Select Language

Open Dataset

IMDB - 映画情報データセット

IMDB - 映画情報データセット

1.04G
1090 hits
0 likes
2 downloads
0 discuss
Music Analysis Classification

IMDB映画データウェアハウスのデータ。映画の名称、紹介、監督、俳優などの情報が含まれています。各データセットは、UTF - 8文字セットを基礎とした、タブ区切りの......

Data Structure ? 1.04G

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    IMDB映画データウェアハウスのデータで、映画の名称、紹介、監督、俳優などの情報が含まれています。

    各データセットは、UTF - 8文字セットを基礎とした、タブ区切りの数値(TSV)形式の圧縮ファイルに含まれています。各ファイルの最初の行には、各列の内容を説明するタイトルが含まれています。「/N」は、そのタイトル/名称の特定のフィールドが欠落しているか空であることを示すために使用されます。利用可能なデータセットは以下の通りです。

    title.akas.tsv.gz - タイトルに関する以下の情報が含まれています:

    • titleId (文字列) - tconst、タイトルの英数字の一意識別子

    • ordering (整数) – 特定のtitleIdに対する行を一意に識別する番号

    • title (文字列) – ローカライズされたタイトル

    • region (文字列) - このバージョンのタイトルの地域

    • language (文字列) - タイトルの言語

    • types (配列) - この代替タイトルの属性の列挙セット。以下のうち1つ以上: 「alternative」、「dvd」、「festival」、「tv」、 「video」、「working」、「original」、「imdbDisplay」。将来的に警告なしに新しい値が追加される場合があります

    • attributes (配列) - この代替タイトルを説明する追加用語で、列挙されていません

    • isOriginalTitle (ブール値) – 0: 原題ではない; 1: 原題

    title.basics.tsv.gz - タイトルに関する以下の情報が含まれています:

    • tconst (文字列) - タイトルの英数字の一意識別子

    • titleType (文字列) – タイトルのタイプ/形式 (例: 映画、ショート、テレビシリーズ、テレビエピソード、ビデオなど)

    • primaryTitle (文字列) – より人気のあるタイトル / 映画製作者がリリース時の宣伝資料で使用するタイトル

    • originalTitle (文字列) - 原題、原言語で

    • isAdult (ブール値) - 0: 成人向けではないタイトル; 1: 成人向けタイトル

    • startYear (YYYY) – タイトルのリリース年を表します。テレビシリーズの場合は、シリーズの開始年です

    • endYear (YYYY) – テレビシリーズの終了年。他のすべてのタイトルタイプには「\N」

    • runtimeMinutes – タイトルの主な放映時間、分単位

    • genres (文字列配列) – タイトルに関連する最大3つのジャンルが含まれています

    title.crew.tsv.gz – IMDb内のすべてのタイトルの監督と脚本家の情報が含まれています。フィールドには以下が含まれます:

    • tconst (文字列) - タイトルの英数字の一意識別子

    • directors (nconstsの配列) - 特定のタイトルの監督

    • writers (nconstsの配列) – 特定のタイトルの脚本家

    title.episode.tsv.gz – テレビエピソードの情報が含まれています。フィールドには以下が含まれます:

    • tconst (文字列) - エピソードの英数字識別子

    • parentTconst (文字列) - 親テレビシリーズの英数字識別子

    • seasonNumber (整数) – エピソードが属するシーズン番号

    • episodeNumber (整数) – テレビシリーズ内のtconstのエピソード番号

    title.principals.tsv.gz – タイトルの主要なキャスト/スタッフが含まれています

    • tconst (文字列) - タイトルの英数字の一意識別子

    • ordering (整数) – 特定のtitleIdに対する行を一意に識別する番号

    • nconst (文字列) - 名前/人物の英数字の一意識別子

    • category (文字列) - その人物が従事していた仕事のカテゴリ

    • job (文字列) - 該当する場合は具体的な職名、そうでない場合は「\N」

    • characters (文字列) - 該当する場合は演じたキャラクターの名前、そうでない場合は「\N」

    title.ratings.tsv.gz – タイトルのIMDb評価と投票情報が含まれています

    • tconst (文字列) - タイトルの英数字の一意識別子

    • averageRating – すべての個別ユーザー評価の加重平均

    • numVotes - タイトルが受け取った投票数

    name.basics.tsv.gz – 名前に関する以下の情報が含まれています:

    • nconst (文字列) - 名前/人物の英数字の一意識別子

    • primaryName (文字列)– その人物が最も頻繁にクレジットされる名前

    • birthYear – YYYY形式

    • deathYear – 該当する場合はYYYY形式、そうでない場合は「\N」

    • primaryProfession (文字列配列)– その人物の上位3つの職業

    • knownForTitles (tconstsの配列) – その人物が知られているタイトル


    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:8 Go earn points?
    • 1090
    • 2
    • 0
    • collect
    • Share