2_Open DatasetPayititi-Artificial Intelligence Data Science Community

映画レビューデータセット - HetRec 2011 MovieLens IMDb/ロッテントマトこのデータセットはMovieLens10Mデータセットの拡張版で、GroupLeans研究グループによって公開されました。http://www.grouplens.org これはMovieLensデータセットの映画とそれに対応する...Music Analysis Classification

33.72M 1480

robot

2004年の全ゲノムシーケンシングと2014年の初期および後期のSNPデータ種形成は新しい生物多様性の基礎となる。しかし、種形成の過程で、自然選択がどのようにゲノムを形作るのか、まだ多くを知る必要がある。仮に選択が障...Others Classification

10.9G 578

Kulmuni, Jonna,Nouhaud, Pierre,Pluckrose, Lucy,Dhaygude, Kishor,Butlin, Roger

僧伽羅語の数字語彙(バージョン2.0)、アルファベットNからZ シンハラ・プラークリット語デジタル用語集（バージョン2.0）、NからZまで...NLP Classification

9.69M 926

Bianchini, Francesco,Gazzard, Katherine

僧伽羅語の数字語彙（2.0版）、アルファベットAからM シンハラ語・プラークリト語デジタル用語集（バージョン2.0）、AからMまでの文字...NLP Classification

9.88M 819

Bianchini, Francesco,Gazzard, Katherine

ニフティ50株データセット（2010 - 2021）これは統合されたデータセットで、一部は NSE India のウェブサイトから、一部は NIFTY - 50 株式データセットから取得されています。このデータセットには、各 nifty - 50 株式（2010 年から 2...Business Text

348K 725

Hyderabad, Telangana

SegTrack v2ビデオセグメンテーションデータセット SegTrack v2はビデオセグメンテーションデータセットで、14個のビデオシーケンスを含んでいます。各ビデオの各フレームの複数のオブジェクトに対して、完全なピクセルレベルのアノテーションが付けられています。...Action/Event Detection Classification

200M 822

robot

深度顔面抽出データセット（Celeb - DF v2） Celeb - DF（v2）データセットには、本物のビデオとDeepFake合成ビデオが含まれており、そのビデオ品質はオンラインで流通するビデオ品質に似ています。Celeb - DF（v2）データセットは以前のCeleb - DF...Face Classification

417.84G 3647

robot

上海のPM2.5 大気汚染の過去データ上海のPM2.5の過去データで、データにはテストデータと訓練データが含まれています。そのうち、テストデータは401件、訓練データは52183件です。...Environment,News,Environment Text

3M 1525

Team AI

1872年から2020年までの40000試合の国際サッカー試合結果データセット 1872年から2020年までの国際サッカー成績、4万以上の国際サッカー試合結果の最新データセット。このデータセットには、1972年の初めての公式試合から2019年の41,5...Sports Classification

534K 1206

NET

人工知能コーパス - Ubuntu対話コーパスには2600万回の対話データが含まれています対話システム（人間が仮想エージェントと自然な対話を行うことができる）を構築することは、自然言語処理における困難なタスクであり、多くの進行中の研究の焦点となっています。いくつかの課題には...NLP Text

2.7G 3217

Rachael Tatman

Visual Question Answering V2.0 画像内容に対する自然言語での質問応答用データセットビジュアル質問応答（VQA）は、画像内容に関する自然言語の質問と回答が画像内容に基づく必要がある、画像内容に対する自然言語の質問応答データセットです。...NLP Text

30.7G 1058

VQA

人工知能コーパス - 欧州議会の議事録平行コーパス、21種類の欧州言語を含む Europarl平行コーパスは欧州議会の議事手続きから抜粋されたものです。これには21種類の欧州言語のバージョンが含まれています：ロマンス語（フランス語、イタリア語、スペイン語、ポルトガル語、ルーマニア語）...NLP Classification,Text

3.75G 1318

Philipp Koehn

鮮花識別画像データセットは4242個の鮮花画像を含んでいますこのデータセットには4242枚の花の画像が含まれています。花卉画像認識データの収集は、flicr、グーグル画像、ヤンデックス画像というデータに基づいて行われました。あなたはこのデータセットを使って写真中の植物を識別することができます。...Plants 2D Box

224.86M 1219

Alexander Mamaev

LabelMe 12 - 50k 一つの物体認識データセット LabelMe 12 - 50kデータセットは物体認識データセットで、合計50000枚のJPEG形式の画像が含まれています。そのうち40000枚は訓練データで、10000枚はテストデータです。...Action/Event Detection Classification

501.5M 1379

robot

アマゾンウェブサイト上の548,552個の商品の情報データ Amazon Product Co - purchasing Network metadataデータセットは、アマゾンウェブサイトから収集された548552個の商品の情報データ（例：データ、音楽）...Smart Retailing Classification

201.04M 1339

Stanford University

175種類の鳥類のデータセット 23657個の訓練画像を含む 175種類の鳥類のデータセット。23657個の訓練画像、875個のテスト画像（各種ごとに5個）と875個の検証画像（各種ごとに5個）。すべての画像はjpg形式でサイズが224です。...Environment,Environment 2D Box

1.88G 1482

Gerry

redditの250万件の投稿データアメリカのRedditニュースサイトで最も人気のある2500人の投稿者の、各メディア1000件の投稿内容とコメントのデータセット。購読者からの上位2500件のサブ評価。2013年8月から...NLP Text

437.79M 1513

reddit

WMT 2011ニュースクロール機械翻訳データ WMT2011NewsCrawldataは自然言語翻訳データで、Europarlcorpusコーパスから抽出されたもので、以下を含みます：フランス語 - 英語、スペイン語 - 英語、ドイツ語 - 英語（原文未完成、「Ge」の続きがないため仮にドイツ語と推測）...NLP Text

25.01G 905

Europarl

250万Reddit投稿データこれは、購読者からの上位2500のサブディレクトリのうち、上位1000の投稿の履歴データセットです。このデータは、2013年8月15日から20日の間にredditから抽出されたものです。これはreddi...NLP Text

452.85M 831

Reddit

ニュースカテゴリーデータセット、20万件のニュースタイトルを含むこのデータセットには、2012年から2018年までにHuffPostから取得した約20万件のニュースタイトルが含まれています。このデータセットで学習させたモデルは、追跡されていないニュース記事のラベルを識別するために使用できます。...NLP Text

25.44M 1364

Rishabh Misra

Select Language

AI Technology Community

Today search ranking

month_search_ranking

Dataset Category

Open Dataset