Select Language

Open Dataset

Related Search
您是不是在找?
Today ranking
Weekly Best Sellers
Monthly Best Sellers
映画レビューデータセット - HetRec 2011 MovieLens IMDb/ロッテントマト このデータセットはMovieLens10Mデータセットの拡張版で、GroupLeans研究グループによって公開されました。http://www.grouplens.org これはMovieLensデータセットの映画とそれに対応する...Music Analysis Classification
33.72M 1462
2004年の全ゲノムシーケンシングと2014年の初期および後期のSNPデータ 種形成は新しい生物多様性の基礎となる。しかし、種形成の過程で、自然選択がどのようにゲノムを形作るのか、まだ多くを知る必要がある。仮に選択が障...Others Classification
10.9G 560
僧伽羅語の数字語彙(バージョン2.0)、アルファベットNからZ シンハラ・プラークリット語デジタル用語集(バージョン2.0)、NからZまで...NLP Classification
9.69M 912
僧伽羅語の数字語彙(2.0版)、アルファベットAからM シンハラ語・プラークリト語デジタル用語集(バージョン2.0)、AからMまでの文字...NLP Classification
9.88M 780
ニフティ50株データセット(2010 - 2021) これは統合されたデータセットで、一部は NSE India のウェブサイトから、一部は NIFTY - 50 株式データセットから取得されています。このデータセットには、各 nifty - 50 株式(2010 年から 2...Business Text
348K 704
SegTrack v2ビデオセグメンテーションデータセット SegTrack v2はビデオセグメンテーションデータセットで、14個のビデオシーケンスを含んでいます。各ビデオの各フレームの複数のオブジェクトに対して、完全なピクセルレベルのアノテーションが付けられています。...Action/Event Detection Classification
200M 805
深度顔面抽出データセット(Celeb - DF v2 Celeb - DF(v2)データセットには、本物のビデオとDeepFake合成ビデオが含まれており、そのビデオ品質はオンラインで流通するビデオ品質に似ています。Celeb - DF(v2)データセットは以前のCeleb - DF...Face Classification
417.84G 3625
上海のPM2.5 大気汚染の過去データ 上海のPM2.5の過去データで、データにはテストデータと訓練データが含まれています。そのうち、テストデータは401件、訓練データは52183件です。...Environment,News,Environment Text
3M 1509
1872年から2020年までの40000試合の国際サッカー試合結果データセット 1872年から2020年までの国際サッカー成績、4万以上の国際サッカー試合結果の最新データセット。このデータセットには、1972年の初めての公式試合から2019年の41,5...Sports Classification
534K 1173
人工知能コーパス - Ubuntu対話コーパスには2600万回の対話データが含まれています 対話システム(人間が仮想エージェントと自然な対話を行うことができる)を構築することは、自然言語処理における困難なタスクであり、多くの進行中の研究の焦点となっています。いくつかの課題には...NLP Text
2.7G 3203
Visual Question Answering V2.0 画像内容に対する自然言語での質問応答用データセット ビジュアル質問応答(VQA)は、画像内容に関する自然言語の質問と回答が画像内容に基づく必要がある、画像内容に対する自然言語の質問応答データセットです。...NLP Text
30.7G 1035
人工知能コーパス - 欧州議会の議事録平行コーパス、21種類の欧州言語を含む Europarl平行コーパスは欧州議会の議事手続きから抜粋されたものです。これには21種類の欧州言語のバージョンが含まれています:ロマンス語(フランス語、イタリア語、スペイン語、ポルトガル語、ルーマニア語)...NLP Classification,Text
3.75G 1295
鮮花識別画像データセットは4242個の鮮花画像を含んでいます このデータセットには4242枚の花の画像が含まれています。花卉画像認識データの収集は、flicr、グーグル画像、ヤンデックス画像というデータに基づいて行われました。あなたはこのデータセットを使って写真中の植物を識別することができます。...Plants 2D Box
224.86M 1206
LabelMe 12 - 50k 一つの物体認識データセット LabelMe 12 - 50kデータセットは物体認識データセットで、合計50000枚のJPEG形式の画像が含まれています。そのうち40000枚は訓練データで、10000枚はテストデータです。...Action/Event Detection Classification
501.5M 1364
アマゾンウェブサイト上の548,552個の商品の情報データ Amazon Product Co - purchasing Network metadataデータセットは、アマゾンウェブサイトから収集された548552個の商品の情報データ(例:データ、音楽)...Smart Retailing Classification
201.04M 1322
175種類の鳥類のデータセット 23657個の訓練画像を含む 175種類の鳥類のデータセット。23657個の訓練画像、875個のテスト画像(各種ごとに5個)と875個の検証画像(各種ごとに5個)。すべての画像はjpg形式でサイズが224です。...Environment,Environment 2D Box
1.88G 1470
redditの250万件の投稿データ アメリカのRedditニュースサイトで最も人気のある2500人の投稿者の、各メディア1000件の投稿内容とコメントのデータセット。購読者からの上位2500件のサブ評価。2013年8月から...NLP Text
437.79M 1502
WMT 2011ニュースクロール機械翻訳データ WMT2011NewsCrawldataは自然言語翻訳データで、Europarlcorpusコーパスから抽出されたもので、以下を含みます:フランス語 - 英語、スペイン語 - 英語、ドイツ語 - 英語(原文未完成、「Ge」の続きがないため仮にドイツ語と推測)...NLP Text
25.01G 894
250万Reddit投稿データ これは、購読者からの上位2500のサブディレクトリのうち、上位1000の投稿の履歴データセットです。このデータは、2013年8月15日から20日の間にredditから抽出されたものです。これはreddi...NLP Text
452.85M 816
ニュースカテゴリーデータセット、20万件のニュースタイトルを含む このデータセットには、2012年から2018年までにHuffPostから取得した約20万件のニュースタイトルが含まれています。このデータセットで学習させたモデルは、追跡されていないニュース記事のラベルを識別するために使用できます。...NLP Text
25.44M 1323