Select Language

Open Dataset

TREC2005 - 2007スパムメールデータセット TREC 2006 Spam Track Public Corpora:https://plg.uwaterloo.ca/~gvcormac/treccorpus06/about.htmlは公開されたスパムメールコーパスです。...NLP,International Relations Classification,Text
1.6G 833
スパムメールデータセット Social - Spammer Social - Spammer - Heterogeneousデータセットはtagged.comウェブサイトから収集されたもので、560万人のユーザーと8500万のユーザー間の関係を含んでいます。データセット...OCR/Text Detection Classification
3.81G 1072
2019データインテリジェントアルゴリズムコンテスト - 店舗の顧客購入転化率予測データセット 購買転化率はブランドビジネスマンが電子商取引プラットフォームで運営する際に最も注目する指標の一つです。今回の大会では、雲積インタラクティブがブランドビジネスマンの過去の注文データを提供し、参加者は人工知能...Business Classification
38.9M 778
Olistのブラジル電子商取引公共データセット このデータセットは、ブラジル市場最大の百貨店であるOlistによって提供されています。Olistは、たった1つの契約で、ブラジル各地の中小企業を簡単にチャネルに接続することができます。これらの販売業者は、通...Business Text
42.65M 743
大型デパートの販売データセット、Big Martの販売予測に使用 ビッグマートのデータサイエンティストは、2013年に異なる都市の10店舗における1559種類の商品の販売データを収集しました。さらに、各商品と店舗の特定の属性も定義しました。...Business Text
306K 1596
ハリソン ソーシャルメディア画像データセット HARRISONはFacebook、Twitter、Instagramなどのソーシャルメディアにある画像にタグ付け(tag)を行った画像データセットで、57383枚の画像を含んでおり、各画像...Image Data Classification
5.58G 957
MERLメルショッピングデータセット MERLショッピングデータセットは106個の動画で構成され、各動画のシーケンスは約2分です。これらの動画は固定された天井カメラから取得され、人々が食料品店で買い物をしている様子を下から撮影しています。...Business Classification
1.72G 835
アンレン社電子メールデータセット このデータセットはCALOプロジェクト(学習と組織化のための認知アシスタント)によって収集および準備されました。これは約150人のユーザー(主にアンランドの幹部)からのデータを含んでいます。...MNIST Classification
422.7M 726
烏雲網公開脆弱性情報データセット データ形式はSqlite形式です。ウーユン(乌云)で確認済みの脆弱性と公開済みの脆弱性の状態、メーカー、Rankなどのデータを収集し、どのメーカーが良心的なメーカーかを分析するために使用します。インターネット上にもミラーサイトがあります。...OCR/Text Detection Classification
2.3M 797
20万人のマイクロブログユーザーのデータ 2015年に20万人の新浪微博ユーザーの公開データを収集しました。データはGitHubから取得しました。...Action/Event Detection Classification
34.8M 814
アマゾン食品レビューデータセット、50万件の食品レビュー Amazon Fine Food Reviewsデータセットは、アマゾンの素敵な食品に対するレビューから構成されるデータセットで、2012年10月までにアマゾンサイト上にあった5684...Action/Event Detection Classification
242.11M 865
“美味ブックマーク”ウェブブックマークデータセット このデータセットには、美味(Delicious)ソーシャルブックマークシステムの2000人のユーザーセットからのソーシャルネットワーク、ブックマーク、タグ情報が含まれています。http://www.delicious.com このデータセットは第2回国際ワークショップで...OCR/Text Detection Classification
13.3M 796
図書評価データセット - Book - Crossings Book-CrossingsはCai-Nicolas Zieglerがbookcrossing.comのデータに基づいて作成した書籍評価データセットです。 これは90000人のユーザーによる270000冊の書籍の1...OCR/Text Detection Classification
50.65M 907
推薦システムと協調フィルタリングの研究に使用されるJesterデータセット このデータセットには3つのサブデータセットが含まれています:データセット1、データセット3、データセット4。以下に説明します:データセット1:410万件の評価値(-10.00から ...OCR/Text Detection Classification
16.77M 1012
グーグルアプリストアのアプリ情報データセット Playストアのアプリデータには、アプリ制作ビジネスを成功に導く大きな可能性があります。開発者に実行可能な洞察を提供し、Android市場を開拓し獲得するために役立ちます。...OCR/Text Detection Classification
1.94M 795
ヒラリーメールゲートデータセット 2015年、ヒラリーはメールゲート事件に巻き込まれました。その原因は、彼女が国務長官在任中に個人メールを非政府のサーバーに保存していたことです。一部の政策専門家や彼女...OCR/Text Detection Classification
13.5M 1133
ペット精霊画像データセット 第1世代から第7世代までのすべてのポケモンの画像。2つの異なるポケモンからの新しい進化形態。画像からポケモンの主要タイプと次要タイプを予測する。事前の進化に基づいて...Image Search Classification
2.47M 1439
インドニュースタイトルデータセット コンテキストこのニュースデータセットは、200年初頭からインド亜大陸で起こった注目すべき出来事の永続的な歴史アーカイブです。...OCR/Text Detection Classification
246.96M 721
自動車消費者の自動車評価とレビュー、データセットには 62 の主要ブランドのデータが含まれています これは消費者の意見と自動車メーカー/モデル/タイプの星評価を含むデータセットです。内容 - 現在...Automobiles and Vehicles,Retail and Shopping,Ratings and Reviews Classification
137.62M 737
ブラジルの科学技術ニュース。データセットにはブラジルのメディアが発表した約2720本のニュースが含まれています。 このデータセットは、ニュースとソーシャルメディアの監視を専門とする会社であるミティ・インテリジェンシアによって提供されました...NLP,News,Text Data,Text Mining,Science and Technology Classification
44.47M 317