Select Language

Open Dataset

Related Search
您是不是在找?
Today ranking
Weekly Best Sellers
Monthly Best Sellers
アラビア語ULMFiTモデル、Ar Wikipediaコーパスに基づくアラビア語モデル アラビア語は世界の主要言語であるにもかかわらず、インターネット上では十分に表現されておらず、アラビア語のリソースが不足しています...NLP,Transfer Learning,Languages Classification
160.13M 649
2018年インド政治ニュース Politics,NLP,Text Data,Linguistics,India Classification
57.35M 280
Sコメディ Earth and Nature,NLP,Text Data,Text Mining Classification
2.99M 428
NLTKロイターニュースファイル、NLTKロイターコーパス内のすべてのファイル このデータセットには、NLTKのロイターコーパス内の各ファイルのID、カテゴリ、および生テキストが含まれています。内容 各ファイル(行...NLP,Computer Science,News,Text Data,Text Mining Classification
3.3M 684
redditの自己投稿分類タスクには、1000以上の精心選抜されたカテゴリが含まれています。 Reddit自己投稿分類タスク(RSPCT)へようこそ!このデータセットの目的は、面白く大規模な......NLP,Classification,Computer Science,Multiclass Classification Classification
839.37M 317
医学成績表、mtsamplesから取得した医学的転記データ 医療データはHIPAAのプライバシー規制のため極めて見つけにくい。このデータセットは、医療に関する情報を提供することで解決策を提供します。...NLP,Health,Medicine Classification
16.22M 294
FakeNewsNet 偽ニュース研究データ収集、偽ニュース、虚偽情報、データマイニング これは、アリゾナ州立大学(ASU)における偽ニュース研究のための進行中のデータ収集プロジェクトのリポジトリです。私たちは、FakeNを説明し、比較します...NLP,News,Social Science,Social Networks Classification
72.61M 1068
ストロングバッドメール Business,NLP,Text Data Classification
0.11M 296
科学流行レビュー削除 Business,NLP,Text Data,Binary Classification,Bigquery Classification
74.17M 271
Mediumの記事には、AI、機械学習、データサイエンスまたは人工知能としてマークされた投稿と、ユーザー情報が含まれています。 ミディアムは世界で最も洞察力に富んだ作家、思想家、ストーリーテラーたちの知恵を引き出し、あなたに最も賢い...NLP,Text Data,Literature Classification
1.8G 366
実体抽出はPitchforkのレビューから Business,Arts and Entertainment,Music,Retail and Shopping,NLP,Popular Culture Classification
14.49M 664
クリスマスのレシピ Religion and Belief Systems,NLP,Cooking and Recipes,Holidays and Cultural Events Classification
2.51M 588
数千の愛に関する質問。このデータセットにはQAサービスからの愛に関する質問と回答が含まれています コンテキストロシア語このデータセットは、mail.ruサービスの質問に対する実際の回答から収集されたものです:https://otvet.mail....NLP,Education,Text Data,Languages Classification
176.23M 289
プレノス総督 エリ大統領 2018年 NLP,Brazil Classification
16.5M 559
ACL論文集選集、論文データはACL選集から取得 ACLアンソロジーからの採択論文のデータ。論文の要約がarXivに存在する場合は、そこから抽出されます。データi...NLP,Education,Literature Classification
1.14M 295
電子メールスパムメール 文脈:[スパムアサシン][1]からのいくつかのメールを使用して、スパムメールとハム(非スパム)メールを区別できるモデルを作成する...NLP,Classification,Software,Email and Messaging Classification
12.08M 291
キュレーションコーパス:キュレーション語彙データベース キュレーションコーパスには、専門家が執筆した4万編のニュース記事の要約が集められており、記事自体のリンクも付けられています。このリポジトリは、それらにアクセスするためのクローリングツールを提供しています。もしあなたが...NLP Text
123.13M 479
MJSynth 合成単語データセット 合成語データセット これは合成的に生成されたデータセットであり、実世界の画像におけるテキスト認識のトレーニングに十分であると我々が判断したものです。...NLP Classification
9.95G 1604
ICDAR 2013データセット 1 ギリシャ語と英語で記載された150枚の画像、およびインドのバングラ語で記載された50枚の画像。2 白黒の……...NLP Text
172.61M 1489