Related Search
您是不是在找?
Today ranking
Weekly Best Sellers
Monthly Best Sellers
Steam公式サイトの約80000本のゲームデータセット
これはデータセットで、Steam公式サイトからの約80000のゲームに関する、スクレイピング可能なあらゆる情報を含んでいます。ほとんどの列には、あなたにより良い...Video Games,Games Classification
98.8M
953
Deepan.N
28種類の言語における停止語、自然言語処理におけるテキスト前処理
ストップワードは、どの言語においても文に大きな意味を追加しない単語です。それらは安全に無視することができます...NLP,Computer Science,Text Data,Languages Classification
0.09M
624
Heeral Dedhia
日本語 - 英語字幕コーパス(JESC)[クリーニング済み]、280万文からなる大規模なコーパス
このデータセットは、誤字の英単語を修正し、次の方法で単語分割を行うことによって作成された、JESCのクリーン版です。英語 = ...NLP,Business,Computer Science,Languages Classification
220.08M
337
Wahyu Setianto
ELI5スコアラーの訓練データ原型816000例、評価モデルの作成に使用
ELI5は「5歳児に説明するように」を意味します。これはもともと、Redditのeli5サブレディットから収集された、自由形式の長い質問と回答です。...NLP,Earth and Nature,Arts and Entertainment,Education,Social Science,Sports,Regression,Transformers Classification
672.61M
306
Neuron Engineer
94.28M
633
Rough Rider 404
TOI 2018ニュース記事
Computer Science,Internet,News,Social Science,NLP,Deep Learning Classification
267.42M
634
PulpAI
EmojifyDataデータセット:1800万件の英語のツイートで、すべてが絵文字を含んでいる
それで、私と友人は自然言語処理におけるディープラーニングのIPavlovコースに参加していました。最終プロジェクトとして、私たちは…...NLP,Online Communities,Text Data,Social Networks Classification
2.58G
599
Daniil Larionov
ウィキペディアの文章、英語版ウィキペディアのダンプから780万の文章が収集されています
ウィキペディアのダンプは巨大なXMLファイルで、あまり有用ではない内容が大量に含まれています。私は何かのためにいくつかの英語のテキストが必要でした...NLP,Text Mining Classification
891.28M
367
Mike Ortman