返回主站|会员中心|保存桌面 手机浏览
以橱窗方式浏览 | 以目录方式浏览 Dataset
图片 标 题 更新时间
トルコ語で書かれたデータを使って、word2vecまたはn-gramモデルを訓練することができます
このデータにはトルコ語で書かれた各文書が含まれており、ウィキ文書IDも含まれています。あなたはword2vecまたはn-gramモードを学習することができます。
2023-03-09
Redditコミュニティの参加度を予測するデータセット、GDELT投稿の分類、およびSiroccoテキスト分析(意見とエンティティの抽出)
このデータセットには、3か月間(2017年6月から8月)のRedditのニュース投稿、ならびにGDELTの投稿分類およびSiroccoのテキスト分析(意見とエンティティ抽出)の結果が含まれています。
2023-03-09
Word2vecはウィキペディア上のデータ(単一文字+二文字)を使って訓練し、ユニグラムとバイグラムを捉えます
これは単語埋め込みモデルであり、ウィキペディア+様々なソースのコメントから作成されました。フレーズベースの手法(隣接する単語のフレーズ/バイグラムの文脈を考慮しない)からバイグラムを作成するのとは異なり、これ
2023-03-09
ATECリスクブレイン支払いリスク
#データセット このデータセットはSu Yinによって作成されました。#内容 これには以下のファイルが含まれています。
2023-03-09
ニューヨークの黄色いタクシー2015年サンプルデータ
このデータセットは、ニューヨーク市タクシー・リムジン委員会(TLC)が公開した2015年のニューヨーク市の黄色タクシーの乗車記録データに基づいています。トレインデータはランダムサンプリングされたもので、全年の数の
2023-03-09
特徴と糖尿病予測
#データセットこのデータセットはakhil alexanderによって作成され、Database:Open Database, Contents:Database Contents#Contentsの下に公開されています。これには以下の文が含まれています
2023-03-09
衣服
#データセットこのデータセットはGustavo Paivaによって作成され、CC0: 公共ドメイン#ディレクトリの下に公開されており、以下のファイルを含んでいます。
2023-03-09
ECG検出信号分類データセット
ECG心拍分類データセット##要約このデータセットは2つの心拍信号セットから構成されており、これら2つの心拍データセットは心拍分類における2つの著名なデータセット[MIT - BIH不整脈から取得されたものです。
2023-03-09