Open Dataset
Data Structure ?
27148.7M
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
データセットの説明
COVID - 19のパンデミックに対応して、ホワイトハウスと主要な研究グループの連合は、COVID - 19オープンリサーチデータセット(CORD - 19)を用意しました。CORD - 19は、COVID - 19、SARS - CoV - 2、および関連するコロナウイルスに関する20万以上の学術論文(うち10万以上は全文付き)のリソースです。この無料で利用可能なデータセットは、自然言語処理やその他のAI技術の最近の進歩を適用して、この感染症との現行の戦いを支援する新しい洞察を生み出すために、世界の研究コミュニティに提供されています。新しいコロナウイルス関連文献の急増により、医療研究コミュニティが追いつくのが困難になっているため、これらのアプローチの緊急性が高まっています。
行動呼びかけ
私たちは、世界の人工知能の専門家に対して、医療コミュニティが優先度の高い科学的な質問に対する答えを導き出すのに役立つテキストおよびデータマイニングツールを開発するよう行動を呼びかけています。CORD - 19データセットは、これまでにデータマイニングに利用可能な最も広範な機械可読のコロナウイルス関連文献コレクションを表しています。これにより、世界中のAI研究コミュニティは、テキストおよびデータマイニングアプローチを適用して、このコンテンツ内の質問に対する答えを見つけ、その洞察をつなぎ合わせ、世界中で進行中のCOVID - 19対応活動を支援する機会を得ることができます。コロナウイルス関連文献の急増により、医療コミュニティが追いつくのが困難になっているため、これらのアプローチの緊急性が高まっています。
このデータセットの**[タスク](https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge/tasks)**セクションに、私たちの初期の主要な質問のリストを見ることができます。これらの主要な科学的質問は、NAS EMのSCIED(米国科学アカデミー、工学アカデミー、医学アカデミーの新興感染症と21世紀の健康脅威に関する常設委員会)の[研究トピック](https://www.nationalacademies.org/event/03 - 11 - 2020/standing - committee - on - emerging - infectious - diseases - and - 21st - century - health - threats - virtual - meeting - 1)と世界保健機関の[研究開発ブループリント](https://www.who.int/blueprint/priority - diseases/key - action/Global_Research_Forum_FINAL_VERSION_for_web_14_feb_2020.pdf?ua = 1)から引用されています。
これらの質問の多くはテキストマイニングに適しており、私たちは研究者にこれらの質問に関する洞察を提供するテキストマイニングツールを開発することを奨励しています。
私たちは、[コミュニティの貢献](https://www.kaggle.com/covid - 19 - contributions)の要約を管理しています。あなたの貢献を有用なものにするためのガイダンスとして、医療および健康政策コミュニティから得たフィードバックを含む[フォーラムスレッド](https://www.kaggle.com/allen - institute - for - ai/CORD - 19 - research - challenge/discussion/138484)を管理しています。
賞品
Kaggleは、提出物が評価基準を最もよく満たすと認定された勝者に、*タスクごとに1000ドル*の賞金を提供しています。勝者は、この賞金をCOVID - 19の救援・研究活動への慈善寄付として、または現金支払いとして受け取ることを選択できます。賞品と日程の詳細は、[ディスカッション投稿](https://www.kaggle.com/allen - institute - for - ai/CORD - 19 - research - challenge/discussion/135826)で確認できます。
データセットのアクセス
私たちはこのデータセットをKaggleで利用可能にしました。[定期的な更新](https://www.kaggle.com/allen - institute - for - ai/CORD - 19 - research - challenge/discussion/137474)に注意してください。
このデータセットは、[AI2のSemantic Scholar](https://pages.semanticscholar.org/coronavirus - research)にもホストされています。また、AI2の新しい[COVID - 19エクスプローラー](https://cord - 19.apps.allenai.org/)を使用してデータセットを検索することができます。
各データセットのライセンスは、all_sources_metadata.csvファイルに記載されています。
謝辞

このデータセットは、AI研究所のアレン研究所が、チャン・ザッカーバーグ財団、ジョージタウン大学の安全保障と新興技術センター、マイクロソフトリサーチ、IBM、および国立医学図書館 - 国立衛生研究所と協力し、ホワイトハウス科学技術政策局と調整して作成したものです。
×
The dataset is currently being organized and other channels have been prepared for you. Please use them
The dataset is currently being organized and other channels have been prepared for you. Please use them
Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
No content available at the moment
No content available at the moment
- Share your thoughts
Go share your ideas~~
ALL
Welcome to exchange and share
Your sharing can help others better utilize data.
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.