Select Language

Open Dataset

COVID 19は文献処理の三つ組

COVID 19は文献処理の三つ組

22.35M
282 hits
0 likes
0 downloads
0 discuss
Earth and Nature,Computer Science,Health Conditions,Coronavirus,NLP Classification

Data Structure ? 22.35M

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    コンテキスト このデータセットは、私たちが[COVID - 19オープンリサーチデータセットチャレンジ(CORD - 19)](https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge/)に対する貢献([ノートブックリンク](https://www.kaggle.com/enriquemartinlopez/covid-19-information-extraction-from-literature))の成果物の1つです。 内容 科学論文の元の[CORD - 19データセット](https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge/)から始めて、まず、**コロナウイルス感染症**およびそれを引き起こす**ウイルス**に関する*様々な用語*を含むすべての論文をフィルタリングしました。次に、これらの論文をより管理しやすいセクションに分割し、各セクションに対して、スタンフォードのOpenIEを使用した情報抽出を適用して、IEトリプレット(`オブジェクト`、`関係`、`主語`)を抽出しました。 謝辞 * イワン・エガ・プラタマ。[データセット解析コード | Kaggle、COVID EDA:初期探索ツール](https://www.kaggle.com/ivanegapratama/covid-eda-initial-exploration-tool) * マニング、クリストファー・D、スルデアヌ、ミハイ、バウアー、ジョン、フィンケル、ジェニー、ベサード、スティーブン・J、およびマクロスキー、デヴィッド。2014年。スタンフォードCoreNLP自然言語処理ツールキット 言語学会年次総会52回大会:システムデモンストレーション論文集、pp. 55 - 60。[Open IE](https://stanfordnlp.github.io/CoreNLP/openie.html) * ジェズラエル。[Pandas - 列内の値が同じ列内の別の値の部分文字列であるかどうかを確認する](https://stackoverflow.com/a/58951442) * イシャメル。[部分列(非連続)の検索](https://stackoverflow.com/a/29954829) * ディパンジャン・サルカー:[NLP戦略I - テキストの処理と理解](https://github.com/dipanjanS/practical-machine-learning-with-python/tree/master/bonus%20content/nlp%20proven%20approach) * マリウス・ボルカン:[基本的な知識グラフのPython実装](https://github.com/bdmarius/python-knowledge-graph) * リヤン・チャン:[Python - 文字列リスト内で他の要素の部分文字列となっている要素を削除する](https://stackoverflow.com/questions/21720199/python-remove-any-element-from-a-list-of-strings-that-is-a-substring-of-anothe) 着想 もともと、このデータセットはCORD - 19チャレンジの質問に答えるために使用しました。ただし、この同じデータセットは、最新の科学文献から得られるコロナウイルス感染症に関する知識に関連する他の任意の質問に答えるためにも使用できます。
    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:0 Go earn points?
    • 282
    • 0
    • 0
    • collect
    • Share