Open Dataset
Data Structure ?
9.4G
README.md
画像検査で日常的に発見される多くのがんは、近年のコンピュータサイエンスの進歩の恩恵をまだ受けていません。機械学習やディープラーニングなどのアプローチは、腫瘍の定量的な3D体積、複雑な特徴、および治療追跡の時間的ダイナミクスを生成することができます。しかし、新しいアプローチを開発しようと努力する学際的な研究者は、しばしば疾患に関する理解や医学界内での十分なコンタクトを欠いています。彼らの研究は、腫瘍の位置などの画像内の基本情報をラベリングし、注釈を付けることで大きく恩恵を受けることができます。これらの情報は放射線科医には明らかなものです。
公開可能な参照データセットの作成をクラウドソーシングすることで、この課題に対処することができます。2011年に国立がん研究所は、医療画像の無料でオープンアクセスのデータベースであるThe Cancer Imaging Archive (TCIA)の開発に資金を提供しました。しかし、これらのコレクションの多くは、画像処理研究者がディープラーニングやラジオミクスの進歩のために必要とするラベリングや注釈が不足しています。その結果、TCIAは北米放射線学会 (RSNA) や多数の学術機関と協力して、RSNA会議の参加者の膨大な知識を活用し、これらの腫瘍マークアップを生成しています。
内容
csvファイルには、著者、疾患の種類、位置、患者ごとに整理された画像のすべての注釈のリストが含まれています
2つのサブフォルダがあります
annotated_dicoms: CSVファイルで参照されているすべてのDICOMスライスが含まれています(ただし、それ以外のものは含まれておらず、上下のスライスや患者全体のコンテキストはありません)
compressed_stacks: データの約70%(Kaggleのファイルサイズ制限)に対応する全スキャンのnifti (.nii.gz) スタックです。niftiファイルは、事前に調べるべきスライスがわからないため、モデルのテストにはるかに便利です。
謝辞
元のデータセットは https://wiki.cancerimagingarchive.net/plugins/servlet/mobile?contentId=33948774#content/view/33948774 からダウンロードされました
データの引用は以下のように行う必要があります:
Jayashree Kalpathy - Cramer, Andrew Beers, Artem Mamonov, Erik Ziegler, Rob Lewis, Andre Botelho Almeida, Gordon Harris, Steve Pieper, Ashish Sharma, Lawrence Tarbox, Jeff Tobler, Fred Prior, Adam Flanders, Jamie Dulkowski, Brenda Fevrier - Sullivan, Carl Jaffe, John Freymann, Justin Kirby. Crowds Cure Cancer: Data collected at the RSNA 2017 annual meeting. The Cancer Imaging Archive. doi: 10.7937/K9/TCIA.2018.OW73VLO2
- Share your thoughts
ALL
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.