Open Dataset
Data Structure ?
14.96M
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
# 背景
ズシャン・ウル・ハッサン・ウスマニのゲノム表現型SNP生データ
ゲノミクスは、ゲノムの構造、機能、変異、進化、マッピングを扱う分子生物学の一分野です。完全な30億塩基対から数千の表現型SNPまで、ヒトゲノムの次世代シーケンシングを提供する企業はいくつかあります。私は自分のDNAの表現型SNPについて、23andMe(イルミナのHumanOmniExpress - 24を使用)を利用しました。私は以下の理由で、この全生データセットを国際的な研究コミュニティに公開します。
1. 私は、オープンデータセット、透明性、そして学習、研究、探求、教育の権利を強く信じています。単なるプライバシー上の懸念で知識の流れを制限したくありません。そのため、私は自分の全DNA生データを、プライバシーを心配することなく研究に利用できるよう世界に提供します。私はこれをコピーレフトデータセットと呼んでいます。
2. 研究に利用可能なテストデータセットの多くは西洋諸国からのもので、発展途上国からのものはあまり見られません。私はこのギャップを埋めるために自分のデータを共有することにしました。そして、他の人もこの流れに乗ってくれることを期待しています。
3. もし私のDNAデータを使って命が救われ、知識が得られ、アイデアが探求され、または事実が発見されるなら、私は地球上で最も幸せな人になります。ご自由に利用してください。
# 内容
名前:ズシャン・ウル・ハッサン・ウスマニ
年齢:38歳
出身国:パキスタン
祖先の国:インド(ウッタル・プラデーシュ州 - UP)
ファイル:GenomeZeeshanUsmani.csv
サイズ:15MB
出所:23andMe個人化ゲノムレポート
研究コミュニティはこの分野でまだ着実に研究を進めており、専門家たちはゲノミクスがまだ初期段階であることに同意しています。あなたは今、このデータセットを通じてこの新しい分野を探求する機会を得ており、少数の初期のゲノミクス利用者の一人になることができます。
このデータセットは、www.23andme.comから抽出された完全なゲノムで、以下の記号で表されるSNPの配列として表現されています:A(アデニン)、C(シトシン)、G(グアニン)、T(チミン)、D(塩基欠失)、I(塩基挿入)、特定の位置のSNPがアクセスできない場合は '_' または '-'。これには染色体1 - 22、X、Y、およびミトコンドリアDNAが含まれています。
利用可能な正確なSNP(塩基対)の完全なリストとそのデータセットインデックスは、
https://api.23andme.com/res/txt/snps.b4e00fe1db50.data
で確認できます。
データセットがどのように抽出されたかについての詳細な情報は、https://api.23andme.com/docs/reference/#genomes を参照してください。
さらに、データセットの内容をより詳細に理解するには、https://api.23andme.com/docs/reference/#genotypes の説明を熟読してください。
# 謝辞
ユーザーは、このデータセットを以下のように利用、コピー、配布、引用することができます:「ズシャン・ウル・ハッサン・ウスマニ、23andMeによるゲノム表現型SNP生データファイル、Kaggleデータセットリポジトリ、2017年1月25日」。
# 有用なリンク
以下のヒトゲノムデータベースサイトを参考にすることができます。
- GenBank - https://www.ncbi.nlm.nih.gov/genbank/
- ヒトゲノムプロジェクト - https://www.genome.gov/hgp/
- ゲノムオンラインデータベース(GOLD) - https://gold.jgi.doe.gov
- Complete Genomics - http://www.completegenomics.com/public-data/
# 着想
探求する価値のあるいくつかのアイデア:
- 問題の人物は癌に罹りやすいか?
- 彼は太りやすい傾向があるか?
- 彼の出身地はどこか?
- 特定の生物学的特徴(癌感受性、脂肪生成率、髪の色など)を決定する遺伝子はどれか?
- この表現型SNPは西洋諸国の他の同様のデータセットとどのように比較されるか?
- この人物の死因は何か?
- この人物が生涯に直面する可能性の高い病気は何か?
- このデータセットの独特な点は何か?
- このデータセットから、個人の特性、知能レベル、祖先、身体構成に関して何を抽出できるか?
# サンプルレポート
このデータで何ができるかを理解するために、以下のレポートを確認してください。
祖先 -
https://www.23andme.com/published-report/eeb4f9bbd6b5474f/?share_id=f6c5562848e84586
体重レポート -
https://you.23andme.com/published/reports/65c9af9f8223456d/?share_id=0126f129e4f3458b
×
The dataset is currently being organized and other channels have been prepared for you. Please use them
The dataset is currently being organized and other channels have been prepared for you. Please use them
Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
No content available at the moment
No content available at the moment
- Share your thoughts
Go share your ideas~~
ALL
Welcome to exchange and share
Your sharing can help others better utilize data.
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.