Select Language

Open Dataset

私の完全なゲノム

私の完全なゲノム

14.96M
300 hits
0 likes
0 downloads
0 discuss
Health,Biology,Genetics Classification

Data Structure ? 14.96M

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    # 背景 ズシャン・ウル・ハッサン・ウスマニのゲノム表現型SNP生データ ゲノミクスは、ゲノムの構造、機能、変異、進化、マッピングを扱う分子生物学の一分野です。完全な30億塩基対から数千の表現型SNPまで、ヒトゲノムの次世代シーケンシングを提供する企業はいくつかあります。私は自分のDNAの表現型SNPについて、23andMe(イルミナのHumanOmniExpress - 24を使用)を利用しました。私は以下の理由で、この全生データセットを国際的な研究コミュニティに公開します。 1. 私は、オープンデータセット、透明性、そして学習、研究、探求、教育の権利を強く信じています。単なるプライバシー上の懸念で知識の流れを制限したくありません。そのため、私は自分の全DNA生データを、プライバシーを心配することなく研究に利用できるよう世界に提供します。私はこれをコピーレフトデータセットと呼んでいます。 2. 研究に利用可能なテストデータセットの多くは西洋諸国からのもので、発展途上国からのものはあまり見られません。私はこのギャップを埋めるために自分のデータを共有することにしました。そして、他の人もこの流れに乗ってくれることを期待しています。 3. もし私のDNAデータを使って命が救われ、知識が得られ、アイデアが探求され、または事実が発見されるなら、私は地球上で最も幸せな人になります。ご自由に利用してください。 # 内容 名前:ズシャン・ウル・ハッサン・ウスマニ 年齢:38歳 出身国:パキスタン 祖先の国:インド(ウッタル・プラデーシュ州 - UP) ファイル:GenomeZeeshanUsmani.csv サイズ:15MB 出所:23andMe個人化ゲノムレポート 研究コミュニティはこの分野でまだ着実に研究を進めており、専門家たちはゲノミクスがまだ初期段階であることに同意しています。あなたは今、このデータセットを通じてこの新しい分野を探求する機会を得ており、少数の初期のゲノミクス利用者の一人になることができます。 このデータセットは、www.23andme.comから抽出された完全なゲノムで、以下の記号で表されるSNPの配列として表現されています:A(アデニン)、C(シトシン)、G(グアニン)、T(チミン)、D(塩基欠失)、I(塩基挿入)、特定の位置のSNPがアクセスできない場合は '_' または '-'。これには染色体1 - 22、X、Y、およびミトコンドリアDNAが含まれています。 利用可能な正確なSNP(塩基対)の完全なリストとそのデータセットインデックスは、 https://api.23andme.com/res/txt/snps.b4e00fe1db50.data で確認できます。 データセットがどのように抽出されたかについての詳細な情報は、https://api.23andme.com/docs/reference/#genomes を参照してください。 さらに、データセットの内容をより詳細に理解するには、https://api.23andme.com/docs/reference/#genotypes の説明を熟読してください。 # 謝辞 ユーザーは、このデータセットを以下のように利用、コピー、配布、引用することができます:「ズシャン・ウル・ハッサン・ウスマニ、23andMeによるゲノム表現型SNP生データファイル、Kaggleデータセットリポジトリ、2017年1月25日」。 # 有用なリンク 以下のヒトゲノムデータベースサイトを参考にすることができます。 - GenBank - https://www.ncbi.nlm.nih.gov/genbank/ - ヒトゲノムプロジェクト - https://www.genome.gov/hgp/ - ゲノムオンラインデータベース(GOLD) - https://gold.jgi.doe.gov - Complete Genomics - http://www.completegenomics.com/public-data/ # 着想 探求する価値のあるいくつかのアイデア: - 問題の人物は癌に罹りやすいか? - 彼は太りやすい傾向があるか? - 彼の出身地はどこか? - 特定の生物学的特徴(癌感受性、脂肪生成率、髪の色など)を決定する遺伝子はどれか? - この表現型SNPは西洋諸国の他の同様のデータセットとどのように比較されるか? - この人物の死因は何か? - この人物が生涯に直面する可能性の高い病気は何か? - このデータセットの独特な点は何か? - このデータセットから、個人の特性、知能レベル、祖先、身体構成に関して何を抽出できるか? # サンプルレポート このデータで何ができるかを理解するために、以下のレポートを確認してください。 祖先 - https://www.23andme.com/published-report/eeb4f9bbd6b5474f/?share_id=f6c5562848e84586 体重レポート - https://you.23andme.com/published/reports/65c9af9f8223456d/?share_id=0126f129e4f3458b
    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:0 Go earn points?
    • 300
    • 0
    • 0
    • collect
    • Share