Select Language

Open Dataset

技術調査におけるメンタルヘルス:オリジナルデータ

技術調査におけるメンタルヘルス:オリジナルデータ

2.76M
649 hits
0 likes
4 downloads
0 discuss
Earth and Nature,Computer Science,Internet,Programming,NLP,Tabular Data,Mental Health,Survey Analysis,spaCy Classification

Data Structure ? 2.76M

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    # 背景 ## 調査データ(2014年、2016年、2017年、2018年) このデータセットの目的は、2016年、2017年、2018年のOSMI技術分野におけるメンタルヘルス調査の生データにアクセスできるようにすることであり、これは分析を容易にするために使用されます。例えば、[複数の時期のOSMI調査を統合した私のカーネル](https://www.kaggle.com/ekwiecinska96/dataset-creation-fusing-surveys-from-2014-2018) などです。 これは、Kaggleにアップロードされた人気の2014年のデータセットがすでに前処理とクリーニングされている(そして、2016年の他の唯一のアップロードデータはカーネルとうまく連携しない)という事実によるものです。これは便利ですが、多くの列が単純な属性名に変更されています。例えば、「あなたは自営業ですか?」は「self_employed」と標準化されています。その後の年の調査ではこのような処理が行われていないため、属性を一致させるために処理手順を逆エンジニアリングするのは困難でした。また、すべてのデータを一箇所にまとめるのは素晴らしいことです。 ## 類似度行列 numpyで読み取り可能なファイル(.npy)として保存された関連する類似度行列は、前述のカーネルの補助ファイルです。これは、執筆時点(2019年6月)でKaggleが[SpaCyモデル](https://spacy.io/usage/models) のうち単語ベクトルを含むモデル(*sm*以外のすべてのモデル)をサポートしていないという不幸な事実によりアップロードされました。この行列がどのように作成されたかについての詳細は、関連するカーネルを参照してください。 ## 謝辞 元のデータ収集とホスティングはすべて[Open - Sourcing Mental Illness (OSMI)](https://osmihelp.org) によって提供されています。すべてのデータセット(2016年、2017年、2018年を含む)は[こちら](https://osmihelp.org/research) で見つけることができます。 # 着想 これらのデータセットをアップロードする着想は、私のようなKaggleユーザーが属性の前処理と標準化をより高度に制御できるようにすることでした。
    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:0 Go earn points?
    • 649
    • 4
    • 0
    • collect
    • Share