Select Language

Open Dataset

コミュニティと犯罪データセット(正規化)

コミュニティと犯罪データセット(正規化)

0.97M
371 hits
0 likes
3 downloads
0 discuss
Social Science,Crime,Public Safety,Data Visualization,United States Classification

Data Structure ? 0.97M

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    属性の重みを選択または学習するアルゴリズムをテストできるように、多くの変数が含まれています。ただし、明らかに関係のない属性は含まれていません。犯罪と何らかの妥当な関連がある場合(N = 122)、属性が選択され、予測対象の属性(人口当たり暴力犯罪数)も含まれます。データセットに含まれる変数には、都市と見なされる人口の割合や世帯収入の中央値などの地域に関するもの、および人口当たりの警察官の数や麻薬対策部門に配属されている警察官の割合などの法執行に関するものがあります。 人口当たり暴力犯罪変数は、人口と米国で暴力犯罪と見なされる犯罪変数の合計(殺人、レイプ、強盗、暴行)を使用して計算されました。いくつかの州では、レイプのカウントに関して明らかに論争がありました。これにより、レイプの欠損値が生じ、人口当たり暴力犯罪の誤った値が生じました。これらの都市はデータセットに含まれていません。これらの除外された地域の多くは、米国中西部からのものでした。 データは、元の値に基づいて以下に説明されています。すべての数値データは、教師なしの等間隔ビニング方法を使用して、0.00 - 1.00の小数範囲に正規化されました。属性はその分布と歪みを保持しています(したがって、たとえば、ほとんどの地域が小規模であるため、人口属性の平均値は0.06です)。たとえば、「世帯当たりの平均人数」と記述されている属性は、実際にはその値の正規化(0 - 1)されたバージョンです。 正規化は、属性内の値の概算比率を保持します(たとえば、利用可能な精度内で人口が2倍になると値も2倍になりますが、極端な値は除きます。平均から3標準偏差以上高いすべての値は1.00に正規化され、平均から3標準偏差以上低いすべての値は0.00に正規化されます)。 ただし、正規化は属性間の値の関係を保持しません(たとえば、ある地域の白人人口当たりの値と黒人人口当たりの値を比較することは意味がありません)。 制限事項として、LEMAS調査は少なくとも100人の警察官を擁する警察署、および小規模な警察署のランダムサンプルを対象としていました。私たちの目的に関しては、国勢調査と犯罪データセットの両方に見つからない地域は除外されました。多くの地域でLEMASデータが欠落しています。
    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:0 Go earn points?
    • 371
    • 3
    • 0
    • collect
    • Share