AI Technology Community
小小程序员
2021-05-15 22:28:06
分類データ(categorical data)
ある特徴は、離散的な可能な値のセットを持ちます。例えば、house style
という名前のカテゴリ特徴は、離散的な可能な値のセット(合計3つ)、つまり Tudor, ranch, colonial
を持っています。house style
をカテゴリデータとして表すことで、対応するモデルは Tudor
、ranch
、colonial
がそれぞれ住宅価格に与える影響を学習することができます。
時には、離散集合内の値は相互排他的であり、指定されたサンプルにはそのうちの1つの値のみを適用できます。例えば、car maker
カテゴリ特徴は、1つのサンプルに1つの値 (Toyota
) のみを許可する場合があります。他の場合には、複数の値を適用することができます。車は複数の異なる色で塗装されることがあるため、car color
カテゴリ特徴は、単一のサンプルに複数の値(例えば red
と white
)を持つことを許可する場合があります。
カテゴリ特徴は、時に離散特徴と呼ばれます。
数値データとは対照的です。
171
item of content
機械学習は多分野にまたがる学問であり、確率論、統計学、近似理論および複雑なアルゴリズムに関する知識を包含しています。コンピュータをツールとして用い、人間の学習方法をリアルタイムで模倣することを目指すとともに、既存の内容を知識構造に分類して学習効率を効果的に向上させることを目指しています。
- 461hits
- 0replay
-
0like
- collect
- send report