Select Language

AI Technology Community

分類データ(categorical data)

ある特徴は、離散的な可能な値のセットを持ちます。例えば、house style という名前のカテゴリ特徴は、離散的な可能な値のセット(合計3つ)、つまり Tudor, ranch, colonial を持っています。house style をカテゴリデータとして表すことで、対応するモデルは Tudorranchcolonial がそれぞれ住宅価格に与える影響を学習することができます。

時には、離散集合内の値は相互排他的であり、指定されたサンプルにはそのうちの1つの値のみを適用できます。例えば、car maker カテゴリ特徴は、1つのサンプルに1つの値 (Toyota) のみを許可する場合があります。他の場合には、複数の値を適用することができます。車は複数の異なる色で塗装されることがあるため、car color カテゴリ特徴は、単一のサンプルに複数の値(例えば redwhite)を持つことを許可する場合があります。

カテゴリ特徴は、時に離散特徴と呼ばれます。

数値データとは対照的です。


post
  • 171

    item of content
機械学習は多分野にまたがる学問であり、確率論、統計学、近似理論および複雑なアルゴリズムに関する知識を包含しています。コンピュータをツールとして用い、人間の学習方法をリアルタイムで模倣することを目指すとともに、既存の内容を知識構造に分類して学習効率を効果的に向上させることを目指しています。