Select Language

AI Technology Community

不均衡を分類するデータセット(class-imbalanced data set)

一種の二元分類問題で、このような問題では、2種類のクラスのラベルの出現頻度に大きな差があります。例えば、ある疾患データセットでは、0.0001のサンプルが正のクラスラベルを持ち、0.9999のサンプルが負のクラスラベルを持っています。これは分類不均衡問題に該当します。しかし、あるサッカー試合予測器では、0.51のサンプルのラベルが一方のチームの勝利で、0.49のサンプルのラベルがもう一方のチームの勝利であれば、これは分類不均衡問題に該当しません。

post
  • 171

    item of content
機械学習は多分野にまたがる学問であり、確率論、統計学、近似理論および複雑なアルゴリズムに関する知識を包含しています。コンピュータをツールとして用い、人間の学習方法をリアルタイムで模倣することを目指すとともに、既存の内容を知識構造に分類して学習効率を効果的に向上させることを目指しています。