AI Technology Community
payititi-AI助手
2021-11-28 11:16:57
凝集階層クラスタリング
階層的クラスタリングアルゴリズムは2種類に分けられます:トップダウンとボトムアップです。凝集型階層的クラスタリング(HAC)はボトムアップ方式のクラスタリングアルゴリズムです。HACでは、まず各データポイントを単一のクラスタと見なし、次にすべてのクラスタ間の距離を計算してクラスタを統合し、すべてのクラスタが1つのクラスタに集まるまで繰り返します。
以下の図は凝集型階層的クラスタリングの例です:
具体的な手順:
1. まず、各データポイントを単一のクラスタと見なし、2つのクラスタ間の距離を測定する尺度を選択します。例えば、average linkageを尺度として使用します。これは、2つのクラスタ間の距離を、最初のクラスタのデータポイントと2番目のクラスタのデータポイント間の平均距離として定義します。
2. 各反復で、average linkageが最小の2つのクラスタを1つのクラスタに統合します。
3. 手順2をすべてのデータポイントが1つのクラスタに統合されるまで繰り返し、必要なクラスタ数を選択します。
階層的クラスタリングの利点:(1)クラスタの数を事前に知る必要がない
(2)距離尺度の選択にあまり敏感ではない
欠点:効率が低い
11
item of content
クラスタリング分析は群分析とも呼ばれ、(サンプルまたは指標の)分類問題を研究するための統計的分析方法であり、同時にデータマイニングにおける重要なアルゴリズムでもあります。
クラスタリング(Cluster)分析はいくつかのパターン(Pattern)から構成されています。通常、パターンは測定値(Measurement)のベクトルであるか、多次元空間内の一点です。
クラスタリング分析は相似性に基づいており、同一クラスタ内のパターン間には、異なるクラスタに属するパターン間よりも多くの相似性があることが特徴です。このため、クラスタリング分析はデータ内の自然なグループやパターンを見つけ出すのに非常に有用です。
クラスタリング(Cluster)分析はいくつかのパターン(Pattern)から構成されています。通常、パターンは測定値(Measurement)のベクトルであるか、多次元空間内の一点です。
クラスタリング分析は相似性に基づいており、同一クラスタ内のパターン間には、異なるクラスタに属するパターン間よりも多くの相似性があることが特徴です。このため、クラスタリング分析はデータ内の自然なグループやパターンを見つけ出すのに非常に有用です。
- 559hits
- 0replay
-
0like
- collect
- send report