Select Language

AI Technology Community

階層クラスタリングHierarchical clustering

階層クラスタリングはある種のアルゴリズムの総称で、下から上へと繰り返し併合するか、または上から下へと繰り返し分割することで入れ子状のクラスタを形成します。このような階層的なクラスは「デンドログラム」で表され、Agglomerative Clusteringアルゴリズムはその一つです。

階層クラスタリングは、異なる「階層」でサンプルデータを分割し、段階的にクラスタリングを行おうとします。クラスタリングツリーにおいて、異なるカテゴリの元データ点はツリーの最下層にあり、クラスタの根ノードはツリーの最上層にあります。

階層クラスタリングの分類

クラスタリングツリーの作成には、現在、下から上への併合と上から下への分割の2つの方法があります。

階層クラスタリングの併合アルゴリズムは主に、2つのデータセットのデータ点間の類似性を計算し、すべてのデータ点の中で最も類似している2つを組み合わせ、これを繰り返します。簡単に言えば、このアルゴリズムはデータ点間の距離を計算して類似性を判断し、距離が小さいほど類似度が高く、最も近い2つのデータ点またはカテゴリを組み合わせてクラスタリングツリーを生成します。


post
  • 41

    item of content
人工知能に関する知識を共有します。これにはAIアルゴリズム、応用例、データ、モデルなどに関する情報が含まれます。