Select Language

AI Technology Community

密度に基づくクラスタリング方法(DBSCAN)

平均シフトクラスタリングと同様に、DBSCANも密度ベースのクラスタリングアルゴリズムです。
具体的な手順:
1. まず、半径rとminPointsを決定します。 未訪問の任意のデータポイントから始めて、この点を中心とし、半径rの円内に含まれる点の数がminPoints以上であるかどうかを確認します。minPoints以上であれば、その点はcentral pointとしてマークされ、そうでなければnoise pointとしてマークされます。
2. 1の手順を繰り返します。あるnoise pointがあるcentral pointを中心とする半径rの円内に存在する場合、その点はエッジポイントとしてマークされ、そうでなければ依然としてnoise pointとなります。手順1を繰り返し、すべての点が訪問されるまで続けます。
利点:クラスタの数を事前に知る必要がない
欠点:距離rとminPointsを決定する必要がある

post
  • 11

    item of content
クラスタリング分析は群分析とも呼ばれ、(サンプルまたは指標の)分類問題を研究するための統計的分析方法であり、同時にデータマイニングにおける重要なアルゴリズムでもあります。

クラスタリング(Cluster)分析はいくつかのパターン(Pattern)から構成されています。通常、パターンは測定値(Measurement)のベクトルであるか、多次元空間内の一点です。

クラスタリング分析は相似性に基づいており、同一クラスタ内のパターン間には、異なるクラスタに属するパターン間よりも多くの相似性があることが特徴です。このため、クラスタリング分析はデータ内の自然なグループやパターンを見つけ出すのに非常に有用です。