Hierarchical Agglomerative Clustering(层次凝聚聚类),是聚类分析中的一种重要方法。
- 基本原理
- 它是一种自底向上的聚类方法。开始时,每个数据点都被视为一个单独的聚类。然后,在每一步中,算法会根据某种相似度(或距离)度量标准,寻找最相似(距离最近)的两个聚类,并将它们合并为一个新的聚类。这个过程不断重复,直到满足某个停止条件,比如达到预定的聚类数量或者所有数据点都合并到一个聚类中。
- 例如,假设有5个数据点A、B、C、D、E。最初,聚类为{A}、{B}、{C}、{D}、{E}。如果根据距离度量发现A和B是最相似的,那么就将它们合并为一个新的聚类{AB},...