第110行: |
第110行: |
| [[Image:Clusters.svg|thumb|原始数据|center]] | | [[Image:Clusters.svg|thumb|原始数据|center]] |
| | | |
− | 例如,假设要对这些数据进行聚类,将欧式距离作为度量。系统聚类[[树状图]]如下: | + | 例如,假设要对这些数据进行聚类,将欧式距离作为度量。系统聚类[[树状图]]如下: |
| | | |
| [[Image:Hierarchical_clustering_simple_diagram.svg|thumb|传统展现法|center]] | | [[Image:Hierarchical_clustering_simple_diagram.svg|thumb|传统展现法|center]] |
第121行: |
第121行: |
| | | |
| | | |
− | 还可以选择在这个阶段构造一个[[距离矩阵 distance matrix]],其中第''i''行第''j''列中的数字是 ''i''和''j'',即为两个元素之间的距离。然后,随着聚类过程的推进,行和列随着聚类的合并和距离的更新而合并。这是实现这类聚类的常用方法,并且具有缓存簇之间的距离的优点。在[[单连接聚类 single-linkage clustering]]页面中描述了一个简单的凝聚聚类算法; 它适用于很多连接(见下文)。 | + | 还可以选择在这个阶段构造一个[[距离矩阵 distance matrix]],其中第''i''行第''j''列中的数字是 ''i''和''j'',即为两个元素之间的距离。然后,随着聚类过程的推进,行和列随着聚类的合并和距离的更新而合并。这是实现这类聚类的常用方法,并且具有缓存簇之间的距离的优点。在[[单连接聚类 single-linkage clustering]]页面中描述了一个简单的凝聚聚类算法;它适用于很多连接(见下文)。 |
| | | |
| | | |
第127行: |
第127行: |
| | | |
| | | |
− | 通常情况下的簇<math>\mathcal{A}</math>和 簇<math>\mathcal{B}</math>之间距离如下: | + | 通常情况下的簇<math>\mathcal{A}</math>和 簇<math>\mathcal{B}</math>之间距离如下: |
| | | |
| * 每个簇内元素之间的最大距离(又名[[完全连接聚类 complete-linkage clustering]]) | | * 每个簇内元素之间的最大距离(又名[[完全连接聚类 complete-linkage clustering]]) |
第133行: |
第133行: |
| | | |
| | | |
− | * 每个簇内的元素之间的最小距离(也称为[[单连接聚类 single-linkage clustering]]): | + | * 每个簇内的元素之间的最小距离(也称为[[单连接聚类 single-linkage clustering]]): |
| ::<math> \min \{\, d(x,y) : x \in \mathcal{A},\, y \in \mathcal{B} \,\}. </math> | | ::<math> \min \{\, d(x,y) : x \in \mathcal{A},\, y \in \mathcal{B} \,\}. </math> |
| | | |
第153行: |
第153行: |
| | | |
| | | |
− | 当簇数足够少时,人们可以停止聚类过程。有些联系也可能保证聚集发生在比先前聚集更大的聚集距离上,直到当聚集距离太远无法合并时可以停止聚集(距离标准)。然而也有例外,如采用质心连接,可能会发生逆转(反转 inversions,偏离超节拍 departures from ultrametricity)<ref>{{Cite book | last1= Legendre | first1 = P. | first2 = L. | last2=Legendre | title= Numerical Ecology | publisher=Elsevier Science BV | date=2003}}</ref>。
| + | 当簇数足够少时,人们可以停止聚类过程。有些联系也可能保证聚集发生在比先前聚集更大的聚集距离上,直到当聚集距离太远无法合并时可以停止聚集(距离标准)。然而也有例外,如采用质心连接,可能会发生逆转(反转 inversions,偏离超节拍 departures from ultrametricity)<ref>{{Cite book | last1= Legendre | first1 = P. | first2 = L. | last2=Legendre | title= Numerical Ecology | publisher=Elsevier Science BV | date=2003}}</ref>。 |
| | | |
| </br> | | </br> |