更改

跳到导航 跳到搜索
第12行: 第12行:  
k个初始类聚类中心点的选取对聚类结果具有较大的影响,因为在该算法第一步中是随机的选取任意k个对象作为初始聚类的中心,初始地代表一个簇。该算法在每次迭代中对数据集中剩余的每个对象,根据其与各个簇中心的距离将每个对象重新赋给最近的簇。当考察完所有数据对象后,一次迭代运算完成,新的聚类中心被计算出来。如果在一次迭代前后,J的值没有发生变化,说明算法已经收敛。
 
k个初始类聚类中心点的选取对聚类结果具有较大的影响,因为在该算法第一步中是随机的选取任意k个对象作为初始聚类的中心,初始地代表一个簇。该算法在每次迭代中对数据集中剩余的每个对象,根据其与各个簇中心的距离将每个对象重新赋给最近的簇。当考察完所有数据对象后,一次迭代运算完成,新的聚类中心被计算出来。如果在一次迭代前后,J的值没有发生变化,说明算法已经收敛。
   −
<math>V=\sum_{i=1}^k \sum_{x_j\in S_i} ({x_j -\mu_{i})}^2
+
::<math>V=\sum_{i=1}^k \sum_{x_j\in S_i} ({x_j -\mu_{i})}^2</math>
</math>
      
算法过程如下:
 
算法过程如下:
第27行: 第26行:  
具体如下:
 
具体如下:
   −
输入:'''k''' , '''data[n]'''
+
输入:<math>k</math> ,<math>data[n]</math>
    
(1)选择k个初始中心点,例如 c[0] = data[0],…c[k-1] = data[k-1] ;
 
(1)选择k个初始中心点,例如 c[0] = data[0],…c[k-1] = data[k-1] ;
7,129

个编辑

导航菜单