K Means算法的一个明显缺陷就是慢,那么还有哪些缺陷和劣势呢?
5个回答
- K-Means计算量大,速度慢
 - K -Means对迭代初始点的选择比较敏感,容易陷入局部最小值
 - K-Means对高维数据表现不佳(慢,高维数据容易稀疏)
 - K-Means对categorical feature不能直接处理
 
- K means对样本的输入顺序比较敏感
 - K means对数值特征的缩放也非常敏感
 
K means和Knn在模型上有一些共性,所以缺点也类型。可以额外阅读以下:kNN算法有哪些缺点?
-----------补充一下------------
我上面说的第二点不是很准确,因为对于batch K Means,顺序是不影响结果的。
感谢各位的讨论,为什么K Means算法对样本的输入顺序比较敏感?
SofaSofa数据科学社区DS面试题库 DS面经
				已更新,谢谢提醒
				- 
             数据科学小K
           
				
          
          2018-10-10 14:20
			
    
  相关讨论
  随便看看