加载中…
个人资料
马小李
马小李
  • 博客等级:
  • 博客积分:0
  • 博客访问:8,847
  • 关注人气:36
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

聚类算法的可伸缩性

(2015-07-02 16:50:17)
标签:

聚类算法

可伸缩性

分类: 算法探究

聚类算法的可伸缩性指的是,许多聚类算法在小于几百个数据对象的小数据集合上运行良好,然而大型数据库可能包含数百万甚至数十亿个对象,在大型数据集的样本上进行聚类可能会导致有偏的结果。因此,我们需要具有高度可伸缩性的聚类算法。

这里的可伸缩性,同时考察的是聚类算法的时间复杂度,以及存储复杂度,如果这两者比较高的话,一般在不做修改的情况下,它们很难直接用于“大数据”的聚类,各种算法的可伸缩性对比如下表。

 算法名称

 可伸缩性

 WaveCluster

很高

 ROCK

很高

 BIRCH

较高

 CURE

较高

K-Prototypes

一般

DENCLUE

较低

 OptiGrid

一般

 CLIQUE

较高

 DBSCAN

一般

CLARANS

较低

对比表来源

http://blog.chinaunix.net/uid-10289334-id-3758310.html

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有