聚类算法的可伸缩性
(2015-07-02 16:50:17)
标签:
聚类算法可伸缩性 |
分类: 算法探究 |
聚类算法的可伸缩性指的是,许多聚类算法在小于几百个数据对象的小数据集合上运行良好,然而大型数据库可能包含数百万甚至数十亿个对象,在大型数据集的样本上进行聚类可能会导致有偏的结果。因此,我们需要具有高度可伸缩性的聚类算法。
这里的可伸缩性,同时考察的是聚类算法的时间复杂度,以及存储复杂度,如果这两者比较高的话,一般在不做修改的情况下,它们很难直接用于“大数据”的聚类,各种算法的可伸缩性对比如下表。
|
|
|
很高 |
|
很高 |
|
较高 |
|
较高 |
K-Prototypes |
一般 |
DENCLUE |
较低 |
|
一般 |
|
较高 |
|
一般 |
CLARANS |
较低 |
对比表来源
前一篇:未能连接一个Windows服务
后一篇:C++调试技巧:使用文件重定向