聚类分析聚类算法中包含哪些数据类型

标签:
聚类分析大数据分析数据分析数据挖掘 |
许多基于内存的聚类算法采用以下两种数据结构:
(1)数据矩阵(Data
http://www.cda.cn/uploadfile/image/20180822/20180822065816_80406.png
(2)相异度矩阵(Dissimilarity
http://www.cda.cn/uploadfile/image/20180822/20180822065810_87915.png
许多聚类算法都是以相异度矩阵为基础的,如果数据是用数据矩阵形式表示,则往往要将其先转化为相异度矩阵。
相异度d(i,j)的具体计算会因所使用的数据类型不同而不同,常用的数据类型包括:区间标度变量,二元变量,标称型、序数型和比例标度型变量,混合类型的变量。