加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

Clementine聚类分析

(2010-04-29 09:27:00)
标签:

节点

聚类算法

数据集

模型

描述性

分类: clementine数据挖掘

本文采用Clementine自带的drug数据集,进行聚类分析。我采用kmeans,SOM和两阶段方法三种聚类算法建模,分别进行描述。聚类分析作为一种描述性,操作起来也是很简单的。

首先建立如下数据集,加入变项文件节点,类型节点,kmeans模型节点,Kohonen模型节点,两步模型节点。

https://pfztpq.bay.livefilestore.com/y1mv2dAmOw-P_3ldPHZGQzly-mLqSL_oh_dF8Za8kZd1TIKMJzVhFHNNZcTJPLiErbs-cjUojlb71KyWUFXDYv9zroW4itP1xeuooXrrqsQQaUIsRbks6Uf5Wywuhl067Q0O396IbD4xlwQ0JpWmYc4FA/clip_image002_thumb%2069C4E217.jpg

设置变项文件节点信息,导入数据集。

https://pfztpq.bay.livefilestore.com/y1mw1VtmpMYx_ZDy4Jqk4wNKDMYt35G4GfTIMFC3UuHnn_OvseuORWffehU3EJySqDH95aoFDeiriCAzuuQwAQRjtvadV9RNp7Vzpazu5EIXvQyw8VIivnj-HjBxlc4aHlBgHCDxsXkvC9y-XDN-whQzQ/clip_image004_thumb%2031ED6504.jpg

https://pfztpq.bay.livefilestore.com/y1ml5qEz4241S_271R-OeduRePuNISdh7VF5M347m80VOsVBgnipmd0D6eFH4DPOzTSAekU22hpR3Vi2KuJg-6rNoP03jvEv-nXO67BGpULDALH3MrqXN_G590M6s_44By1V6zj6M0ZPqkPEy858TfGqQ/clip_image006_thumb%2075F946EA.jpg

设置kmeans模型节点信息

https://pfztpq.bay.livefilestore.com/y1mS5alpGJfPxy5yiNmDP664Uybz2bQhgr8aSleAM0XA7-eexPbA1zO-bVtg4ZPz6xFHoxKS9ecMxqAOqU-JwK9bMRX0jnltj8SbDd1Pv1fNlXI-W7SenNUdZ3FtxYssMD89gSsSS7FHG7fTWYgACnuAA/clip_image008_thumb%2042F4BB10.jpg

设置Kohonen节点信息

https://pfztpq.bay.livefilestore.com/y1mx2ht8BDXeY-9mXyqJzux-YALR4CIJdvkSkmg6OwZoy-jOzLoyTbfbiPsTL371bjI52c0aH1vITxDSImNLqAydJuTdOPyLzCgOsIpFFUcSgNXbH1pxZrRamYQ2v3COiRl3NJe3nf610kF43q9zDvbSQ/clip_image010_thumb%20122CB7F2.jpg

设置两阶段聚类模型节点信息

https://pfztpq.bay.livefilestore.com/y1mcYlEgCaEFIjn0dZIbKL7tRTNPVwMD2plG4W9LgLVGvfbgNAdEXyC55zSv38dQKoGwYIFkEpA5X_OBwgMBHFQAwOKmJoxubDcHG4gV0FaI3OSb37Q4S3EZiV-ALCO-7BJYjPpGesfBb994anTlnYIwQ/clip_image012_thumb%200CD087E1.jpg

加入模型节点信息

https://pfztpq.bay.livefilestore.com/y1mgkXRnOuxgkbUMtyQALVuHH5x5WTzbTIxgyLEwv2VkSwIe_y6DoYTlHp-52AXJ-mkQ0NJuZ_JySsjiBnZJDjKURlrGAhUXxG03FHlgoSnUgOR-bFvIyFX-sY3AHe1blmjxDsAXEyyKiKdXCQSRB4abA/clip_image014_thumb%2078629A57.jpg

加入分布图查看结果信息

https://pfztpq.bay.livefilestore.com/y1mptVgcSPHSAw4tsQY2GlJK7RYgYDzXCKdM_vnj70jjLObVgfWvkBFLbTe0BKxlJGSPyJpI6jwDmMs70yXBELPXpFxaoo3vOmRi0NoSzJS9B-VdveN0jkxFg6IEZi8CPE2y32BdL631_UntNN9ZnFLsw/clip_image016_thumb%2017B84365.jpg

https://pfztpq.bay.livefilestore.com/y1mYQYFJ9sUkS_37To09_59e2DdbNU4r-Ll-1vC40OgAKTGSA3WiVhTD3o46nYMxTR5H5TUjSjPJtyBWpUOmHHlBOM6-JO8imvTm1BAp8rL6kqmHr6J695WiGqG6L90gXwLm89imkIQDoc4F96a2asb-w/clip_image018_thumb%20413CF62E.jpg

https://pfztpq.bay.livefilestore.com/y1mmH_Bi71NxZt9jHpPKd3FgL1FROtq0KtUGK2NZJndttmubmrYyCiuEJLMGxDIVVnMjqUuHuwYPVAQroUZZNiH1BuNEP0PjJtWUGTOkVOQm9eNefM7f5SVo_E2hLtOajS-OPTdiZOaNjtjaLbd8x0iYQ/clip_image020_thumb%202E2C3B0B.jpg

https://pfztpq.bay.livefilestore.com/y1m2DFFyOlN7Eg5fHTBCBr9-csWASI42UUrFNbzDPl_G00MVHLnsRttW56ySHQq2VIVsbMoJcMKjvEeSMbHl_a_23lFtwqActj6cg9O5akGSSgrLN2csYvFaIfnWLliyg0w2tY5SYcUDTYzU2av0-ZmfA/clip_image022_thumb.jpg

https://pfztpq.bay.livefilestore.com/y1mwCVpxfsEVGJWZvm-C0SrTFVHGZpyaxP3UW4R7U68d9rARoHcHqMHkIgK7DCpkvgyIgbKx434HiwsK_QfpUO9HTEfvt7nLIOcDDU3bmIP2XKb7x6oSTUp0tD-WEKL_um7wd2P1Oc_i-WGH4nSdpbLDw/clip_image024_thumb.jpg

https://pfztpq.bay.livefilestore.com/y1mzfAe7_LjrotpmZXHp9GGiqasEiybTzaShkejBJjkOpgmqPsPVOoIb0ilKQHo9LStClFQGmT5b6iKtQvGV9_GgR1vEKnuTnqXVvwsXisV12EgLvdacMclfEy6aOEXTt8EEGO5QYELFqTGkG_-VWhG4A/clip_image026_thumb.jpg

https://pfztpq.bay.livefilestore.com/y1mEzHUYvjmYGByNpcsbA_ndA0bgi7VAk8Q9-Gdikkt3UUD1qIRPWtiIJsaNdawT40PWcv-9fN1-sZorMW5N7Px2BxyqkaDodxYlBk3cHLWSe3sI7r5d_zAQH1Oh9iiaTTcMlJx43uKYX259qxCw_I8XA/clip_image028_thumb.jpg

clementine提供的聚类模型也是比较丰富的,相对来说,这样的描述性建模是比较简单的。通常,聚类算法经常用

在数据预处理方面,尤其是数据海量时,需要将数据划分为有意义的组,然后考虑进一步深度分析模式。

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有