加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

Citespace简单使用教程[转载]

(2015-08-05 17:29:46)

Citespace简单使用教程

已有 286 次阅读 2015-6-7 16:28 |个人分类:知识图谱|系统分类:科研笔记

原文地址 http://blog.sciencenet.cn/blog-2602259-896205.html

具体操作可看The CiteSpace Manual 的论文。下面是我自己理解将数据可视化部分的简单用法。


1、聚类

   聚类能更精准的分析领域里研究方向和热点的分类。

   首先点击首行菜单栏的http://img.blog.csdn.net/20150601100606696?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvYWRlbGVhbWlseQ==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center,然后窗口的右上角看到#clusters就代表聚类完成。左上角显示的是整个聚类网络的一些特性。参数modularity和mean silhouette是告诉我们整体框架的特征的重要参数。例如modularity q = 0.7141代表指数高,整个网络是被分为了松耦合的集群。mean silhouette = 0.5904代表所有集群的同质化程度平均都不高也不低。

   通过点击http://img.blog.csdn.net/20150601101800334?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvYWRlbGVhbWlseQ==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center,可以看到每个聚类集群的情况。Silhouette列代表聚类集群的同质性。假设所有聚类集群的大小一样,Silhouette值越高,那个聚类集群里的成员越一致。如果某个聚类集群的容量太小,高同质化参数是没有意义的。average year of publication代表是最新的论文形成的还是老的论文形成的。


2、生成聚类的标识

   CiteSpace 可以从文章标题http://img.blog.csdn.net/20150601110300699?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvYWRlbGVhbWlseQ==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center


3、主要研究领域

   为了完整清晰呈现主要研究领域,将有些细节可以隐藏

http://img.blog.csdn.net/20150601111510880?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvYWRlbGVhbWlseQ==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center

    图中的1、2、3刚好对应下面的(1)、(2)、(3)

(1)节点大小

http://img.blog.csdn.net/20150601111146192?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvYWRlbGVhbWlseQ==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center

(2)集群标识大小

根据标识的大小决定是隐藏还是显示,或者改变标识里的字体的大小

(3)连接的透明度


4、主要研究领域的关联

  为了弄清楚这个,我们需要在图中恢复连接。CiteSpace用紫色线来标明高连接度的节点。色彩越往紫色走,代表连接度越高。通过点击http://img.blog.csdn.net/20150601112555645?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvYWRlbGVhbWlseQ==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center

第一个符号的菜单,就可以看到连接的线。


5、最活跃的研究方向

在CiteSpace里的爆发点检测算法是Kleinberg 算法。  

http://img.blog.csdn.net/20150601151417222?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvYWRlbGVhbWlseQ==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center可以生成爆发点的总结图。通过图可以看出是从哪些文献开始爆发的,并且发生在什么时候。这方法也可以运用到其他节点类型上。

http://img.blog.csdn.net/20150601152549821?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvYWRlbGVhbWlseQ==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center

6.主要的研究领域是研究什么的

  为了更深入地研究各个集群,可以点击

http://img.blog.csdn.net/20150601170541153?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvYWRlbGVhbWlseQ==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center

然后会出现一个装有四个面板的窗口:1、Clusters,2、Citing Articles.3、Cited References,4、Summary Sentences。

只有你点击Clusters,2、3才会出现内容。

Citing Articles:每一条是指引用了这个Cluster里的一篇论文的论文,每条前面的数字代表引用的比例即引用了这个集群的多少程度。黄色标明的那个词语就是在整个可视化图里显示的那个词语,同时它也在top terms里。

Cited References:代表了自己的集群引用的文章。前面的数字代表引用的次数。同时还给出了文章的其他信息。

Summary Sentences:点击开始按钮,然后会抽取这个集群里所有摘要中最有代表性的句子


7、时间线视图

http://img.blog.csdn.net/20150601173118410?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvYWRlbGVhbWlseQ==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center

点击右侧的Timeline单选按钮,然后你就能看到水平线上的各个集群视图。


0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有