加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

[转载]SATI 国产文献题录信息统计分析工具:使用教程

(2015-10-01 21:54:22)
标签:

转载

分类: 学术资料

背景:

      通过统计和分析期刊数据以挖掘出实用的模式和隐藏的信息,已成为识别学科热点或探索学科前沿的重要方法之一,而全文期刊数据库所收录的电子期刊文献自然成为数据源的首选。题录作为描述文献外部特征的重要条目集合,利用适当的信息抽取技术和定量分析方法,即可以题录为媒介,深入发掘和呈现出美妙的数据统计分析结果。对信息技术的掌握可使得我们编写出控制台程序或者窗体软件,以往需要进行大量手工分析运算的工作如今可以迅速直接的从数据本身得出结论。目前针对题录信息统计分析而开发的软件以国外较多,其数据源大都为国外数据库(WOS)导出文件,并且多为大型、复杂软件难以操作,为提供一个专门分析国内期刊论文题录信息,同时拥有分析WOS题录数据功能的小巧精准工具,以抽取指定字段信息、统计条目出现频率、构建知识单元共现矩阵,特作此软件和说明。

目的:

    提供开源软件,辅助研究者统计分析文献题录信息或构建共现矩阵;只提供中间数据生成,不代表最终研究结果,即现成大型软件具备的后续功能(如基于词频排序构建图表,基于共现矩阵进行聚类分析、制作网络知识图谱等)自然不必开发;个人为学习.NET相关技术而作。

方法:

    开发平台:.NET Framwork 4.0;技术语言:C#, WinForm

 

功能模块:

        1.字段信息抽取:支持WOS导出的HTML格式、EndNote格式和NoteExpress格式三种格式题录数据,抽取题录中指定的字段信息并可选择存储为文本文档(包括:自定义字段、关键词、主题词、作者、引文、机构、发表年、标题、期刊名、文献类型、摘要、URL等字段)。

        2.条目频次统计:根据抽取到的字段信息对条目内元素的频次进行统计和降序排列(包括:自定义标识、关键词、主题词、作者、引文、机构、发表年、标题、期刊、文献类型等)。

        3.共现矩阵构建:根据设定的共现矩阵行列数,将频次降序排列表中的相应数量条目元素作为矩阵知识单元进行运算,以构建知识单元共现矩阵(包括:关键词共现矩阵、主题词共现矩阵、作者共现矩阵、引文共现矩阵、机构共现矩阵等)并生成EXCEL格式文档,进而可以基于此矩阵文档导入相关软件(如Ucinet、Netdraw等可视化分析软件)生成共现网络知识图谱。

         4.内嵌Netdraw软件,可以直接在矩阵生成后进行可视化分析。

 

当前版本:

         SATI 3.2 

         下载链接 http://pan.baidu.com/share/link?shareid=133442&uk=3238469186

          官网:http://sati.liuqiyuan.com

 

提示说明:

数据源:

        目前本软件支持三种格式题录数据(EndNote格式、NoteExpress格式、HTML(WOS)格式和CSSCI格式)。

        1.EndNote格式:推荐使用中国知网(CNKI)导出EndNote格式的题录数据,因为知网提供的EndNote格式题录数据较为完整,万方数据(WF)提供的EndNote格式题录数据中作者字段只显示第一作者。

        2.NoteExpress格式:推荐使用万方数据(WF)提供的NoteExpress格式题录数据,因为万方提供的NoteExpress格式题录数据较为完整,中国知网(CNKI)提供的此类数据缺少关键词字段数据。

        3.HTML(WOS)格式:Web of Science数据库平台导出的HTML格式题录数据。

        4.CSSCI格式:南京大学CSSCI检索题录数据,同时支持旧版和新版格式。

操作流程:

        具体参照软件【简介】—【帮助文档】。 

注意事项:请一定要按照步骤进行操作,即顺序点击按钮: 【抽取字段】——【统计频次】——【生成共现矩阵】。

帮助:实例演示:

1.分别检索 WOS 数据库平台和中国知网 CNKI,导出 2006-2010 年图书情报学学科十种国际和国内核心期刊论文题录数据,先设定【题录格式】,然后选择【文件夹】方式将题录数据导入软件;
http://s12/middle/4ee13c2c4dca428a18c2b&690国产文献题录信息统计分析工具:使用教程" TITLE="[转载]SATI 国产文献题录信息统计分析工具:使用教程" />

2.选择要抽取的字段名称【关键词】,点击【抽取字段】按钮,抽取出关键词字段信息;
http://s7/middle/4ee13c2c07c76d0df5076&690国产文献题录信息统计分析工具:使用教程" TITLE="[转载]SATI 国产文献题录信息统计分析工具:使用教程" />

3.点击【统计频次】按钮,对条目频次进行统计(如:得到关键词词频统计文档);
http://s14/middle/4ee13c2c4dca428afe50d&690国产文献题录信息统计分析工具:使用教程" TITLE="[转载]SATI 国产文献题录信息统计分析工具:使用教程" />

4.在【行列数】文本框中设置矩阵行列数,点击【生成共词矩阵】按钮,生成共词矩阵(100×100 的 Excel 格式和全矩阵.txt 格式);
http://s11/middle/4ee13c2c07c76d0de6b2a&690国产文献题录信息统计分析工具:使用教程" TITLE="[转载]SATI 国产文献题录信息统计分析工具:使用教程" />

5.点击netdraw按钮,进行高频关键词共现分析,根据频次属性设置节点大小与连线粗细程度,生成网络知识图谱;
http://s11/middle/4ee13c2c07c76d0e0e14a&690国产文献题录信息统计分析工具:使用教程" TITLE="[转载]SATI 国产文献题录信息统计分析工具:使用教程" />

6.国际、国内高产作者合作矩阵、高产机构合作矩阵、共引矩阵等分析方法步骤同上。分别可得,国际、国内图书情报学高产作者合作网络,国际、国内图书情报学主要研究机构合作网络。

 

以上内容在http://hi.baidu.com/liuqiyuan/item/79c3a619d7e7bb633f87cedf基础上整理所得。





0

  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有