加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

CSSCI转SCI导入CiteSpace

(2012-10-23 10:48:49)
标签:

csscirec

citespace

sci

批量下载

分类: 学习笔记
不少做科研的朋友在分析文献时,会尝试些新方法,新手段。有的同学在用CiteSpace做可视化分析时碰到些问题,如从CSSCI里导出的数据格式,导出格式并不能直接转换成SCI的数据。大家使用比较多的的转换工具是CSSCIREC.jar。现记下一些想法:
1. CiteSpace和CSSCIREC都是用JAVA开发的本地程序,需要安装JDK来运行。
2. CSSCIREC将CSSCI导出的数据转换成SCI用的格式,这个实现可用一些字符串操作如indexOf,substring等来提取CSSCI的字段值,再按SCI的格式要求重新组合却可。当然,也可以用正则表达式,这可就省了不少if语句了。CSSCI与SCI对应例如:
AU,author,【来源作者】
TI,title,【来源篇名】/【来源文献】
SO,source,【期刊】/【来源期刊】
DE,description,【标引词】
C1,unit,【机构名称】/【作者机构】
CR,reference
NR,cout
PY,year,【年代卷期】
VL,
PG,
CSSCI格式:
【文件序号】11G0142011010009
【来源篇名】出版社如何满足高校图书馆购书需求
【英文篇名】
【来源作者】党卫红/王丽敏
【文章类型】论文
【基    金】
【期    刊】科技与出版
【第一机构】中国矿业大学(北京)
【机构名称】中国矿业大学(北京)/中国矿业大学(北京)
【学科分类】新闻学与传播学
【第一作者】党卫红
【中图类号】G23
【年代卷期】2011,(010):29-31
【关 键 词】高校图书馆/资源建设/出版社/营销
【基金类别】
【参考文献】
-----------------------------------------------------------------------

【文件序号】11G0202011010017
【来源篇名】对高校图书馆图书“借阅空档期”的研究——以西南大学图书馆为例
【英文篇名】Research on Library “Lending Empty Slot”——Taking The Library of Southwest University as an Example
【来源作者】林萍/杨挺
【文章类型】论文
【基    金】
【期    刊】图书情报工作
【第一机构】西南大学
【机构名称】西南大学教育学院/西南大学教育学院
【学科分类】图书馆、情报与文献学
【第一作者】林萍
【中图类号】G252.5
【年代卷期】2011,55(010):80-83,30
【关 键 词】图书馆/借阅效率/借阅空档期/改善策略
【基金类别】
【参考文献】
1.梁桂芝.提高图书流通率的探索与实践.农业图书情报学刊.2006.(12)
2.宗栓金.流通服务动态管理的思考.山东图书馆季刊.2005.(2)
3.吉汀.谈高校图书馆的人本管理.图书情报工作.2006.(7)
4.廖利文.浅议高校图书馆人员的心理管理.广东职业技术师范学院学报.2002.(2)
-----------------------------------------------------------------------

3. 有些同学在使用软件过程当中,碰到一些安装或是运行时出现的问题,没能使用软件,很是遗憾。如果能将这些软件做成RIA的应用,让同学们打开网页即可使用,可真是方便多了。比如使用HTML5,或是Flash。在
数据可视化的显示方面,就目前还是FLASH用得多些。像同济大学图书馆的可视化平台,还有IBM的ILOG Elixir等。相信在未来,也会出不少HTML5的解决方案的。
4. JAVA做可视化的开源项目也有一些,可以充分利这这些开源成果来构造自己的可视化平台,但要注意许可协议哟。
5. 有些学者说在看通过数据可视化生成的图时,得到的信息跟表格差不多,只是多漂亮而已,可视化技术,知识图谱的效果就这么一些吗?或许,与数据挖掘结合起来,可视化技术将会更有优势吧。
6. 看了一些图书馆专业的核心期刊,也包括一些其它专业做科研时用到的这些可视化的工具,基本思路就是下载数据,人工“除噪”,然后就可以点按钮一步一步的生成图形,然后再对图形做解释说明,有的甚至通过图形给的“答案”去找“原因”来论证。同一模式,换几个关键词,就能出品了,做文献研究是否存在这种“工业化”生成的模式呢?该不该质疑软件本身,该不该质疑软件所使用的算法?
7. 从多个TXT中将CSSCI批量转SCI

8. 从CSSCI的检索结果页面导出数据时,需要一页一页的选择,逐页导出吗?还是因为没有权限批量导出?草根的思路是研究生成导出数据的action:control/controllers.php,可查看其JS脚本,做个爬虫,自动抓取所有结果记录。


使用说明:
1.在检索页面进行检索.
2.待检索结果出来后,如果记录数小1000的,直接点"获取文章号"按钮,如果大于1000的,请先勾选"按年下载打包",再按"获了文章号"按钮.下方的文本调试信息会显示采集的情况
3.待采集完成后,点数据管理选项卡,点"读取"按钮,即可读出所采集的数据,按"WOS"可导出WOS的格式.
http://s13/mw690/67532f7cgcccae315644c&690


http://s4/mw690/67532f7cgcccb09a8a753&690

http://s2/mw690/67532f7cgcccb09816141&690
测试反馈:
2012-11-7:支持NOTEEXPRESS2,以及ENDNOTE.在NOTEEXPRESS2 中要设置为web of science ccc-(ris) 过滤器
2012-11-10:Json转换有些问题,<语义Web运作机制的认知语义学基础>的关键语 语义Web,只截得义Web.
WIN7下运行有问题,可能是文件权限的原因,数据库无法创建,保存不好。(查明原因,原来是生成的数据库文件有错误,DB组件代码贴错了项目.已改正)
WOS格式无法导入BibExcel。
2012-12-5:关键词采集有错,第一个字漏掉(已改正)
2012-12-30Citespace中有CSSCI2WOS的功能,citespace.io.data.chinese;代码跟大连理工的刘老师那个转换工具是一样的.citespace的使用的是开源的prefuse(http://prefuse.org/)来做可视化.

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有