加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

自然语言处理:中文情感挖掘语料-ChnSentiCorp

(2012-02-27 13:51:42)
标签:

杂谈

分类: 自然语言处理

获取请进:中文情感挖掘语料-ChnSentiCorp

http://www.datatang.com/data/14614

 

1、数据信息:

 经过近一年的进一步收集整理,本语料库已扩展到3个领域:酒店、电脑(笔记本)与书籍。欢迎学术同行试用。

   未去重语料:

   1.ChnSentiCorp-Htl-ba-4000平衡语料,正负类各2000篇。

   2.ChnSentiCorp-NB-ba-4000平衡语料,正负类各2000篇。

   3.ChnSentiCorp-BK-ba-4000平衡语料,正负类各2000篇。

   去重后语料:

   1.ChnSentiCorp-Htl-del-4000平衡语料,正负类各2000篇。

   2.ChnSentiCorp-NB-del-4000平衡语料,正负类各2000篇。

   3.ChnSentiCorp-BK-del-4000平衡语料,正负类各2000篇。

 

2、数据大小:6.07M

3、数据来源:北理工网络搜索挖掘与安全实验室

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有