加载中…
个人资料
青梅
青梅 新浪个人认证
  • 博客等级:
  • 博客积分:0
  • 博客访问:14,648
  • 关注人气:618
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

关于通过文本噪音分析判断作者

(2005-04-24 20:55:08)
经常听说用词频统计什么的判断作者,心里就笑,如果大家写文章某些字、词频率都那样的,也算特征么?必然是与平均数有差别的,不管正差还是负差,才算特征,这里面还要考虑的到稳定性,剔除因为特定题材造成的某些字词影响,还要考虑方言特征,把由于地域特点造成的“特征”剔除,哪有那么容易的,标准的苦力活呢!
亲爱的,想好没?我可以提供完整的分步骤算法,以及编程要求,你提供其他条件?
这可是中文处理领域的,今天有机器人还说想用它判断遗嘱的真实性呢,哈哈哈哈

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有