加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

“通过文本噪音特征分析识别作者”软件的制作过程

(2005-04-27 21:22:10)
1.要根据足够大的语料库生成平均化的关联字组频率统计信息;
2.使用合适的方法生成种子;
3.使用种子代入第一步得到的结果,进行干扰,使样本分化,特征分级收敛,局部公共特征逐级剔除;
4.重复第二、三步骤,获得稳定的局部公共特征集;
5.通过多次重复第二、三步骤经验,获得稳定完全私有特征集样本尺度,并验算。
实际上,这是在未来被广泛使用的方法,也就是说,在未来,“已经被证明”是可用的,为什么没人相信啊?!

0

阅读 收藏 喜欢 打印举报/Report
前一篇:笨蛋当道
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有