“通过文本噪音特征分析识别作者”软件的制作过程_青梅

http://blog.sina.com.cn/u/1494818470

首页博文目录关于我

个人资料

微博

加好友发纸条

写留言加关注

博客等级：
博客积分：

博客访问：
关注人气：
获赠金笔：0支
赠出金笔：0支
荣誉徽章：

正文字体大小：大中小

“通过文本噪音特征分析识别作者”软件的制作过程

(2005-04-27 21:22:10)

1.要根据足够大的语料库生成平均化的关联字组频率统计信息；
2.使用合适的方法生成种子；
3.使用种子代入第一步得到的结果，进行干扰，使样本分化，特征分级收敛，局部公共特征逐级剔除；
4.重复第二、三步骤，获得稳定的局部公共特征集；
5.通过多次重复第二、三步骤经验，获得稳定完全私有特征集样本尺度，并验算。
实际上，这是在未来被广泛使用的方法，也就是说，在未来，“已经被证明”是可用的，为什么没人相信啊？！

阅读┊ 收藏 ┊ 喜欢 ▼ ┊打印┊举报/Report

前一篇：笨蛋当道

后一篇：又要找新工作了

新浪BLOG意见反馈留言板　欢迎批评指正