加载中…
正文 字体大小:

《自然语言处理的形式模型》导读

(2010-04-22 13:42:51)
标签:

杂谈

分类: NLP

《自然语言处理的形式模型》导读

作者:王增才

邮箱:wangzengcai@126.com

该书将自然语言处理的方法分为两种:理性主义(基于规则的方法)方法与经验主义(基于统计的方法)。该书对自然语言处理中的很多种形式模型进行了系统的介绍。基于规则的形式模型,介绍了短语结构语法,递归转移网络等等;基于统计的形式模型,介绍了Markov链,概率语法,Bayes公式,HMM等等。

该书介绍了很多种主流的形式模型,在一定程度上反映了国内外自然语言处理方面的成果,可以作为一本入门书或者工具书来使用,有助于我们大体把握自然语言处理发展动向的。

该书是手册性的综合概述书籍,有如下优点:

1.介绍了很多种规则和统计的形式模型。

2.简练的论述了形式模型的优缺点。

3.该书各章写作风格一致,内容协调,特别适合对自然语言处理感兴趣和刚入门的朋友们阅读。

缺点:

1.数学公式较多,文科背景的朋友们阅读和理解起来可能会有一些困难。

2.没有论述基于模糊数学的自然语言处理的形式模型。不知道是冯老师不熟悉这块,还是有意回避。据我了解,冯老师本人是擅长于基于统计的形式模型研究的。我国的学者伍铁平(代表作《模糊语言学》)与张乔老师(代表作《模糊语义学》)等等对模糊语言学颇有研究。

据我所了解,该书是国内第一本综述基于规则与统计的自然语言处理方法的书籍,是值得一读的。不推荐想深究某种具体算法的朋友阅读该书。深究算法,还是阅读原作者的论文比较好。

 

 

参考资料

1.《自然语言处理的形式模型》,冯志伟,中国科学技术大学出版社,201001

0

阅读 评论 收藏 转载 喜欢 打印举报
  • 评论加载中,请稍候...
发评论

    发评论

    以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

      

    新浪BLOG意见反馈留言板 电话:4006900000 提示音后按1键(按当地市话标准计费) 欢迎批评指正

    新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

    新浪公司 版权所有