加载中…
个人资料
冯志伟文化博客
冯志伟文化博客
  • 博客等级:
  • 博客积分:0
  • 博客访问:716,278
  • 关注人气:1,291
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
相关博文
推荐博文
谁看过这篇博文
加载中…
正文 字体大小:

冯志伟《机器翻译》75讲感言

(2021-10-08 08:59:34)
标签:

人工智能

术语学

语言学

自然语言处理

冯志伟

冯志伟《机器翻译》75讲感言


冯志伟《机器翻译》75讲感言

 

詹开第

 

志伟教授,

您的75集讲座(以下简称75集)已从头到尾听完了,十分感谢。现说一下我的收获,做为囬聩。

一,促使我学简单编程。

有段时间了,我想增加对人工智能的理解,可不知道从哪兒入手。在听75集的过程中,自己知识结构的短板暴露无遗了。由于缺少数学的基礎,不会编程,好多地方听不懂。我:想如果能学会简单的编程,就能和电脑对话,从而加深对机器人,人工智能的理觧。将来说不定要使用无人驾驶汽车,服务机器人什么的,就方便许多。已决定学简单编程。

二,学习了觧决问题的方法。

75集的讲述,不是只讲结论,而是一直着重讲述解决问题的思考过程,並逐一举例说明。这对开拓听者的思维很有帮助。印象最深的是讲授者讲述在法国做一项中法翻译时如何处理“我吃了”和“面包吃了”这样的句法分析。按照乔姆斯基的短语结构语法,只讲形式,不讲语义,从而无法区分这两个句子语义关係的不同。怎么办?讲授者搜索枯腸,想到对句中NP做剖析的方法,前者“NP”有动物性的含义,而后者“NP”有食品的含义。这样一来两个句子就分开了,问题迎刄而解。这层窗户纸捅开並不容易,表现出讲授者解决问题的能力。不仅如此,讲授者进而对乔姆斯基短语结构语法进行了补充和丰富,用复杂标记。(或说特征结构)代替乔姆斯基的单标记。后来讲授者又用依存语法的理论和配价语法的方法並找出中心词来改造乔姆斯基的短语结构语法,从而使机器翻译工作得以较顺利地进行。研究工作的意义就在于能发现问题並解决问题。我在过去的研究中有时找不准问题,有时找到问题了却急得团团转却找不到解决的方法。75集中讲觧的思考过程确实给了我啟发。

三,殊途同归

讲授者说,从机器翻译的发展看,词典越做越大,句法部份越做越小。

我对大词典小句法是很认同的。我从未做过机器翻译的工作,而是在语言所现代汉语研究室做过20几年传统的语法研究(我觉得,可以归为描写语言学)。这与机器翻译本是两股道上跑的車(当然机器翻译在前段发展中也用得着句法分析)。可是

随着工齡的增长,我对于大字典是越来越赞成了。觉得大字典对语法的描写更清楚,更贴切,对外国人学汉语也更有帮助。当时我们研究室人不多,沒人说出大字典的口号,但后来我们编写了“现代汉语八百词”,这足以说明我们认同大字典的方向。这与室主任(兼所长)吕叔湘先生的倡导密切相关。是吕先生提出,确定並主持了“现代汉语八百词”的工作。呂先生在那时对现汉研究的大方向已胸有成竹。后来围绕着硏究动词,找动词配价关係(只是沒用配价这个术语,而是用语义关係)也是我们一个研究方向。这次听75讲座,感到对语法研究有殊途同归之感。当然了,语法,语义是非常复杂的,讲授者特别提到索绪尔对此早有论述,还有两位美国学者说自然语言不可构建。尽管这种说法有些极端,但大家认为现在对语言的描写还是如冰山之一角。但无论如何语言研究还是进步了。

四,70集之后讲授者介绍如何用概率来做机器翻译,似未充分展开,十年前这方面研究

还不成熟吧?

五,讲授者的学风端正,值得学习

1,用功甚勤,75集中每有疑问,讲授者都去查阅原著,有时还要看不同版本。例如求证在爱因斯坦之前是否有另外的科学家提出过相对论。讲授者就查阅了爱因斯坦论相对论的好几个版本。在几个版本中只有第一版提到在他之前有人提出过,而后来几版就不提这件事了。

2,实实在在。

整个讲座,每提出一个理论或一种方法,一种算法,都把原作者姓名,著作,贡献说的清清楚楚。而对于某一方法的优点和和不足之处也都眀白指出,让人信服。

3,在实际工作中对以往的语言学理论不生搬硬套。

例如一方面使用乔姆斯基的短语结构语法,同时也不迷信,而是开动脑筋,用多标记代替单标记並釆用依存语法的方法来改造乔姆斯基的短语结构语法等等。

听完75集,感到讲授者今天成为一位计算语言学的著名学者和获奖者绝非偶然。正是讲述者从大学时代(或许更早)就勤于学习,逐渐掌握了几门外语,后又到科技大学学习数学,计算语言学,打好了基础。多年来对所热爱的机器翻译亊业孜孜以求,头脑灵活,具有解决问题的能力,才有了今天的成绩。对比如今某些人浮躁的学风,讲述者的学风实在难得。我也深感望尘莫及。

詹开第   20211008

0

阅读 评论 收藏 转载 喜欢 打印举报/Report
  • 评论加载中,请稍候...
发评论

    发评论

    以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

      

    新浪BLOG意见反馈留言板 电话:4000520066 提示音后按1键(按当地市话标准计费) 欢迎批评指正

    新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

    新浪公司 版权所有