马希文教授语言学学术思想管窥_白硕SH

http://blog.sina.com.cn/u/1922397344

首页博文目录关于我

个人资料

微博

加好友发纸条

写留言加关注

博客等级：
博客积分：

博客访问：
关注人气：
获赠金笔：0支
赠出金笔：0支
荣誉徽章：

正文字体大小：大中小

马希文教授语言学学术思想管窥

(2013-05-23 11:10:52)

标签：

马希文

语言学

自然语言处理

文化

分类：分类1

马希文教授是我国杰出的语言学家、第一代“两栖型”计算语言学家。他的语言学学术思想博大精深，充满智慧和洞察力。他不仅把对语言学的精深把握用于计算机处理自然语言的研究，也反过来大力提倡把计算机用于语言学研究。他的语言学学术思想涉及语言哲学、句法、语义、语用、自然语言理解和信息检索等许多方面。作为他的弟子，由于课题选题方面的关系，我在语言学方面受教于马希文教授之处良多。借此纪念马希文教授诞辰74周年之际，把自己对马希文教授语言学学术思想的点滴理解，同大家一起分享。

马希文教授对于语言学的兴趣，始于上个世纪50年代末。他关于语言学的第一项工作是语言的一个统计模型，应该说是最早一批利用概率统计的原理从事“语言模型”研究的成果之一。这部分工作也是计算语言学界所谓“经验主义”的典范之作。不过，作为一个以理论和逻辑见长的学者，马希文教授并不满意对语言的研究止于概率和统计，也不喜欢把自己放入“经验主义”的行列。当然马希文教授的语言哲学观点也绝不可以简单地归结为“理性主义”。他在语言学领域的建树既是综合性的，也是有着长远眼光的，这远远超越了简单的“经验主义”和“理性主义”之争。

大家知道，在理论语言学领域，马希文教授在中国学术界活跃的年代，正是乔姆斯基学派风靡世界的年代。作为一个在理工科特别是数学方面拥有良好背景的研究者，马希文教授为什么没有利用自己的优势，成为乔姆斯基学派的倡导者，反而保持了难能可贵的冷静，从概念到论证方法都几乎完全采用了朱德熙学派的“话语”，默默做了很多本来应该是文科出身的语言学家们应该做的工作？我从进入师门就在思考这个问题，随着具体工作的积累，慢慢有所领悟。我体会，主要有三个方面的原因：

第一个方面，是马希文教授充分认识到了把汉语语言学知识体系形式化所面临的困难。采用乔姆斯基的路线用于描述汉语，绕不开两个最根本的问题。一个是“终结符”体系，即词类问题；一个是“规则”体系，即句式问题。这两个问题，对汉语来说，远不像英语那样清晰和透彻。不走进去不知道，只要一接触汉语研究的实际，就会感受到其中的困难，绝不是局外人乃至非汉语背景的人想象得那样简单和轻松。这里面既有汉语本身形式化难度的问题，也有乔姆斯基理论的适用性问题。就汉语而言，到底是针对“小类（次范畴）”来刻画句法规则体系，还是把“小类（次范畴）”在分布上的差异归于语义层面，就是个直到现在还在困扰我们的问题。

语法类型	0型	1型	2型	3型
对应自动机类型	图灵机	线性有界自动机	下推自动机	有限自动机
复杂度	半可判定	NP完全	多项式	线性
可学习性	不可学习	极限意义下可学习

第二个方面，是马希文教授从朱德熙教授提倡的研究方法中，看到了以文理贯通的方式研究汉语语言学问题的可行性。朱德熙先生在西南联大先是学的物理，而后转向了语言学。朱先生的研究方法里面，包含着大量从理工科角度看非常合理非常先进的因素。比如说，以短语结构从替换、扩展中发现词和短语的句法功能分布上的共性等方法，对于其语言学知识体系基础范畴尚在认识和建设之中的汉语显得尤其切合实际。

第三个方面，是马希文教授对人工智能特别是知识表示和机器学习的深入理解，为语言学知识体系建构的文理沟通开辟了新的道路。马希文教授很早就关注陌生语言的破译和辨识，在学习多门语言的过程中掌握了破译陌生语言的独特方法，曾经对契丹大字、契丹小字的辨识提出过非常专业化的见解。马希文教授非常敏锐地捕捉到语言习得、语言学知识体系建构/获取和机器学习之间的关系，他的两个学生（陈刚和我）做的研究课题都是围绕这方面进行的。马希文教授还专门为我的《语言学知识的计算机辅助发现》一书作序，在序中，马希文教授对建设一个人机共生的、能综合计算机和语言学家双方所长的语言学知识体系建构环境表示出强烈的关注和支持。

基于以上的三个原因，尽管马希文教授本人对语言学的了解程度已经可以胜任在斯坦福大学讲授“语言学史”课程，但他并没有对风靡全球的乔姆斯基理论盲目跟风，而是扎实地根据汉语的实际来推进汉语语言学知识体系的形式化，为此甚至他本人甚至很专业化地从事了大量面向汉语的纯语言学研究。在上个世纪70年代末到80年代，马希文教授的语言学研究成果大量发表在《中国语言学报》、《中国语文》、《方言》等语言学界的权威刊物上。尽管他本人在计算机科学技术领域已经取得了出众的成果，但他对在语言学知识体系本身建构很不完整的情况下匆忙搭建面向“实用”的系统始终表示出一种谨慎的保留。在马希文教授看来，汉语在连基本的语言学概念范畴都极其不清晰现状下，不可能有高质量的实用系统。他宁愿扎扎实实地、一砖一瓦地推进面向汉语的语言学知识体系建构。

我们说马希文教授的这些选择背后体现了他的语言哲学观点已经超越了“理性主义”和“经验主义”之争，是因为马希文教授的学术路线兼容了二者、超越了二者。在马希文教授看来，例句是检验语言学理论的最终标准，例句的价值不仅在于数量更在于质量、不仅在于正例更在于反例。与一些学者大量摘引五四以来新文化运动名著作为例句的传统不同的是，马希文教授充分利用了作为一个地道北京人的语感，举出的例句特别是反例具有非常强大的说服力。在《论动词“了”的弱化形式/lou》当中，这个特点表现得尤其鲜明。马希文教授认为语言规律最终是基于规则的，但就汉语的情形来看，规律的复杂程度很可能出乎很多人的意料。马希文教授极其重视从例句中发现语言学规律，重视归纳推理和机器学习，但是又非常清醒地认识到任何归纳推理和机器学习都离不开对领域知识表示的原始设定。而这个对领域知识表示的原始设定，则取决于研究者在语言学领域的功力和洞见。

马希文教授的纯语言学研究，秉承了他的语言哲学思想。既然至少对于汉语来说，乔姆斯基理论尚未找到非常坚实的实证基础，既然基于机器学习和归纳推理的语言学知识获取至少必须站在语言学巨人的肩膀上，并要反过来为在语言学学术前沿工作的人提供便利，那么具有良好形式化基础并且志在探究自然语言理解的计算机制的数学家、计算机科学家就应该责无旁贷地深入语言学研究的第一线。在当时，这是要有极大的学术勇气的。用马希文教授的话来说，就是——“不入虎穴，焉得虎子”。

马希文教授进入纯语言学领域，并不是浅尝辄止。即使用纯语言学学术研究的标准来衡量，马希文教授的研究也可谓成果丰硕。他的成果具有如下一些鲜明的特点。

第一个特点是研究成果的“震撼力”。他选择的几项研究，入手点都是平常人极易忽视的小词，如“了（lou）”，如“着”，如“再”；或者是口语中极其常见的句式，如动结式。但是，他研究后得出的结论却每每语出惊人但证据翔实。这里举几个例子。

比如，在传统教材里，动结式动词中的结果补语只是谓语动词的补充，但马希文教授通过详尽的句式对比，得出一个大胆的结论——谓语动词是结果补语的实现方式，结果补语才是真正的中心。“袖子染红了/脚冻肿了”说的是“袖子”和“脚”的状态。同时，结果补语描述的对象和谓语动词的施事之间存在着隐含的缺省领属关系。“老李把脚冻肿了”中，除了奇怪的明示预设前提的场景之外，按常识“脚”是“老李”的。尽管陆俭明教授等后来关于语义指向的研究把马希文教授的这个成果又向前推进了一步，但最初提出这样观点的勇气绝对是难能可贵的。

再比如，助词“着”究竟表示进行，还是表示状态？传统上，无论在语言学研究还是翻译实践中，一直存在着一种把汉语中的时态助词与西方语言中的时态简单对应的倾向。所谓“了、着、过”表示时态，其中“着”表示进行，就是学术界一个持续了很长时间的误解。马希文教授发现，“着”其实表示状态的持续，而非简单的动作进行。“墙上挂着画”这一例句中，实际上“挂”的动作已经结束，反倒是这个动作所遗留的“画附着在墙上”这一状态在持续。当然“天上飞着飞机”这一例句中，“飞”的动作的进行就是“飞”的状态的持续。更有甚者，明确表示进行义的“队伍正在前进着”却不能说。涉及“着”的句式对动词的这种选择性，颠覆了“着”表示进行的传统观点，通过马希文教授抽丝剥茧的理性分析，把“着”表示状态持续的论点凸显出来。

还有就是他对动词“了（liao3）”的弱化形式“了（lou0）”的研究。这是他在纯语言学领域的开山之作。过去讲“了”有句末助词和时态助词两种。马希文教授通过对北京话中以“了”结尾的命令句的研究，发现这里的“了”（读音为“lou0”）本质上既不是时态助词（记为“了₁”）也不是表新情况开始的句末助词（记为“了₂”），而是表示事件按预期定性定量完结的动词“了（liao3）”的一种弱化形式。例句“把馒头吃了！”的意思是要求听话人把整个馒头“吃完”，而不能出现“吃了（le），没吃了(liao)”这样的情况。这一发现，实质性地丰富了有关“了”这个助词的研究。

第二个特点是研究成果的“可读性”。马希文教授有极好的形式化功底，但却能充分照顾论文受众的多样性，在纯语言学论著中完全避开形式化，令文科出身的纯语言学者可读。而理工科出身的我们，也同样能从中读出暗含的“玄机”——如何用于计算机理解汉语。他的例句及解释中充满幽默感，在说明对“老李把脚冻肿了”这个例句的非常识性解读时，他说这时我们就要把“老李”设想为一位医生，正在对他的患者实施某种“冷冻”疗法，但却出乎意料地把患者的脚冻肿了……这样信手拈来的神解释在让人忍俊不禁的同时，最贴切地诠释了什么叫非常识性解读。

第三个特点是研究成果的“本土化”。他立足汉语语料实际，充分发挥他个人的北京方言语感优势，不迷信未经充分消化的舶来品。在评论“格语法”的时候，他说，施事格和工具格其实很难区分。“老王压死了一条狗”、“老王用汽车压死了一条狗”、“汽车压死了一条狗”、“汽车用前轱辘压死了一条狗”、“前轱辘压死了一条狗”……这些句子在汉语里都是成立的。在评论动词的论旨角色时，马希文教授举出“考”的例子，我考你，你考数学，数学考了八十分，八十分考得算不错了，还有考大学、考北大、考驾照、考律师、考托福……这些NP和“考”结合方式各不相同，难道都要赋予相应的论旨角色？边界在哪里？对另一个动词“吃”，他居然举出了“吃棺材铺”这样的组合，语感真是超一流。

在语义学研究方面，马希文教授早在上个世纪80年代初就在北京大学宣讲“蒙塔古语法”，研究以自然语言为背景的模态逻辑例如“知道”逻辑。在我读博士期间，他开办“情境语义学”讨论班，介绍通过语境决定语义的形式化方法。他对语义知识表示情有独钟，无论是解读SHRDLU的工作机制，还是把带类型的λ-演算与面向程序语言的形式语义学引入自然语言语义研究，他都发挥了自己的“两栖优势”。他高度关注时-体（tense-aspect）结构、空间结构、权属结构等对不同动词的选择性，认为这是揭示动词相关的次范畴体系的重要线索。

在语言处理与智能的关系上，马希文老师坚决反对所谓的“物理学嫉妒症”，即认为语言规律可以像物理学一样用简单的法则来刻画，只是我们还未找到而已的观点。他认为语言的规律远比我们想象得要复杂得多。他认为，解决语言处理上的困难，是迈向对智能的深入理解的不可绕过的关键。汉语研究表现出来的停滞，不是因为汉语比英语“落后”，而是汉语从句法层面开始就面对英语到了语义层面才遇到的困难。

马希文教授对我的学术道路和人生道路的影响是巨大的、独一无二的。最后一次聆听马希文教授的教诲，是在2000年5月份。当时，我作为中国青少年首次组队参加Intel科学与工程大赛的随团科学顾问，在底特律参加完比赛后来到旧金山做短时停留。本希望能见先生一面，因种种原因没能见成。但先生在当时已经在关注问答式搜索问题，在电话里以怎么识别“华盛顿”是一个人名、城市名还是州名为引子，就NLP用于搜索服务的方方面面跟我进行了长时间的探讨。怎么也没想到那次探讨竟成了恩师的最后一课。之后没多久，我先后淡出了很多学术领域，但语言学却一直是我永远放不下的业余爱好，这和马希文教授对我的深刻影响是难以分开的。

追溯马希文教授语言学研究的学术轨迹，我们看到，他建立了常人难以企及的“跨界”知识面和工作面，从一个角度树立了融贯文理、中西的标杆，回顾历史，似乎只有赵元任能与之相提并论。他一生淡泊名利，思维超越了表浅的学派之争，超越了功利和恩怨，甚至超越了绝大多数同时代人的理解力。遗憾的是，太多的工作没有来得及做，马希文教授就离开了我们。数学出身的马希文教授在语言学领域的学术建树说明，文理在根子上是相通的。人类的潜能无限。让我们在追思先辈的同时，争分夺秒把握现在，活出精彩。

阅读┊ 收藏 ┊ 喜欢 ▼ ┊打印┊举报/Report

前一篇：合唱笔记【3】

后一篇：合唱笔记【4】——避免渐变

新浪BLOG意见反馈留言板　欢迎批评指正