加载中…

加载中...

语义和常识

转载 2016-04-12 02:55:52

语义和常识

人们常常弄不清语义和常识的区别,尤其在一个语言处理系统中如何观察或处置。语义(semantics)是语言的一部分,是语言表达的内容,相对于语言的形式,即语言结构及外部表现形态。语义可以有语言的词汇意义,短语和句子的结构意义,以及词汇与结构相互咬合产生的共现意义。语义是离不开语言的,特定的语言以其特定的形式表现语义。因此,语义、语法、语用都应该是语言内知识。常识(ontology)则是语言外知识。但因为它是语义的基础,与语义密切相关,所以有时候似乎你中有我,我中有你,切不断理还乱。这里讨论几个例子,看看是否有助于理解两者的区别。​

A. 有关语义的例子:

英文原文:

   The surgeon reduced his dislocated jaw. ​

  His jaw that was reduced yesterday was dislocated again.  

   The medication side-effect will reduce bone density.

流行机译系统译文(1)​

外科医生减少了他的下巴脱臼。/  他的下巴被缩小昨天再次脱臼。/  药物副作用将降低骨密度。

流行机译系统译文(2

 外科医生把他的下巴脱臼。/ 他的下巴,昨天再次脱臼了。/  药物副作用会降低骨密度。

流行机译系统译文3

 这名外科医生为他的脱臼的颌复位。/  昨天被复位的他的颌再一次脱臼。​/ 这一药品副作用将减少骨密度。

从上面的机译分析看,系统(1)和(2)中的“reduce”完全没有“reposition“(复位)的意义,自然翻译不可能正确。而系统(3)必定是确定了“reduce”与“jaw”的句法和语义关系,并且必须知道“reduce”的“复位”的意义取决于它与“jaw”的这种关系。第三句中“reduce”与“bone”没有句法关系,因此不会选取“复位”的意义。

  1. B. 有关常识的例子:

英文原文:

Cranes are a clade(Gruidae) of large, long-legged and long-necked birds in    the  group Gruiformes. There are fifteen species of crane in four genera. Unlike the ​similar-looking butunrelated herons, cranes fly with necks outstretched, not pulled back. Craneslive on all continents except Antarctica and South America.

流行机译系统译文(1

   起重机是一个分支(Gruidae)的大型,长脚和长颈鸟集团鹤形目。 中有415种起重   机。不像类似的前瞻性,但无关的苍鹭,起重机伸出,没有拉回脖子飞。起重机生活在除南极洲以外,南美各大洲。

流行机译系统译文(2

   起重机的组中的大、 长腿、 长颈鸟是一个分支 (鹤)鹤。 有十五种起重机的四个属。不同于看起来类似的但无关苍鹭,鹤飞与脖子,伸不拉回来。起重机在除南极洲和南美洲的所有大洲上生活。 ​

中文原文:

现在的中学生可不得了,初二就谈上恋爱了。     

流行机译系统译文(1: ​Now the middle school students can not, the two days on the love of the.    

流行机译系统译文(2):   Now high school students can be incredible, on the first two days to talk     about love.     

流行机译系统译文(3):  High school students now be disastrous, on the second day on falling love.

从上面这段关于“鹤”的描述,可以设想即便是一个没有英文句法知识的本族语者也不会把这里的“crane”认定是“起重机”。这个意义的选择是不必通过对语言进行句法分析的。同样的,中文的例子里的“初二”意义的选择,并不是通过句法关系确定的。虽然可以推测这一意义的确定,必然与“中学生”有关,但它们体现的正是常识,而不是语言内的关系。综上所述,从语言学角度观察,我们可以悟到:流行的机译系统(1)处理篇章能力几乎等于零,全无自控能力;(2)常识知识或称语言外知识全无自控能力;(3)全语言频率统计淹没了当前语料内的频率统计(以致像 crane 作为“鹤”,bank 作为“河岸”等成了死穴)。

阅读(0) 评论(0) 收藏(0) 转载(0) 举报/Report

评论

重要提示:警惕虚假中奖信息
0条评论展开
相关阅读
加载中,请稍后
钁h
  • 博客等级:
  • 博客积分:0
  • 博客访问:1,439
  • 关注人气:0
  • 荣誉徽章:

相关博文

推荐博文

新浪BLOG意见反馈留言板 电话:4000520066 提示音后按1键(按当地市话标准计费) 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

新浪公司 版权所有