加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

[转载]英语中的词汇歧义现象 -- 一切语言都具有歧义

(2011-07-03 06:15:42)
标签:

转载

我是反过来读这个博客的。
1. 定量研究比较语言间的严谨度,没有什么不好。你可以换个更中性的名字,也可以在文章的第一段加个评论,说严谨度搞并不一定就绝对好,绝对高级。还有其它因素。等等。
2. 说英语有歧义,正说明汉语的“同音字”“同音词”并不是独有的特色。用同音词的存在来说明汉语拼音不能代替部分汉字是说不通的。

                http://s2/middle/72d083c7g9bf28a7b9161&690-- 一切语言都具有歧义" TITLE="[转载]英语中的词汇歧义现象 -- 一切语言都具有歧义" />          这个头像看起来一会儿像女孩,一会儿像老头,具有歧义

     

                英语中的词汇歧义现象 -- 一切语言都具有歧义

                                  冯志伟

                               

 

博主在前面的博文中介绍了宋柔教授对于“拜晚年”提出的问题,引起网友的兴趣。有的网友提出计算语言的严谨度的建议,主张以此证明德语严谨度高,汉语严谨度低,等等。我认为我们可以设计某种方法来计算语言的严谨度,但是,我们最好不要比较不同语言的严谨度,例如,说:“德语严谨度高,汉语严谨度低,等等”。这很可能会导致语言优劣的荒谬结论,因为语言是民族的重要因素,语言优劣论往往会引起民族的不和,我是坚决反对的。

对于这样的问题,我们需要特别谨慎。我刚才写了关于英语中一词多义现象的博文,说明英语中的歧义与汉语一样严重。博文如下,欢迎阅读。

 

  • 在自然语言中,一词多义是一种普遍现象,不仅汉语中存在一词多义,其他语言中叶存在同样的问题。一词多义是自然语言中存在的普遍现象,在机器翻译中,如果词义翻译错误,译文不能正确地表示原文的意思,也就没有任何价值了,所以,词义排歧是任何机器翻译系统必须解决的大问题。此外,词义排歧还直接关系到信息检索、文本分类、语音识别的效率。

这里,我愿意介绍英语中的词汇歧义现象。从而说明歧义这个问题的普遍性。

英语中的名词、代词、动词、形容词、连接词、介词都存在歧义,这里举例介绍如下。

1. 名词中的歧义

——多义词:具有多个涵义的词位叫做多义词,多义词中的各个涵义是有联系的。

例如,在句子John is a bachelor.中,bachelor有两个不同的意思,一个意思是“单身汉” (unmarried man),一个意思是“学士”(first university degree),从而造成歧义。我们可以把这种情况写为如下的形式:

John is an unmarried man.

John holds a first university degree.

-> John is a bachelor

这表示,bachelor是一个多义词,它的不同的意思,由箭头前面的两个句子表示出来。

其他关于名词歧义的例子还有:

1) John is a medical doctor.

          John is a doctor of philosophy.

          -> John is a doctor.

Doctor的涵义可以是“医生”,也可以是“博士”,从而造成歧义。

2) He is looking for his drinking glasses.

          He is looking for his reading glasses.

-> He is looking for his glasses.

Glasses的涵义可以是“玻璃杯”,也可以是“眼镜”,从而造成歧义。

3) Here is a small lamb.

          Here is a small amount of lamb.

          -> Here is a little lamb.

Lamb的含义可以是“小羊”,也可以是“羊肉”,从而造成歧义。

——同形异义词:词形相同而意思不同的词叫同形异义词,同形异义词中的各个涵义之间没有联系。例如,

1) He looked at the river bank..

He looked at the money bank.

-> He looked at the bank.

Bank的涵义可以是“河岸”,也可以是“银行”,从而造成歧义。前面我们说过,据词源学家考证:“河岸”的意义来自斯堪底纳维亚语,“银行”的意义来自意大利语。

2) The period of sleep of the army was insufficient.

          The remainder of the army was insufficient.

          -> The rest of the army was insufficient.

 Rest的涵义可以是“睡眠时间”,也可以是“剩余物资”,从而造成歧义。

从计算机处理语言的角度来看,多义词和同形异义词在实质上没有区别,因此,在机器翻译中,我们没有必要区分它们,把它们一律作为词汇歧义来处理。

——名词的单数形式和复数形式相同而造成的歧义:例如,

        1) I saw this sheep graze in the field.

          I saw these sheep graze in the field.

         ->I saw the sheep graze in the field.

Sheep的单数形式和复数形式相同,所以,难于辨别它的数,从而造成歧义。

2) They put the condemned person to death.

          They put the condemned persons to death.

          -> They put the condemned to death.

Condemned这个过去分词形式作为名词使用,难于辨别它是单数还是复数,产生歧异。

     ——缩写词造成的歧义:例如,

1) He is a news reporter from Australian Broadcasting Company.

          He is a news reporter from American Broadcasting Company.

        -> He is a news reporter from ABC.

缩写词ABC的涵义可以是澳大利亚广播公司,也可以是美国广播公司,从而造成歧义。

2) In this book, he talks about the World Without War.

          In this book, he talks about the World Wide Web.

       -> In this book, he talks about WWW.

缩写词WWW的涵义可以是“没有战争的世界”,也可以是“万维网”,从而造成歧义。

2. 代词中的歧义:例如,

1) Nobody said he himself was wrong.

          Nobody said the person in question was wrong.

-> Nobody said he was wrong.

代词he究竟是指“说话人自己”还是指“所说的另一个人”,难于分辨,从而造成歧义。

2) He killed himself by shooting

          He shot personally.

          -> He shot himself.

Himself究竟是指“自己射击自己”,也就是“自杀”,还是指射击人“亲自射击”,难于分辨,从而造成歧义。

3) Everyone was eating a large cake together.

          Everyone was eating a large cake respectively.

     ->Everyone was eating a large cake.

Everyone是指“大家共同吃一个大蛋糕”,还是“每个人分别吃一个大蛋糕”,难于分辨,从而造成歧义。

4) Every sailor loves his own girl.

          Every sailor loves the same girl.

  -> Every sailor loves a girl.

Every是指“每一个海员都喜欢自己的姑娘”,还是“每一个海员都喜欢同一个姑娘”,难于分辨,从而造成歧义。

 

3.动词中的歧义:例如,

1) I heard the child weeping.

         I heard the child shouting.

      -> I heard the child crying.

Crying的涵义可以是“哭”,也可以是“喊叫”,从而造成歧义。

2) John is pulling a cart.

          John is making a picture of a cart.

-> John is drawing a cart

Drawing的涵义可以是“拉动”,也可以是“作画”,从而造成歧义。

3) They never saw the wood with their own eyes.

They never cut the wood with a saw.

->They never saw the wood.

Saw的涵义可以是“看”,也可以是“锯”,从而造成歧义。

3. 形容词中的歧义:例如,

1) John is a mechanic with little money.

          John is a mechanic who lacks competence.

-> John is a poor mechanic.

Poor的涵义可以是“贫穷的”,也可以是“糟糕的”,从而造成歧义。

2) She is a student who is a Japanese.

          She is a student who studies Japanese.

          -> She is a Japanese student.

Japanese的涵义可以是“日语的”,也可以是“日本的”,从而造成歧义。

3) He tried to speed up the ship.

          He tried to fasten the ship.

-> He tried to make the ship fast.

Fast的涵义可以是“快”,也可以是“拉紧”,从而造成歧义。

4) That was a clever idea.

          That was a stupid idea.

-> That was a brilliant idea.

Brilliant的涵义可以是“聪明的”,也可以是“愚蠢的”,从而造成歧义。

5) He is a salesman who is sweet.

          He is a man who sells sweets (in this case, ‘sweets’ is a noun).

-> He is a sweet salesman.

Sweet的涵义可以是“可亲的”,也可以是“甜食”,从而造成歧义。

4.连接词中的歧义:例如,

1) When it becomes cold, we do not go outside.

          Because it became cold, we do not go outside.

-> As it became cold, we do not go outside.

As的涵义可以是“当什么时候”,也可以是“因为”,从而造成歧义。

2) When I was working at night in the library, I saw Mary often

          Although I was working at night in the library, I saw Mary often.

-> While I was working at night in the library, I saw Mary often.

While的涵义可以是“当什么时候”,也可以是“尽管”,从而造成歧义。

3) From the time when I lost my glasses yesterday till now, I haven’t been able to do any work.

          Because I lost my glasses yesterday, I haven’t been able to do any work.

         -> Since I lost my glasses yesterday, I haven’t been able to do any work.

Since的涵义可以是“从什么时候”,也可以是“因为”,从而造成歧义。

5.介词中的歧义:例如,

1) The reminiscence written by my father was very interesting.

          The reminiscence about my father was very interesting.

-> The reminiscence of my father was very interesting.

Of my father的涵义可以是“我父亲写的”,也可以是“关于我父亲的”,从而造成歧义。

2) John stays with Tom.

          John agrees with Tom.

-> John is with Tom.

With Tom的涵义可以是“跟Tom在一起”,也可以是“同意Tom的意见”,从而造成歧义。

3) John hits the man by means of the stick.

          John hits the man who carried the stick,

-> John hits the man with the stick.

With the stick是一个介词短语,它可以修饰名词短语the man,也可以修饰动词hits,从而造成歧义。这样的句法结构歧义与介词with具有不同的涵义有关,所以,也可以看成是由于with涵义的不同而造成的歧义。词义排歧(Word Sense Disambiguation,简称WSD)是自然语言计算机处理中的一个很困难的问题。

4) The damage was brought about by the river.

          The damage was done beside the river.

-> The damage was done by the river.

By的涵义可以是“由于”,也可以是“在什么旁边”,从而造成歧义。

由以上的分析可以看出,英语中的词汇歧义现象分布很广,涉及到各主要的词类,而且,不同的歧义都有很强的特异性,很不容易发现一般性的规律。

当然,对于人来说,要判定词汇歧义并不困难,人们可以根据语言环境或上下文,在多义词的多个涵义中选择最恰当的涵义。但是,对于计算机来说,要从多个涵义中进行正确的选择,却是非常困难的事情。

上述现象在德语、法语、日语、俄语中都普遍存在,因此,我们不能根据一词多义现象的情况来判定一种语言的表达是否明晰。一切语言都有歧义,歧义性是语言固有的属性,我们无法避免。

0

  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有