现代汉语的语义网络
(2010-04-20 11:00:19)
标签:
信息处理/汉语it |
分类: 信息处理--汉语--静态语义网络 |
现代汉语的语义网络
鲁川
河南财经学院
http://www.hackchi.com/hnc/papers/compulin/lchsenet.htm
提要
§0 引言
现有的计算机是“数据处理机”,新一代计算机是“知识处理机”即“智能机”。因为“智能”就是“知识处理”的能力。知识处理包括:知识表示、知识获取、知识运用。知识表示(Knowledge Representation)是智能机研究的核心课题。“知识”必须以一定的方法来加以“表示”,才能去“获取”和“运用”。
中国人如去德国留学,必须先学会德语,即先学会德国的“知识表示”,才能在德国进行“知识获取”,然后回祖国进行“知识运用”。
既然人类最重要的“知识表示”是语言,那么模拟人类智能的智能机的“知识表示”也应该是人类的自然语言,但必须是“形式化”的自然语言。因此,在现有的理论语法和教学语法的基础上还要编写适于计算机处理自然语言语言的“信息语法”。信息的语法要用形式化的方法来为计算机描述人类的自然语言的知识,包括句法知识、语义知识、语用知识。本文从“现代汉语信息语法”的角度出发,拟出一个跟“句法结构系统”相平行的“语义组合系统”及其形式化图解——“语义网络”。
把语义组合关系标注在句法结构分析图上是不行的。句法分析图是“树形图”,它只能标注“父结点”跟“子结点”的关系,不能标注“兄结点”跟“弟结点”的关系。而“网络图”则可以标注任何“结点”之间的关系。
例句:王冕死了父亲。
| ─── | ||||
| │死了│ | ||||
| ──── | ||||
| ││ | ||||
| ┌─ 与事.变化 | ──── | ┘ └ | ─── | 变化.当事─┐ |
| │ | ||||
| 王冕 | ──── | 领事.属事 | ── | 父亲 |
从这个例句的语义网络可以清晰地看出:
① 这个事件的核心是表示变化的“死了”。
② 这个事件中的“父亲”是“死了”这个变化的当事(变化的承当者)。
③ 这个事件中的“王冕”是“死了”这个变化的与事(变化的受损者)。
④ 这个事件中的“王冕”跟“父亲”之间必然有领属关系,即“王冕”是领事,而“父亲”是司事。就是说,“死了”的是“王冕的父亲”。这个句子不能扩展为:*“王冕死了别人的父亲”。
在“句法树”上,主语跟宾语的关系无法标注,所以必须用“语义网络”。
向计算机输入自然语言的“线性序列”,如果计算机能把表层的“线性序列”自动地变成深层的“语义网络”,则可以认为计算机“理解”了自然语言。
我们设想的机器翻译的流程图如下:
| (A) | (D) | |||||
| 原文线性序列 | ┐ | ┌→ | 译文线性序列 | |||
| │ | │ | |||||
| 理解 | 生成 | |||||
| │ | (B) | (C) | │ | |||
| └→ | 原文语义网络 | ──→ | 译文词义网络 | ┘ |
§1 语义网络的内容
语义网络(Semantic Network)是由各级“语义单位”组成的,能清晰地表示概念之间和事件之间全部的“语义组合关系”和“语主标记依附”的有层次的网络。
语义网络最早是美国学者奎廉(M.Quillian,1996)从心理学角度研究记忆时所提出的。后来经过本蒙斯(R.Simmons,1973)和亨德里克斯(G.Hendrix,1997)等的改进,比较成功地用于英语的“知识表示”和“自然语言理解”。为了更适合于汉语信息处理,我们又对语义网络的内容和形式进行了重大的改进。
Ⅰ.语义网络中的语义单位
语义单位是语义平面上的语言单位。它不同于句法单位(词、短语、句子)。
一、概念(Concept)
概念是对客观事物及其特有属性的概括的反映。一个概念表示为一个语言符号串。
概念是语义网络的基本单位。在语义网络中,一个概念是一个“结点”(Node)。
1、指称性概念(Nominal Concept)
指称性概念即“事物类概念”。在认识客观世界时,指定这样一个语言符号串来称呼所指的事物,也就是对所指的事物给以命名。
2、述谓性概念(Verbal Concept )
述谓性概念即“运动类概念”。在认识客观世界时,使用这样的一个语言符号串来叙述所指的事物的运动状态、描述所指事物的属性特征、表述所指事物的归属关系,也就是对所指的事物加心说明。
二、事件(Event )
事件是以一个述谓性概念为“中枢”(Pivot),一个或多个指称性概念为“外围”(Peripery)的组合所反映的客观现实。一个事件形成一个简单的“语义组合网络”,其中每个“结点”是一个概念。
充当“中枢结点”的概念叫做“中枢概念”,位于语义组合网络的高层。
充当“外围结点”的概念叫做“外围概念”,位于语义组合网络的低层。
| 1、 | 叙述性事件(Narration Event )叙述客观事物的运动状态。如: |
| 王平加来了。| 李明学习英语。 | 那本书放在桌上。 | |
| 2、 | 描述性事件(Description Event)描述客观事物的属性特征。如: |
| 王平很聪明。| 李明十分勤奋。 | 那本书非常重要。 | |
| 3、 | 表述性事件(Judgement Event)表述客观事物的语义组合关系。 |
| 王平是班长。| 李明有个弟弟。 | 那本书共十八章。 |
三标记(Label)
标记只标明概念的依附属性以及概念之间或事件之间的语义组合关系。
| 1、 | 依附性标记(Attachment Label)标明概念或事件的依附属性。如: |
| “时态”标记(着、了、过、起来),“语气”标记(吗、呢、吧、啦)。 | |
| 2、 | 组合性标记(Combination Label)标明概念或事件之间的语义组合关系。如: |
| “并列”标记(和),“假设”标记(如果),“施事”标记(被)。 |
Ⅱ.语义网络中的语义组合关系
语义角色(Semantic Role)是一个概念或事件在语义网络中的作用或地位。
语义组合关系(Semantic Combinative Relation)是由概念或事件充当的两个主义角色的“有序对”,记作“角色1.角色2”。
| ┌─ | 并列关系 | ||||
| ┌─ | ── | 对称关系 | ──┼─ | 选择关系 | |
| │ | ├─ | 同指关系 | |||
| 语义组合关系 | ──┤ | └─ | 同现关系 | ||
| │ | ┌─ | 接合关系 | |||
| └─ | ── | 非对称关系 | ──┼─ | 配合关系 | |
| └─ | 加合关系 |
(Ⅰ)对称关系(Symmetric Relation)
对称关系是双方语义角色相同的语义组合关系。所以对称关系只记作“角色”。
| 1、并列(Coordinative) |
| 并列是地位平等的两个以上的事物。如:报纸和期刊。 |
| 2、选择(Alternative) |
| 选择是任选其一的两个以上的事物。如:工作或休息。 |
| 3、同指(Equivalent) |
| 同指是对于同一事物的复指或注释。如:王兴华校长。 |
| 4、同现(Co-ocurrence) |
| 同现是同一时刻出现的活动或状态。如:边走边看书。 |
(Ⅱ)非对称性关系(Asymmetric Relation)
非对称关系是双方语义角色不同的语义组合关系,必须记作“角色1.角色2”。
一、接合关系(Connectional Relation)
接合关系是互不嵌套的两个事件之间的“衔接性”语义组合关系。
如果两个事件嵌套时,被嵌套的事件称为“降级”(Downgraded)而当成一个概念。
(一)接合关系共有14种“事件角色”:
| 1、先行(Antecedent):在时间上或事理上发生在前的先行事件。 |
| 2、后继(Succedent):在时间上接续先行事伯的后继事件。 |
| 3、递进(Progression):在某一方面比先行事件更理一层的后继事件。 |
| 4、转折(Adverse):不顺着先行事件方向发展的转折性事件。 |
| 5、原因(Cause):造成某种结果或导致另一事件的引发性事件。 |
| 6、结果(Effect):由于某种原因或条件所造成的结局性事件。 |
| 7、推断(Inference):根据某种原因或假设而得出的推断性事件。 |
| 8、条件(Condition):影响事件进展的、必要的或充分的前提性事件。 |
| 9、假设(Assumptio):为了对事件进展有所推断而提出的假设性事件。 |
| 10、让步(Concession):为了跟转折性事件形成对比而提出的让步性事件。 |
| 11、手段(Means):为了达到某种目的而采取的措施性事件。 |
| 12、目的(Purpose):通过某些手段而要达到的目标性事件。 |
| 13、舍弃(Abandonment):为了选取更有利的事件而舍弃的另一个可选性事件。 |
| 14、选取(Preference):舍弃一个可选性事件而选取的更有利的可选性事件。 |
(二)接合关系的基本组合模式
| 1、先行.后继:足球队首先学习理论,然后进行射门训练。 |
| 2、先行.递进:队长不仅自已学得好,而且带动全队都学得好。 |
| 3、先行.转折:足球场下着雨,但是足球训练仍在进行。 |
| 4、假设.推断: 如果明天下雨,就别进行室外训练。 |
| 5、让步.转折:即使明天下雨,也得进行室外训练。 |
| 6、手段.目的:他们如此刻苦地训练,为的是夺取冠军。 |
| 7、原因.结果:因为平时训练刻苦,所以比赛中获得了冠军。 |
| 8、原因.推断:即然训练时负了伤,就该安心治疗休养。 |
| 9、条件.结果:只有坚持刻苦训练,才能迅速提高技术水平。 |
| 10、舍弃.选取:与其重防守争取少输球,不如重进攻争取多赢球。 |
| ①刘英的孩子病了,所以她没来上班。 | 〖原因.结果〗 |
| ②刘英没来上班,因为她的孩子病了。 | 〖结果.原因〗 |
| ③下其束手就擒,不如拼个鱼死网破。 | 〖舍弃.选取〗 |
| ④宁愿拼个鱼死网破,也不束手就擒。 | 〖选取.舍弃〗 |
事件的接合关系是两个“事件角色”的关系。例如:“他虽然年纪不大,但是书读得不少。”有人坚持是让步关系,有人坚持是转折关系,双方争执不下,谁也服不了谁。其实,“他虽然年纪不大”是〖让步〗,“但是书读得不少”是〖转折〗。下确地说,这个复句是〖让步 .转折〗关系。
二、配合关系(Collocatinal
配合关系是事件内的中枢概念跟外围概念之间的“配合性”语义组合关系。记作:“中枢角色.外围角色”。
外围概念的“角色”跟它本身的“义类”没有必然联系。如:在“肉包了打狗”中,“肉包了”的“角色”是“工具”,而它的“义类”是“食品”。
中枢概念的“角色”跟它本身的“义类”有必然的联系。如:在“肉包了打狗”中,“打”的“角色”是“支配”,而它的“义类”也正是“支配”。
这就是说,中枢概念的“角色”就是它的“义类”。
吕叔湘先生指出:“动词是句子的中心、核心、重心,别的成分都跟它挂钩,被它吸住。”“动词的性质决定它可以跟哪种名词联系,不能跟哪种名词联系。反过来,这种那种联系的可能与不可能又帮助我们给动词分类。”(见《动词与句型》,第1页)
我们按照吕先生的论述来给现代汉语的谓词划分“义类”,分类的唯一标准是该谓词“能带哪种外围角色”。这样的“义类”也就是中枢概念在配合关系中的“角色”。
(一)中枢角色(Pivot Role)
| ┌ | 存现 | Existence | |||
| │ | 停留 | Staying | |||
| │ | 性状 | Attribute | |||
| ┌─ | 状态 | ─┤ | 心态 | Mentality | |
| │ | STATE | │ | 期望 | Expection | |
| │ | │ | 思考 | Consideration | ||
| │ | └ | 感知 | Perception | ||
| │ | ┌ | 类同 | Classification | ||
| │ | │ | 扮成 | Disguise | ||
| │ | │ | 领属 | Possession | ||
| ├─ | 关系 | ─┤ | 包括 | Inclusion | |
| │ | RELATION | │ | 组成 | Composition | |
| │ | │ | 相关 | Connection | ||
| 运动 | ─┤ | └ | 牵连 | Involvement | |
| MOTION | │ | ┌ | 自变 | Self-variation | |
| ├─ | 变化 | ─┤ | 促变 | Make-variation | |
| │ | CHANGE | │ | 自进 | Self-development | |
| │ | └ | 促进 | Make-development | ||
| │ | ┌ | 自为 | Self-behavior | ||
| │ | │ | 自移 | Self-move | ||
| │ | │ | 流动 | Flow | ||
| │ | │ | 支配 | Control | ||
| │ | │ | 使令 | Command | ||
| │ | │ | 搬移 | Make-move | ||
| │ | │ | 给予 | Give | ||
| └ | 行动 | ─┤ | 获取 | Gain | |
| ACTION | │ | 创造 | Creation | ||
| │ | 对待 | Treatment | |||
| │ | 考察 | Inspection | |||
| │ | 通信 | Commumication | |||
| │ | 显示 | Show | |||
| └ | 遭遇 | Encoumter |

加载中…