自然语言处理分析技术,大致分为两个层面,一个是浅层分析,如分词,词性标注。这些技术一般只需对句子的局部范围进行分析处理,目前已经基本成熟。另一个层面是对语言进行深层的处理,需要对句子进行全局分析。深层语言分析有三个层次:句法、语义、语用。
句法关心的是词语如何排列形成正确的句子,并决定每个词语在句子中充当的结构角色。语义是指词语的意义(词义)以及在句子中词语意义是如何相互结合形成句子意义(句义)的。获得一个句子暗含的语义信息是最重要的,并且是自然语言处理的最终目标。语义信息与句子的句法和词义信息有着密切的联系。
语义分析,指的是将给定的自然语言(包括篇章和句子)转化为反映其意义的某种形式化表示,也就是将人类能够理解的自然语言转化为计算机能够理解的形式语言,做到人与机器的互相沟通。语义依存分析,它建立在依存理论基础上,是深层的语义分析理论。它融合了句子的依存结构和语义信息,更好地表达了句子的结构与隐含意思。语义依存分析提取句子中所有的修饰词与核心词对间的语义关系,且修饰词与核心词对覆盖了句子中所有的词,即句子中的每一个词都有其核心节点(除了整个句子的核心节点外)。语义依存分析是处理词级别、短语级别、从句级别以及句子级别的语义结构的过程。它是面向整个句子的,而不仅是句子中主要谓词与其论元之间的语义关系,还含有非主要谓词包含的语义信息,如数量(quantity)、属性(attribute)和频率(frequency)等。
语义依存分析的例子:一九九八年
美国
康乃尔
大学
研究生
莫理斯
写
了
一
个
程序
http://s7/middle/6d15445fha09ef0c0d546&690
由这个例子可以看出,语义依存不仅分析动词谓词的语义角色,如“写”的语义角色“莫理斯/agent”和“程式/ContentProduct”;还分析了名词短语的内部结构,如“美国康奈尔大学研究生莫理斯”和“一个程式”,并且名词短语内部也是有语义关系的,譬如,“quantity”表示数量,“possessor”表示领属关系中的领有者等。由此可见,语义依存分析给出了一个句子完整的语义信息。
加载中,请稍候......