http://s5/middle/72d083c7g9f9ac70fb924&690
Chomsky与冯志伟合影的另一张照片(冯志伟在Chomsky的右侧)
Chomsky的X阶标理论
冯志伟
上下文无关语法是层次分析法的理论基础,这种语法是不管中心语的。我在上世纪70年代末期在法国研究多语言机器翻译系统FAJRA时,已经感觉到上下文无关语法的这种缺陷,我试图来改进这种语法,当时采取的办法是给短语规则中的中心语一个叫做gov的特殊标记(gov表示governor[支配者]),给整个句子的中心语一个叫做pivot的特殊标记(pivot表示轴枢),由于我采用了gov和pivot这两特殊的标记,暂时解决了中心语的表示和自动求解问题,gov和pivot的采用,是我的中文信息多叉多标记树模型(Multiple
branched, Multiple labeled Tree Model,简称MMT模型)的一个重要内容。
后来我发现,远在1970年,Chomsky就提出 “X阶标理论” (X-bar
theory),他把中心语引入到层次分析中,有效地把层次分析法与中心词分析法结合起来,不由得非常佩服他的远见卓识。
Chomsky的X阶标理论认为:
第一,短语范畴应该分析为词汇范畴的阶标投射,阶标可以分为若干个层次,处于最低层次的词X就是中心语,中心语带有若干个补足语,中心语管辖着补足语。中心语也就是短语的核心,这就克服了短语结构语法只注意层次而忽视核心的不足。
第二,词汇范畴应该分析为一组特征。
在X阶标理论中,Chomsky把英语的名词短语和动词短语进行了对比,他指出,名词短语和动词短语的内部结构存在着一些共同的特征。试比较:
(1)
John proved the theorem (约翰证明了定理)
(2) John’s proof of the theorem (约翰对定理的证明)
(1)是动词短语(记为VP),其中心语是动词(记为V)prove,the
theorem是动词的补语,记为Comp;(2)是名词短语(记为NP),其中心语是名词(记为N)proof,名词的补语是the
theorem。用短语结构语法的重写规则可以分别表示为
VP → V Comp
NP
→ N Comp
不仅动词短语和名词短语可以这样表示,形容词短语(记为AP)和介词短语(记为PP)也可以分别表示为形容词(记为A)加补语以及介词(记为PP)加补语:
AP → A Comp
PP
→ P Comp
不难看出,动词短语、名词短语、形容词短语和介词短语的重写规则都非常相似,可以归纳为如下格式:
XP → X Comp
这个规则中,X相当于数学中的变量,可以用V, N, A,
P的任何一项代入,就可以得到上面的各个规则。这个规则可以用树形图表示如下:
http://s6/middle/72d083c7g9f9ab069d485&690
XP规则的树形表示
如果我们把XP写为X’(也可以在X上加一个短横),那么,重写规则就变为:
X’ → X Comp
树形图就变为:
http://s8/middle/72d083c7g9f9ab275aa27&690
X’规则的树形表示
这样一来,整个表示方法就变得非常简练了,而且每一个短语的中心语也就更加清楚了。
从树形图上可以看出,X’表示比X高一个层次的语类,比X’更高一个层次的语类可以在X’上面再加一个’表示为X’’(也可以在X上加两个短横表示)。
下面,我们以句子“this proof of the
theorem”(对这一定理的证明)为例,来比较短语结构语法的树形图和X阶标语法的树形图之间的异同。
这个句子的短语结构语法的树形图为:
http://s9/middle/72d083c7g9f9ab34630e8&690
短语结构语法的树形图
这个句子的X阶标语法的树形图为:
http://s1/middle/72d083c7g9f9ab414d820&690
X阶标语法的树形图
其中带阶标的N就是NP的核心。
以上是名词短语的例子,动词短语也有相应的V’,V’’等层次,形容词短语也有相应的A’,A’’等层次。各种语类的通用形式是X,X’,X’’,其层次关系可用树形图表示如下:
http://s1/middle/72d083c7g9f9ab49ed810&690
X阶标语法中的层次关系
X’’上面还有没有X’’’,学者们各说不一,有的人认为有,有的人认为没有。由于无法确定一共有多少层,可以采用权宜之计,把最低层写做X,把最高层写做XP,中间需要加几层就加几个’。这样,用XP封顶,XP下面的整个树形就是XP所属的“最大投射”(maximal
projection)。
X阶标语法比短语结构语法的表达力更强。短语结构语法只有单词型语类(lexical category)和短语型语类(phrasal
category)两种语类,缺乏中间层次。例如,This proof of the theorem和Proof of the
theorem,如果用短语结构语法,都只能称为NP,不能把它们区别开来,而用X阶标语法就可以把前者称为X’’,后者称为X’,可以把它们清楚地区别开来。
X阶标语法比短语结构语法更为严谨。在X阶标语法中,由于强调短语的核心,V’’之下一定是V’,不允许出现V,更不允许出现N或者A,而在短语结构语法中却没有这样的限制,不能表示出短语的核心,对于如象VP
→ A PP之类的不合理结构,短语结构语法无法阻止其出现。重视核心是X阶标语法的一个重要特点。
我国语法研究中曾经有过“层次分析法”和“中心词分析”两种不同分析法的争论,争论双方各执己见,互不相让,形成了汉语语法分析中的两个对立的学术派别,至今仍然有学者固执地坚持着自己的学术立场。
其实,我个人认为,“层次分析法”和“中心词分析”并不是水火不相容的,“层次分析法”中可以加入中心语的标记,“中心词分析法”中也可以考虑层次。我们不应当把两者绝对地对立起来。我在20世纪70年代末期提出的MMT模型,Chomsky在1970年提出的X阶标理论,早已把层次分析法和中心词分析法结合起来了,并且已经在机器翻译的应用中证实这是可行的了。我个人认为,汉语语法研究中实在没有理由再继续把“层次分析法”和“中心词分析法”对立起来了,不知网友们以为如何?
加载中,请稍候......