韩礼德的系统功能语法--结构与系统
(2020-12-07 15:57:31)
标签:
冯志伟人工智能语言学 |
韩礼德的系统功能语法-- 结构与系统
冯志伟
韩礼德发展了弗斯关于“结构”和“系统”的理论,对“结构”和“系统”下了新的定义,提出了“系统功能语法”(systemic
functional grammar)
韩礼德新提出的语法理论包括四个基本范畴:单位(unit)、结构(structure)、类别(classification)、系统(system)。
其中,结构与系统的含义与弗斯的不尽相同,分别解释如下:
①单位:语言的单位形成一个层级体系(hierarchy),单位同时又是一个分类体系,单位之间的关系呈现为从最高(最大)到最低(最小)的层级分布,每个单位都包含一个或一个以上的、紧跟在它下面的(小一号的)单位。例如,英语中的单位就是句子、分句、词组、词和语素。一个单位的级(rank)就是这个单位在层级体系中的位置。
②结构:在语法中,为了说明连续事实间的相似性而设立的范畴,叫“结构”。结构是符号的线性排列,其中,每个符号占一个位,而每个不同的符号代表一个成分。结构中的每个单位,由一个或多个比它低一级的单位组成,而每一个这样的组成成分,都有自己特殊的作用。例如,英语的分句由四个词组组成,这四个词组的作用是分别充当主语(subject)、谓语(predicate)、补足语(complement)和附加语(adjunct),分别用S、P、C、A来代表。所有的分句都可由它们组合而成。如SAPA(“主语—附加语—谓语—附加语”)、ASP(附加语—主语—谓浯)、SPC(主语—谓语—补足语)、ASPCC(附加语—主语—谓语—补足语—补足语),等等。此外,在词组这一级,还有一类词组,韩礼德把它们叫做“前定语”(modifier)、“中心语”(head)、“后定语”(quatifier),分别用M、H、Q来代表。如果可能存在的结构有H(中心语)、MH(前定语—中心语)、HQ(中心语—后定语)、MHQ(前定语—中心语—后定语)等形式,那么,这些结构可以用一个公式表示为(M)H(Q),其中括号里的成分可有可无,是随选的。
③类别:一定单位的一群成员,根据它们在上一级单位的结构中的作用,可以定出它们的“类别”。例如,英语的词组可定出动词词组、名词词组、副词词组等类别。动词词组用作分句中的谓语,名词词组用作分句中的主语和补足语,而副词词组在分句中则具有附加语的功能。它们的类别都是根据词组中的成员在分句中的作用定出来的。一般地说,如果某一单位具有基本结构XY、XYZ、YZ、XYZY,那么,下一级单位的基本类别就是“作用于X的类别”“作用于Y的类别”和“作用于Z的类别”。
结构和类别为一方,单位为另一方,它们之间的关系可在理论上确定。
类别和结构一样,都是同单位相连的,类别始终是一定单位的成员的类别。
类别和结构的关系经常不变,类别总是按照上一级单位的结构来定,结构总是按照下一级单位的类别来定。
④系统:韩礼德指出,所谓“系统”,是由一组特点组成的网。如果进入该系统的条件得到满足,那么,就选出一个特点,而且只选出一个特点。从某一特定系统网中形成的特点进行的任何选择,就构成对某一单位的系统的描写。可见,系统从其外部形式上看,就是一份可供说话者有效地进行选择的清单。系统之间的种种关系,可以由系统网络(system
network)来表示。
系统存在于所有的语言层,如语义层、语法层和音位层,它们都有各自的系统来表示本层次的语义潜势。
系统功能语法采用包含“与/或”(and/or)逻辑关系的非循环有向图来表示语法,这样的语法就是系统网络。如下图所示(图略):
上图以举例的方式给出了一个简单的系统网络。这里,最大的波形括号表示“and”(也就是并列的)系统,而笔直的垂直线表示“or”(也就是不相交的)系统。因此,每个句子(Clause)可以同时具有语态(Mood)、及物性(Transitivity)和主题(Theme)的特征,但是不可能既是指示语(indicative)又是祈使语(imperative),只可能是其中之一。
系统功能语法采用“实现语句”(realization
statement)来建立语法指定的特征(比如,指示语、祈使语)与句法形式之间的映射。网络中的每个特征都具有一个实现语句集,并通过该实现语句集来指定对最终表达形式的约束。每个特征的实现语句在系统网络图中以特征下面的斜体语句集来表示。当遍历系统网络时,实现语句容许将语法用于约束表达形式的结构。所采用的简单的运算符号如下所示:
+X: 插入功能X。例如,上图的语法中,Clause
的实现语句“+predicator”表示句子(clause)需要插入一个谓词(predicator)。
X=Y:合并功能X和Y。这意味着容许语法通过对表达式的相同部分指派不同的功能而建立一个层次化的功能结构。例如,在特征Active下面的实现语句“actor
=
subject”表示主动语态的句子将行为者(actor)与主语(subject)合并,而在特征Passive下面的实现语句“goal
= subject”表示被动语态的从句将目的(goal)与主语(subject)合并。
X>Y:将功能X置于功能Y之前的某一位置。例如,“subject >
predicator”表示句子的主语(subject)置于谓词(predicator)之前。
X/A:将功能X与词汇或语法特征A划为一类。例如,“predicator /
verb”表示把谓词(predicator)功能和动词(verb)划为一类,也就是说,这个谓词功能在词汇语法特征方面必须是动词。
对于一个给定的系统网络,自然语言生成的处理程序是:
① 从左到右遍历网络,选择正确的特征并执行相关的实现语句;
② 建立中间表示,这个中间表示要满足遍历期间执行的实现语句所施加的约束;
③ 对于任何没有完全指定的功能通过在较下层递归地调用该语法而加以指定。
例如,经过文档规划和微观规划之后,我们得到了如下的内容描述:,作为英语句子生成的初始信息:
其中,save-1, system-1,
document-1表示它们是词典的选项,词的后面标以“-1”,表示系统也可以选择其他的同义词来替代它们。上面给出的这些信息说明,我们要生成的英语句子应该是一个具有将来时态的断言句。
现在,让我们根据这些信息,使用上面的系统网络图来生成英语句子。
生成处理从系统网络图中的句子特征clause开始,该特征的实现语句是:+predicator,predicator/verb,表示需要插入一个谓词并将它分类为动词,因此,插入动词save。
然后,继续进行至语态(mood)系统。一个系统的正确选项是通过与系统有关的简单查询或决策网来选择的。因为输入说明指定这是一个断言句,因此语态系统选择指示语(indicative)和陈述语(declarative)的特征。与指示语和陈述语特征有关的实现语句是:+subject,
subject > predicator, +finite, finite >
predicator,表示要插入主语(subject)和定式(finite)功能,并将它们排列为主语(subject)、定式(finite)、谓词(predicator)的顺序。这样,我们得到如下的功能结构:
Mood Subject finite predicator
接着,进入及物性(Transitivity)系统,我们假定save–1行为的特征是物质加工过程,因此,及物系统选择“物质加工”(material
process)的特征。这个特征的实现语句是:+goal, +process,process = finite,
predicator,因此,插入目的(goal)和处理(process)功能并合并定式(finite)和谓词(predicator)。由于输入中没有指定采用被动语态,因此系统选择主动语态的特征,这个特征的实现语句是:+actor,
actor = subject, +object, object = goal, predicator > object,
object / noun
phrase,因此,插入行为者(actor)并将它与主语(subject)合并;然后,插入宾语(object),将它与目的(goal)合并,并将它置于谓词(predicator)之后,这个宾语(object)是名词短语(noun
phrase)。结果如下:
Mood Subject finite Predicator Object
Transitivity Actor Process Goal
最后,因为输入的信息中没有关于主题(theme)的说明,主题系统选择未标记主题(unmarked
theme),这个特征的实现语句是:+theme, +rheme, theme = subject, rheme =
predicator,
object,因此,插入主位(theme)和述位(rheme),把主位与主语(subject)合并,把述位与谓词(predicator)和宾语(object)合并。所得到的结果是一个完整的功能结构:
Mood
Subject finite Predicator Object
Transitivity Actor Process Goal
Theme
Theme Rheme
这时,生成处理还需要递归地多次进入语法的较低层次,以便完全地指定短语、词典项以及词形。名词短语网络将采用与这里给出的过程类似的方法来生成“the
system”和“the
document”。辅助动词网络将为系统插入词汇项“will”。词汇项“system”、“document”和“save”的选择可以通过多种方式来处理。最后生成的英语句子是:
The system will save the document.
系统功能语法把这个句子表示为如下的多层结构:
The system Will save the document
Mood Subject Finite predicator Object
Transitivity Actor Process Goal
Theme Theme Rheme
这里,语态层(Mood)表示这个句子是一个带有主语、定式助动词、谓语动词和宾语的简单的陈述句结构:the
system是主语,will是定式助动词,save是谓语动词,the document是宾语。
及物层(Transitivity)表示主语“system”是“saving”处理的行为者或实施者(actor),宾语“document”
是目标(goal),“will save”是过程(process)。
主题层(Theme)表示“system”是句子的主位(theme)或关注的焦点,“wil save the
document”是句子的述位(rheme)。
这三层处理的是不同的功能集合。这三个功能集合,被称为“元功能”(meta-functions),语态层表示交际元功能,及物层表示观念元功能,主题层表示话语元功能。
从系统语法的观点来看,言语行为就是从数量巨大的、彼此有关的、可供选择的各种成分中,同时地进行选择的过程。
假设有一个包括特点a和b的系统,必须选出a或b,则可表示为图9-7。
图9-7 a和b为必选
如果系统 (1) 包含特点a或b,系统 (2) 包含特点x或y,而系统(1)中的a是进入系统(2)
的条件,也就是说,如果选上了a,那就必须选择x或y,则可表示为图9-8:
如果在同样的条件a下,系统m/n与系统x/y同时发生,则可表示为图9-9:
如果在a和c二者都选上的条件下,必须选择x或y,则可表示为图9-10:
如果在a或者d选上的条件下,选择x或y,则可表示为图9-11:
由此,可以组成系统网,这种系统网可以清楚地描写句子的结构。例如,图9-12是英语时间表达法的系统网。
这个系统网可以准确地说明下列各句是否合乎语法。
i. Is it six yet?(经六点钟了吗?)
ii. I think it's about half
past.(想大约是过了半点钟左右)
iii.It was five after ten.(十点五分)
iv.He got there at eight minute before
twelve.(他于十二点差八分到达那里)
v.*He got there at eight before twelve.
vi. *It was half past ten o’clock.
句i是正确的,因为在系统网中,“表示小时”这一类可以选用“不带o'clock”的用法。
句ii是正确的,因为在系统网中,表示“比小时小的单位”这一类也可以采用“不用hour(小时)这个词”的用法。
句iii是正确的,因为在系统网中,“表示比小时小的单位”这一类可先进入“比半点小的单位”,然后进入“十二分之一小时”(即五分钟)这种用法,而无须用“minute”(分)这个词;但在“比半点小的单位”这同一条件下,还应同时用“after"(在……之后)或“before”(在……之前),句“iii中用了after,所以是正确的。
句iv也是正确的,因为在系统网中,“表示比小时小的单位”这一类,可先进入“比半点小的单位”,然后,又可同时地进入“before”(在……之前)和“minute”(分)。
句v是不正确的,因为在系统网中,当它进入“比半点小的单位”之后,必须在“四分之一小时”或“十二分之一小时”或“minute”(分)之间选择一种,但它哪一种都没有选择,所以,是不正确的。
句vi也是不正确的,因为在系统网中,如果进入了“表示比小时小的单位”,然后又进入了“半点”的表示法,则不应该用“o'clock”,而只有在“表示小时”这一类中,才能带“o'clock”,所以,句vi不正确。
可以看出,系统语法的系统网必须精心地进行编制,才能正确无误地表示语言的结构。
由于系统语法把言语行为看成一个在数量庞大的、彼此有关的可选择项目中同时地进行选择的过程,如果表示这种选择过程的系统网编制得又详尽、又准确,就可以用形式化的手段对语言进行细致入微的描述,从而使这种系统语法在语言自动处理中得到实际的应用。
美国人工智能专家维诺格拉德(T.Winograd),在1974年研制的自然语言理解程序SHRDLU中,运用了系统语法的理论,取得了很大的成功。
SHRDLU程序能理解用普通英语键入计算机终端的语句,并能回答询问,以此进行人机对话,用英语来指挥机器人摆弄积木,移动简单的几何物体。