协同语言学

标签:
协同语言学词汇子系统最小省力原则冯志伟 |
http://s1/middle/72d083c7tb5616080de60&690
摄于厦门海滨
协同语言学
由前几篇博文的内容可知,在语言学的各个层面似乎都存在一些定律,通过这些定律,我们可以更精确地对语言进行描述。如果我们打算对语言做一个全面的描述,那么就有必要将这些定律有机地结合在一起,形成一个基于普适定律的语言学体系。
这是德国计量语言学家科勒(Reinhard Köhler) 提出协同语言学(Synergetic linguistics)的初衷。1986年,科勒出版了《语言协同学:词汇的结构以及动力学》(Zur linguistischen Synergetik. Struktur und Dynamik der Lexik),这标志着协同语言学的诞生。协同学(Synergetics)是由德国学者哈肯(Hermann Haken)在上世纪70年代提出的,它是一个研究不同事物共同特征及其协同机理的新兴学科。协同论认为,各种系统,尽管其属性不同,但在整个环境中,各个系统间存在着相互影响而又相互合作的关系。协同论的主要特点是通过类比对从无序到有序的现象建立一整套数学模型和处理方案。它基于“很多子系统的合作受相同原理支配而与子系统特性无关”的原理,设想在跨学科领域内,考察其类似性以探求其规律。协同语言学便是将协同学应用到语言研究领域的产物。
科勒认为,理论是由一些普遍定律组成的系统,没有定律,解释就无法进行。协同语言学的主要任务提供一套构建语言学理论的架构,即:这套建模方法可以用来建立普适的假设,测试假设,将这些假设组合起来形成定律和类似于定律的陈述网络,并用其来解释所观察到的现象。通过这种方法,也可以重构近几十年来正在丧失的语言观:语言既是一种心理-社会现象,同时也是一种生物-认知现象。协同语言学的基本公理是:语言是一个自组织和自调节的系统,是一种特殊的动态系统[1]。
第一个协同语言学的模型是由科勒于1986年建立的,这是一个有关词汇的语言子系统,如下图所示。图中,长方形表示的是系统变量(如,状态或控制变量);圆代表的是系统需求(requirements);正方形表示的是运算符,在大多数情况下,运算符是一些带有正负号的比例算子。值得注意的是,在阅读分析这样的语言系统图时,不应忘记图中所表示的关系实际上是对最初假设经过对数转换后的结果。如果我们想表示的假设是“一个词的长度越长,它的义项就越少”,则需要用的公式为:
P = a L –b
对此式两边取对数,就得到:
Q = c – b M
式中 Q = ln P, c = ln a, M = ln L. 由此可得到这一假设的图示形式:
http://s13/middle/72d083c7tb5613d73aa7c&690
这意味着,如果我们要从协同语言学结构图中提取单个假设的公式或等式,则需要进行反对数的操作。
词汇子系统结构示意图
(1)
词库大小(Lexicon size,简称LS)是编码需求COD和多义词PS的函数。V 是运算符,写在上标的位置,量V是需求Spc、Var和 Inv的函数,这些需求反映的是形意关系稳定性和灵活性之间的平衡和折中。 -L是运算符,写在上标的位置。以下公式中的运算符都写在上标的位置,不再特殊说明。
(2)
音素的数量(Phoneme number,简称PN)是平衡反映编码minC和解码需求minD的结果。
(3)
词长(Length,简称L)是词库大小LG、冗余Red、语音总藏大小(phonological inventory size,简称PH)及频率F的函数。
(4)
多义词(Polysemy,简称PL)是需求minC、minD和词长L之间折中的结果。
(5)
多文度(Polytextuality,即:可能的上下文数量,简称PT)是上下文全局化CE和上下文集中化CS过程间的作用以及多义词PL的函数。
(6)
一个词项的频率(Frequency,简称F)取决于它的意义的交际关联度Appl和它的多文度PT。
(7)
同义词(Synonymy,简称SN)是编码需求Cod和多义词PL的函数,它是灵活性需求和稳定的形意关系之间折中平衡的结果。
限于篇幅,这些公式和图中的大多数符号不能在此一一详解。但我们有必要对几个min开头的符号做一点说明,图中出现了minP、minI、minD和minC等符号。因为它们是出现在圆圈内部的,因此反映的是语言交际中的需求。语言交际包括了说者(speaker)和听者(hearer),在交流的过程中,二者都想用最省力的方式来完成交际,因此交际过程使用中说者和听者之间最小省力的平衡过程。换言之,在一个探讨语言交际的模型中,是不能忽略这些因素的作用的。协同语言学模型中的minP表示的是言语生成方面的最小化,minI是语言单位总藏的最小化(这是与人的记忆密切相关的),minD表示的是解码方面的最小化,minC是编码方面的最小化。由此可见,旨在解决这些因素和交际需求平衡的协同语言学是齐普夫提出的“最小省力原则”的具体化和现代化。
这里所说模型中的每一个假设均得到过实际数据的验证,其中许多假设更是通过了多种类型各异语言的验证。这些实证研究说明,采用协同学的原理来研究语言系统是可行的和值得进一步努力的。目前,除了本文提及的词汇子系统外,句法子系统也已基本形成。当然,鉴于所研究对象的极端复杂性,构建语言系统完整的协同语言学模型,还有很长的路要走。
[1] 本文内容主要参考了Köhler, R. (2005).