加载中…
个人资料
雨燕起飞
雨燕起飞
  • 博客等级:
  • 博客积分:0
  • 博客访问:129,363
  • 关注人气:92
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
相关博文
推荐博文
谁看过这篇博文
加载中…
正文 字体大小:

回首二简(5) - 简化还是拼音&#

(2008-08-30 01:26:38)
标签:

杂谈

分类: MSN搬家

汉字作为目前世界上主要文字中仅存的象形文字,在简化和拼音化的问题上,历来众说纷纭。新中国成立之后,许多学者作出判断,汉字的拼音化是必然趋势,拼音化是语言发展的必然结局,代表着先进。因此,才有了逐步简化汉字以至最终拼音化的方案。一简就是在这个大的背景下出台的。事实上,简化汉字对于普及教育的功绩不可磨灭。然而是否需要进一步简化,在70年代二简出台的时候,分歧就巨大了。

80年代,五笔字型的发明,为汉字快速输入计算机提供了可行的途径。现在专业打字员用五笔字型或表形码(均基于汉字组字部件的拆分)输入汉字的速度至少都在200汉字/分,已经不亚于甚至快于专业英文打字员。能达到这样高的效率,是由于汉字的象形本质。组字单元的排列组合,每个汉字不同,这样就可以用至多4键确定一个汉字。高频汉字只用1键即可。而且汉语组词相对固定,4键可以输入一个词,无形中大大加快了输入速度。因此,基于字形的编码,也就成为语言信息学的研究基础之一。

近年来,随着信息学的发展,对于汉字编码的研究已经证明了汉字具有很大的再简化的潜力。同时,以“井田汉字”为代表的“拼音化”汉字也开始在学者的眼中频频出现。“井田汉字”将汉字拆分成组成单元,用田字的规则形状来代表,的确易于编码易于输入。然而,由于字形改变太多,中国人无法快速适应,井田汉字注定只有学术价值而没有实用价值。(有关“井田汉字”的具体内容,请参阅相关资料,在google上搜索“井田汉字”即可)

井田汉字的目的,是要用最少的代价将汉字拼音化。目前在各种基于字形的拼音化方案中,井田汉字的确已经做到最好了,然而它并不具有实用价值,是不是意味着汉字拼音化是不可能的呢?

要回答这个问题,我们只要回顾一下历史,分析一下象形文字与拼音文字的特点便可以有一个大致的答案。

拼音文字的字元(字母)是完全抽象的。因此,笔画的空间位置基本上对其代表的内容没有实质影响。例如字幕b,那一竖长点短点没关系,圆大点小点没关系,瘪的也无所谓,甚至画成三角形也无损于人们将其认成b。这个特点非常有利于高速书写,因为空间冗余度很大,写成什么样子都没关系。相反,象形文字笔画空间位置非常重要,长短也很重要。例如“土”和“士”,“来”和“耒”,“己”和“已”和“巳”,“日”和“曰”,形状极其相似,写潦草一点,就成另一个字了。

但是,同样在一个字元所占的空间里,同样的笔画数,拼音文字只能有很少的几种字母可能性,例如一个圈加一竖只可能有4个可能(abpq),然而象形文字却可以有许多种不同的可能性。英文abpq四个区别其实不够大,遇到书写潦草的,基本上无法分辨(不信?改天我扫描我奥地利同事的笔迹上来,所有的字母都好像是一样的写法……)但是书写再潦草,“中”,“日”总能分清楚吧,这也是一个圈加上一画。同样的道理,3画的“上”、“下”、“土”、“工”、“干”等,都是两横一竖的结构,但基本上不会被混淆。如果加上撇捺折,变化更多。

因此,即便在笔画数2-3的状况下,同一个字元空间中,象形文字可以表示出比拼音文字多许多倍的意义,而无损于快速书写的特性。因此,在限制笔画数的状况下,简化的象形文字比拼音文字具有更大的单字元信息量。

但是,单字元信息量不可能无限增大,因为字与字之间应有足够明显的差别,这样才好识别。例如繁体中文中同时“月”字旁就有两种,一种是“月”,一种是“肉”(实在不容易用文本打出来),形状极其相近,除了那时候少数秀才文人,大多数人都无法分辨。虽然它们代表着不同的意思,是从不同的象形符号中抽象出来的,但是由于实在太相近,最后干脆给合并起来。这种情况在笔画数少的情况下尤为明显,例如“土”和“士”,“己”和“已”和“巳”。然而,即便按井田汉字的单字元模型,3画全长的字元已经超过20种,而且不易互相混淆。而且一个汉字可以由多个组字单元组成。这样,经过简化的象形文字,单字元信息量仍然要大过拼音文字。

由于拼音文字无法继续精简字元,要想简化只能采取缩短长度的方法,但这样一来带来的问题就是相似性太高。例如catcut就很相近。现代以来英语国家(尤其是美国)泛滥的首字母缩略更是麻烦多多,因为同样一个缩写可以代表许多种意思。例如HD可以代表Huntingtin’s Disease(亨廷顿综合症), High-Definition(高清), Hard Disk(硬盘)等,风马牛不相及。金山词霸里输入缩略语PC,可以看到21种不同的缩略语全称,随便列举几个“微调电容器”“通路控制”“磷酯胆碱”“聚合物混凝土”“穿孔卡片”“个人计算机”等等,而这其中尚未包含近年流行起来的“透视调整(移轴)”“耻骨-尾骨”“聚碳酸酯”等。可想而知,今后出现更多词汇概念的时候,仅凭缩略词一定会让人云里雾里。韩语的拼音化已经导致这方面的严重问题,同一个韩语词可以代表多达几十个汉字词汇,人们必须依赖上下文语境才能猜出词汇的意义,有的时候干脆猜不出来。因此,拼音文字的简化目前已经几乎到了极限。

可是简化象形文字就不同了。保证笔画数相同的情况下,我们有更多的选择。它们之间有着足够的差别供人们区分,却并不增加书写的负担。

当然,有人会说,象形文字需要更精细的点阵才能正确显示。不错,这正是象形文字不够抽象的缺点。然而,当24x24点阵已经足够表示6万汉字,双字节Unicode字符通行天下的时候,这点问题已经不是问题了。对于人工书写,当然就更不是问题了。

可能很少有人知道中国的速记语言。60年代曾经有专门这方面的教材。这种速记语言,就是用非常简单的易于连写的符号组合(可以看成是一些字母)来表示汉语的语音,速记的时候只记录语音。由于这些速记符号空间冗余度高,写得很潦草也没关系,一样能认出来。实际上这就是汉语的拼音化的一种尝试。但麻烦之处在于,由于汉语重音字词太多,导致记录人必须根据记忆和上下文内容才能恢复出原文,如果交给另一个人来看,可能完全理解错。最后这套通行的速记语言渐渐消失了,虽然它的每字都能1笔写出。简化,还是要有个度的。

这么看来,象形文字的简化潜力要比拼音文字更大。仅从节省时间的角度来看,如果要简化汉字,我们不能丢弃象形文字的这种天然优势,而不能走拼音化的路线。随着时代的发展,象形文字会逐渐显露出其优势。

然而,这一切的优势,都是建立在单字元信息量的基础上的。以目前汉字对英文2.4倍信息量劣势来看,在不简化的情况下要自然扭转局面,恐怕还要信息继续爆炸个几十上百年。那个时候人类的大脑受不受得了,尚未可知。

0

阅读 评论 收藏 转载 喜欢 打印举报/Report
  • 评论加载中,请稍候...
发评论

    发评论

    以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

      

    新浪BLOG意见反馈留言板 电话:4000520066 提示音后按1键(按当地市话标准计费) 欢迎批评指正

    新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

    新浪公司 版权所有