加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

“数字部件”是汉字信息化的紧迫问题

(2006-01-31 13:26:59)
标签:

汉字部件

汉字输入

成字部件

信息化

规范

笔画

书写

电脑

数字时代

分类: 信息化与互联网

“数字部件”是汉字信息化的紧迫问题

 

摘要:从电脑里没有汉字部件的规范开始,分析“笔画模式”的汉字部件标准,因为缺欠部件的“称谓”和“一次”排序规则,影响了汉字结构的讨论、教学和汉字编码。汉字要成为世界语言,必需要使部件享有“数字模式”。

关键词:汉字   部件   电脑   输入

 

随着电脑和互联网的发展,书写、印刷(显示)、传输和保存,已成为一体。汉字输入方法已在社会普及之后,似乎汉字的信息化已全面解决。然而,数字化和网络将对汉字带来哪些发展,又会带来多少影响与变革,依然是中国信息化的一大问题。汉字信息化在文字上的二大问题是:

汉字部件居然至今没有进入电脑;

汉字部件的相当部分没有称谓、读音和“一次排序”规则。

 

汉字部件居然至今没有进入电脑

1997年,国家语言文字工作委员会发布的《信息处理用GB  13000.1字符集——汉字部件规范》规定了560个汉字部件,包括成字部件和非成字部件,在《部件表》中归纳成393组。

    成字部件有:木水火土天人一二三百千万甲乙子丑等250个,其余不成字的部件有310个,称为非成字部件。

非成字部件中一部分是所谓的“偏旁部首”,有通常的“称谓”,如:“忄”“刂”称为“竖心”“立刀”,大约49个;剩余的部件如:勹、彡、冫、夂等,不能成字,也没有通常的称谓和读音。由于电脑中没有部件的“字形”,作者也无法对它们一一形容,就是自己做了“造字”,也无法在评审组的电脑中显示,也没法打印出来。

我们通行的商品化电脑的字库中,有英文、俄文、希腊文,甚至还有日文字母。惟独没有国标560个部件全集,也就是缺少所谓部首偏旁之外的那260个部件。

没有部件,除了不利于学习之外,任何人都不再可能通过电脑和网络交流、讨论汉字的来源和去向。也就是说,进入网络时代之后,“汉字发展和未来问题”已经画上句号。公众和专家对汉字输入的议论逐渐淡化,直到无人喝彩。一个根本因素却未引起注意——汉字部件的口语表达不便,用电脑在网络上更无法交流表达。

一年、两年、三年,直至十年之后,汉字的现实和发展问题,就将淡出人们的视线。现代社会中,特别是在网络上,得不到发展的语言文字终将逐步消亡。在电脑中没有基本位置的汉字,长久下去也将处于弱势,不要说在国外,就是在新一代青年心目中,也会置其于次要地位,这绝不是耸人听闻的说法。

 

汉字部件标准不适应信息化进程

用专业术语说,汉字有三层结构:笔画、部件、整字。正式的定义是:由笔画组成的具有组配汉字功能的构字单位,简称“部件”。

任何语言的字母或基本单元都需要也应当使用口语来表达,在学习语言中也是启蒙的课程。拉丁字母都能够单独用语音表达,学习字母也就是学习语言文字的开始。从城市到边疆,不会英文的老老少少不仅都能流利地说出:VCD、USA、CCTV,就是通过电话“读”字母,也能说清楚外文姓名、词汇。

相比之下,汉字非成字部件如“”“肀”等,公众就无法以读音用口头表达。人们经常说:“弓长张、木子李”,而“句官衣鼠”等字,无法用上述“拆分”方式叙述。要是碰到不常用的亓芈卣袤耜等字,不论是在电话还是当面,也很难用语言表达其之构成。

汉字的信息化离不开部件的表达,而部件没有称谓和读音就无法用语言形容,也难于使用字符赋值,这才是“万码奔腾无人喝彩”的根本原因。

因为有了元素周期表,有了科学的元素名称、符号代码和排序规则,才推动了化学反应的表达,使化学从炼丹术士和点金术的歧途中走出。那么,在“数字地球”时代,大批汉字部件至今缺乏通俗的读音和代码,能不认为是“数字化”的一个断层?

 

汉字部件的标准不符合信息化规范

信息化社会的一个基本特征是有序,数字时代一切事物都要赋予代码,提供相关排序规则。不错,现在的汉字部件标准也是先按照笔画多少,同笔画的部件再照笔画顺序排列。但是,二次排序的规则,完全不适应信息代码的快速赋值,特别是在见字识码的过程中更是这样。部件要赋值,给予称谓、读音之后,就可以如同字母一样,实现“一次”直接排序。

所以说,现今的汉字部件标准是出于单纯的“语言文字”的学术排列,是“笔画”书写时代的标准,而非信息社会时期的部件标准。现有的部件规范,自然不适合汉字的信息化,更不适合汉字信息化的社会化普遍应用。要彻底解决汉字信息化,就必须从汉字部件的标准化重新开始。

    就连中文研究生都不能背诵的“汉字部件标准”如何能够为公众使用呢?必须对560个部件进行归纳、合并、赋音、排序。

    技术创新只有在理论创新的支持下才能产生,才能为公众广泛接受。在数字地球年代,汉字在部件级的数字化工作已经落后了,这种欠缺将通过电脑和网络影响到整个社会。

    门捷列夫元素周期表的产生,方便了对元素和所有化学产品、化学反应的描述,从而推动了化学,以至医学、生物学、材料产业等等的发展。汉字的信息化,同样也需要新的理论和合乎中国人思维的“称谓”体系。

 

汉字部件的演化

汉字的产生应当源自“部件”,早期汉字仅有二层结构,即整字和部件,笔画是不存在的。在有了书写工具之后,随着字形的“  ”,才产生“笔画”。

几千年的字形变化表现在两个方面,一个是笔势和体态的变化;另一个是笔画组合的变化。在漫长的农业时期,笔书写过程中强调和突出了字的笔画和运笔,而弱化了部件。远古时期的刀刻龟甲,农业社会的毛笔和工业时代的铅笔、钢笔、圆珠笔的书写,强调的是“笔”的动作,所产生的字形的基础部分,被称之为“笔画”。的同时,部件的形态变化,称谓和读音也逐步蜕化,一些专家们认识的“部件”,其称谓或读音也不为公众周知。

例如:鼠字是由“臼”和下方部件构成的,除去“臼”之外,其实是一个表示“躯体”的部件。而现有的部件部件是按照笔画彻底拆分,自然影响了表达和输入。

  如果我们确认,“工具可以影响和决定产品的特征”。那么,当电脑书写成为主流之后,汉字的字形已经不能随意变化之时,汉字部件的音形义是否还会发展呢?如果我们跳过“笔画”,回归到先民时期的汉字,直接对“部件”赋值。那我们就能够用部件的“称谓”逐一描述所有的汉字,部件的“一次”排序也就迎刃而解,而不论它是否是简体、繁体。

    汉字的信息化是汉字的未来,它取决于首先完成“数字时代”的汉字部件规范。当外国人,也能够在电脑上通过部件来学习和描述汉字之时,也就是“数字汉字”的真正开始。从此,汉字才真正的成为“世界语言”。

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有