加载中…
正文 字体大小:

简析新华拼音

(2005-11-25 22:59:30)
简析新华拼音
徐孟罗
一、新华拼音的特色
㈠输入功能最全
新华拼音是目前国内输入功能最全的输入法之一,主要功能包括:①用笔画输入生僻汉字;②英汉字典;③各类特殊符号输入;④偏旁部首输入;⑤英汉混合输入;⑥重现功能;⑦拼音输入和汉字注音--这是其最具特色的功能,目前在所有中文输入法中居于领先地位。它不仅能输入完整的带声调音节如zhōng,也能输入带声调的拼音词组如zhōngguǒ;还能对大段中文注音,如:正确(zhèngquè) 使用(shǐyòng) 祖国的(zǔguóde) 语言(yǔyán) 文字(wénzì),大力(dàlì) 推广(tuīguǎng) 普通话(pǔtōnghuà) 。
㈡与众不同的"新华双拼"
囿于对双拼编码规律认识的局限,一些著名的输入法曾深受键位资源紧张的困扰,不得不利用分号键进行双拼编码,如微软拼音2.0、双拼4.0等。新华双拼居然在不动用分号键的情况下,在26个英文键位中安排了4个声调键位、6个词类键位,目的是区别重码,主要目标是无重码输入以实现盲打。从这个意义上说,新华双拼对双拼编码规律的研究也处于领先地位,是所有拼音输入法中最具创新精神和最别具一格的双拼键盘布局。
㈢强烈的叛逆色彩
刚进入"汉语拼音论坛"时,我真的不大明白怎么有那么多声讨汉语拼音方案的帖子。后来才发现新华拼音已经提出了一套全新的拼音方案,大有与汉语拼音方案分庭抗礼之势。
二、市场现状
在此作者提供一组引自新浪网2003年10月27日的抽样统计数据--您最常用的输入法是(按用户占有率排序):五笔35.33%、智能ABC26.86%、紫光11.12%、微软拼音10.66%、智能狂拼8.31%、拼音加加4.41%、自然码1.16%、其它2.15%。
在未和系统整合的输入法中,紫光以11.12%的用户占有率高居榜首,并以微弱优势领先于和系统整合的微软拼音。新华拼音则和上千种中文输入法同囚于2.15%的"其它"围城之内。具有那么多独特的功能,部分功能还处于领先地位,新华拼音有足够的理由和自信宣称:新华拼音"将成为最好用的输入法"!事实是,新华拼音的市场现状并不理想,原因何在?
初涉新华拼音,最突出的感觉是:它是最难学的拼音输入法,背离了拼音输入法最基本的"易学"特色!它所强烈推荐的"新华双拼"在这方面表现尤甚,无形中将大多数用户拒之门外。
说点闲话吧。王竹溪,一位令人尊敬、治学严谨的学者。八十年代编过一部当时收字最多的汉语字典,由于没有可用的铅字,全书均用小楷抄写,至今仍具有很高的学术价值和收藏价值。很可惜,竹溪先生与大众交流的信息平台--他所独创的汉字检索系统没有被大众所认可,一部本该为大众服务的工具书并没有发挥它应有的作用,在很多场合都被束之高阁。
新华拼音是二十一世纪的王竹溪!市场不相信阳春白雪!
三、最难学的输入法
之所以难学,缘于其繁杂的输入规则,尤其是新华双拼的输入规则。原因在于双拼编码所承载的信息负荷量过重,如4个声调键位和6个词类键位的设定等,致使合理的编码布局与输入规则的简化之间无法达到和谐统一的最佳效果。
㈠输入规则的繁杂主要体现在零声韵母的输入上。①采用"分类设置输入规则"的方式--单字母和双字母零声母音节:拼写形式同全拼,啊=a,安=an;三字母零声母音节:为首尾字母连击,ang=ag,eng=eg。不符合"一声一韵"的双拼习惯。②搅乱了众所周知的零声韵母概念--除了通常的以a、e、o起首的12个零声韵母之外,wu、yi、yin、ying、yu、yue都莫名其妙地成了零声韵母(本是音节,却成了韵母),其输入规则更与书写习惯大相径庭--屋=u(不是wu或uu),衣=i(不是yi或ii),因=in(不是yl或il),英=ig(不是yh或ih),玉=yu或iu(无法与yü兼容);特别是,月=yo或io(不是yw或iw),令人匪夷所思。
㈡声母输入规则也与通常的双拼方案不同。①有三个声母和汉语拼音不同,w=u,y=i,x=f。其帮助文件的键位图上也没有在U、I、F键上分别标明W、Y、X,F键上标注的是f(i),更令人不可思议。②使用频率极高的双字母声母无法设置专用键位,只能采用模糊音设置方式,zh=z,ch=c,sh=s,致使重码率增高;虽可用全拼输入,但又与双拼规则不符。
㈢部分汉语词组的输入规则,尤其不能令人容忍。如,单字母音节后跟某些字母时, 需用声调字符(或隔音符:"'","-","/";或首字母大写)隔开,如:
ivge, i'ge,i-ge,iGe 一个(否则将误认为"英俄")
avge,a'ge,a/ge,aGe 阿哥(否则将误认为"昂俄")
uwff, u'ff,u-ff,uFf 无妨(否则将误认为"往复"、"往返"、"妄想"、"往下"等)
eyip, e'ip,e/ip,eIp 扼要(否则将误认为"欸跑")
ewgo,e'go,e-go, eGo 俄国(否则将误认为"嗯我")
yi、wu两个音节极其常用,有时间的用户不妨试试输入如下词组,同时也锻炼一下自己的忍耐力:一万/玉米、以往/预防、遗物/雨雾、以为/预报、五个、武装/外头、无形、五倍/尾部、无能/稳固、诬蔑/完成、五阿哥/瓦罐。
相对而言,新华拼音的"汉语拼音双拼"更符合人们的输入习惯,但某些词组的输入将会遇到困难,如"俄国"等。
如此繁杂的输入规则,岂能不让大多数用户望而却步,特别是那些想换一种功能更全的输入法的用户?再好用的输入法也都必须以优良的"中文输入"性能为基础,其它功能无论多么出色也都是陪衬,皮之不在,毛之焉附?
四、问题讨论
㈠有必要专设四声键位吗?
作者认为完全没有这个必要。理由是:
①难学的始作佣者
普通用户大多都跨不过"难学"这道门槛,难学是由于输入规则的繁杂,规则繁杂则主要起因于四声键位的设置。同时输入规则的规律性也不强;比如:他ta,她tav,它taa;三个单音节词倒是定位了,其间的内在联系是什么?
一般认为,形码的特点是重码率低但难学,音码的特点是重码率高但易学。后者易学是建立在全民普及的基础之上的:中国人从小学时就开始学习汉语拼音。其实汉语拼音也绝不是好学的玩意儿,一个既不会汉语拼音也不会五笔的人,可能更容易学会五笔。
过多地改动拼音书写习惯未必是明智之举--背离了易学的特点,还有多少人愿意接受如此难学的输入法呢?即使按比较乐观的估计,愿学此法的人也难超过10%。
②市场空间小
多数南方人的汉语拼音基础都欠扎实,这是许多人拒绝拼音输入法的一个重要原因;由于受各地方言的影响,多数北方人的四声也很难说得地道。因此,愿意用四声规则进行汉字输入的用户群体很小,估计不会超过10%。
综合上述两项因素,新华拼音要达到1%的市场占有率有一定难度。
③重码分离效果差强人意
作者曾尝试用新华拼音输入如下重码率最高的9个音节(音节后数字为重码的汉字数目):yi158,ji136,yu122,qi101,fu101,zhi99,xi94,yan93,li92;发现许多汉字仍需十余次翻页才能输入。看来,用四个键位分离重码,很难让人满意;拼音之星所附的谭码用二十余个键位分离重码,效果则明显好得多。
重码困扰分析:
无论哪种纯拼音输入法,距离盲打的目标都还有相当大的差距。使用五笔的用户,大多数也都是看着屏幕打字。从这个角度而言,双拼比之五笔,录入速度并无太大的区别。
随着各种拼音输入法的不断改进完善,重码对用户的困扰已逐渐退居次要的地位。
一般的拼音输入法都提倡按词、词组、短语输入,大多都能有效地区别重码。重码问题较大的单字词在汉语词库中仅占13%(引自智能ABC,6万词库),本人所用词库约15万字,单字词比例估计不到10%。即中文输入过程中遇到单字词的几率约为10%。
单字词中,每个音节所对应的汉字数目差别很大。据作者统计,GBK范围内约72%的音节(298个)可通过1-2次翻页或不翻页而检索完所有汉字(按紫光、新华拼音的输入栏窗口每屏显示9个汉字统计);约18%的音节(73个)需通过3-4次翻页检索完所有汉字;事实上,在20902个GBK汉字中,常用的约占1/4稍多,这意味着90%的常用汉字一般无需翻页即可输入,在此范围内用声调区分重码实际上增加了击键次数。重码问题突出的音节(42个)仅占总音节数的10%,这是降低重码所要重点突破的区域。
综合上述两项因素,输入过程中重码翻页问题目前对用户的困扰几率约占1%。但"以词定字"功能已部分地解决了这一问题。
因此,在一般输入过程中附加声调信息有画蛇添足之嫌;而在确实需要区别重码的时候,附加声调信息往往不能解决问题。
④干扰双拼布局
四声键位的设置,加重了双拼编码时键位资源紧张的问题。如三个双字母声母zh、ch、sh无法安排专用键位;若采用全拼方式输入,则使码长加大,同时又导致H键只能安排非零声韵母;若采用模糊音设置,则使重码率增大,违背了降低重码率的初衷。四声键位也只能安排音节组合最少的韵母(不超过6个,如ia就只能和j、q、x、d、l相拼)。如何做到操作方便则更无从谈起。
《汉王简》的四声键位设置可资借鉴。它是将键盘左侧的"·-Tab-Caps Lock-Shift"四键按键位序列分别定义为一、二、三、四声,未占用26个英文字母键位;且作为可选项,是锦上添花的角色。而微软拼音3.0则是用数字1、2、3、4来代行四声功能。
综上所述可知,在26个英文字母键位中设置四声键位弊大于利。撤销四声键位则有利于简化输入规则、扩大用户层面、优化双拼布局,何乐而不为?
㈡单声母移位的学术价值
我们不妨撇开市场意识,换一种角度来考察新华拼音。
将W、Y、X三个声母分别移位到U、I、F键,一下子创造出四个特殊功能键位V、W、X、Y,这在所有输入法中是独一无二的。其中最具实用价值的是X移位到F键,只有一个音节fiao(覅)需要进行模糊处理。
"拼音加加" 在全拼状态下可用I键开启"笔画输入",但在双拼状态下只能用"~"来开启,其操作是"shift+·",远不如单击I键方便。事实上,双拼编码时零声韵母的输入,凡采用"分类设置输入规则"方式的,都难以安排特殊功能键位。
新华双拼的X移位措施,是此类情况下创设特殊功能键的唯一范例。尽管这些键位用于分离重码,有大材小用之憾,且未能取得最佳效果。但仅此而言,新华双拼的学术价值已远远超过其实用价值。
新华拼音不缺少具有创造性的研究型人才,缺的只是市场营销意识。
五、未来走向预测
㈠维持现状
修修补补的小改动,比如将ue与eng同置一键,再对疟、略等音节进行模糊音处理,则"月"可用yue输入;不进行大的改动,此种可能性为90%。理由是:谁不爱自己的孩子呢?此种情况下,作者建议将双拼助记口诀进行改动,以反映更多的键位信息,也利于按键位序列记背。
挑往二尤鹅约鸥;羊屋一窝跑;
更坊稀,端孙啊;英翁窘,快烟林威;(稀表示X)
背雨,野洼鸭在;恁满。
㈡大幅度简化输入规则
设置专用的零声母键位(Q或J),zh、ch、sh分别定义到E、A、O键,er与ü组合置V键("菊"只能用ju输入,不能用jü),或将er定义在分号键上,这些措施都有利于简化输入规则。可能性为9%。
㈢撤销四声键位
否定自我,从头再来,这种可能性为1%。看看新华拼音网站的代号fhpi吧,您就知道这是最痛苦的一种选择。然而,面临被市场淘汰的危局时,推出一款面向大众而不是一小部分人的全新产品,挽狂澜于既倒,谁能说这种可能性为零呢?
后记:刚接触一种产品时,用户的最初感觉未必都正确,但却很重要,尤其是对产品的生产者而言。故此文主要供新华拼音的研制者参考。
2003-11-16草于鄂豫皖交界处的大别山腹地(河南省商城县长竹园乡陈湾村陈泽兵处)
汉语拼音论坛版主王良辰等人的回帖:
①好文章,值得一读
“新华拼音输入法”没有和知名操作系统或编辑软件等捆绑在一起,社会应用范围自然比不上“五笔字型”和“智能 ABC”、“微软拼音”等等。但是“清华紫光拼音输入法”的应用率很高。除了自身的因素以外,是不是“高等学府”的头衔起了相当大的作用?
据我在网上聊天的初步调查,使用“五笔字型”的比率并不很大。使用者大都是在早期经过专门训练的人员,当年计算机培训教材中少不了“ WPS”和“五笔字型”。
“新华拼音输入法”要扩大影响,就要极力宣传自己的优势,继续改进自身的功能。
吸取其它输入法的优点,不应当被视为“侵权行为”“侵犯专利权”,否则科学技术怎么能快速进步?
②拼音输入法也有“侵权行为”的问题吗?
我一直想写一篇各种拼音输入法的评介的文章,我是比较推宠新华拼音的,但因事多不能完成。
请问王先生,“新华拼音输入法”要扩大影响,就要极力宣传自己的优势,继续改进自身的功能。吸取其它输入法的优点,不应当被视为“侵权行为”“侵犯专利权”,否则科学技术怎么能快速进步?”这两句话是什么意思,我从来不曾想过,拼音输入法也有什么“侵权行为”“侵犯专利权”的问题吗?
很久不见王先生了,不知在研究什么题目?
③关于各种拼音输入法的评介文章,我一定喜欢
我一直想写一篇各种拼音输入法的评介的文章,我是比较推宠新华拼音的,但因事多不能完成。
希望早日问世。
请问王先生,“新华拼音输入法”要扩大影响,就要极力宣传自己的优势,继续改进自身的功能。
我是说,要在竞争中发展,自身的完善是永无止境的。
吸取其它输入法的优点,不应当被视为“侵权行为”“侵犯专利权”,否则科学技术怎么能快速进步?”
发明输入法,都申请了专利。发明拼音输入法(音码)是不是也要申请专利?拼音输入法中有许多功能是“雷同”的,那是谁的专利?我反对固步自封,反对把社会公理的东西窃为窃为己有。动不动就起诉别人“侵权”,谋取私利。
很久不见王先生了,不知在研究什么题目?
没有新的题目。只是我的话说得山穷水尽了。修整一下,三五天才来看看论坛。
④请徐孟罗先生点评天码方案
看过徐孟罗先生一系列关于双拼的文章,感慨深深,徐先生在双拼的研究,造诣深邃, 令我敬佩。
不知徐先生在这方面研究多少年了?徐先生对新华拼音的分析,鞭辟入里,非常深刻;为了进一步完善天码,请徐先生点评天码方案,望不吝指教。
顺便说一点,我也在这方面研究,双拼的设计理念是中国的传统思想,早期的著名的中国人的拼音方案都是双拼方案; 相反,外国人的方案都是全拼方案,
我已经考证汉语拼音方案的主要设计理念是由英国人thomas 提出的。这个方案很有影响,语委会最后通过的汉语拼音方案是建立在魏托码拼写(1867年)基础之上的。汉语拼音方案与其80%相同,只有稍许改动。
⑤答Thomas先生
看了Thomas先生的帖子,让我不胜惶恐,谢谢您对我的信任和鼓励。我很愿意回答您的第二个问题。我学电脑的时间很短,是从2002年7月17日开始学的,至今约一年半的时间。除了本职工作之外,这期间的业余时间主要是学习Word等基本的办公软件。2003年春节假期期间开始研究双拼编码和特殊符号编码问题。
我的本职工作是地质科研,对于电脑是门外汉,完全不懂编程这一类东西。因此,我更多地是站在用户的立场上说话,我的文章中所涉及的内容也大都局限于基础研究领域。我像一个站在政府办公大楼门前的一个请愿者,我手中的标语上写着:“我想要一个更好的输入法”!您、戴石麟先生、新华拼音、紫光都是我心目中的政府机关。无知者无畏。因为不懂,所以不怕文章中出笑话,若有网友指出我的谬误之处,我会非常感激。
至于天码方案,之所以不敢贸然评价,是由于缺乏基本的了解,比如安、万、严三个音节如何毫无冲突地输入我就没弄明白。今天刚上过您的网站,发现天码已经是一套很完整的理论体系。事实上,写《简析新华拼音》一文之前,我用了整整一个星期的时间试用和体味新华拼音;《文字码》的文档我也花了很长时间,反复看了很多次之后才弄懂了拼音部分的内容;其形码部分和自然码、拼音之星的谭码类似,由于出差前未下载文字码软件,无法试用,故至今仍有许多问题不明白,只是感觉其形码的编码理论更系统或更严谨。
在此谨请Thomas先生谅解。谢谢!
2003-12-28

 

0

阅读 评论 收藏 转载 喜欢 打印举报
  • 评论加载中,请稍候...
发评论

    发评论

    以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

      

    新浪BLOG意见反馈留言板 不良信息反馈 电话:4006900000 提示音后按1键(按当地市话标准计费) 欢迎批评指正

    新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

    新浪公司 版权所有