加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

〇九五笔——指间挥洒的惬意,词组重码之天敌

(2010-04-11 11:47:11)
标签:

杂谈

内容摘要:
本文为不同五笔编码方案间的词组重码率静态测试及评析。

涉及输入法:
一、86五笔;
二、09五笔第一代第056版(以下简称091e056);
三、09五笔第二代第230版(以下简称092e230)。

涉及词库:
北语大学高频
  本词库20000词条,根据北语大材料整理得出。

测试结果:
北语大学高频总词条数:20000)
86五笔编码行数    17553 非首选词条数  2447 重码率:12.23% 
091e056编码行数 18584 非首选词条数  1416 重码率: 7.08% 
092e230编码行数 18798 非首选词条数  1202 重码率: 6.01% 
结论1:091e056方案的词组重码率相当于86五笔的57.89%
结论2:092e230方案的词组重码率相当于86五笔的49.14%
备注:以上重码率的计算公式均采用:重码率=非首选词条数/总词条数。所采用的092e230并非09速记最终版本,最终版本的词组重码将可以达到86五笔的30%以下。

结语:
  即使09五笔直接挂接86五笔海峰词库,也没有问题,那些词组重码就算不是一扫而光至少也是伤亡惨重。甚至可以这样讲,就算09五笔里面的重码词组排序都是倒序的(低频词在前,高频词在后),也不会比完美排序(高频词在前,低频词在后)后的86五笔需要更多的选重码动作。
  在打字爱好者的练习和切磋中,我们也常常遇到这样的86五笔用户或其他输入法用户:他们也像09五笔一样加载了和词条数有6万或6万以上的大词库,他们也像09五笔一样开启了输入法提供的三重一二级简码功能,他们有时还会启用简码词组和自动造词功能——但即使是使用了这样多的减少码长的手段,他们的码长仍然要比09五笔用户长出明显一截。这样的结果让很多人奇怪,为什么词库规模差不多、简码数目也差不多、也都有简码词,但输入法的效率就是没有09五笔高呢?这个问题的答案就蕴藏于上面进行的几组重码率测试之中。

  这个问题的答案也即:09五笔的词组重码率之低,已经到了25键编码方案的极致。09五笔第一代的动态选词率不及86五笔的1/2,而09五笔第二代的动态选词率更低一筹(动态选词率指的是每若干字文章的选词次数。例如,如果在1000字文章中86五笔需要选10次,那么09五笔第二代差不多就只需要选4次)。这个特点可以让用户打词组时
高枕无忧、尽情挥洒。09五笔用户打词组的时候再不需要像用其他输入法时那样克制,因为他就算什么重码都不选,最终的错误也非常少。这个因果链可以表示如下:
      重码公理:所有词组重码过多的输入法,其高重码率
          的症结都在于字根布局的不合理。

                 ↓
      09五笔精巧的字根布局,将词组重码消灭于萌芽状态。
  
               ↓
   
      09五笔中,常用词组恰好都不重码,极少例外。
   
              ↓
 
     09五笔加载大型词库时的重码率远低于其他的输入法。
                 ↓
 
       09五笔可以在不降低输入法效能的情况
 
          轻松加载大词库乃至超大词库。
                 ↓
  
      09五笔可以良好地支持用户可以在打文章
   
         时近乎漫无节制地打词组。
                 ↓
    
       09五笔用户不需要狠敲键盘,
   
    他们可以用很低的击键速度创造很高的录入速度,
   可以轻松避免其他输入法难以避免的低效率、高重码、高选词、高退格。
  以上所示,就是09五笔降低码长、提高输入法效率的主要逻辑。09五笔即使加载一个未经刻意删除重码的六七万的大词库,其选词率也低于绝大多数中小规模的86五笔词库或其他输入法词库。
  另外需要提到的是,09五笔确实一直倡导用户以词组录入为主,但由于自然词组重码率上的客观差异,这个倡议显然是不适合照搬到其他输入法上面的。也同样是自然词组重码率这个原因,导致了其他一些形式上看起来与09五笔类似的输入法在实际使用效率上和09五笔差别较大。
  因此,这里再次提醒其他输入法用户不要被《09五笔第一代打字实录》一文误导。请勿盲目模仿,只有09五笔这样的先天上自然词组重码率
极低、且拥有完备的大型词库的输入法,才可以像这样以有词必打而基本无须考虑空打或重码的方式录入文章。而别的较高自然词组重码率的输入法,又或者词库收词时缺斤少两的输入法,其使用者若想提速,必须老老实实地加倍苦练单字录入技巧。

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有