标签:
杂谈 |
二十二年前,十岁的李旻坐在父亲的自行车后座,欢心雀跃地从县城书店回到家里。车篮里载着属于他的第一本书——1979年缩印版的《辞海》。这本当时售价29.8元,也许相当于父母一半月薪的书,对于还是小学生的李旻来说,不仅意味着不用再留恋于同学家翻阅摘抄自己感兴趣的条目,更意味着愈广阔丰富的知识世界至此敞开。
此刻,窗外淅沥的细雨使偌大的张江校园有些冷清。说到《辞海》,三十二岁的李旻老师微微笑了。回忆,让软件学院办公室变得明亮。
从孩童走向青年
“文革”后,新鲜空气涌来,八十年代是全民阅读、写作的时代。浓厚的读书空气弥漫在社会上,同样也溢满了李旻的家庭。由于父母爱好阅读,家中藏书较多,而那个时代娱乐的东西较少,李旻的童年便沉浸在书香中了。
“家里的藏书情况可能就决定了阅读面。像四大古典小说,中国文化经典,评书,历史类的小说,还有那个年代流行的连环画,我们家都有”,在读小学三、四年级时,李旻已经把家中的书读完了。在江西,不满十六周岁是无法办借书证从图书馆借书的,之后,他只能从朋友家里借阅自己没看过的书籍,比如姚雪垠的小说《李自成》。他笑道“这其实是一种补差的过程”。当时,诸如二十四史之类的古书都很难找到,一般家庭里不会藏,工厂厂房的图书馆也没有这类书,“那个时候尽最大可能,我就找到台湾出版的一套白话《二十四史》,后来又有唐宋八大家选,但是多是选集,很少有看到全的一套的,所以就非常希望看到古书到底是什么样的”。
童年的阅读决定了李旻对历史的热爱。有两部书对他产生了启蒙影响,五、六岁时读的《三国演义》启发了李旻的兴趣,这是四大古典小说中他读得最早的一部;另一套是林汉达等编写的《上下五千年》,这对他构建起一个大致的中国历史框架,了解中国历代王朝的更迭有很大的帮助。而李旻中国地理区域划分方面知识的启蒙,来自他在三四岁时靠亲戚送的一套各省、市、区的地图拼图。中学生李旻对中国古代制度和历史地理沿革方面特别感兴趣,十六岁的他开始到市级图书馆借阅专业性的书籍了。公立图书馆的借期很短,一般只有两个星期,在那个时候,李旻养成了边看边抄习惯。
由于父亲是铸造专业出身的工程师,母亲是学机械的,李旻考大学时也就选择了理科专业。“我的选择相对实用性,兴趣也不能吃饭嘛。”理科大学生李旻,并没有放弃对历史的热爱,他给自己定了一个目标,了解一些东西,并对它进行整理,而且这些整理中有些可能也没有前人做过——“我希望自己可以做这样的事”。于是,大学的时光除了专业以外全都扑进了文史书籍中。
从兴趣走向专业
大学毕业,李旻继续深造,从2003年开始于复旦大学软件学院从教。兴趣和专业的冲突,文科与理科的矛盾是非常明显的,两方面都需要非常大的时间投入。他说,“这些年来我最大的问题是书读的不够,没有把更多的时间投入到日常工作和研究中去。于此,心态就非常重要了,做多少算多少吧。”
作为非专业人士,李旻所接触到的大多是一些校勘本。“但是人都有眼睛,辨得出基本的好坏;而且相对而言,读得多一些,对一些粗浅的错误可以看得出来的。”
计算机专业出身的李旻,与电子书接触的比较早。在大学期间他感觉到,资料的复制非常困难,一般只能用抄录或是复印,即使复印在当时也是很奢侈的手段,而电子书的复制就非常的方便,使人很快获得大量的资料。“电子书一开始就让我觉得这是一个最好的方向”,而且,他名字里的“旻”字可以算是个“半生僻字”,这个字在最早的汉语国标里面是没有的,计算机也无法显示的。他想,“中国古籍中比我名字生僻的字要多得多了,这样的情况会造成中国古书电子化的难题”。为了解决这个问题,他研究起计算机的汉字编码了,对字符集的国际上的研究进展也比较关注,从此,李旻就把兴趣和专业结合起来了。
九十年代随着网络的迅猛发展,他发现网络上可以找到的大量国学电子版资料中存在很多低水平的学术问题,由于传播量大,以讹传讹,流布非常广,影响也坏。于是他萌生了一个想法:创造出一个电子网络平台,让中国的古典文化能够以某种形式的形式固定下来。于是之后,李旻更多的就是在此基础上去做推广或是在别人的基础上做校勘。他找到一些好的已经电子化的资料,通过一些好的本子去对它进行校勘,然后以一种比较集中的方式发表。另外也是以这种方式来鼓励别人对它纠错。
“文科的和理科的思维方式并不完全一样。一些理科的方法应用到文科中去,如果这些方法文科学者从未想到过的话,可能会对文科方法有一些更细致的增补。”于是,李旻把专业所研究的计算机技术与阅读兴趣相汇并创新,在研究本专业学科的同时还继续投入国学领域,收集文本,开展书籍文本电子化,勘校工作。于是,便有了属于他的,今后,也许是社会大众的电子书房。
从油墨走向数据
他收集电子版书籍有两种方向:一种是外文类书籍,主要是和他的专业有关。“计算机的很多书籍都是翻译的,有能力的学生应该直接读原版,我就希望给学生提供一个资源创造条件”。第二种是中文类书籍,在1949年以前出版的纸质书籍,和在网上看到的各种文献和书,他认为,现在复旦图书馆的电子藏书量也很大,但是形式不太好,比如超星,它的书种类很多,但是它的数据读取是实在是很糟糕的一种方式,而且大量的书或者缺页,或者缺文,一本书有多册的,甚而缺本。他还认为,中国古籍库的价值在于有些书以前没有电子化,但是其整体水平并不令人满意,有很多错误,而以抄本为甚。尤不可取的是,基本古籍库并不对外开放修改权限,是一个封闭式的系统。“用我的技术手段,提供一种可以修改的平台”,集众人之力提高电子文本的质量。于是,李旻通过国际统一书号对计算机专业图书进行编目,目前他的电子书籍数据库已经有5000余册了。
在近七、八年的点滴积累中,李旻不断修改软件,目前内容大概有2-3G的纯文本。“这一部分相对来说底本比较好,是台湾中研院制作的,我做了一个转换,已经帮他们补了很多字。他们做得很精细,不会很多家做同一个类似的主题。国内的书籍校勘有一个问题,就是太多出版社做太多版本,没有一个统一规划,以至于又花钱又花人没有一个质量好的。”现在,电子书房的共享方式还有需要考虑之处。一是阅读问题,他希望有更多的人去使用这样一个工具去读书,但同时为了提高这个质量,必须开放一部分的校勘权限,当任何人都有这样一个免费的机会去读,就可能有这样一个动力为了完善其质量去做工作。这样可以很快地汇集资料。但是,如果有人瞎改,就会把有用的信息弄丢,所以这里存在系统准入的问题。二是版权问题,所以目前只能在校内网络上分享。
李旻还展示了书房中的 “数据管理中心”。在他把读的史书中提到的人,以一个统一的方式对它进行编码,在这里不是以人的名字的方式,而是以人的属性的方式去索引,这样能够精确到历史上客观存在的某一个具体的个人,而不是他在历史不同时段、场合下所拥有的不同名称。这种手段实际上对历史研究而言,是一个非常好的办法,数据一旦汇总到一起,就方便研究者发现真实可信的东西,也能以一种直观的方式来阅读人物之间的关系脉络。另外他还制作了一些方便快捷的工具,如中国公历和农历的自动转换的工具等。“这个数据库的量很大,收集的条目已将近有十万条,并且在不断上升”,老师自豪地笑道。
李旻除了收集整理资料,他的研究、校勘工作也卓有成效。
他有一个读书计划,分为两个系列——国内和国外的。国外的书主要以商务汉译名著丛书为主;国内的,以兴趣为主。他常常一边阅读一边做资料整理,还把资料整理给学校正在参加二十五史重修工作、整理唐五代史部分的陈尚君教授看,“陈教授认为这个方法非常的好,也很希望我把这个方法开放给其他人去使用,但是,但是问题在于使用它有一个技术门槛。我过一段时间还要去找陈老师,把通过这样的方法取得的一些成果给陈老师过目一下,一方面取得他的承认,另一方面也是取得这种技术方法的信心。” 在勘校的过程中,他也会存在一些误校:以前可能认为是这样的,但更多的资料出现后,就会发现自己的错误。李旻并不是直接把误校删掉,而是将新的资料放进去,来证明和补足。
文史与理工的矛盾、兴趣与专业的冲突,在对面这个年轻老师这融会贯通。理科生的理性自觉和机智促使着好奇心在历史曲线中探索来龙去脉和机理,这是他阅读的乐趣,沉浸在阅读中的李旻,会顺着新婚妻子轻轻的询问慢慢地答,只是,答非所问。在闲暇时,李旻会活跃在日月光华BBS,发表一些让专业人士注目的文本研究成果,还会拉几曲从小自学的胡琴曲乐。胡琴声悠远,于他,阅读是在计算机虚拟中的书斋里漫步,脚步轻快,脚印厚重。
李旻简介:
1977年4月生,理学博士。先后在上海理工大学、复旦大学读书。2003年开始在软件学院从教,被聘为讲师。从1997年至2000年担任多门计算机各类课程的助教,并主讲C++语言、计算机网络、计算机图形学等课程,承担本科生毕业设计和部分研究生课程指计的指导工作。
文:记者 黄相宜
录音整理:记者 陈诗悦
来源:《复旦青年》