扉页机器
资源共享在多、好、省以外,还要快。决定快的因素有二:找书的速度,和运输的速度。运输事业外的事情。图书馆没有很大直接的影响。找书可是图书馆的专长。在20世纪,图书馆界大部分的人力和物力,都花在找书上。茫茫梦海,梦在何处。书目控制就是20世纪卓越的寻梦工具。
美国图书馆学对世界,包括对中国、日本与韩国,有很深远的影响。20世纪在东亚地区成立的图书馆专业学校,包括日本的庆应、韩国的梨花、中国的北京和武汉等大学的图书馆院系,都跟美国图书馆业教育有莫大的渊源。然而,资源共享这理念,直到今天,没有在东亚图书馆界生根。能得到东亚图书馆界几乎全盘接受的,是书目控制的技术与标准
一百多年来,美国的书目控制能独步天下,主要是得力于两台机器、一张卡片和一套罗马-亚拉伯数目字符。第一台机器是十九世纪末叶发明的打字机。一台小小的桌上机器,能快捷地打印出美观的卡片。改进了手写记录的迟钝。第二台机器是20世纪中期发明的电脑。电脑把检索带到了电快的佳境。第三个元素是卡片。三寸乘五寸的面积虽然限定了书目的有限内容与生硬的格式,但是成本偏低,效率偏高。直到马克目录登场,卡片才销声匿迹。马克目录并没有突破内容与格式的限制,还是继承了卡片的基本设计。但能配上计算机,检索快捷。第四个元素是罗马-数目字符。因为打字机与早期电脑字符集都收到英美式键盘的限制,缺点是只能使用罗马-数目字符作为排检、排架的代码, 优点是易学易用。这四样工具都受到全世界的普遍接受。在非英美语、文地区,包括中国,不但对图书馆业,甚至对当地的语言文化也产生了各有不同的影响。
19世纪到20世纪中叶,从杜威十进分类法开始,以致卡片,编目法,索书号,主题词表,开架藏书,参见档等美国产品。世界图书馆业若不是整套进口,也会忠实模仿。接受美国,尤其是国会图书馆,为世界图书馆业的龙头老大
打字机和卡片把美国图书馆带进20世纪。编目员把扉页上的资讯 录到卡片上。加上索引配套,把卡片根据非常细致的规则,排列到抽屉中,每张卡片各就各位,井井有条,组成一条冗长的检索线条。读者只要学好排卡的规则,检索就可以准确。在当年卡片时代,图书馆每个部门,采购部也好,编目部也好,都有一套书目卡片。日常操作,从采购,编目,参考,到流通。图书馆的工作人员都得围绕在不同部门的书目卡片柜旁边操作。
1970年代,检索由卡片柜转型到电脑化,有了电脑以后,图书馆建立书目档,就不用维护多套卡片。只要维护一套机读目录。图书馆内外的职工和读者都可以共同使用一套目录,全图书馆的书目一致。维护书目档的工作量减低了十之七八,检索速度加快了千万倍。工作效率提高了。无怪在国会图书馆发明的马克目录面世以后,很快就风行全球,连在当时反美情绪高涨的中国,刘国钧也力排众议,提倡采用。美国的书目网络和集成图书系统,也就成为全球时尚。
风靡世界的书目控制是美国图书馆的骨干工具。用处很大。可惜检索范围不大。只能检索扉页上的信息。编目员从扉页上抄下数据为主要检索内容。要找书,先得找到扉页。图书馆花上大部分的预算去编目,排卡,和排架,就是要构成一个“扉页机器”去找扉页。没有扉页的东西,比如是唱片,照片,图像等资讯载体。都得加上类似扉页的数据才能编目处理。图书馆除了用扉页或是类似扉页的数据,是没有任何更好别的办法使用卡片或机读目录去寻找馆藏的。
除了扉页的限制,美国书目系统也受字符种类与数量的限制。只能检索打字机键盘上有的字符。美国的打字机和早期的电脑只能处理罗马字符、亚拉伯数字与几十个其他符号。不能处理东亚字符,甚至不能处理很多欧洲语系的字符。但是由于键盘字符数目有限,次序分明,简单明了,易学易打。用作卡片排检,书本排架的工具,比用任何其他字符集都优越。用于英语,固然行之有素,遇上别的语种,也不妨削足适履,。冒上失真的大不韪把其他字符音译后,用罗马字符做音符,代替了原文后打印排检,美国如此,中国如此,很多其他国家也如此。罗马字符在图书馆各种操作中广泛使用多年后,在书目记录中,成为所有非英文字符的替身。得到大部分读者与图书馆员工的接受与认同。甚至得到一部分人的热爱。
爱恨与否,把字符拼音化会引起失真效果的。一部分原文的含义,会跟随原文的消失而消失。幸而,电脑内存(RAM)量增加以后,处理多种文字已经不是个严重的问题。
20世纪末期。有过不少改进扉页功能的尝试与实施。比较出色的有世界图联(International Federation of Libraries and Institutions IFLA)带领从1961年开始到1997年定案的长期研究“书目纪录实用标准”(Functional Requirements for Bibliographic Records FRBR http://www.ifla.org/VII/s13/frbr/frbr.pdf )。与经过数年酝酿,在2003成立的德美合作项目:虚拟国际权威档(Virtual International Authority File, VIAF http://www.loc.gov/library/libarch-news-viaf.html )这些项目多有创见。前者从作者创意,写作,到出版而成“件”的过程有详尽的分析。后者把权威档带进多文种的国际范畴。由于参与这两项国际工作的队伍中有美国图书馆界要员。将来在美国图书馆业会有一定的影响。但是两者都没有跳出扉页的框框。
现在已经崭露头角的XML(Extensible Markup Language http://www.w3.org/TR/REC-xml )是一个已经得到广泛接受的国际标准网络的语言,其基本字符集是Unicode,容易处理多文种。其标签格式灵活,。可以索引扉页、书本内容与非书载体讯息。是类似书目格式而又能在万维网上使用。获得图书馆界的好评,是能超出扉页框架的好工具(http://www.ucc.ie:8080/cocoon/xmlfaq#import) 。已经被使用到好些美国的图书馆项目上。
因特网与搜索引擎的出现把扉页框框打破了,搜索引擎不限于扉页。不限于罗马字符。可以在多种文字中作全文检索,格式自由,能处理音像,运算数据,能处理图像以及其他没有扉页的资讯。搜索引擎技术在图书馆传统的扉页系统以外迅速发展。是图书馆界的福音还是威胁?那要看图书馆业者自己的定位。我个人觉得图书馆不是一个软件生产者,软件工业发达并不威胁图书馆,相反,对图书馆业是肯定有利的。声,像,多语种在资讯系统现身。资讯内容日加丰富。采用高科技产品作检索是无可避免的,图书馆已经开始接受这些在图书馆传统系统以外开发的检索系统。既然可以检索扉页以外的资讯做全文检索。检索技术除了字符,还有字码、字音、字义、字形等检索。目前的一些网上搜索引擎,像Google,已经可以在中文的检索条上作繁简互换,同义词通捡。一些在中国开发的专用检索系统,像四库全书,有更多的中文功能。另外现在在美国正在加紧开发的一些商用技术,可以检索指纹和脸孔。在不久的将来,也可以检索声像。都是图书馆业的佳音。
我们只要不把计算程序看成是图书馆业的专有技能,不跟电脑专业在技术上竞争,而在检索理念上寻求合作。前景是美好的。其实,图书馆界也不容易去与搜索引擎公司直接在技术上竞争。举例来说。Yahoo在2003年以20亿美元买下Overture Services 和 Intomi公司来加强本公司的阵容,准备与Google 对抗[3]。Yahoo是美国一家占有全美国四分之一搜索引擎市场的老二。这样的大手笔,只是公司一部分的投资。却相当于一所中上型大学图书馆年度预算的一百倍。要多所图书馆联手筹措这样大的资金也绝不容易。借上面的例子,可以看到美国搜索引擎发展规模巨大的一斑。
不跟私营搜索引擎企业竞争,资金短缺不是主要原因。原因是近代美国图书馆的重要使命是资源共享。检索只是一种手段而已。搜索引擎是一种可以购买或是租用与定制的工具。商业搜索引擎技术的进步,他们同业间彼此的竞争。产品应该比图书馆自制引擎品质更好,成本更低,是图书馆业另一佳音。
检索技术超出扉页,越来越是易学易用。是我对图书馆业乐观理由之三。

加载中…