“古腾堡计划” 藏书现突破四万本,仍有活力
“古腾堡计划” 今天宣布网站收藏的电子书数量超过四万本,作为世界上最早,也是规模最大的数字图书馆,它依然保持着相当的活力。
第四万本书是《Extinct Birds》,由 Walter Rothschild 撰写,内容关于历史上灭绝的鸟类,这本书于 1907 年出版,仅发行了 300 本,书中包含了 45 幅彩图以及 4 幅黑白素描。
古腾堡计划是一个值得长期关注的项目,它的使命是确保公有领域的书籍自由流通、格式开放,有利于长期保存,并可在各种计算机上阅读。
1971 年,Michael S. Hart 偶然间获得了 Xerox Sigma V 大型计算机一个没有时限的账号。后来,这台计算机碰巧成为组成英特网的计算机网络 15 个节点之一。此后,他一直思考如何能够好好利用这份 “馈赠”。
刚好 1971 年 7 月 4 日时,有人将一个仿造羊皮纸的《美国独立宣言》拿给他看时,他头脑中闪过一道光:“如果把这本书打进电脑,它将在英特网上永远不会消失。” 于是,在制作了世界上第一本电子书后,他发起 “古腾堡计划”,鼓励志愿者将公共领域的纸本书籍转变为数字形式的电子书,供全世界的人自由下载,包括《傲慢与偏见》、《理性与感性》、《简爱》、《基督山伯爵》等文学名著,甚至也包含了中国历史名著《红楼梦》、《水浒传》、《三国志》等;形式不但包括文本,还包括音频和录像等多媒体形式。
在当时,为了每台机器都能够顺利阅读电子书,他决定采用 Plain Vanilla ASCII 编码的纯文本文档,作为电子书的载体。
但在互联网和移动设备普及之前,古腾堡计划的发展长期处于缓慢之中。自 1971 年开始到 1989 年,古腾堡计划收录的书籍数量仅为 10 本。一方面是人手缺乏所致,早期的电子书基本由 Hart 一个字一个字在键盘上录入,一个月基本只能收录一本电子书,Hart 一共亲手制作了 313 本电子书;另一方面,早期的互联网用户量少,古腾堡计划的影响力有限。然而,Hart 一直坚信电子书将流行开来,他说 “我等着全世界意识到我把它撞翻了。”
1993 年,多亏 Marc Andreessen,发明世界上第一个现代浏览器 Mosaic,人们开始通过网页来接触新资讯,互联网迎来第一次爆发;之后 10 年,惠普、戴尔等 PC 制造商的竞争令个人电脑的价格越来越便宜,最终成为大众化的产品。而网络也随着个人电脑的普及,逐渐成为主流。
古腾堡计划的发展,和互联网发展的速度成正比的关系。根据 Marie Lebert 所整理的古腾堡计划的历史:
- 1994 年古腾堡计划平均每月收录 8 本书;
- 1995 为 16 本;
- 1996 为 32 本;
- 1998 年到 2000 为 36 本;
由于互联网的互通性,令人们跨地域、大规模的协作成为可能,这令古腾堡计划收录书籍的速度进一步得到提高。2000 年 10 月,Charles Franks 启动 “Shared Proofreading”,志愿者可以通过扫描仪,将书本变为图片,储存到电脑中,然后通过 OCR 文件将图片中的文字转为文本,经过校对后发布到网络上。古腾堡计划一般推荐每名志愿者每天能够发布一页,虽然大多数志愿者速度比较缓慢,但因为有 100 名志愿者帮忙,总体的速度还是大为提高。
结果 2001 年,古腾堡计划平均每月收录书籍的数量增长到 104 本。之后,古腾堡计划收录书籍的速度有了很大的提高:
- 2002 年,平均每月收录 203 本;
- 2003 年,平均每月收录 348 本;
- 2004 年,平均每月收录 338 本;
- 2005 年,平均每月收录 252 本;
- 2006 年,平均每月收录 345 本;
- 2007 年,平均每月收录 338 本。
和 Google Books 不同,古腾堡计划是一个完全公益的项目,而且它所收藏的电子书,均可自由下载和使用,人们可以按照自己的意愿改变电子书的字体、颜色,也可以自由的剪贴粘贴,而且支持全文搜索。说到底,古腾堡计划的电子书赋予读者更加大的自由。这是为何苹果、亚马逊、Google 等大公司在激烈争夺电子书市场的时候,古腾堡计划依然值得关注的原因。
目前古腾堡计划中提供的书籍,也开始支持 EPUB 和 MOBI 等电子书格式,回顾 Hart 流传最广的名言,也许里面描绘的 “电子书自由如空气” 的未来将很快到来:
大多数人没有意识到,电子书有一个特点。它是人类有史以来,制造出来的第一种像空气一样取之不竭的产品。如果你仔细思考这一点,你就会意识到,我们正在做正确的事情。