“数字人文”视野中的目录之学 ——以中国现代、当代文学目录为讨论对象
来源:《澳门文献信息学刊》 | 王贺 2020年03月26日09:19
2019年3月19日,拙文《目录学向何处去》在《上海书评》发表。发表后,许多师长、朋友慷慨提供了不少意见、建议。这些精彩的意见、建议,约略可归纳为二方面:一是针对此文具体所论《新月》目录、索引及复旦大学分校中文系资料室编印《〈新月〉目录索引》而补充、提示新的研究资料和研究线索、来源。这些补充和提示,不可谓不重要,因学术研究的任务之一,乃是向读者提供新的、尽可能准确的知识。不过,由于我尚未完全掌握这些新的资料和采访对象等,目前无法作出进一步的、全面的补充与修正。二是因此而生发出的,关于现时代目录学之意义、价值如何认识,中西目录学学术传统如何评估等等相关问题的讨论。这些问题,拙论其实并未充分展开,其间寥寥数语,似亦不免理有未周、意犹未尽,故此再作若干分析、解释,以免谬种流传而不自度,且以售其欺者耳。
拙文尝谓:“在互联网搜索引擎和数据库出现之后,绝大多数目录、索引的工作都已被自动生成的检索结果和在线‘机读目录’等形式取代。作为专门之学的传统的目录学(这是就其狭义而言的,并非是指‘辨章学术、考镜源流’的广义的目录学),固然在古籍整理、研究中不断发展,但面对《新月》在内的近现代文献,面对新的学术与知识生态,已在很大程度上丧失了实用性、当代性,而使自身成果成为了资料室、图书馆中的‘遗迹’,乏人问津;面对当代浩瀚无边、旋起旋灭的网络文献,更使人感到任何人力编制一目录、索引的徒劳、无力。”
又称:“如果说目录的历史漫长而悠远,那么,索引自诞生之日起,堪称知识分类生产的新工具,被发明用于加工、利用原始文献资料。作为‘二次文献’的索引,极大地提高了知识生产的效率,促进了知识的积累、学术的发展,拓展了人类思维的疆界,将其誉之为全球知识史、文明史上的一大革命,也毫不夸张,但如今美人迟暮、英雄难有用武之地,其前路何在,不得不引人深长思之。”
凡此种种,似乎给读者留下了我竭力否定目录学的实际功能、价值的印象。事实上,学界对目录、索引类著作的一般性批评,并非始自拙文,而前辈学人虽未有专门撰文,但在其具体批评中仍涉及到此类工作的一些根本问题,如周一良在自藏《世说新语引得(附刘注引书引得)》(系洪业主持之哈佛燕京“引得编纂处校订”之《引得》第12号,于1933年5月由“哈佛燕京学社”出版)一书即有如此批语: “世说一书不可解处太多,此引得仅就可解项目编制,不可解者仍付缺如,为用殊狭耳。” “刘注只有引书引得,亦为美中不足。”虽寥寥数语,却点出了索引编制的内在缺陷。更何况作为一种发展趋势,目录学在互联网、数据库时代遭遇了严重挑战,其所面临的危机是无可否认、毋庸置疑的,不过,正如我在另一论及校勘学研究方法的短札中所言,这并不意味着其已沦落到人人可哂、殆无足观的地步,相关的工作也已不可被视作严肃的学术工作,相反,仍存在着不少有待今人深入思考、努力开拓的空间。校勘学如此,其他的传统文献学的分支领域,何尝不是如此?
(一)目录、索引在现时代之意义及其功用
首先,有必要强调的是,对于任一迄未建立数据库的文献资料,目录、索引仍有其存在价值。例如,1951年9月24日,前苏联作家爱伦堡、智利诗人聂鲁达等作为“世界和平理事会”、“加强国际和平”斯大林国际奖金委员会代表访问上海。到沪当日下午,即参观虹口区大陆新村鲁迅故居、鲁迅纪念馆,并与陪同的丁玲、周而复等人合影留念。参观结束后,爱伦堡夫妇、聂鲁达夫妇在该馆纪念册上题词,中云: “鲁迅虽然没有看到新时代的新事物,但他是培养新时代新事物的人!”之后,爱伦堡夫妇由陈虞松等陪同参观了新华印刷厂,聂鲁达夫妇由黄华等陪同参观了水生生物研究所。当晚还一道出席了由中华人民保卫世界和平反对美国侵略委员会华东总分会暨上海市分会、中苏友好协会上海分会、中华全国总工会华东办事处、上海总工会、上海市民主妇女联合会、上海市文学艺术界联合会等多个团体联合举办的招待晚宴。唐弢为此还在《解放日报》发表杂文《新的鼓舞》,对二人到访上海表示热烈欢迎,讴歌来之不易的国际友谊,表达对世界和平的期许。
然而,关于此一史事,透过“读秀学术搜索”“中国知网”“谷歌学术”等各大学术搜索引擎,我们只能查得三条记录。其中之一即来自李万春编《苏联当代文学研究资料索引》的《爱伦堡、聂鲁达参观上海鲁迅纪念馆》。据该书所示,此文原载《文艺新地》1951年第10期,但是,包括《文艺新地》在内的大量当代报刊,几乎很少被建置为数据库,故此我们只得循此线索至图书馆查询原刊,以顺利获得全文。然而,如果没有这一专题索引,我们焉能看到这一研究资料?此外,上海《文汇报》1951年9月25日头版也发表了题为《访问人民的新上海 爱伦堡与聂鲁达昨抵沪》的消息,并载有该报记者徐开垒的报道《爱伦堡与聂鲁达访问鲁迅纪念馆》,述之甚详,足供参考。《文汇报》《人民日报》《光明日报》等大报,尽管早已建成各自的数据库或光盘版全文检索系统,但或需要图书馆采购,或需要购买、安装光盘才能使用,且未能进入各大学术搜索引擎,因此较难为学者所利用,而三十多年前问世的《苏联当代文学研究资料索引》,在此正体现出它不衰的价值。
在许多学者和读书人的认识、想象中,越是古老的文献越不容易找到,似已是一定论,若欲查找当代文献,又何愁之有?但以上的实例就告诉我们,诸如《文艺新地》等等当代文献,仍需要我们为之建立专题目录、索引;而当代文献的大宗——网络文献,更以其生命周期短、每天以高速度增长、传输介质的不稳定性等等原因,导致其难以有效保存,致使后之来者难以利用。与此相比,既有的“互联网档案馆”(Internet Archive)等旨在定期收录、永久保存全球网页的网站、项目所取得的成就,则显得微不足道。也正因为我们长期以来崇古而卑今的文献意识(刻板印象?)作祟,学界中人每每语及当代文献,虽不必弃之如敝屣,但谈到其搜集、保存及整理工作,恐怕很难不表示不置可否的态度;而不重视阅读、利用专题目录、研究资料索引等书的结果,便是坊间流行的一些关于“爱伦堡在中国”“聂鲁达与中国”的研究,在一定程度上失去了基础资料的支撑,从而无法进行起码的史实重建,更无论就相关问题进行分析、解释与论证,当然也很难构成坚实、有效的学术积累,何其憾也。
(二)图书馆在线“机读目录”等目录之局限
其次,面对图书馆的在线“机读目录”(MARC)或藉由搜索引擎和数据库自动生成的条列式检索结果,我们固然有充足的理由为之额手称庆,但也同时必须承认其有限性。例如,2007年3月8日,意大利作家、学者翁贝托·埃科(一译艾柯)结束北京之行,莅临上海,次日在上海书城参加其新作《波多里诺》中译本发布活动。与其1993年首次访华、在北京大学发表《独角兽与龙》的学术演讲不同,这次埃柯还接受了许多新闻媒体的采访,也与普通读者有较多交流机会。其中,发表于同年3月15日《南方周末》的专访,不仅有两个专版,而且思想、内容深刻,问世后引发不少关注。通过搜索引擎,我们可以清楚地掌握这一专访的基本信息,甚至知道这一专访的超链接地址,指向该报官方网站的某一页面,但是,当我们试图重新访问时,却发现该地址已经失效。实际上,在该报官方网站和其他种种来源上,都完全查找不到这一专访的内容,最后仍只能到图书馆中去查检原报。
复旦大学图书馆联机目录中的《南方周末》
一旦我们想要进入图书馆查检原报,就必须通过查询图书馆在线“机读目录”、确认其是否已纳入馆藏这一程序。但是,正如我们所知,在图书馆“机读目录”中,一份报纸无论发行时间多长、总数有多少张、合订本有多少册,一般可能只有一个条目。在这一条目之下,除题目、著者等一般著录的字段,也还罗列有馆方依其发行年限或其他标准加工而成的各个合订本的所谓“详细书目记录”,但很明显,这仍然无法深入我们所需要的具体的某篇文献。试想,假如没有之前获得的具体的发表时间等等信息,如何查找这篇专访资料?无异于大海捞针。然而,这一切,恰是专门的目录、索引可以派上用场的地方。不仅如此,正如北京大学中古史研究中心的史睿兄评论拙文时所指出的:“产生于计算机信息处理技术发展初期的机读目录,早已远远落后于当今信息处理技术发展水平,就知识体系而言不及纸本目录,就直指关键词检索而言不及纸本索引等检索工具书。”而且“目前图书馆的机读目录表面上便于检索,因其完全无序(书目内在意义的顺序),其实是取消了传统目录‘即类求书’功能,更不要说用以‘辨章学术、考镜源流’了。”
这也意味着我们需要更加充分、自觉地认识图书馆“机读目录”的成就与不足。作为图书馆系统编制书目数据所遵循的作业规范和描述、揭示文献信息的国际标准格式,“机读目录”较数千年流行的“卡片目录”,在很多方面的确更胜一筹,其最大的长处即在于利用机器(电脑)识读和处理图书信息,并根据一定的编目规则、格式及编制方法,自动生成书目信息,为读者快速查询、图书分类与书目数据资源的共享奠定了基础,极大地节省了人力、物力和财力,但自其诞生发展至今,亦已暴露出不少局限性,无法满足读者深入单一、个别文献乃至“即类求书”“辨章学术、考镜源流”的需求,正是其一大不足。
另一方面,图书馆“机读目录”中的许多著录项、字段因可由出版机构、图书代理商提供,或与之合作取得(据我所知,近年来,中国大陆许多图书馆的编目业务已由外包公司承担),馆方只待其完成初稿之后,再交由正式的图书编目员稍作校对,便汇入书目系统,但此一整合与共享书目数据之举,究竟是技术革新所取得的进步,还是说明此一工作已渐失其专业水准、门槛,从而化为图书馆学实务之一附庸?如何满足图书馆读者不同层次的“目录”需求,兼顾其对权威与可信数据的需求?如何克服日益增长着的文献(及其信息)与读者“对文献特定需求之间的矛盾”?仍值得思考。
但无论如何,读者都必须面对、利用这一不尽如人意的“机读目录”。史睿兄因此感慨道:“从这个角度说来,当今图书馆读者被机读目录误导,知识管理能力尚不及古人。此今日图书馆极为可悲可哀之事,今之图书馆人‘不暇自哀而后人哀之,后人哀之而不鉴之,亦使后人而复哀后人也’。”更进一步,“需要诘问的是:技术转型真的带来文明提升吗?至少在图书馆目录这件事上我们看到的是,技术转型带来了读者知识管理方式的丧失和知识管理能力的下降。这表明图书馆绝非是几位二五眼的程序员能包打天下的。学者们抗拒‘数字化’,其实根子在此。”
令人忧心的是,无论是在线“机读目录”,还是全文数据库及其相关的“数字人文”研究工具的开发,与中西目录学广阔而丰富的传统似已呈现出相互割裂的状况。这在一定程度上既影响了当代数字学术的进展,也使得目录、索引等主流学术形式蒙尘,仿佛从此走向凋零。哈佛大学费正清中国研究中心的徐力恒兄阅毕拙文后,还检讨道,近些年“数字人文”工具的开发,似并未充分参照、总结目录学的传统和源流,从中获得宝贵的经验和启示;图书馆学界与文献学界、文史研究者各自为政,疏于交通,或系造成此一现况的重要原因。力恒兄参加过中国历代人物传记资料库(CBDB)的建置工作,对文史数据库的开发、利用情况相当熟悉,其高见应予重视;至于如何消除学科、专业壁垒,促进不同领域的交流、沟通,使不同学术成果之间交相辉映、启迪,文献学与“数字人文”深度融合,确属目前及未来相当长一段时间内亟待解决的问题。
(三)作为研究工具的目录之学
再次,自“上世纪九十年代以来,文献学和实证主义史学影响下的现代文学研究虽已取得不俗成绩,但仍有许多人认为,文献学和一般的现代文学研究关系不大,而与古代文学、经学、历史研究更为相关,或者说,一个合格的现代文学研究者,只要学会利用文献史料及相关研究成果即可,并不必接受文献学的训练,当然,从事自己的研究也不必自文献学开始。” 而一般研究历史的学者,对目录之学等中西传统学问,似亦不觉其重要,因即便不习得、利用此类研究工具,照样无碍于援笔作文、立论陈词。但事实是否如此?
目录和索引的核心,就是依照一定标准,将文献资料进行排序、分类组织、整理。其产出的成果,也就是我们一般所谓的目录、索引,为读者查检某一领域、主题的资料提供方便。但在同时,它也完全可作为一种研究工具被使用,不仅可以产出相应的研究成果,也构成了我们展开新的研究的基础。因为专题目录和索引,既可以有效地呈现出其所属的一个小的领域、小的主题的结构与框架,也能使得其中一些研究不足的更小的领域、主题重新被照亮、被发现,从而有了引起研究者重新研究的可能,更重要的是,这一工作还有利于研究者系统、深入地汲取既有研究成果,避免了因资料丰富、不知分门别类而使自己的思考、研究陷入薄物细故不辨、牛溲马勃并陈之窘境。
《〈新月〉目录索引》
不过,为了讨论的方便,这里仍不妨举一个与《新月》杂志有关的资料(包含专书、报刊文献等等)编目的例子。但首先必须声明的是,这个目录只是我自己一时所拟,只是一方便法门,实际情形一定要较此复杂得多,当然也需要被不断地进行完善、修改:
在实际使用过程中,我们还可以为这个目录的每一方面添加研究资料的重要信息,甚且借助Zotero等软件实现编目需要(类似的软件可以同时将我们研究资料的电子版,导入这一目录,以便参阅、引用),帮助我们建立对这一研究领域及其所属子领域的基本判断。待其初步建成之时,我们不仅应能对《新月》研究的进程、现况了然于胸,而且将会对此一领域的研究前景有所洞察,更重要的是,它能够帮助我们对自己的研究作一清晰、准确的定位,亦即个人的研究将在什么方面作出何种贡献,还有什么问题、薄弱环节仍待补足,诸如此类问题也都将会有相当的自觉。
也因此,按照罗伯特·达恩顿袭自狄德罗的观察,这种乍看似“目录”、分类整理知识的框架的建立,实际上无异于培植下一棵有机的、“记叙‘人类知识的秩序与连贯’”、枝繁叶茂的“知识树”。对于任一专业研究者而言,势必都要经年累月、持续追踪一个或几个研究领域的进展,但如果其研究工作由目录之学开始,由“知识树”的培植开始,随着新的研究成果和资料的不断加入,这个“知识树”也将不断成长,从而呈现出知识的系统性、专业性与重要性;细致、耐心地观察同一个树枝下不同果实的差异,或者,对同一个果实,利用新的研究工具,转换观察、诠释的视点,也一定会激发学者新的思考,带来新的发现 。
对于研究《新月》杂志、“新月派”而言,这一“知识树”必将发挥巨大的作用。学者若能在研究的过程中,可以时时返顾、浇灌此一“知识树”,其《新月》及相关研究的整体格局、问题意识势必不以个案的讨论、史实的考证、单一文本的解读而削弱,相反,尽可以小大由之,使细节、个案在与整体的无尽对话中,提出并完成一个又一个的研究甚至新的理论论述,从而切实推动这一领域的深入。
文学研究之外的例子也在所多见。如所周知,近代史学“二陈”(陈寅恪、陈垣)凡所研究,几乎都从编定资料目录、索引开始,尤其陈垣更是如此。所作《文津阁本元六十家文集目录》《中国佛教史籍概况》《明末清初教士译著现存书目》《四库全书书目考异》《四库全书撰人目录》诸书,今人或不免视之为研究“副产品”,实多为其从事元史、佛教史、近代中西文化交通史等等研究工作之前,所作另一准备工作,它们本身也自有作为著述的独特价值。
至此,可以肯定地说,在学术研究中,若能重视研究资料的排序、分类组织整理,“观察所得需要加以筛选” ,积极编制专题目录和索引,将会给我们的研究工作带来很多帮助,直接推动学术研究的深入。这也就是我所理解的目录之学作为研究工具、“致用之学”的意义。
(四)超越“检索” 走向“阅读”
最后,依我个人有限的经验,阅读纸质图书(包括纸质的专题目录、索引)与专门查检资料而后狼吞虎咽、罗织为文,似仍为二途。更准确地说,由于学术专业化程度的不断加深、国际高等教育市场与大学体系的激烈竞争,制度性的学术生产且“根据研究的问题进行检索,以问题的探索为导向进行阅读”渐已成为主流,但“按照目录的方式,将某一主题的文献逐一阅读”仍然十分重要。
1926年上海扫叶山房版《书目答问》
陈寅恪、吕思勉、严耕望、罗尔纲等杰出的近代学人,亦曾不约而同地分别此二者,强调读书而非查检资料,方为治学之正途。但“读书宜有门径”,以故近人张之洞教导门生弟子,须拜《四库全书总目提要》此一目录学著作为师:“泛滥无归,终身无得。得门而入,事半功倍。或经,或史,或词章,或经济,或天算地舆,经治何经?史治何史?经济是何条?因类以求,各有专注。至于经注,孰为师授之古学?孰为无本之俗学?史传孰为有法?孰为失体?孰为详密?孰为疏舛?词章孰为正宗?孰为旁门?尤宜抉择分析,方不致误用聪明。此事宜有师承。然师岂易得?书即师也。今为诸生指一良师,将《四库全书总目提要》一过,即略知学术门径矣。”不仅如此,张氏还撰有《輶轩语》《书目答问》等,金针度人。
也就是说,对于许多杰出的学者而言,目录、索引、提要、叙录等等,并非工具之书,而只有偶一查检之用,反之,恰是通读、研读的对象。以近现代文史研究为例,由于时间、精力及其他条件有限,我们终其一生,都无法通读(也许也并无必要通读)全部的近现代报刊、作家学者文集和全集,但至少可以做到通读诸多期刊、报纸的目录和索引(假如有的话),循此再进入原刊、原典的阅读与思考,必将事半功倍。另一方面,如果能在选择性地阅读原刊、原典之后,再将有关的目录和索引通读一过,则我们收获了感受、印象、资料、线索的同时,也不致失去整体观,从而避免了“碎片化”“捡到篮里都是菜”甚或入宝山而空手回的情况。在此意义上,不仅清人王鸣盛所谓的:“目录之学,学中第一紧要事,必从此问途,方能得其门而入,然此事非苦学精究,质之良师,未易明也 。” “凡读书最切要者目录之学,目录明方可读书,不明终是乱读。”数语仍适用,且《〈新月〉目录索引》等近现代文献的目录、索引,亦不因数据库中有其目录甚至全文检索功能而黯然失色,反之,仍待有心人反复打磨、完善,推出一个定本,供读者阅读、参考。
1931年南京国学图书馆版《书目答问补正》
至于拙文所谓目录学丧失的实用性、当代性,当然也应该加一必要的限定,此即其主要针对着那些完全依赖互联网、数据库做其所谓“学问”的学者(互联网民族志学者等或是例外)。我们不应该忽视的是,还有很多学人,仍切盼着一个时常可以关闭电脑、远离网络的世界,无数个可以潜心研读、圈点、勾画、校阅,与书籍及作者思接千载、心游万仞的时刻,而非深陷于“论文机器”“学院动物”状态不能自拔。这种阅读、思考的状态,有时呈现为“按照目录的方式,将某一主题的文献逐一阅读”,有时则纯粹代表了第三种阅读方式——漫无目的的阅读(desultory reading),而后者的存在,在在提醒我们,不妨享受“非职业阅读”、沉思、奇思妙想的乐趣。按照亚里士多德、培根、夏目漱石、鲁迅等人的理论,学术研究也好,艺文创作也罢,本来就是闲暇、余裕的结果,而闲暇“是一种精神的现象”“一种灵魂的状态”“强调一种内在的无所忧虑,一种平静,一种沉默,一种顺其自然的无为状态”今天,“硬写”“硬译”“硬评”如火得风而炎炽,几有遮天蔽日之势,但在我看来,有志的学者仍不能轻易向此流俗缴械投降,降低自己阅读、思考、研究和写作的难度。
(五)朝向新的目录之学
一言以蔽之,除非人类的全部书刊资料都已经被充分的电子化、数字化,且可长期、有效存储,开放给读者访问、使用,否则,目录学的重要性容或下降,但其意义、价值,绝不可能被取消而致沦亡。从中西学术传统来看,自其发端至今,目录学的意义、价值,都和我们阅读、研究的实际需要——查找、利用文献资料——联系在一起。因为无论是作为二次文献的主流形式,还是知识管理、知识工程的重要内容,目录、索引不仅与此一实际需求密切相关,也构成了我们走向文献、获得知识的必经之路(尽管现时代的途径已更加多元)。这一实际需要同时决定了图书馆、资料室等机构的核心功能,即在于存藏文献资料。换句话说,在任何时代、境况中,图书馆、资料室的发展皆须将此一需求置于优先地位,而非其他。更何况,我们即便拥有海量的数据库,它也并不是万能的,它的问题之多,绝不亚于纸质文献史料。
在当下,无论在中国内地,还是全世界的其他国家和地区,图书馆等搜集、整理、收藏文献资料以供人阅览、参考之馆所,朝向电子化、数字化、“智能化”的大势,已然浩浩汤汤、一望无涯。置身于此一新的时代潮流之中,或许更有必要强调的是,包括图书馆在线“机读目录”或藉由搜索引擎和数据库自动生成的检索目录(甚至个性化的目录定制推送服务)等等新的知识管理成就,乃至其他五花八门的知识工程、服务等等的发展,并不应该以摒弃、弱化存藏文献资料此一核心功能作为代价。如果我们无视这一读者的实际功能/需求,昧于中西目录学及文献学传统的守正创新,而完全依赖于信息技术的革命,甚或认为透过“人工智能”等新技术和“大数据”分析,即可拯救世界、包打天下、解决文明遗产保护和传承的所有问题,或恐不免舍本逐末、自毁长城之虞。
对于目录之学来说,今天更应该在近代学者奠定的良好基础之上追求更大的发展,而不只是停留在目录学史研究这一方面止步不前。近人余嘉锡尝言: “吾国学术,素乏系统,且不注意于工具之述作,各家类然,而以目录为尤甚。故自来有目录之学,有目录之书,而无治目录学之书。”但自其讲论目录学至今,中国目录之学的轮廓已大致建立,近代意义上的目录学研究成果极为丰硕,可以说,我们所有人都受惠于这一学术遗产。也因此,尽管目录学在今天面临着重重挑战和危机,但重温前人这些拓荒性、奠基性的论述,窃以为,我们同样也应该有勇气、有责任,从危机、挑战中为其寻找意义,创造新的发展方向和可能。就此而言,无论是对“数字目录学”等新目录学的理论建构,还是在实操中改进现有的各式编目与检索系统,探索“数字人文”时代的书目控制之道,乃至对近现代目录学进行全面、深入之勘探,皆属新一代学者责无旁贷的使命。