中国社会科学网 | 王贺:从数字人文到机器人人文,我们将失去什么?

发布者:新闻中心发布时间:2020-12-21浏览次数:10

现在也许是讨论数字人文可能面临的问题的时候了。为使讨论进一步聚焦,此处仅以笔者的研究经验为例,先看看一般理解的数字人文究竟是什么。事实上,在近年关于晚清至当代文献的研究之外,笔者一直尝试数字人文与现代文学研究结合的可能,陆续写过一些相关文章,参与了多个数据库的建设(如2018年3月由“学术地图发布平台”网站发布笔者第一部个数字人文作品《曹禺西北之行图》)。许多相熟或素未谋面的朋友,便由此认定数字人文是纸质文献的数字化或关于数字文献史料的研究,其实这是一种误会。

  如果我们可以将1949年起罗伯托·布萨神父(Fr Roberto Busa)与IBM公司合作为托马斯·阿奎那的《神学大全》编制拉丁文词汇索引视为数字人文起源之一的话,那么数字人文的历史至今已有半个多世纪了。其间,数字人文的发展大致经历了三个阶段。第一阶段是纸质文献的数字化;第二阶段是配合相应的平台、工具等,将已经数字化了的文献资料作更进一步的处理,特别是量化分析和可视化技术的运用更加深了这一印象;第三阶段则无疑是人文学术与计算科学、数据科学的深度融合(D.M.Berry:Understanding Digital Humanities,Palgrave Macmillan,2012)。当然,在第一阶段中已潜藏着一种人文学术“计算转向”(computational turn)的趋势,也因此,数字人文早期的术语是“人文计算”(humanities computing),用以强调计算机技术在人文研究中的运用。

  随着互联网技术的迅猛发展,数字或者数据代替纸质文献,成为人文学术生产中越来越重要的资料,同时越来越多的人文学者意识到使用数字技术、方法是为了更好地理解人文学术。因此,数字人文或数据人文等概念相继被提出(如2014年英国著名的布莱克威尔出版公司将其定期出版的《人文计算年鉴》更名为《数据人文》),特别是“Digital Humanities”一语,不胫而走,风靡全球。迄今相关的科系、研究中心,也已在哈佛大学、伦敦大学国王学院等欧美知名高校建立,并提供从本科生到博士生的一整套完整的人才培养方案,数字人文也因此成为一个极具活力的前沿学术领域。正如包弼德教授(Peter K. Bol)在数字人文国际高峰论坛暨上海师范大学数字人文研究中心成立大会上的致辞中所言,数字人文中心不仅是一个研究中心,同时也是一个教学中心,一个学术交流、协作中心。

  数字人文在中国的发展,虽早在十余年前已开始,但直到近一两年才真正成为一种学术潮流、学术时尚,既成为图书馆学、情报学、档案学等学科的“学术热点”,也在文学、史学、文献学、语言学、艺术史研究等不同领域不断引起人们探讨的热情。尽管就其一般性的学术水平而言,中国的数字人文目前可能还处于上述所谈第一、第二阶段,但不出意外,在广阔的数字人文场域中,数字文学、数字史学、数字文献学、计算档案学、计算语言学(语料库语言学)、数字艺术等新的分支领域未来都将取得一定的发展。

  最近人工智能技术的发展及其在全球范围内社会生活各场景中的广泛应用,也引起了批评家们的关注。在一般性的数字人文研究之外,检讨技术、算法带给文学、艺术与日常生活的宰制性和技术霸权,追问机器人是否可以被视作人、是否具有人性及其话语权等重要议题,也相继被提出。由此,“机器人人文”成为另一个引人关注的场域,一个似乎可以取代数字人文、也显得更加时尚的概念。事实上,从卡雷尔·恰佩克(Karel Capek)的科幻小说《罗素姆万能机器人》首度展开对机器人的文学想象,到2016年仿生机器人索菲亚(Sophia)获得沙特阿拉伯公民身份这一特殊事件及其传递出的象征意义,都让人和机器人、人工智能的关系成为科学家与人文学者难以绕开的话题,尤其是随着大规模机器人群体的诞生,机器人社会的出现,游走于现实与网络之间的“赛博人”“后人类”社会似乎已不再是天方夜谭,而是相去不远的未来。

  对于人文学者来说,在人工智能技术的刺激下,诸多新的问题扑面而来。诸如微软机器人小冰出版的诗集,是否可以被视作和人一样的作品?清华“九歌—人工智能诗歌写作系统”自动生产出的诗作,或许不是传统意义上的一首好诗,但仅就其能够完全根据我们的需要进行批量生产这一方面而言,是否已经可以说明传统诗歌的能量、魅力在今天仍能够被我们再一次激活,抑或已消耗殆尽、沦落为一种“装饰艺术”?又如,面对机器人新闻写作和由机器人深度参与的部分网络文学文本时,其独创性、文学性又该被如何界定?

  此外,人工智能技术也与数字人文的关系极为密切,在很大程度上已经介入了数字人文的发展中。中华书局、书同文等企业开发的在线古籍校勘整理系统,就使用了人工智能的核心技术——机器学习,更不用说自然语言处理、语义网分析、知识图谱、神经网络等分支技术在历史人文大数据环境中的成功应用,已是目前数字人文领域最受关注的方面。这一切似乎都向我们表明,包括人工智能这一前沿技术在内的数字技术、方法,已经成为人文学者必须掌握的工具或至少是辅助研究工具,而且将改变我们的学术习惯、生态。有学者甚至认为数字人文是一场新的学术革命。

  但事实是否如此?在笔者看来,不仅传统学术仍具有强大的生命力和创新发展的可能(参见拙文《“数字人文”与传统学术》),而且数字人文和机器人人文尽管都是数字时代人文学术回应时代、社会重大关切而做出的某种适应和改变,固然可以帮助我们在某些方面理解旧的问题、验证旧的结论、提出新的问题,重启我们对主体、身体、人性、心灵、权利等一系列重要命题的思考,但就其长远发展而言,或许也有将人文学术带向“计算批评”,从而愈益科学化、丧失人文性的危险。

  虽然“人文性”是一个难以准确定义的概念,但我们至少应该承认:与自然科学相比,人文学术的结论可能很难是唯一的、固定的、放之四海而皆准的,许多很难经得起重复验证,也根本没有什么技术操作方案、程序可供验证。人文学者的研究成果,往往因学者个体的性格、禀赋、学术训练和特定的审美旨趣、意识形态偏向等,呈现出千差万别的特点。但是,假如我们对于所有问题使用同一个数据库(语料库)、同一套计算机程序和分析工具,经过同样的数据挖掘、分析作业之后,会得出相同的结论,这样的人文学术研究还是我们需要的吗?它是否会窄化人文学术的诠释和想象空间?是否会将原本与博学、审思、明辨结合在一起的充满个性的人文学术,降格为一种纯粹的技术、实验操作而危害“人文性”本身的发展?是否会导向对技术和算法的崇拜?这不能不引起我们的忧思。

  更不必提,可能“还有很多学人,仍切盼着一个时常可以关闭电脑、远离网络的世界,无数个可以潜心研读、圈点、勾画、校阅,与书籍及作者思接千载、心游万仞的时刻,而非深陷于‘论文机器’‘学院动物’状态不能自拔。这种阅读、思考的状态,有时呈现为‘按照目录的方式,将某一主题的文献逐一阅读’,有时则纯粹代表了第三种阅读方式——漫无目的的阅读(desultory reading),而后者的存在提醒我们,不妨享受‘非职业阅读’、沉思、奇思妙想的乐趣。按照亚里士多德、培根、夏目漱石、鲁迅等人的理论,学术研究也好,艺文创作也罢,本来就是闲暇、余裕的结果,而闲暇‘是一种精神的现象’‘一种灵魂的状态’‘强调一种内在的无所忧虑,一种平静,一种沉默,一种顺其自然的无为状态’”(《“数字人文”视野中的目录之学》)。但数字时代的来临,对人文学术工作带来了一定的消极影响:不仅传统的阅读、写作的技艺在走向衰落,学术成果的衰减期由原来的数年、数十年激变为今天的数天,而且更重要的是,当我们熟练地使用着数据库、数字工具、算法输出一套所谓的人文学术研究成果时,又可以在多大程度上慰藉我们或已开始干枯的心灵世界、救赎原本动荡不安的灵魂?

  也正因此,笔者以为,数字人文也好,机器人人文也罢,不仅它们的重心、基座是人文,它的航向也应该是人文,是面向人文的一种可能的(最终并不一定成功的)研究取向、路径,而不是相反,将其研究结果变成数字学术以至数字经济的一个个精致的、制式化的产品(甚至“草率的学术快餐”)。如果明知我们要付出的代价可能是牺牲其固有的、丰富的“人文性”,那么一旦开始选择这样的研究取向、路径,也就注定了我们的感觉是半信半疑的,脚步是蹒跚的,眼神是游弋、闪烁的,说话的腔调是不那么掷地有声的。

  当然,试验新的学术取向,或创造可能的新学术,虽然并不一定比保守传统更高明,但总归是一种新的尝试。借用鲁迅先生的话来说,“希望是本无所谓有,无所谓无的。这正如地上的路;其实地上本没有路,走的人多了,也便成了路”。

  (作者系上海师范大学数字人文研究中心副教授)


链接地址:http://www.cssn.cn/gd/gd_rwhd/gd_ktsb_1651/szjshffcjrwxkcxfz/202012/t20201221_5234973.shtml