文艺报 | 王贺: 人工智能人文学:数字人文的“下一件大事”

发布者:新闻中心发布时间:2025-06-27浏览次数:10


一个非技术流的人文学者,是否有资格、有能力谈论人工智能?当然是可能的,只不过我们大致需要经历一个学习的过程。第一步,从了解人工智能的核心概念、基础技术和科学开始,建立最低程度的技术常识。第二步,逐步转向自己专攻和擅长的领域,不断形塑“人工智能人文学”的地形、地貌和地景。



2009年12月,一年一度的国际语言文学顶会MLA2009年会在美国费城召开。但与以往的年会不同,这次会议上竟出现了“在数字媒体中定位文学”“数字学术”“数字人文中的合作”等十余场以数字人文、数字文学为主题的分组讨论,以致“有的与会者抱怨道,这次年会似乎更像是一场关于技术、而非文学的会议”。威廉·潘纳帕克(William Pannapacker)在会议期间发表的一篇短文中说:“在大会的一片悲观氛围中,有一个领域似乎正在蓬勃发展——数字人文。不仅如此,在所有相互竞争的分支领域中,数字人文似乎是很长一段时间以来,我们首先迎来的‘下一件大事’,因为数字技术的影响正在波及每个领域。”自此以后,数字人文作为文学界和人文学界的“下一件大事”之说,不胫而走,“下一件大事”也成为了它众多显赫的头衔中的一个(尽管作者后来改变了他的观点和立场)。

威廉·潘纳帕克及与会者的感喟,有一个很重要的原因也许与数字人文本身的发展有密切关系。简言之,此时数字人文(Digital Humanities)一名已取代其早期术语“人文计算”(Humanities Computing),真正流行开来。数字人文研究、教学正如火如荼在欧美高校展开。具体来说,在2004年4月,著名的学术出版商布莱克韦尔出版公司(Blackwell Publishing)推出了苏珊·谢赖布曼(Susan Schreibman)、雷·西门子(Ray Siemens)、约翰·昂斯沃思(John Unsworth)等人合编的以“数字人文”为名的首部专书《数字人文指南》(A Companion to Digital Humanities),引起广泛关注。由此,“数字人文”一名,便以其更强的包容性(不局限于计算)和对面向对象(人文学术)的强调,逐渐赢得了学界认同,真正确立了自己作为术语的合法性。

当然,我在这里之所以简要回溯这两个数字人文发展史上的关键节点,是想提出一些可能许多人文学者特别是数字人文学者都关心的问题。即我们如果从2009年的“下一件大事”开始算起的话,数字人文距今已有近16年的时间了;如果是从2004年的定名之日算起,更有足足21年了,那么,在这一二十余年之后,数字人文拯救了美国和欧洲的人文学科吗?这么多年过去了,它究竟做到了什么?没做到什么?在多大程度上实现了自己的承诺?实际上,从那时候到现在,对数字人文的批判之声一直不绝如缕。最为常见的批评是说,技术入侵了人文学科;其他的批评也不少,如数字人文并未真正建立自己的方法论、问题意识和学科边界,并未提供与传统的人文学相媲美的解释体系和分析体系等等。但一个更加直接的回应,或许是由全球高等教育的现实提出的。据媒体报道,在2024年秋季学期,“哈佛本科生学院取消了至少30门课程,涉及20多个系。无一例外,这些大多是文科专业”,“在众多文科专业中,历史与文学的研讨课受到影响最大”,被取消的课程包括“从莎士比亚到杜阿·利帕的英国软实力”“购物中心的马克思:消费文化及其批评”“拉丁美洲种族的形成”以及“全球资本主义历史”等。其实,不独哈佛如此,从全美其他高校到欧洲、澳洲和亚洲部分高校的不少人文和社会科学科系,正在纷纷关门。那么,它们关门的原因是什么?是坚持传统、没有拥抱数字人文,还是数字人文并没有挽回“众神的黄昏”这一颓势?

目前并没有特别详细的调查和报道,给我们这些问题的答案,但我认为,人工智能(准确地来说,是生成式人工智能)在某种程度上可能给予人文学科新的发展机会,并将人文学科带到“人工智能人文学”这一新的阶段。这里我不想重复那些关于“人文学”“传统/老的数字人文”“基于生成式人工智能/新的数字人文”的区别的陈词滥调,但的确应该说明的是,从人文文本、文献资料、信息、数据的处理及其转换开始,到对这些数字对象的保存、分析、编辑和建模,提出新的研究洞见,直至教育教学和面向公民的知识服务、传播方面,生成式人工智能不仅能帮助我们节省人力、时间和金钱成本,还能够提供新的、基于语义和关联数据、多模态数据的分析和叙事。另一方面,引人瞩目的是,目前在中国、美国及世界各地,生成式人工智能这一技术本身不仅发展迅速,而且围绕这一技术开发的产品和项目,已多到不计其数的地步,而且还在被源源不断地推向它的用户,让人眼花缭乱。它们也共同构成了一个人工智能的生态(甚至慢慢地有点闭环的感觉),留给我们许多普通用户的工作几乎就是应用它们。唯一的区别只在于我们用它来指导烧菜、旅游、交友、谈恋爱还是做人文研究。也就是说,当“‘现实’的机器渐渐老化”(比森特·维多夫罗语),基于生成式人工智能的人文学研究已然无需特别讨论其是否可能、如何可能,而是成为了我们新的现实。新的“‘现实’的机器”,带给我们新的机遇和挑战。

真正的、棘手的问题是,如果我们要研究“人工智能人文学”,我们需要研究、处理、讨论哪些问题?我们的研究理论、方法、技术、工具有哪些?在我看来,基于人工智能的人文学研究或数字人文研究(在此人工智能充当的是方法、技术和工具的角色,主流的研究方法是量化研究,相当忽略批判性研究),只是其中一个方面,另外一个方面则是对人工智能本身的人文学研究。例如,对于文学研究者来说,一个需要理论创新、实践验证和反复观察的重要现象和议题,就是“人工智能文学/写作”。这可以说是(后)人类历史上首次出现的、真正崭新的创作实践。与许多研究者还停留在使用人工智能工具时的简单网页(含PC客户端)交互相反,一些作家已经走向更为专门、深入的探索,如陈楸帆自谓2025年春节以来,“一直在探索DeepSeek-R1,包括各种参数规模的蒸馏模型,以及调用API进行个人知识库的部署”。他发现,“DeepSeek的中文能力确实令人惊艳,甚至在创作诗歌等短篇幅作品方面,已经能超过90%的人类创作者,这已经是相对保守的估计。不过,它的上下文记忆力还是有所欠缺,输出超过4K token(上下文长度)就会无可救药地发散,而且文风容易变成中文互联网上常见的抖机灵的‘油腻’风格”。这里且不说他的具体判断是否恰切、他提供的数据是否正确,单是“调用API进行个人知识库的部署”一项,可能已经难倒了许多人文学者。既然如此,我们应该怎样去分析、评判其最新创新,亦即人类和人工智能深度协同创作的过程和结果?

到此为止,我们的问题进一步发生了变化,一个方法论的问题开始浮现在我们面前:一个人文学者(就其主流看,仍属于非技术学者),或者拥有一定数字技术、方法和科学基础的数字人文学者(但与计算机科学家、人工智能科学家和专业人士相比,我们的基础仍是极其有限的),是否有资格、有能力谈论人工智能(哪怕是从人文学的角度)?我们应该如何负责任地、认真地参与有关人工智能问题的讨论?这可能吗?在我看来,当然是可能的,只不过我们大致需要经历一个学习的过程。第一步,从了解人工智能的核心概念(如概率模型、监督学习/无监督学习、过拟合、幻觉、对齐)、基础技术和科学(如机器学习、深度学习、强化学习、提示词工程、指令微调)开始,建立最低程度的技术常识。当然,在此过程中,我们必须放低身段,暂时放下人文传统给予我们的内在的骄傲和恒久的自信,向科学家、工程师、技术人员请益并与之进行沟通、协作。另一方面,如上所述,我们今天也有各种各样的生成式人工智能工具,可以充分地发挥它们的效用。第二步,逐步转向自己专攻和擅长的领域。例如,历史学家可以研究人工智能的历史叙事、话语、知识和权力;哲学家、伦理学家可以探讨人工智能哲学和道德伦理相关问题;文学和语言学研究者可以利用大模型及相关技术辅助自己的文学研究、创作和教育教学,比较人类写作与人工智能写作、人机共作文学之间的优劣异同,进而更加深入地理解人类写作的特质,理解数字文学、生成式文学的潜力;法学家可以研究AIGC的知识产权归属问题……所有这一切,都将形塑“人工智能人文学”的地形、地貌和地景。

再举一个更加具体的例子。对于文学研究者来说,我们固然不是人工智能研究专家,但正如艾莉森·伍德拉夫(Allison Woodruff)等人的研究所指出的那样,生成式人工智能在社会力量(区别于个人、家庭、团体力量)层面已经产生了极大影响,加剧了人的去技能化(deskilling)、去人性化(dehumanization)、断联(disconnection)和虚假信息(disinformation)等问题,然后当我们注意到这一研究和现象,也就可以在此基础上进一步讨论中外文学想象尤其人工智能书写中对此类问题是否有足够注意?作家和艺术家又是如何处理他们所经验或想象中的这一新技术、新科学和新方法?其思想资源、文学装置、技术和科学基础分别自何而来?在艺术实践中又是如何犬牙交错、互相嵌入?其整体或局部的创作意涵何在?创作特色、优长和不足之处何在?对于我们认识目前的社会、时代、文化、文学和人性而言,这些创作究竟有无实际帮助?诸如此类围绕着人工智能和文学本身而形成的、彼此之间高度相关的、在认知功能上可以互相整合的大量问题构成的问题集丛,也就顺理成章地成为了我们可以探讨、且有能力探讨、亦须仔细探讨的一系列主题和论题。毫不夸张地说,这些研究对象和议题,在计算机科学和人工智能科学领域处于极边缘的地位,鲜见有学者怀抱浓厚的兴趣进行深入研究,而这恰恰是建立了最低程度的技术常识、有一定人工智能研究经验的人文学研究者,能够本色当行、一展所长的广阔天地。更关键的是,它也同样构成了“以人为本的人工智能”(HCAI)不可或缺的组成部分,将促进以增进人类福祉为目标(而非替代人类,削弱或危害人性、人道和人文)的人工智能技术和科学本身的发展。进而言之,怎样为人工智能注入人文关怀与价值理性,可谓是一个至为迫切的、现实的问题,也是一个“人工智能人文学”需要研究的重大课题,更是我们这些文学、人文研究者在当下需要回应的“中国之问、世界之问、人民之问、时代之问”。

也正是在这个意义上来说,我想提出属于21世纪第三个十年的数字人文学的新的发展方向——人工智能人文学。不可否认的是,此前全球范围内早已有学者提倡过“人工智能人文学”研究,但受限于人工智能本身的发展水平,应者寥寥,然而,到了今天,人工智能的能量几乎已不容我们置疑,可以说,无论从哪个角度、层次来看,它都完全有资格、有理由成为数字人文的“下一件大事”,也期待着人文学者的深度介入、参与、建构和想象。

(作者系上海师范大学数字人文研究中心副主任)


链接地址:https://wyb.chinawriter.com.cn/Pad/202506/27/node_2.html


https://mp.weixin.qq.com/s/vKJxZ_p4ikXwUU-khml0NQ

热点新闻
最新要闻