论文 | 从公共图书馆到公共智能:公共知识媒介演化及人文学术范式转型
原创 PKUDH 2026-04-01 11:49 北京
![]()
北京大学数字人文研究中心的研究论文《从公共图书馆到公共智能:公共知识媒介演化及人文学术范式转型》近期发表于知网。
![]()
北京大学数字人文研究中心主任王军老师的研究论文《从公共图书馆到公共智能:公共知识媒介演化及人文学术范式转型》近日发表于《中国图书馆学报》。该文从知识媒介演化的历史视角出发,辨析人工智能技术,特别是大语言模型出现的历史条件。梳理了自古腾堡印刷术以来人类信息环境的三次历史性跃迁:从印刷文献时代的“公共图书馆”,到网络化信息时代的“公共知识”,再到人工智能时代的“公共智能”。通过对印刷技术、互联网与Web 2.0、开放数据文化及大语言模型等公共知识媒介演化的分析,结合北京大学数字人文研究中心的实践案例,探讨智能技术对人文学科研究资料、研究工具与研究议题的重构作用。人工智能的出现并非偶然,而是开放文化、知识共建与技术演进长期交互作用的历史必然。在“公共智能”的支撑下,人文研究呈现出资料获取的穷尽化、形态的结构化及处理单元的原子化趋势,不仅极大地扩展了研究的问题空间,也推动了方法论层面上诠释与计算的深度融合,预示着学术范式正朝向“人机共生”的模式演化。
以下摘录论文的主要内容,全文请见:
王军. 从公共图书馆到公共智能:公共知识媒介演化及人文学术范式转型[J]. 中国图书馆学报, 1-12[2026-03-27].
从公共图书馆到公共智能:
公共知识媒介演化及人文学术范式转型
王军
01
引言
2022年ChatGPT横空出世,使人工智能(Artificial Intelligence, AI)进入全球公众的视野,也迅速成为跨学科讨论的焦点。尽管人工智能的研究早在20世纪中期便已起步,但大语言模型(Large Language Models, LLMs)的自然语言生成能力,使公众第一次直观感受到机器“理解”与“回应”人类语言的可能性。由此,学界与产业界均提出了一系列关切问题:人工智能的知识来源何在,它与人类认知的关系如何,会在多大程度上重塑学术研究,尤其是人文学科的研究范式。
本文从知识媒介演化的长时段视角来回答这些问题。可以预期,人工智能技术在未来数年内将逐渐成为继互联网之后人类社会的信息基础设施。与印刷术和互联网技术类似,大语言模型正日益成为获取信息的重要载体和入口,并重塑我们获取和学习知识的方式。随着这一趋势的发展,它将像印刷术和互联网曾经引发的那样,推动知识生产与学术范式的深刻变革。换言之,人工智能正在展现出成为新一代“泛在媒介”的潜能。而媒介不仅是信息传递的技术载体,更是塑造知识结构、社会组织与文化认同的深层动力。因此,理解人工智能的出现,需要回溯前两次重大信息环境转型:15世纪的印刷文献信息环境与20世纪末的数字化、网络化信息环境。
本文回顾印刷术对现代科学与学术制度的奠基作用,以及“公共图书馆”知识共享机制的形成过程;分析互联网与Web 2.0所孕育的“公共知识空间”,强调开放数据文化的奠基性作用;讨论大语言模型技术是如何依托开放数据文化而发展起来的,并提出“公共智能”概念;探讨智能信息环境下人文研究范式的转变,重点分析研究工具、研究材料与研究尺度的变化;结合北京大学数字人文研究中心的案例,展示智能技术在人文学科的具体应用;最后强调批判性思维的人文学术传统在智能时代不可替代的价值,以及传统人文训练是构建“人机共生”的学术生态不可或缺的条件。
02
印刷文献信息环境与公共图书馆
从人类文明史的长时段视角来看,媒介演化不仅仅是技术的迭代,更是知识生产方式与社会结构的重构动力。15世纪中叶,古腾堡(Johannes Gutenberg)活字印刷术的普及,被视为“现代性”的重要起点之一。印刷术的出现,将知识的生产和传播从手工抄写的局限中解放出来,标志着纸本印刷信息环境的确立。
在印刷术出现之前的中世纪欧洲,知识的保存和传播主要依赖修道院和教会机构,教育的主要内容是神学,核心文本是拉丁文《圣经》,且只有少数受教育的精英阶层有能力阅读拉丁原文。普通民众对宗教与世界的认识,依赖神职人员的口头解释。这种知识解释权和传播渠道的垄断不仅限制了信息的传播速度,也造成了知识获取在不同社会阶层的不平等。活字印刷术的推广改变了这一局面。印刷技术实现了文本的大规模复制,使知识的传播速度与覆盖范围前所未有地扩大。不同民族语言的《圣经》译本相继问世,识字率显著提高,人们有机会直接面对本民族语言的圣经文本,而非通过神职人员来传达“上帝的旨意”,思想解放成为可能。
机械印刷的社会影响可从出版规模的增长窥见一斑。据史料统计,1480年前后,西欧约有110家印刷坊;至1500年,这一数字增长至271家,印刷品总量达两千万册;到1500年时,西欧各地印刷机已累计印制两千多万册印刷品;进入16世纪后,产量更是增长十倍,达到约1.5亿至两亿册。而当时西欧人口仅7300万,人均印刷品2—3册。16世纪,欧洲的活字印刷机单日可完成1500至3600张的印刷。如此高的日均效率,是同期东亚雕版印刷工匠手工刷印难以企及的。
机械印刷不仅改变了知识传播的速度与规模,还推动了学术制度化的形成。手抄本因抄写者的主观添加或疏漏,往往导致同一本书的不同版本存在差异。机械印刷保证了同一版本书籍在结构、内容与分页上的一致性,这是现代学术体系中至关重要的“引用”“著作权”等概念产生的技术前提,出版、评审、引用等一系列现代学术规范,正是在这种标准化的印刷环境下逐渐形成的。正如爱森斯坦(Elizabeth Eisenstein)在The Printing Press as an Agent of Change一书中所论述的,机械印刷带来了抄写手稿所无法实现的稳定性与一致性,这种标准化为现代学术实践提供了技术基础,是现代科学与现代学术规范的制度性前提。
随着19世纪工业化印刷的普及与出版物成本的下降,欧洲逐步建立起现代意义上的公共图书馆体系,其核心特征是由公共财政支持并向社会大众免费开放,不论读者的身份和阶层差别。相比之下,中国古代虽有皇家藏书楼与私人藏书阁,但多不向公众开放,直到辛亥革命后,现代公共图书馆制度才逐步建立。公共图书馆的出现,标志着人类社会第一次在制度层面确认了知识的公共属性,并致力于为所有社会成员提供平等的图书资源。这一制度创新,不仅推动了大众教育与思想启蒙,也成为了以物理载体为核心的“公共文献资源共享”的象征。它构成了现代社会知识基础设施的重要组成部分,塑造了长达五个世纪的知识传播基本范式。
历经数百年的发展,纸本印刷信息环境孕育并推动了出版发行、新闻传播、全民教育、学术研究等诸多行业的形成与繁荣,为人类社会全面发展和平等进步提供了坚实的基础。随着通信技术和计算机技术的不断突破和普及渗透,到20世纪末,人类信息环境经历了由纸本印刷向数字化、网络化的重大转型。这一转型以互联网的普及为标志,使信息得以脱离物理载体,以二进制形式在全球范围内实时传播。
2.1互联网的兴起与信息去载体化
互联网技术产生于20世纪60年代末。到了90年代中期万维网出现,以及图形界面操作系统(如Windows)的流行,使得普通用户无需掌握复杂指令,在网页上移动鼠标、点击链接即可访问全网信息。万维网不仅改变了信息获取的速度与范围,更改变了社会运行的基本方式:购物、交通、通信、教育等服务机构逐步将业务迁移至线上,形成全新的数字社会形态。互联网的核心特征之一,是信息的“去载体化”。在纸本环境下,知识要依附于书籍、期刊等物理载体来传播,而在数字化环境中,文字、图像、音视频等内容均以数字形式存储与传输,突破了空间限制,实现了“足不出户而知天下事”的信息平权。
2.2Web 2.0与用户生成内容(UGC)
互联网早期的知识生产主要由机构主导,用户的角色是“信息消费者”。然而,2000年前后兴起的Web 2.0运动,使用户得以通过博客、视频网站(YouTube、优酷等)、社交媒体(Twitter、微博等)、大众书签(Delicious)等平台直接生成内容。2006年,《时代周刊》将年度人物授予“You”,象征每一位网民都是信息的生产者与传播者,这就是Web 2.0所标志的核心模式——用户生成内容(UGC),自此引发网络信息量的爆炸式增长。全球范围内,无论是个人还是团体,政府还是企业,纷纷在互联网上发布信息。各种语言、各个行业、各个学科的知识和资讯,以及其中所蕴含的丰富的操作过程、组织方式和处理逻辑,由此汇集于网路空间,共同绘制出一幅全球网民协力编织“世界知识”的壮丽图景。这为随后兴起的以数据驱动为核心的大模型技术提供了规模空前的数据基础和文化准备。
2.3“公共知识体”与开放数据文化
Web 2.0时代的UGC,不仅引发了信息量的爆炸式增长,也催生了集体协作的知识生产方式和开放数据文化。维基百科(Wikipedia)是最具代表性的案例。与传统由专家编纂百科全书不同,维基百科允许任何用户参与词条撰写与编辑,形成一种基于网络协作的知识生产模式。这一机制体现了“集体智慧”(collective intelligence)的理念,即无论个体的专业背景或社会地位如何,都可以参与到知识共建的活动中来。与纸本印刷时代依托公共图书馆实现知识共享相比,维基百科依托互联网平台展开的知识众包模式,使得知识共享的范围大幅扩展、更新时效性显著提升、协作的粒度也得以延伸到更细微的知识单元。这一转型意味着人类社会的知识共享机制从“公共图书资料”进入到“公共知识空间”(public knowledge space)的新时代。与前者依赖物理场所提供载体共享不同,公共知识空间以网络平台为媒介,直接实现知识内容本身的开放与共享。Web 2.0孕育了互联网的“开放数据”(open data)文化——全球范围内,无论是个人还是团体、政府还是企业,都可以在网络上访问、分享、再利用信息资源,使得知识跨越地理与文化边界,以全球化方式流动与扩散,促成了跨国、跨语种的全球知识共同体的形成。这种由网络推动的“公共知识”机制,成为大语言模型等人工智能技术得以构建的文化基础。它不仅实现了信息获取的平权化,更为机器学习提供了规模空前的开放数据资源,为数据驱动的大语言模型的出现准备好了数据基础。
03
大语言模型与“公共智能”的兴起
3.1 书目统计及典籍存佚
进入21世纪第三个十年,人工智能,尤其是基于大语言模型的生成式AI,成为继印刷术与互联网之后又一次重塑知识结构的关键技术。
虽然互联网与Web 2.0实现了知识生产前所未有的开放与共享,但知识的呈现方式仍以静态为主。即便用户能够快速检索到所需信息,仍需依靠自身的阅读与理解,将其转化为对具体问题的答案。以ChatGPT为代表的大语言模型的突破在于,它们可以直接以自然语言与用户交互,根据提示生成连贯且贴合语境的回答,从而省去了传统的“查找—阅读—整合”的过程。流畅的自然语言生成,再加上强大的上下文学习能力和广泛的世界知识,使用户第一次直观感受到机器所展现出的类似智能的表现。
(1)所谓上下文学习(contextual learning),是指大语言模型能够利用用户提供的上下文信息,包括对话历史、任务指令、文本语境,甚至示例与反馈,动态调整生成内容。这种能力使其在交互中表现出高度的适应性与针对性。
(2)所谓世界知识(world knowledge),是指大语言模型通过对大规模语料的训练,汇聚了跨语言、跨文化、跨学科的世界知识储备,涵盖自然科学与人文社会科学的广泛领域。这些知识构成了自然语言生成与理解的基础,使其能够处理从常识性问题到专业性任务的多样需求。
无论是自然语言生成,还是上下文学习,大语言模型之所以能够展现出超越性的自然语言能力,根本上依赖于其所汇聚的“世界知识”,亦即训练数据的规模与开放性。自20世纪90年代互联网普及以来,全球用户与机构持续上传文本、图像、音视频等多模态数据。这些数据在个体层面或许零散、琐碎,但在超大规模的聚合下,通过深度神经网络的模式学习与参数化表示,得以产生“智能涌现”(emergent intelligence)现象。这一现象与人类的知识积累过程具有类比性:正如学者的创造性往往源于广泛的阅读与跨领域的交流,大语言模型的创造性亦建立在对多元数据的整合与再生成之上。
因此,从人文社会的视角来看,人工智能的诞生并非偶然的技术奇点,更不是单一企业或机构的孤立创新,而是自活字印刷术发明以来,开放文化、知识共建与技术演进共同推动的历史必然。开放数据驱动的大模型技术,通过互联网平台与移动终端实现全民可及、即时交互,成为全社会成员皆可使用的“公共智能体”(public intelligence)。如果说“公共知识”阶段实现了信息与知识的获取平权,那么“公共智能”阶段则进一步推动了认知能力与思考力的平权,使人人皆可借助智能工具获得理解、分析、推理与创作的能力。由此,人类社会的知识共享机制进入了新的阶段,“公共智能”将成为继公共图书馆与公共知识空间之后,人类社会知识共享的新型基础设施。
04
智能信息环境下人文研究资料的重构
自15世纪中叶印刷术诞生以来的近六个世纪,人类信息环境的演进轨迹为我们理解智能时代的人文研究提供了重要的历史视角。现代人文学术研究的基本范式是在纸质印刷环境下逐渐确立的:通过标准化出版程序,形成了“资料收集—写作发表—出版引用—同行评议”的学术流程和相应的评价体系。这一学术范式赖以存在的基础,是以公共图书馆和学术出版体系为代表的人类知识共享机制,它为以图书与期刊为主要载体的知识进行系统性的收集、整理、传播与再生产,提供了社会性与制度性的保障。进入网络化数字化的信息环境后,信息检索效率显著提升,知识传播的速度和范围空前拓展。然而,资料的阅读、理解和消化最终仍依赖研究者个体,其阅读量和认知容量仍受限于个体生命历程与个人精力。因此,尽管网络技术极大提升了知识的可及性和流通性,学术研究的基本范式在本质上依然延续着纸本文明时期所形成的传统路径。相比之下,智能信息环境则预示着一种全新的研究格局。凭借上下文学习、世界知识储备和自然语言生成的能力,LLMs使人机协作模式发生根本性转变,从而重塑人文学科的研究工具、研究材料与研究方法。这种变革不仅体现在研究规模和效率方面,更在资料规模的穷尽性、知识单元的细粒度化,以及人机协作的共生化等方面,为人文研究开辟了前所未有的可能性。下文将结合北京大学数字人文研究中心的实践予以阐释。
4.1 资料获取的穷尽化
传统人文研究依赖学者个人所掌握的档案、文献、田野记录,其数量和范围受制于研究者的时间、精力和认知容量。在智能技术的辅助下,人文学者能够驾驭的资料规模、类型和语种得以超越个体能力的限制。具备多模态理解能力的大模型,使得对超大规模语料、图像、影音资料的检索、比对和综合成为可能,从而极大地扩展了研究的认知边界。在古典文献、古代历史等特定领域,研究者得以在几乎“全量”的资料空间中展开工作,这为学者观察宏观趋势、探索长时段历史和回应重大跨学科议题提供了新的可能。
为了全面系统地反映中国古代书目的建设和发展情况,北京大学数字人文研究中心与孙显斌合作研发了“经籍指掌:中国历代典籍目录分析系统1。它将上始《汉书·艺文志》,下讫《清史稿》的八朝官修目录加以集成,跨越汉、隋、唐、宋、元、明、清等朝代,再加上《四库全书总目》和现代编撰的《中国古籍总目》,累计299 206条古籍书目,是对中国古籍目录的一次系统整合。该系统中,在宏观层面,研究者可以观察不同历史时期生产和收藏古籍的总量变化(见图1),进而直观考察古籍总量的增长轨迹和知识体系的长时段演化,这种全景式的观察,唯有在全量数据的支持才可以实现。在微观层面,研究者可以考察任一古籍两千余年来的版本流变,追踪它在历朝目录中的记载、更名或重编;可以分析任一类目在后世的演化情况,乃至通过共现关系而关联在一起的书群的聚散离合现象。借助大数据和可视化手段,可以方便地观察中国古代两千年来古籍类目演化、版本流变和知识谱系的结构变更。
![]()
![]()
图1 历代官修典籍目录数量分布
“经籍指掌”系统汇集的是古代典籍的书目元数据信息。存世的中国古代文献数量毕竟有限的,若能将存世古代文献全部汇集起来,研究者便能在完整的资料空间中考察中国古代思想观念发生、发展与演化,从而避免个体阅读范围有限所造成的偏差。“《论语》复用可视化分析平台”2展示了这一可能性。该平台在《中国学术名著提要˙哲学卷》所收录的全部语料基础上构建,利用语义相似度计算,穷尽式地将后世文献中与《论语》原词或原句意思一致或相似的文本片段无一遗漏地找出来,既包括对原词原句的直接引用,也包括词形句形虽有变化但是意思一致或相近的间接引用,从而观察它们在后世的演化轨迹。在这一框架下,复用数据越完整,越能真实反映思想观念的历史流传全貌。据此还可以观察某一观念乃至某篇章节在不同时代的复用情形,从而揭示其在不同时代所受到的重视程度及其思想史意义(见图2)。
![]()
![]()
图2 《论语》各篇章在各时代的复用统计
4.2 资料的结构化与图谱化
人文学科的研究对象大多属于人类历史与文化的记忆材料,如史料、典籍、书画等,原本是以人类的阅读、欣赏和记忆为前提而制作与流传的。然而,当研究追溯至历史深处,需要处理考古遗存、古代文献与艺术典籍等文化遗产材料时,它们往往因年代久远、语言艰深、结构复杂而含义隐晦,即便是专业学者,也常常需要多年训练才能加以解读与阐释。资料的智能处理,核心在于将原本面向人类理解的材料重构为面向机器处理的数据。这一过程可以借助多模态大模型的文字识别、图像处理、命名实体识别与语义标注等手段,把文字、图像、影像等传统文史资料统统转化为结构化数据,并进一步构建富含语义关系的知识图谱。通过这种方式,研究者得以在大规模数据集上开展统计分析、比较研究,乃至进行推理与阐释。这为人文学科中难以直接解读的文化遗产材料开辟了新的研究路径。基于这一理念,北京大学数字人文研究中心研发了“吾与点”智能人文平台3,其核心目标在于实现人文学科研究材料的结构化与图谱化。平台内置了多种主流大语言模型的接口,研究者可以根据任务需求灵活调用合适的模型,对文本或图像等原始资料进行处理。在具体操作上,用户首先将材料上传系统,并依据研究目的自定义所需的数据结构。例如,可以设定从文本中抽取人名、地名、官职等字段,或为图像建立标注与描述的维度。平台随后调用指定模型,自动完成信息抽取与标识,随后生成二维表格,或构建包含丰富语义关系的知识图谱。这样,原本以顺序书写形式存在的文史材料,便可转化为结构化数据,实现从线性文本到表格、再到知识图谱的多层次转换(见图3)。
![]()
图3 “吾与点”平台智能生成的《史记˙孟子荀卿列传》知识图谱
更为关键的是,这一过程并不仅仅是形式上的转换,而是对材料的重新组织与语义重构(见图4)。传统文史典籍是面向人类阅读的线性文本,而研究往往需要按概念或关系进行聚合与比较。“吾与点”能够利用大语言模型的语义理解能力,从资料中抽取并关联信息,例如,识别史料中同朝为官且具父子关系的人物,汇总《三国志》中涉及战争的所有段落,或集中整理关于某一学者的记载。通过这种方式,材料得以打破原有的书写顺序,依据研究者的需求重新组合,最终形成可供计算分析的知识图谱。这不仅显著提升了人文学科的数据处理能力,也为资料的重构与深层解读提供了新的可能。
![]()
图4 吾与点平台基于“人—出生—某国”的关系对《三国志》文本聚类
4.3 知识处理单元的微细化和原子化
搜索引擎时代,机器返回文档级或篇章级的结果以响应用户查询。研究者需要进一步细读来筛选所需要的内容。进入智能时代,大语言模型凭借其语义解析能力,将分析从书籍、章节等宏观单元,进一步细化到段落、句子、词语甚至词元(token)的原子级别,从而赋予研究者精确识别跨文本的细粒度语义关联,并在大规模语料中展开定量分析和计算建模。例如,思想史研究中可追踪特定概念在不同历史语境中的微妙差异,文本学研究能够捕捉跨文本的复用、改写和风格变异,而文化传播研究则能够刻画概念、隐喻或叙事单元在跨地域与跨语种中的迁移和扩散。这种从宏观视角对大规模文化现象的考察,正体现了莫莱蒂(Franco Moretti)所倡导的“远读”(distant reading)范式——即通过计算方法揭示传统文本分析难以察觉的文学演进规律与全球性文化联系。
这一理念可追溯至基于词频统计的数字概念史研究,例如金观涛与刘青峰在“中国近现代思想史专业数据库(1830—1930)”中,对“公理”“社会”“个人”“世界”等关键概念的词频进行统计,考察它们在百年间相关文献中的传递与嬗变,进而分析词义变化所折射出的社会心理特质与时代变迁。更复杂更精细的方法是利用词嵌入表征检测跨文献的 n-gram 互文,使文本分析的尺度能够从整部文献或篇章级别下沉至段落、句子乃至词语的“原子化”层级。北京大学数字人文研究中心在一个涵盖唐以前大多数典籍及部分后世经典的大规模语料库上,检测出千万级别的互文,并通过上下文语境分析,描绘观念在超长时段中的语义演化轨迹。
例如,从《论语》中的“一箪食一瓢饮”出发,经《孟子》《新语》《盐铁论》《汉书》《论衡》等典籍不断被引用、缩写与转化,最终凝练为流传广泛的典故(见图5)。这一追踪过程展示了观念如何由具体叙事逐渐抽象化为符号化表达。又如,通过互文计算追溯《韩诗外传》中的“伪诈不可长,空虚不可守,朽木不可雕,情亡不可久”一语,发现其子句构成分别来自对《韩非子》原句“矜伪不长,盖虚不久”的化用,及《论语》原句“朽木不可雕也”的直接引用,再附上《韩诗外传》作者自撰的“情亡不可久”而形成,从而揭示了思想观念的复杂源流。
图5 采用互文计算追溯“箪食瓢饮”典故的形成
05
智能时代的研究范式
人工智能在工具层面与材料层面带来的根本性变化,必然推动人文研究范式的转型。首先,近乎全量的资料规模将极大拓展研究问题的空间,研究者得以在更大范围内提出和检验新的问题;其次,智能处理能力正在重构方法论格局,使传统人文学术依赖的“诠释”方法与算法化的“计算”分析趋向互补与融合;最后,工具的智能化发展意味着人机协作机制的演进,其终极形态将走向“人机共生”。
5.1问题空间的极大扩展
受限于个体精力与认知负荷,传统人文学者一般选择具体而微的研究问题,通过对局部材料的精读,从个案出发,以“小中见大”“一叶知秋”的方式,推演宏观结构与历史脉络。
而在智能工具的加持下,研究者能够从大规模数据集中识别模式、发现问题,并提出过去因资料规模过大而难以驾驭的问题。美国学者安德伍德(Ted Underwood)通过分析数万本文学作品,用计算方法来回答关于文学史演变的大问题,例如小说体裁如何随着时间的推移而变化、批评家对文学作品的接受模式如何演变。他在著作Distant Horizons: Digital Evidence and Literary Change中指出,通过在数以千计的文本中汇聚证据,研究者能够发现个别作品层面无法呈现的长期变化与宏观模式。
这表明,数字与智能工具使得学者能够在大规模数据集中识别规律,进而探索“大趋势”“大历史”层面的学术问题。基于大趋势的观察,研究者又可以筛选出对应的具体文本,深入细读和分析诠释,随时在宏观把握和微观诠释之间灵活切换,从而既能把握整体大势,又能穷究细节。这一范式的转型,将赋予每个研究者“致广大而尽精微”的研究能力。
5.2 诠释和计算的复合运用
传统的人文学科强调“精读”与解释。然而,正如莫莱蒂所言:“精读并不是一种可扩展的方法……远读则使我们能够聚焦于比文本更小或更大的单元:如修辞手法、主题、母题,或是文类与体系。”在人工智能技术的加持下,基于大数据的远读模式将更加流行。面对超越个体消化能力的庞大资料集,研究者需要将传统的诠释学方法与统计建模、机器学习等计算手段相结合,从而形成“量化统计—质性解释—智能辅助”相融合的研究路径。换言之,纯粹依赖解释的研究模式仍然不可或缺,但质性与量化相结合的研究范式正在逐步成为主流。这不仅要求人文学者具备一定的量化分析能力,成为具有跨学科素养的研究者,也意味着人文研究将越来越强调团队协作,人文学者与计算机科学家、数据工程师的合作将逐渐成为常态。
5.3 人机共生的协作范式
如果说搜索引擎时代的人机关系是“人机协作”,即计算机收集和提供信息并提供创作工具,而用户则理解、消化信息并自主生成知识,那么,在大语言模型的三大能力——自然语言生成、上下文理解与世界知识整合——的支撑下,人机关系将进化为“人机共生”,即人与AI共同参与知识生成,形成“增强式研究”范式。基本协作流程是:学者提出问题→ AI进行初步分析→ 学者批判性判断→ AI根据反馈进一步优化。如此循环迭代,研究者与AI不断交互从而构成一种动态的知识共创机制,显著提升知识生产的速度与质量,并拓展学术创新的可能空间。
北京大学数字人文研究中心研发的“吾与点”平台,在数据智能处理的基础上,已经升级为智能体开发平台,其核心目标是支持用户在私有数据集之上构建个性化的专属智能体。用户上传私有资料库之后,平台首先智能生成结构化表格或知识图谱,继而根据用户需求创建多功能智能体:既可作为智能助手协助用户对数据集做深度分析,亦可作为小程序向他人提供基于私有数据集的知识服务。与传统的信息传递和知识共享不同,这种“资料集—知识库—智能体”的全链路转化,为用户提供了将自己独有的分析视角、研究思路和处理逻辑也分享给他人的通道。借助这样的智能平台,用户不仅能打造学习和科研的智能助手,还可以化身为“微图书馆”,为大众提供特色服务。
06
结语
综上所述,智能时代的来临为人文学科带来了前所未有的工具与方法,使研究能够在更大规模的资料、更细微的知识单元上展开,并推动学术范式的深刻变革。然而,真正的学术洞见仍然依赖于人类所独具的历史感、价值判断、批判精神与创造性思维——这些都是任何算法无法替代的。在未来的人机共生模式中,机器的优势在于规模、速度与模式识别,而人类学者的价值则体现在问题的提出、意义的阐释以及文化与伦理的关怀。正因如此,传统人文学科的训练依旧不可或缺,文本细读、历史语境的把握、逻辑与修辞的训练,都是塑造人文学者的基本功夫,也是人机协作得以真正发挥作用的前提。换言之,人工智能的繁荣是否会削弱人文学科,在很大程度上取决于我们对人文学术根本价值的理解与坚守。如果仅把人文学科视为文字生产的工具或特定思想的附属装饰,那么其式微几乎不可避免。但如果承认并珍视人文学科在探寻人类存在意义、反思文化价值与提供伦理关怀方面的不可替代作用,就应当在智能时代更加珍视人文学术的传统价值,善用智能技术打造符合人文学术特质的数字人文研究平台,从而充分发挥人类心智与文化创造的独特力量。
*本文原标题《从公共图书馆到公共智能:公共知识媒介演化及人文学术范式转型》,有删节,网络首发于知网,参考文献从略,下载全文请登录中国知网首页检索。
