阅读视图

数字人文时代的“新文献观”及其对文献学专业教育变革的启示 ——以中华书局“苏东坡数字人”为案例

郭琳 王建 2026-04-22 18:00 北京

以下文章来源于:DH数字人文

DH数字人文

清华大学、中华书局联合主办《数字人文》(Journal of Digital Humanities)季刊,旨在为方兴未艾的数字人文研究提供理论探讨和专题研究的平台。

在中国传统文化中“文献”既有典章资料的含义(“文”),又指掌握典章之人(“献”),但后世的文献学在某种程度上缺失了“人”的维度。

教育与教学

郭  / 北京大学社会科学部

王 建 / 中华书局

要:在中国传统文化中“文献”既有典章资料的含义(“文”),又指掌握典章之人(“献”),但后世的文献学在某种程度上缺失了“人”的维度。为了提供一个更贴合“文献”概念原初含义,同时也更适合当下数字人文时代的理解框架,本文尝试引入文化哲学、技术哲学的新视角,来提供一种新的“文献观”,试图将“文”与“献”纳入一个整体框架来进行理解。从文化哲学的视角,人是符号的动物;从技术哲学的视角,符号是人的外化与延伸。人可以创造符号并以此创造文化,而文献也正是一个符号系统,它依赖于对应时代的符号书写与媒介技术。在全新的数字人文时代,数字文献的应用越来越广泛,数字文献技术使得历史文化名人数字人成为可能与必然。与此同时,符号技术的变迁必会引起文化形态与学术范式的升级转型,当下大学的文献学专业研究与教学模式变革需要试图做好专业与通识的结合、基础与应用的融合、传承与创新的综合,才能塑造未来大学教育的新形态,创造出越来越多像“苏东坡数字人”这样的优秀案例并切实推进落实中华优秀传统文化的创造性转化和创新性发展。

关键词:文化哲学 技术哲学 文献观 数字人 文献学 数字人文

一、文化哲学、技术哲学视角下的“文献观”

(一)“文献”概念溯源与新视角的引入

我国是一个史籍浩瀚、史学发达的国家,文献的产生、流传和研究已有悠久的历史。随着时代的发展,“文献”一词的含义在不断变化。《辞海》将“文献”释义为“专指具有价值或与某学科相关的图书文物资料”,《现代汉语词典》将“文献”解释为“有历史价值或参考价值的图书资料”。所以,现在人们通常所理解的“文献”是指图书、期刊、典章等所记录知识的总和。

而如果我们将考察的视线拉得更长可以发现,最早将“文献”一词用作书名的著作是元代马端临的《文献通考》,而“文献”一词的最早出处则可以追溯到《论语》。在《论语·八佾》中,孔子曾说:“夏礼吾能言之,杞不足征也;殷礼吾能言之,宋不足征也。文献不足故也,足则吾能征之矣。”何晏《论语集解》中引东汉经学大师郑玄的注云:“献,犹贤也。我不以礼成之者,以此二国之君,文章贤才不足故也。”这里用“文章”解释“文”,用“贤才”解释“献”。宋代朱熹在《四书章句集注》中解释道:“文,典籍也。献,贤也。”[1]“文”是指历史典籍、档案等文字资料,“献”是指博学多才、熟悉掌故的贤才。清代刘宝楠在《论语正义》中也沿用了这一说法:“‘文’谓典策,‘献’谓秉礼之贤士大夫。”[2]后来杨伯峻在《论语译注》中的注释为:“《论语》的‘文献’包括历代的历史文件和当时的贤者两项。今日‘文献’一词只指历史文件而言。”[3]

鉴于上述梳理可以看出,今天我们常用的“文献观”对于“文献”概念的理解,如果较之“文献”一词的原初含义而言,其实是只得其半,而缺失了对于“人”本身的理解。因此,为了提供一个更加贴合“文献”概念原初含义的新的“文献观”解释框架,本文尝试引入文化哲学、技术哲学的新视角,来探索一种新的“文献观”表达,试图将“文”与“献”纳入一个整体框架来进行理解,并从中发现人类“文献”发展史的规律与趋势。

(二)文化哲学的新视角——人是符号的动物

恩斯特·卡西尔(Ernst Cassirer,1874—1945)是德国著名的文化哲学家,被誉为“当代哲学中最德高望重的人物之一”。卡西尔在其代表作《人论》中概括表达了他的符号论文化哲学体系,他认为人类文化形式都是符号形式。因此,我们应当把人定义为符号的动物(animal symbolicum)来取代把人定义为理性的动物。[4]也就是说,人是能用符号去创造文化的动物。从而可以理解,人是创造符号并以此创造文化的动物,符号是人区别于动物的一个显著特点。人类拥有其他一切动物不具有的符号系统,人可以在创造符号的过程中获得自由与解放,成为真正意义上的人。

“符号”是卡西尔文化哲学思想体系中的核心观念。在卡西尔这里,“符号”不是具体的单个符号,而是一个整体的概念,具有极其丰富的内容和意义,他将人类文化的各种形式包括语言、神话、寓言、宗教、艺术、科学、历史等都看作符号形式。人与符号紧密相连,符号是人类创造文化的媒介。人具有符号化的思维模式,并通过符号创造文化,即创造一个符号世界,进而认识自我、发展自我。符号化的思维和符号化的行为是人类生活中最富于代表性的特征,并且人类文化的全部发展都依赖于这些条件,这一点是无可争辩的。[5]可见,符号是人和文化的共同本质,人—符号—文化构成了三位一体的存在。首先,符号可以理解为作为文化现象的符号形式;其次,符号体现了主体(人)本质的符号活动;另外,符号展现了被赋予的符号意义。

在卡西尔看来,“符号”(symbol)是与“信号”(sign)相对的,“信号是物理的存在世界之一部分,符号则是人类的意义世界之一部分。信号是操作者(operator),而符号是指称者(designator)”。[6]文化符号和自然界的信号有严格区别,这二者体现了“人禽之别”的关键,即动物只能对信号做出条件反射,只有人才能掌握和运用信号,并将信号改造成有意义的符号,所以“信号”与“符号”的核心差别在于“意义”。如图1所示,人和动物与客观世界的互动方式是不同的,动物与世界直接互动,往返的是信号,信号不具有意义,它是物理性的、实体性的存在;人与世界则通过符号进行互动,符号是意义的表达。符号是人类的创造物,人具有符号构形能力,不存在无意义的符号,也不存在无符号的意义。

图1 人和动物与客观世界的互动方式差异

由此可以看出,基于“符号”这一视角,可以认为,主流“文献观”定义里的“价值”与“知识”等跟卡西尔最为强调的“意义”是内在相通的,因此,可以用“符号系统”这一概念来提炼与概括“文献”中“文”的内涵。符号系统成为连接人与文化的通道,构成整个人类文化世界。

从根本上说,人是符号的动物,符号揭示着人的本质,延伸着人的能力,人所创造的符号成为人与世界的中介,人所面对的世界也是符号世界。与此同时,卡西尔认为,符号具有二重性,即符号具有可感载体与普遍意义两个方面。人类可以像其他动物一样以各种感官与世界进行交往,依据物理信息与外界进行沟通,此时世界是可感知的。另一方面,人具有符号能力并进行符号活动,正是这种符号能力将自己与动物区别开来,当人类作为“符号”动物与世界交往时,人类是有意识的、有思想的、有理智的,此时“符号”成了载体与意义的统一。

需要指出的是,就历时性的角度而言,作为人与世界之中介的符号系统是具有历史性的,也就是说,一个个体所面对的符号世界从根本上说正是该个体之前全部的人类历史中所能留存下来的符号的整体。

(三)技术哲学的新视角——符号是人体感官的外化与延伸

从卡西尔把人定义为“符号的动物”来看,一方面,人是创造和发明符号的动物;另一方面,人是使用符号的动物。正是由于人的能动性与创造性,人能够制造和使用符号,人的意识、愿望、思维等精神能在具体实践活动中对象化到客观世界,实现客观世界的符号化,比如艺术是人类直觉或观照的客观化,语言和科学是人类概念的客观化,而这些符号可以将人体感官不断地外化和延伸。

其实在更早的德国技术哲学家恩斯特·卡普(Ernst Kapp,1808—1896)那里,曾更加明确地提出了工具和器物是人体“器官投影”(Organ Projection)的核心观点,在其被认为是技术哲学奠基性著作的《技术哲学纲要——从新观点看文化发生史》(1877)一书中,卡普试图用器官投影论的新观点,通过作为技术文化的工具发生历程来解释人类文化的演进历史,他认为,人体的外形和功能总是作为人类最理解的客观存在,当成创造技术的外形和功能的尺度,投影到外部环境;所有工具的源泉和本原的技术,都是建立在人的器官特别是手的基础之上的。因此,人是制造器物的尺度。[7]卡普的“器官投影”理论开创了一种分析技术的独特视角,某种程度上,我们可以说是他提出了技术生成文化理论,并从技术哲学范式内部对技术的本质进行思考。

作为卡普“器官投影”论在媒介时代延续的加拿大媒介理论家马歇尔·麦克卢汉(Marshall McLuhan,1911—1980)在他的名著《理解媒介:论人的延伸》一书中提出:媒介,即技术,可以是人的任何延伸。媒介带来一种新的技术尺度,人的延伸及其感知比率随之改变,就形成一定的后果。这就是“媒介即讯息”。[8]媒介是那些延伸人类器官的所有工具、技术和活动,一切技术都可以被看作是不同人体器官的延伸,比如,车轮是人类脚步的延伸,衣服是人类肌肤的延伸,报纸是人的言语和视觉的延伸,广播是听觉的延伸,等等。万物皆媒介,凡是能使人与人、人与事物或事物与事物之间产生关系的物质都是广义的媒介。半个世纪之后,美国学者凯文·凯利在《科技想要什么》一书中进一步认为“技术是思维的延伸”,将技术称为“第七王国”,并提出了“技术元素”(technium)的概念,这里的“技术元素”包括硬件、文化、艺术、社会制度以及各类思想。他认为科技是我们躯体的延伸,技术元素是生命的延伸,技术应该被理解为一种正在进化的生命。[9]

综上所述可以看出,就技术哲学的视角而言,作为人与世界的中介的符号及其能力也可以被视为“符号技术”,其本身就是人类感官与思维的外化与延伸。进一步的,再就符号的历史性而言,一个个体所面对的符号世界从根本上说正是该个体之前全部的人类历史中所能留存下来的前人们感官与思维外化与延伸的整体。因此,就其符号整体的所指而言,它指向的是前人们于四维时空、眼耳鼻舌身意全感官的所有真实而鲜活的生命经验,而就该符号整体的能指而言,它则是特定历史时代与对应的特定符号技术下对上述多维度、全感官生命经验的部分维度、部分感官的“投影”。

(四)双重视角下的新文献观

总体而论,从文化哲学的视角来看,人是创造符号并以此创造文化和进行文化实践的动物;从技术哲学的视角来看,符号是人体感官的外化与延伸,也可以理解为,人类的一切活动是借助于符号技术不断外化自身的过程。基于此,在文化和技术哲学的双重视角下,可以构建一种新的“文献观”表达,即“文献”是一个符号系统,是人类进行一切生命活动的符号化记录,其映射的对象其实是真实而鲜活的历史人物的生命体验所外化于四维时空形成的高维度、全感官的历史文化世界。

因此,作为总结,就作为人与世界的历史性的中介而言的符号世界对应着本文新文献观中“文”的内涵,而在客观世界的角度来看,人与历史性的符号世界构成的具有意义、价值、历史性的整体,则对应着本文新文献观中“献”的内涵,如图2所示。

2双重视角下的新文献观

可见,文献这一符号系统依赖于对应时代的符号书写与媒介技术,特定时代的符号书写与媒介技术的维度决定了文献的维度,它蕴含着人类活动、媒介技术(符号书写)、知识生成(符号世界)相互依存的关系。事实上,“文”与“献”本身就是一个整体的结构体系,遵循着人类历史文化发展的规律与趋势。

(五)人类符号技术发展趋势与数字人文的必然

如前所述,人类符号技术的发展史其实就是人类文化的发生史,是人类不断追求更有效、更丰富地去外化与延伸自身感官与思维的历史,因此,人类符号技术也在多维度与多感官两个角度呈现出了历史性的发展趋势。

在原始社会,人们通过结绳、绘画、雕刻等方式记载和传递信息,这些图形和符号逐步演变并形成最初的符号系统。当文字及印刷技术出现后,人类的视觉得到了延伸。其中,“文字”的产生打破了“口耳相传”的局限,成为人类用符号记录和表达信息的突破性进步,从最早的抽象图画,再到象形文字、指事文字、会意文字等。广播、电视等媒介技术的诞生,改变了人们的生活方式和文化体验。广播延伸了人的听觉,而电视结合着语言符号与非语言符号,更是综合了文字、声音、图像等多重符号,具有“声画合一”的特点,更全方位延伸了人们的视觉和听觉。21世纪以来,随着信息科技的迅猛发展,增强现实(AR)、虚拟现实(VR)以及混合现实(MR)等技术突飞猛进,让人类视觉的延伸逐渐从平面化的二维向立体化的三维拓展,如图3所示。与此同时,通过不断创新的数字技术的加持,人类的嗅觉、味觉、触觉等也得以被前所未有的数字化模拟,更进一步的,人工智能、脑机接口等颠覆性技术也逐渐显露了越来越多的曙光。

图3 符号技术发展简史与趋势

由此可见,作为与人类文化发生史相伴生的符号技术呈现出追求更高时空维度、更多感官意识维度的必然趋势,因此,数字文献技术这一作为人类思维与智能的外化与延伸的符号技术必然成为当今人类符号技术发展的大势所趋与时代主题。方兴未艾的数字化改变了传统文献的生产、存储、研究和使用方式,以印刷媒介为基础的传统文献生产体系正向以智能媒介为前提的数字文献生产体系转变。[10]数字化促进了知识形态的变革与演进。随着大数据技术的应用以及人工智能等数字技术的发展,古籍数字化、文献数字化已成为共同趋势,数字文献大量出现。数字人文数据以文本形式为主,兼有图片、音频、视频、3D等多元数据形式。文本资料有地方古典文本资料、图书、笔记、家谱资料等。图片有地图、画作、壁画等。3D数据有器皿、雕塑等。音频与视频数据包括访谈、纪录片等多媒体数据。[11]

与此同时,由于人类符号技术始终不断追求更高时空维度、更多感官意识维度的表达,因此,每当有一种新的、具有更高时空维度与更多感官意识维度的人类符号技术出现后,此前所记录下来的人类文化历史都将被这种新的符号技术“重新书写”,并被依托其更加丰富的维度与感官进行持续不断地“扩写”与“创写”。并且,这样的“重新书写”呈现出越来越多的高时空、跨学科、多模态、全场景等特点,为人类、文化、历史的全面延伸尤其是具有悠久历史文献传统的中华优秀传统文化的全面延伸提供了无限丰富的可能。

二、文献学的数字化应用——以中华书局“苏东坡数字人”为案例

习近平总书记曾强调,“要系统梳理传统文化资源,让收藏在禁宫里的文物、陈列在广阔大地上的遗产、书写在古籍里的文字都活起来”。让文物和文化遗产“活起来”……最终实现“让文物说话,让历史说话,让文化说话”。[12]为此,中华书局立足自身深厚的文化积淀与数字文献技术优势,首创研发了全国首位3D超写实历史文化名人——“苏东坡数字人”。

(一)从数字文献视角看古代历史文化名人数字人的研发特征

“数字人”是指通过计算机图形渲染、动画驱动、动作捕捉、语音合成、人工智能等技术打造的虚拟仿真人物,其产生本身就是文化与科技深度融合的产物。清华大学《2020—2021元宇宙发展研究报告》指出,2021年被产业界称为“元宇宙元年”。因此,作为未来元宇宙数字世界主体性存在的“数字人”,自2021年迎来了爆发式的发展。与此同时,随着我国经济社会的全面发展和国际地位的不断加强,中华优秀传统文化在作为互联网原住民的年轻人群中的认同度与影响力在不断提升。在这样的时代背景下,从2021年至今,各类国风数字人陆续发布,俨然已经成为中华优秀传统文化活化利用的标配。如2021年10月28日,中央戏剧学院与北京理工大学共同发布“梅兰芳”,2022年5月18日,中国文物交流中心发布“文夭夭”,2022年6月3日,新华网发布“筱竹”,同一天浙江卫视发布“谷小雨”,2022年6月15日,敦煌研究院发布“伽瑶”,2022年7月22日,国家博物馆发布“艾雯雯”,等等。

但纵观以上多位国风数字人,除了“梅兰芳”外,均属于“纯虚构型”数字人,即历史上并没有真实存在过这个人物,而对于古代的真实历史文化名人进行“复活”的超写实数字人,则一直是一个空白。究其原因,需要先从数字人的分类入手进行分析。

在中华书局“苏东坡数字人”之前,数字人行业内对于数字人的分类通常是采用两类方法。其一,是根据数字人的角色形象与建模技术进行分类,分为二次元数字人、2.5次元数字人、3D卡通数字人、3D写实数字人等。其二,是根据数字人的功能与应用场景进行分类,分为服务型数字人、身份型数字人等。其中,服务型数字人可用于替代真人服务,并作为多模态AI助手提供服务,如虚拟主播、虚拟教师、虚拟客服等;身份型数字人则可以实现虚拟IP、虚拟分身等功能。然而,这两种分类方法均无法解释和分析历史文化名人数字人的独有特征。为此,中华书局立足数字文献的全新视角,对数字人进行了全新的分类,并从文献不同特征的角度进行象限化分析,逐步探索出历史文化名人数字人研发的理论基础与方法论思路。

首先采用“有无文献依据”和“文献是否齐清定”两个指标来进行分析,可以得出如下的三个象限,如表1所示。第一类虚拟数字人对象是“在历史文化符号世界中曾经真实存在过的人”,这类数字人的研发是基于真实有效的文献资料,且文献具有“齐”(齐全)、“清”(清晰)、“定”(确定)等特点。第二类虚拟数字人对象是“正在活着的人”,他们虽然有文献资料记载,但其文献资料还处于不断创作和变化之中,所以具有不稳定性,还未成“定论”。第三类是纯虚拟数字人,这类数字人并无文献典籍的基础,在历史上未曾真实生活过。

1基于文献维度的全新数字人分类(一)

然后,可以采用“文献的维度”和“文献的感官”两个指标来对第一类数字人进行进一步分析,如表2所示,古代历史文化名人只有关于身体记录的抽象的文字文献(可视为一维文献),但现代历史文化名人具有三维立体身体数据(三维文献)和动态影像文献(四维文献)。另外,古代历史文化名人只有画像等“非完全真实”的视觉文献,无真实的听觉、嗅觉等文献,但现代历史文化名人具有真实的视觉、听觉文献,甚至可能留存有部分程度的嗅觉文献。他们留存有照片、音视频、使用过的器物等资料。

表2 基于文献维度的全新数字人分类(二)

最后,再通过“有无真实地理文献”这一指标,还可以将古代历史文化名人176分为两类,如表3所示。一类是以苏东坡、李白、李清照等中华先贤人物为代表的曾在历史上真实活过的人物,另一类是以苏小妹、林黛玉、孙悟空等为代表的在文学符号世界中存在的人物。

表3 基于文献维度的全新数字人分类(三)

(二)中华书局古代历史文化名人数字人研发的方法论心得

综上所述可以看出,对于超写实的古代历史文化名人数字人的研发而言,可谓是一项几乎前无古人的工作,一方面要求数字人的开发技术本身必须达到与超写实纯虚拟数字人同样的行业前沿水准,另一方面又不允许像纯虚拟数字人那样天马行空地随意发挥,但与此同时,又缺乏像邓丽君、梅兰芳数字人那样的真实照片与动态视听影像的文献支撑,因此需要独辟蹊径、守正创新。为此,中华书局始终牢牢扎根“文献”这一关键基础,逐步摸索出了一些古籍文献数字化应用的全新方法论。

其一,要将重写与创写有机结合。

如前所述,每当有一种新的、具有更高时空维度与更多感官意识维度的人类符号技术出现后,此前所记录下来的人类文化历史都将被这种新的符号技术“重新书写”,并被依托其更加丰富的维度与感官进行持续不断的“扩写”与“创写”。就超写实古代历史文化名人数字人的研发而言,首先,必须要求是“重写”,而且是严格遵从古籍文献学术共识的“重写”,这是与纯虚拟数字人研发方法的根本区别——也因此,古籍文献数据的学术共识对于超写实古代历史文化名人数字人的研发来说是应该具有“一票否决权”的,即明显不符合古籍文献记载的古代历史文化名人数字人是应该被限制准入的。

以苏东坡数字人的“塑形”为例,中华书局在总字数超70亿字的古籍大数据中心中进行了海量搜索,通过一系列精心设计的关键词精准抓取到了一批涉及苏东坡容貌形象的古籍文本数据,与此同时,又通过图像搜索技术,抓取了由宋至清各个不同时期所作的涉及苏东坡的画作100余幅,既包括苏东坡单人画像,也包括如《西园雅集》《赤壁》等主题群像以及若干石刻画像拓片等,从而初步形成了对于苏东坡容貌形象之“古籍真实”的把握,然后再结合权威专业的专家系统进行校验,最终确定下来超写实苏东坡数字人的每一个细节并确保与历史文献资料不相违背,实现严格科学的“重写”。

然而,由于古代历史文化名人只有来自古籍文字记载的一维文献和非完全真实的画像类二维文献,缺乏像邓丽君、梅兰芳等人的真实三维立体身体数据和动态影像数据这样的四维文献,所以对于古代历史文化名人数字人的“塑形”而言,科学规范的“重写”只能做到“不错”(即没有古籍文献的反例),但无法证明“全对”(即只有如此才是唯一正确的),因此,在“不错”与“全对”之间的部分,需要进行一定程度的“创写”——这也正是古代历史文化名人数字人与邓丽君、梅兰芳等数字人研发方法的根本区别。

以苏东坡数字人为例,中华书局在深入挖掘古籍文献中对于苏东坡容貌形象的记载数据的同时,还致力于深度提炼苏东坡的精神气质。为此,中华书局通过“苏东坡专题数据库”与“苏东坡主题知识图谱”的深度挖掘,侧重提取苏东坡本人、同时代人、后代历史人物以及现当代专家学者对于苏东坡精神气质的凝练与概括,并且还对当前各大主要社交媒体上有关苏东坡的内容中反映的东坡气质进行了搜集与提炼,最终实现在“塑形”基础上进一步的“凝神”,让苏东坡数字人不仅形似,更加神似。

图4 全国首位3D超写实数字人苏东坡

其二,重写与创写都具有当代性。

正如前文所言,任何一个符号,就其能指而言,都是特定历史时代与对应的特定符号技术下对多维度、全感官生命经验的部分维度、部分感官的“投影”,“苏东坡数字人”作为当下时代产生的一个数字文献符号作品,它的“重写”与“创写”也都具有典型的“当代史”特征,即它在将古籍文字一维文献、画像类二维文献以及精神气质等的文字表达综合起来最终予以3D超写实、可动态交互的数字人表达时,其实已经不可避免地带进了“当代人们的精神”,一如意大利历史哲学家贝奈戴托·克罗齐(Benedetto Croce,1866—1952)在其《历史学的理论和实际》一书中指出的:“一切历史都是当代史。”在克罗齐看来,当代性不是某一类历史的特征,而是一切历史的内在特征。[13]真正的历史属于当代生活,当我们在思考过去的历史时,会把过去纳入我们当前的思想和精神之中,体现我们当前的思想活动和精神生活,历史时刻此时便与人们的思想或精神紧密相连,成了“活生生的历史”,也反映了当下人们的思考,因而从这一意义上来说一切历史都是当代的。由于实践的需要以及人们对历史事件的认识不断深化,历史上发生的事件会以新的形式再次“复现”。

其三,既要塑形、凝神,更要赋魂。

为了让古籍里的历史文化名人真正地“活起来”,让他们以数字人的身份真正走出古籍书本、走进当今时代、当下生活,我们需要将平面化的文学文本转变为立体化的虚拟场景。这不仅能带来视觉上的直观冲击,同时还能提供互动式体验和全新理解。[14]因此,在数字人“塑形”“凝神”的基础上,我们需要进一步为其进行“赋魂”。

以苏东坡数字人为例,“赋魂”主要体现为古籍大数据与人工智能技术的深度融合。在这一方面,中华书局一直在持续进行古籍人工智能技术的自主研发,通过对70亿字古籍大数据的深度机器学习与人工智能训练,目前中华书局开发的古籍智能处理系统已经可以自动给古籍断句标点、自动标记人名地名、自动核对引文、自动识别古籍文字等。[15]下一步,中华书局将在上述工作的基础上,基于与主流大模型的深度合作,使用苏东坡专题数据库对大模型进行专项人工智能训练,从而让苏东坡数字人越来越像真正的苏东坡一样去认知、去思考、去表达、去行动,最终实现苏东坡在元宇宙数字世界真正的“复活”,让苏东坡成为“中国式美好生活的代言人”,让他“活”在我们这个时代。

以人工智能版苏东坡数字人的现场实时自然语言交流为例,至少涉及如下的技术环节:(1)提问者自然语言自动转换成文字;(2)文字自动输入大模型(外挂专题数据库)并自动生成回答文字(该回答至少符合3个维度的要求:自然语言之通畅,史实学术之正确,符合苏东坡的身份与气质);(3)回答文字自动生成数字人的语音;(4)根据语音自动驱动唇形;(5)根据语义自动匹配表情;(6)根据语言和表情自动匹配肢体动作;(7)服饰等跟随肢体动作实时自动解算。

可见,要想真正给数字人“赋魂”,不仅涉及人工智能、边缘计算、虚拟现实、实时动捕等技术,还需要专业的专题数据库、匹配应用场景的深度知识图谱等大量数据挖掘与知识服务能力的支持——例如对于历史文化名人的古籍数据进行挖掘、梳理、加工并实现数据可视化,实现文化资源数据与文化数字内容的标识解析、提炼转化、搜索查询、匹配链接、传播利用等。

(三)中华历史文化名人数字人与中华文化元宇宙展望

元宇宙是数字技术与文化内容的双向融合、联动共生。元宇宙将会给内容产业带来新的进化,在内容生产、内容形态、内容衍生、内容体验等层面赋予新的定义。[16]“数字人”被视为未来人们进入“元宇宙”的入口,将广泛应用在元宇宙新生态中,作为元宇宙中“人”与“人”、“人”与事物、事物与事物之间产生联系或发生孪生关系的新介质,起着举足轻重的作用。可见,传统的中华文化内容产业将会被持续赋能、创新发展。人类经验对象有可能实现全面数字孪生化,线下物理空间将可能全面混合现实化,线上线下场景将全面人工智能化。

在这样的背景下,中华书局将继续发挥古籍数字化专业优势,以主题出版工程“中华先贤人物故事汇”为底本,持续研发系列化的“中华历史文化名人数字人”,如李白、李清照、陶渊明、戚继光等,逐步形成数字人矩阵,深入挖掘历史文化名人的古籍数据,在数字科技加持下进行现代化表达,形成“中华先贤数字人”IP矩阵,真正让“书写在古籍里的文字活起来”“把优秀传统文化中具有当代价值、世界意义的文化精髓提炼出来、展示出来”,让中华优秀传统文化融入时代、融入生活,更好地满足数字时代人们对于中华传统文化持续高涨的热情和需求。

进而,在全新的数字经济时代,中华文化内容产业基于古籍大数据,借助元宇宙数字科技,将有可能彻底突破传统媒介格局,构建全新数字内容生态,“创造性复原”书写在古籍里的“人、货、场”,实现中华文化的人、场景、叙事的全面数字孪生到数字原生再到虚实共生,最终实现中华文化元宇宙的宏伟愿景。

三、“新文献观”对文献学专业研究与教学模式变革的启示

如前所述,正因为每当有一种新的具有更高时空维度与更多感官意识维度的人类符号技术出现后,此前所记录下来的人类文化历史都将被这种新的符号技术“重新书写”,并依托其更加丰富的维度与感官进行持续不断地“扩写”与“创写”,这也直接导致人类符号技术的每一次变迁都引起文化形态与学术范式的升级转型。落实到当下的大学教育而言,数字人文可以被视为数智化时代人文与科技融合发展的前沿学术阵地,或许正可以塑造未来大学教育的新形态。

(一)文献学作为一门学科在近代中国的诞生

中国传统学问虽然也有分科,但主要是从研究主体而非客体乃至方法的角度来划分,是学派而非专业。清中后期汉学发达,开始出现专门化的倾向,如龚自珍在为《阮元年谱》作序时概括出了训诂之学、校勘之学、目录之学、典章制度之学、史学、金石之学、九数之学、文章之学、性道之学、掌故之学十个方面,但总体而言这些所谓的“专门”还处于萌芽的阶段。[17]

直至19世纪末以后,“中华民族到了最危险的时刻”,这引发了国人关于中西古今之争的深刻反思,也激发了从制度到思想的全面扬弃与重建。在学术和教育领域,古典的经学、礼教在现代学制中毫无生存空间,文以载道的圣人之学被彻底革除,西学东渐的大潮席卷而下,从自然科学到社会科学乃至人文学科,无不是建立在西方现代学科分类、研究范式和教育体系的基础之上的。在此“三千年未有之大变局”中,中国历代传统之学在大学体制中被摒弃,经史子集被肢解为文献学、语言学、哲学、史学等。1920年,梁启超在《清代学术概论》中首次提出“文献学”的概念;随后《中国文献学概要》的出版开始从学科的角度阐述文献学的内涵;陈垣、王国维、顾颉刚、罗振玉等一大批学者推动了文献学学科体系的创建。

(二)分科而治导致的“人”与“学”之分

在更广阔的历史和地理空间上考量,工业革命后职业教育对传统大学教育的冲击,以及以洪堡思想为代表的研究与教学相结合的新型大学潮流,使得德国逐渐成为当时世界教育和学术的中心。但与之相对的,作为“牛津运动”代表人物的英国主教纽曼在其著名的《大学的理念》中重新阐释了知识的分类,并在此基础上提出大学的本质在于心智的培养,从而提醒人警惕知识之恶。

与之遥相呼应的,清末新政中出台的我国第一个真正实行的现代教育体系——“癸卯学制”,其所设定的教育宗旨即为“端正趋向,造就通才”,即使是对立足于专门教育的大学堂,仍贯彻着“通”的理念。一方面,专门之学是通经致用的工具;另一方面,治学的目的是立人,学问只是成为“通人”的工具。[18]

正如钱穆先生所言:“在中国传统知识界,不仅无从事专精自然科学上一事一物之理想,并亦无对人文界专门探求某一种知识与专门从事某一种事业之理想。因任何知识与事业,仍不过为达到整个人文理想之一工具,一途径。若专一努力于某一特殊局部,将是执偏不足以概全,举一隅不知三隅反,仍落于一技一艺。”[19]他以此批评西方近代的学科分立时说道:“即就西方近代传授知识之大学言,分科分系,门类庞杂,而又日加增添。如文学院有文学史学哲学诸科系,治文学可以不通史学,治史学亦可不通文学。治文史可以不通哲学,治哲学亦可不通史学文学,各自专门,分疆割席,互不相通。……要而言之,则可谓之不明大体,各趋小节。知识领域已乱,更何论于人事。”[20]在前后断裂的历史大潮中,知识层面的整理国故,以及西方导向的分科而治,目光指向的只能是专精而非博通、保存而非应用、批判而非创新。

(三)新时代提供了“文”与“献”合璧的可能性

时至今日,变局再现。这一次,工业文明经历了几十年的后工业过渡,终于开启了数字智能时代的大门。人类信息环境正在发生根本性的改变,人类文明记录和传播方式的大规模变革势必引发文明本体的重建和知识谱系的改写。以本文“新文献观”的视角来看,人与世界是一个具有历史性和当代性的整体,“文”正呈现出对“立人”的重视与回归,“献”则经历了知识生产方式的不断迭代,不论是对于文献学专业的研究和教学,乃至更广阔范围上的大学教育,都具有深刻的启发意义。为此,本文认为应该努力做好如下“三合”。

第一是专业与通识的结合。工业时代,专业教育的重要性毋庸置疑,大学为工业化的全面胜利贡献了最重要的人力基础和技术创新。同时,相伴而生的通识教育也一直在呼吁人本主义的回归,抵抗着过度专业化给人带来的异化和禁锢。但近年来,数字鸿沟、算法黑箱和信息孤岛似乎进一步强化了专业教育的卓越性,数字智能时代的技术主义与全球主义对通识教育带来了巨大的冲击和挑战。[21]因此,大学的通识教育更应与专业相结合,走出一条专业基础上的通识之路。这不仅是因为专业教育本身已经从工业文明的摇篮跃迁为智能社会的航母,更是源于通识教育开始卸下西方“普世价值”的面具,转而深入探讨数字智能时代的“人”的本质属性。

具体而言,通识教育模式的重心在于对经典文献的研读,这恰是对一个时代经典问题的凝练、思考和解答。数字化时代的文献学更强调对于文献的跨时空、跨学科理解,不仅是知识形态的改变,更激活了其内涵的文化精神,建构出“历史—当代”相连接的当代性意义世界。这就使今日的通识教育不再局限于一般的或者说以西方价值为内核的公民教育和批判精神,转而推动个体的社会化、本土化,高扬科技与人文的交叉,塑造一种具有超越性的共同体意识,最终培养出符合“君子不器”的、可以创造和驾驭“苏东坡数字人”这一类新型成果的复合式、高层次、战略性未来人才。

第二是基础与应用的融合。2023年2月,习近平总书记在主持中共中央政治局第三次集体学习时,着重阐述了强化基础研究的重要性,强调要有组织推进“战略导向的体系化基础研究、前沿导向的探索性基础研究、市场导向的应用性基础研究”[22]三种基础研究。尤其是“应用性基础研究”的提法更是直指“学”与“用”相分裂的痼疾——而这一点在传统的人文领域更是以“无用即大用”为由成了一种自傲。实际上,基础是源头,应用是牵引,从“文”到“献”的内化正是在应用转化的过程中实现的。尤其对于人才培养来说,如果没有(广义上的)就业前景,这个学科几乎就丧失了存在的合法性。以应用为导向的基础研究和人才培养,更加明确了目标指向和评价标准,倒逼综合改革的落地,打通了大学与社会的互动链条。

因此,一方面,数字文献学是应用数字技术来研究文献,另一方面,这也是数字技术为文献学开创了广阔的应用空间,促使其更好地服务于学术研究和社会大众,从而激活其生命力和生产力。从前述“苏东坡数字人”案例就可以看出,权威的古籍数据与专业的学术研究是基础、是源头,但如果没有数字科技的应用转化与产业赋能,这些数据就无法成为生产资料,最终也就无法形成生产力;与此同时,“苏东坡数字人”在媒体传播、城市IP发展、展览展示、文旅商融合以及人工智能驱动等方面面临的新场景、新机遇,也反过来对古籍数据的数据挖掘与知识服务、数字人人工智能的情感模型等新领域提出了更多更新、前所未有的技术与理论需求,这又引导和推动了对应学术研究的发展与创新,最终形成基础与应用融合的正反馈循环。

第三是传承与创新的综合。从推动中华优秀传统文化创造性转化、创新性发展,到把马克思主义基本原理同中国具体实际相结合、同中华优秀传统文化相结合,再到建设中华民族现代文明,习近平文化思想不断将文化传承与创新的理念推向新高度。《中庸》讲“父作之,子述之”,《论衡·对作》有“圣人作,贤者述”,“作”为创新,“述”为传承。创新需要积累,需要专业的、跨学科的、跨文明的视野,需要发现问题,更需要具有使命感。创新与传承互促共生,创新因传承而生机绵延,传承因创新而波澜壮阔。这不仅是历史与未来相逢于当下,更是作者与读者、师与生、数与文的相互成就。大学教育的本质即在于人类文明基因的复刻和进化,既追求永恒不变的“形而上者谓之道”(《易经》),又以求新求变的“圣之时者”为典范(《孟子》)。

于“苏东坡数字人”而言,它既是对历史文化名人苏东坡的“复原”,又要努力实现文化意义上的“复活”,前者是传承,后者是创新,二者缺一不可。所谓“复原”意味着“苏东坡数字人”拥有苏东坡的全部知识、记忆、史实、精神等,所谓“复活”意味着“苏东坡数字人”要融入当今的时代,用他独特的精神面貌、思想深度、批判视角和人文情怀去对当下时代、当今世界进行活生生的观察、判断、表达乃至行动、实践,进而用苏东坡的文化精神来产生现实的影响和改变。

四、结语

随着时代的发展,“文献”一词的含义在不断变化。本文立足于“文献”概念原初含义的理解框架,将“文”与“献”纳入一个整体框架来进行理解,通过引入文化哲学、技术哲学的新视角探索一种新的“文献观”表达,即“文献”是一个符号系统,是人类进行一切生命活动的符号化记录。从文化哲学的视角,人是符号的动物,符号是人区别于动物的一个显著特点;从技术哲学的视角,符号是人体感官的外化与延伸,作为人与世界的中介的符号及其能力也可以被视为“符号技术”。

人类符号技术的发展史其实就是人类文化的发生史,数字文献技术这一作为人类思维与智能的外化与延伸的符号技术已成为当今人类符号技术发展的大势所趋,并使得数字人文成为必然。中华书局立足自身深厚的文化积淀与数字文献技术优势,首创研发了全国首位3D超写实历史文化名人“苏东坡数字人”,并从中摸索出了一些古籍文献数字化应用的全新方法论——这也必然伴随着人才培养的探索与创新。

落实到当下的文献学专业研究与教学而言,为了避免近代以来分科而治所导致的“人”与“学”之分,培养出既具有文史知识积淀和传统淑世情怀、又具有现代科技视野和基本数字素养的新生代学人,就需要做好专业与通识的结合、基础与应用的融合、传承与创新的综合,最终,在数字人文时代的新视野下,抓住机遇、守正创新,塑造未来大学教育的新形态。

The “New Document Perspective” in the DigitalHumanities Era and Its Implications for the Reform ofDocumentary Studies Education: A Case Study of ZhonghuaBook Company’ s “Su Dongpo Digital Human”

Guo Lin, Wang Jian

Abstract: In traditional Chinese culture, the concept of “wenxian” encompasses both the meaning of ancient classics and records (“wen”) and the scholars who master these classics (“xian”). However, the later discipline of documentary studies has, to some extent, lost the “human” dimension. To provide an understanding framework that is more aligned with the original connotation of “wenxian” and better suited to the current era of digital humanities, this paper attempts to introduce new perspectives from cultural philosophy and technical philosophy to propose a new “view of wenxian”, striving to integrate “wen” and “xian” into a holistic framework for interpretation. From the perspective of cultural philosophy, humans are the animals of symbols; from the perspective of technical philosophy, symbols are the externalization and extension of humans. Humans can create symbols and thereby create culture, and “wenxian” is precisely a symbolic system that relies on the symbolic writing and media technologies of the corresponding era. In the new era of digital humanities, the application of digital documents has become increasingly widespread. Digital document technologies have made the creation of digital humans of historical and cultural celebrities not only possible but also inevitable. At the same time, changes in symbolic technologies will inevitably lead to the upgrading and transformation of cultural forms and academic paradigms. Currently, the reform of research and teaching models in university documentary studies programs needs to strive to integrate professionalism with general education, basic theory with practical application, and inheritance with innovation. Only in this way can we shape a new form of future university education, create more outstanding cases like the “Su Dongpo Digital Human,” and effectively promote the creative transformation and innovative development of China’s excellent traditional culture.

Keywords: Cultural Philosophy; Technical Philosophy; Document Perspective; Digital Human; Documentary Studies; Digital Humanities

编辑 | 耿弘明

向上滑动 查看注释

[1]朱熹:《四书章句集注》,北京:中华书局,1983年,第63页。

[2]刘宝楠:《论语正义》卷3,北京:中华书局,1990年,第92页。

[3]杨伯峻:《论语译注》,北京:中华书局,2017年,第27页。

[4]恩斯特·卡西尔:《人论》,甘阳译,上海:上海译文出版社,2004年,第37页。

[5]恩斯特·卡西尔:《人论》,第38页。

[6]恩斯特·卡西尔:《人论》,第44页。

[7]郭明哲:《恩斯特·卡普:技术哲学奠基者》,《理论界》2008年第7期。

[8]黄旦:《延伸:麦克卢汉的“身体”——重新理解媒介》,《新闻记者》2022年第2期。

[9]赖黎捷、李明海:《从“人体延伸”到“思维延伸”:麦克卢汉与凯文·凯利技术哲学述评》,《重庆师范大学学报(哲学社会科学版)》2014年第6期。

[10]刘石:《文献学的数字化转向》,《文学遗产》2022年第6期。

[11]王军、张力元:《国际数字人文进展研究》,《数字人文》2020年第1期。

[12]习近平:《加强文化遗产保护传承弘扬中华优秀传统文化》,《求是》2024年第8期。

[13]贝奈戴托·克罗齐:《历史学的理论和实际》,傅任敢译,北京:商务印书馆,1997年,第3页。

[14]刘石:《文献学的数字化转向》,《文学遗产》2022年第6期。

[15]俞国林、王建:《数字人:用科技激活传统文化之美》,《光明日报》2023年1月4日第13版。

[16]王建、付小艳、张建丽:《从数字出版到数据产业再到内容元宇宙——传统数字出版的新型破局之路》,《出版人》2022年第11期。

[17]张寿安:《龚自珍论乾嘉学术:专门之学——钩沉传统学术分化的一条线索》,《学海》2010年第2期。

[18]郭琳:《新教育下的宗经与存古——从〈劝学篇〉和“癸卯学制”看张之洞的经学教育变革》,博士学位论文,北京大学,2017年。

[19]钱穆:《中国知识分子》,《国史新论》,北京:生活·读书·新知三联书店,2018年,第139页。

[20]钱穆:《现代中国学术论衡》,北京:生活·读书·新知三联书店,2001年,第94—95页。

[21]强世功:《数字智能时代的大学通识教育》,《复旦教育论坛》2023年第2期。

[22]习近平:《加强基础研究实现高水平科技自立自强》,《求是》2023年第15期。

扫描下方二维码即可购买《数字人文》期刊

校对  |   肖爽

美编  |  王秀梅

数字使人文更新

投稿:https://szrw.cbpt.cnki.net

数字人文门户网站:www.dhcn.cn

阅读原文

跳转微信打开

  •  

第七届清华数字人文国际论坛“未来学者”专场报名通知

2026-04-22 18:00 北京

在人工智能技术迅猛发展的今天,数字人文领域正经历前所未有的变革。数据驱动的研究方法、跨学科的技术融合以及人工智能在文化遗产、文本分析和数据可视化等领域的应用,为学术研究带来了全新的可能性。

“未来学者”专场

人文学术的未来,寄托于未来的人文学者;也即是当下正致力于研究和探索的青年学子。为鼓励和支持本、研阶段学生投入数字人文研究,结合数字时代新方法、探索人文学术新方向,《数字人文》学术集刊持续举办第七届“未来学者”论坛,诚邀国内外的本科生、硕士生、博士生在读学生(不含博士后)投稿并参会。

期待来稿面向人文问题、结合数字方法,给出来自文学、历史、哲学、社科、艺术、教育、传播乃至政治学、图情档案等各个领域的回答和发现。

本届入围者将受邀参与第七届清华大学数字人文国际论坛“未来学者”专场,获得专家指导评议及进一步研究支持,并于本刊择优刊发。

投稿须知

摘要提交截止日期:2026年5月22日

全文提交截止日期:2026年6月12日

投稿地址:

https://szrw.cbpt.cnki.net 

入围名单及参会事宜请参见后续通知。

时间地点

2026年7月10日-13日    共4天

报到7月10日

会议 7月11日—12日

赋归7月13日

上海大学宝山校区(上海市上大路99号)

合作酒店

上海衡山北郊宾馆

:上海市宝山区沪太路4788号

总机: 021-56040088

(注:若实际报名人数超过酒店接待上限,会务组可能新增其他酒店安排接待)

我们期待您的参与,共同探讨数字人文的前沿议题,推动学术研究的创新与发展!

论文格式模板及要求-中文.pdf

论文格式模板及要求-中文.pdf

会议时间地点

2026年7月10日-13日    共4天

报到  7月10日

会议  7月11日—12日

赋归  7月13日

上海大学宝山校区(上海市上大路99号)

会议合作酒店

上海衡山北郊宾馆

地址:上海市宝山区沪太路4788号

总机: 021-56040088

(注:若实际报名人数超过酒店接待上限,会务组可能新增其他酒店安排接待)

论文格式模板及要求-中文.pdf

END

数字使人文更新

投稿:https://szrw.cbpt.cnki.net

数字人文门户网站:www.dhcn.cn

阅读原文

跳转微信打开

  •  

吴冠军 | “MAGA元宇宙”里的另类现实——当代美国谎言政治研究

吴冠军 2026-04-23 09:00 浙江

以下文章来源于:华东师范大学学报哲学社会科学版

华东师范大学学报哲学社会科学版

向广大作者和读者提供本刊的最新资讯和动态。

“MAGA元宇宙”里的另类现实

——当代美国谎言政治研究

吴冠军

摘要

自特朗普2016年获选美国总统至今,美国政治发生了巨大且实质性的变化;然而各种显著变化却遮盖了一个根本性的转变——美国民众对说谎的态度之转变。今天的美国,最高领导人谎言被频繁揭穿,却仍坚决以“真相追寻者”自诩,并能获得近半国人以及大量硅谷精英的支持。这一“特朗普现象”深刻地重新界定了当下美国的伦理性实质。通过对当代美国谎言政治的独特形态做出深入考察,我们旨在揭示出特朗普如何将谎言成功地政治化与武器化,并改写了当代美国的伦理性实质。在当代美国政坛,谎言不仅仅被用于遮盖原有现实,而且被用于构建另类现实。

关键词:特朗普现象; 谎言政治; 另类现实; 真相政制; MAGA 元宇宙

本文发表在《华东师范大学学报(哲学社会科学版)》2025年第5期 #政治学研究 栏目

作者简介

吴冠军,华东师范大学政治与国际关系学院教授暨中国现代思想文化研究所研究员

目录

一  从“政治中的谎言”到“谎言政治”

二  以自身面目参与政治的谎言

三  “真诚性的胜利”与美国文化之溃败

四  构建现实:一种认识论-本体论的谎言政治

五  作为缝合点的谎言:元宇宙里的“真相政制”

一  从“政治中的谎言”到“谎言政治”

法国科学哲学家、思想史家亚历山大·科瓦雷在发表于1943年的《现代谎言的政治功能》 一文开篇写道:“从来没有像我们这个时代这样说谎如此猖獗。从来没有像现在这样说谎如此无耻,如此系统,如此停不下来。”

时间推进到81年后。2024年6月27日,在唐纳德·特朗普与约瑟夫·拜登总统候选人电视辩论结束后,美国多个媒体展开了事实核验,揭示出整场辩论中特朗普面不改色地说了近30个谎言。面对着电视镜头,谎言竟还是如此猖獗,如此停不下来。

1998年,当时的美国总统比尔·克林顿面对电视直播镜头说了一个谎言(并且不是关于国家事务,而是关于私人生活),随即遭到正式弹劾并险些就此下台。然而2024年,特朗普面对电视直播镜头说了近30个谎言,事后对自身却没有带来任何实质性的负面影响,甚至反过来有实质性的积极影响——他接连击败了民主党的两位强大对手(在任的总统与副总统)而获得了胜利。

特朗普面对电视镜头说了一个又一个谎言,非但本人毫发无损,反而令其对手深陷困境——特朗普与拜登的总统选举辩论后,民主党内部随即涌起了要求后者退选的强烈呼声。面对这种来自“自己人阵营”的施压,拜登本人及其竞选团队尽管多次宣称坚决不退选,但最终仍然扛不住党内巨大压力,在“被盟友背叛的愤怒”中于7月21日不得不宣布退出。

这意味着,这场电视辩论令包括拜登盟友在内的民主党诸多实力派人物一致认为,拜登不是特朗普对手。亲民主党的主流媒体《时代》 周刊在那场辩论刚结束,随即就以一片红色为杂志封面,拜登低头离场。封面上除了“时代”(Time)之外只有一个单词:“恐慌”(panic)。《政治家》 等媒体更是发明了“拜登危机”(Baiden crisis)这个词,来形容在总统辩论后拜登的处境。这场辩论的四个多月后,尽管民主党临时更换了总统候选人,特朗普仍然获得了2024年美国总统选举的最终胜利——时隔四年其人再次入主白宫,成为该国历史上就职年龄最大以及首位曾被刑事定罪的总统,共和党亦自2004年以来首度同时赢得选举人票及选民票。12月11日,《时代》 周刊把2024年度人物给了特朗普,并以《美利坚分众国总统》 (President of the Divided States of America)作为标题。

面对当代美国选举民主实践中的“特朗普现象”,我们有必要定位到一组极其不寻常之处:(1)共和党并未因特朗普巨量谎言被揭破而逼迫他退选;(2)民众们亦没有揪住特朗普面对电视直播镜头说谎一事痛加谴责;(3)总统辩论后多家主流媒体相继宣布频繁输出谎言的特朗普是这场辩论的赢家;(4)民主党则因拜登现场无力招架特朗普连篇谎言反而逼其退选(并达成目标),包括《纽约时报》 与《经济学人》 在内的亲民主党媒体编辑委员会发表社论敦促拜登退选。

基于上述这组独特现象,我想提出如下论题:弥漫于美国总统选举中的巨量谎言,标识出的不仅仅是政治中的谎言(lies in politics),而是谎言政治(politics of lies)。那么,两者之间存在着怎样的区别?

1941年逃离欧洲到美国定居的犹太裔政治理论家汉娜·阿伦特曾借助1971年在媒体曝光的“五角大楼文件”,深入地分析了政治中的谎言:“五角大楼文件的核心问题是隐瞒、虚假以及故意谎言的角色,而不是幻象、错误、误算等。”该档案的曝光,使得美国政治的“可信性缺口”(credibility gap)被撕裂成深不见底的深渊,“各种类型的谎言性陈述(欺骗以及自我欺骗)的流沙极易吞没任何对这些文件材料一探究竟的读者;不幸的是,他还必须承认,这些材料就是近十年来美国外交与内政政策的基础架构”。

关于“政治中的谎言”阿伦特的洞见是:谎言具有本体论基础,不可能因道德谴责而消失。她写道:

谎言并非因人类有罪性(human sinfulness)的偶发而悄然渗入政治。仅仅出于道德义愤,不太可能使谎言消失。故意的虚假涉及偶然的事实;也就是说,涉及本身并不包含内在固有的真理(inherent truth)、不具有如其所是的必然性的事物。

事实在本体论层面上的这种偶然性使其变得脆弱,“在一定程度上使欺骗如此容易,如此诱人”。政治领域则更是很容易就成为谎言的重灾地,“诚实(truthfulness)从来没有被算作一种政治德性,而谎言则总是被视为政治事务中的正当工具”。

对于“政治中的谎言”阿伦特特别指出,美国政治中国家总统由于工作繁重,故此需要大量顾问,需要许多“问题解决者”(problem-solvers),这些人——其中不少来自大学与智库——熟练运用各种来自公共关系学乃至博弈论中的技巧,来帮总统解决问题并维护其“形象”,“他们说谎,与其说是为了他们的国家(当然不是为了他们国家的生存,因为国家的生存从未受到威胁),不如说是为了国家的‘形象’”。这些政治中的谎言制造者,把美国的“形象”打造得非常高大上,“他们不仅聪明,而且以‘理性’自居,他们确实在相当惊人的程度上超越了‘多愁善感’,并热衷于‘理论’——那个纯粹由心智构建的世界”,“这些问题解决者与地道的说谎者所共享的就是清除事实的努力,以及对清除事实之可能性的信心(因事实之内在固有的偶然性)”。他们“如此确信:操纵人民是无限可能的,他们关于这个可能性的诸种心理学预设是可靠的”。出自这些形象建筑师之手的金光闪闪的“美国”,只是清除各种“不受欢迎的事实”后的一个巨大谎言——这个谎言每每被诸如“五角大楼文件”这样的曝光事件所刺破。

基于对彼时美国政治的分析,阿伦特提出:政治中的谎言不管再怎样泛滥和猖獗,都无法最终得逞(亦即,无法让自身转变成“真相”),那是因为“无论一个经验老到的说谎者编织的虚假罗网有多大,也总是不够大,哪怕他借助计算机的帮助,也无法做到覆盖事实性的浩瀚;对于任意数量的单个谎言,说谎者都可能会成功,但他会发现,原则上成功地说谎是不可能的”,除非“杀死与说谎者同时代的所有人,并控制地球上所有国家的图书馆和档案馆”。

让我们暂且搁置“原则上成功地说谎是否可能”这个阿伦特于1971年所聚焦的问题,把时间推进到半个世纪后的美国。我们发现:政治中的谎言已经变成一种完全不同的东西。为了对这种全新事物展开分析,我们有必要用“谎言政治”这个概念来描述它。可以看到的是,当下美国政治中的谎言制造者并不怎么关注“形象”,也不怎么诉诸“理性”或热衷于调用公共关系学、博弈论等“理论”(被关注的说谎者们主要也不再是那些来自智库与学术界的专家)。

更为关键的是,说谎者甚至并不担心谎言被事实核验所揭穿;换言之,他们并不谋求用谎言来“覆盖事实性的浩瀚”。尤为独特的是,当政治中的谎言被揭穿后,说谎者们却并没有丧失支持率乃至葬送整个政治生涯,相反其竞争对手却陷入困境。这里的诡异之处在于,谎言并没有以冒充真相的方式使言说者在政治领域获得优势,而就是以其本来面目——被事实核验揭穿为“谎言”——做到了这一点。正是在这个意义上,我们用“谎言政治”一词来描述当代美国政坛的这种独特状况。

政治中的谎言哪怕再猖獗,都有对抗的方式:事实核验乃至密件曝光,皆是有效的遏制形式,阿伦特据此提出在政治领域“原则上成功地说谎是不可能的”。然而对于当代的谎言政治,这些遏制形式则几乎全然失效:谎言以其本来面目(而非冒充“真相”)来有效影响政治进程。

值得提出的是,当代美国这种完全不在乎事实核验的谎言政治,并不仅仅存在于选举环节,也不仅仅面向国内:在国际舞台上,特朗普政府亦以同样的方式来展开政治实践。阿伦特在论证没有人“有权利去触动”事实性的质料(factual matter)时这样写道:

为了阐明这一点,并作为不再深入探讨此问题的借口,我想讲这样一个故事:在(20世纪)20年代,克列孟梭在去世前不久,同一位魏玛共和国的议员就第一次世界大战爆发的罪责问题进行了一场友好的交谈。对方问克列孟梭:“在您看来,未来的历史学家会如何看待这个棘手而又充满争议的问题?”他回答道:“这个我不知道。但我确切知道的是,他们将不会说,是比利时入侵了德国。”我们在这里考虑的是这类最无情的基本事实,即使是历史主义的最极端、最诡辩的信奉者也接受它们是不可破坏的。确实,要从记录中抹去1914年8月4日夜晚德军越过比利时边境的事实,需要的远不只是历史学家们的一时兴起;要做到这点,至少将需要一种针对整个文明世界的权力垄断。

要篡改这种“最无情的基本事实”,在阿伦特看来,说谎者就必须拥有一种覆盖整个文明世界的垄断性权力,能够控制地球上所有国家的图书馆和档案馆;而这就意味着,“原则上成功地说谎是不可能的”。

然而,再度当选总统的特朗普,2025年2月19日在谈论俄乌冲突时,面对电视直播镜头与一屋子记者指责乌克兰“你们本就不应该发动战争;你们本来可以做个交易的”。然而核验下来,事实是2022年2月24日清晨俄军从东、南、北、东北四个方向越过乌克兰边境。特朗普声称乌克兰总统弗拉基米尔·泽连斯基的“支持率下降到只有4%”。核验下来的事实是泽连斯基其时的支持率超过50%。阿伦特认为至少是垄断“针对整个文明世界的权力”的人才会去对这样的基本事实进行说谎,然而当下的美国总统面对电视镜头,面对全世界人们的眼光,就这样做了。

同时需要重视的是,特朗普(作为美国总统)关于泽连斯基“支持率下降到只有4%”的声称,却是有很大可能性真的会导致泽连斯基的支持率变成那个数字。当年克林顿面对电视镜头说了一个关于私人生活的谎言遭到正式弹劾并险些下台;而当下特朗普面对电视镜头说了一组关于重大国际事务的赤裸裸的谎言(能有效并轻易核验出来的关于“最无情的基本事实”的谎言),非但自己不受影响,更会导致被谎言中伤的相关方承受巨大损失。阿伦特对“政治中的谎言”的分析,已经完全不适用于当下政治舞台中的谎言状况。

二  以自身面目参与政治的谎言

就美国政坛而言,从何时起,政治人物面对电视镜头说谎,变成不受惩罚甚至获得奖励的行为?要知道,特朗普2016年首次参加总统选举并获胜(赢得选举人票但输掉了民选票),尚未主要依靠“以谎制胜”。

这就意味着,自特朗普2016年以毫无从政经验的房地产商人身份参选并成功登上总统宝座后,美国政治已发生了巨大且实质性的变化。特朗普第二个总统任期,难以想象的操作更是接连而来:取消“多元、公平和包容计划”(Diversity,Equity and Inclusion, DEI)、中止“出生公民权”、取消教育部、撤销环境保护局、解散美国国际开发署、赦免了2021年1月6日国会大厦袭击事件中的1500多人、退出《巴黎气候协定》 、退出世界卫生组织、退出联合国人权理事会、宣布墨西哥湾更名为“美洲湾”、宣称美国必须获得巴拿马运河与格陵兰岛、系统性削减科研经费、全面清除留学生、将移民定性为“入侵”、在社交媒体上自称“国王”……然而,各种瞠目结舌乃至“目不暇接”的显著变化,却遮盖了一个根本性的变化——美国民众对说谎的态度变化。

根据《华盛顿邮报》 的一项统计研究,在特朗普担任美国总统的第一个四年任期内,共发表了30573条虚假或误导性言论,平均每天约21条。这些虚假言论的频率随着时间的推移而增加,从他第一年平均每天6条增加到最后一年平均每天39条。以1992年著作《理性公众》 为学界所熟知的当代美国政治学家罗伯特·夏皮罗,在其2022年文章《谎言、弥天大谎与美国民主》 中这样评论道:

自2016年大选唐纳德·特朗普获选总统以来,美国政治发生了翻天覆地的变化。在美国历史上,从未有过如此多的彻头彻尾的谎言被公开表达,并且在美国政治生活中如此显眼。

夏皮罗认为,政治中的谎言规模,使得当下美国政治科学中的辩论彻底偏离了重点——让政治学家们辩论得面红耳赤的问题,是“公众意见在多大程度上影响政府政策,以及由于单方面利益的力量,这种影响是否是不平等的”。然而,谎言肆无忌惮地蔓延,使得公众意见本身被操弄与扭曲。夏皮罗本人早年提出的“理性公众”概念,已然被当下公众“关于真相的分歧”(disagreement over truth)有效地瓦解了。故此,夏皮罗提出:谎言的弥漫“对精英和美国公众的‘民主能力’构成了挑战,从而破坏了民主”。

在2025年的当下,我们看到,美国民众对谎言与说谎行径的接受度极高,甚至已达到了无动于衷的地步。在2024年总统候选人现场辩论舞台上,拜登面对谎言频出的对手,呼吸急促、手足无措,这被公众乃至自己党内人士视为反应迟钝、年老无能的表征。然而,特朗普满嘴谎言,实则使拜登陷入了如下困境:如果在自身2分钟发言时间内去一一纠正谎言,那么就等于全盘跟着对方跑,彻底丧失了自己的议程设置,事先所准备的辩论要点完全用不上(并且纠正某命题,在话语的接受效应上往往比不上抛出某命题);如果对对方的谎言置之不理,那么各种指鹿为马的言语便会有效地产生出真相效应(truth-effect),被民众们听进去。拜登在辩论现场的手足无措、反应迟缓,其实是因为他的处境使其不管怎样应对,后果都会很糟糕。特朗普不在乎谎言是否当场被反驳,抑或事后被事实核验揭穿;他仅仅是通过无间歇地输出谎言,便使其成了辩论的“赢家”(在共和党、民主党以及主流媒体眼中)。

我们看到,特朗普不只是使政治实践中充斥谎言,并且使政治中的谎言不再受到普遍的拒斥,谎言有效地参与到了政治议程中。在当代美国谎言政治中,谎言不再以妥善隐匿自身的方式(亦即,冒充为真相)发挥效力,而是以其自身形态(亦即,被事实核验揭穿为“谎言”)直接发挥效力。80多年前科瓦雷所讨论的“现代谎言的政治功能”中,谎言必须当自身不被揭穿为“谎言”时才能有效产生“政治功能”,然而当代美国的谎言政治,谎言直接以自身面目参与政治进程。

更为甚者,在当下美国,连对谎言的“科瓦雷式谴责”,亦已经党派化了——只有民主党才在单方面地谴责特朗普说谎。与之对应的,特朗普政府也频繁指责拜登政府说谎。这种党派化的互指说谎本身意味着,谎言并未因其自身的性质而被认真对待。在当代美国,谎言并没有广泛受到谴责,没有人人喊打——对比当年总统克林顿一个陈述被揭穿为谎言便遭到普遍谴责的情形,美国文化已然发生了实质性变化。

有意思的是,夏皮罗在对当下美国政治中的谎言规模作出重新估量之后,还是决定“冒险以乐观的基调”来看待这个状况。他的理据是这样两点:(1)新闻媒体所进行的充分的调查研究和报道能够防止并揭露谎言;(2)政府中的不少官员与专家也会帮助阻止谎言传播。然而,夏皮罗的“乐观基调”的理据,已然难以成立。新闻媒体对政府官员甚至最高领导人的话语诚然做了极大力度的事实核验,然而这些努力并没能阻止谎言的弥漫。政府官员与专家对谎言的谴责,更已是被党派化的“党同伐异”格局所裹挟。在当下美国,在制度实践层面上并无法定位到能够遏制谎言政治的机制。谎言直接以自身本来面目畅行无阻。

夏皮罗寄希望于美国精英阶层对真相的捍卫,所以采取“乐观的基调”。当代中国政治学家郑永年对“为什么政治谎言主宰美国”的分析,亦同样把精英阶层的作用视为关键。但不同于夏皮罗的乐观,郑永年认为“随着美国民粹主义崛起,现在美国的统治阶层或者精英阶层变得非常衰弱,美国曾经的‘出类拔萃之辈’(the Best and the Brightest)已经不再存在”,故此其结论是美国政治中的谎言将无可遏止地越来越恶化,并且该状况“会继续毒害中美关系,制造一波又一波的危机”。

我们看到,尽管夏皮罗和郑永年表面上结论相反,他们的分析路径实则是一致的,皆聚焦在精英阶层对于揭示真相的作用上。然而,哪怕当代美国并不缺乏“出类拔萃之辈”,精英同真相之间的关系却实则相当靠不住。连那位呼吁开发“真相GPT”(TruthGPT)的美国工程院院士、世界首富埃隆·马斯克,在总统竞选期间亦以完全不在乎真相的方式,在其运营的社交媒体X(前身为推特)上频繁为特朗普造势。在特朗普胜选后,马斯克深度参与其第二任政府,甚至自身在社交媒体上传播了多种谎言(他本人面对记者亦承认“我说的一些事情将是不正确的并应该被纠正”)。

具有反讽意味的是,在特朗普首个总统任期的第一年,马斯克就退出了总统顾问委员会,并表示:

特朗普可能是世界上有史以来最牛的胡扯大师之一,就像我父亲一样,他胡扯的时候会让旁人摸不着头脑。但如果你把特朗普的发言权且当成一个骗子在演戏,那他的行为差不多就说得通了。

然而7年后,马斯克却不遗余力地为他眼中这位擅长演戏的“骗子”作出毫不含糊的公开背书,多次亲身在后者竞选集会上站台,出人并且出钱。根据美国联邦选举委员会发布的文件,马斯克向支持特朗普2024年竞选的团体捐赠了2.59亿美元,成为美国历史上最大的总统竞选赞助人之一。

2025年6月初马斯克同特朗普因“大而美法案”再次公开决裂后,6月5日在社交媒体上声称“是时候投下真正的重磅炸弹了:特朗普在爱泼斯坦文件中,这就是它们未公开的真正原因”,并随后要求网友“标记这篇帖子,未来真相会大白”。6日特朗普公开反击,称马斯克“完全失控”,并重申自己与杰弗里·爱泼斯坦已断交多年,否认任何不当联系。到了7日,马斯克要求人们做标记的那条帖文却被他本人删除,并称自己“走得太远”。之后一个多月双方不断就此激烈地展开攻讦。至少其中一人在撒弥天大谎,而完全不担心真相的“反噬”。

时间回到2024年10月17日,总统大选最后的冲刺阶段,马斯克在关键摇摆州宾夕法尼亚为特朗普举办助选活动,在台上声称:“特朗普若落选,西方文明就将走到终点。”(然其并未解释该宣称的内在逻辑)但值得反过来追问:特朗普再度胜选,意味着美国文化(乃至“西方文明”)走向了哪里?

三  “真诚性的胜利”与美国文化之溃败

“六岁男孩乔治·华盛顿不对砍倒樱桃树说谎”这则故事,被认为铸造了美国文化的核心价值观。当代美国思想史家马丁·杰伊曾对这个故事的寓言性质及其对美国大众文化的影响进行了考证。杰伊的结论是:

梅森·威姆斯实际上编造了这则轶事,或者更准确地说,他从詹姆斯·贝蒂1799年发表在伦敦的《吟游诗人》 中剽窃了这个故事,但它成了美国民间故事的基石。当美国内战结束了南方文化(该文化更倾向于把文明性界定为英勇,而非发自内心的坦率直言)后,真诚性的胜利似乎牢不可破,至少是作为公共行为的模范。在他亡故后不久,“诚实的亚伯”林肯加入了华盛顿的行列,成为这种理想的巅峰。

不说谎的乔治·华盛顿与诚实的亚伯拉罕·林肯,将真诚性确立为美国大众文化的理想。也正是在这样的文化中,诚如杰伊所观察的:“测谎仪”在执法领域与公共领域中所享有的盛誉,在美国是独一无二的。杰伊亦引用法国哲学家雅克·德里达的如下观察:“伪证罪”(perjury)这个词就是产自美国,它在当代美国日常生活中被极高频率使用与核查,甚至到了“一种迷恋性坚持”(an obsessional insistence)的程度,一个人不管走到哪里,都会被要求在各种文件上签名,并被威胁以针对“伪证罪”的法律行动。“在美国,一个人不能在未阅知伪证是受法律严格惩罚的情况下签署公共文件,并且在官方和法律上都假定他已阅知。”在美国,从技术手段(测谎仪)到法律手段(伪证罪),构筑起一张针对谎言的大网,其文化清晰无误地传递给每一个人如下信息:莫说谎,说谎会被抓,后果很严重。

然而,在当代美国“真诚性的胜利”变得越来越可疑。科瓦雷于1943年做出的关于“现代谎言”的描述(前所未有的猖獗、无耻、系统、停不下来),针对的是德国纳粹主义。德里达于2001年则提出,科瓦雷的描述亦完全可以用于那被宣称为“历史之终点”(弗朗西斯·福山语)的自由民主。德里达在21世纪伊始便观察到,谎言不仅仅关涉人类文明史上的昨天,而且“可以被广泛扩展到在一种资本主义-技术-媒体的领导权(capitalistico-techno-mediatic hegemony)时代中所谓的民主国家的现行实践上”,并且“说谎从来没有像现在这样,如此无耻,如此系统,如此停不下来”。德里达把前所未有的无耻、系统与停不下来的说谎行径,同资本主义、技术、媒体与民主国家这组关键词关联了起来:前者的兴起,是后者占据领导权后的产物。然而,即便是德里达充满洞见的分析,也未能预先涵盖到特朗普及其政界追随者所掀起的更为无耻、更为系统、更为停不下来的说谎现象,以及它在当下美国社会的接受状况。

美国大众文化,已从真诚性的胜利转变成了对谎言的无感。国家民选出来的最高领导人,从拒绝说谎的华盛顿,变成了肆意输出谎言的特朗普。2024年美国总统选举之结果明白无误地昭示出,过半的美国民众完全不在乎国家的最高领导人满嘴谎言。对于其说谎行为,特朗普甚至完全不诉诸柏拉图所说的“高贵的谎言”,亦即,为了护卫城邦秩序而向民众说谎。他直接将其话语称作“真相/真话”(truth),而把反对他的媒体评论称作“假新闻”(fake news)。“后真相/后真话”(post-truth)这个词,也因特朗普在政坛上的崛起而成为热词,被牛津词典评为2016年度词汇。史蒂芬·勒文道斯基等美国政治学者对当代美国政治中的谎言状况所展开的研究,同夏皮罗很相似,亦是以乐观的基调结束,认为要采取的措施就是“提升人民在事实与错误之间作出区别的能力”。然而,勒文道斯基等人的应对方案如何处理如下局面:面对清晰明确的事实核验结果,过半美国民众却仍然选择说谎的候选人作为他们的总统。

不能说谎,是各已知文明社会(不只是“西方文明”)教育幼童的首要内容之一——“六岁男孩乔治·华盛顿不对砍倒樱桃树说谎”这类寓言故事,就是这样被发明出来。更有代表性的寓言,是19世纪意大利作家卡洛·科洛迪所创作的著名童话《木偶奇遇记》 。为了在孩子们心头种上不能说谎这条律令,主角匹诺曹说谎时鼻子会变长——该意象成为“谎言可视化”的经典符号。鼻子变长既是生理羞辱,也是社交隔离(无法隐藏的谎言标志)。在经历了许多冒险和挫折(被狐狸和猫欺骗、被吊在树上、变成驴子、被鲨鱼吞食等)后,匹诺曹最终学会了诚实、勇敢和无私,实现了变成真正男孩的愿望。

《木偶奇遇记》 被翻译成240余种语言,成为全球儿童“诚信教育”的通用教材。迪士尼分别于1940年与2022年推出名为《匹诺曹》 的动画影片与真人影片,皆着重强调了匹诺曹说谎的代价。在马提欧·加洛尼执导的2019年意大利真人影片《匹诺曹》 中,这一设定更是被强化:通过阴森色调、人面鱼、蜗牛黏液等哥特式意象,将说谎后果具象为“恐怖体验”,打破迪士尼式甜美叙事,通过制造生理性不适迫使儿童直面谎言代价。2014年韩剧《匹诺曹》 则将“鼻子变长”改写为“匹诺曹综合征”(一说谎即打嗝),女主角崔仁荷因无法说谎成为记者,以身体禁忌捍卫真相。

然而,现实世界中说谎并无可视化的效应,所谓的“微表情”分析与“测谎仪”判断也远非硬科学。那么,“真诚性的胜利”又如何来确保呢?政治理论家汉娜·阿伦特把“真相”界定为我们无法改变的事物,而谎言则恰恰试图改变我们无法去改变之事。她写道:

从概念上讲,我们可以将那些我们无法改变的事物称为真相;比喻地说,它是我们立足的大地和头顶的天空。

谎言试图改变我们无法改变的事物,也就是说,尝试摧毁掉“我们立足的大地和头顶的天空”。在阿伦特看来,尽管谎言已然充盈于二战后的美国政治中,但谎言不可能取得最终胜利(掀不了大地,翻不了天)。

在当今世界的各种“后真相”社会中,事实(无法改变),经常被转化成意见(可以改变)。谎言与真相的对立,经常被转化成观点之争。阿伦特当年就看到了混淆意见与谎言的趋势。她这样区分两者:“不受欢迎的意见可以通过争论、拒绝或妥协来处理;但不受欢迎的事实却具有一种令人愤怒的顽固性,除了赤裸裸的谎言,没有什么能动摇它。”真相如同脚下大地与头顶天空,意见动摇不了它,谎言却可以伤害它(尽管无法完全毁灭它)。也正因此,阿伦特把谎言视作最危险的政治实践,“除非事实性的信息得到保证且事实本身没有争议,否则意见自由不过是一场闹剧”。阿伦特的学理论述呼应了不能说谎在各已知文明社会中的地基性地位。也正因此,被屡屡揭穿连篇谎言的特朗普,却亦是紧紧抓住“真相/真话”不放。

“文明”与“不能说谎”之间为什么会存在这样的对应关系呢?在题为《论一种假定的从仁善动机出发说谎的权利》 的文章中,伊曼努尔·康德对此做出了一个解释:

例外摧毁了普遍性,而正是普遍性,使得原则能够担得起它们的名字。

康德提出,普遍性与例外无法共存。真相/真话,具有普遍性。作为真相/真话之例外的谎言,则无法以正当的方式存在。故此康德主张任何情境下都不能说谎,因为一旦有谎言能被允许(亦即,认可“说谎的权利”),那就会结构性地摧毁“不能说谎”这条律令的普遍性。换言之,说谎决不能是正当的、是“对”的。

瑞典裔美国哲学家、哈佛大学教授希赛拉·博克在其出版于1978年那部荣获奥威尔奖的奠基性作品《说谎:公共与私人生活中的道德选择》 中,从两个方面来论证为什么说真话是具有普遍性的规范性要求,而说谎只能是破坏规范的例外。首先,说真话与说谎在初始条件上存在差异:“说谎需要理由,而说真话无须理由”。说真话者并不需要为自己为什么说真话而进行辩解。其次,说谎者自身对说谎的隐在态度是:“自己可以说谎,但其他人应该诚实。”换言之,说谎者亦不想生活在一个自己随时会上当受骗的社会中。当人与人之间的信任消失,“社会就会土崩瓦解”。换言之,任何一种文明,皆必须建立在“不能说谎”的规范性律令上。

康德与博克的分析有力解释了在我们的生活世界中,说谎这种行为何以只能偷偷摸摸进行,不能公之于众。这就意味着,谎言只能以妥善隐匿自身的方式发挥效力,而不能直接以自身形态发挥效力——谎言是“见不得光”的。甚至在话语的操演层面上,一个人若宣称“我在说谎”,那么这句话本身是真话吗?这就陷入两位当代德国哲学家卡尔-奥托·阿佩尔与尤尔根·哈贝马斯所说的“操演性矛盾”(performative contradiction),亦即,言说一个陈述的行为,同使该言说有意义所需的前提相矛盾。“说话”这个操演性行为的前提,就是“我不在说谎话”。正是在这个意义上,哈贝马斯在语用学层面上将“真相”“正当”“真诚”“可领会”作为语言沟通的有效性要求。

我们也因此看到满嘴谎言的特朗普,并没有宣称“说谎有理”,相反他极力指控对其话语进行事实核验的媒体在说谎,是“后真相”媒体,不遗余力炮制各类“假新闻”。特朗普曾因传播不实信息而遭遇包括“脸书”“推特”在内的各大社交媒体封杀账号。面对“后真相”与“假新闻”对他的围剿,特朗普干脆于2021年底自建了一个社交媒体,名字就叫“真话社交”(Truth Social),其口号就是“追随真相”(follow the truth)。“真话社交”成了特朗普2024年总统竞选的重要阵地。

上一节已经提到,当代美国谎言政治的独特之处,不仅是以谎言充作真相,并且在于即便谎言被揭穿,说谎者并不会遭受负面影响,甚至该话语所产生的效力亦不受影响。博克在《说谎》 一著中提出,“在重要的事情上公开说谎,一旦被揭穿,说谎者将反受其累”,“届时,纵然说谎者本人对失去正直(integrity)毫不在意,也定会因谎言被揭穿而导致的信用扫地而后悔”。博克的这段分析在该著出版20年后,对在总统任上公开说谎的克林顿仍属贴切(尽管说的只是一个关于私人生活的谎)——其人遭到正式弹劾并险些下台。然而40多年后,该分析到了特朗普这里,显然彻底失效:现在美国总统做到了笃定地面对公众公开说谎、肆意说谎,甚至在各类事实核验中被频繁抓个正着,却丝毫不影响其票仓和支持度(并且还令其对手深陷困境)。

今天的美国,最高领导人谎言张口就来,被频繁揭穿亦不收敛,与此同时却仍以“真相追寻者”公开自诩,并能获得过半国人以及大量硅谷精英的支持——不仅是马斯克、彼得·蒂尔等人在选举中全力背书,马克·扎克伯格与杰夫·贝索斯在特朗普胜选后亦先后向其就职基金做出百万美元的捐赠,扎克伯格更是解散了2016年他在Facebook上引入的第三方事实核验网络。这个现象,深刻地重新界定了当下美国的伦理性实质(ethical substance,借用黑格尔的术语),亦即,支撑社会实践与道德行为的深层结构。谎言直接以其自身面貌出现在政治舞台上,仍然能畅行无阻,广泛产生效力,并对说谎者不产生负面影响——这昭示出美国文化(乃至“西方文明”)已然发生了激进改变。

2024年9月10日,特朗普同接替拜登的卡玛拉·哈里斯展开总统候选人电视辩论。就在辩论现场,ABC新闻主持人不得不出面纠正特朗普的多个虚假陈述,包括对堕胎、移民和2020年选举的错误说法——本应维持中立的辩论主持人出面纠正总统候选人,这种做法在美国极为罕见。当特朗普在该辩论中宣称美国许多州在操作“产后杀婴”时(主持人随即驳斥“在这个国家,没有一个州允许在婴儿出生后将其杀死”),这个国家在一个又一个自诩“真相”的谎言中变得面目狰狞——那些被美国界定为它的敌对势力,亦未对它施加过这样的“妖魔化”(demonization),该谎言竟由美国自己的(前/当选)最高领导人公开说出,并获得了众多美国民众与精英的高度拥护。美国的伦理性实质,已然被彻底改写。

四  构建现实:一种认识论-本体论的谎言政治

康德把“说真话”(speak truth)同人之为人的定义性特征关联起来—— 一个谎言,就将摧毁掉人之尊严,使其较之一块物(a mere thing)还不如。即便一个谎言并未对受骗的一方造成具体伤害,但说谎本身意味着,“我侵犯了人类的权利;因为我的行为违背了一个人类社会能够以成型的条件和手段,因此也违背了人的权利”。康德进而宣称,当你被问到是否会说真话时,哪怕在脑海里设想一下可能的例外状况,你就已经是一个破坏人类社会的说谎者了,“从一个规则那里保留例外将是自相矛盾的,因为规则之本质就是不允许有例外”。

那么,我们能否把当代美国的谎言政治现象,简单地视之为人类社会的例外?我的答案是否定的。康德把“说谎”界定为“构想例外”,然而特朗普主义实践绝非构想例外,而是为美国设定新的规制(nomos)。故此,我们有必要对该现象展开进一步考察。

在2024年著作《智人之上》 中,以色列历史学家尤瓦尔·赫拉利对“真相”展开了深入讨论。他认为,寻求真相必须是一个“普遍的工程”,“不可能有相互矛盾的真相”。然而,任何真相,都无法呈现现实的所有方面。赫拉利写道:

就算能对现实做出最贴近真实的描述,也永远无法完整地呈现现实。每次想要呈现现实,都会有一些方面遭到忽略或扭曲。所以,所谓的真相其实并不代表一比一地呈现出现实。所谓的真相,一方面能够让我们专注于现实的某些方面,另一方面也无可避免地让我们忽略某些其他东西。在描述现实的时候,没有任何一种描述能做到百分之百的准确,但有些描述会比其他描述更贴近真实。

赫拉利给出了一个强有力的案例分析。某君描述某地有一万名士兵,他是否讲出了真相?即便那里也确实有一万名士兵,这最多意味着该描述揭示了现实的某个方面,但它忽略了许多其他方面——计算某种实体的数量,就会把注意力集中在相似性上,同时忽略差异性,士兵之间就沙场经验、健康程度、士气状况等可能会差别很大,“一千名新兵搭九千名老兵,与九千名新兵搭一千名老兵,在军事上的现实可是完全不同的”。更具体来看,每个士兵都是独一无二的,但这是不是就意味着“某地有一万名士兵”的描述扭曲了现实,是不是意味着要描述某地军事局势,就必须完整说出每个士兵独特的历史与个性?

一个人即便自认为是在讲真话,但其描述最多仅仅是揭示现实的某个方面。赫拉利进而提出,现实本身就包括“主体性的现实”,涵盖每个人的信念和感受:“每个人都会对世界有不同的观点,每种观点都是由每个人不同的个性与生活经验交集而成的。”主体性现实是被社会性地构建起来的,影响其构建的不只有国籍,“光是在以色列,男性或女性、左翼或右翼、正统派或世俗派的犹太人”,皆系现实构建的核心参数。于是,哪怕每个人都在言说关于其所体验的现实的真相(换言之,并未故意说谎),然而社会层面上呈现出的关于现实的描述仍然极其多元,甚至彼此剧烈冲突。

故此,真相本身是受限的,是无法总体化的。基于此,赫拉利犀利地批评一种“天真的信息观”:

这种观点认为,有了足够多的信息,就能得到真相;有了真相,就能得到力量与智慧。相较之下,无知似乎无法通向任何地方。虽然在某些历史上的危急时刻,基于妄想或欺瞒而形成的网络偶尔会出现,但长期看,这些网络必然会败给那些真实且可信的网络。……天真的信息观会认为,面对收集与处理信息时遇到的大多数问题,解决办法就是收集与处理更多的信息。……从这种观点看来,信息网络越大,就能越接近真相。

持有这种“天真信息观”的代表人物有贝拉克·奥巴马、扎克伯格以及雷·库兹韦尔。这些当代美国政经界精英认为,只要信息足够多、自由讨论时间足够长,“肯定能让所有谎言与谬论无所遁形”。谷歌的使命宣言简洁地表达出了这种天真的信息观:“整合全球信息,使人人皆可访问并从中受益。”

然而,信息数量堆上去,却并不意味着就能抵达真相,更不意味着谎言会无所遁形。赫拉利提出,信息的作用并不是呈现既有的现实,而是通过彼此“联结”的方式创造出全新的现实。个人可以追求“关于自己与世界的真相,但大型网络却会使用各种虚构故事与幻想将成员连接在一起并创造秩序”。谎言连篇并以“真相追寻者”自居的特朗普并不是在“构想例外”,而恰恰是在构建“现实”,在该现实中墨西哥人都是强奸犯、华为与抖音等华企丧心病狂地窃取数据、民主党领导下的许多州纵容产后杀婴……当代美国过半民众,积极接受了特朗普所构建的那个现实,并基于该现实来解释生活现象与社会现象,以及决定自己的行动。在《智人之上》 中,赫拉利这样分析特朗普主义政治:

不管是唐纳德·特朗普、巴西前总统雅伊尔·博索纳罗这样的民粹主义领导者,还是像匿名者Q(QAnon)和反疫苗者这样的民粹主义运动与阴谋论,都认为有些传统机构制度只是声称自己在收集信息、找寻真相,以此取得权力,但其实都是在说谎。在他们看来,那些官僚、法官、医生、主流记者和学术专家就是一个精英阴谋集团,他们对真相没有半点兴趣,总在故意传播虚假信息,牺牲“人民”的利益来谋取自己的特权。……一言以蔽之,在民粹主义者眼里,信息就是一种武器。……无论何时何地,当民粹主义成功地让人觉得信息就是一种武器而进行传播时,语言本身就会受到损害。不论是“事实”这样的名词,还是“准确的”“真实的”这样的形容词,都会变得语义模糊,似乎无法指向一个共同的客观现实。这种时候,只要一谈到“事实”或“真相”,就会引起一部分人的疑问:“你说的是谁的事实、谁的真相?”

在赫拉利看来,特朗普主义政治的独特之处在于,除了导弹以及无人机外,信息被当作武器投入大规模使用。国际社会对武器的使用尽管具有相当严苛的规范,但晚近我们见证着这些规范被屡屡突破,而特朗普主义政客们进一步把针对信息传播的规范彻底颠覆了:真相与谎言的差别被彻底取消。正是在这个意义上,特朗普主义政治,是一种认识论-本体论(epistemo-ontological)的谎言政治,在其中谎言的定义性特征被彻底抹消,并被用以构建现实。

在政治哲学层面上,“真相”是以柏拉图为代表的古典政治哲学家用以对抗暴民统治(ochlocracy)的基石。“真相”范畴被取消(甚至只是“你说的是谁的事实、谁的真相”这种追问盛行),会产生严峻的后果:它会激发出古老的“对暴民统治的恐惧”。这种恐惧——根据法国人类学家布鲁诺·拉图尔的分析——就是“害怕暴民对现实的介入”,亦即,“在任一给定时刻,现实依存于暴民对正误的看法”。

特朗普主义政治,用通不过事实核验的话语填充真相的独特实践,在当代美国事实上落实并复兴了暴民统治——现在,现实依存于特朗普主义政客所部署的“信息武器”之受害者(受骗者)的裁决。再细密的事实核验,亦无力扭转或阻止谎言(“特朗普式真相”)的“高歌猛进”。谎言在各类事实核验中被频繁揭穿,非但不会使说谎者深受其累,信用扫地,相反让其原先的支持者更加坚定与狂热,甚至令旁观者亦倒向说谎者——拜登就是被自身党内盟友们担心旁观者的倒向而被排挤掉候选人资格。

五  作为缝合点的谎言:元宇宙里的“真相政制”

经由前文的分析我们看到,特朗普主义实践将信息武器化,激进地取消了真相与谎言之差别。当代美国的谎言政治并不仅仅体现在谎言在政治舞台上如此猖獗、如此停不下来,它的独特性更是在于谎言以其本来面目被接受并且被用于构建现实,对谎言无感的民众们(“信息武器”之所有受害者/受骗者),则皆在为这个现实的构建添砖加瓦。现在,值得进一步思考的是,何以特朗普主义实践所构建的现实,能够成为当代美国一个主流版本的现实?

在思考这个问题时,我们有必要引入法国思想家米歇尔·福柯的洞见——半个世纪前福柯针对“真相”做出的分析,对探究当代美国谎言政治仍具有理论穿透性。

在发表于1975年的论文《话语的秩序》 中,福柯用“真相政制”(regime of truth)这个概念来描述如下状况:每个社会都通过特定的话语、机制和技术来区分真伪,并赋予其相应的权力效应,这种权力决定了哪些类型的言论被接受为真,哪些言论则被排除在外。福柯认为“真相政制”是普遍的,并非仅仅存在于某些社会中:

每个社会都有其真相政制,即其“真相的通用政治”(general politics of truth)。也就是说,社会接受并使之发挥作用的各种话语类型;区分真伪陈述的诸种机制和实例,以及对每种陈述的制裁方式;在获取真相过程中被赋予价值的诸种技术和程序;以及负责阐述何为真相的人的地位。

真相政制的通用性就在于,每种社会都会选择某些话语作为其运作的基础,这些话语被认定为“真实”的,并通过这种方式有效地传递和维持权力结构。换言之,真相与“话语权力”体系相互关联,权力会产生并维持真相。

正是在某种特定的真相政制下,诸如“上帝保佑美利坚”“新兴大国与既有大国必有一战”(亦即“修昔底德陷阱”)抑或“民主党允许产后杀婴”等话语才会被接受为真。而特朗普“让美国再次伟大”(Make America Great Again, MAGA)的努力,仅仅是将原先那个充斥各类自由左翼“政治正确”话语的现实,改造成了一个“另类现实”(alternative reality)。这个另类现实由特朗普主义话语权力系统(一种极其独特的区分真伪陈述之机制)所支撑,它使得赤裸裸的谎言在该现实中能够以真相的名义流行。特朗普主义政治有力印证了福柯所分析的真相政制:真相并不在权力之外。反过来,福柯的分析揭示出,并不存在任何先天的机制来阻止特朗普主义实践所构建的现实成为主流版本的现实。

尽管博克在其出版于1978年的《说谎》 中没有提及福柯同期的“知识/权力”研究,但很相近地,她从弗朗西斯·培根的“知识就是权力”论题入手提出:谎言在与知识同等的程度上影响着权力的分配。其中的机制是,谎言可以让受骗者希望达成的目标变得模糊不清,还可能掩盖相关的备选方案,或者让情况呈现出虚假的确定性。通过这样的方式,“谎言增加了说谎者的权力,削弱了受骗者的权力,在不同层面上改变了后者的选择”。换言之,说谎者的权力,来自所有直接与间接的受骗者。赫拉利在晚近《智人之上》 一著中亦做出如下观察(尽管并未引用博克的话),认为民粹主义领袖们“总在对我们说谎以骗取权力”。

福柯对“真相”的分析揭示出,特朗普主义谎言政治,是真相政制的一种极端形态,在该形态里赤裸裸的谎言以真相的名义获取政治权力。博克对“谎言”的分析则进一步揭示出,特朗普源源不断地从所有的受骗者那里获取权力:当其谎言覆盖面达到整个国民并被其中相当多的人接受时,特朗普就具有了问鼎总统宝座的实力(并获得成功)。特朗普从一个政治素人快速迈向权力巅峰,这个过程中谎言扮演了关键性的角色。特朗普用谎言“联结”起了在现实中因无法找到原有舒适位置而倍感沮丧的民众(他们时刻感受着移民、有色族群、女性、性少数群体、环保等带来的不适),为他们构建起一个另类现实,在其中确立起新的规制,并给他们“让美国再次伟大”的愿景。

在很大程度上,特朗普主义政客所构建起的这个另类现实之所以能够成为主流版本的现实,便正是因为之前那个版本的现实(各种“自由左翼”“生态左翼”“文化左翼”“后殖民左翼”“后现代左翼”“性别左翼”所构建的现实),已然如同《盗梦空间》 (克里斯托弗·诺兰执导的2010年影片)里那种摇摇欲坠的“梦境现实”那样,无法承受住越来越多人对该现实的质疑。关于“社会现实”(social reality)的那些被“植入”头脑中的核心理念(“政治正确”“觉醒文化”“取消文化”……),被越来越多的该现实中之人不再体验为自己的理念。特朗普主义政客则进一步抛出大量谎言并把它们武器化,对那个现实进行了激进的越出信息传播规范的袭击。

特朗普的“MAGA”里几乎没有关涉任何由联合国当下议程所背书的“伟大”的政治理念与理想,而是用武器化的谎言,激发“底层”生存层面的社会性忧虑乃至生物性恐惧——“墨西哥人都是强奸犯”“华企都是盗贼”“非法移民都是冷酷杀手”……在2024年9月28日的竞选集会演讲中,特朗普多次用“冷酷杀手”来形容非法移民,声称“他们会走进你的厨房,割掉你的喉咙……他们将强奸、抢劫、盗窃、掠夺和杀害美利坚合众国的人们”,并称“拜登有精神障碍,卡玛拉出生就是智障,你仔细想想,只有智障人士才会允许这种情况发生在我们的国家”。特朗普主义政客所构建起的另类现实,和“让美国更加伟大”无关,而是“让美国更加撕裂”——这就是为什么《时代》 周刊把2024年度人物给了作为“美利坚分众国总统”的特朗普。

当代美国的“前特朗普版本”现实——借用美国社会心理学家亚伯拉罕·马斯洛的经典术语——主要围绕爱和归属层面、尊重层面以及自我实现层面来构建与呈现自身,奥巴马版本的“美国梦”几乎把这些词都囊括其中。而特朗普版本的另类现实,则在根本上放弃任何向“上”看的政治理想,而是在“底部”的生理层面与安全层面上,用谎言作为素材进行构建。可以说,特朗普主义政客们极为有效地运用武器化的谎言,把当代美国社会现实从应对马斯洛需求层级上的高阶需求转变为应对底层需求。

两位当代美国政治学家、加州大学洛杉矶分校的尼基塔·萨文与丹尼尔·特雷斯曼通过文本数据分析揭示出,特朗普在2024年总统竞选中的平均暴力词汇使用频率,超过了他们研究的任何其他民主国家中的任何政客。他们还发现,不同于其他民粹主义政客,特朗普较少用“我们”“人民”这两个词,而是频繁输出关于“他们”的脏话表述。萨文与特雷斯曼写道:

大多数民粹主义政客赞美并声称自己代表被想象成一个同质统一体的“人民”,特朗普相对较少调用“人民”;他擅长于一种排他性民粹主义,专注于识别外部群体和邪恶的精英,并将他们塑造成敌人或威胁。

两位作者进而指出,特朗普即便谈及“我们”,亦是出现在“他们对待我们像对待垃圾那样”“他们正在毒害我们国家”这样的表述中,而这些表述则皆是特朗普式的无视事实核验的谎言性表述。

特朗普用关于“他们”的巨量谎言性与暴力性表述,来刺激生理与安全层面的恐惧与恐慌。越底部的需求受到威胁,所能激起的政治动员力就越大;换句话说,理想(各种高档次的“美国梦”)能有效凝聚人,当且仅当生理与安全层面需求得到广泛满足时。正是在这个意义上,特朗普主义谎言政治在构建现实上具有着强大力量:强奸犯、小偷与杀手已经在门口了,“他们”甚至已经冲进家里了……这样的话语哪怕是谎言,也往往十分有效,因为它能快速激发出生物性-情绪性的反应,而非开启大脑皮层的思考。

诺奖得主、以色列裔美国认知心理学家丹尼尔·卡尼曼区分了“快思考”与“慢思考”,亦即,存在着驱动人类行为的两个系统:“系统1自动且快速运行,几乎不需要或根本不需要努力,也没有主动控制感;系统2把注意力分配给必须要它参与并付出努力的脑力活动,包括复杂的计算。”

做出“快思考”的系统1,其实是经由生物性演化形成的神经网络运算系统:看到蛇(感知器官接收到的“蛇形信息”)就会害怕,便是生物性演化对安全层面上威胁所产生的快速反应,这种情绪性反应将有效催生逃跑(或者攻击)行动。这就是为什么特朗普主义政客所说出的谎言,总是能有效地激发惊慌、恐惧、愤怒这样的情绪性反应,甚至进一步催生出暴力性的行动。

而分辨谎言则需要启动做出“慢思考”的系统2,这种思考不仅慢,而且需要消耗大量能量,并且其开展的深度依赖于受教育的程度。这意味着开启“慢思考”比起“快思考”来,具有高得多的门槛。特朗普的话语几乎很少诉诸受众的“慢思考”,已有多项研究指出,在认知风格上,特朗普的演讲展现出的分析性思维和综合复杂性低于至少自20世纪60年代以来的几乎任何一位美国总统。正是特朗普主义谎言政治所诉诸的这种“快思考”机制,使得“信息武器”的受害者们(受骗者们)积极地乃至全身心地,配合政客们从自身身上汲取权力。

特朗普主义政治确实可以被视作民粹主义政治的一个极端版本,因为它成功地从为数众多的民众(受骗者)那里汲取权力。它的极端之处在于,哪怕是各种事实核验,都无法冲击那些牢牢填充在“真相”这个普遍性位置上的谎言。在一个相当妥帖的意义上,特朗普实质性地为其众多追随者们构建了一个“元宇宙”—— 一个有效地叠加了虚拟现实、增强现实与混合现实的“元宇宙”。

就构建“元宇宙”而言,特朗普使用了最前沿的具有“深伪”(deep fake)能力的生成式大模型。2024年8月17日,特朗普在X上转发多张宣称美国乐坛天后泰勒·斯威夫特及其歌迷支持特朗普的图片(其中一张斯威夫特装扮成“山姆大叔”并配文“泰勒希望你给唐纳德·特朗普投票”),随后部分图片被证实由人工智能生成,泰勒本人随即在X上公开发出背书哈里斯的声明。2025年2月19日,特朗普在社交媒体上自称“国王”,随后白宫所有官方社交媒体账号矩阵(包括X、Instagram、脸书等各平台官方账号)发布了特朗普自称“国王”的评论文字,并附上一张以“国王万岁”为标题的伪《时代》 杂志封面,图片中特朗普头戴珠宝王冠,背后则是纽约曼哈顿。2025年7月10日,白宫官方社交媒体账号发布了一张将特朗普描绘成“超人”的深伪图片(身材魁梧的年轻特朗普穿着“超人”标志性的红色斗篷和紧身蓝色西装),配文“希望的象征;真相、正义、美国方式;超人特朗普”。在特朗普主义所构建的这个以“MAGA”为标识的独特元宇宙(the Magaverse,“MAGA元宇宙”)中,特朗普成了美国建国以来独一无二的超人“国王”。其中,深伪的MAGA内容被认知为“真话社交”。

特朗普主义政客不仅使用前沿的人工智能技术,而且将古早的在人类文明史上长久存在的谎言玩出了全新境界——谎言不只是参与深伪,并且直接成为真相。在MAGA元宇宙中,谎言不再是破坏普遍性(真相)的例外,而是自身成为现实之缝合点(quilting point)——法国精神分析学家雅克·拉康用“缝合点”一词来指称弥合或遮盖“现实”在本体论层面上的不连贯性,使得“意义”看似固定且有逻辑性的关键力量。在MAGA元宇宙里,美国毋庸置疑地“再次伟大”,而特朗普则无可置疑地是一位带给美国新希望的超级“国王”、真相与正义的当代化身。

2020年辞世的拉图尔曾从“新气候政制”(new climatic regime)角度出发,对时任美国总统的特朗普做出如下批评:特朗普代表了“离开这个世界”(Out-of-This-World)的政治视野,其“视野不再属于地球的诸种现实”。在拉氏看来,特朗普的姿态已然触发一场不同世界间的战争:“我们美国人并不和你属于同一个地球;你的地球可能被威胁到了,但我们的不会!”拉图尔急切呼吁,以特朗普为代表的美国政客们“落到地球”(down to Earth)。然而,拉图尔所未能纳入分析的是:在特朗普努力下“再次伟大”的美国,诚然是一个另类的元宇宙:发生在地球上的“假新闻”,无法诋毁MAGA元宇宙里“让美国再次伟大”的真相,无法抹除特朗普成为美国“国王”、地球“超人”的真相。在那个元宇宙里,特朗普诚然能没有操演性矛盾地呼吁“真话社交”。

为适应微信排版已删除注释和参考文献,请见谅,如需阅读全文,请点击左下角“阅读原文”获取。

上期回顾

纪念中国人民抗日战争暨世界反法西斯战争胜利80周年

瞿骏 林发钦  等 | 抗日战争研究的新史料与新视角(笔谈)

重启科技与人文对话

徐进 王珏 | 开源人工智能“伦理-技术共构”的治理范式演进

武锐  李恒威 | 预测加工理论的历史演进

马克思主义与现时代

余南平 张彭 | 通用人工智能时代资本主义新变局与中国式现代化选择

代利刚 | 1866年危机笔记与马克思的虚拟资本理论探赜

文学研究

夏中义 | 论钱锺书“有灵魂的酬唱”   ——兼及叔子“苦魂诗侣”

王小惠 | 《西游记》 的现代阐释与五四文章观的建立

法律研究

叶青 王艺 | 数字时代网络暴力检察公益诉讼:理论阐释与实现路径

魏晓娜 谢甜甜 | 认罪认罚从宽制度的典型问题与立法完善

陈海锋 | 论我国监察官的有限独立行使监察权

中国式现代化:文旅高质量融合

冯学钢 何静 | 中国式现代化进程中的文旅高质量融合:理论逻辑、关键问题与实践进路

张琰  严春怡  牟琳 | 标准化驱动文旅深度融合高质量发展研究

于秋阳 刘心舟 | 文旅融合背景下文旅消费促进政策的影响效应及其机制——来自文化和旅游消费试点示范城市的实证

我知道你在看

阅读原文

跳转微信打开

  •  

书香四月,字韵生辉——全民阅读活动周特别推荐:《汉字(英汉对照)》

外研社国际汉语 2026-04-23 09:00 江苏

以下文章来源于:外研社国际汉语

外研社国际汉语

本账号由外研社中国语言文化出版分社运营,旨在为国际中文一线教师和专业学生搭建一个多元化、专业性程度高的教育交流平台。

外研社推《汉字(英汉对照)》,讲解汉字起源演变与构形,适合多类读者。

转载自“外研社”

四月,是被书香浸润的季节。阳光暖、微风轻,书香氤氲,正是与文字相伴,与文化对话的美好时光。

你是否好奇,方寸之间的汉字藏着怎样惊艳的故事?是否渴望透过字形与笔画,触摸中华文明的温度与力量?这一次,我们为你献上一本既有趣又充满文化深意的佳作——《汉字(英汉对照)》

它是一把解读汉字奥秘的钥匙,帮你轻松读懂语言的智慧;更是一扇通往中华文化深处的大门,带你感受千年文明的独特韵律。从字形的演变到六书的奇妙逻辑,从汉字的起源到书法中的笔画规则,每一页都生动展现汉字的魅力与传承。

让这本书成为你书香四月的良伴,在全民阅读活动周里,开启一次字里行间的精彩旅程吧!

点击封面即可跳转购买

汉字:

中华文明的文化密码

汉字,不仅是一种记录语言的工具,更是一部流动的文化史书。它承载着五千年的岁月温度,也讲述着中国人观察世界的方式。从新石器时代的刻符到甲骨文、金文,再到现代的简体汉字,每一次字形的演化都深深映照着社会的变迁和思想的革新

字形演变图,横滑查看

《汉字(英汉对照)》由著名语言学家冯志伟教授詹宏伟博士联手打造,以生动有趣的内容和严谨科学的讲解,为读者提供一次深入了解汉字的奇妙旅程。从汉字的起源、构形规律到其背后的文化韵味,这本书不仅是一部知识读物,更是打开中华文化的一扇窗。

精彩样张,横滑查看

阅读这本书,会收获什么?

(一)探寻汉字的起源与演变

从新石器时代的陶符到甲骨文,从大篆到隶书,每一个字形的变迁,都是社会和文化发展的见证。这本书带你重返文字的发轫之地,追溯汉字如何从简单的符号演化为完整的书写体系。

(二)解读汉字构形规则:

六书的逻辑之美

象形、指事、会意、形声、转注、假借……每一种构形法则都体现出古人观察自然、表达哲思的智慧。通过生动的图文实例,书中详细解析了这些构形规律,让你轻松记住复杂的汉字,感悟每个字形背后的文化逻辑。

(三)了解汉字的结构设计:

文字也有建筑学

汉字的组合不只是简单的拼接,而是有着深厚科学基础的“语言工程学”。无论是象形的单字,还是复杂的合体字,作者都以直观的图例将其层层拆解,让你理解文字如何从骨骼到血肉层层构建,最终成就一字一形的巧妙之美。

(四)掌握汉字的笔画与书写规律

写好一个汉字,不仅仅是学习规则,更是体会其结构与设计的精妙。本书系统讲解了汉字笔画类型及笔顺规则,让每一笔每一画都有据可循,让书写成为一种审美体验。

适合谁读?

每个人都能从中汲取灵感!

《汉字(英汉对照)》不仅是一本关于语言的书,更是一部探秘文化的指南。不论你是谁,都能在其中找到属于自己的收获:

中文学习者:

无需担心语言障碍,本书采用中英双语对照,帮助你快速了解汉字构形规则,从零基础到汉字达人,轻松学习!

国际中文教师:

丰富的实例和科学的解析,将为您的课堂增添更多生动素材,帮助学生理解和记忆,更高效、更有趣。

汉字研究者:

严谨的学术态度与权威的资料考证,为您的研究提供重要参考,同时也启发您用不一样的视角重新认识汉字。

文化爱好者:

热爱中华文化却不知从何入手?从汉字开始再合适不过。这本书不仅帮您读懂文字,也让您通过它窥见中华民族的智慧与精神。

书香四月,字韵生辉:

一场穿越字里行间的文化之旅

2026全民阅读活动周的到来,为每个人提供了与文化邂逅的机会。一杯清茶、一本好书,《汉字(英汉对照)》就是汉字学者、文化探寻者的不二之选。从中您不仅能感受汉字的古老韵律,还能体会汉字的逻辑之美。

翻开这本书,迎接中华文化的字韵芬芳

扫码购买,轻松开启你的汉字探索之旅!

当当

京东

天猫

比特人文

投稿邮箱:dhbase@126.com

扫码关注 获取更多资讯

图片

阅读原文

跳转微信打开

  •  

莫莱蒂:远读是个玩笑

远读 2026-04-23 12:19 北京

远读是针对世界文学这个新研究对象提出的方法,在一定程度上也是认识论层面的探索

本文转载自华东师范大学远读批评中心公众号“远读”

图片

活动现场

远读是个玩笑

2026年4月17日晚6点,斯坦福大学荣休教授弗朗哥·莫莱蒂、清华大学中文系教授格非、《上海书评》主编丁雄飞来到华东师范大学普陀校区,以“远读实验:反思文学批评的量化转向”为主题展开对谈。本场活动为北山讲堂高端系列讲座第2讲、远读讲座第56讲,由华东师范大学国际汉语文化学院、华东师范大学中国语言文学系主办,华东师范大学远读批评中心承办,商务印书馆协办。

弗朗哥·莫莱蒂1950年出生于意大利松德里奥,1972年毕业于罗马大学现代文学专业,先后任教于美国哥伦比亚大学、斯坦福大学,美国科学与艺术学院院士,美国国家书评人协会奖最佳评论类书籍奖获得者。2000年,莫莱蒂教授于《新左评论》上发表《世界文学猜想》一文,首次提出“远读”(distant reading)的观念。2010年,他创建了斯坦福文学实验室。代表作包括《世界之路:欧洲文化中的成长小说》《现代史诗:从歌德到加西亚·马尔克斯的世界体系》《布尔乔亚:在历史与文学之间》《远读》等。今年,他刚刚出版了新作《黑旗:悲剧形式与内战》。

以下为对谈内容:

图片

丁雄飞

丁雄飞:纵观莫莱蒂教授的研究生涯,我们似乎可以辨认出两个莫莱蒂:一个是“细读的莫莱蒂”,一个是“远读的莫莱蒂”;一个是“作为文本阐释者的莫莱蒂”,一个是“作为量化形式分析者的莫莱蒂”。但归根结底,只有一位莫莱蒂教授,他是文学史家,是文学理论家,也是文学批评家,并且始终是一个唯物主义者。我想先请莫莱蒂教授谈谈什么是“远读”:您提出这个说法的契机是什么?它与世界文学、与您组织编纂的五卷本文集《小说》有什么关系?

图片

弗朗哥·莫莱蒂

莫莱蒂:“远读”的来源有二。它最初是个玩笑,当年美国学界言必称“细读”,我开玩笑说还有“远读”。我没把它当真,可大家都当真了,后来真成了学术术语。“远读”还有一个由来:我独自去看电影,喜欢坐后排,因为坐得远,看得全,但和我太太一起时,就要迁就她坐前排。显然,坐在前排和坐在后排看到的东西是不一样的。这也对“远读”适用——拉开距离,就能看到不一样的内容。

我们当时出的那套文集有五千页,希望从各个角度讨论世界各地的小说;同时,《新左评论》还约我写一篇二十页的文章,讨论世界文学。显然,要在有限的篇幅内讨论数量庞大的文学,需要一种和以往不同的方法,所以“远读”首先是为了分析海量文学或文化作品而提出的。

其次,远读是针对世界文学这个新研究对象提出的方法,在一定程度上也是认识论层面的探索。就像去博物馆看画,靠近画作和远离画作看到的内容不同,远离画作时看不到细节,但能看到整体的几何结构。远读就是这样,更注重文学中的模式,而非细节。

丁雄飞:请您举个远读的具体例子吧。远读和细读,或者说,量化研究与经典阐释之间,是什么关系?

图片

弗朗哥·莫莱蒂

莫莱蒂:远读的实践方式是多样的。比如《尤利西斯》这本书中有几章由意识流构成,我在研究时特意关注这些意识流段落的共性:有多少处意识流描写?在段落中处于什么位置?起了什么作用?通过聚焦“意识流”这一元素,我希望去把握某种更大的东西。

远读和细读是对立关系,非此即彼。同样,定量研究和阐释学也是对立的。定量研究绝对尊重数据,比如分析《尤利西斯》时,统计意识流段落的共性就必须如实计数,不改动数据;而阐释学是对数据的改造,比如我认为《尤利西斯》的意识流和意识无关,而和社会化有关。把此解读为彼,就是一种阐释方法,这和定量研究的逻辑完全不同。需要强调的是,这种对立无法形成某种综合。

丁雄飞:如今,数字人文和定量研究在全球遍地开花。回望来路,您觉得远读和量化研究的贡献和局限是什么?您退休回到欧洲后开始研究悲剧,这种转向是否也体现了您对量化研究态度的微妙变化?

图片

弗朗哥·莫莱蒂

莫莱蒂:首先,我认为量化研究是一个很好的探索方向,也提供了重要成果,比如用网络理论分析情节、对戏剧结构产生新认知、在更广阔的文学语境中理解“正典”的形成。这些成果都来自量化研究,更准确地说,是来自为了做量化研究而形成的概念建构。正是这些新的文学概念,让我们对许多传统话题有了新理解。

然而从大约十年前开始,一种不好的苗头出现了:与文学理论紧密相关的概念建构工作被抛弃了,取而代之的是极其复杂的统计分析。复杂统计本身是好的,但它不能替代文学、文化理论。现在有很多优秀的数学类文章,但其文学价值却很有限。我和这类研究拉开了距离。

丁雄飞:格非老师读过莫莱蒂教授的什么书?

图片

格非

格非:我前不久刚看完《布尔乔亚:在历史与文学之间》这本书,非常好看,触发了我很多思考。莫莱蒂教授在书中提出了一些非常重要的问题。第一,当代资本主义在全球范围内取得了巨大成功,但资本主义的主人公是谁?是否存在世俗意义上的主人公?他认为这个主人公是缺席的,如果一定要寻找,主人公既不是过去的贵族,也不是一般意义上的底层工人阶级,而是作为庞大中间群体的资产阶级市民。莫莱蒂先生用“布尔乔亚”这个概念来涵盖这个中间阶层。另外,他认为真正的主人公或许是散文。他引用了黑格尔有关“散文的心智”的论述。书中说,散文通过原因和结果、目的和手段来理解我们所面临的世界。资本主义是这样理解世界的,散文也是如此。

第二,莫莱蒂先生对小说的研究是远读视角下的历史学分析,而非新批评意义上的文本细读。他把小说放到社会变迁、历史进程以及不同文本中展开研究,其中也包含我一直以来思考的问题,比如他提到“填充物”(filler)这个概念。莫莱蒂先生认为,西方小说自十八世纪以后,尤其是1719年《鲁滨逊漂流记》问世后,才真正开始了我们今天的时代。在这类作品以及后来的现实主义、现代主义作品中,存在一个显著的变化:会话性描写开始大量增加。他把这些新增的描写称为“填充物”。

图片

格非

现代小说中为什么会有这么多“填充物”?他认为这和资本主义的内在逻辑是一致的。一方面是主客体倒置,“物”的世界开始被放大。另一方面,他认为资本主义追求的是准确性而非意义,他提出“精确性远胜于意义”的说法,这也是填充物产生的重要原因。

此外,就是“真实性”的问题。莫莱蒂先生认为,真实性被奉为小说的最高原则,评判小说的核心标准就是“是否真实”,而这种真实性与科学的要求是一致的,因为科学最强调“真”。他引用了马克斯·韦伯的话:“一个东西可以不美、不善、不够神圣,但它真。”这一点和我的个人思考不谋而合。

莫莱蒂:感谢格非老师。很高兴您对“填充物”的讨论感兴趣。作为文学教授,在授课时难免要把一本五百页的小说总结成三四个核心情节,这样一来,小说的大部分内容就被忽略了,这是我面临的现实问题。而研究“填充物”的目的,就是为了还原小说中那百分之九十九被忽视的部分,让这些平时无人谈及的内容重新被讨论。“填充物”的一大特点就是不被记住,小说用散文(prose)写成,而“prosaic”作为形容词本身就有“平庸、日常”的含义,这些散文性的内容往往无法让人留下深刻印象。当年编纂《小说》这部研究文集时,编辑团队曾讨论是否要收入《一千零一夜》。有位编者反对,理由是它的故事太精彩了,没有平淡无聊的部分,而小说需要一定的平庸感和无聊感。所以我想问格非老师,作为小说家,您是否愿意写这些无聊的内容?您希望自己的小说全程精彩,还是觉得需要保留“填充物”?

格非:我的创作过程有一个缓慢的变化,不知不觉间,我作品中的“填充物”开始显著增加。不是我刻意要写“填充物”,而是它好像自然出现了。比如《隐身衣》中就有大量“填充物”。所以我也在思考,该如何重新描述当代创作中的“填充”。我最爱的书是《左传》,许多年来反复读,从来读不厌。《左传》里没有一句废话,所有看似浅显的文字都非常深刻,每一句话都值得玩味。我对“填充物”的态度是中立的,一方面,没有“填充物”就无法完整呈现今天的社会现实;但另一方面,我也对大量“填充物”的存在感到困扰,这两者之间存在一种紧张的关系。

图片

丁雄飞

丁雄飞:我在莫莱蒂教授来中国前,把格非老师《隐身衣》的意大利文版发给他读。能说说您的读后感吗?

莫莱蒂:我非常喜欢这部小说。我的疑问是,这部作品是“长篇小说” (novel)还是“中篇小说”(novella)?这两个概念在英文里不只是篇幅差异,更是两种不同的文类。中篇小说通常只有一个核心,而长篇小说像“群岛”一样,有多个核心。您如何在文类上界定这部作品?另外,我了解到您是先锋派作家,但《隐身衣》这部小说的情节性很强。通常大家对乔伊斯这类先锋派作家的抱怨是“小说里什么都没发生”。因此作为先锋派作家,您是如何组织协调先锋派技巧与叙事情节需求的?

图片

格非

格非:我最初想把这部小说写得更短,大约是现在篇幅的一半,但写着写着,有一种莫名的力量推着我继续。莫莱蒂先生提到的“群岛”概念很符合我当时的创作状态,这部作品里涉及了很多不同的话题,创作过程中我不断扩充、重写,完全超出最初的构想。当然,从我的原始动机来说,我想把它写成一部不太长的中篇小说。

上世纪八十年代的中国带有强烈的理想主义和浪漫主义色彩,很多作家都深受西方现代主义影响,毫不避讳地说,我们当时狂热地迷恋乔伊斯、卡夫卡、福楼拜这些作家。

转折发生在九十年代初。我的一个好朋友邀请我去他家吃饭,他全程只和我谈了一件事:“你们的小说受西方现代主义影响,这没问题,但你有没有想过中国古典叙事和西方完全不同?”他给我推荐了《左传》《史记》等中国传统叙事作品,以及一些明清小说,还严肃地说:“如果你三十多岁还不关注这些,我认为是不对的。”这件事对我的影响非常大。之后很长一段时间,我开始回归中国古典叙事,这也是促成我创作转变的重要原因,比如《人面桃花》中已经有了古典叙事的影子。

我认为西方现代主义有两种不同类型,一种相对激进,比如伍尔夫、乔伊斯等,就像您说的“小说里什么都没发生”;但也有不那么激进的现代主义作家,比如我反复推荐的德国浪漫派作家克莱斯特,他只写过八篇小说,还有亨利·詹姆斯、福楼拜等等。所以在激进的现代主义、不那么激进的现代主义,以及中国传统之间,我需要做出选择。《隐身衣》和后来的很多作品都是在这几者之间权衡选择的结果。

莫莱蒂:您在写作中融合中国传统与西方现代主义传统时,最难的部分是什么?最大的困扰是什么?

格非:最难的部分是“转换”。阅读西方作品时需要经过一次转换,反过来,中国传统叙事也需要经过一次转换,而且这个转换必须由我自己完成,才能让二者在同一个层面上进行讨论。我们无法回到过去的年代,只能立足当下的社会现实、自身处境,以及全球化带来的影响,重新阐释中国传统叙事。比如我今天读《左传》,和九十年代读完全不一样,有了西方文学的大量参考和探索作为基础,再回头讨论它的叙事,情况就完全不同了。中国传统叙事和西方现代主义小说不能生硬地拼接,需要在不同语境中适当转换,才能实现真正的交流与对话。

丁雄飞:《远读》里有一章《小说:历史与理论》,对比了中西方小说。莫莱蒂老师问了一个问题:为什么小说在十八世纪的欧洲兴起,而中国却没有出现同样意义上的兴起?

莫莱蒂教授给出的解释是,中西方小说传统都很悠久,像是两个并行发展的实验室。到了《金瓶梅》时期,中国小说出现了很强的评点传统,他认为这体现了一种审美转向。当时中国人读小说带着审美化、诗化的视角,而欧洲小说的审美转向要到十九世纪末才出现,比中国晚了三百年。他还认为,十八世纪欧洲小说的兴起与消费社会有关,当时小说印刷数量大幅增长,但人口并没有增长那么多。于是,人们只会泛读小说。这形成了一个悖论:小说变多了,人们的注意力却变少了。而同一时期的中国小说,在某种意义上说是作为审美对象被阅读的。格非老师,您怎么看这个论述?莫莱蒂教授,您是否仍然坚持这个判断?

图片

弗朗哥·莫莱蒂

莫莱蒂:我坚持。我当时在美国的学术会议上提出这个观点时,美国学者对中国传统小说和欧洲小说是“不同物种”的说法难以接受。但又没有人能说服我改变看法。我想,至少文化物种的多样性对地球和人类文化是好事。当然,我可能是错的。

格非:这是个很有意思的观点,我也同意。我读《左传》时,会在某一瞬间觉得它非常现代,因为里面写的全是秘密,直接呈现出来的内容反而没那么重要。德勒兹评价亨利·詹姆斯时说过一句话:“他一辈子都在写秘密。”《左传》《史记》也是如此,呈现的部分是为了让读者理解隐藏在背后的内容,这就是中国叙事的重要特点,作家似乎忙着“藏”,而非“显”。这种特点在中国叙事中非常早熟,而大概要到十九世纪以后才成为西方现代主义文学的重要特征。

莫莱蒂:我读的中国小说不多,主要有《红楼梦》《金瓶梅》,还有一部分《三国演义》。这些中国小说中存在审美对象,或者说“美”的概念,而且这种特质在中国出现得比西方早得多。另外,中国小说有大量评点,中国人把读小说当成一件严肃的事情,而直到十九世纪末,西方的人们才开始严肃地对待小说。

分享一个故事。1971年,我参加了一场英国文学考试,其中有一道题是“乔治·艾略特对小说的贡献是什么”,我写了很多答案都被老师否定了。最后的答案是:“乔治·艾略特的贡献,是把小说变成了一件艺术作品。”——这发生在十九世纪七十年代,而中国小说完成这种转变的时间要早得多。

格非:这种观点在中国现代作家中很普遍。比如四川作家李劼人有一个观点能和莫莱蒂先生相互印证:像《金瓶梅》,甚至《水浒传》《红楼梦》这样的作品,西方要一直等到托尔斯泰、司汤达等大师出现,才有资格与之相提并论。

丁雄飞:我们来聊聊《现代史诗》。请教莫莱蒂教授:这本书在您所有作品中的定位是什么?这是您赴美后出版的第一部作品,其中已经非常娴熟地用进化论来讨论文学形式的变迁。

莫莱蒂:这本书的最终形态和我最初的构想很不一样。我一开始想写二十世纪初的先锋文学,重点讨论《尤利西斯》等作品。后来我发现,《尤利西斯》之于二十世纪的意义,相当于《浮士德》之于十九世纪的意义。于是我猜想,从《浮士德》到《尤利西斯》,可能构成一种特殊的“文类”。这类作品的共同特点在于,它们在一部作品中讨论整个世界。传统史诗关注民族,而这类作品则关注世界。有一次我听瓦格纳的歌剧时,突然觉得瓦格纳的歌剧也在尝试构建整个世界,所以我把瓦格纳也纳入了《现代史诗》的范畴。

在一本书里书写整个世界,本身就是不可能的事,所以无论是《浮士德》《尤利西斯》,还是瓦格纳的歌剧,这些作品都存在很多缺陷,篇幅冗长、部分内容枯燥、质量参差不齐。历来的批评家都知道这些问题,也对此感到不适,但我觉得这是为了再现世界所必须付出的代价。世界本身就是不完美的,充满不平等和斗争,所以试图再现世界的作品自然也会有缺陷。或许所有文学形式本质上都是有缺陷的,而研究文学形式的真正难点,不是发现其中的重复模式,而是理解什么不在这些模式之中,这才是最有挑战性的部分。

格非:我想请教莫莱蒂先生一个问题。您刚才提到乔伊斯的作品以整个世界为描述对象。您是否关注过“叙事速度”这个概念?它在您所研究的小说中是如何演变的?比如乔伊斯的作品,从表面情节看似乎是停滞的,因为他会把想象中的内容、各种语言文化元素都拉扯进来。但我认为,这体现了一种无与伦比的速度,因为它可以在任何一个点与世界建立连接,不再遵循古典小说或戏剧的线性逻辑。这种叙事速度的变化在十八、十九世纪以来的作品中非常明显,我认为和资本主义世界的“加速主义”变化是相关联的。您对这个问题怎么看?

莫莱蒂:乔伊斯作品中的加速感非常明显。一开始读,你会觉得它是一部关于小说本身的作品,聚焦个体心理、意识流、前意识等内容。但随着章节推进,它逐渐变成体制化语言的小说。因此,这部小说在风格上浓缩了西方资本主义近一百年的发展历程,这是一种非凡的“加速”。

丁雄飞:《现代史诗》里一个贯穿始终的形式线索是“复调”。格非老师,您的创作,比如《江南三部曲》里,有没有复调?

格非:我们在八九十年代或多或少都关注过“复调”的问题,包括巴赫金讨论的陀思妥耶夫斯基的复调,米兰·昆德拉也在他的小说中尝试用复调结构创作。我当然也关注过复调,尤其是陀思妥耶夫斯基在《卡拉马佐夫兄弟》等作品中呈现了复杂多声部,以及不同声部之间的关联。但现在我对复调已经没有那么关心了,因为现代小说已经提供了足够多的创作方法。我们可以直接进行文本意义的生成,自由表达不同的声音、场景和想法,已经不依赖复调这种结构性的东西来呈现了。

图片

活动现场

撰稿|庞雅文

摄影|陈榆菲

编辑|周正颜

阅读原文

跳转微信打开

  •  

发言|众手续文脉:智能时代古籍大众整理的价值与路径

原创 PKUDH 2026-04-22 10:04 北京

北京大学数字人文研究中心副主任杨浩老师在2026年“我用 AI 校古籍”——我是“校书官”古籍大众智能整理计划启动仪式暨海外汉籍资源汇聚与典籍活化前沿论坛上发表题为《众手续文脉:智能时代古籍大众整理的价值与路径》的主题发言。发言指出传统古籍整理由精英主导、门槛高、效率低,结合 AI 与海外汉籍数字化实践,提出 “AI 赋能、大众参与、分层校勘” 路径,以 “AI 预处理 — 大众初校 — 进阶组精校” 体系兼顾普及与严谨。以 “我用 AI 校古籍” 为代表的大众参与模式,让公众与青年深度参与文脉传承,提升效率、培育人才、增强文化认同,助力构建开放共享的数字人文生态,开启人人参与的古籍传承新范式。

众手续文脉:智能时代古籍大众整理的价值与路径

杨浩

回溯中华文明的长河,古籍整理始终是赓续文脉的千秋之业。孔子删《诗》《书》、定《礼》《乐》、赞《周易》、修《春秋》,以个人的宏大愿景,开启了古代文献整理的先河。汉代刘向、刘歆父子于石渠阁校勘群籍,首创目录与校雠之学。至宋代,得益于文治的兴盛,官方开展了规模空前、体系完备的大型古籍编纂工程,先后组织编纂了四大类书。此后,明代有《永乐大典》的浩瀚集成,清代有《四库全书》的宏富汇总,民国时期则有影印《四部丛刊》《正统道藏》等嘉惠学林的壮举。及至当代,则有建国后“二十四史”的点校整理,以及新世纪《儒藏》精华编的编纂等宏大古籍整理工程。这些都是泽被学林、传承文明的文化盛举。

北大《儒藏》精华编·500种·282册

然而,回顾这一部浩荡的文献整理史,不难发现:历代的古籍整理,更多的是官方主导、学者专司的精英事业。传统古籍整理高度依赖少数具备深厚学养的专家学者,是一项专业门槛极高、耗时漫长的系统工程,是一门名副其实的“冷门绝学”。没有深厚的古代汉语功底、扎实的文字学基础和丰富的版本学经验,普通人乃至一般学者都难以企及。这使得古籍整理长期局限于极少数学术精英的寂寥书斋之中。

历代代表性古籍整理工程对比

从文献载体来说,当前正处在从纸质媒介向数字媒介全面转移的历史阶段。在这场深刻的媒介变革中,古籍整理的目标不能仅仅停留在扫描图像的数字化保存,更要将沉睡在图像中的字符转化为计算机可读取、可利用的数字文本。当前,一方面必须加速完成古籍的文本数字化;另一方面,在AI时代,还必须让AI能够接触到,并能理解这些承载着千年智慧的文字。然而,面对浩繁的卷帙与珍贵的遗存,传统的“专家主导”模式正面临着严重的效率瓶颈。要跨越这道鸿沟,迫切需要AI技术的赋能,更需要广大学生的积极参与。

人工智能的飞速发展,正在彻底重塑古籍整理这一古老领域的范式。高精度的光学字符识别(OCR)技术,以超越人工录入千万倍的效率,解决了最为繁重的文字转录难题;基于大数据的自动标点技术,在各类文献上展现出稳定的标点水平。技术,不再仅仅是冰冷机械的辅助工具,而是能够打破专业壁垒、重塑整理流程的利器。

智能技术的深度介入,使得原本紧密耦合、深奥复杂的整理工作被合理地拆解了。AI承担了大规模、机械性的初步识别与标点任务,而将更高层次的精细核校、学术研判、疑难辨析交给人类。这种“人机协作”的范式,不仅让古籍图像迅速转化为数字文本,更让大众的广泛参与从理想变成了现实。

人机协同工作流程图

如果说AI是古籍数字化的“先锋部队”,那么广泛参与的大众则是“星火大军”。“我用AI校古籍”绝非一句轻巧的口号,而是建立在“人机协作”基础上的全新文化传承模式。

回想这项活动发起的初衷,其实源于一次巨大的挑战。此前,数字人文中心获得了哈佛燕京图书馆近万种珍贵古籍的数字化授权,但面对如此庞大的文献量,仅有的少量专业人力无异于杯水车薪。面对这种困难,数字人文中心提出了一个大胆的设想,借助大众的力量,采用“众包”的方式。不难想到,提出这个想法,大家可能都有着“大众真的能参与古籍整理这样高度专业的工作”的担忧。带着这样的疑问,在小范围探讨之后,专门召开了“智能时代古籍整理与大众传播”研讨会,广泛听取学界意见,专家们给予了积极的支持。在此,要特别感谢全国高校古籍整理研究工作委员会的鼎力支持,以及“到梦空间”第二课堂平台的积极推动。正是有了各方的信任与保驾护航,“我是校书官”活动才得以在2024年7月顺利扬帆启航。现在有越来越多的承办院校的加入,“我用AI校古籍”已然有星火燎原之势。

2024年6月7日,

智能时代古籍整理与大众传播研讨会在京举办

如今,在“我用AI校古籍”活动的系列实践中,可以目睹到这样令人动容的情景:成千上万来自不同专业、不同高校的青年学子,通过轻量化、智能化的平台,满怀热情地参与到基础的文字校对中。

这种“人机协作加上人际分工”的模式,有效缓解了古籍整理长期面临的人力困境。其中更深远的价值可能在于:它构建了一种深度的、参与式的文化传播机制。以往,大众仅仅是古籍成果的被动接受者;如今,他们化身为文明传承的“在场者”。在逐字逐句的校对与比勘中,青年学子们越过千年的时光,真切地触摸了历史的温热,领略了先哲的智慧。

面对万千大众的参与,如何保证古籍整理的专业质量?这是作为组织者从一开始就必须直面的核心问题。因此,在大众参与的基础之上,活动设立了进阶组,构建了“AI预处理——大众初校——进阶组精校”的多层级协作体系。设立进阶组的初衷,源于一个现实挑战:专家学者的时间成本极为高昂,不可能将全部精力投入到海量古籍的初校与基础精校中。因此,开始探索一种新的可能——让经过培训的学生,去参与那些以往认为只有专家学者才能胜任的专业工作。

三层协作金字塔

进阶组的同学们,经过系统的理论学习与实操训练,承担起了更为复杂的标点校对、版本核勘与疑难处理工作。在这个过程中,哪怕是非古典文献学专业的学子,在系统的培训与人机协同的支撑下,依然能够产出符合学术规范的有一定质量的整理成果。通过这种梯队式的协作与培养,不仅保障了古籍整理的学术严谨性,更探索出了一条批量化培养古籍整理后备人才的创新路径。这是一种新形态的“教学相长”,是数字时代学术普及与创新人才培养的有机结合。

进阶组培训内容与成效

古籍整理不应当是束之高阁的孤芳自赏,更应是“源头活水来”的引流工程。在我看来,“我用AI校古籍”活动不仅是一次整理范式的飞跃,更是一场深刻的参与式文化传播。这种“做中学”的沉浸式体验,能够跨越学科的界限,在青年的心中播撒下文化认同与文化自信的种子。

数字人文生态系统示意

当然,哪怕经过大众整理,平台上的文献数量与整理质量仍然有较大提高的空间。因此,未来的工作将继续坚持做到“既重视数量,又重视质量”。依托这样的大众智能整理模式,能够构建起一个更加开放、共享的古籍知识生态系统。未来可以充分利用平台的技术与资源,一方面回馈学界,让更多的古籍数据反哺数字人文与传统学术研究;另一方面回馈参与的学生,进一步推动古籍整理与古籍教学的深度融合。

中华文脉的传承,需要代代学人的皓首穷经,也呼唤着千万大众的共襄盛举。从竹简木牍到纸寿千年,再到今日云端上跳跃的数字字符,文明的载体在变,但众手续文脉的精神恒久未变。今天,大众正在以AI为笔,以智慧为墨,共同书写古籍整理的时代新篇。

阅读原文

跳转微信打开

  •  

“近代中外文明交流互鉴研讨会暨2026年中国世界近代现代史研究会世界近代史专业委员会理事会专题会议”在山东威海召开

2026-04-21 10:34 山东

近代中外文明交流互鉴研讨会

暨2026年中国世界近代现代史研究会世界近代史专业委员会理事会专题会议

2026.4.17-4.20

202641720日,由中国世界近代现代史研究会世界近代史专业委员会主办,山东大学历史学院、山东大学东北亚学院、山东大学边疆治理研究院联合承办的“近代中外文明交流互鉴研讨会暨2026年中国世界近代现代史研究会世界近代史专业委员会理事会专题会议”在山东威海顺利召开。来自中国社会科学院世界历史研究所、浙江大学、南京大学、武汉大学、中山大学、南开大学、北京师范大学、厦门大学、东北师范大学、湖南师范大学、延边大学、上海师范大学等30余所高校科研单位和期刊出版单位的五十余位专家学者参加会议。

会议开幕式由山东大学特聘教授、山东大学边疆治理研究院执行院长苗威教授主持。山东大学东北亚学院院长刘昌明教授、中国世界近代现代史研究会世界近代史专业委员会会长俞金尧教授为大会致辞。刘昌明教授介绍了山东大学在世界史、东北亚研究、边疆治理等领域的学科布局与建设成果。俞金尧教授指出,会议紧扣“近代中外文明交流互鉴”主题,聚焦学术前沿与重大议题,旨在为全国世界近代史研究者搭建学术交流与对话的重要平台,推动世界史研究理论创新、方法突破与视野拓展。

大会主旨报告阶段,多位专家围绕全球变局、史学转向、国家建构、区域认知、人工智能应用、课程建设等方向作学术分享。张蕴岭教授从全局视野分析当今世界变局;梁民愫教授梳理了动物史研究转向的学术脉络并作出学理反思;王华教授探讨美国作为太平洋国家的历史形成过程;姜秀玉教授考察14至17世纪朝鲜王朝对琉球认知与态度的转型;陈建红助理研究员分享山东大学边疆治理研究院人工智能赋能边疆研究的经验与探索;潘迎春教授分享世界史一流课程建设的实践路径。各位学者的报告立足当下、深研史料、聚焦问题,从理论、实证、方法、教学等维度展现了中国世界近代史研究的最新进展。

4月18日下午,大会设置5个专题分论坛,围绕历史书写与史学理论,殖民、帝国与地缘政治,城市、空间与社会变迁,跨文化与跨区域互动,世界近代史教学创新等议题展开深入研讨。与会学者结合联邦德国国史书写、西方文明观念演变、日本海防观念、美国优生学运动、英国文化殖民、近代城市变迁、跨文明空间秩序、海事司法以及人工智能赋能历史教学、课程思政建设等专题,交流最新研究成果,回应学术前沿问题。分论坛讨论视野开阔、议题丰富,体现了世界近代史研究在理论探索、区域互动与教学实践等方面的持续深化。

闭幕式由中国世界近代现代史研究会世界近代史专业委员会秘书长张炜研究员主持。范继敏、王本涛、孙琇、邵政达、刘加明五位学者依次汇报各分论坛研讨成果。俞金尧教授致闭幕辞,向承办单位及全体与会学者表示感谢,对本次会议的学术质量、组织成效与交流价值给予高度评价,并对专委会未来工作与世界近代史学科建设作出展望。

本次会议以“近代中外文明交流互鉴”为主题,聚焦世界史研究前沿,贯通理论研究、实证考辨与教学实践,进一步凝聚了学术共识、拓宽了研究视野、深化了跨机构交流协作,为推动中国世界近代史研究高质量发展、促进史学界深入对话与合作发挥了积极作用。

供稿 | 姜思彤

摄影 | 丁绍通、冯一洲

编辑 | 徐晓婷

审核 | 刘加明

编审 | 陈建红

阅读原文

跳转微信打开

  •  

月湖数智文科前沿论坛第二十九期 | 蕞尔小物与丝路遗产:古代玻璃珠的生产与传播

2026-04-21 09:54 湖北

👆👆👆点击蓝字 · 关注我们

图片

欢迎参加

主讲人:温睿

温睿,男,西北大学教授,博士生导师,英国牛津大学博士。现任西北大学研究生院院长,全国文物、博物馆专业学位研究生教育指导委员会副主任委员。国家重点研发计划首席科学家,入选国家哲学社会科学领军人才,主持国家自然科学基金、国家社会科学基金等国家级项目 6 项。教育部首批国家级课程思政示范课程、教学团队负责人,荣获国家级教学成果一等奖,全国第三届高校教师教学创新大赛一等奖。

时间

2024年4月29日

报告时间

2026 年 月 24 日(周五)

14:30-16:30

报告地点

武汉大学人文社科楼 B111 

主办单位

武汉大学人文社会科学研究院

承办单位

文化遗产智能计算教育部哲学社会科学实验室

武汉大学大数据研究院

END

编辑|文化遗产智能计算实验室

审校|刘争

武汉大学人文社科楼

阅读原文

跳转微信打开

  •  

博士生论坛第五十九期|生成式知识推理:大模型与知识图谱的双向协同研究

2026-04-21 09:54 湖北

知识推理作为人工智能的前沿方向,正面临从“静态查表”向“动态生成”的范式转换。单一技术路线已难以满足复杂场景下“既通情达理又严谨可信”的智能需求,大模型与知识图谱的双向协同成为突破瓶颈的关键路径。本报告启发性汇报两者深度协同的技术框架。

👆👆👆点击蓝字 · 关注我们

摘要:知识推理作为人工智能的前沿方向,正面临从静态查表”向“动态生成”的范式转换。当前,大模型虽展现出强大的理解与生成能力,却受困于事实幻觉、逻辑断裂与记忆遗忘等固有局限;知识图谱虽具备结构严谨、推理可解释的优势,却面临构建成本高、泛化能力弱、难以处理开放域文本等现实瓶颈。单一技术路线已难以满足复杂场景下“既通情达理又严谨可信”的智能需求,大模型与知识图谱的双向协同成为突破瓶颈的关键路径。本报告启发性汇报两者深度协同的技术框架:首先,阐述知识图谱增强大模型推理,通过知识图谱合成数据、结构化推理增强可解释性、图约束解码提升生成质量,实现领域知识的精准注入。其次,探讨如何利用 LLM 强大的理解与生成能力来自动化地完成知识对齐、高质量负采样以及多模态知识扩展。最后,探究知识推理从“链路预测”向“受控生成”的跨越,为构建可信、动态的知识推理系统提供新视角。

跨学科合作方向:未来的跨学科合作可围绕生成式推理、知识工程、认知科学与数字人文展开。认知科学提供对人类推理机制、概念形成与因果判断的理论洞察,通过大模型与知识图谱的双向协同实现对复杂认知过程的可计算化表征;数字人文则提供历史语境、知识体系与文化传统的深层链接,使推理结果能嵌入具体的社会与意义网络。两者的结合,不仅推动知识工程从“静态图谱”迈向“动态生成”的方法转型,也促进人文学科从“经验阐释”走向“计算推理”的认知扩展。通过构建融合大模型理解能力、知识图谱结构约束与双向闭环验证的协同系统,可实现从链接预测到受控生成的跨越,形成兼具可解释性与创造力的生成式知识推理新范式

主讲人 石佛波

武汉大学信息管理学院博士研究生

时间

2026 年 4 月 24 日 11:30-13:00

地点

人文社科楼 B305 会议室

腾讯会议:775-6968-3346

主办单位

武汉大学文化遗产智能计算实验室(教育部哲学社会科学实验室)

武汉大学大数据研究院

欢迎参与

编辑 | 文化遗产智能计算实验室

审校 | 刘争

           武汉大学人文社科楼       

阅读原文

跳转微信打开

  •  

讲座预告 | 冉启斌《“词向量”计算在语言文学研究中的拓展应用》

徐惠 2026-04-22 09:00 江苏

讲座预告

南开大学汉语言文化学院、国际教育学院将特邀冉启斌教授,带来题为《“词向量”计算在语言文学研究中的拓展应用》的专题讲座。此次讲座将会谈及“词向量(word vector)”技术是自然语言处理的方法之一,也是语言大模型(LLM)的重要基础,其方法亦可应用于语言学本体研究及文学、文化等其他学科研究;本次报告还将介绍利用“词向量”技术进行关键词相似度计算开展的一系列研究,涵盖汉语拼音、港澳台、南海、现代汉语等主题的知识图谱,以及中国古代文化名人、典籍的知识图谱等内容。

讲座时间及其他

  • 时间:2026年4月23日(周四)中午12:00

  • 参与方式:飞书会议(278-221-878)

  • 主持人:温宝莹

  • 主办单位:南开大学国际教育学院/南开大学汉语言文化学院

主讲人简介

冉启斌教授,教育部青年人才项目入选者,南开大学文学院教授。兼任中国民族语言学会实验语言学专委会执行主任、中国语言学会语音学分会副主任委员等。知名语言学数据库 ASJP 数据库(第 21 版)共同主编之一。主要从事实验语言学、语言信息处理、应用人工智能的语言研究,和团队成员发表论文 140 余篇;出版学术专著 6 部(含合著)。主持国家社科基金重大项目等科研项目 10 余项。建立学术网站 2 个,主持微信订阅号 1 个(语言实验与计算)。

比特人文

投稿邮箱:dhbase@126.com

扫码关注 获取更多资讯

图片

阅读原文

跳转微信打开

  •  

会议预通知丨2026年首届大学生国际数字人文节(IDHFUS 2026)

RUC信息资源管理 2026-04-21 09:01 北京

以下文章来源于:RUC信息资源管理学院

RUC信息资源管理学院

中国人民大学信息资源管理学院官方微信平台,发布学院动态,致力于为每一个信管人构建与学院沟通的桥梁。

2026年9月18日—9月20日,中国人民大学

数字技术正以前所未有的力量重塑人类文明的记忆与表达。从古籍善本的数字复原到非物质文化遗产的交互再现,从海量历史数据的智能挖掘到跨文化叙事的可视化构建——数字人文正成为这个时代最富活力的交叉学科之一。

如果你对技术与人文的碰撞充满好奇,如果你有一个关于文化遗产、历史记忆或人文数据的创意构想,首届大学生国际数字人文节(IDHFUS 2026)正是为你而来!

为响应国家文化数字化战略,促进全球青年在数字人文领域的深度交流与创新实践,中国人民大学信息资源管理学院与数字人文研究院将于2026年9月18日至20日在中国人民大学中关村校区举办本次盛会。我们诚邀全球在校大学生携作品参展,同时欢迎青年教师、研究人员及数字人文相关行业专家参会交流,共同探索数字文明的无限可能。

组织单位

主办单位:

中国人民大学信息资源管理学院

中国人民大学数字人文研究院

指导单位:

世界顶级信息学院联盟(iSchools联盟)  

世界绿色设计组织(WGDO)

亚太数字人文教育协作委员会

国家文化科技创新服务联盟  

(指导单位持续更新中)

活动安排

时间

2026年9月18日—9月20日

地点

中国人民大学中关村校区(北京)

语言

官方语言为中英双语

参与对象

本次活动开放两类参与方式:

参展者:

全球在校大学生(个人或团队均可),   提交数字人文相关作品参加展览与评奖。

参会者:

青年教师、研究人员及数字人文相关行业专家,欢迎莅临交流。

参展要求

作品形式

参展作品须具备数字人文属性,鼓励提交以下类型的数字作品:

1. 数据可视化成果、扩展现实(XR)作品、交互式网站或应用

2. 数据集、软件工具、动画、游戏、视频等数字创作

语言要求

参展作品须以中文或英文呈现。为便于国际交流,所有作品(无论中英文)均须同时提交一份300字以内的英文摘要。

 基本规范

参展作品须为原创,内容健康积极,遵守中国及作者所在国家(地区)相关法律法规,须随附一份简短的AI使用说明,参考格式如下:

是否使用AI: 是 / 否

使用环节与工具:(例:用ChatGPT翻译英文摘要 / 用Midjourney生成配图 / 用Python+AI库辅助数据清洗)

人工贡献确认:本人保证核心观点、史料分析及最终结论均由本人完成,未由AI直接生成。

赛道设置

参展者可选择以下任一赛道:

赛道1:自选主题(围绕“遗产·记忆·视界”自由创作)

赛道2:(企事业单位命题赛道,待发布)

赛道3:(企事业单位命题赛道,待发布)

获奖权益

本次活动设有多项奖项,评委团由全球知名数字人文专家学者组成,为获奖作品颁发获奖证书。其它获奖权益如下:

1

奖金支持:评选设置奖金奖励

2

专业资源:专业工具授权与算力资源支持

3

专家辅导:学术+技术专家一对一指导深度打磨作品

4

专家辅导:学术+技术专家一对一指导深度打磨作品

5

成果转化:对接文化数字化落地场景与成果孵化平台

6

案例入库:优秀获奖作品将纳入数字人文优秀案例库

7

学术发表:优秀获奖作品的相关研究论文将在《数字人文研究》期刊发表

学术期刊支持单位

《数字人文研究》

(更多支持单位持续征集中)

重要时间节点

作品提交及挑战赛报名截止

2026年7月20日

早鸟报名截止(优惠票)

2026年8月20日

普通参会报名截止

2026年9月8日

活动举办

2026年9月18日

—9月20日

初步日程安排

时间

安排

9月18日

开幕式及主旨报告;

数字记忆联盟成立大会

及联盟成员项目展演;

工作坊1;闭门会;学生作品展

9月19日

工作坊2;

数字人文实验室开放日;

青年沙龙;学生作品展

9月20日

闭幕式及颁奖典礼

学生作品展

详细议程见正式通知

联系方式

联系人:胡老师

联系电话:13021941288

电子邮箱:(详见正式通知)

官方网站:(详见正式通知)

数字人文不仅是技术与人文的简单相遇,更是一代青年对文明传承与创新使命的主动回应。期待与你相聚北京,共赴这场数字人文的国际盛会!

中国人民大学信息资源管理学院

中国人民大学数字人文研究院

2026年4月

排版:欧阳振伟

初审:任明

核发:韩曙光 闫慧

阅读原文

跳转微信打开

  •  

转载 | 观澜·驻访学者沙龙(具身心智工作坊第2期)| 人与机器人:从科幻到现实

2026-04-19 22:15 广东

我院2026年春季学期校内驻访学者李珍教授将担任召集人,主持开展共四期的具身心智工作坊。

为进一步营造深圳校区浓郁的人文学术氛围,人文社会科学研究院(以下简称“文研院”)策划推出“观澜”系列学术活动,旨在搭建开放、前沿的学术交流空间,更好地展现人文社科领域的思想碰撞,促进学科交融。

“观澜”取义,既在方法与视野,又在境界与格局“观澜”系列学术活动将由文研院携校内驻访学者在深圳校区组织开展,包括学术沙龙、专题讲座、雅集等丰富多样的形式。我们诚挚邀请校内外师生持续关注,积极参与,在“观澜”中共同见证思想的交汇与新生。

在本学期的“观澜·驻访学者沙龙”专栏中,我院2026年春季学期校内驻访学者李珍教授将担任召集人,主持开展共四期的具身心智工作坊。该系列工作坊旨在打破学科壁垒,深度融合认知科学、人工智能、哲学、法学及科幻视角,围绕具身认知、人机关系、身体智能与AI伦理法规四大核心议题,开启一场连接前沿科技与人文思考的深度对话,诚邀校内外师生踊跃参与,共话心智与智能的交汇之道。

下面推出的是“观澜·驻访学者沙龙”专栏具身心智工作坊系列第2期——人与机器人:从科幻到现实。

01

会议信息

会议时:4月20日(星期一)14:30-17:30

会议地点深圳校区文学园 5 栋 403 会议室

召集人李珍

中山大学马克思主义学院教授、人文社会科学研究院 2026 年春季学期校内驻访学者

02

会议议程

开幕式

主持人:李珍

报告一

具身智能下的人工智能发展前景

报告人:韩瑜

中山大学智能工程学院教授、广东省消防科学与智能应急技术重点实验室主任

与谈人:

  • 刘骁奔  生生科技创始人、2025年博古睿论文奖获奖者

  • 李毅琳  中山大学马克思主义学院助理教授

报告二

从互动到他者:当机器人开始凝视我们

报告人:王华平  

中山大学哲学系(珠海)教授

与谈人:

  • 周国梅  中山大学心理学系教授、人文社会科学研究院 2026 年春季学期校内驻访学者

  • 阮   凯  中山大学哲学系(珠海)副教授

报告三

机器人:科幻与现实的边界行者

报告人:程林

广东外语外贸大学外国文学文化研究院教授

与谈人:

  • 徐翌茹  中山大学外国语学院教授、人文社会科学研究院 2026 年春季学期校内驻访学者

圆桌讨论 (30 分钟)

内容来源:中山大学人文社会科学研究院

编辑:陈旖旎

初审:蔡一峰

复审:林  耿、陈诗诗

审定发布:张  伟

阅读原文

跳转微信打开

  •  

实验室召开学术委员会年会

2026-04-20 09:50 湖北

2026 年 4 月 17 日,武汉大学文化遗产智能计算实验室学术委员会年会在人文社科楼 B111 顺利召开。

 👆👆👆点击蓝字 · 关注我们

图片

2026 年 4 月 17 日,武汉大学文化遗产智能计算实验室学术委员会年会在人文社科楼 B111 顺利召开。武汉大学党委常委、副校长陆伟,湖北省文化和旅游厅党组成员,省文物局党组书记、局长陈飞,武汉大学人文社会科学资深教授、实验室名誉主任马费成出席会议并致辞。学术委员会委员及相关领域 20 余位专家参与会议。

武汉大学人文社会科学研究院院长冯果、武汉大学人文社会科学研究院平台建设处副处长冯志轩先后主持会议。

陆伟强调,实验室肩负服务国家重大战略的重要使命立足信息资源管理、测绘科学与技术等学科优势以学科转型为抓手,推动科研成果高质量转化。实验室要强化智库服务功能,以实体化平台为载体,产出更多专利、专著与落地产品,持续加强平台建设,不断提升服务国家与地方文化发展的能力。

陈飞表示全省文物系统坚持以科技赋能、数智支撑,积极探索新时代文物保护利用、价值阐释与传播展示新路径,推动文物保护利用取得扎实成效实验室作为教育部首批哲学社会科学实验室,是政产学研协同的重要平台,为湖北文物科技保护提供了有力支撑。同时陈飞对实验室建设和文化遗产保护双向发展提三点期望:一是强化使命担当,服务国家与省级战略。二是坚持创新驱动,深化学科交叉融合。三是扎根荆楚沃土,赋能文物事业高质量发展。

马费成表示,实验室依托武汉大学人文社科深厚底蕴,联动文学、历史等传统学科,借力测绘科学与技术等理工学科优势,构建文理交叉、互鉴共融的研究场景,为新文科建设提供重要实践样本。实验室在文科实验室建设模式上积极探索,精准对接国家与省级重大需求,在文物保护、古籍整理、遗址数字化等领域贡献突出,未来要进一步拓展学校资源,持续服务长江文明溯源等重大研究,助力文化高质量发展。

实验室主任王晓光从科研项目、科研成果、人才培养、国际交流、社会服务等方面对实验室过去五年的建设情况进行整体汇报。五年间,实验室建成全国首个“文化遗产数字演绎剧场”,承担 20 余项国家级项目,产出系列论文、专利、软著等丰富的科研成果,形成人才培养、国际合作、社会服务协同推进格局。王晓光表示,未来力争建成国际一流的哲学社会科学实验室与数字文化人才培养平台

中国人民大学国家一级教授学术委员会主任冯惠玲主持学术委员会交流环节并作总结。学术委员会对实验室近五年的建设成效、特色成果与创新模式给予高度肯定,指出实验室未来应着重在高质量数据资源建设、共性关键技术创新、科技成果转化、政产学研合作等方向发力,探索文科实验室建设体制机制创新。

武汉大学信息管理学院党委书记王三礼代表武汉大学信息管理学院,对各位专家的到来与建言献策表示衷心感谢。他表示,实验室的建设与发展离不开各位专家的悉心指导与大力支持,学院将与实验室一道,认真梳理吸纳各位专家的宝贵建议,聚焦 AI 时代文科教育与高校治理的新命题,持续探索文科实验室的运转机制与成果转化路径,以问题为导向破解发展难题,推动实验室建设再上新台阶,为新文科建设与文化遗产数字化事业贡献武大力量。

会议期间学术委员们在王晓光与实验室副主任王玉珏陪同下,现场考察了实验室在设备装置、数据平台、科研项目等方面的建设成果

本次会议围绕文化遗产智能计算前沿探索、学科交叉创新与成果转化应用,全面总结实验室建设成效,明确未来发展方向与重点任务。实验室将以此次会议为契机,深耕文化遗产智能计算领域,为服务国家文化数字化战略与文化强国建设凝聚共识、汇聚力量。

(通讯员:翁梦娟、周柃妍,排版:刘天畅)

编辑|文化遗产智能计算实验室

审校|刘争

武汉大学人文社科楼

阅读原文

跳转微信打开

  •  

袁毓林 | 《新文科视角下的计算社会语言学研究》

袁毓林 2026-04-21 09:00 江苏

新文科下以第一代交叉学科融合构建计算社会语言学,研究语言社会变异与计算建模。

转引自:《语言文字应用》2024年第1期,第5-16页

作者简介

袁毓林,澳门大学教授,主要研究理论语言学和汉语语言学。

新文科视域下的计算社会语言学研究

袁毓林

澳门大学人文学院中国语言文学系/北京大学中文系

摘要:新文科建设的目标之一是:多种学科在研究内容和理论方法上的交叉与融合,从而形成新的学科方向和研究范式,以及相应的复合型人才培养模式。为此,本文提出一种可操作的路径:利用已经发展起来的若干第一代交叉学科,融汇成第二代交叉学科。比如,对于“社交网络—语言的社会变异—计算建模”这种头绪繁多的研究领域,可以借助“计算语言学”与“社会语言学”等第一代交叉学科,形成“计算社会语言学”这种第二代交叉学科。这种操作路线可以细化与落实新文科建设,并提供必要的学科规训。文章还以当代社会的“物理—精神—信息”三元空间,以及其中说话者的社会身份、个体人格和社交互动对语言使用和变异选择的影响为例,说明计算社会语言学的理论、方法和议题。

关键词:新文科建设;第一/二代交叉学科;计算/社会语言学;三元空间

一、新文科建设视域中的社会计算

新文科建设的一个重要特征是,建设一批多学科交叉的人文社会科学的新兴研究领域或研究方向。这种愿景和理想是非常美好和丰满的,有助于培养能够应对未来挑战的跨学科的复合型人才;但是,实现起来却是十分艰难的,从具体的学科群选择与组合、研究目标设计到操作路线与实施方案的制订,都需要进行不断的探索和尝试;并且,要冒着因尝试失败而沉没了机会成本的风险,甚至还可能要背上误人子弟的骂名。因此,不同的学科怎样寻找相关的伙伴学科,形成有议题(研究内容新颖而且重要)、可操作(有技术支撑)、有发展前途(带来理论突破或应用落地)的交叉学科,是新文科建设成败的关键要素和重中之重。

一般的印象,新文科不同于传统文科的一个标志是:有意识地在人文社会科学的研究内容或方法中,系统性地融入当代前沿的科学技术,以期形成新的学科方向和研究范式,以及相应的复合型人才培养模式。比如,随着大数据(Big Data)技术的跨越式发展,“计算”已经越来越成为人文社会科学领域的关键词。跟“计算”相结合的多学科/交叉学科/跨学科的(multi/inter/trans/cross-disciplinary)研究领域也开始大量涌现,形成了数字人文(Digital Humanities、社会计算(Social Computation)、计算社会科学(Computational Social Science计算传播学(Computational Communication)、计算社会学(Computational Sociology)等新兴学科或研究方向。值得一提的是,2009年,哈佛大学的David Lazer联合从事信息科学、社会学和物理学的15位学者Science杂志上联名发表文章(Lazer, et al. 2009),创造性地提出了“计算社会学”(Computational Sociology)这一新兴学科。他们阐述了利用计算手段,从大数据中揭示社会学规律的学术思想和趋势。这标志着社会学研究进入到数据计算时代。因为,当代科学技术的显学是计算机科学技术和网络大数据技术;所以,像“计算社会学”肯定可以算是“新文科”。随后短短几年内,计算社会学已成为人文社科领域近年来最重要的研究范式。《科学》(Science《自然》(Nature和《美国国家科学院院刊》(PNAS)等国际顶级学术期刊上,大量涌现计算社会学的研究成果,众多学术期刊出版专刊介绍计算社会学研究的进展。美国还成立了计算社会学学会,George Mason大学甚至成立了计算社会学系,并成为世界上第一个正式授予计算社会学博士学位的单位。计算社会学无论对于揭示人类与社会规律,还是对于用户个性化服务,均具有重要的意义。因此,基于社会媒体大数据的计算社会学研究,在学术界和产业界均引起了广泛的关注。这可以说是国际学术界新文科开拓与建设的一个成功的范例,足以为我们的新文科建设提供经验。

二、社会计算的议题与方法

我们认为,就利用社会媒体大数据的社会计算和计算社会学而言,也并非只有原来从事计算机科学技术和社会学的学者才可以涉足;其实,语言学研究者也是可以积极参与的,并且还是可以大有作为的。因为,社会媒体的海量数据中,绝大部分是用自然语言写成的长短不一的文本;其中蕴藏了跟用户及其复杂的社会结构有关的丰富信息,是社会学、心理学(特别是社会心理学)和语言学(特别是社会语言学)等学科的重要研究对象和研究角度。但是,这些学科所需的信息都隐藏在复杂的语言背后,需要利用自然语言处理和理解技术挖掘出来,才能被计算社会学研究进一步加以利用和提炼。而这种对语言数据的处理,正好是语言学、自然语言处理和计算语言学等学科的强项。

近年来,随着机器学习和自然语言处理技术的发展,如何更好地分析社会媒体大数据中的自然语言(即文本信息),已经成为社会计算、计算社会学研究的热点;吸引了众多不同学科的学者的研究兴趣,学科体系与范式已初具规模。并且,取得了不少令人鼓舞的成果。比较著名和成熟的研究有下列四个方面:

1词汇的时空传播与演化研究。比如,哈佛大学研究团队利用Google Books收集并扫描识别的1800年到2000年之间的500万种出版物(占人类所有出版物的4%),通过不同关键词使用频度随时间的变化,分析了人类文化演进特点,做出了很多惊人的或有意思的发现。例如,他们发现在过去几百年里英语中越来越多的不规则变化动词演化成了规则变化动词(Lieberman, et al. 2007)。再比如,通过Google Books中历年来使用The United States is”和“The United States are”两种表达形式的统计趋势图,来定量地分析美国作为一个统一国家的概念是如何慢慢形成的(Aiden & Michel 2013)。词汇是文本中负载信息的基本单位,考察社会媒体中词汇的时空传播与演化,无论对语言演化研究,还是对社会管理,均具重要意义。

2语言使用与个体差异。比如,Pennebaker & King1999)以词汇作为语言使用定量分析的基本单位,在给定的个体或群体对应的文本中进行词频统计,从而建立起个体差异(即不同人格)与词类比例(即语言使用特点)之间的关联关系。研究者们发现,抑郁与自杀者往往会在文本中发出可侦测的求救信号;初次约会的时候对象之间几分钟的对话就可以预测彼此的好感,而情侣间的对话也可以预测几个月后持续交往的概率;团队的凝聚力和合作倾向也可以通过内部对话做出预测,等等(详见下文§5)。近年来,在社会计算领域提出了用户建档(user profiling)的研究任务,旨在利用用户产生内容预测用户的各种属性,既包括用户的各种简单属性,如性别、年龄和地理位置等,也包括用户的复杂属性,如兴趣、政治倾向、性格特点和主观幸福感等。

此外,还有(3语言使用与社会地位的关系,和(4语言使用跟群体的关注话题与情绪态度,等等。诸如此类的研究,不仅具有社会学、心理学和语言学方面的学理价值,而且在舆论监测、社会管理和客户分析等方面,都具有重要的应用价值。

三、从“计算语言学”和“社会语言学”

“计算社会语言学”

众所周知,高等院校的学科体系和专业分工是已经制度化了的。并且,不同的学科在学科传统、方法论和学术追求与价值观方面,也存在巨大的差别。这在历史上形成了所谓的“学科鸿沟”或“学术壁垒”,或者如俗话所说的“隔行如隔山”。因此,要把不同的学科整合起来,殊非易事。对此,我们提出一种可操作的实践路径:尽可能有效地借鉴和利用已经发展起来的相关的几种第一代交叉学科,再次进行交叉与融合,从而形成第二代交叉学科。这样做好像是在比较坚固的旧楼上面加盖新的楼层,可以取得以旧出新、物尽其用、组合增效、事半功倍的效果。比如,面对“社交网络—语言的社会变异—计算建模”这种头绪繁多的研究领域,和相应的“大数据与计算科学—社会学—语言学”等多种学科和知识体系,可以借助已经成熟的“计算语言学”Computational Linguistics, CL“社会语言学”Sociolinguistics等第一代交叉学科,形成“计算社会语言学”Computational Sociolinguistics, CS这种第二代交叉学科,从而使得相关的新文科建设不仅路径清晰、基础扎实,而且有法可依、有章可循。

关于第一代交叉学科“计算语言学”的思想源头,可以追溯到研制电子计算机的当初。大家也许知道,著名的“图灵测试”(Turing Test)就是以自然语言理解与翻译为思考背景的。相应于“自然语言处理”(natural language processingNLP)和“自然语言理解”(natural language understandingNLU)这种研究方向与工程领域,学者们提炼出了“计算语言学”这种学科建制与学科体系,以利于学术探索和人才培养。

关于第一代交叉学科“社会语言学”的发展与兴盛,可以归功于Labov (1966)Weinreich, et al.1968)等一系列关于语言与社会的共变关系的研究。他们采用口头访问、书面问卷和民族志等方法,系统地调查和研究了说话者的性别、年龄、地理位置、社会阶层和权力关系等社会结构对个体与社群的语言使用的影响,发现了说话人的有关社会变量(social variables)与语言变异(linguistic variation)之间的对应关系,揭示了语言使用的阶层差异与历史演变的重要规律,推动了社会学、心理学和语言学的深人与细化。

现在,Nguyen, et al.2016认识到:随着大数据的发展,相关的科学正在经历着一场范式的转变。除了聚焦于传统的自然现象描写、理论发展以及计算科学,数据驱动的探索和发现已经成为许多学科的方法论框架的有机组成部分,而计算语言学也在这进化之列。考虑到以往的计算语言学主要是捕捉语言的信息维度和语言信息传递的结构,对语言的社会维度关注很少。最近二十年来,受社交媒体大数据的驱动,计算语言学对研究社会环境中的语言的兴趣越来越浓。社交媒体平台上的大数据为计算语言学的研究提供了新方向,也具有方法论意义。当然,此方向也面临着一些挑战,比如:(1)比起计算语言学传统上用的语料来,社交媒体中的语言更口语化、变异也更多;(2社会变量和语言之间的关系是更为动态和脆弱的,这也不同于计算语言学以往所关注的文意和结构之间的相对固定的关联。另一方面,传统的社会语言学用量化或质性方法来研究口语语料,而调查和民族志方法则是语料收集的主要手段,但是其语料规模往往较小。随着类似社交媒体平台语料的出现,大规模的数据为语言变异研究提供了更为宽阔的舞台。面对这些更为庞大也更为异质的语料,社会语言学需要新的方法论,而计算语言学则正符合这一期待。于是,他们大胆地构想一个计算语言学和社会语言学相结合的、可以被称之为“计算社会语言学”的新兴交叉领域;并且,明确其目标是从计算的角度研究语言与社会的关系。这篇论文详细地讨论了“计算社会语言学”的原理和范围及方法论特点,讨论了说话者如何使用语言来塑造对其身份的感知,并重点讨论了基于性别、年龄和地理位置的语言变异模型的计算方法;还从单个说话者转向成对、成组和社区,讨论语言在塑造个人关系、改变风格的使用以及在社区中采用规范和语言变化方面的作用;讨论了多语言和社交互动,其中概述了处理多语言交流的工具,如分析器(parsers)和语言识别系统(language identification systems),还讨论了从计算角度分析多语言交流模式的方法;最后,该综述论文指出了“计算社会语言学”这个研究方向所面临的挑战,也即这个新兴的多学科研究领域(an emerging multidisciplinary field)的研究议程(research agenda):扩展调查范围,调整方法框架以提高兼容性,根据社会语言学研究的需要调整自然语言处理的工具。

我们认为,这种基于成熟的若干第一代交叉学科来构建第二代交叉学科的做法,路径清晰、方法可靠、规范明确、有章可依,不仅可以指导我们细化与落实新文科建设,并且为我们的新文科建设提供制度化的学科规训(古拉丁文disciplina英文discipline/disciplinarit)。下面,我们主要根据Nguyen, et al.2016刘知远(2021)等材料,再结合笔者的语言学工作经验和文献阅读体会,简单介绍和讨论一下社会计算语言学的有关理论假设、研究方法和主要课题。

四、计算社会语言学的理论、方法与课题

作为第二代交叉学科,计算社会语言学尝试整合社会语言学和计算语言学的有关方面,从大数据和计算的角度对人们的语言(变异)和社会(参数)之间的关系进行研究,探讨对相关的语言内容及其社会背景信息的数据收集、计算建模和结果分析、及对其理论含义的揭示的一系列方法,以便在新的技术和学科背景上,加深对于语言运用中的社会动态(social dynamics)的理解,对在社会环境中使用语言这一主题产生新的见解;并且,通过这种基于社会语言学的语言研究,来改进相关的自然语言处理的工具与方法,帮助建立更加丰富的语言计算模型,从而对社交媒体上的文本及其内容处理提供更多的学术支持。比如,基于对用户语言选择的分析,自动检测用户的性别、年龄、地理位置或从属关系(工作单位或所属机构)、甚至性格特点、兴趣爱好和政治倾向等的研究,可能会给自动用户分析工具(如前述的用户建档)带来好处。反过来说,这种注重语言的社会变异的研究,可以超越经典的自然语言处理工具背后的典型假设,即语言使用同质性(homogeneity),从而让相关的语言计算工具更加贴近互联网语言运用的实际生态。

在社会语言学研究中引入计算建模方法,这是由我们这个网络时代语言运用的实际生态所要求的。因为,随着移动互联网的普及,数字信息世界这个虚拟空间已经成为人类的生活世界的一个不可或缺的组成部分。我们的社会突破了传统的“物理世界—精神世界”这种二元空间,已经全面进入了“物理世界—精神世界—信息世界”这种三元空间。人们在无处不在的信息空间中频繁交往,不断地通过语言使用来建构(construct)和塑造(shape)自己的线上身份(online identity),维护与管理自己的线上社会关系网络;从而在这种以计算机为媒介的交际(computer-mediated communication, CMC)中,形成了大量跟用户的社会变量相关的语言变异,为社会语言学的研究提供了大规模的活生生的素材。并且,信息世界通过万众上网、全民互联和迅速更新的方式,对人们的观念、行为、时尚和情绪等舆情和趋势产生全方位的实时影响。比如,在社会预测方面,社会媒体中关于候选人的提及率就是很好的预测指标。例如,根据Facebook上的支持率就能够成功预测2008年美国总统大选结果(Williams & Gulati 2009)。可见,社会环境的空间结构变化了,在社会环境中运用语言的实际生态也变化了;网络环境中的语言运用已非传统手工方式所能应付,计算建模方法已经是不二的选择。因此,对于社会语言学来说,计算建模不仅是一种方法论,更是一种认识论。在当今网络主宰人类社会的数字化生存时代,计算社会语言学是一种水到渠成的研究范式。

比如,在语料收集方面,社会语言学的传统做法是观察旁听、口头访谈和问卷调查,等等。显然,这是一个耗时费力的过程,而所得的数据集往往很小。现在,随着网络媒体的兴起,微博、论坛、评论等社交平台上用户生成的内容极为丰富,并且这些自然、非正式的语言往往带有上下文信息(比如,用户、社交网络机构、生成时间、地理位置,等等)。在一定的计算手段的帮助下,这些内容成为传统数据收集方法的一个有力的补充。这种计算社会语言学范式下收集起来的网络语料,自然地规避了Labov (1972)所谓的“观察者悖论”(observer’s paradox):社区语言研究的目的必须是发现人们在没有被系统观察时是如何说话的,然而我们却又只能通过系统观察来获得这些数据。此外,计算语言学上常用于获得各种大规模标注数据的“众包”(crowdsourcing)方式,也可以被计算社会语言学用以获取不同的人群如何使用某种语言变体,以及不同的人群如何看待不同的语言变体的大量数据。总之,计算的视窗一经打开,社会语言学的语料收集和处理方式就别开生面,如虎添翼。

在对语料的计算建模等研究方法方面,目前的计算语言学和自然语言处理,按照语言的结构层次和任务需求,已经形成了下列相对丰富和成熟的技术和系统:1词汇层,自动分词、词类标注、命名实体识别等;2句法层,自动句法分析、依存关系分析、层次结构和成分关系分析等;3语义层,词义消歧、语义角色标注、同义互释、文本蕴涵分析等;4篇章层,指代消解、共指消解、篇章结构、话题发现与跟踪等;5应用层,文本分类、信息抽取、智能问答、文档摘要、机器翻译等;6)算法模型层,除了传统的支持向量机(Support Vector Machine, SVM)、逻辑回归(Logistic Regression)、朴素贝叶斯(Naive Bayes)等算法,还有n-元语法(n-grams)、新兴的潜在变量建模方法(latent variables modeling approaches),以及最近十几年来发展起来的概率图模型(probabilistic graphical models )、神经网络方法中的深度学习(deep learning within a neural network approach)。这些不同层面上的计算建模方法,可以在研究语言变异与社会变量的对应关系时选择性地使用

在研究课题方面,计算社会语言学一方面继承社会语言学的两大主题:(1)社会身份与语言变异的关系,(2)社交环境与语言变异的关系;当然,计算社会语言学更加注重利用计算建模的方法,来探讨和研究这些问题。另一方面,计算社会学上已经开展的词汇的时空传播与演化、语言使用与个体差异、语言使用与社会地位、语言使用与群体分析等专题,也可以融入和拓展上述两个方面。下面三节分别简单地进行介绍。

五、社会身份与语言变异的计算方法

下面简单地举例说明,怎样建构跟社会身份(social identity)相关的语言变异的计算方法。众所周知,社会语言学的一个重要假设是:说话者用语言来构建他们的社会身份,语言(特别是其中的变异形式)是说话者用来塑造其身份的工具之一。当计算语言学认识到语言的使用可以揭示其使用者的社会模式以后,许多研究就集中于从文本中自动推断作者的有关社会变量(social variables)。这个任务可以看作一种自动的元数据检测,以期得到关于作者特征的有关信息。随着对社会趋势分析工具的需求的日益增长,人们对这类元数据检测算法的开发和改进也越来越感兴趣。在计算语言学社区中,跟种族、社会阶层等群体变量相比,依据性别、年龄和地理位置等个体变量的语言变异受到了更多的关注。

在数据收集方面,早期的研究基于语料库中的正式文本,或者在当面对话或电话交谈等受控环境中收集。随着社交网络媒体的普及,人们从博客、推特、论坛等不受控环境中收集非正式文本。由于这类数据通常缺乏明确的关于用户的性别、年龄、位置等身份的信息,因而研究人员需要使用不同的策略,从用户提供的有限信息、注释或名字上来获得足够的标签。

以性别建模为例,计算语言学研究过文本作者的自动分类。曾经用支持向量机、逻辑回归、朴素贝叶斯等算法,对作者进行基于生物学特征的二元分类。但是,社会语言学的研究表明,这种把性别作为说话者的一种固定属性的做法,忽略了说话者的主观能动性(the agency of speakers)。从社会学的角度看,性别是一种社会结构,性别行为是社会习俗的结果,而不是固有的生物学特征。如果联系会话伙伴、互动环境和社交网络,对语言使用中性别的特定模式进行计算研究;那么,可以发现:尽管某些语言特征通常被男性或女性更多地使用(比如,在词类频率方面,男人更多地用介词、冠词,而妇女更多地用代词,特别是第一人称代词;在风格方面,男人倾向于用长的词句和文本、更多地用詈辞,而妇女更多地用情绪性词语、及“omg”“lol”之类典型的社交媒体词语)。但是,个别说话者可能会偏离许多研究中强调的刻板印象(stereotypes,例如:男人善于用“报告性”言谈来交换信息,妇女于喜欢用“亲善性”言谈来建立联系)。有研究发现,在同性别的人们交谈时,他们/她们更多地使用专属于其性别的语言变体。此外,性别因文化和语言的不同而形成不同的形态。这一切,有助于更好地证明:语言(运用)本质上是社会性的,语言的共时变异和历时变化跟语言使用者的社会变量直接相关

另外,怎样发现和分析年龄、地理位置跟语言使用的关系(比如,什么年龄层次的人、处于什么场合更加容易偏离标准语的规范)?怎样为年龄和位置的变化建模(离散的年龄段还是连续的生命周期,离散的行政区划还是连续的地理坐标)?怎样利用语言使用者在推特等社交媒体上留下的GPS信息,或者他们在用户介绍中提供的位置信息?以及怎样对这些维度的调查结果进行解释?比如,年轻人更多地使用单数第一和第二人称代词,而老年人更多地使用复数第一人称代词及介词、定指词与冠词,这种倾向性跟语言类型(是不是代词脱落型语言,pro-drop language)有没有关系?这些也是从计算角度研究社会结构如何影响语言使用的核心课题

反过来看,如果研究清楚了由性别、年龄和位置等变量决定的说话者的社会身份,怎样影响了语言变体的选择;那么,这种成果肯定也可用以帮助改进基于身份信息的内容检测和文本分类等自然语言处理任务。比如,Dadvar et al. (2012)训练针对特定性别的分类器,来侦测网络霸凌(cyberbulling)的实例。他们发现,不同性别的侵扰者使用的语言是不同的。再比如,Hovy (2015)发现,训练针对特定性别或年龄的词嵌入向量(word embeddings),可以改善情感评价分析(sentiment analysis)和话题分类(topic classification)等工作。这就走向语言学的社会研究和计算研究的双向对流、互惠互利和协同发展,也显示出计算社会语言学的应用潜力。

事实上,计算语言学社区已经展开了从有位置标签的数据(location-tagged data)上,训练和开发自动预测说话人的位置的一系列研究。比如,Eisenstein, et al. (2010)开发了一个话题模型(topic model),来识别区域惯用词语跟语言区域在地理上的相关性。这个模型被用以根据推特文本来预测推特用户的位置,成功地通过了测试。显然,这种基于文本的话题来预测用户的位置的计算模型,可以用来发现新的具有社会语言学价值的语言使用型式(new sociolinguistic patterns)。再比如,Bamman, et al. (2014)通过增加表示美国州名的语境变体,来扩展Mikolov, et al. (2013)“跳词语法”模型(skip gram model结果,这个模型学会了全局嵌入矩阵和增加的每一个语境(比如,州)的嵌入矩阵,从而捕获了词的意义的地域变体形式,最终发现了有关词的意义怎样随着地理位置的变化而产生变异。我们相信,随着诸如上面这种分布式语义表示技术等计算模型的引入,计算社会语言学的技术路线也将越来越宽广。

六、个体人格与语言变异的计算方法

事实上,对于个体的语言使用和变异选择来说,比社会身份更加隐蔽和关键的决定因素,可能是人格差异。人格心理学(personality psychology)和社会语言学的相关研究发现,人类个体的人格差异会反映在他们的语言使用特点上。因此,如何定量地建立起语言使用与个体人格差异之间的关联,是心理学、语言学和社会计算的重要课题。关于这个主题的最具代表性的计算建模工作,是20世纪90年代PennebakerKing提出的“语言探求与词数统计”(Linguistic Inquiry and Word Count, LIWC)方法(Pennebaker & King 1999。这是一种基于词典的词语计数程序(dictionary-based word counting program),其基本思想是:以词汇作为定量分析语言使用的基本单位,首先通过人工收集、标注的方式,建立词语的不同类别(如代词、数词、情感词等)的词典;然后在跟给定的个体或群体相对应的文本中进行词频统计,从而建立起个体差异(即不同人格)与词类比例(即语言使用特点)之间的关联关系。Pennebaker教授的研究团队已经在这方面做了大量有影响的工作。他们发现,抑郁与自杀者往往会在其文本中发出可侦测的求救信号(Chung & Pennebaker 2007);初次约会的时候,对象之间几分钟的对话就可以预测彼此的好感,而情侣间的对话也可以预测几个月后持续交往的概率(Ireland, et al.2011);团队的凝聚力和合作倾向也可以通过其内部对话做出预测(Gonzales, et al.2010);谎言的有关语言特性也有助于分辨真假(Newman, et al.2003);对语言使用进行分析,还将有助于结识新朋友(Pennebaker & King 1999);语言使用还与年龄有千丝万缕的联系(Pennebaker & Stone 2003)等等。

目前,在大规模网络社交媒体普及的背景下,通过语言使用分析个体差异更凸显其重要性。一方面,很多在小规模数据集上建立起来的社会理论,需要在大规模真实数据集上进一步验证或再发现;另一方面,利用社会媒体用户产生的文本数据推测用户的人格或心理特点,可以在个性化推荐服务中发挥重要的作用。正因为如此,近年来,在社会计算领域中,研究人员提出了用户建档(也称为“用户画像”)的研究任务,旨在利用用户产生内容来预测用户的各种属性,既包括用户的有关简单属性,如性别(Burger, et al. 2011Fink, et al. 2012)、年龄(Goswami, et al. 2009)和地理位置(Rao, et al. 2010Li, et al. 2012)等,也包括用户的有关复杂属性,如兴趣(Yang, et al. 2011)、政治倾向(Rao, et al. 2010)、性格特点(Mairesse, et al. 2007Schwartz, et al. 2013)和主观幸福感(Frank, et al. 2013Mitchell, et al. 2013Dodds, et al. 2011,等等。这种研究成功地把语言使用特点跟用户的其他方面的特征(如用户的社会网络结构、在线行为模式等)综合起来进行有效的属性预测。特别是,在研究手段上超越了词频统计的层面,充分利用了机器学习和自然语言处理领域的新方法,如向量空间模型(Manning et al. 2008)、隐含主题模型(Steyvers & Griffiths 2007)、时间序列分析(Hamilton 1994)等,在定量分析的广度和精度上都向前推进了一大步。这种类型的研究,为我们建设计算社会语言学开辟了新的领域和研究手段。

现在,面向大规模在线社会媒体的语言使用跟个体差异的关系的研究,尚处于起步阶段。一方面,在线社会媒体为语言的变异研究提供了极为丰富的分析素材和观察角度;另一方面,机器学习和自然语言处理的发展也为语言使用和语言变异分析,提供了更丰富的测量维度和更合适的计算建模工具。可以预期,在深度学习和语言大模型的推动下,未来将能看到关于语言使用与个体的人格差异的更多、更深层次的分析和发现,从而推动计算社会语言学向更加微观和深入的方向发展。

七、社交环境与语言变异的计算方法

语言运用往往是在成对、成组和成社群的人员构成的社会互动环境中进行的。这给了不同的说话人一个机会,来顺应或塑造社会关系,并响应特定的社交场合和相遇细节(如对话者或听众、话题和说话人的目标等)。这种跟社交环境相关的语言变异研究,特别需要计算建模的方法。因为,首先,从数据源的角度看,各种线上社区、论坛、课堂(on-line community, forum and classroom)等在线数据中,有大量的详细的交互记录,已经推动并促成了计算语言学社区关于这一主题的大量工作。其次,从上述语料中,我们可以通过一定的计算手段,来自动地提取社会关系,揭示社会关系的强弱、权力等级、礼貌策略、风格转换等对语言运用的影响因素。

语言运用往往不仅是一种信息交流的过程,而且也是一种表现自我和定位他人、以及反映说话人跟会话伙伴的相对地位的社会行为(social behaviour)。这种言语行为表现上的一致性,等于是定义了会话角色(conversational roles)。也就是说,从诸如此类的语言运用中,可以揭示相关说话人之间的社会关系的若干线索。正是认识到了这一点,计算语言学社区已经展开了基于文本的不同类型,来自动提取会话者的社会关系及其动态变化的研究,成功地从语言使用上发现了弱关系(比如熟人)和强关系(比如家人或密友)的区别。Bak, et al. (2012)用自动识别话题的方法,研究推特用户在强弱不同的关系中自我透露(self-disclosure)的差异。他们发现,推特用户面对强关系会透露更多的个人信息,而面对弱关系则会显示更多的正面的情感评价。这种现象,也许可以用照顾初次相识这种社会规范来解释。其他一些研究,已经从更广泛的数据集中自动提取了社会关系;从而发现线上互动时,发送消息的作者是向上言说(面向较高社会地位)还是向下言说(面向较低社会地位),在语言使用上有不同的表现。还有人用逻辑回归方法来对线上语料库中的权力关系进行自动分类,进而得以分析所提取出来的社会网络结构。比如,社会语言学调查了说话者如何使用语言来维持和改变权力关系,计算语言学探索了怎样从文本中自动识别权力关系。但是,对于不同社区之间的人们的社会互动,迄今的研究仍停留在简单的层面上。

关于不同权势的人们之间的语言互动,社会语言学理论曾经提出:地位越低的发言者需要从语言上去适应地位越高的听者,而地位越高的人则不需要调整自己的语言方式去适应别人(Gonzales, et al. 2010)。过去由于缺少相关大规模数据,因而有关理论一直缺少定量分析的支持。美国康奈尔大学的Mizil教授等人选取线上和线下两个场景,验证了语言交流行为是如何体现权力关系的。两个场景分别是维基百科中编辑们的在线讨论,以及法院庭审现场的辩护对话。值得注意的是,这里所谓的语言使用方式,指的是虚词(function words)的使用,而不是实词的使用。他们调查了包括冠词、助动词、连词、高频副词、(非)人称代词、介词和量化词等8种标记,一共451个词项的使用情况。研究者观察了由甲引起的对话中,乙分别用了多少不同种类的标记来回应;并且考察了甲分别用了多少不同种类的标记,可能引起乙分别用了多少不同种类的标记来回应。值得注意的是,这种不同权势的对话者对虚词的不同的使用及其调整变化,甚至可能连对话者自己都没有注意到。然后,他们通过统计和定量分析及形式化刻画,验证了参与讨论的人之间权力的差异,会在两人如何回应对方的语言方式上有所体现Danescu-Niculescu-Mizil, et al. 2012这种结论,也在推特平台上得到了验证。首先,他们同样利用介词等虚词的使用情况,考察了交流双方的语言风格是如何彼此适应的。然后,他们考察了交流双方之间影响的不对称性,以及这种不对称性与社会地位的关系;即地位高的人不会去适应地位低的人,而地位低的人要付出更多去适应地位高的人。研究结果表明,虽然推特对交流增加了一些限制(非面对面,非实时,而且只能说140个词),但交流中仍然有比较明显的语言适应行为(Danescu-Niculescu-Mizil, et al. 2011)。

一般认为,社会交往中的礼貌行为,有助于维持社会和谐和避免社会冲突。Brown and Levinson (1987)发现,语言的礼貌行为受到下列三个社会因素的影响:(1)社会距离(social distance),(2)相对的权力(relative power),(3)诉求的麻烦程度(ranking of the imposition,i.e., cost of the request即请求的成本或代价)。幸运的是,检测礼貌的自动分类器已经被开发出来了,可用于大规模地研究礼貌策略。鉴于礼貌用语的使用跟参与对话的人的社会地位之间具有密切的关系,Mizil团队分别对维基百科编辑和Stack Exchange论坛的讨论者进行了研究。他们把用户对他人提出请求时的对话摘录出来(其中,一句是真正的请求,而另一句是客套话),然后由标注者为其礼貌程度进行评价。研究结果表明,维基百科编辑在选举过程中试图获得更高地位时,会更加礼貌;而一旦选上以后,礼貌程度随机就会下降。这种情况,同样也出现在Stack Exchange上;明显地,人们的礼貌程度跟其地位呈反比关系(Danescu-Niculescu-Mizil, et al.2013a)。

根据Labov1972的研究,没有单一风格的说话者;因为,说话者可能会根据他们的交流伙伴(比如,受话人的年龄、性别和社会背景),在不同风格之间进行切换(风格转换)。此外,话题(比如,政治vs.宗教)、语境(比如,法庭vs.家庭餐聚)等因素也能造成言语风格的转变。根据交际顺应理论(Communication Accommodation Theory, CAT),说话人会让其言语行为更加趋近或背离他们的对话伙伴。其中,趋近行为减少了对话者之间的社会距离。一般来说,作出趋近行为的说话人,往往会被认为是更加讨人喜欢和擅长合作的。现有的研究发现,说话人之间的互相顺应,主要体现在音高、手势、措辞等不同的维度。计算语言学社区侧重于用诸如前述的“语言探求与词数统计”(LIWC)方法,通过对线上语料中人称代词的使用(比如,更多地用单数第一人称还是复数第一人称)等的统计分析,来测度言语风格的顺应。有人发现,网上论坛的跟帖通常重复原帖的词语和句法结构,来达到顺应的效果。还有人用动态贝叶斯模型(Dynamic Bayesian Model),归纳出语料中潜在的风格状态,发现了不同的说话人在顺应方面的差异。

最后,对于社区动态的研究也是计算社会语言学的主题。因为,人们会根据谈话对象调整他们的语言使用。在社区内,规范随着时间的推移,通过成员之间的互动而出现;例如,使用俚语和特定领域的行话,或者在推特上表示转发的约定。对于这一主题的早期调查,是基于非公共社区的数据的。最近的研究则使用了来自公共在线社区的数据,比如在线论坛和评论网站。这一方向的研究,显示了利用大量在线数据定量研究社区语言变化的潜力。当然,在这种分析中,应该仔细考虑数据中的偏差,特别是当数据的动态和内容没有被完全理解时。比如,据Danescu-Niculescu-Mizil, et al. (2013b)介绍,他们以两个大型啤酒评论社区作为研究对象,发现用户在社区中一般会经历两个阶段:在第一个阶段,他们刚进入社区,会积极学习适应社区的语言使用规则;而接下来,他们逐渐不再做出改变,任由规则变化;最后,逐渐退出社区主流群体。这项研究定量地探索了在社区与个人的相互作用下,语言使用规则变化的复杂性。可见,Mizil等人的一系列研究,开创性地在社会媒体大数据上定量验证了社会语言学中的重要理论,并进一步利用该理论展开社会计算的研究。这为计算社会语言学树立了研究典范。

八、结语:用并为计算建模而研究语言的社会变异

新文科建设的出发点是多种相关学科的交叉、融合与创新,通过在研究内容、研究方法和技术手段等方面的跨学科的交融、提炼与整合,形成新的学科方向与研究范式,以及相应的复合型人才培养模式。我们充分地认识到,这种崇高而宏大的目标实施起来是困难重重的,迫切需要明确的可依循的操作路径。有鉴于此,上文提出一种在旧楼上加盖新楼层的方法:尽可能利用已经发展起来的若干第一代交叉学科,融合贯通起来形成第二代交叉学科,以取得物尽其用、事半功倍的效果。就语言学而言,面对“社交网络—语言的社会变异—计算建模”这种头绪繁多的研究领域,和相应的“大数据与计算科学—社会学—语言学”等多种学科和知识体系,我们可以借助已经成熟的“计算语言学”与“社会语言学”等第一代交叉学科,形成“计算社会语言学”这种第二代交叉学科。因为,社会语言学关注在社会环境中使用的语言的社会维度,计算语言学关注在社交网络上使用的语言的信息维度;把它们结合起来,形成计算社会语言学这种新的研究领域和学科,可以整合这两个学科的优势和强项,更好地从计算的视角来研究语言(变异)和社会(变量)之间的关系,以便更加深刻地认识人类语言在社会环境中的运作机制,更加充分地为计算机处理人类的语言提供理论、方法和材料支持。我们希望这种操作路线可以帮助细化与落实新文科建设,并且为新文科建设提供制度化的学科规训。

本文的创新点是从当代社会的“物理—精神—信息”三元空间这一特征切入,说明社会语言学的研究迫切需要计算建模这一方法。文章还以社会身份、人格特点和社交互动等对语言使用和变异选择的影响因素为例,说明了计算社会语言学研究的理论依据、语料采集与计算建模方法。

讨论至此,计算社会语言学的宗旨也就可以粗略地总结为:用计算建模的方法研究语言的社会变异,并为语言的计算建模而研究语言的社会变异(study linguistic variation by computational modeling and for computational modeling natural language)。

Computational sociolinguistics research from the perspective of new liberal arts

Yuan Yulin

Department of Chinese Language and Literature, Faculty of Arts and Humanities, University of Macau /Department of Chinese Language and Literature, Peking University

Abstract: One of the goals of the new liberal arts is the intersection and integration of multiple disciplines in research content and theoretical methodologies, thus forming new disciplinary directions and research paradigms, as well as corresponding inter-discipline talents training models. To this end, this paper proposes an operational path: using several first-generation interdisciplinary fields that have already been developed to integrate them into a second-generation interdisciplinary field. For example, in the research field of "social media plateforms-social variation of language-computational modeling", which issocomplicatedby multiple disciplines, we can use the first generation interdisciplinary fields such as "computational linguistics" and "social linguistics" to form the second generation interdisciplinary field of "computational social linguistics". This path can refine and implement the construction of the new liberal arts, and provide necessary disciplinary regulations (discipline or disciplinarit). In addition, theories, methodologies and issues of computational sociolinguistics are also exemplified in this paper by the “physical – mental – cyber” ternary space of contemporary society, where speakers’ social identities, individual personalities, and social interactions impose influence on language use and language variation choices. 

Keywords: Construction of new liberal arts; First-/Second-generation interdisciplinary branches of learning; Computational/Sociolinguistics; Ternary space.

(发表于《语言文字应用》20241期,5-16

END

比特人文

投稿邮箱:dhbase@126.com

扫码关注 获取更多资讯

阅读原文

跳转微信打开

  •  

批判性数字人文|机器学习时代的代码认识论

DHLR Ray编 2026-04-20 11:40 北京

以下文章来源于:左手数字右手人文

左手数字右手人文

About Digital Humanities, what is right and what is left. 分享全球数字人文相关学术论文译文、会议通知等资讯内容。

随着全局优化与机器学习算法的兴起,代码在揭示知识的同时,也同样遮蔽知识

栏目简介:批判性数字人文(Critical Digital Humanities, CDH),通常指的是在数字人文基础上,引入批判理论、社会理论、后殖民研究、性别研究、媒介研究、科技社会学等视角,对“数字技术如何介入知识生产、文化记忆、权力结构与社会不平等”进行反思性研究的方向。


The Epistemology of Code in the Age of Machine Learning

机器学习时代的代码认识论

DOI:https://doi.org/10.63744/mtgy4d9qn78k

作者: Evan Buswell

期刊: Digital Humanities Quarterly (DHQ)  Volume 20 Number 4, 2026

作者 Evan Buswell 是一位独立学者及软件工程师,博士毕业于加州大学戴维斯分校,从事人工智能研究。其研究横跨计算机科学、数字人文与批判性理论。他关注计算机技术的历史演变及其背后的哲学意涵,特别是计算架构如何塑造人类对知识的认知。

1. 摘要

代码是一种以“压制状态”(Repression of state)为前提的认识系统。然而,随着全局优化(Global optimization)与机器学习算法的兴起,代码在揭示知识的同时,也同样遮蔽知识。代码的形成回应了二十世纪知识型(Episteme)的两个特征:其一,知识被表征为一种过程(Process);其二,这种表征必须是自足的,即其意义由表征形式本身构成。代码与状态虽存在关联,但为了将代码建构为认识论对象,状态被持续限制与压制。这一建构始于1940年代代码的最初形成,并在1960年代末结构化编程运动中达到现代形态。然而如今,随着全局优化和机器学习算法在计算领域日益占据主导地位,状态的关键重要性已无可回避,而我们理解状态的工具却极为匮乏。这一认识论困境反而为那些罔顾后果、规避责任的行为者提供了庇护。

2. 文章内容

本文从科学技术研究(STS)与批判性代码研究的视角,追溯"代码"概念的历史形成,论证代码与状态的分离并非中立的技术选择,而是特定历史认识型的产物。

作者将论证分为三个层次展开:

  • 代码作为认识论对象:代码诞生于一种将知识理解为"过程"的知识型(约形成于1930年代)。在这一认识型中,意义的合法性来自符号系统内部的自足性,而非外部指涉。代码因此被要求不仅描述算法,更要"实例化"算法本身。然而这一要求内含矛盾——动态过程无法被静态文本完整构成,由此产生了代码与状态的结构性分裂。

  • 状态的压制史:作者通过对早期计算机代码的细读,追踪这一分裂的具体历史轨迹:从Mark I的系统性路由范式,到ENIAC的时序化结构,再到EDSAC条件跳转指令的出现,最终经由Fortran、ALGOL等语言演进,抵达1960年代结构化编程运动对GO TO语句的驱逐。每一次编程范式的更迭,本质上都是将状态进一步压入不可见的角落——先是隐入符号地址,再是隐入语法结构,最终隐入状态变量。

  • 机器学习与认识论危机:全局优化算法的兴起使上述压制走向历史性破产。这类算法在数学意义上已知其效果依赖于代码与状态的内在关系,然而代码范式依然将状态处理为非认识论对象。"黑箱"的比喻并非描述技术限制,而是这一历史性压制的文化症状。更危险的是,状态的不可知性正在成为资本与权力规避责任的结构性工具——算法推荐系统、自动驾驶责任归咎,莫不如此。

3. 理论框架与方法论

本文方法论融合批判性代码研究(critical code studies)的文本细读传统与知识考古学式的历史分析。作者并置不同历史时期的代码片段(EDSAC、A-2、Fortran、ALGOL等),通过比较性近读(comparative close reading)追踪条件跳转指令的语法演变,将技术史细节与认识论命题直接挂钩——这是本文方法论上最具说服力之处。

论证结构遵循一条清晰的辩证线索:外部化—压制—压抑物的回归—新形式的再压制,并以全局优化算法作为当下历史节点,将这一循环推至其内在矛盾最为显露的临界时刻。引入"无免费午餐"定理,使技术论证与认识论批判形成精准呼应,避免了此类研究常见的泛泛而论。

简  评

对于从事AI认识论、数字人文与STS研究的读者而言,这篇文章提供了一个罕见的分析框架:它拒绝将"黑箱问题"处理为机器学习的技术局限,而将其还原为一段有据可查的观念史。这种将代码语法演变与权力/责任问题直接相连的论证路径,对于思考AI治理的文化与语言基础尤具启发性。

看到这篇文章的时候,就不得不想起本杰明·M·施密特在2016年发表的本杰明·M·施密特《数字人文主义者需要了解算法吗?》(2016)。这两篇文章之间构成了一种跨越十年的“互文”关系,像同一个认识论困境的两个不同截面——施密特从实践层面发现了症状,Buswell从历史层面追溯了病因。如果说施密特的核心诊断是:数字人文学者把算法当黑箱,满足于用经验性测试("符不符合常识")来评估工具,却没有去理解算法背后的转换逻辑。他的药方是:不需要懂算法的实现细节,但必须懂它试图做什么——也就是理解 "transformation" 而非 "algorithm" 。Buswell的回答实际上是:施密特说得对,但他没有问为什么黑箱会存在。答案是:黑箱不是技术局限,而是代码范式的历史性产物。Buswell通过对计算机史的详细考据,在认识论层面指出,在机器学习与全局优化算法主导的今天,施密特所寄望的那种“可理解的转换”的认识论就随之坍塌。

文章对中文语境同样具有延伸价值:中文对"代码"与"状态"的概念处理方式是否内嵌了不同的认识论预设?在"算法黑箱"的本土讨论中,状态的不可知性是否同样承担了类似的责任规避功能?这些问题值得进一步探究。

撰文、编辑:丁怡瑞(剑桥大学数字人文系硕士研究生)

初审:徐碧姗

复审:段婧怡

终审:夏翠娟

阅读原文

跳转微信打开

  •  

征稿 | AACL-IJCNLP 2026 Call For Papers

AACL-IJCNLP 2026 2026-04-19 09:00 江苏

AACL-IJCNLP 2026在横琴举办,5月25日截稿,征集NLP原创未发表长/短论文。

转载自“计算学习算法与自然语言处理”

图片

MLNLP社区是国内外知名的机器学习与自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。

社区的愿景是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进步,特别是初学者同学们的进步。

Link: https://2026.aaclnet.org/

When: Nov 6, 2026 - Nov 10, 2026

Where: Hengqin, China

Submission Deadline: May 25, 2026

Notification Due: Sep 7, 2026

Final Version Due: Sep 30, 2026

Categories: natural language processing, artificial intelligence

Call For Papers

AACL-IJCNLP 2026 (the 5th AACL & 15th IJCNLP) invites the submission of long and short papers featuring substantial, original, and unpublished research in all aspects of Computational Linguistics and Natural Language Processing.

CFP: https://2026.aaclnet.org/calls/main_conference_papers/

The conference will be held in Hengqin, China from November 6th to November 10th, 2026.

Important Dates

ARR submission deadline (long & short papers) May 25, 2026

Reviewer registration deadline for ALL authors May 27, 2026

Author response and author-reviewer discussion July 7 - 13, 2026

Meta review released July 30, 2026

Commitment deadline August 26, 2026

Notification of acceptance (long & short papers) September 7, 2026

Camera-ready papers due (long & short) September 30, 2026

Main Conference (dates for Workshops/Tutorials TBD) November 6 - 10, 2026

Note: All deadlines are 11:59PM UTC-12:00 (“anywhere on Earth”).

Topics

AACL-IJCNLP 2026 aims to have a broad technical program. Relevant topics for the conference include, but are not limited to, the following areas:

Safety and Alignment in LLMs

AI/LLM Agents

Human-AI Interaction/Cooperation

Retrieval-Augmented Language Models

Mathematical, Symbolic, and Logical Reasoning in NLP

Computational Social Science, Cultural Analytics, and NLP for Social Good

Code Models

Interpretability, Model Editing, Transparency, and Explainability

LLM Efficiency

Generalizability and Transfer

Dialogue and Interactive Systems

Discourse, Pragmatics, and Reasoning

Low-resource Methods for NLP

Ethics, Bias, and Fairness

Natural Language Generation

Information Extraction and Retrieval

Linguistic theories, Cognitive Modeling and Psycholinguistics

Machine Translation

Multilinguality and Language Diversity

Multimodality and Language Grounding to Vision, Robotics and Beyond

Neurosymbolic approaches to NLP

Phonology, Morphology and Word Segmentation

Question Answering

Resources and Evaluation

Semantics: Lexical, Sentence-level Semantics, Textual Inference and Other areas

Sentiment Analysis, Stylistic Analysis, and Argument Mining

Speech Processing and Spoken Language Understanding

Summarization

Hierarchical Structure Prediction, Syntax, and Parsing

NLP Applications

Presentation at the Conference

All accepted papers must be presented at the conference to appear in the proceedings. The conference will include both in-person and virtual presentation options.

Related Resources

IEEE-ICECCS 2026: 2025 IEEE International Conference on Electronics, Communications and Computer Science (ICECCS 2026)

IEEE ICCT-PACIFIC 2026: 2026 IEEE 2nd International Conference on Consumer Technology - Pacific (ICCT-Pacific 2026)

AMLDS 2026: IEEE--2026 2nd International Conference on Advanced Machine Learning and Data Science

Asia EISC 2026: The 1st Asia Conference on Edge Intelligence and Service Computing

ACM NLPAI 2026: ACM--2026 7th International Conference on Natural Language Processing and Artificial Intelligence (NLPAI 2026)

ACIE 2027: 2027 The 7th Asia Conference on Information Engineering (ACIE 2027)

CFP-CIPCV-EI/SCOPUS 2026: The 2026 4th International Conference on Intelligent Perception and Computer Vision

I&CPS ASIA 2026: 2026 lEEE IAS Industrial and Commercial Power System Asia (IEEE I&CPS ASIA 2026)

Call for Book Chapter 2026: Human-Animal Studies and Literary Animal Studies in German Narratives

NeTCoM 2026: 18th International Conference on Networks & Communications

比特人文

投稿邮箱:dhbase@126.com

扫码关注 获取更多资讯

图片

阅读原文

跳转微信打开

  •  

学术前沿丨《数字人文学刊 (DSH)》2026年第1期论文荐读

2026-04-19 08:30 湖北

本期内容将选取《数字人文学刊》2026年第1期(Volume 41,Issue 1,April 2026)中的10篇论文进行介绍。

《数字人文学刊》(Digital Scholarship in the Humanities,简称DSH)是一本国际性的、同行评审的期刊,发表关于人文学科中所有数字学术方面的原创研究,包括但不限于当前被称为数字人文学科的领域。该期刊主要发表长篇和短篇论文报告,理论、方法、实验和应用研究以及书评等。本期内容将选取《数字人文学刊》2026年第1期(Volume 41,Issue 1,April 2026)中的9篇论文进行介绍。

01

识读不可读文本:基于图像转文本语言模型构建 19 世纪英文报纸数据集

Reading the unreadable: creating a dataset of 19th century English newspapers using image-to-text language models

Jonathan Bourne

摘要:奥斯卡・王尔德曾言:“文学与新闻的区别在于,新闻不堪卒读,文学无人问津。” 遗憾的是,王尔德所处的 19 世纪数字化存档新闻文本,其光学字符识别(OCR)结果往往缺失或质量低劣,既降低了档案的可获取性,也使其在象征意义与字面意义上均成为 “不可读文本”。为解决这一问题,本研究采用预训练图像转文本语言模型 Pixtral 12B,对包含 8.4 万页 19 世纪英文报纸与期刊的《19世纪连续出版物典藏》(NCSE)开展光学字符识别。研究将该模型与四种主流OCR方法进行性能对比,结果显示其字符错误率中位数仅为1%,较次优模型低80%。本研究构建的NCSE2.0数据集优化了文章识别效果,具备高质量字符识别文本,并将文本划分为4个类别与17个主题,包含140万条条目与3.21亿个词汇。研究通过主题相似度、可读性与事件追踪分析验证了数据集的应用价值。该数据集免费开放,旨在助力历史学与社会学研究,让21世纪的读者得以足不出户识读这份“不可读文本”,共情王尔德对19世纪新闻水准的遗憾。

Abstract:Oscar Wilde said, ‘The difference between literature and journalism is that journalism is unreadable, and literature is not read’. Unfortunately, the digitally archived journalism of Oscar Wilde’s 19th century often has no or poor quality Optical Character Recognition (OCR), reducing the accessibility of these archives and making them unreadable both figuratively and literally. This paper helps address the issue by performing OCR on ‘The Nineteenth Century Serials Edition’ (NCSE), an 84k-page collection of 19th-century English newspapers and periodicals, using Pixtral 12B, a pre-trained image-to-text language model. The OCR capability of Pixtral was compared to four other OCR approaches, achieving a median character error rate of 1%, 5x lower than the next best model. The resulting NCSE v2.0 dataset features improved article identification, high-quality OCR, and text classified into four types and seventeen topics. The dataset contains 1.4 million entries, and 321 million words. Example use cases demonstrate analysis of topic similarity, readability, and event tracking. NCSE v2.0 is freely available to encourage historical and sociological research. As a result, 21st-century readers can now share Oscar Wilde’s disappointment with 19th-century journalistic standards, reading the unreadable from the comfort of their own computers.

图:边界框 “CLD-1853-07-30_page_2_B0C2R7” 分割为三个子框,重叠区域以深蓝色标注

Figure:Bounding box ‘CLD-1853-07-30_page_2_B0C2R7’ is split into three boxes. Overlap is shown as darker shades of blue.

02

非物质文化遗产剪纸纹样的数字化提取与分割

Digital extraction and segmentation of intangible cultural heritage paper-cut patterns

Daoling Chen , Pengpeng Cheng

摘要:剪纸艺术是中华传统文化中独具特色的非物质文化遗产,当前正面临传承与发展的双重困境。随着剪纸艺人离世、作品损毁流失,部分剪纸品类濒临消亡,其数字化保护工作迫在眉睫。本研究基于改进遗传算法自适应优化Canny算子阈值,结合Grab-Cut算法,实现非遗剪纸纹样的智能化提取与分割。研究首先通过双边滤波对采集的剪纸图像进行平滑处理,提升图像质量;其次采用改进遗传算法优化后的Canny算子,提取剪纸纹样整体轮廓;随后设计Grab-Cut算法,针对性分割剪纸设计元素轮廓,并借助CDR软件处理矢量图像,生成独立可编辑矢量文件;最后通过多种算法对比不同类型剪纸图像的轮廓提取效果。实验结果表明,本研究提出的方法可有效检测剪纸图像纹样真实边缘,完成轮廓提取,纹样各设计元素的像素分割精度达96%以上,为非遗剪纸艺术的数字化保护与创新应用提供了新方法。

Abstract:As a unique intangible cultural heritage in Chinese traditional culture, paper-cut art is now facing the dilemma of inheritance and development, and with the death of paper-cut artists and the damage and loss of paper-cut works, some paper-cut types also disappear. Therefore, the digital protection of paper-cut art is urgent. This research is based on the improved genetic algorithm adaptive optimization of Canny operator threshold and Grab-Cut algorithm to achieve intelligent extraction and segmentation of intangible cultural heritage paper-cut patterns. First, the collected paper-cut images are smoothed by bilateral filtering to improve the image quality. Second, based on the Canny operator optimized by the improved genetic algorithm, the overall contour of the paper-cut pattern is extracted. Then, the Grab-Cut algorithm is designed to segment the contours of decoupage design elements in a targeted way, and the vector image is processed by CDR software to obtain an independent editable vector image. Finally, the contour extraction experiments of different kinds of paper-cut images are compared by different algorithms. The results show that the method proposed in this article can effectively detect the true edge of the pattern in paper-cut images and complete the extraction of the pattern contour, and the accuracy of the segmentation pixels of each design element of paper-cut pattern is greater than 96 per cent. It provides a new method for the digital protection and innovative application of intangible cultural heritage paper-cut art.

图:剪纸图像平滑去噪处理 (a) 原始图像;(b) 增强后图像

Figure:Smoothing and denoising of paper-cut images. (a) Original and (b) enhanced.

03

丈量东方之声:华语流行歌词共性与特质的数字人文研究

Measuring sounds from the East: digital approaches to commonality and specificity in Chinese Mandarin pop lyrics

Zheyuan Dai , Haitao Liu

摘要:1978年改革开放以来,中国流行音乐产业高速发展,成为全球当代流行音乐的重要组成部分。本研究采用数字人文方法,对1978-2019年当代华语流行歌词开展系统性分析。研究运用文体计量指标布塞曼系数,从静态与动态双维度揭示了歌词文本的高活跃度,佐证了其叙事性的文体本质。歌词情感分析结果显示,文本整体呈现积极基调,而2000年成为重要分水岭,前后两个时期的情感特征呈现显著分化。主题建模分析进一步表明,不同时期歌词的主题分布模式呈现多元化特征,既体现了流行文化的普世性,也彰显了文化与时代语境塑造下的中国本土特质。

Abstract:Since China’s reform and opening-up in 1978, its popular music industry has experienced rapid development and emerged as a significant component of global contemporary pop music. This study conducts a systematic analysis of contemporary Chinese Mandarin pop lyrics (1978–2019) with digital methodologies. A stylometric measurement, the Busemann coefficient, was employed to demonstrate the lyrics’ high textual activity from both static and dynamic perspectives. This finding supports the lyrics’ stylistic essence as narratives. Besides, sentiment analysis of lyrics reveals an overall positive tone, though a significant watershed occurred around the year 2000, marking a divergence between the two periods. Furthermore, analyses with topic modeling demonstrate diversified topic distribution patterns across these periods, reflecting both the universality of popular culture and the distinctive Chinese characteristics shaped by cultural and temporal contexts.

图:潜在狄利克雷分配模型评估:一致性与困惑度对比

Figure:LDA model evaluation: Coherence vs. Perplexity.

04

文本可视化视域下江南禅诗对高丽汉诗的跨文化影响研究

Exploring the cross-cultural influence of song Jiangnan Chan Buddhist poetry on Goryeo Han poetry through text visualization

Yaqin Fu , Rongrong Fu , Linfeng Li

摘要:本研究选取三位代表性诗人,从词汇意象、时空解构、主题演变与情感表达四个维度,对比分析江南禅诗对高丽汉诗的影响。研究构建基于文本可视化的研究方法,融合词频 - 逆文档频率关键词提取、潜在狄利克雷分配主题建模与情感分析技术,辅以AI大模型新词挖掘与Kimi智能助手分词功能开展研究。研究得出四项核心结论:其一,两类诗歌均以自然与禅意为核心,共享相似的词汇与意象体系;其二,二者均体现永恒视角与历史意识的交织,以及宇宙宏大性与人世现实性的辩证关系;其三,主题演变层面,江南禅诗“自然与禅”的核心内核,在高丽汉诗中转化为“护国、弘法、济世”的三位一体框架;其四,江南禅诗侧重超脱与空寂的审美表达,高丽汉诗则融入世俗生活书写与历史记忆叙事。研究同时证实,该方法可有效提升古典诗歌文本的中文分词精度,彰显了量化对比分析在禅诗跨文化传播与嬗变可视化研究中的核心价值。

Abstract:This study examines the influence of Jiangnan Chan poetry on Goryeo Han poetry through a comparative analysis of three representative poets from four dimensions: vocabulary imagery, spatiotemporal deconstruction, thematic evolution, and emotional expression. It proposes a text visualization-based methodology employing Term Frequency–Inverse Document Frequency (TF-IDF)-based keyword extraction, Latent Dirichlet Allocation (LDA)-based topic modeling, and sentiment analysis, supplemented by neologism mining and Kimi Intelligent Assistant (KIMI)-based word segmentation using AI large models. The results reveal four key findings: (1) both poetries share similar vocabulary and imagery centered on nature and Chan Buddhism; (2) both reflect an interweaving of eternal perspective and historical consciousness, alongside a dialectic between cosmic vastness and human reality; (3) in terms of thematic evolution, the original focus on “Nature and Chan” in Jiangnan poetry was transformed in Goryeo Han poetry into a trinitarian framework of “national protection, Dharma propagation, and social salvation”; and (4) Jiangnan poetry emphasizes transcendence and emptiness, while Goryeo Han poetry incorporates depictions of secular life and historical memory. The findings also suggest that the proposed methodology is effective in improving the accuracy of Chinese word segmentation for ancient poetry texts. This study underscores the value of quantitative comparative analysis in visualizing the intercultural diffusion and transformation of Chan Buddhism poetry.

图:禅诗名词词云图 (a)雪窦重显;(b)杨杰;(c)义天

Figure:Noun word clouds of Chan Buddhism poetry: (a) Xuedou Chongxian; (b) Yang Jie; (c) Yitian.

05

近代早期英语的善恶语义空间:道德二元对立的计算语言学研究

The semantic space of good and evil in early modern English: a computational study of moral contrasts

Michael Gavin , Michael Witmore

摘要:本文提出一种创新研究方法,通过近代早期英语词向量的几何分析解读文化内涵。研究基于17世纪《早期英文图书在线》(EEBO-TCP)语料库,构建语义模型,梳理3.2万余个词汇的道德关联与性别属性。研究依托分布概念分析方法,设定善恶、女性-男性两大启发式坐标轴,将词汇映射至坐标轴中,挖掘语言使用内嵌的规范结构。情境、离散度与斜率等统计指标,揭示了概念与性别道德化宏观范式的适配规律。研究发现,多数词汇集中于“女性/邪恶”象限,而其语义邻域却常向抽象化、男性化与正向语义域倾斜。本研究提出全新指标——道德对比分数,可无监督挖掘文本潜在二元对立关系,识别塑造近代早期话语体系的文化维度,涵盖情感表达、信任机制、社会教化与领土合法性等范畴。研究勾勒出层次丰富的道德语义图景:道德对立并非静态固化,而是相互重叠、动态流变;该模型打破了固定二元对立的认知框架,证实语言是构建与重塑文化价值的动态高维场域。

Abstract:This article introduces a novel approach to understanding cultural meaning through the geometric analysis of word vectors in early modern English. Using a seventeenth-century corpus Early English Books Online (EEBO-TCP), the study constructs semantic models that chart the moral and gendered associations of over 32,000 words. Building on methods from distributional concept analysis, the authors define heuristic axes—good-evil and feminine-masculine—and project words onto these axes to explore normative structures embedded in language use. Statistical metrics such as situation, spread, and slope reveal how concepts align with broader patterns of moralized gender. Notably, most terms cluster in the ‘feminine/evil’ quadrant, yet semantic neighborhoods often slope toward abstract, masculine, and positive domains. A new metric, the moral contrast score, enables unsupervised discovery of latent binaries, identifying the cultural dimensions that structure early modern discourse—from affective expression and trust to social refinement and territorial legitimacy. The result is a richly layered moral landscape, where contrasts are not static but overlapping and mobile. Far from mapping fixed binaries, the model reveals a dynamic, high-dimensional field in which language organizes—and reconfigures—cultural values. This method offers a scalable, interpretive framework for investigating the moral geometry of meaning in historical texts.

图:核心词汇语义邻域图(左上:死亡;右上:戏剧;左下:牙买加;右下:信用)

Figure:The semantic neighborhood of death (upper left), play (upper right), jamaica (lower left), and credit (lower right).

06

复杂网络视角下现代简体汉字构形系统研究

Investigating the structural formation system of modern simplified Chinese characters from a complex network perspective

Wei Huang , Yonghui Xie , Junting Li

摘要:汉字在东方文明发展进程中具有核心地位,其构形体系具备系统性特征,而系统科学方法在汉字构形系统研究中的应用仍较为匮乏。为此,本研究基于复杂网络方法,探究现代简体汉字的宏观网络特征与核心系统属性。研究以汉字基础构件为节点、构件关联为边,构建共现网络、有向网络、加权网络三类网络模型及对应的随机对照网络;通过17项通用网络指标量化分析网络特征,深入阐释汉字构形系统的内在属性。研究结果表明,相较于随机网络,汉字构件网络呈现小世界性、无标度性、异配混合性、高中心性与层级组织性五大显著特征;这五大特征印证了汉字构形系统兼具复杂性、鲁棒性与经济性三大属性,分别源于构件的有序组合、紧密联结与高效配置。本研究成果为汉字构形系统的实证研究提供了重要补充。

Abstract:Chinese characters hold pivotal significance in the development of Eastern civilization. While their structural formation exhibits a systematic nature, system science approaches are seldom seen in analyzing the formation system. Therefore, based on complex network methods, this study aims to examine macro-scale network features and the essential system properties of modern simplified Chinese characters. Specifically, three types of networks were constructed: co-occurrence, directed, and weighted networks, along with their random counterparts. In these networks, primitive components served as nodes, and their relationships as edges. Subsequently, seventeen general network metrics were measured to analyze the network features, enabling deeper discussion of the system properties. Research results show that component networks exhibit five distinct network features compared to their random counterparts, including small-world feature, scale-free feature, disassortative mixing, high centrality, and hierarchical organization. These features demonstrate that the formation system displays three properties, namely complexity, robustness, and economy, which emerge respectively from organized, close-knit, and efficient component combinations. These findings serve as a significant supplement to the empirical research on the structural formation system of Chinese characters.

图:真实网络与随机网络全局拓扑图(a、c、e:真实网络;b、d、f:随机网络)

Figure:Global network graphs of real and random networks (a, c, e: network graphs of real networks; b, d, f: network graphs of random networks).

07

非遗审美中的情绪唤醒与视觉认知双路径研究——以硖石针刺灯彩画为例

A dual-path approach to emotional arousal and visual cognition in intangible cultural heritage: the case of Xiashi Pinprick Lantern Pictures

Wenwen Shi , Yi-Tong Cui , Yihong Liu , Weicong Li , Xinlong Li , Jing Sun

摘要:当前关于晚期Z世代对中国非物质文化遗产的审美体验与评价的实证研究仍较为匮乏。本研究以清代颜元庄硖石针刺灯彩画为研究对象,探究大学生群体的审美反馈,聚焦作品主题、潜在审美偏好及其与喜爱度的关联。研究采用双路径研究方法:其一,运用混合设计方差分析与语义差异量表,分析四大主题作品,通过因子分析与聚类分析提取审美潜在维度;其二,开展眼动实验,记录注视时长与注视次数,量化分析眼动指标与主观评分的相关性。研究结果表明:第一,园林主题灯彩画的喜爱度评分显著最高(P<0.001),主题与专业的交互效应不显著(P=0.094),说明不同专业群体的审美偏好具有一致性;第二,研究提取出情绪效价、形式审美、认知唤醒三大潜在维度,揭示了非遗审美的多层级体验结构;第三,潜在审美偏好与喜爱度呈极强正相关(r=0.94,P<0.01),而眼动注视指标与喜爱度无显著相关性(P=0.174;P=0.234)。研究证实,晚期Z世代对传统针刺灯彩艺术的偏好具有主题依赖性,由情绪与认知双重参与塑造。本研究结合主客观测量方法提供实证依据,深化了对晚期Z世代非遗审美认知的理解,为非遗传承与美育推广提供理论支撑。

Abstract:There is a limited empirical research on late Generation Z’s (Gen Z’s) experience and evaluation of Chinese intangible cultural heritage (ICH). This study examines university students’ aesthetic responses to Xiashi Pinprick Lantern Pictures by Yan Yuanzhuang (Qing dynasty), focusing on theme and latent preferences and their relation to liking. Using a dual-path approach, this study conducted (1) a mixed-design ANOVA and semantic differential scale to analyze four themes and extract latent dimensions via factor and cluster analysis, and (2) an eye-tracking experiment to record fixation duration and count, thus assess their correlations with subjective ratings. Results revealed: (1) the garden-themed pictures scored significantly higher in liking level (P < .001), with no significant theme–major interaction effect (P = .094), indicating consistent preferences across disciplines; (2) three latent dimensions, Emotional Valence, Form-Aesthetic, and Cognitive Arousal, were extracted, revealing a multi-layered structure of aesthetic experience; (3) latent preference strongly correlated with liking levels (r = 0.94, P < .01), whereas fixation-based metrics showed no significant correlation (P = .174; P = .234). These findings suggest that Gen Z’s preferences for traditional pinprick lantern art are theme-dependent and shaped by emotional and cognitive engagement. The study offers empirical evidence, through both subjective and objective measures, to better understand how ICH artworks are perceived by late Gen Z audiences, contributing to ICH transmission and the promotion of aesthetic education.

图: 《黛玉葬花》眼动热力图

Figure: Daiyu Burying the Fallen Flowers eye-tracking heatmap.

08

从浪漫到现实:数字人文视域下华语流行歌词的词汇与主题演变

From romance to reality: lexical and topic evolution in Chinese popular lyrics through digital humanities approaches

Yubo Wang , Lüyuan Wang , Fang Xie , Haitao Liu

摘要:本研究探究2000-2025年华语流行歌词的词汇与主题演变,映射大众情感变迁与社会文化转型。现有研究多忽视非西方歌词语料库,本研究填补这一空白,构建涵盖25年、1560首代表性歌曲的华语流行音乐历时语料库。研究采用数字人文方法,融合词频分析、可读性指标与BERTopic主题建模,追踪歌词词汇与主题的历时演变。研究发现,歌词高频词汇始终围绕情感表达、个体自省与人际互动三大核心;类符形符比显著提升,表明歌词词汇丰富度持续增长,文本复杂度呈波动变化,反映出创作风格的动态转向。主题分析识别出浪漫爱情、未来期许、都市生活等12大核心主题,主题结构从自然与时间的抽象表达,逐步转向情感具象化与心理内省化书写;近年来,负面情感主题与自我指涉艺术母题的占比显著上升。本研究为音乐、语言与社会交叉领域研究提供了全新方法论框架,彰显了数字人文工具在大规模歌词分析中,描摹集体情感与文化变迁的核心价值。

Abstract:This study explores the lexical and topic evolution of Chinese popular music lyrics from 2000 to 2025, reflecting changing public sentiments and broader socio-cultural transitions. While prior research has largely overlooked non-Western lyric corpora, this study addresses that gap by constructing the Chinese Popular Music Diachronic Corpus, comprising 1,560 representative popular songs sampled across twenty-five years. Using digital humanities approaches, it integrates word frequency analysis, readability metrics, and BERTopic-based topic modelling to trace lexical and topic evolution of lyrics over time. Findings reveal that high-frequency words consistently revolve around emotional expression, individual introspection, and interpersonal dynamics. Type-token ratio (TTR) has increased significantly, indicating growing lexical diversity, while textual complexity shows fluctuation, reflecting stylistic shifts in song writing. Topic analysis identifies twelve major topics, including romantic love, future aspirations, and urban life, with topic structures evolving from natural and temporal abstraction to emotional concreteness and psychological introspection. Recent years show a significant rise in negative emotional topics and self-referential artistic motifs. This study contributes a novel methodological framework for interdisciplinary research at the intersection of music, language, and society, and underscores the value of digital humanities tools in mapping collective emotions and cultural change through large-scale lyric analysis.

图:各项指标历年变化趋势

Figure:Trends of various metrics over the years.

09

文化分析与表征政治:埃及《箴言》杂志中犹太群体形象的呈现研究(1933-1953)

Cultural Analytics and the Politics of Representation: Mapping the Jewish Presence in Egypt’s al-Risālah (1933–1953)

Eid Mohamed , Said Hassan

摘要:本文融合文化分析与后殖民理论,探究1933-1953年埃及主流文学期刊《箴言》中犹太群体的形象表征。研究运用数字文本分析方法,识别并解读期刊档案中犹太形象的建构范式,揭示两次世界大战之间及战后初期,阿拉伯知识分子在政治张力下对犹太身份的协商与阐释。这一跨学科研究方法实现了量化建模与文本细读的结合,精准剖析文化生产机制,呈现这一关键历史节点阿拉伯印刷话语的内在矛盾性。本研究的核心价值在于,对锡安主义兴起与以色列建国这一重塑阿拉伯世界族群关系的关键时期的媒介文本开展数字化研究:随着阿拉伯犹太人大规模撤离埃及,《箴言》中犹太形象的动态演变,折射出社会层面对民族身份、宗教差异与殖民遗产的集体焦虑。全文分为两部分:第一部分将《箴言》置于反殖民与后奥斯曼知识思潮中,阐释其成为阿拉伯现代性多元理念博弈平台的历史背景;第二部分结合远读与阐释性分析,梳理期刊对犹太人的三重身份建构——现代性符号、西方帝国主义受害者、阿拉伯主权威胁者。这些形象建构并非单纯的历史遗存,更深刻影响着当代族群宗教身份与政治归属感的认知。本研究将数字人文工具与知识生产的后殖民批判相结合,为阿拉伯印刷文化、形象表征与媒介史研究提供了全新的方法论与认识论范式。

Abstract:This article investigates the representation of Jews in al-Risālah, a major Egyptian literary magazine (1933–53), by integrating Cultural Analytics and postcolonial theory. Using digital text analysis methods, it identifies and interprets patterns of Jewish representation within al-Risālah’s archive, uncovering how Arab intellectuals negotiated Jewishness amid the political tensions of the interwar and early postwar periods. This interdisciplinary approach enables a nuanced examination of cultural production, bridging quantitative modelling with close textual reading to reveal the ambivalences of Arab print discourse during a pivotal historical moment. The study’s significance lies in its digital examination of media texts published during the rise of Zionism and the establishment of Israel, an era that reshaped intercommunal relations across the Arab world. As Arab Jews began departing Egypt en masse, al-Risālah’s evolving depictions of Jews became symptomatic of broader anxieties over national identity, religious difference, and colonial legacies. Structured in two parts, the first contextualizes al-Risālah within anti-colonial and post-Ottoman intellectual currents, illustrating how the magazine became a platform for competing visions of Arab modernity. The second part synthesizes distant reading with interpretive analysis to assess how al-Risālah conceptualized Jews: as symbols of modernity, victims of Western imperialism, or threats to Arab sovereignty. These portrayals are not merely historical curiosities but inform contemporary understandings of ethno-religious identity and political belonging. By fusing digital humanities tools with a postcolonial critique of knowledge production, this study contributes a new methodological and epistemological model for analysing Arab print culture, representation, and media history.

图:《箴言》杂志核心关键词年度出现频次

Figure.Recurrence of key words in al-Risālah by years.

编译|洪冰凤

校对|罗斯鹏

排版|魏翔

阅读原文

跳转微信打开

  •  

观澜·驻访学者沙龙(第14期)回顾 | 人工智能与人类智能

2026-04-17 15:04 广东

4月12日,观澜·驻访学者沙龙(第14期)在我校深圳校区文学园5栋103致用·观澜学术会议室顺利举行。本次研讨会由我院2026年春季学期校内驻访学者周国梅教授和刘虎教授共同召集,汇聚心灵哲学、逻辑学、心理学、智能工程及产业界的专家学者,深度剖析人工智能(AI)与人类智能(HI)的本质差异,探讨人类认知研究在人工智能发展中的应用价值,探索人机协作的优化模式、人机融合社会的未来图景。

周国梅教授、刘虎教授作引言

01

人类智能

在中山大学心理学系代政嘉教授主持的“人类智能”主题研讨中,研究者们从实验心理学与神经科学视角审视了人类认知的独特性。

中山大学心理学系钱洁慧教授通过三维空间工作记忆的研究发现,人类智能在处理空间信息时展现出显著的特异性。她认为,物体间的空间关系、远近距离及可操作性均会影响信息的编码与表征,这提示了人类的信息加工机制由具身经验塑造,这一点可能与当前AI的信息处理逻辑存在差异。

中山大学心理学系岳珍珠教授则聚焦于跨通道视听整合的认知机制。她介绍,在单通道信息较弱时,多通道整合的神经元反应模式比单通道信息引发的效应更强,这一发现为理解人类感知系统的复杂性和适应性提供了新视角。

中山大学心理学系林盈教授以“以脑‘知’脑:脑科学与AI的双向赋能初探”为题,分享了脑科学与AI融合的前沿探索。报告围绕"AI for Brain"与"Brain for AI"两条主线展开:利用AI技术建模人脑结构-功能耦合关系,揭示人脑异质性通信机制;同时借助AI模型基于脑功能活动重建视觉图像,探索脑科学理论发现如何提升AI模型。该报告展现了脑科学与AI协同创新的广泛前景,引起了与会专家对这一领域的热烈探讨。

左右滑动查看第一场研讨现场

02

人类智能与人工智能

中山大学心理学系王琪教授主持的“人类智能与人工智能”主题研讨中,与会专家重点探讨了AI在医疗手术、智能驾驶及工业设计等领域的创新应用和落地实践。

中国科学院深圳先进技术研究院贾富仓研究员介绍了具身智能人机协同手术机器人的最新进展。报告了解剖结构、动态环境感知和增强现实导航对于提升手术安全性和精准性的临床验证效果,提出结合仿真数据强化学习和临床数据模拟学习提升机器人的自主性。

中山大学心理学系何子静副教授分享了自动驾驶混合交通中的人机交互研究。她认为,未来的自动驾驶不应仅追求工程效能,更应关注拟人化感知与动态博弈,通过适度让渡控制权来增强人类的心理接受度。

深圳人因工程技术研究院李海波院长从人因工程角度介绍了复杂作业系统人机交互的挑战。他强调,智能系统设计需充分考虑用户认知模型的预测价值,并展示了人因工程在核电应急仿真、数字化界面设计及海洋立体生态评估大模型中的应用前景。

中山大学心理学系罗思阳副教授则从文化组学视角切入,探讨了AI大模型的高维心理结构、道德价值观和文化价值观,及其在人机交互中的刻板印象与偏见,并通过交叉融合表征相似性建模、个体行为建模、社会演化建模,检验了未来导向、命运共同体等多种调控AI大模型交互行为的策略,解析了未来人-AI多智能体融合社会的演化趋势。

左右滑动查看第二场研讨现场

03

交流讨论

在自由讨论环节,香港中文大学哲学系张寄冀教授、香港中文大学政务与政策科学学院詹晶教授、香港大学哲学系王康予讲师、中山大学马克思主义学院李珍教授、中山大学逻辑与认知研究所文学锋教授、中山大学外国语学院徐翌茹教授,中山大学心理学系丁如一副教授、中山大学历史学系李智副教授、深圳大学心理学院黄丽芹助理教授等与会学者踊跃发言,围绕智能的能动性、情绪智能、心理健康、具身智能、群体智能、自我意识、政策制定等核心议题展开了深入探讨,分享了各自的前沿见解。

左右滑动查看交流讨论现场

04

总结

周国梅教授和刘虎教授在总结发言中表示,本次“人工智能与人类智能”学术沙龙取得了丰硕成果,成功搭建了横跨人文、社科、工程、产业等多领域的跨界交流平台,有效促进了哲学思辨、心理科学、工程技术与产业应用的深度对话与思想交融。同时,他们强调,人工智能的发展不应仅追求技术突破,更应注重人文关怀,期待未来能够持续举办此类活动,不断推动人工智能领域向着更具人性温度的方向演进,共同探索人机协同、和谐共生的未来发展路径。

研讨会合影留念

内容来源:中山大学人文社会科学研究院

编辑:陈旖旎

初审:蔡一峰

复审:林  耿、陈诗诗

审定发布:张  伟

阅读原文

跳转微信打开

  •