阅读视图

AI+社科，第四届“人文社科之光”社科普及短视频大赛必须冲！

2026年5月28日 00:00

江苏社科联 2026-05-28 00:00 江苏

以下文章来源于：江苏社科联

江苏社科联

江苏省社科联是江苏省委领导下的学术性群众团体，是全省社科工作者的联合组织，是全省性社科学术社团和民办研究机构的业务主管单位，是省委、省政府联系全省哲学社会科学界的桥梁纽带，是繁荣发展社科事业的重要力量。

别再说AI只能画画作图啦，2026年度社科圈赛事——第四届“人文社科之光”社科普及短视频大赛重磅来袭！

为进一步学习贯彻习近平文化思想，加强新时代科普能力建设，更好发挥社科普及在价值引领、文化传承、知识传播等方面作用，积极探索人工智能（AI）技术在社科普及领域的实践运用。5月26日，由全国各省（自治区、直辖市）社科联主办，江苏省社科联承办的第四届“人文社科之光”社科普及短视频大赛正式开启。

跨界主题等你挑战

本次大赛的主题是“爱社科·AI普及”，主打“科技+人文”的跨界整活。

热爱社会科学普及事业和乐于参与普及推广社会科学知识的社科普及工作者、社科普及爱好者、社会团体人员、在校学生等，均可通过活动官方报名渠道参加。

搞什么内容能冲奖

划重点！大赛发挥AI技术以及创意优势，可聚焦以下任选其一：地名里的红色故事、文字中的中国故事、讲好社科名家故事。简单解读，以下12个字：

挖掘地名：深挖隐藏在大小地名背后的红色故事，发挥AI创意设计等优势，以社科普及方式庆祝中国共产党成立105周年。

解读汉字：一字越千年，看中国精神。选择一个字或词，深挖其中华文化基因与精神密码，发挥AI优势彰显文化自信与文明传承风采。

画像大师：聚焦新中国成立后老一辈社科名家，从一名代表性人物入手，主打用AI给学术泰斗“拍传记”。

优秀作品还有经费资助

以上并非全部，优秀作品还有经费资助！活动一等奖2000元，二等奖1500元，三等奖1000元（为税前金额），以及证书加持！

“上车”指南看过来：

参与作品统一在B站短视频平台发布，添加话题#人文社科之光#。视频发布后须通过活动官网或官微提报信息：

方法1：访问“人文江苏”网（https://rwjs.jschina.com.cn/）的第四届“人文社科之光”社科普及短视频大赛宣传栏报名。

方法2：关注“江苏社科联”微信公号，进入“人文社科之光”社科普及短视频大赛宣传栏报名。

友情提醒：作品须是2025年7月以来创作的短视频，全部或部分采用AI创作。时长3—5分钟，分辨率不低于1920×1080像素。

报名时间：5月26日-7月26日

联系人：王老师电话：025-83353872

技术支持电话：025-58682280

扫描二维码

直达报名页

编辑：陈潇

审核：蒋志初

终审：朱建波

15 - 安庆师大DH官网

实验室邀请浙江传媒学院刘志宏教授应邀做客安庆师范大学“敬敷人文讲坛”

2026年5月27日 00:00

20 - 古联数字

新继教面授24学时 | 古籍编校能力提升与智能工具应用实战班

2026年5月26日 19:00

古联数字 2026-05-26 19:00 北京

籍合学院2026年第2期出版专业技术人员继续教育培训将于6月24日-26日举行。

为贯彻落实《2021—2035年国家古籍工作规划》关于“打造素质优良的古籍人才队伍”的要求，有效提升学员在古籍编校方面的学理素养和业务实操能力，强化数智时代古籍编校新工具的应用能力，经中宣部干部局批准，中华书局古联公司计划举办“古籍编校能力提升与智能工具应用实战班”。

参培学员可获出版专业技术人员继续教育证书（新继教面授24学时）。

培训形式

培训形式：线下面授。

时间：2026年6月24日至6月26日（共3天）

地点：北京市丰台区太平桥西里38号中华书局二楼多功能厅

培训对象

全国各出版单位从事古籍出版编辑、校对、质检工作的专职人员；
高校、研究机构中承担古籍整理与出版相关任务的教学科研人员；
其他希望提升古籍编校能力的人员。

培训内容

本次培训聚焦古籍出版编校环节的核心问题，结合行业发展的现实需要及数智时代的工作新思路，设置思政引领、编辑审稿、图书质检、数字文献学、智能整理与编校工具实操五个板块，共6门课程，24学时。具体课程安排见文末。

考核方式

学员培训期间参加由组织方安排的签到考核，成绩合格者颁发出版专业技术人员继续教育证书。

培训费用

990元/人（含午餐），其他交通食宿自理。

报名方式

个人自助报名请直接扫描下方二维码缴费。集体对公转账报名，扫描下方二维码直可获取报名表及报名方式，或联系工作人员。

联系我们

联系人：杨老师

电话：18519325994（可加微）

邮箱：training@ancientbooks.cn

上午：9：00~12：00

下午：13：30~16：30

具体安排以实际授课情况为准：

6月24日上午

授课主题：学习贯彻习近平文化思想，坚持创造性转化、创新性发展

授课老师：汤恒，中宣部原副秘书长，现为中国大众文化学会会长、西北师范大学传媒学院教授。主要研究方向为习近平文化思想、国际传播和文化传播理论。参与马克思主义理论研究和建设工程教材《文学理论》的编写，发表理论文章《文化自信的来源及价值》《习近平的人民文艺观》《全球文明倡议的原创性贡献和践行机制》《敦煌文化跨文化传播的研究理念与实践方略》等，合著《电视剧导演创作与理论》，在《人民日报》《光明日报》《求是》杂志发表多篇理论文章。

6月24日下午

授课主题：面向出版的古籍文献智能整理工具及应用

授课老师：胡韧奋，北京师范大学汉字汉语研究与社会应用实验室副教授，研究方向为计算语言学、数字人文，主持十余项科研课题，在国内外高水平刊物和计算机领域顶会发表学术论文50余篇，获国家发明专利授权6项，作为主持人或核心成员构建了中文词向量资源库、CCA中文搭配助手、古诗文断句标点系统、“AI太炎”古汉语大模型等资源和应用。

6月25日上午

授课主题：古籍图书的质检工作与案例分析

授课老师：樊挺，中华书局总编室质控部门主管，长期从事古籍图书质检工作，在图书质控、差错管理领域具有丰富的从业经验。

6月25日下午

授课主题：古籍审稿的质量把关

授课老师：周绚隆，清华大学中文系教授。1969年生。先后毕业于兰州大学、山东大学中文系，获文学博士学位。1997年进入人民文学出版社工作，先后任古典部主任、副总编辑；2020年底调入中华书局任总编辑，2022年任执行董事、党委书记；2023年5月调入清华大学中文系任教授。长期从事古典文献、文学出版与研究，积累了丰富的经验，长于明清文献与文学研究。为中宣部“四个一批”人才。兼任中国明代文学研究会副会长、中国红楼梦学会常务理事兼《红楼梦学刊》编委、《文学评论》编委、贵州孔学堂学术委员会委员。著有《陈维崧年谱》、《易代：侯岐曾和他的亲友们》、《克莱门特的〈金瓶梅〉翻译》、《听雨集》、《金元文选》（与邓绍基合作）等。现承担着国家社科项目《叙事、修辞与符号——〈红楼梦〉文本的形式分析》、孔学堂基金会委托项目《陈维崧与清初文坛》、高校古委会古籍整理项目《陆圻集》。

6月26日上午

授课主题：数字时代古籍整理常见错讹解析及应对策略

授课老师：李林芳，2008至2018年就读于北京大学中文系，专业为中国古典文献学，先后获文学学士、文学博士学位。2016年秋季学期前往普林斯顿大学东亚系访学。现为北京大学中文系助理教授。主要研究方向为中国古典文献学、先秦两汉文学与文献、数字人文。

6月26日下午

授课主题：古籍智能编校工具的研发和应用实操——以文达编校为例

授课老师：苏瑞欣，古联（北京）数字传媒科技有限公司古籍实验室主任，全国信息技术标准化技术委员会字符集与编码分技术委员会（SAC/TC28/SC2）委员。长期从事古籍数字化工作，负责“古籍数字化标准体系的建设与应用”项目，获2020 年度质量技术奖综合类二等奖，参与多项国家标准研制工作。负责古籍OCR、文达编校、古籍智能整理平台等古籍整理智能工作系统，入选国家古籍数字化工程专项经费资助项目、出版业科技与标准创新示范项目、出版融合发展工程重点项目。

欢迎报名！

古联（北京）数字传媒科技有限公司

2026年5月25日

19 - 经典古籍库

新继教面授24学时 | 古籍编校能力提升与智能工具应用实战班

2026年5月26日 18:00

古联数字 2026-05-26 18:00 北京

籍合学院2026年第2期出版专业技术人员继续教育培训将于6月24日-26日举行。

参培学员可获出版专业技术人员继续教育证书（新继教面授24学时）。

培训形式

培训形式：线下面授。

时间：2026年6月24日至6月26日（共3天）

地点：北京市丰台区太平桥西里38号中华书局二楼多功能厅

培训对象

全国各出版单位从事古籍出版编辑、校对、质检工作的专职人员；
高校、研究机构中承担古籍整理与出版相关任务的教学科研人员；
其他希望提升古籍编校能力的人员。

培训内容

考核方式

学员培训期间参加由组织方安排的签到考核，成绩合格者颁发出版专业技术人员继续教育证书。

培训费用

990元/人（含午餐），其他交通食宿自理。

报名方式

个人自助报名请直接扫描下方二维码缴费。集体对公转账报名，扫描下方二维码直可获取报名表及报名方式，或联系工作人员。

联系我们

联系人：杨老师

电话：18519325994（可加微）

邮箱：training@ancientbooks.cn

上午：9：00~12：00

下午：13：30~16：30

具体安排以实际授课情况为准：

6月24日上午

授课主题：学习贯彻习近平文化思想，坚持创造性转化、创新性发展

6月24日下午

授课主题：面向出版的古籍文献智能整理工具及应用

6月25日上午

授课主题：古籍图书的质检工作与案例分析

授课老师：樊挺，中华书局总编室质控部门主管，长期从事古籍图书质检工作，在图书质控、差错管理领域具有丰富的从业经验。

6月25日下午

授课主题：古籍审稿的质量把关

6月26日上午

授课主题：数字时代古籍整理常见错讹解析及应对策略

6月26日下午

授课主题：古籍智能编校工具的研发和应用实操——以文达编校为例

欢迎报名！

古联（北京）数字传媒科技有限公司

2026年5月25日

10 - 武汉大学文化遗产公众号

“文化遗产数字化保护与智能计算”暑期学校通知

2026年5月26日 16:49

2026-05-26 16:49 湖北

武汉大学历史学院、长江文明考古研究院、文化遗产智能计算实验室、测绘遥感信息工程全国重点实验室计划联合举办“文化遗产数字化保护与智能计算”暑期学校。

👆👆👆点击蓝字 · 关注我们

近年来文化遗产数字化保护技术飞速发展，显著提升了考古人员对田野现场和室内藏品空间信息的采集能力，也带来了文物保护技术方法上的革新。近年来武汉大学历史学院、长江文明考古研究院高度关注这一领域的新进展，为贯彻落实学校学术发展战略，充分利用国内各高校学术资源，提高学生对数字考古、文化遗产数字化保护以及相关前沿问题的认知，武汉大学历史学院、长江文明考古研究院、文化遗产智能计算实验室、测绘遥感信息工程全国重点实验室计划联合举办“文化遗产数字化保护与智能计算”暑期学校。

本次暑期学校拟从国内外高校招募优秀学生参加，以提升考古、文博领域研究者的文化遗产数字化能力为目的，拓宽青年学生的学术视野，优化培养模式，打造前沿的高端学术交流与学习平台。开课及报名的具体信息如下：

内容与形式

暑期学校主要涉及文化遗产数字化的理论学习和实践操作。将邀请学界和行业著名的数字考古与文化遗产数字化专家开展系列专题讲座和课程，以线下面对面讲授、三维建模实践、圆桌讨论等方式为主。

师资介绍

本次暑期学校将聘请多位国内外知名的文化遗产数字化领域的专家授课，具体授课内容和日程将于暑期学校开始前发布。

授课语言：中英文结合。

开课信息

招生类型：在读学生（包括本科生、硕士研究生和博士研究生）

招生人数：50人。

报到日期：2026年6月30日

上课时间：2026年7月1日-5日

上课地点：湖北省武汉市武昌区武汉大学历史学院振华楼、测绘遥感信息工程全国重点实验室、文化遗产智能计算实验室。

课表及授课专家将于开课前在学员微信群发布。

报名条件及申请方式

1、报名条件：

①拥护中国共产党的领导，品德良好，遵纪守法，学风端正，无违法、违纪、处分记录，身体健康；

②国内外高校考古学、文物与博物馆学、历史学、文化遗产、文化产业等相关专业在读的本科生、硕博士研究生；

③成绩优秀，对文化遗产数字化保护有浓厚兴趣，有较强的学习意识和学术发展潜力，有一定的科研能力。

2、申请方式：

有意向的学生请及时查看武汉大学历史学院官网(www.history.whu.edu.cn)发布的相关通知，按要求准备并提交相关材料，材料清单如下：

①《武汉大学文化遗产数字化保护与智能计算暑期学校报名推荐表》1份（电子版，签名处请手写签名）；

②已修课程成绩单1份（电子版），文博机构从业人员不必提供成绩单；

③身份证和学生证（电子版）；

④学术成果及获奖证明材料（已发表学术论文、各类获奖证明及资格证书）

请将上述材料合并为一个PDF文件，命名为“武汉大学文化遗产数字化保护与智能计算暑期学校+姓名+电话”，并于2026年6月15日24时之前发送至邮箱wj_zhang@whu.edu.cn。

考核

本次暑期学校被录取的学员需要全程参与，课程结束后可获得由武汉大学颁发的暑期学校结业证书。

结课后，学员参加暑期学校组织的“文化遗产数字化保护”论坛，并做专题报告，由专家学者进行点评。同时，学员在课程结束后一周内需要提交本次暑期学校学习总结报告。结合专题报告和学习总结报告，有独到见解、表现优异的学员，颁发“优秀学员”证书和奖品。

材料审核及学员录取

1.材料审核

武汉大学历史学院、长江文明考古研究院将根据平等公正的原则对申请材料进行审核及评估。

2.学员录取

经审核获得学员资格的学生，我院将于2026年6月25日之前通过电话或邮件通知本人。届时未接到录取通知的学生皆为未入选者，不再另行通知。

费用

1.暑期学校不收取报名费用。

2.暑期学校国内学生食宿及往来交通费自理。

3.暑期学校外籍学员将酌情予以差旅费资助。

其他

1.暑期学校学习期间，学员须服从武汉大学统一安排。

2.暑期学校学习期间，学员须遵守武汉大学校园管理相关规定，因个人原因造成不良后果，由学员自行承担责任。

3.此活动由武汉大学历史学院、长江文明考古研究院负责解释。

4.更多详情可咨询：

王老师：027-68753810

张同学：13509716117；wj_zhang@whu.edu.cn

其他

附件 2026 报名表-文化遗产数字化暑期学校-新

来源 | 珞珈史学

审校 | 刘争

武汉大学人文社科楼

前沿 | 第十四届全国语言文字应用学术研讨会（免会务费）

2026年5月27日 00:00

徐惠 2026-05-27 00:00 江苏

第十四届全国语言文字应用研讨会十月举办，聚焦语言文字应用创新研究。

本文来源：语言文字应用

第十四届全国语言文字应用学术研讨会

为促进中国语言文字应用研究的理论和实践创新，保障支撑语言文字事业高质量发展，教育部语言文字应用研究所、武汉大学拟于2026年10月下旬联合举办第十四届全国语言文字应用学术研讨会，诚邀相关研究领域专家学者莅临会议。谨将有关事宜禀告如下：

会议时间

2026年10月23日—25日

举办单位

主办：教育部语言文字应用研究所

武汉大学

承办：武汉大学文学院

中国语情与社会发展研究中心

《语言文字应用》编辑部

会议主题和议题

会议主题：

语言文字应用研究的时代使命与创新发展

主要议题：

1.语言文字法治建设、政策与规划研究

2.国家通用语言文字高质量推广普及研究

3.中国语言学自主知识体系构建研究

4.数智时代的语言文字应用研究

5.全民语言文化素养提升研究

6.中文国际传播和国际中文教育高质量发展研究

7.语言治理能力与治理体系现代化研究

8.国家语言能力建设/语言资源建设研究

9.应用语言学理论与方法创新研究

投稿事项

1.投稿要求：提交会议论文全文，英文撰写的文章请提供中文版；具体参见《语言文字应用》杂志格式要求；字数不限。将选择优秀论文在《语言文字应用》刊发。

2.截稿日期：2026年9月20日。

3.报名链接：https://v.wjx.cn/vm/QZU1Ccw.aspx

报名二维码：

4.联系邮箱：zgyq@whu.edu.cn

其他事项

本次会议不收会务费，往返交通及住宿费用由参会人员自理，住宿地点由会议统一安排。

比特人文

投稿邮箱：dhbase@126.com

扫码关注获取更多资讯

3 - 人民大学公众号

批判性再谈“数字人文”

2026年5月26日 10:57

原创许喆 2026-05-26 10:57 泰国

数字人文; 方法论; 学科建设; 批判性思维; 数据准确性; 研究范式

转载请注明“刊载于《数字人文研究》2026年第1期”;参考文献格式:许喆.批判性再谈“数字人文”[J].数字人文研究,2026,6(01):3-13.全文PDF已在知网、万方及编辑部网站(http://dhr.ruc.edu.cn)上发表，此处注释及参考文献从略。

批判性再谈“数字人文”

许喆

摘要

数字人文作为人文研究中的新兴领域,其学科属性迄今仍较为模糊,并伴随持续争议。文章从方法论视角出发,综合分析各国学者关于数字人文在克服传统人文研究局限方面的论述,并批判性地指出当前数字人文研究中“重数据建设、轻实质研究”的倾向。文章主张,数字人文本质上应被理解为人文研究的方法论,而非独立学科,并强调数据准确性、研究的科学性和论证逻辑的严密性。与此同时,文章批判了当前数字人文教育过分关注技术工具的使用,而忽视人文问题意识以及发现问题和解决问题能力的培养,因而有必要从“技术中心”转向“问题中心”和“批判思维”导向。

关键词 数字人文; 方法论; 学科建设; 批判性思维; 数据准确性; 研究范式

作者简介 许喆(HEO Chul)，韩国釜山大学占毕斋研究所研究员,鲁东大学区域国别学院特聘教授

引言

随着大数据、机器学习和人工智能等技术开始深刻影响我们的日常生活,不仅理工科领域,各个人文学科内部也出现了大量尝试利用这些技术开展研究的实践。相较于1949年意大利耶稣会神父罗伯托·布萨(Roberto Busa)与IBM合作启动的“托马斯·阿奎那索引”(Index Thomisticus)项目，以及随后伴随个人计算机普及而兴起的各类数字化数据建设,这一新一轮浪潮具有截然不同的意义。2004年,约翰·昂斯沃思(John Unsworth)、苏珊·施赖布曼(Susan Schreibman)和雷·西门斯(Ray Siemens)共同编辑出版的《数字人文指南》（A Companion to Digital Humanities）及其导言《数字人文与人文计算导论》中,明确采用了“Digital Humanities”这一术语,并强调数字人文并非“单纯的数字化”(mere digitization),而是与传统“人文计算”有所区分的实践。按照这一区分,修辞学与写作等领域通常被理解为“以当代人文方法研究数字对象”,而数字人文则被界定为“以数字技术研究传统人文对象”。

然而,这样看似清晰的界定之所以仍显得暧昧不明,根本原因在于:围绕数字人文的本质属性——它究竟是人文研究的方法论,还是一门独立的新兴学科——不仅在学界存在激烈争论,在更广泛的社会实践中也呈现出多重张力。有的观点将数字人文界定为“计算或数字技术与人文学科交叉的学术活动领域”,既包括对数字资源的使用,也包括对这些技术应用影响的分析;EBSCO“研究论文写作范例平台”（Research Starters）则将其视为"数字时代研究和教学中,人文学科利用数字技术的领域",涵盖计算、数据库、数字保存和多媒体等方面。

围绕“数字人文究竟是一种人文研究方法、是对既有人文学科资料的数字化整理与新研究方式,还是一种以人类视角重新统合诸学的‘新学科’”的争论,不仅影响数字人文的地位,而且直接关系到其发展方向、教育模式和研究实践。如果是新学科当然需要新专业；如果是新研究方式，在原专业上调整课程或设置微专业就可以。在这种情形下,加州大学尔湾分校图书馆指南干脆指出:“没有单一或普遍认可的定义”(no single or universally agreed-upon definition),并倾向于将数字人文理解为"计算工具与人文问题的交叉点",在某种程度上回避了学科本体论层面的正面回应。

本文将从理论争鸣与实践困境两个维度,对数字人文的学科属性与研究实践进行批判性考察,并明确提出:数字人文应被理解为人文研究的方法论,而非独立学科，更不是“AI+专业”的模式。AI就是利用数字与电脑的一种方式而已，不能覆盖数字人文的全领域。尤其是在试图克服传统人文研究中常被诟病的主观性、模糊性与碎片化时,数字人文需要以数据的准确性、研究的科学性和论证的逻辑严密性为基础,同时警惕当前数字人文教育中普遍存在的技术中心主义倾向,重新强调批判性思维与问题意识的重要性。

到底“数字人文”是什么——其学术争论

关于“数字人文”的属性,不管哪个国家/地区的学界均存在明显分歧。一方面,较多学者坚持将数字人文理解为人文研究的方法论创新。马修·柯申鲍姆(Matthew Kirschenbaum)在其经典文章《什么是数字人文？它在英语系中扮演着怎样的角色？》中,将数字人文界定为“关注计算与人文学科交叉的研究、教学和创新领域。它在本质上是方法论的,在范围上是跨学科的”,强调数字人文具有工具性与方法性特征。台湾数位人文学会也明确指出，数位人文领域的核心概念是将现代数位技术应用于传统人文学科,以克服传统研究方法的局限。当然，中国学界的相关研究也指出,数字人文领域呈现出“实践先于理论”的态势,“作为技术方法的数字人文”这一观点被广泛接受,其本质是一种技术工具论式的理解,尽管这一理解本身也需要批判性反思。

从更深层的动力来看,此类“方法论化”倾向至少有两重背景。第一是人类对“便利”的欲望:为了追求便利,人类不断发明并使用各种工具,计算机与数字技术不过是这一漫长历史中的最新成果,欲望始终是推动技术演进的重要动力。第二是欲望的满足逐渐被转化为一种“财富形式”,并在竞争性的社会结构中成为新的秩序基础。技术发展不仅带来生活上的便利,也与生产、消费以及财富积累紧密相连,从而成为经济收益与社会分层的重要机制。

刘圣婴等学者在《数字人文的研究范式与平台建设》中提出,数字人文研究范式由技术(Technology)、过程(Process)和行为(Behavior)三个维度构成。这一范式框架强调,数字人文平台作为基础设施的重要组成部分,是数字研究方法的载体,能够促进数字人文方法论体系的丰富和新研究范式的建立。具体而言,技术系统包括数据采集(如API、“爬虫”)、数据存储(如数据库、知识图谱)、数据分析(如文本挖掘、社会网络分析)和数据呈现(如可视化、VR/AR)等环节;方法系统则涵盖昂斯沃思提出的“学术基元”(scholarly primitives),包括发现(Discovering)、注释(Annotation)、比较(Comparing)、引用(Referring)、采样(Sampling)、说明(Illustrating)和表现(Representing)等基本研究行为。

与此同时,一些研究试图将数字人文论证为较为独立的学科或新的知识范式。通过文献计量与学科网络分析,有学者指出数字人文已经形成较为清晰的学术共同体:不仅拥有稳定的核心期刊与出版物,还有相对集中的作者群体与合作网络,因此“数字人文既是一门独立学科,又是一个高度跨学科的领域”。英文期刊《数字_人文》（Digital_Humanities）则从更具纲领性的层面把数字人文界定为“21世纪人文学的范式”,强调它并非单纯为既有学科提供辅助工具,而是通过平台建设、界面设计与数据驱动的知识生产实践,整体重塑人文知识的组织方式与呈现形态,由此被视为一种重绘人文知识空间的“元学科”(meta-discipline)。《人文社会科学传播》（Humanities and Social Sciences Communications）上的文章《比较文学与数字人文》指出，比较文学和数字人文都是复合型学科,本质上具有跨学科性质,并强调要将数字人文作为独立学科来建构,就必须界定一种能够反映学科理想的独特方法,使之成为这一学科结构的重要支柱。《数字人文研究》上有关数字人文堆栈的研究,则试图从计算思维、知识表示、基础设施、方法工具和学术界面五个方面构建数字人文的理论支撑体系。

认识这些主张，需要注意的是,“复合学科”和“跨学科”的说法本身并不新奇。从本质上看,人类留下的全部痕迹都可以被视为“人文”。而人文记录总是在人与自然、人与人以及人与群体之间的互动中呈现出复杂的属性,并以多种形式显现。虽然人类在长期知识分类过程中将其划分为众多学科,但其中几乎不存在与“人”完全无关的领域:无论是医学、音乐还是历史,都与人的经验紧密相连。换言之,作为人类行为记录的全部资料天然具有学科交叉和复合性,后来的“人文科学—社会科学—自然科学”划分强调的是研究重心的差异,而非经验本身的单一性。从这个意义上说,如果从“对象的普遍性”出发,数字人文似乎可以被描述为“统摄诸学的新学科”，但在具体实践中,大多数关于数字人文的讨论依然是在既有人文学科框架内展开,而非真正超越其边界。《信息科学与技术协会期刊》（Journal of the Association for Information Science and Technology）发表的《数字人文——一门独立的学科？》一文通过计量分析得出结论:数字人文“同时是一门独立学科和一个高度跨学科的领域,与相邻学科有着多重连接”。这种模糊性恰恰揭示了数字人文当前的困境:它既不是纯粹的工具,也尚未完全成为一门独立学科,而是处于尴尬的中间状态。

其实这个观点我们在现实研究情况下可以看到。比如，基于2020年中国数字人文大会(CDH2020)获奖项目与论文的分析,以及对国际数字人文年会主题的考察,如前文所述，刘圣婴等学者提出了一个由技术、过程和行为三个维度构成的数字人文研究范式框架，这一框架的核心在于强调,数字人文研究不应仅仅停留在技术应用层面,而应将技术、研究过程和学术行为有机整合,形成完整的方法论体系。在数字人文平台建设中,这三个维度与人文资源的结合构成了数字人文研究基础设施的基本组成部分。但是本质上来说看，研究维度大部分集中于人文资料数字化有关技术，而不是探讨“人文”价值的解释。

当代人文学者的态度、立场分化与数字人文克服传统人文研究局限的可能性

面对数字人文与生成式人工智能的兴起,传统人文研究者大致呈现出三种不同的态度。第一类可以被视为“否定者”,他们或全面否定,或部分否定数字技术的价值,认为在以汉字文献为代表的传统人文研究中,即便人工智能技术高度发展,也不可能取代人文学者;相反,依赖计算机的研究方式会阻碍研究者思维与认知的拓展,因此应当坚持传统方法,至多只在必要时使用一些最基本的功能。

第二类则是“狂热的拥护者”,他们不仅全面肯定新技术,甚至对其抱有某种幻想。在当下生成式AI和大模型迅速发展的语境中,这类声音往往认为人工智能已经在多方面超越人类,未来世界将由人工智能主导;传统的语言翻译工作将被大幅削弱,编程可以完全交给聊天机器人完成,生成式图像和虚拟演员会使真正的演员变得多余,等等。

第三类则试图在否定与迷信之间寻求“批判性接受”的道路。这一立场承认:无论是人工智能、大语言模型,还是数字人文方法,都不可能成为解决一切问题的“万能钥匙”;任何算法都不能自主做出价值判断,数字数据本身只是经由人类编码的结果,数据处理的方法也无法被一次性定型或简单标准化。因此,数字人文方法应被理解为激发新问题、补充或修正既有研究的一组“工具”,而非替代人文思考本身的终极方案。这类研究者往往会关注从数据转写、预处理、分析到可视化的完整流程,理解各种算法与软件的运行逻辑,评估它们在具体研究中的适用性与局限性,从而在实践层面提出更为具体、务实的使用策略。

当然,还有一部分人选择“观望”。他们既不积极反对,也不主动拥抱数字人文与新技术,而是选择在一旁观察事态发展,认为这与自身关系不大,即使环境发生变化也坚持原有立场。

尽管理论上数字人文有望克服传统人文研究的诸多局限,但现实中的实践往往偏离这一初衷。不过学者们仍普遍承认,数字人文在提升研究科学性、扩大研究规模、开辟新问题域以及促进学科合作方面具有重要潜力。

第一，提升研究的科学性与客观性

《数字人文:大数据时代教育研究的新图景》一文指出,在数字技术的加持下,教育研究的科学性、普适性和客观性得以提升;“基于数据”成为保证研究科学性的关键路径,帮助研究摆脱“从主观出发”的研究模式,通过海量数据的归纳和分析夯实实证基础。《澳门理工学报》发表的《“精确人文科学”的价值》则强调,数字人文并没有消解语言学和历史学,而是以量化方式对其研究方法进行批判性的拓展,在若干问题上对准确性有着严格要求。

第二，扩大研究规模与提高效率

台湾中研院数位文化中心指出,数字人文平台期望通过结合研究者、研究资料与研究工具的综效,扩大研究规模、缩短研究时间,从而提升人文研究的质量。“学术厨房”（The Scholarly Kitchen）网站上的文章《拓展数字人文的三大挑战（及解决方案）》指出,许多数字人文项目需要大量数据以获得统计上显著的结论;研究者能够调动的数据库和资料来源越多,提出新问题、发现未知趋势或通过增添证据强化论证的能力就越强。刘圣婴等学者强调,通过新技术、语义技术和知识图谱等先进技术的应用,数字人文平台能够实现资源的互联互通,为研究者提供一站式的研究支持。

第三，开辟新的研究视角与问题域

《数字人文季刊》（Digital Humanities Quarterly）上的相关研究指出,新技术不仅提供新的数据分析方法,也可用于创造新类型的数字资源,从而帮助克服传统研究方法的局限。《接受·整理·生成——“数字人文”视域下文学研究方法转型的初步探讨》一文则指出,“数字人文”作为一种新的科研方向,使得数据处理不再局限于理工科,而是逐渐渗透到人文研究之中,以数字文本的大量产生和纸质文本数字化为基础,引入理性技术手段,将定量分析与定性分析结合起来,为人文学科打开新的研究思路。该文进一步提出了“接受、整理、生成”三阶段模型,探讨数字人文研究方法的转型路径。“接受”阶段强调计算机处理与识别机制与读者接受之间的差异,揭示数字技术对文学文本的认知方式;“整理”阶段则关注大数据时代“校勘”的崛起,通过实现不同文本之间的连接来转化与重写文本意义;“生成”阶段探讨如何通过数字技术对文本的情感主题、叙事话语和人物形象进行可视化的数字生成。

第四，促进跨学科合作与知识生产

《牛津数字学术与数字人文手册》（Oxford Handbook of Digital Scholarship and Digital Humanities）指出,数字人文所面临的根本挑战之一,在于不同学科在认识论文化上的鸿沟,体现了关于数据与知识的根本性且常常相互冲突的立场。然而,这一挑战同时也是机遇:数字人文为理解、揭示和捍卫人文学科的方法提供了独特视角,使其探索性、迭代性、批判性、思辨性与对话性等复杂特征得以被重新认识,这正是我们不应失去的洞见与灵感源泉。

《数字人文的研究范式与平台建设》一文还特别强调了“方法论共同体”(Methodological Commons)的概念,认为数字人文平台不仅是技术基础设施,更是方法论实践的共享空间。通过构建开放、协作、共享的研究环境,数字人文能够打破学科壁垒,促进人文学者、计算机科学家、图书馆员和档案管理员之间的深度协作。

数字人文实践层面的困境与真正研究方法

当下的数字人文研究存在以下几个重要问题。

第一，基础设施建设与研究分析的脱节

曼弗雷德·塔勒(Manfred Thaller)在《数字人文领域的争议：一个议程》一文中指出,数字人文面临的首要危险之一,就是“过度关注基础设施建设,忽视分析方法”。他警告说,许多数字人文项目将所有时间和经费用于数字化和平台建设,等到资助周期结束时,却几乎没有多少真正的解释或学术论证产出。中国学界的反思也指出,早期的数字图书馆与数字典藏为当前数字人文研究提供了重要数据支持,但整体上仍缺乏系统性和规划,各学科发展不均衡,研究成果散乱而微观,多数只是对数字技术的简单应用、对既有研究的重复验证或对西方经验的模仿,缺乏具有原创性的高影响力成果，虽然CBDB(“中国历代人物传记资料库”)、DocuSky、MARKUS等平台在数据建设方面取得显著成就,但大多数项目仍停留在“资源数字化”和“工具开发”层面,真正产生学术影响力的研究成果相对有限。这一现象揭示了当前中国数字人文实践中“重平台建设、轻问题研究”的普遍倾向。

第二，“数据问题”:数据与算法盲从主义的陷阱

诺亚·沃德里普-弗鲁因(Noah Wardrip-Fruin)在《论数字人文的数据问题》中尖锐地指出,数字人文领域因被认为“仅仅是关于数据”而受到限制和边缘化。一些媒体将数字人文方法简化为“统计频率与模式分析”,并用“先跑一轮数字,再看是否能激发解释性假设”来概括其研究路径,这导致不少项目停留在频率统计与共现关系等表层描述上,而缺乏对文化语境、历史语义和思想脉络的深入阐释。

《接受·整理·生成》一文也指出了数字人文研究中普遍存在的“意义挖掘”(Meaning Digging)与“文学批评”(Literary Criticism)之间的张力问题。数据挖掘虽然能够揭示文本中的统计规律和模式,但这些模式本身并不等同于意义。如何从数据中提炼出具有人文价值的洞见,仍然需要研究者深厚的理论素养和阐释能力。

第三、工具开发与问题研究的失衡

塔勒指出,数字人文面临的另一大危险是“被动接受技术,而非主动塑造技术”，如果人文学者只是“接受”他人设计的现成软件与基础设施,那么关于何为数据、何为证据、何为有效推论等关键的认识论与伦理前提,便会被技术提供方预先设定,而不由人文学者自己把握。与此同时,许多项目虽然在工具和平台开发上投入巨大资源,却缺乏清晰的人文问题导向,结果形成“为技术而技术”的局面。《数字东方学家》（The Digital Orientalist）上的文章指出,数字人文学者工作所处的学术环境与传统学科之间,存在着真实且不断扩大的脱节。

在考察数字人文平台建设的设计原则时,刘圣婴等学者提出了“先进系统、完备资源、全面功能、丰富工具、用户友好”五大原则。然而,他们也承认,当前大多数数字人文平台在“先进系统”和“丰富工具”方面投入较多,但在“问题导向”和“用户实际需求”方面仍显不足。这种失衡导致许多平台虽然功能强大,但实际使用率不高,难以真正融入研究者的日常学术实践。

第四，可重复性危机与学术严谨性的缺失

《数字可再现时代的数字人文：建立一个最公平的后计算框架》一文强调,为了验证科学结果,研究所用数据应公开可得、具有足够且具有代表性的规模,并附有透明的元数据,同时所采用的方法必须明确且可在数据集上重复。然而,许多数字人文项目难以满足这些基本要求。《文化分析》（Cultural Analytics）上发表的《数字人文的理论驱动统计学》则指出,数字人文面临“多重假设检验”的问题:研究者不断测试越来越多的假设,直到找到所需的模式,这种“数据挖掘式”研究严重损害了研究的科学性与可信度。

因此，作为人文研究方法论的数字人文需要更慎重的考虑。基于上述历史演变与实践困境的分析,本文明确主张:数字人文本质上应被理解为人文研究的方法论,而非独立学科。这一定位既契合其知识谱系,也有助于缓解当前“重建设、轻研究”的失衡状态。

首先,从历史溯源看,数字人文起源于布萨神父为解决传统文本索引问题而引入计算机技术的尝试,其初衷并非创建全新的学科,而是为既有人文研究提供新的工具和方法;在“人文计算”到“数字人文”的术语转换过程中,其核心诉求始终是强调数字技术与人文研究的深度结合,而非简单的资源数字化。

其次,从知识特性看,数字人文并不拥有独立的研究对象,其关注的对象仍然是文学、历史、哲学、艺术、语言、文化等传统人文学科研究对象,只是研究手段发生了变化。《数字人文的方法理解及其反思》一文虽然批判了将数字人文简化为“技术工具”的倾向,但也承认“作为技术方法的数字人文”这一理解在相当程度上揭示了数字人文的根本属性:通过智能化、多样化的研究方法,发现传统方法难以察觉的问题,从而提出更优的解决路径。

再次,从实践需求看,将数字人文定位为方法论,有助于把评价标准从“建设了多少数据库、开发了多少工具”转移到“是否提出并回答了真正重要的人文问题,是否产出了具有解释力的研究成果”。正如《数字人文的方法论在哪里？》一文所指出,数字人文学者正在使用对人文学科来说基本上全新的方法,因此更需要清晰地阐明这些方法如何运作,而不是急于以“新学科”的名义寻求制度性的正当化。

在此基础上,如果把数字人文视为人文研究方法论的一部分,它就必须遵循科学研究的一般规范:数据准确、方法科学、逻辑严密。

第一，在数据准确性方面,研究者需要意识到:所谓“数字化数据”并非天然客观,而是在数字化标准、标注规范与清洗流程中被不断重构的结果。如果数据本身存在偏差或错误,再精巧的算法也只能“垃圾进,垃圾出”(garbage in, garbage out)。FAIREST原则进一步强调,在构建研究语料时,除了技术标准和语境标准之外,研究者自身的专业判断同样不可或缺。

第二，在方法的科学性方面,数字人文研究需要借鉴社会科学中“理论驱动”的研究范式,避免在缺乏明确问题和假设的情况下无目的地“挖掘”数据,而应当围绕清晰的问题选择合适的分析方法,进行严谨的统计检验,并坦诚讨论研究的局限。

第三，在解释的逻辑严密性方面,数字人文研究应当将定量分析与定性阐释有机结合,使数理逻辑和计算思维成为支撑解释的基础,而不是替代解释本身;通过预设算法逻辑对文本进行处理之后,仍需要人文学者基于整理后的数据和主题模型展开细致的解读。

刘圣婴等学者已经指出,数字人文平台设计不仅要关注系统的技术先进性,更要提取领域知识特色的内容架构,使平台能够真正服务于具体学科的研究需求。这一观点与本文主张的“数字人文作为方法论”的定位高度契合:数字人文的价值不在于技术本身,而在于技术如何有效地支持人文研究问题的提出与解决。

如果数字人文在制度上被完全学科化,一方面,它很可能自我封闭为一种“技术性学科",削弱与传统人文方法论之间本来具有生产张力的内在关系;另一方面,它也有可能失去深入介入各个人文学科内部实践、推动其方法论更新的能力。相比之下,如果将数字人文界定为人文研究的方法论创新,并在这一前提下强调数据准确性、研究的科学性和论证的逻辑严密性,同时把具体方法深度嵌入各个学科自身的理论语境之中,那么数字人文就更有可能不再沦为一座孤立的“新技术岛屿”,而是成为推动当代人文研究范式转型的内在动力。在此基础上,还需要对研究成果的产出模式进行评估。研究者应向评审者充分提供研究所使用的数据与分析工具,使之能够在同一数据集上再现实验过程和主要结论。只有在这一意义上实现可再现性,研究成果才可能被视为客观、具有清晰逻辑并能提出具有解释力的新见解。

数字人文教育的偏向与重构

当前数字人文教育普遍存在技术中心主义倾向:过度强调工具与软件的使用,而忽视人文问题意识与批判性思维的培养。《职业院校数字人文教育的实践路径与创新发展研究》一文指出,技术工具在教育实践中逐渐从辅助手段异化为主导力量,导致教师与学生的批判意识弱化,并被动服从技术规训,技术反而成为教育的目的本身。台湾关于数位人文方法应用于文学分析教学的研究也强调,良好的数字人文教育不应停留在“如何使用某种工具”的层面,而应使学生在课程结束后,即便掌握的具体技术并不繁多,也能具备更成熟的综合能力。系统性文献综述表明,不少数字人文课程在实践中过度强调工具、软件与项目操作,而在培养学生的理论基础与批判性思维方面投入不足,易导致学生拥有一定技术能力,却在各自人文学科的理论训练、史料训练和语言训练上出现断层。

更为根本的问题在于“思考能力”的弱化。有研究指出,在高等教育领域,传统应试教育的惯性尚未根除,学生习惯于被动接受知识,在数字化转型背景下对AI产生过度依赖,因而在批判性思维与价值判断方面日益乏力。法兰克福学派的批判理论揭示了“数字茧房效应”如何将个体塑造成缺乏反抗性和批判思维的“单向度的人”,若数字人文教育只教学生使用工具而不培养其质疑工具背后的逻辑、算法偏见与数据局限的能力,他们便难以避免沦为技术的附庸。

从素质教育角度看,AI虽然在信息检索与逻辑推理方面可能超越人类,但在可预见的未来仍难以获得人类特有的好奇心与想象力,这恰恰是教育必须守护的核心价值。数字时代的教育应着力提升学生的“精准提问能力”,避免因依赖AI提供现成答案而丧失独立探究意识。相关研究也再次强调,人文学科对培养批判性思维与问题解决能力具有不可替代的作用,它帮助学生解释复杂叙事、进行伦理思考、从多重视角应对挑战,并考虑不同解决方案对人的影响。

要纠正当前的偏向,需要在以下几个方面进行系统性改革。

第一,从“工具中心”转向“问题中心”。数字人文教育应同时涵盖计算方法、支持人文学习的数字工具与平台,以及对数字资源与实践的批判性视角,其中最后一项目前最为匮乏。推动数字人文教育从“技能培训”转向“思维培养”,注重学生批判性思维、问题意识与伦理判断能力的提升,培养既懂技术又具人文深度的复合型人才。

第二，构建“问题意识—技术能力—批判反思”三位一体的能力结构。通过信息、数字与人文三种素养,以及技术应用、数据分析、批判思维与创新实践四种能力的综合培养,形成较为完整的教育框架。批判性数字人文，即鼓励对数字技术本身进行批判性反思,关注算法背后的权力结构、数据的社会建构性以及数字实践中的伦理困境,使数字人文成为“批判性人文”的重要组成部分。法兰克福学派的批判理论为我们提供了重要的理论资源,帮助我们警惕数字技术可能带来的意识形态控制和主体性消解。

第三,重视数字人文的伦理维度。在教学中系统讨论数据伦理、算法公平与隐私保护等问题,培养学生对这些议题的敏感度和批判能力。

第四，推动跨学科深度协作。打破学科壁垒,推动人文学者与计算机科学家、数据工程师、设计师等开展实质性合作,共同构建既能满足技术标准又符合人文需求的研究工具与平台。如前文所引"方法论共同体"概念,数字人文平台应成为不同学科背景研究者协作的共享空间。

第五，支持开放科学与可重复研究。推动数字人文项目的数据、代码与方法论透明化,建立符合FAIR原则(可查找、可访问、可互操作、可重用)的研究规范,提升研究的可信度与可重复性。数据的FAIR原则和语义技术的应用,被认为是实现数字人文研究可持续发展的关键。

结论

从中国以外学界的观察来看,尽管数字人文在中国起步较晚,但近年来发展迅速,已成为人文学科数字化转型的重要推动力。在实践层面,中国数字人文项目呈现出"平台驱动、数据先行、多学科协作"的特点。

综上所述,数字人文应当被视为嵌入各个人文学科内部的一套方法论创新,而非在学科版图上另起炉灶的独立学科。只有在与传统人文研究方法保持持续对话和张力的前提下,并在数据准确性、研究科学性与逻辑严密性方面不断自我要求,同时将具体方法深度内嵌于各个学科的理论语境之中,数字人文才有可能不沦为一座孤立的“新技术岛屿”,而真正成为推动人文研究转型的内在动力。

从这个意义上说,与其追求简单的“分离”与“学科化”,不如在“整合”与“批判性接受”的路径上,探索数字技术与人文传统共生共存的新可能性。数字人文的未来,不在于它是否能够成为一门独立的学科,而在于它能否有效地推动各人文学科的方法论创新,能否帮助人文学者更好地理解和阐释人类文明的复杂性,能否在数字时代延续和弘扬人文精神的核心价值。因此,与其急于在制度层面为“数字人文”划出一块全新的学科版图,不如在具体研究实践中,以方法论更新、可重复性规范和教育改革等路径,逐步检验和拓展数字人文的实际能力边界。因此,数字人文的未来不在于是否获得一块独立的“学科领地”,而在于它能否在具体研究中持续检验和扩展自身的方法论价值。在这一意义上,数字人文与其说是一门新学科,毋宁说是当代人文研究在数字条件下进行自我反思与自我更新的重要路径:它既要求研究者保持对数据与算法的批判性态度,也要求他们在开放、可重复和跨学科协作的框架内,重新思考“何为人文研究”这一根本问题。

排版：黄琬喻

初审：徐碧姗

复审：段婧怡

终审：夏翠娟

14 - 南京师大数字人文公众号

讲座预告|Roberto Finelli：马克思技术概念的双重定义

2026年5月25日 09:00

2026-05-25 09:00 浙江

讲座预告

讲座主题

马克思技术概念的双重定义

主讲人

罗伯托·菲内利（RobertoFinelli），国际知名马克思主义学者，意大利罗马第三大学哲学系荣休教授，兼任《后现代批判评论》、《时间序列：黑格尔、马克思与弗洛伊德》主编。

主持人

张福公副教授

与谈人

于沫、王元钊、董屹泽、邹家琪、何梦阳

时间与地点

时间：5月26日（周二）15:30

地点：行敏楼604

长按二维码关注南师数字与人文

《语言战略研究》入选为CSSCI（2025—2026）来源期刊

刘海涛：计划语言的社会化与语言规划范式重构

2026年5月26日 00:00

刘海涛 2026-05-26 00:00 江苏

以下文章来源于：语言战略研究

语言战略研究

《语言战略研究》是我国第一份以语言政策和语言规划为主要内容的专业学术期刊，于2016年1月正式创刊。该刊由国家语言文字工作委员会指导，中国语言学会语言政策与规划研究会学术支持，商务印书馆主办出版。主编李宇明教授，执行主编郭熙教授。

语言的生命力源于社群互动的社会涌现。

2026年第2期

专题研究一

语言政策与规划知识体系构建

刘海涛

复旦大学文科资深教授，主要研究方向为语言规划、国际语语言学、数据驱动语言学、数字人文。

计划语言的社会化与语言规划范式重构

刘海涛

（复旦大学　外文学院　上海　200433）

提要 为满足第一次全球化时期（约1870—1914）对跨国交流工具的需求，人们创造了300多种计划语言。其中，先后诞生于1880年和1887年的沃拉普克语与世界语尤为知名；前者风靡一时而又迅速消亡，后者成长为具有持续社会生命力的“活语言”。剖析其成败原因，沃拉普克语的创始人和使用者没有按照语言演化的规律来规划和使用语言，致使其因中心化权力垄断走向僵化；而世界语通过放弃个人权利、确立底层协议稳定性和文本驱动习得，实现了从纸面方案向社会事实的跃迁。对比二者的社会化进程可知，语言生命力根植于真实使用中的社会涌现，而非语法设计的机械完美。世界语的演化范式预演了当代大语言模型从“规则驱动”向“数据驱动”转型的技术逻辑。从本质上看，语言规划是一项社会工程，其成功关键在于能否实现从工程设计向生态培育、从行政控制向民主治理的范式转型。对计划语言兴衰历史经验的挖掘，可为数智时代的语言规划及人类命运共同体建设提供理论参考与历史镜鉴。

关键词 语言规划；计划语言；社会涌现；生命态；第一次全球化

一、引　言

从语言规划的视角看，语言不仅是抽象的符号系统，更是一个由个体主观能动性驱动的、具备生命态特征的复杂适应系统。人作为“生物人”与“社会人”的统一体，其移动性与创造性不断重塑着语言的边界。然而，当人类试图发挥主观能动性去干预、调节语言以适应社会需要时，我们必须直面一个核心命题：语言的演化规律究竟是预设的工程设计，还是社会交互中的自发涌现？

库珀（2020）认为，语言规划本质上是社会变迁的产物。每当历史步入剧烈变革期，既有的语言系统往往因运行惰性而难以满足新的社会需求。回顾历史，“第一次全球化”（约1870—1914）正是这样一个由于社会急剧转型而触发语言规划高潮的典型时期。这一时期见证了人类历史上首次“物理连接”与“制度共振”的交织，在“路通、规则通、钱通”的硬性需求下，人类还迫切需要实现“人（心）通”。对全球化“通用协议”的深切渴求，使那个时代演变为一个宏大的社会语言学试验场，各类语言规划的产物（计划语言）纷纷登台，竞相为多语的世界架设简单易行的沟通桥梁。

在众多方案中，沃拉普克语（Volapük）与世界语（Esperanto）的兴衰史为我们提供了极具价值的研究案例。沃拉普克语是第一个社会化的计划语言方案，一度风靡全球，后又迅速消亡；与此同时，起步较晚的世界语却在动荡中展现出持续的生命力，成为唯一的全功能计划语言。本文通过对这两者的历史对比，试图剖析：为何一种计划语言能突破“纸面方案”的局限，成长为具有社会生命力的“活语言”？这不仅涉及语言本体规划的优劣，更取决于地位规划中权力结构的开放度，以及习得规划中由“语境驱动”向“生命演化”转型的深层逻辑。

长期以来，语言规划学科倾向于将语言视为可控的符号工程（刘海涛2023），这种基于工具理性的“工程设计范式”在解释语言生命力的动态演化时日益显现出局限性。本文以第一次全球化为视阈，通过对沃拉普克语与世界语命运分野的深层剖析，探究计划语言社会化的内在逻辑，并据此寻求语言规划范式的重构之道。这不仅是对历史经验的实证挖掘，更是对语言规划知识体系的一次本体论回归，即揭示语言如何从“设计态”方案跃迁为具有生命活力的“社会协议”，并探讨这种从规则驱动向数据驱动转化的演化规律，如何为数智时代的语言治理提供跨时空的镜鉴。

二、第一次全球化背景下的计划语言涌现

第一次全球化通常指19世纪中后期至第一次世界大战前这段时间（Daudin et al. 2010）。这一时期具有代表性的重大事件有：红十字国际委员会（1863、1876）；跨大西洋电报电缆铺设（1866）；苏伊士运河开通（1869）；国际金本位制确立（1870年代）；万国邮政联盟（1874）；国际度量衡局（1875）；《巴黎公约》（1883）；柏林会议（1884—1885）；《伯尔尼公约》（1886）；跨洲铁路网的兴建（1885—1910）；第二国际（1889）；巴黎世界博览会（1889、1900）；各国议会联盟（1889）；国际和平局（1891）；第一届国际卫生大会（1892）；万国工业产权保护协会（1893）；第一届现代奥运会（1896）；海牙和平会议（1899、1907）；跨大西洋无线电通信（1901）；首届国际世界语大会（1905）；国际电工委员会（1906）；国际公共卫生局（1907）；巴拿马运河开通（1914）；《国际海上人命安全公约》（1914）；等等。

（一）全球化格局对跨国交流工具的需求

这些事件勾勒出的第一次全球化图景，核心体现为“连接、规则、协作”三大特征，以及由此衍生的“路通、规则通、钱通、人（心）通”的“四通”格局。

这一时期，人类历史上首次见证了物理连接与制度共振的深度交织。苏伊士运河、跨洲铁路和海底电缆等巨型工程的落成，将世界编织进一张即时流动的物质与信息网络，彻底重塑了时空距离对贸易的约束，促使商品、资本与信息得以在大陆间以前所未有的速度自由流淌。伴随而来的是全球治理的“标准化驱动”阶段。从国际金本位制提供的统一金融语言，到万国邮联、度量衡局、《巴黎公约》（知识产权）等确立的行政准则，一套维系全球商业运转的共同规则体系在混乱中建立起来。最终，这种连接从经济领域外溢至社会精神层面。无论是红十字会的人道共识、奥运会的体育交流，还是世界语运动对语言壁垒的挑战，人类开始超越民族国家的界限，尝试进行全球性的协作与治理。这些物理层面的连接不仅重塑了全球贸易，更迫使人类在硬性的规则体系之外，寻求一种能够支撑全球协作的标准化符号协议。尽管这一体系最终在第一次世界大战的战火中戛然而止，但人类命运共同体的理想，在这一时期首次转化为大规模的现实尝试。

有关这一时期的贸易、投资、技术等领域的情况，已有很多研究了（Faubert 2012；Zinkina et al. 2019），这里我们主要关注人员流动情况。不仅因为“‘流动性’是解释与描写现代基本进程的核心词语”（Sloterdijk 2020：10），更因为人是语言人，因此流动的人是影响全球语言生态的主要力量，是全球性语言变革的源驱力。从交流和共同体形成的角度讲，是流动的人，特别是跨越语言边界流动的人，扮演了语言社会网络中的“弱连接”角色，联通了讲不同语言的小网络，使数千种人类语言形成了具有小世界特征的语言、文化、知识和文明的大网络与共同体。这一时期也在人类历史上首次形成了复杂的语言生态，有一种重现“巴别塔”的既视感。只不过那时是讲多种语言的人在梦想破灭后的分离，而现在是讲多种语言的人为了梦想又聚在一起。

（二）计划语言的辅助语范式与创制浪潮

那他们如何交流呢？没有有效的交流，是不可能构建一个真正的共同体的。换言之，第一次全球化时代在语言方面带给人类的真正挑战是：在现代国家意识日益增强的时代，在不同语言的人们可以更便捷地相遇和交流的时代，在保证不伤害印刷术革命带来的民族语多样性的前提下，人类如何自由地使用某种语言进行有效的交流？在这种情况下，“构成交流最基本成分的语言便成为吸引跨国改革者的一种媒介”（Rosenberg 2012：850）。请注意这句引语中的“跨国”（transnational）一词，这不仅是一个伴随第一次全球化于1916年诞生的新词，也是描述这一历史时期人类社会特征的一个热词，^[1]它关注的是在跨越国家边界的人际交往日益增强的全球化时代，如何更合理地处理各种文化间的关系。所有这一切，使科学界与知识界均认识到：“民族语严重阻碍了人们在许多普遍领域的相互理解。如果要在跨国范围内共享信息，如果要让自然的、自发的全球一体化社会进程自由发展，就必须采用新的语言形式。”（Rayward 2014：16）当原有的民族语在跨国语境下因文化偏向和习得成本而凸显其局限时，计划语言作为一种理性的替代方案正式进入了历史视野。

[1]　参见Rosenberg（2012）。在这部系统阐述第一次全球化史的著作中，“transnational”（跨国）一词出现达353次，表明“跨国性”已成为界定这一时期社会协作与全球生活特征的核心概念。

于是，人们开始考虑什么样的语言才能满足全球化时代各国人民的跨国交际需要问题。理论上，这样的语言应该是中立的，因为只有中立的语言对所有国家的人来说才是公平的；这样的语言应该简单易学，但又富有表现力；这样的语言应该是辅助的，它存在的目的是帮助人们更好地进行跨国交际，而不是要取代任何现有的人类语言。用现在的话来说，这种语言应该是生态友好型的，它的引入不会也不应该破坏现有的人类语言和文化生态。这也标志着人类在语言规划上从管控向共生的转向，为后续从工程设计走向生态治理的范式转型埋下了伏笔。

显然，所有自然语言都无法满足上述要求，理论上，只有人类有意识创造的语言才可胜任这一角色，今天，我们一般将这类语言称为（国际）计划语言（Blanke 1985）。^[2]据不完全统计，从2世纪到20世纪70年代，人类已经创造了900多种计划语言方案（Дуличенко 1990）。在这900多种方案中，有310种是在第一次全球化时期创制的。然而，方案的爆发并不等于生命的诞生。在近千种计划语言方案中，绝大多数仅能作为造语者的智力遗迹存在。

[2]　关于计划语言的基本问题以及计划语言对语言规划、自然语言处理和语言学的意义和价值，可参考刘海涛（1995，1996，1998，2004，2023）。

（三）计划语言从设计态向生命态的跃迁模型

在剖析这些计划语言命运分野的根源之前，有必要引入一套系统性的评估维度。布兰克通过对计划语言演进的深度观察，划定了计划语言成功的关键，即：实现从静态的“设计态”向动态的“生命态”的跃迁。他将这一社会化进程细化为19个微观步骤（Blanke 1985），我们可系统性地将其提炼为5个递进阶段：①方案构建，②组织萌芽，③实际应用，④结构稳定，⑤深层内化。依据此框架审视历史，近千种语言方案中的绝大多数均止步于雏形阶段；能够跨入组织化层面的“半计划语言”寥寥无几；唯有世界语穿越了全部路标，在完成社会化全路径整合的同时，至今仍以活语言的姿态砥砺前行。这套评估模型也为我们反思传统语言规划的工程设计范式提供了实证支点。它表明语言规划的成功不在于设计蓝图的完美，而在于其在复杂社会中的生存能力。

基于这一判准，我们将目光投向第一个开启大规模社会化进程的方案——沃拉普克语（Schubert 2023），去解析其如何触及了“生命态”的边缘，最终却又由于系统性的缺陷而迅速消亡。

三、沃拉普克语的社会化尝试与失败

1880年，德国人施莱尔用德语出版了一本标题为《沃拉普克语》（Volapük）的书（Schleyer 1880）。这本147页的出版物有一个拗口的副标题——“世界语，适用于全世界所有受过教育的人的通用语言方案”。

（一）沃拉普克语的理想与全球传播

施莱尔在开篇写道：“铁路、轮船、电报和电话的出现缩小了地球的时空，也大大拉近了世界各国之间的距离。人类日趋国际化，并寻求进一步的一体化。伟大的万国邮政联盟已使我们朝着这个美好的目标迈出了一大步。另外，在货币、度量衡、时区、法律和语言等方面，亲如兄弟的人类也应该越来越统一！希望现在这本小书能为大规模的语言统一提供第一推动力。继人类已在万国邮政实现一体化之后，也需在世界文字、世界语言和世界语法方面更统一！对人类而言，这无疑是精神和物质上的最大收获和进步。”

从这段话，不难看出那个时代的人对于由技术革命带来的世界大变革的期许——既然整个地球都变成了一个村庄，各个方面的统一和一体化似乎也应该近在咫尺。人是语言的人，语言是联结社会的纽带，那么，我们当然也需要一个简单易学、适合“地球村”的语言了。这种想法不是施莱尔一个人的，也是当时许多知识分子的想法。因此，施莱尔就适时为“全世界所有受过教育的人”创造了沃拉普克语（Volapük），这个词中的vol来自英语的world（世界），pük来自英语的speak（语），合起来便有了“世界语”的意思。由此也可看出，尽管沃拉普克语的词汇大多来自英、德等日耳曼语言，但由于经过缩减处理，人们很难辨认。然而，再难也难不倒全球化时代热盼国际语的人们。

据不完全统计（Kniele 1889），截至1889年，沃拉普克语在全世界约有283个俱乐部，1600名有证教师，25种期刊，用25种语言出版了316种教科书，其中有60本完全以沃拉普克语写成，学习者人数曾一度超过百万。“人类文明所及之处，如今已无人不知施莱尔之名。”（Schmidt 1986：11）一般认为，这个数字有夸大的成分。一本1901年出版的沃拉普克语使用者名录（Kausch 1901）只包括了不到3000人，其中有7人的地址在中国。

克尼勒（Kniele 1889）说，将沃拉普克语引入中国是1888年最引人注目的事情之一。比利时人阿尔斯特（Julius A. van Aalst）在厦门出版了《通用语言或沃拉普克语》（The Universal Language or Volapük）一书，并给中国人开设了培训班。同时，在天津、北京都有人开始传播沃拉普克语，以致阿尔斯特还给施莱尔写了封信说：“施莱尔的名字出现在了所有中国报纸上。”当然，我们有理由怀疑上面这句话中的“所有”一词，正如沃拉普克语没有像克尼勒书中最后一句话期待的那样“万岁”（Liföl volapüke），也没有实现1887年12月《谢菲尔德晚星报》所说的“在进入20世纪之前，四分之三的国际通信将用沃拉普克语进行”^[3]。

[3]　转引自Volapükabled zenodik. Monatsblätter der Weltsprache Volapük, 1888, 8(90): 393。沃拉普克语在厦门的推广与宣传还是有效的。在1895年7月14日《纽约时报》第13版，还刊登了一则厦门某商行打算发行国际货币的消息，在货币样品上印有汉字“通”和沃拉普克语“Mon bevünetik”的字样。

（二）私人产权意识与组织内部的分裂

事实上，就在1888年，克尼勒书中多次提到的在沃拉普克语运动中起到重要作用的利奥波德·爱因斯坦，带着他自己创办的纽伦堡世界语言协会放弃了沃拉普克语，转而支持另一种刚问世的计划语言。这次“转会”事件，标志着热闹了近10年的沃拉普克语开始走下坡路。这一点，也可以从媒体对于沃拉普克语的关注度看出来。我们以5年为时间段，用Volapuk作为关键词检索了美国报刊库，发现这个词在不同时期的出现次数：1880—1884（5），1885—1889（1398），1890—1894（715），1895—1899（314），1900—1904（312），1905—1909（434），1910—1914（441），1915年后则迅速减少以至于可以忽略不计了。这些数据表明，沃拉普克语虽然在短时间内获得了极高的国际声望，但这种繁荣更像是一场缺乏根基的文化风暴，而非稳固的语言生活实践。当新鲜感退去，其内部治理的弊端便开始显露。

施密特（Schmidt 1986）认为，导致沃拉普克语运动彻底崩塌的主要原因是施莱尔与曾任沃拉普克学院院长的凯尔克霍夫^[4]之间的冲突。凯尔克霍夫主张对语言进行系统性简化和改革，以提升其实用性和传播力，但施莱尔拒绝修改。这一分歧引发了运动内部的分裂，导致大量支持者和协会转向改革派，严重遏制了沃拉普克语的发展势头。尽管施莱尔于1891年3月将凯尔克霍夫从沃拉普克语者名录中剔除，但期许的改革迟迟不来，导致使用者诸多不满，语言的核心支持群体锐减，语言失去传播能力，宣传几乎停滞，刊物数量大幅下降，组织体系逐渐解体。这标志着沃拉普克语作为国际语运动的实际终结。

[4]　凯尔克霍夫被广为人知的是其1883年提出的密码学原理：即使密码系统的任何细节已为人悉知，只要密钥未泄漏，它也应是安全的。

种种迹象表明，沃拉普克语始终停留在布兰克（Blanke 1985）所定义的“第二阶段”。它有组织、有学习者，但缺乏使用者自主创造的空间，未能进入更高层次。为什么人类历史上第一次计划语言社会化的实践持续的时间如此之短？在社会需求如此旺盛的时期，沃拉普克语为什么会昙花一现？是社会问题？还是语言本身的问题？抑或是创始人的理念问题？

如果用一句话来总结沃拉普克语的失败，那就是创始人和语言的使用者没有按照语言演化的规律来规划和使用语言。语言创制是一种全面的语言规划活动，一个人可以设计语言方案，但无法创造真正的人类语言，因为人类语言诞生于人际交互使用的过程中，只有正常的使用才能造就正常的语言。

施莱尔1880年的沃拉普克语第一本书的封面有这样一句口号：“一个人类，一种语言！”（Menadé bal, Püki bal!）；然而，在版权页上却写着“一切权利归作者”。施莱尔自始至终都认为沃拉普克语是“他自己的发明”“他自己的财产”“他自己的孩子”，拒绝接受任何个人或集体改变沃拉普克语的建议。在推广语言和使用者组织方面，施莱尔把学习沃拉普克语的人分为了19级，用语言分级复制了社会阶层，进而给人造成一种错误的印象，认为学习沃拉普克语就是为了在这个人造的社会阶梯上登攀，而不是为了更好地与人进行交流。

施莱尔对权力的固守不仅导致了组织的瓦解，更封死了语言改进的可能性。当追随者发现自己无法参与语言的演进，而只能服从创制者的意志时，他们最终选择了离开。

（三）复杂的语法规则与习得难度的挑战

语言结构上，沃拉普克语的词汇虽然来自自然语言，但已被改得面目全非，无法辨认。更糟糕的是，这种修改几乎毫无规律可循，基本是由着施莱尔的性子来。这当然会增加使用者学用语言的难度。

在形态方面，沃拉普克语作为一种黏着语，其优点是形态变化很规则；缺点是变化太多，难以完全掌握。即使是沃拉普克语的权威学者卡尔·伦泽，在面对多达50万种可能的动词变体和毫无理据的词根时，也不得不感叹这门语言学起来确实太难：“倘若有教师罚学生抄写沃拉普克语中一个动词的所有变化形式，学生每4秒抄写一种形式，那么他必须连续不停地抄写整整20个昼夜，方能完成这项任务！”（Lenze 1886：27）伦泽的挫败感揭示了沃拉普克语作为“基于规则的专家系统”的致命缺陷。它可能只适合存在于词典和语法规则中，却难以“内化”在人类有限的认知网络中。这也许是人们后来发现就连施莱尔本人也不能完全流利地使用他自己创造的语言的原因，因为施莱尔也是人。沃拉普克语是人类历史上第一个大规模社会化的计划语言，无论是创始人还是使用者都有一种朴素的想法，那就是，语言没人用、用不好，就说明语言本身还不够好。于是，最好的解决办法就是从技术方面不断改进语言，而不是从社会组织方面、语言演化规律方面去找原因。

沃拉普克语运动衰落了，但沃拉普克语的追随者们修改语言的热情却持续了很长时间。“诚然，它已经死去，但也许重要的经验是，它曾经活过。”（戈尔金2022：130）作为人类历史上第一个大规模社会化的半计划语言，沃拉普克语值得青史留名。它的十年辉煌告诉我们，语言是可以规划的，人是可以有意识创造语言方案，并将其社会化为真正的人类语言的；但在社会化的过程中，要遵循语言的自然演化规律，要顺势而为。语言不是创始人的私产，而是所有使用者的共同财富。它的失败可以说是“内忧外患”合力作用的结果。“内忧”指的是源于内部的语言改革以及对于语言改革的态度，“外患”指的是受“内忧”困扰的使用者发现新出现的世界语几乎可以解决所有这些“忧虑”，于是转投新语言。沃拉普克语的兴衰揭示了一个深刻规律：语言的生命力源于社会实践，而非设计理念本身。沃拉普克语的失败也为后来的计划语言划定了红线。而此时，“满怀希望的人”正带着权利开放和逻辑简化的姿态，从沃拉普克语手里接过了人们对国际语的希望。

四、世界语的社会化与生命力的生成

1887年7月26日，华沙的一家小出版社出版了一本42页的俄语小册子（Д-р Эсперанто 1887），作者的名字为Esperanto博士，书名《国际语》^[5]，副标题是“前言与完整的教科书”。

[5]　后来，为了突出这本书的重要性，人们称其为世界语“第一书”（Unua Libro）。

（一）权利开放与Esperanto博士的希望

这本书的封面上有一句座右铭：“一种语言要成为世界语仅这么叫它是不够的。”比较独特的是，版权页上并没有人们习惯了的“所有权归作者”之类的字样，而是写着：“国际语同所有民族语一样是社会的公共财富，作者永远放弃对它的一切个人权利。”这与施莱尔将语言视为私人专利的立场形成了本质区别。在版权页上永久放弃权利，世界语创始人消解了计划语言社会化过程中的专利阻碍，为世界语成为一种公共语义协议扫清了法律与心理障碍。

Esperanto博士这本书的封面布局与沃拉普克语第一本书很相似，但二者的内容却很不一样。本来就不多的42页，其中绝大部分是前言之类的东西，主要是谈国际语的重要性、作者解决这个问题的基本思路、国际语传播等问题。严格来说，所谓的“完整教科书”只有13页：6（语法）+ 2（词典）+ 5（语言样本）。

两种语言的“第一书”在结构与作者权利的差异，本质上反映了两位创始人对计划语言认知的根本分歧。施莱尔将沃拉普克语视作一种已完成的、静态的通用语，在编撰教材时采取了传统语言教科书的体例，忽视了学习者从既有民族语言体系跨越到计划语言的认知门槛。而Esperanto博士则采取了截然不同的策略。他通过长篇序言与《承诺书》强化了学习者的心理接受度和社群归属感，并采用极简规则大幅降低了学习阻力，使学习者得以快速入门。

二位作者对“第一书”再版的态度差异，更进一步凸显了语言稳定性在本体规划中的重要性。世界语创始人有意识地没有再版“第一书”，而是通过后续出版的《世界语基础》冻结其核心内容，确立了语言的不可更改性。反观施莱尔，截至1888年持续修订再版至第9版，并始终强调只有最新版本有效。这种持续变动给学习者造成了极大的不确定性与负面印象。在一个追求稳定沟通协议的社群中，谁愿意投入时间学习一个“明天就可能作废”的语言？因此，尽管我们常说“没有最好，只有更好”，但对于语言，尤其是一种旨在建立全球共识的计划语言而言，稳定作为一种社会契约理应超越本体设计的持续完善。

在前言中，Esperanto博士给自己定下了这样的目标：语言应该简单，人们如同玩一样就能学会；学会它后，人们可以立即用它来与讲其他语言的人交流；语言应该是活的，它不仅是创造的结果，也应是随时可用的克服语言障碍的钥匙。因此，他也颇为自信地认为，人们可以在一小时内掌握这种语言的语法，可以轻松快乐地用几天时间就学会这种语言。根据书最后的两页词典，我们现在可以破译作者名Esperanto的意义：这是一个由esper（希望）、ant（正在进行）和o（名词结尾）组成的词语，合起来就是“满怀希望的人”。在中国，人们最早把这种语言译为“爱斯不难读”“爱世语”“万国新语”，后借用日语的译法“世界语”并延续至今。回到原点的话，“世界语”本来是沃拉普克语的名字，Esperanto博士的语言方案的名称是“国际语”才对。

尽管世界语的创始人多次强调他是独立创造这门语言的，而且其首个国际语方案早在1878年就已初具雏形，但他确实是熟悉沃拉普克语的。正如他本人所言：“当我已经完成了绝大部分工作的时候，沃拉普克语登场了。”^[6]由于篇幅所限，我们这里不再细数世界语与沃拉普克语的关系（Neves 2012），只需回到世界语“第一书”封面和版权页的那两句话，为什么Esperanto博士会写那么两句话？难道不是对沃拉普克语社会化过程中所遭遇问题的有的放矢吗？版权页上的那句话说明，Esperanto博士已经充分认识到，任何语言都不是个人的财富，而是一种特殊的资源，即公共资源。如果它只属于创始人，那么注定无法成为人的语言。

[6]　这句话刊登于1889年出版的第一本世界语刊物《世界语者》（La Esperantisto）第1期第6页。

（二）规则稳定与用户社群的早期培育

然而，正如世界语“第一书”封面所说的那样，一种语言要成为世界语，仅仅那么叫它是不够的。像世界语这种计划语言，在推出之时，除了作者，世界上没有第二个人会了。语言是交流的工具，没人交流的话，即使你白送人，也不会有人要。这样一来，版权页上的那句话就成了空话。那Esperanto博士又是如何解决这个问题的呢？在42页小册子里面，有4页属于8份空白的《承诺书》。每份《承诺书》的正面写着：“我，用此签名，承诺：如果有1000万人也公开做出此承诺的话，我将学习Esperanto博士所提出的国际语。”签署后的《承诺书》可寄到Esperanto博士留下的一个地址。这个地址暴露了世界语创始人的真实姓名柴门霍夫（L. Zamenhof）。

这种签署即承诺的机制，本质上是在解决语言网络效应中的冷启动困境。它不是强迫个体学习，而是通过构建集体预期来培育潜在用户。这与沃拉普克语的等级晋升制度形成了鲜明的范式对比：前者是参与式驱动，后者是选拔式约束。

柴门霍夫认为，当签署《承诺书》的人达到1000万时，国际语的问题也就差不多解决了。这样的想法显然有些天真，因为即使在139年后的今天，世界语的日常使用者也没有1000万。但毫无疑问，柴门霍夫的方法是一种讲道理的方法，是一种可操作的方法。于是，“国际语”和空白《承诺书》带着人类的希望走向了世界。柴门霍夫也开始履行自己的承诺，公开他收到的《承诺书》签署人的名址。

1889年开始，柴门霍夫通过各种渠道开始出版一种叫作《地址录》（Adresaro）的名录。截至1908年，《地址录》共收录了21 915位世界语学习者的名址信息。后来因为学习者增长太快，就不再以个人名录形式出版，而改为组织名录了。根据《地址录》统计，世界语学习者总数在1897年达到了4000人，用了10年时间；接下来的4000人仅用6年，后来用的时间越来越短——4年，1年，5个月……当然，还有很多人，可能就懒得写信给柴门霍夫通报自己的情况。《地址录》含有世界上最早学用世界语的2万多人的地址信息。这些信息，不仅是人名的堆砌，更是构建了一个透明的社会化网络。在1889年出版的第一本《地址录》中，就记录了一位居住在中国的使用者：皮尔斯·埃塞克斯·奥布莱恩·巴特勒（Pierce Essex O’Brien Butler）。在所有《地址录》中，共记录了29个中国的名址。这也表明这种基于个人联系的去中心化传播，已具有超越国界的“生命态”特质。

（三）民主公投机制与语言核心规则的确立

柴门霍夫在世界语“第一书”前言的最后，谈到了自己对于语言改革的意见。他首先明确指出，自己的这个语言不是完美的，也不是不能改的。因此，他请大家在一年内将修改意见寄给他。当然，这些修改不能违反世界语结构的基本原则。然后，他将整合修改建议并确定语言的最终形式。最终形式一旦确定，而且语言已被人普遍使用，就是他本人也没有修改的权利了。但修改的权利可以由一个更加权威的世界语研究机构来进行。

从沃拉普克语毁于不断改革的教训中，柴门霍夫意识到语言不能总是改革，但作为一种带有“计划”特质的语言，其追随者们有更大的改革之心也是可以理解的。在各种压力下，柴门霍夫在1894年的《世界语者》杂志上提出了“世界语”改革方案，主要内容有：废除所有带变音符号的字母（如ĉ, ĝ, ĥ, ĵ, ŝ, ǔ）；废除宾格（-n），改为通过语序确定宾语；名词复数后缀由-j改为-i；取消形容词与名词性、数的一致性要求；取消定冠词la；词汇更加拉丁化等。与施莱尔不同的是，柴门霍夫选择了世界语使用者公投的方式来决定是否要修改语言。投票结果表明，绝大多数使用者不同意对语言进行任何改动。面对这种结果，柴门霍夫虽然在理论上对某些改革（如废除宾格）持开放态度，但他表示尊重投票者的意愿。

于是，他在1894年11月的《世界语者》上宣布：“世界语应完全保持其现有形式，不做任何改动。”（La lingvo Esperanto devos tute sen ia ŝanĝo resti en sia ĝisnuna formo.）公投结果表明，语言的生命力源于使用者的稳定性预期。社群宁愿接受一个不完美的方案，也不愿忍受一个频繁变动的实验品。柴门霍夫尊重民意终止改革方案的实施，标志着世界语从创始人的“设计态”正式转化为社群共有的“生命态”。

这次投票也说明，世界语社群更倾向于维持稳定性，而非追求理论上的完美语言。因为世上没有完美的语言（Eco 1993），更因为参与者意识到，频繁的变动会毁掉一个新生的交流系统，正如沃拉普克语所经历的那样。这次投票结果直接促成了1905年《世界语基础》（Fundamento de Esperanto）的出版。该书规定了语言的核心规则不得修改，确保世界语不会重蹈沃拉普克语因改革问题而导致的频繁内斗、进而分裂的覆辙。这本书还收录了已在世界语者间广泛流传的练习册、词典和16条语法。在前言里，柴门霍夫强调了3点：“这本书起着世界语发展统一的纲领性作用。为了世界语的统一，每一个世界语者都应当好好了解、熟悉这本书；世界语的基础永远都是不可触动、不能改变的；如果需要改变，得有一个权威的机构来做决定。”这3点基本延续了他在“第一书”中关于语言的稳定与发展关系的观点。换言之，《世界语基础》的“不可触动性”意味着语言规划中“底层协议”的冻结，这为语言在更高层级的“自发演化”打下了稳固的基础。

同年8月5—13日，第一次国际世界语大会（Universala Kongreso）在法国布伦召开，来自20个国家的688人参加了这次大会。会上，通过了《世界语主义宣言》。其中第4条是这样说的：“世界语没有立法者，也与某个特定的人无关。世界语创始人的意见和著作，如同其他世界语者的意见和著作一样，绝对只有个人的特质，对任何人没有强制性。所有世界语者唯一应遵守的，就是《世界语基础》。”这不仅是单纯的学术主张，也奠定了语言所有权社会化的基础。

（四）跨国协作模式与历史遗产的继承

从语言发展的角度看，尽管世界语没有完全达到创始人预设的目标，但139年的时光已将世界语从一本40页的小册子变成了一种使用者总数约200万、分布在120多个国家和地区的人类语言（Wandel 2015）。布兰克认为世界语取得相对成功的原因（Blanke 2009），除了在结构方面语言系统具有适应社会需要的能力之外，更重要的是，柴门霍夫清醒地认识到，语言是一种社会现象，推动语言发展的动力是使用者形成的言语社区，因此，如何构建和维持一个言语社区稳定发展的语言统一基础就尤为重要了。换言之，经过分散在世界各地的语言使用者的共同努力，在《世界语基础》的基础上，他们创造了人类有意识参与语言演化的奇迹。

在组织与行动方式上，世界语运动也创造了人类历史上一种独一无二的跨国运动模式，即“在世界社会缺乏集中的政治和文化权威的情况下，世界语运动帮助建立了一个世界一体主义的意识形态框架，并为其他行为者，特别是其他国际非政府组织所利用和采纳”（Boli & Thomas 1999：147）。世界语的发展轨迹，尽管坎坷，但却较完美地对应了布兰克（Blanke 1985）所描绘的语言社会化过程：它不仅提出了清晰方案（①），建立了全球学习网络（②），更关键的是鼓励用户自由创作（③）、推动口语实践（④），并最终实现了代际传递（⑤）。正是这种由下而上的共建机制，使其摆脱了“人造项目”的标签，成长为一种真正意义上的“活语言”。

值得注意的是，世界语的成功也与吸取沃拉普克语失败的教训有很大的关系。时至今日，一些源于沃拉普克语运动的要素仍存在于世界语者的语言生活之中，如年度世界性大会、会歌、各种协会网络、语言研究院等（Haupenthal 2012：76）。为此，“世界语者已不再把沃拉普克语看作自己的竞争对手，而将其视为一位值得尊敬的先驱。沃拉普克语是第一个社会化了的计划语言，即使只有极少数地球人知晓这一点，它仍是全人类的共同财富。我们不应任由这一宝贵财富就此消逝”（Cherpillod 2003：3）。“我们须以对待古希腊语或古撒克逊语的态度来珍视沃拉普克语。保护这份人类语言遗产，正是我们的责任。”（Bishop 2012：2）对于语言规划研究者而言，这一点尤为重要。因为我们没有理由忘记，1889年8月在巴黎举行的沃拉普克语大会，这是人类历史上首次以计划语言为唯一交流语言的国际大会。这不仅是语言学史上的奇迹，更是语言规划梦想照进现实的高光时刻。世界语对沃拉普克语遗产的尊重，体现了语言规划史的连续性，沃拉普克语开创了社会化的先河，世界语则完成了生命化的转型。

五、语言规划的社会工程本质

世界语和沃拉普克语的诞生，是第一次全球化时期人类主观能动性与时代需求碰撞的产物。面对日益凸显的国际交流障碍，这两种语言可视为“生物人”的认知能力与“社会人”的协作需求共同作用的产物。

（一）语言规划的社会工程属性

计划语言方案在这一时期的集中出现，一方面反映了全球化进程中社会协作的迫切需要，另一方面也精确地映射了当时尚未定型的地缘政治格局：那是一个英国略微领先，法、德紧随其后，美国崭露头角的时代，还没有任何一种语言独霸全球。这种多元竞逐的权力真空，为人类有意识地创造理想的国际语提供了宝贵的土壤，为世界语等计划语言的社会化提供了历史空间，更为计划语言从私人方案向社会公约的跃迁提供了动力。这也说明语言规划的本质不仅是符号设计，更是社会关系的重组。

从人类交际工具的角度看，一旦计划语言完成了完全的社会化进程，除了拥有一个明确的“生日”之外，它与自然语言的根本区别便微乎其微。最新的认知神经科学研究表明（Malik-Moraleda et al. 2025），人类处理高度社会化后的计划语言时，所用的认知与神经机制与处理自然语言时并无二致。既然如此，那么规划的成败便不再取决于语法的精妙和词典的厚度，而更取决于其能否在复杂的社会生态中成功落地并开始内生演化。

计划语言的兴衰过程，本质上构成了一场关于“人类主观能动性在语言变革中的作用”的宏大社会实验。这场实验既展现了人类超越民族界限、追求普遍沟通的强大意志，也暴露出语言作为深层文化载体所固有的惰性。从语言规划的专业视角来看，沃拉普克语和世界语的兴衰史提供了一个极具价值的研究案例。两者同为19世纪末第一次全球化背景下旨在解决跨文化沟通障碍的产物，却因在规划理念、管理机制和对语言认知规律顺应程度上的截然不同，最终导致了天壤之别的命运分野。基于这两种计划语言的社会化实践，我们有理由说，语言规划从来不只是语法规则的制定或词汇系统的发明，它本质上是一项社会工程。这一过程涉及地位配置的权力让渡、本体干预范式的转型以及习得机制的语境化。

（二）沃拉普克语与世界语的成效对比

沃拉普克语与世界语的兴衰对比表明，决定计划语言成败的关键，并非其结构是否科学和逻辑，而在于其规划方式能否实现从个人方案向公共实践的跨越。为了厘清两种范式的差异，表1从权利配置、干预范式与生成机制3个维度，揭示了控制型规划与涌现型规划的异同。从中可以清晰地看到：语言的生命力与设计本身有关，但更取决于它能否在社会互动中获得生长的土壤。

总的说来，沃拉普克语和世界语的社会化实践告诉我们，语言不是机器，不可由一人设计、操控；语言是生命，需在使用中生长，在交流中演化。“语言不是个体的，而是集体的，社会是将个人言语晶化为集体语言的熔炉。”（刘海涛2025：191）世界语之所以能穿越百年风雨，正在于它逐步完成了从“方案”到“内化”的全过程。而沃拉普克语的失败，则是一个停留在前中期阶段的典型案例。这再次证明，人类语言不是设计出来的，而是在千万次真实互动中“长”出来的；它的生命力，永远根植于使用者的集体实践之中。换言之，语言规划与政策的本质，不在于“规定什么”，而在于“如何让语言更好地服务于人”。

有意识的语言干预是可能且必要的，但其成功与否取决于是否顺应语言发展的内在规律，且干预必须适度。任何成功的语言规划，本质上都是对语言演化规律的尊重。语言规划的成功不在于设计的完美程度，而在于管理的民主程度。有意识的干预只能在语言的“基础框架”层面进行，一旦语言进入流通领域，规划者就必须退居幕后，让位于使用者的集体智慧。语言规划必须顺应使用驱动和社群共建的规律。试图通过权力结构强行规定语言发展，是对语言本质的误读。语言规划，无论针对的是计划语言还是自然语言，都应建立在多方参与、协商一致的基础上，避免个人意志凌驾于社群之上。简言之，沃拉普克语死于控制，世界语活于放手。这一规律要求规划者实现角色转变，从试图主宰每一个语法规则的立法者，转变为提供底层协议并保障演化空间的生态培育者。只有当语言真正属于使用者时，它才有了生命力。这两种计划语言的社会化历程也表明，语言规划应顺势而为，这个“势”就是语言作为一种人驱复杂适应系统的运作规律（刘海涛2024）。

（三）从规则驱动向数据驱动的范式转型

另外一个必须提及的本质区别是，1888年出版的《国际语第二书》（Dua Libro de l’ Lingvo Internacia，以下简称《第二书》）就是20篇用世界语写成的文章合集（Dr. Esperanto 1888）。柴门霍夫认为学习者应该重复学习这些文章，这样可以更好地掌握语法规则，理解词汇的意义和词缀的用法。这种通过大量文本的学习来获得语言知识、形成“语感”的方法，有力地推动了语言的社会化，也在一定程度上避免了语言的方言化（刘海涛2005）。今天，这种方法也已被用在以大语言模型为代表的人工智能领域。沃拉普克语注重词典编纂，本质上是试图构建一套基于规则的专家系统，这导致了习得过程中的认知超载。而世界语通过《第二书》提供的语料，实质上是在进行基于语境的数据驱动的语言演化。这种差异决定了语言是作为死代码被封存，还是作为生命体被激活。我们认为，这才是世界语得以成功的秘诀，因为只有这样“使用创造语言”才能落地，才能让语言真正活起来。

对比今天盛行的大语言模型的工作机理，我们可从以下3个方面来解读二者的异同。（1）从逻辑演算向模式识别的跃迁。沃拉普克语的失败，很大程度上在于它采用了一套冻结的静态逻辑。它的创作者施莱尔将语言视为一种基于词典和语法的数理演算。学习沃拉普克语就像在查表拼图，学习者始终在处理符号映射，而难以形成真正的“语感”。相比之下，柴门霍夫在《第二书》中的20篇文章，实质上是世界语历史上第一个“对齐数据集”。这个数据集不仅有助于语义涌现，也有益于形成柴门霍夫反复强调的“语感”，因为词汇的意义不能只靠词典，更需要它在句子中的邻居来锚定。通过重复阅读，学习者大脑中建立的是概率分布和关联模式，而不仅仅是语法规则。当学习者不再思考这些规则，而是能直接预测下一个词的出现时，语言就实现了从代码到意识的跃迁。（2）从硬性干预向预训练演化的跨越。沃拉普克语类似早期的基于规则的专家系统。这种系统非常脆弱，一旦遇到规则之外的表达就会崩溃，且学习曲线极其陡峭。世界语则类似大语言模型，虽然有基础架构，但真正的灵魂在于语料的喂养。柴门霍夫通过《第二书》和后续的大量翻译与原创作品，为世界语提供了最初的“预训练数据”。这种方法允许语言在实际使用中产生微小的“变异”和“优化”，从而获得了生命力。（3）从中心化指令向去中心化协议的转换。语言本质上是一种社会协作的协议。沃拉普克语的权力高度集中在创作者手中，规则的修改是行政命令式的，导致了社群的分裂。世界语通过《第二书》的范文，建立了一个去中心化的语义标准。因为所有早期的世界语者都“学习”过同一批高质量文本，他们在交流时即便遇到了新词，也会根据这些范文所确立的“风格”和“上下文”进行推断。这种“共识算法”使得世界语在没有任何国家强制推广的情况下，依然能保持全球范围内语义的一致性。

至此，我们不难明确：语言的生命力并非取决于其“说明书”（词典与语法书）的详尽程度，而在于它能否提供足够的语境样板，支撑社群进行大规模的自适应演化。这种从规则驱动向数据驱动的范式转移，不仅解释了世界语成功的原因，更为数智时代的语言治理提供了底层逻辑，即：真正的语言战略，其核心在于语境的动态释放与社群的话语赋权，而非意义的静态规约与权力的单向垄断。

六、结　语

本研究表明，语言的生命力本质上是一种社会涌现现象。它不由单一创始人的智力边界决定，也不取决于语法结构的机械完美，而是在成千上万使用者的真实互动中逐渐淬炼而成。沃拉普克语的兴衰是一面历史的镜子，映照出中心化控制与权威垄断对语言演化的根本桎梏。这警示我们，语言规划一旦沦为封闭的专家系统，它便失去了自我更新的能力，从而难以在复杂多变的社会中生存。

世界语的跨世纪实践，本质上完成了一次从工程设计范式向生态培育范式的底层重构。创始人柴门霍夫通过放弃权利的地位规划，将语言从实验室的专利方案转化为社区共建的公共协议；通过语料驱动的模式，完成了从规则灌输向语感培养的习得转向。这一过程与当代大语言模型的智能跃迁模式呈现出惊人的同构性，二者都遵循语境先于规则、使用塑造结构（语义）的逻辑。世界语早期的社会化历程，正是一场跨越百年的“基于人类反馈的强化学习”，它证明语言规划的知识体系不应仅筑基于静态的词典条文和语法规则，更应扎根于语言社群命运共同体的呼吸之中。

这种从设计态向生命态的范式转型，为未来的语言战略提供了深刻的启示。特别是世界语通过文本语料释放语境的路径，为我们在算法时代理解智能涌现提供了历史坐标。有效的语言规划应从单纯的符号干预转向深层的生态改良：^[7]在语言保护中，不应仅满足于博物馆式的档案存证，而应通过激活日常使用让语言在生活中自愈；在国际推广中，不应仅追求标准化的指标覆盖，而应鼓励去中心化的文化共创；在数智时代，面对人类与AI共生的语义空间，政策重心应从内容管制转向机制创造，探讨如何构建让多元语言自然生长的肥沃土壤。

[7]　刘海涛（2023：64—85）指出，“从语言问题向语言生态的转向”是20世纪50年代以来语言规划学科最重要的范式变迁之一。在这本书中，“生态”与“世界语”分别出现158次与370次，这种关键词的共现并非巧合，而是映射了计划语言研究在当代语言治理与生态视域下的理论回归。

回顾这段历史，本文以第一次全球化为视阈，通过剖析计划语言社会化的兴衰细节，萃取普适的演化规律，以期实现语言规划范式的重构。这种对历史经验的实证挖掘，最终指向了语言规划知识体系的一次本体论回归，即：承认语言的生命力并非来自有意识的精密设计，而是源于社群互动的社会涌现。

理想的语言生态是构建人类命运共同体的基石。计划语言这种具备生态属性的交流工具，不仅是第一次全球化留下的未竟遗产，更是数智时代重塑人类协作体系的理论参照。尽管现实常让理想蒙尘，但推动文明前行的始终是那份“Espero”（希望）。“满怀希望的人”之所以伟大，不在于他已经到达了目的地，而在于他即使知道前路艰辛，依然选择在巴别塔的废墟上继续播种。计划语言的命运与人类的命运是同构的。在AI构建的算法银河中，这种对平等与理解的向往，依然是指引我们通往“心通”未来的恒久心灯。希望永存，因为交流不止。

本文系复旦大学“数字人文和语言计量实验室”研究成果。

该文发表于《语言战略研究》2026年第2期，参考文献从略，引用请以期刊版为准，转发请注明来源。

编排：韩畅

审稿：王飙余桂林

相关推荐

《语言战略研究》入选为CSSCI（2023—2024）来源期刊

《语言战略研究》入编《中文核心期刊要目总览》2023年版语言学类核心期刊

《语言战略研究》2026年第1期目录与提要

《语言战略研究》2026年第2期目录与提要

时隔25年首次修订！新修订的《中华人民共和国国家通用语言文字法》颁布

张日培：语言功能规划视角下的新时代语言立法

叶强：国家认同视域下的《国家通用语言文字法》修改

张振达：《国家通用语言文字法》研究的回顾与思考

何俊芳，郭亚星：当代俄罗斯的语言立法与语言关系发展

约稿启事丨“国际中文教育”专题（每年一期）

约稿启事丨“汉语哲学”专题（每年一期）

约稿启事丨“中原语言与黄河文明”专题

本刊从未与任何第三方合作从事征稿、审稿及发稿活动

从不以任何形式收取版面费、审稿费

请认准本刊官方网站界面→

编辑部联系方式

电话：010-65219062，010-65219060

电子邮箱：yyzlyj@cp.com.cn

地址：北京市东城区王府井大街36号

投稿网址：yyzlyj.cp.com.cn

订阅方式

1.全国各地邮局订阅，邮发代号：82-104.

2.网店订阅：

（1）商务印书馆官方微店 （关注商务印书馆微信公众号；点击公众号页面底部的“官方微店”；在微店中搜索“语言战略研究”即可下单）

（2）商务印书馆京东旗舰店 （登录旗舰店，搜索“语言战略研究”即可下单）

3.中国邮政—微商城（微商城中搜索“语言战略研究”，即可预订全年）

↓↓↓点击“阅读原文”可访问本刊官网

校经工作的恐慌，杜泽逊教授为本刊撰写的学人寄语，载《中国文化》2026年春季号

2026年5月25日 00:00

徐惠 2026-05-25 00:00 江苏

杜泽逊撰文感慨校经工程耗时漫长，年岁渐长恐难如期完成。

转载自“中国文化杂志社”

深研中华文化阐扬传统专学

探究学术真知重视人文关怀

校经工作的恐慌

杜泽逊

我主持的《十三经注疏汇校》，开始于2012年3月。学习清代阮元，计划利用阮元没有见到的版本，加上前人校勘成果，予以系统性增补，形成“升级版”。这一宏大计划，得到山东大学儒学高等研究院王学典院长以及院学术委员会大力支持，被立为该院重大项目，给予八十万元巨额资助。我组织了“校经处”，带领团队（主要是研究生）坐班校勘，无间寒暑，不分昼夜。经过十四年努力，完成了《尚书注疏汇校》《周易注疏汇校》《毛诗注疏汇校》三部，《礼记注疏汇校》马上进入后期汇总阶段。《尚书注疏汇校》九册，中华书局出版后，获得山东省特等奖，教育部一等奖，这是中国文科科研成果最高荣誉。《毛诗注疏汇校》篇幅很大，我需要逐字逐句最后定稿。可是担任山大文学院院长近六年，除了必须的教学、指导研究生、主持几个科研项目正常运转之外，几乎没有任何时间用来为《毛诗注疏汇校》定稿。2023年底文学院院长卸任，接任《文史哲》主编，本应腾出一点时间，可是各种会议、讲学、评审，越来越多，《毛诗注疏汇校》又搁置两年，几次试着拿起来，旋即放下。今年春节后，下大决心拿起来，零零星星看完了卷一之一到卷一之四，四个子卷。第四个子卷我记录了起止日期，正好一个月。《毛诗注疏》共七十个子卷，就算坚持不放，也要70个月。我已63岁，70个月大约六年，就69岁。正式出版就要70岁开外了。《礼记注疏汇校》目前就要进入汇集阶段，它的篇幅和《毛诗注疏汇校》差不多，究竟还有多少精力去定稿呢？就目前看，我的宏大计划难以如愿。我为什么恐慌，“子在川上曰：逝者如斯夫！”我要从忙乱中安静下来，下定决心学会说“不”。

2026年4月30日于山东大学校经处

【杜泽逊山东大学讲席教授】

中国艺术研究院主办刘梦溪主编

欢迎订阅 中国文化 大型学术期刊

每年推出春季号、秋季号两期，每期50万字

社址：北京市朝阳区来广营西路81号

邮政编码：100012 电话：010-64813408

电邮：culture@china.com

国际标准刊号：ISSN 1003-0190

国内统一刊号：CN 11-2603/G2

邮发代号：80-617 国外发行代号：8006 SA

全国各地邮局均可订阅

定价：人民币50元港币50元新台币260元

比特人文

投稿邮箱：dhbase@126.com

扫码关注获取更多资讯

10 - 武汉大学文化遗产公众号

博士生论坛第六十一期 | 相似评论的相邻与分散展示策略：邻近内容相似性对信息价值感知与销售绩效的影响

2026年5月24日 14:18

2026-05-24 14:18 湖北

基于三个平台、四类场景（酒店、餐馆、游戏和消费品）的海量评论数据及收入数据，研究结合深度学习文本分析、计量因果推断与两项在线实验，系统考察邻近内容相似性对用户信息价值感知和销售绩效的影响。

👆👆👆点击蓝字 · 关注我们

摘要：在信息过载背景下，如何在用户有限的阅读范围内呈现真正有助于决策的信息，已成为在线评论平台设计的重要问题。尽管现有平台已采用排序、筛选与推荐等机制为用户呈现相关信息，但这些机制主要关注单条评论特征，较少考虑评论之间的内容关系。本文聚焦内容相似评论的展示策略，探讨平台应将内容相似的评论相邻展示以形成相互印证，还是分散展示以减少信息冗余。为此，本文引入“邻近内容相似性”构念，刻画用户顺序浏览过程中邻近评论之间的语义重叠程度。基于三个平台、四类场景（酒店、餐馆、游戏和消费品）的海量评论数据及收入数据，研究结合深度学习文本分析、计量因果推断与两项在线实验，系统考察邻近内容相似性对用户信息价值感知和销售绩效的影响。研究为平台基于内容相似性优化评论展示机制以及用户生成内容激励机制提供理论与实证依据。

跨学科合作方向：本文以数字化平台用户生成内容为研究对象，以缓解信息过载、提升用户决策质量和优化平台信息组织为目标，融合信息系统、消费者行为、数字营销与计算社会科学等多学科视角。通过深度学习文本分析、计量因果推断与在线实验相结合的方法，揭示平台内容相似评论展示策略对用户信息价值感知和销售绩效的影响，旨在为平台排序算法优化、用户生成内容治理和平台价值创造提供理论依据与实践启示。

主讲人王佳雯

武汉大学经济与管理学院博士研究生

时间

2026 年 5 月 29 日 11:30-12:30

地点

人文社科楼 B305 会议室

腾讯会议：775-6968-3346

主办单位

武汉大学文化遗产智能计算实验室（教育部哲学社会科学实验室）

武汉大学大数据研究院

线下参会报名表

欢迎参与

编辑 | 文化遗产智能计算实验室

审校 | 刘争

武汉大学人文社科楼

Hinton 最新表态：AI 的下一个数据源，可能根本不在互联网上！

2026年5月24日 00:00

图灵硅硅 2026-05-24 00:00 江苏

以下文章来源于：林叔说事

林叔说事

聚焦热点，深度解析，用心讲述每一个故事

Hinton 最新表态：AI 的下一个数据源，可能根本不在互联网上！

导读
【导读】深度学习教父 Geoffrey Hinton 近日在一段视频中直言：AI 未必被人类数据锁死。AlphaZero 靠自我博弈创造了无限训练数据，数学也是同理——他相信大语言模型最终也会走上这条路。从 AlphaGo Zero 以 100:0 碾压前代冠军，到 AlphaProof 拿下 IMO 银牌，DeepMind 已经反复证明：不靠人类数据，AI 照样能变强。但 LLM 能复制这个奇迹吗？关键卡在一个东西上：验证器。

「它们可以生成无限数据，不需要任何外部输入」

最近，X 用户 Haider（@haider1）发布了一段约 42 秒的 Hinton 视频片段。

在这段视频中，这位图灵奖得主、深度学习教父直接点明了一个很多人一直在回避的问题：AI 继续变强，到底还需不需要人类数据？

Hinton 的回答很干脆。他以 AlphaGo 和 AlphaZero 为例：

"If you look around for what AI systems don't have any problems with data limits, one example is AlphaGo, Alpha0, where they're playing games."

「如果你看看哪些 AI 系统不受数据上限困扰，一个例子就是 AlphaGo、AlphaZero——它们在下棋。」

"They play against themselves… they can generate infinite amounts of data. They don't need any external data put in."

「它们和自己对弈……可以生成无限量数据，不需要外部输入。」

Haider 发布的 Hinton 视频片段（分段1） Haider 发布的 Hinton 视频片段（分段2）

▲ Haider（@haider1）在 X 上发布的 Hinton 视频片段

然后他把话题引向数学：

"Mathematics is kind of a closed system. You can make conjectures, see if you can prove them… with no external input of data."

「数学某种程度上是一个闭合系统。你可以提出猜想，尝试证明……不需要外部数据输入。」

最后，他给出了自己的判断：

"Those kinds of systems can run all the time and get smarter and smarter. And I believe that's going to happen with large language models eventually."

「这类系统可以一直运行，越来越聪明。我相信大语言模型最终也会如此。」

42 秒，Hinton 画了一条清晰的路线图：从棋类的自我博弈，到数学的闭环验证，最终指向 LLM 的未来。

AlphaGo Zero：100 比 0 碾压前代，全程零人类数据

Hinton 提到的第一个例子，已经被 DeepMind 用论文和实验反复验证。

2017 年，DeepMind 在 Nature 上发表了 AlphaGo Zero。这个系统和之前的 AlphaGo 有一个根本区别：它完全不用人类棋谱。

论文摘要写得明明白白：

"An algorithm based solely on reinforcement learning, without human data, guidance or domain knowledge beyond game rules."

「仅基于强化学习，不使用人类数据、指导或游戏规则之外的领域知识。」

结果？从白纸开始的 AlphaGo Zero，以 100:0 的比分击败了之前战胜世界冠军的 AlphaGo。

▲ Nature 论文《Mastering the game of Go without human knowledge》

论文里还有一处值得注意：

"AlphaGo becomes its own teacher."

「AlphaGo 成为了它自己的老师。」

一年后，DeepMind 把这套逻辑推广到了更多棋类。AlphaZero 作为一个单一系统，从零开始学会了国际象棋、将棋和围棋：

"An untrained neural network plays millions of games against itself via a process of trial and error called reinforcement learning."

「一个未经训练的神经网络通过与自己进行数百万局对弈，用试错式强化学习来学习。」

▲ Google DeepMind AlphaZero 官方博客

这里的核心在于：棋盘环境规则明确，胜负可判定，系统可以无限生成对弈数据。人类棋谱反而成了束缚——AlphaZero 不用人类棋谱，意味着它不被人类惯例所限制。

数学：下一个被攻破的闭合系统

如果说棋类是 Hinton 类比的起点，那数学就是他指向的下一站。

2024 年 1 月，DeepMind 发布了 AlphaGeometry，专攻几何问题。这个系统面临的核心挑战和 AlphaGo 当年一样：训练数据不够。

DeepMind 的解法同样激进——自己造数据：

"By developing a method to generate a vast pool of synthetic training data - 100 million unique examples - we can train AlphaGeometry without any human demonstrations, sidestepping the data bottleneck."

「通过开发一种生成海量合成训练数据的方法——1 亿个独特样例——我们可以在不用任何人类演示的情况下训练 AlphaGeometry，从而绕开数据瓶颈。」

▲ Google DeepMind AlphaGeometry 官方博客

1 亿个合成样例，零人类演示。数据瓶颈就这样被绕过去了。

但 AlphaGeometry 的突破点在于它的架构：神经语言模型负责"直觉"，符号推理引擎负责"检验"。生成的每一步推导，都要经过形式逻辑的审核。

半年后，DeepMind 更进一步。2024 年 7 月，AlphaProof 亮相，直接挑战国际数学奥林匹克（IMO）——6 道题做出 4 道，达到银牌水平。

"AlphaProof is a system that trains itself to prove mathematical statements in the formal language Lean."

「AlphaProof 在 Lean 形式语言中训练自己证明数学命题。」

▲ Google DeepMind AlphaProof 在 IMO 中达到银牌水平

AlphaProof 的路线非常清晰：预训练语言模型 + AlphaZero 式强化学习 + Lean 形式化验证。模型提出证明，Lean 检查对不对。对了就强化，错了就调整。

DeepMind 在博客中点出了关键：

"Formal languages offer the critical advantage that proofs involving mathematical reasoning can be formally verified for correctness."

「形式语言的关键优势在于：涉及数学推理的证明可以被形式化地验证其正确性。」

这就是 Hinton 说"数学是闭合系统"的底层逻辑：有了形式化验证器，模型的输出可以被机器自动判定对错。和棋盘上的胜负判定如出一辙。

验证器：这条路线的真正门槛

Hinton 的判断在社区里引发了明显分歧。

支持者认为，一旦模型能自己生成并验证数据，scaling 就不再依赖互联网文本。有开发者总结得很到位：

"For LLMs the missing piece is strong verifiers: math, code, simulators."

「对 LLM 来说，缺少的就是强验证器：数学、代码、模拟器。」

但边界也同样明显。

有人指出，数学和棋类共享一个多数真实世界任务不具备的东西：内置的验证函数。棋有规则和胜负；形式化数学有 proof checker。但现实世界的政策制定、商业决策、社交互动、科学实验——没有这么便宜、准确、即时的反馈函数。

还有人提出了更尖锐的问题：模型能无限生成真命题，但真命题和有价值的命题之间隔着巨大鸿沟。系统可以产出十亿个正确的定理，其中可能没有一个有趣——方向感、研究价值、创新性，这些仍然需要外部评价标准。

更根本的质疑在于：AlphaGeometry、AlphaProof 都是高度专用的系统，配备了符号推理引擎、形式语言和精心设计的强化学习流程。从这类专用系统到通用聊天 LLM，中间的鸿沟远比表面上看起来大得多。

合成数据本身不难生成，难的是判断这些数据到底在提升推理能力，还是在强化错误。

从棋盘到 LLM：一条看得见但还没走通的路

把 Hinton 的 42 秒视频放回更大的时间线里：

2017 年，AlphaGo Zero 证明了在规则明确的棋盘上，纯自我博弈可以达到超人水平，完全不需要人类数据。

2024 年，AlphaGeometry 和 AlphaProof 证明了在形式化数学中，合成数据 + 强化学习 + 形式验证器的组合同样能突破数据瓶颈，拿下 IMO 银牌。

现在，Hinton 把这条线延伸到了 LLM，说他相信"大语言模型最终也会发生同样的事"。

这个判断的分量在于，它背后有实打实的技术验证。但它的边界也同样清楚：每一次成功突破，都发生在有强验证器的闭合环境里。

LLM 要走通这条路，核心在于能否把代码执行、数学证明、物理仿真、工具调用变成可靠的反馈信号。多抓几 TB 网页文本，解决不了这个问题。

AI 的下一个数据源，可能真的不在互联网上。但它也不会凭空出现——它需要被构建出来。

— END —

18 - 中山大学数字人文联合研究院

转载 | 观澜·驻访学者沙龙（第16期）：“沟通、照护与制度：医学人文的跨学科实践”

2026年5月23日 08:55

2026-05-23 08:55 广东

本次工作坊将围绕“临床医学人文课程的教学创新”“安宁疗护的政策落地”“养老照护中的沟通与身份建构”三大议题展开深入讨论。我们希望借此打破学科壁垒，汇聚医学、人文、社科等领域的研究者与实践者，共同推动医学走向更具理解力、温度与尊严的未来。

编者按

为进一步营造深圳校区浓郁的人文学术氛围，人文社会科学研究院（以下简称“文研院”）策划推出“观澜”系列学术活动，旨在搭建开放、前沿的学术交流空间，更好地展现人文社科领域的思想碰撞，促进学科交融。

“观澜”取义，既在方法与视野，又在境界与格局。“观澜”系列学术活动将由文研院携校内驻访学者在深圳校区组织开展，包括学术沙龙、专题讲座、雅集等丰富多样的形式。我们诚挚邀请校内外师生持续关注，积极参与，在“观澜”中共同见证思想的交汇与新生。

下面推出的是“观澜·驻访学者沙龙”专栏第16期——沟通、照护与制度：医学人文的跨学科实践。

01 研讨初衷

在现代医学从“生物模式”向“生物-心理-社会模式”转型的进程中，沟通与照护日益成为医学人文实践的核心议题。如何通过语言建构照护关系？如何在教学中涵养人文底色？如何将研究转化为制度善意？这些问题呼唤语言学、社会学、护理学、哲学与医学的深度对话。为此，中山大学人文社会科学研究院联合中山大学人文学部、中山大学医学人文联合研究院共同举办本期工作坊，旨在搭建跨学科交流平台，探索医学人文从理念走向行动的多元路径。

沟通是照护实践的基本载体。在机构养老等长期照护情境中，护理人员与老年人之间的语言互动不仅传递信息，更在细微处建构着双方的身份认同与社会角色。语用学与话语分析为我们审视医患/护患沟通中的互动形式、权力关系与参与机制提供了理论工具，使“沟通”从日常行为上升为可分析、可优化的专业实践。

与此同时，医学人文教育正面临从“知”到“行”的转化挑战。如何让叙事医学、沟通技巧、伦理反思不再停留于课堂讲授，而是内化为医学生的专业素养？如何通过教学创新，培养既有技术理性、又具人文温度的临床实践者？这些追问推动着课程改革者不断探索新的教学范式。

而从临床实践到政策设计，医学人文的关怀精神需要制度的承载。以普惠性安宁疗护为例，社会科学研究如何识别患者与家属的真实需求，如何评估政策落地的现实障碍，如何为制度建构提供实证支撑，是医学人文走向社会实践的关键一环。

本次工作坊将围绕“临床医学人文课程的教学创新”“安宁疗护的政策落地”“养老照护中的沟通与身份建构”三大议题展开深入讨论。我们希望借此打破学科壁垒，汇聚医学、人文、社科等领域的研究者与实践者，共同推动医学走向更具理解力、温度与尊严的未来。

02 会议信息

会议时间：5月26日（星期二）15:00

会议地点：深圳校区文学园5栋103致用·观澜学术会议室

召集人：徐翌茹

中山大学外国语学院教授、人文社会科学研究院2026年春季学期校内驻访学者

主办单位：

中山大学人文社会科学研究院

中山大学人文学部

中山大学医学人文联合研究院

03 会议议程

开幕式主持人：徐翌茹

圆桌论坛一

《临床医学与医学人文导论》课程教学创新与实践

主讲人：

张昆松中山大学附属第一医院

评议人：

林琳中山大学附属第六医院
郭聪中山大学国际翻译学院

圆桌论坛二社会科学研究与政策落地——以普惠性安宁疗护建设为例

主讲人：

程瑜中山医学院

评议人：

夏薇中山大学护理学院
王楠中山大学政治与公共事务管理学院

圆桌论坛三机构养老照护沟通：互动形式、身份建构与社会参与

主讲人：

郭薇薇法国里昂二大

评议人：

易利中山大学外国语学院
符隆文中山大学附属第七医院

与谈嘉宾

曹家启中山大学历史学系
周国梅中山大学心理学系
李艳红中山大学新闻传播学院
李珍中山大学马克思主义学院
周殷华中山大学附属第七医院
李智中山大学历史学系
叶芬广州中医药大学

END

内容来源：中山大学人文社会科学研究院

编辑：陈旖旎

初审：蔡一峰

复审：林耿、陈诗诗

审定发布：张伟

http://cips-cl.org/static/CCL2026/index.html

即将截稿 | 第二十五届中国计算语言学大会（CCL 2026）征稿启事

2026年5月23日 00:00

CCL 2026 2026-05-23 00:00 江苏

第二十五届中国计算语言学大会（CCL2026）10月宜昌举办，现即将截稿。

转载自“中国中文信息学会”

第二十五届中国计算语言学大会（The 25th China National Conference on Computational Linguistics, CCL 2026）将于2026年10月15至18日在湖北省宜昌市举行。中国计算语言学大会创办于1991年，由中国中文信息学会计算语言学专业委员会主办。经过30余年的发展，中国计算语言学大会已成为国内自然语言处理领域权威性最高、规模和影响最大的学术会议。作为中国中文信息学会（国内一级学会）的旗舰会议，CCL 聚焦于中国境内各类语言的智能计算和信息处理，为研讨和传播计算语言学最新学术和技术成果提供了最广泛的高层次交流平台。

会议网站：

论文主题：

CCL 2026征集计算语言学方面的原创研究和应用论文。论文包括但不限于以下内容：

语言研究的本体理论、认知模型和心理加工机制
语言资源和评测
语义学和词汇本体论
语言结构分析、语用学（含词法、句法、语义等结构）
信息检索、信息抽取与知识图谱
机器翻译和多语言/资源缺乏语言信息处理
问答系统、人机对话系统
社会计算、社交媒体计算、情感计算
语音与多模态信息处理
大语言模型与智能体
大语言模型安全、价值观与对齐
自然语言处理应用

时间表：

投稿系统开放：2026 年 5 月 10 日

论文投稿截止日期：2026 年 6 月 6 日

录用通知发出日期：2026 年 7 月 31 日

论文终版提交日期：2026 年 8 月 16 日

会议日期：2026 年 10 月 15-18 日

论文投稿：

CCL 2026 接受中文与英文投稿。所有录用论文将在会议上以口头报告或海报形式进行交流。其中，录用的英文论文将全部发表在中科院二区期刊 Data Intelligence（作者需负担Open Access费用）；中文论文将推荐至《中文信息学报》（入选中国计算机学会《计算领域高质量科技期刊分级目录》T1 类）等中国科技核心期刊（依据中国科学技术信息研究所目录），经期刊审稿通过后正式发表。

论文格式要求：

会议投稿系统由 Data Intelligence 期刊提供技术支持。请使用会议指定的 LaTeX 模板，并以 PDF 格式提交。正文篇幅不超过 10 页，包含参考文献页数不超过15页。本次会议实行双盲评审，投稿论文中不得出现作者姓名、单位及其他可识别信息，作者自引需采用第三方形式（如"作者 XX 提出…"）。未满足格式和匿名要求的论文将不经完整审稿程序而直接拒稿。

论文模板下载：

英文论文模板（Data Intelligence 格式）：http://cips-cl.org/static/CCL2026/templates/ccl2026_english_template.zip
中文论文模板（IEEE 单栏格式）：http://cips-cl.org/static/CCL2026/templates/ccl2026_chinese_template.zip

所有稿件须通过 Data Intelligence 投稿系统以 PDF 格式提交，系统链接即将公布。

关于平行投稿政策：

本次会议允许作者将同一稿件同步投稿至其他自然语言处理领域的国际顶级会议，前提是该会议亦允许平行投稿。投稿时，作者须明确标注该稿件同时投往的相关会议。收到录用通知后，作者须在最终版本提交截止日期前告知程序委员会是否在本会议发表。一旦确认发表，必须撤回其他会议中的同一稿件。本会议不接受任何已公开发表或与之高度重合的稿件。

关于出版费用：

Data Intelligence 期刊出版费用（英文论文）：

Data Intelligence期刊为Open Access期刊，所有被接受和拟发表论文均收取一次性版面费（Article Processing Charge, APC）。版面费根据论文的最终排版长度（即印刷版或最终在线 PDF 版的页码）进行计算。论文长度包括标题、作者信息、摘要、正文、图表、参考文献及附录等所有组成部分。

类别	页数	版面费 (APC)
基础收费	10 页及以内（含10页）	人民币 8,000 元
超页收费	超过10页（11-15页，含15页）	人民币 10,000 元

中文期刊出版费用：

根据各推荐中文期刊具体要求执行。

新书推荐丨《数字人文引论》：全面呈现数字人文“新理念、新领域、新方法、新设施”

2026年5月23日 08:30

2026-05-23 08:30 湖北

《数字人文引论》

作者：李飞跃、桑海主编

出版社：中华书局

书号：978-7-101-17674-2

出版时间：2026年4月

字数：454千字

定价：92.00

/ 内容简介 /

《数字人文引论》以“新理念、新领域、新方法、新设施”为总体框架，系统阐释数字时代人文研究的范式跃迁。全书围绕大模型与人文研究、数字史学、数字文献学等领域核心议题展开，深入探讨自然语言处理、主题模型、网络文本分析等技术方法，并对数字基础设施建设、数字媒介发展、知识范式变革及海外数字人文前沿动态进行全面论述，为理解数字时代人文研究的转型路径与未来发展提供系统而清晰的指引。

/ 作者介绍 /

主编

李飞跃，清华大学人文学院长聘教授、博士生导师，北京大学文学博士。兼任清华大学和中华书局《数字人文》、中国人民大学《数字人文研究》编委，中国索引学会数字人文专业委员会委员、中国古籍保护协会古籍整理与开发专业委员会委员等。主要从事诗歌文献、音乐文学与数字人文研究，开设“数字人文”“诗词曲经典研读”等本科课程、“诗歌文献的跨学科研究”等研究生课程。在《中国社会科学》、EMNLP等发表论文60多篇，主持国家社科基金重点项目等数项，曾获教育部高等学校科学研究优秀成果奖、清华大学教学成果奖一等奖等。

桑海，清华大学文学博士，《澳门理工学报》编辑、《数字人文》副主编。主要从事文艺理论、新媒体、数字传播研究，在《文史哲》《南京大学学报》《清华大学学报》《人民日报》等报刊发表多篇论文或评论。

作者团队

作者团队由清华大学、北京大学等十余所国内知名高校及科研机构的19位数字人文专家组成。他们在数字人文领域深耕多年，兼具理论深度与技术应用，并且长期从事一线的科研与教学工作。

（按章节先后顺序排列）

刘石/ 清华大学人文学院

李飞跃/ 清华大学人文学院

孙茂松/ 清华大学计算机科学与技术系

孔存良/ 清华大学计算机科学与技术系

梁晨/ 南京大学历史学院

李林芳/ 北京大学中国语言文学系

许可/ 华东师范大学中国语言文学系

邱伟云/ 南京大学历史学院暨学衡研究院

左家莉/ 江西师范大学人工智能学院

张辰麟/ 昆明学院人文学院、教育部语言文字应用研究所

胡韧奋/ 北京师范大学国际中文教育学院数字人文系

苏祺/ 北京大学外国语学院、北京大学人工智能研究院

赵薇/ 中国社会科学院文学研究所

唐宸/ 清华大学人文学院

姜文涛/浙江大学国际联合学院

饶高琦/ 北京语言大学国际中文教育研究院

李斌/ 南京师范大学文学院语言大数据与计算人文研究中心、澳门大学人文学院

桑海/ 澳门理工大学《澳门理工学报》编辑部

肖爽/ 清华大学人文学院

/ 编辑推荐语 /

“清华数字人文丛书”中的第一本教材，以“四新”为框架，理论与研究成果相结合，全面阐述数字人文领域的主要研究方向。

目录

《数字人文引论》

试读

《数字人文引论》

END

转自“数字人文专业发展联盟”

已获转载授权

https://culturalanalytics.org/

5 - 武汉大学数字人文公众号

学术前沿 | 文化分析学刊(Journal of Cultural Analytics，JAC)介绍及论文荐读

2026年5月23日 08:30

2026-05-23 08:30 湖北

《文化分析学刊》（Journal of Cultural Analytics，简称 JCA）由普林斯顿大学数字人文中心出版，这是一份倡导开放获取的学术期刊，致力于发表计算方法在文化研究领域的前沿应用成果。该刊聚焦于人文学科、社会科学与计算机科学的交叉融合，探讨如何运用数字技术分析文化文本、历史文献、视觉艺术以及声音档案等多元文化样态。该刊特别鼓励具有全球视野、跨学科方法以及多语言、多文化背景的研究，推动计算人文学科的发展，并促进学界对文化数据化时代的新认识。

核心主题：

计算与量化方法能否为我们理解数据化时代提供新的视角？
如何在数据驱动的研究和分析实践构建理论？计算方法不应也不能替代严谨的研究方法论思考。
人文学者能否在计算方法的标准化以及数据的文化语境化过程中发挥核心作用？
如何融合批判性数据研究、批判性档案研究、计算人文学科与传统人文学术方法？

栏目设置：

论文（Articles）：发表经过同行评审的学术研究。
数据论文（Data Essays）：刊发经过同行评审的数据论文，并附上与文化研究相关的精选数据集。
专题特写（Special Features）：刊发更简短、更具时效性的文章，介入文化的计算分析议题，行文风格通俗易懂，面向非专业读者。这些短篇文章可以集体提交（例如围绕特定主题的圆桌讨论或专题集群），也可以采用“致编辑信”或评论文章的形式，亦或是旨在开启关于新方法、新数据集或新文章讨论的独立文章。

此外，期刊提供专题研究（Thematic Clusters），可按关键词进行检索，并接受特刊（Special Issues）的提案。

本期内容将选取《文化分析学刊》近两年间与数字人文相关的10篇论文进行介绍。

作为关系数据的书目元数据：一项跨学科方法论反思

Bibliographic metadata as relational data: A cross-disciplinary methodological reflection

Rossana Scebba

摘要：本文中反思了在数字/计算史学与定量经济史研究中，将书目元数据作为经验材料使用这一日益增长的跨学科共识。结合两个领域的实例，概述了预处理图书馆目录元数据的主要挑战。以旧鲁汶大学学术藏书为试点案例，展示了数据转换与准备的关键步骤，旨在协调通用流程并创建跨学科可复用资源。随后探讨了元数据如何应用于历史网络分析，讨论了其基本前提、潜在陷阱及关键建模决策。基于此分析，提出将多层网络表示作为表征书目元数据的结构忠实基础。最后，通过与定量经济史实践的比较，该文展示了采用假设驱动建模和统计推断如何回应学界对数字方法的质疑，从而推动数字史学的计算发展。

关键词：书目数据科学，数字史学，经济史，网络分析，多层网络

Abstract：In this paper, I reflect on the growing cross-disciplinary convergence around the use of bibliographic metadata as empirical material in digital/computational history and quantitative economic history. I outline the main challenges in preprocessing library catalog metadata, drawing on examples from both fields. A pilot case on the academic collection of the Old University of Louvain demonstrates key steps in data transformation and preparation, with the aim of aligning common routines and creating reusable resources across disciplines. I then examine how metadata can be applied in historical network analysis, discussing underlying premises, potential caveats, and key modeling decisions. Based on this examination, I propose a multilayer network representation as a structurally faithful base to represent bibliographic metadata. Finally, by drawing a comparison to practices in quantitative economic history, I show how adopting hypothesis-driven modeling and statistical inference can address skepticism toward digital approaches and thereby advance the computational development of digital history.

Keywords: bibliographic data science, digital history, economic history, network analysis, multilayer networks

图：地图显示了低地国家及周边地区每五十年间隔的印刷中心。气泡面积与每个城市相关的“旧藏学术藏书”中的印刷藏品数量成正比。历史边界随时间变化，数据来源于《世纪历史地图集》。

Figure：The maps show printing centers in the Low Countries and surroundings at fifty-year intervals. Bubble area is proportional to the number of printed holdings from the Collectio academica antiqua associated with each city. Historical boundaries are time-varying and drawn from the Centennia Historical Atlas.

微调史学家的宏观镜：Neo4j 中的中世纪韩国传记数据重用

Fine-Tuning the Historian's Macroscope: Data Reuse and Medieval Korean Biographical Records in Neo4j

Javier Cha

摘要：本文探讨了史学家“宏观镜”（macroscope）的开发与应用——这是一个基于 Neo4j 的计算框架，能够对中世纪韩国传记记录进行多尺度探索。虽然数字化极大地扩展了历史资料的获取渠道，但现有方法论难以在整合大型异构数据集的同时，保持阐释的严谨性与语境特异性。本研究展示了图数据库模型如何通过动态追踪庇护网络和亲属网络来增强历史探究。与通常会在个体细节与宏观结构模式之间造成生硬割裂的传统网络可视化工具不同，Neo4j 能够在不同分析层次之间实现无缝切换。本文阐述“宏观镜”如何帮助史学家发现被遮蔽的关系、优化分析焦点并生成新的研究问题。更广泛地，本文强调数字史学需要发展超越大规模可视化、能够批判性介入历史资料复杂性的方法论。

关键词：数字史学，韩国史，中世纪史，Neo4j，集体传记学，图数据库，宏观镜，数据重用

Abstract：This article explores the development and application of a historian’s macroscope, a computational framework that enables multiscalar exploration of medieval Korean biographical records using Neo4j. While digitization has greatly expanded access to historical sources, existing methodologies struggle to integrate large, heterogeneous datasets while maintaining interpretive rigor and contextual specificity. This research demonstrates how a graph database model enhances historical inquiry by enabling the dynamic traversing of patronage and kinship networks. Unlike conventional network visualization tools, which often impose a rigid divide between individual detail and macrostructural patterns, Neo4j facilitates seamless transitions across different levels of analysis. This discussion illustrates how the macroscope helps historians uncover obscured relationships, refine analytical focus, and generate new research questions. More broadly, it highlights the need for methodologies in digital history that move beyond large-scale visualization to critically engage with the complexities of historical sources.

Keywords:digital history, korean history, medieval history, neo4j, prosopography, graph database, macroscope, data reuse

图：截图显示了1469年与1589年功勋人物之间跨越两个节点距离的所有链接，通过类别节点进行分解以生成简化视图。

Figure：The screenshot shows all the links between merit subjects of 1469 and 1589 spanning two node distances, decomposed using category nodes to produce a simplified view.

量化古希腊罗马经典在现代早期英国的存在

Quantifying the Presence of Ancient Greek and Latin Classics in Early Modern Britain

Margherita Fantoli，Jukka Suomela，Toon Van Hal，Mark Depauw，Lari Virkki，Mikko Tolonen

摘要：本文探讨了在手摇印刷机时代（1470年代至1790年代）古典作品在现代早期英国的接受情况。研究考察了经典形成、知识传播以及数字档案在定量书籍史中的整合。研究通过量化方式描绘了古典经典在不同时期被认知的变化，提供了“变动中的经典”的全景视图。分析基于三个数据档案：《英文短标题目录》（ESTC）、《早期英文图书在线》（EEBO）和《十八世纪作品在线》（ECCO）。我们得出结论：可以观察到现代早期英格兰印刷的古典作者群体经历了一个“经典化”过程，这体现在出版物的多样性显著丧失，尽管古典作品的出版总量总体增加。偏好也发生了变化：古代希腊作者在18世纪获得了显著更多的空间。然而，这一发现需要与另一个观察相平衡：这一时期古希腊语原版著作的流通量并未增加。这种多维方法有助于全面理解古典学在现代早期英国的接受情况，并揭示文化和智识的转型。

关键词：古典学，现代早期英国，元数据，手摇印刷机

Abstract：This paper explores the reception of classical works in Early Modern Britain during the hand press era, between the 1470s and 1790s. It investigates canon formation, knowledge transmission, and the integration of digital archives in quantitative book history. The study quantitatively maps changing perceptions of the classical canon across time, offering a panoramic view of 'shifting canons'. The analysis is based on three data archives: the English Short Title Catalogue (ESTC), Early English Books Online (EEBO), and Eighteenth Century Collections Online (ECCO). We conclude that we can observe a “canonization” of the set of classical authors printed in Early Modern England, which is reflected in a significant loss of diversity in publications, despite a general increase of the publication of classical works. Preferences also shift, with ancient Greek authors of the early centuries gaining significantly more space in the 18th century. This finding however is balanced by the observation that the circulation of Ancient Greek editions in the original language does not increase during this time. This multidimensional approach contributes to a comprehensive understanding of the reception of Classics in Early Modern Britain, shedding light on cultural and intellectual transformations.

Keywords:Classics, Early Modern Britain, Metadata, Hand press

图：从17世纪到18世纪，28位最频繁出现的作者（蓝线）与其他作者（红线）的版本预测。点表示每十年间印刷最多的20位作者（蓝色）和其他作者（黄色）的实际计数。

Figure：Prediction of the editions of 28 most frequent authors (blue line) vs the rest of the authors (red line) from the 17th to the 18th century. The dots represent the real counts per decade of the 20 most printed authors (blue) and the others (yellow).

超越计算形式主义，或架构的重要性

Beyond Computational Formalism or, Architecture Matters

James E. Dobson

摘要：本文指出，尽管计算文学研究（CLS）常常宣称奉行形式主义方法论，但它并未充分重视其使用的计算模型——尤其是深度学习神经网络——形式化架构的重要性。针对学界倾向于对神经网络的运作进行流于表面的抽象概括、或将注意力过分集中在输出结果上的倾向，本文提出：架构不仅是技术细节，更是意义生成与历史性得以铭刻的关键场所。通过考察神经网络架构的谱系——从 Frank Rosenblatt 的感知机到当代基于 Transformer 的模型——本文展示了这些架构如何从物质性层面塑造机器学习模型的能力、输出结果和阐释可能性。

关键词：神经网络，形式主义，机器学习，人工智能，计算文学研究

Abstract：Despite frequently avowed commitments to formalist methodologies, computational literary studies (CLS) has insufficiently accounted for the importance of the formal architectures of the computational models it employs—particularly deep learning neural networks. Arguing against the tendency to treat neural networks with an abstract gloss of their operation or to focus attention on the outputs, this article posits that architecture is not merely a technical detail but a crucial site where meaning is made and historicity registered. By examining the genealogy of neural network architectures—from Frank Rosenblatt’s Perceptron to contemporary transformer-based models—this article demonstrates how these architectures materially shape the capacities, outputs, and interpretive possibilities of machine learning models.

Keywords:neural networks, formalism, machine learning, artificial intelligence, computational literary studies

生成美学：论AI诗歌中的形式僵化

Generative Aesthetics: On formal stuckness in AI verse

Ryan Heuser

摘要：本文通过一系列计算实验，考察了AI生成诗歌的形式与美学模式。通过对韵律和节奏的分析，揭示了大语言模型在其输出中表现出一种顽固的形式固着。本文证明，大语言模型往往使诗歌形式僵死，它们生成的文本在形式上趋于保守，甚至比文学史上形式最严格的时期更刻板地遵循传统诗歌惯例。本文将这一发现解释为一种追求理想化形态的计算逻辑——这种逻辑将满足形式期待置于对期待的巧妙挫败之上，将规则性置于变化之上，将趋同置于矛盾之上。本文提出“生成形式主义”作为一个批评框架，该框架扩展了传统以及量化和形式主义方法，用以理解生成系统如何处理、扁平化并物化文化生产。

关键词：人工智能，数字人文，批评理论，诗律学与诗学

Abstract：This paper examines the formal and aesthetic patterns of AI-generated poems through a series of computational experiments. Through analyses of rhyme and rhythm, it reveals how large language models (LLMs) exhibit a stubborn, formal stuckness in their outputs. The paper demonstrates that LLMs often ossify poetic forms by producing formally conservative texts that adhere more rigidly to traditional poetic conventions than even the most formally strict periods of literary history. The paper interprets these findings as evidence of a computational logic of idealization that privileges the satisfaction of formal expectation over its artful frustration, regularity over variation, and conformity over contradiction. It proposes “generative formalism” as a critical framework that extends traditional as well as quantitative and formalist methods to understand how generative systems process, flatten, and reify cultural production.

Keywords:artificial intelligence, digital humanities, critical theory, prosody and poetics

图：Chadwyck-Healey 语料库中押韵诗歌的频率与 LLM 生成诗歌的比较。生成模型被提示生成三种类型的诗歌：押韵诗、不押韵诗以及未指定是否押韵的诗。点表示平均概率；点的大小表示每个数据点对应的诗歌数量；须线表示标准误差。

Figure：Frequency of rhymed poems in the Chadwyck-Healey corpora compared with LLM-generated verse. Generative models were prompted for three types of poems: rhyming poems, unrhyming poems, and poems without specifying whether to rhyme. Points indicate mean likelihood; size indicates the number of poems per data point; whiskers show standard error.

情感的拉锯战：1967–2023 年中文流行歌词中情感周期的测量与建模

Tug-of-War of Emotion: Measuring and Modeling Sentiment Cycles in Chinese-Language Pop Song Lyrics, 1967-2023

Xiaolu Wang

摘要：流行音乐学者通常认为，流行歌词情感的趋势（随时间变得更积极或更消极）会“镜像”反映听众偏好或社会精神风貌的变化。例如，英文流行歌词中检测到的单调递减趋势通常被解读为“反映了”听众群体情感和精神状态的恶化，以及/或者对更消极（或更不积极）歌词偏好的增长。本研究通过提出一种替代性的“均衡解释”来挑战这种“镜像解释”。均衡解释认为，听众的平均情感偏好可能在几十年间保持大体稳定，而均衡过程要么使流行歌词的情感趋同于听众偏好，要么使歌词情感围绕听众偏好波动。为探索这一替代性解释，本研究测量并对超过26万首中文流行歌曲（1967-2023）的歌词情感运动进行了建模。为量化大量歌词的情感，本文开发了一种结合大语言模型和基于词典的情感分析的新方法，用以提取歌词中的情感信息。测量得到的平均歌词情感轨迹呈现出（阻尼）正弦波样式的模式，估计周期为34至35年。此外，本研究并未止步于识别情感模式，而是进一步构建了一个数学模型，解释形成此类模式的潜在文化过程——音乐听众与词作者之间的互动。一个简洁的阻尼谐振荡（DHO）模型能够解释中文歌词（周期性）和英文歌词（非周期性）中的歌词情感运动模式，并且模型参数经过统计估计。DHO模型对经验数据的解释力为均衡解释提供了支持。总体而言，本研究使任何试图将大众文化产品特征变化作为潜在社会心理趋势代理变量的尝试变得更为复杂。

关键词：流行音乐，情感分析，文化周期，大语言模型，自然语言处理，阻尼简谐振荡

Abstract：Scholars of popular music often assume that trends in the sentiment of pop song lyrics (becoming more positive or negative over time) “mirror” those in listeners’ preferences or the ethos of societies. For example, the detected monotone downward trend in the sentiment of English-language pop lyrics is typically interpreted as “reflecting” the deteriorating emotional and mental state in listener populations and/or the increasing demand for more negative (or less positive) lyric sentiment. This study challenges this “mirror interpretation” with an alternative “equilibration interpretation,” which posits that the average listener sentiment preference may remain largely stable across decades, and it is the equilibrating process that either brings the sentiment of pop lyrics closer to the listener preference or make the lyric sentiment oscillate around the listener preference. Exploring this alternative interpretation, this study measures and models the movement of lyric sentiment in more than 260,000 Chinese-language pop songs over six decades (1967–2023). To quantify the sentiment of a large volume of lyrics, a novel approach of combining large language model (LLM) and lexicon-based sentiment analysis is developed to extract affective information from lyrics. The resulting trajectory of measured average lyric sentiment exhibits a (damped) sine-wave-like pattern with an estimated period of 34 to 35 years. Moreover, this study does not stop at identifying sentiment patterns but goes further to build a math model that explains the possible cultural process—interactions between music listeners and lyricists—underlying the formation of such patterns. A parsimonious Damped Harmonic Oscillation (DHO) model can explicate both the periodic (in Chinese lyrics) and nonperiodic (in English lyrics) patterns of lyric sentiment movements, and the model parameters are estimated statistically. The explanatory power of the DHO model over empirical data lends support to the equilibration interpretation. In general, this study complicates any attempt to use changing features of mass cultural products as proxies for some underlying socio-psychological trends.

Keywords:popular music, sentiment analysis, cultural cycles, LLM, NLP, damped harmonic oscillation

图：年度平均歌词情感的周期性轨迹（计算过程借助 ChatGPT）。曲线周围的灰色带是 LOESS 预测情感值的 95% 置信区间。

Figure：Periodic trajectory of the yearly average lyric sentiment (calculations assisted by ChatGPT).

The gray band around the curve is the 95% confidence interval for the LOESS-predicted sentiment values.

莎士比亚公司项目数据集 2.0 版

Shakespeare and Company Project Data Sets, Version 2.0

Joshua Kotin, Rebecca Sutton Koeser

摘要：“莎士比亚公司项目”数据集详细描绘了两次世界大战之间 Sylvia Beach 经营的“莎士比亚公司”书店及借阅图书馆的面貌。本文概述了促成数据集重大更新的研究、数据策展和开发工作。2.0 版对 1.2 版中包含的数据集进行了细化和扩充，并新增了两个数据集，分别关注借阅图书馆流通图书的作者以及借阅图书馆成员的地址。本文应作为 2022 年发表于《文化分析学刊》的《莎士比亚公司项目数据集》一文的补充。

关键词：现代主义，文学，书籍史，图书馆，接受史，阅读，地图，人口统计，读者

Abstract：The Shakespeare and Company Project data sets provide a detailed portrait of Shakespeare and Company, Sylvia Beach’s bookshop and lending library in interwar Paris. This article outlines the research, data curation, and development that led to a major update of the data sets. Version 2.0 refines and augments the data sets included in Version 1.2, and adds two new datasets, focused on the authors of the books that circulated in the lending library and the addresses of lending library members. The article should be read as a supplement to "Shakespeare and Company Project Data Sets," published in the Journal of Cultural Analytics in 2022.

Keywords:modernism, literature, book history, libraries, reception history, reading, maps, demographics, readers

图：这张巴黎地图按区显示了成员分布，以及左岸成员占主导的情况。

Figure：This map of Paris shows members by arrondissement and the predominance of members on the Left Bank.

折衷主义读者

The Eclectic Reader

James English,J. D. Porter

摘要：近三十年来，折衷主义（Eclecticism）一直是文化消费社会学最核心的关注点之一，但关于读者阅读折衷主义的研究却几乎付诸阙如。我一直利用 Goodreads 的数据来弥补这一研究盲区。这项研究使我得以描述高度活跃的 Goodreads 用户在阅读习惯上呈现出的宽窄模式，这些模式在很大程度上类似于其他文化实践领域学者所发现的“杂食者（Omnivores）与单食者（Univores）”的社会分层图式。然而，我的分析也凸显了该定量模型的局限性，以及折衷主义概念本身在社会学文献中常被忽视的诸多弊端。这些问题具体涉及：折衷主义与时间性的内在关系；研究中对偏好（品味）与实践（习惯）的混淆与滑动；以及对文学和文化作品进行分类时，存在多种同样合理但不可通约（Incommensurable）的分类范式。

关键词：折衷主义，文化消费，文学社会学，经验读者研究，Goodreads，体裁，杂食者论题，阅读的时间性，文学数据研究

Abstract：Eclecticism has been among the most central concerns in the sociology of cultural consumption for 30 years, but hardly any research has been done on the eclecticism of readers. We have been using data from Goodreads to address this blind spot. Our research enables us to describe some general patterns of breadth vs narrowness in the reading habits of highly active Goodreads users, which largely resemble the socially hierarchized schema of omnivore vs univore discerned by scholars in other fields of cultural practice. But our analysis also highlights the limitations of our model, and indeed of eclecticism itself, a concept rife with problems that have have often gone unremarked in the sociological literature. These problems involve the relationship of eclecticism to temporality; the slippages between preference (taste) and practice (habit); and the sheer variety of equally legitimate but incommensurate ways to classify works of literature and culture.

Keywords:Eclecticism, cultural consumption, sociology of literature, empirical reader studies, Goodreads, genre, omnivore thesis, temporality of reading, literary data studies

图：3,209 位用户的距离得分（所有成对书籍之间平均距离）与香农得分（香农多样性指数）对比图，线条显示中位数和拟合线。颜色对应每个用户收藏中排名靠前的体裁簇。圆圈大小对应于每个用户收藏中用于计算得分的书籍数量。

Figure：Distance Score (mean of all pairwise distances between books) vs Shannon Score (Shannon diversity index) for 3,209 users, with lines showing median and fit. Color corresponds to the top genre cluster in a user’s collection. The size of a circle corresponds to the number of books in each user’s collection that were used to calculate their scores.

“德语虚构作品翻译映射”数据集：数据收集、范围与数据质量

The “Mapping German fiction in translation” dataset: Data collection, scope, and data quality

Lisa Teichmann

摘要：“德语虚构作品翻译映射”数据集包含 35,972 种翻译虚构作品的条目，这些作品原版以德语出版于 1980-2020 年间，作者共计 6,457 位，涉及 86 种语言。它是首个从德国国家图书馆提取的、可自由获取的书目翻译数据集（提取于 2021 和 2023 年）。该数据集是一个更大项目的一部分，该项目旨在通过翻译来映射德语虚构作品的地理与语言踪迹。项目开发了用于地理制图和网络分析的可视化工具，可在 GitHub 仓库中获得。本文中，我记录并评估了数据提取过程、编目与收藏实践以及数据质量，特别关注了所用方法的挑战与局限。

关键词：翻译，德国国家图书馆，书目数据，数据集，数字翻译史，数据质量

Abstract：The “Mapping German fiction in translation” dataset consists of 35,972 translated titles of fiction originally published in German between 1980-2020 by 6,457 authors in 86 languages. It represents the first freely available dataset of bibliographic translation data extracted from the German National Library in 2021 and 2023. The dataset is part of a project that aims at mapping the geographic and linguistic traces of German fiction by means of translation. Visualization tools for geographic mapping and network analysis have been developed which are available in a Github repository. In this paper I document and evaluate the data extraction process, cataloguing and collection practices, and data quality, with special attention to the challenges and limitations of the applied approach.

Keywords:translations, German National Library, bibliographic data, dataset, digital translation history, data quality

图：“德语虚构作品翻译映射”数据集的编译与文档工作流程。

Figure：Workflow for compiling and documenting the Mapping German fiction in translation dataset.

以上内容来自官方网站：

经数字人文资讯小编翻译整理而成

如需转载请后台私信联系

编译丨罗斯鹏

校对丨魏翔

排版丨洪冰凤

20 - 古联数字

教材上新丨《数字人文引论》：全面呈现数字人文“新理念、新领域、新方法、新设施”

2026年5月22日 10:16

2026-05-22 10:16 北京

《数字人文引论》以“新理念、新领域、新方法、新设施”为总体框架，系统阐释数字时代人文研究的范式跃迁。

数字人文，人工智能

上架建议

《数字人文引论》

作者：李飞跃、桑海主编

出版社：中华书局

书号：978-7-101-17674-2

出版时间：2026年4月

字数：454千字

定价：92.00

/ 内容简介 /

/ 作者介绍 /

主编

作者团队

（按章节先后顺序排列）

刘石/ 清华大学人文学院

李飞跃/ 清华大学人文学院

孙茂松/ 清华大学计算机科学与技术系

孔存良/ 清华大学计算机科学与技术系

梁晨/ 南京大学历史学院

李林芳/ 北京大学中国语言文学系

许可/ 华东师范大学中国语言文学系

邱伟云/ 南京大学历史学院暨学衡研究院

左家莉/ 江西师范大学人工智能学院

张辰麟/ 昆明学院人文学院、教育部语言文字应用研究所

胡韧奋/ 北京师范大学国际中文教育学院数字人文系

苏祺/ 北京大学外国语学院、北京大学人工智能研究院

赵薇/ 中国社会科学院文学研究所

唐宸/ 清华大学人文学院

姜文涛/浙江大学国际联合学院

饶高琦/ 北京语言大学国际中文教育研究院

李斌/ 南京师范大学文学院语言大数据与计算人文研究中心、澳门大学人文学院

桑海/ 澳门理工大学《澳门理工学报》编辑部

肖爽/ 清华大学人文学院

/ 编辑推荐语 /

“清华数字人文丛书”中的第一本教材，以“四新”为框架，理论与研究成果相结合，全面阐述数字人文领域的主要研究方向。

目录

《数字人文引论》

试读

《数字人文引论》

立即购买，继续阅读

《数字人文引论》

点击上方书封即可购买

END