阅读视图

转载 | 纪要:【“数字与人文”跨学科系列讲座】Andrea Nanetti:可视化映射:从列奥纳多·达·芬奇到奇点

中大高研院 2026-03-30 15:36 广东

以下文章来源于:中山大学人文高等研究院

中山大学人文高等研究院

发布中山大学人文高等研究院相关学术信息

2025年11月28日晚,中山大学人文高等研究院“数字与人文”跨学科系列讲座第十四讲在中山大学南校园图书馆顺利举行。广州美术学院数字人文特聘教授安德烈亚·纳内蒂(Andrea Nanetti受邀主讲,主题为“可视化映射:从列奥纳多·达·芬奇到奇点——基于定义、假设、观念、概念与解读的研究路径(Visual Mapping from Leonardo Da Vinci to the Singularity)”,讲座由中山大学信息管理学院程焕文教授主持。

Andrea Nanetti教授在讲座中

一、正名与溯源:“艺术”与“技术”的概念考古

在讲座中,纳内蒂教授以历史经验(尤其是文艺复兴时期的智慧)为基石,通过辨析核心概念、回溯技术变革中的历史先例并展示其团队在数字人文领域的实践,探索如何为现代人文学科建立坚实的应用计算技术的方法论框架,系统阐述了连接历史智慧与未来技术的前沿路径。

讲座伊始,纳内蒂教授回归欧洲古典传统,厘清了“艺术”(Art)与“技术”(Technology)的概念:希腊语单词τέχνη与拉丁语对应词ars本指同一事物,即“制作的学问”,二者的现代分野是历史建构的结果。在古代,“自由七艺”属于理论思辨,绘画、雕塑等则被归为“机械艺术”,地位较低。直至文艺复兴时期,“纯艺术”概念在意大利兴起,创作者的社会价值与文化价值才获得重估。纳内蒂教授强调,当代人文学科以理解人类境况为核心旨趣,应当利用一切可用的“技艺”与“技术”,这正是数字人文工作的根本意义

二、历史的范式:面对技术变革的三种抉择

为阐明如今面对人工智能等颠覆性技术时的应有立场,纳内蒂教授援引三类人物作为先例,勾勒出三种典型的反应模式。

1)十五世纪佛罗伦萨书商韦斯帕夏诺·达·比斯蒂奇(Vespasiano da Bisticci)的拒绝与退隐。作为曾为美第奇家族服务的杰出手抄本书商,比斯蒂奇代表着前印刷时代知识生产美学与工艺的巅峰。古登堡印刷术这一“颠覆性技术”传播至意大利时,他并未拥抱变革,而是选择在1480年左右退休并关闭书店。在回忆录中,他视印刷书籍为“廉价”且“低质”的产品,破坏了手抄本承载的工艺标准与审美价值。他的选择代表了深刻的保守立场:当新技术与既有伦理、美学标准严重冲突时,主动退出与自我边缘化成为其坚守尊严的方式在今日的数字人文领域,部分学者表达了类似的态度,即批评数字工具“粗浅”或“不可靠”而拒绝使用。这虽是基于学术操守的合理选择,但也意味着自愿脱离该领域未来的主流发展轨道

韦斯帕夏诺·达·比斯蒂奇

2)十七世纪化学家波义耳(Robert Boyle)的开拓与创制在波义耳的时代,物质研究领域主要由充满神秘主义色彩的炼金术主导,其工具与方法无法满足建立基于实证与理性观察的新科学范式(即现代化学)的需求。面对这一困境,波义耳并未向旧工具妥协,也没有选择被动等待新工具的出现,而是亲手设计和制造了空气泵等革命性的实验仪器。他的实践揭示了这一关键原则:当研究议题的深度超越了现有技术手段的极限时,真正的学术突破往往依赖于研究者为自己“量身定制”工具的能力这对于当今数字人文的启示直接而深刻:我们不能仅仅满足于使用商业公司提供的通用型人工智能或软件,为解答人文学科中具体、复杂的问题,必须主动参与甚至主导开发专用的工具与方法

波义耳

3俄里翁(Orion)与刻达利翁Cedalion)神话的当代启示纳内蒂教授展示了一幅描绘盲眼巨人俄里翁与站在其肩上的少年刻达利翁的画作,引申出有关知识与技术关系的核心隐喻:力大无穷却目不能视的俄里翁象征着人类所积累的庞大数据和知识库(当今的大语言模型与海量数据库),是巨大而无方向的“力量”。身形渺小却拥有视觉的刻达利翁则象征着人类研究者,他并不能替代巨人的力量,却为其提供关键的方向指引。这精妙地回应了当下关于人工智能的争论:技术模型本身并不天然具备目的性与判断力(正如OpenAI等机构常申明不对输出结果负责),是需要被驾驭的“巨人”。人文学者的核心角色,便是成为不可或缺的“指引者”,将自身的领域知识、批判性思维与伦理判断注入研究过程,确保将技术巨人的力量引导至富有意义的人文探索之路上

俄里翁与刻达利翁

三、从视觉思维到记忆工程:达·芬奇的遗产与现代实践

纳内蒂教授将列奥纳多·达·芬奇(Leonardo da Vinci)的工作方法置于核心,将其视作如何成为“可视化映射”的典范。屏幕是未来知识获取的主要渠道,面对这一现实,如何在有限空间内有效压缩和展示信息便成为关键挑战,达·芬奇为此提供了历史范例。

纳内蒂教授指出,达·芬奇的笔记常被误解为混乱的图文混杂,实则体现了超前的非线性视觉思维。以达·芬奇对人类视觉的研究为例,在当时缺乏现代科学且许多文献难以理解的情况下,达·芬奇无法从传统文本中获得满意答案,于是转而借助绘画来思考。他所绘制的眼睛解剖图及伴随文字并非简单的插图与说明,而是视觉化的研究提纲。他以主动的视觉重构探索光线进入眼睛并被大脑处理的过程,这表明达·芬奇不仅是在观察,更是在通过视觉手段实现知识聚合

达·芬奇及其手稿

受到达·芬奇历史经验的直接启发,纳内蒂教授及其团队与“工程历史记忆”(Engineering Historical Memory)项目及国际历史科学委员会(International Committee of Historical Sciences)展开合作。其项目的目标不只是利用AI生成数字替身进行演示,更是要深入探索计算技术真正赋能历史学的方法论。在方法上,该项目秉持波义耳“自制工具”的精神致力于为历史学家打造专属工具,其核心是运用信息可视化技术将过去与现在的复杂数据联系起来,从而揭示其背后完整的故事脉络。

最后,纳内蒂教授由历史路径归结到面对技术奇点(Singularity)的根本问题上。技术奇点临近,我们该如何自处?我们可以像书商韦斯帕夏诺那样固守传统,但可能为此而自我边缘化;也可以像波义耳那样,为建立新范式勇敢打造自己的工具。但最重要的是,必须牢记俄里翁与刻达利翁的隐喻:技术与数据如同盲眼的巨人,人文学者必须站在其肩上,扮演指引方向的角色。因此,未来的使命不仅是解读文本,更要通过“可视化映射”来重新组织和理解人类的知识体系。这是从达·芬奇的智慧到迎接奇点挑战一以贯之的探索路径。

编辑:陈旖旎

初审:蔡一峰

复审:林  耿、陈诗诗

审定发布:张  伟

阅读原文

跳转微信打开

  •  

课程介绍丨基于可视化编排的 AI 史料挖掘与溯源验证

2026-03-31 17:31 北京

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

本课开始我们进入模块三:学习利用零代码编程开展研究的工作全流程。

在生成式人工智能(AIGC)重塑知识生产的当下,人文学者面临着双重困境:传统的编程工具(如 Python)学习曲线陡峭,让人望而却步;而新兴的大模型虽然能快速生成内容,但其固有的黑箱机制与幻觉风险,使得输出结果难以满足人文学科对证据来源与逻辑可控性的严苛要求。

如何在享受技术红利的同时,捍卫学术研究的严谨性?本课程将围绕具体的数字人文研究案例,讲授一套AI条件下“低门槛、高严谨”的研究流程。

主讲人:张光伟

陕西师范大学历史文化学院讲师,硕士研究生导师。担任陕西师范大学丝绸之路历史文化虚拟仿真实验教学中心(省级)主任,国际长安学研究院数字长安研发中心主任,全国历史学实验室建设联盟秘书长,国际教育合作协会(GPE)咨询委员会委员。主要从事"人工智能+历史学"交叉学科研究。发表各类相关研究论文20余篇,参与、主持多项国家级、省部级社科基金与自然科学基金项目。开设数字人文与新文科以及国际理解教育相关课程。

*了解培训详情及报名请扫描本文海报二维码。

←了解我们正在进行的项目

籍合学院

中华书局旗下

古籍整理与传统文化学习平台

阅读原文

跳转微信打开

  •  

课程介绍丨零代码搭建人文数据库及人文智能体

2026-03-30 17:30 北京

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

本课程为方法论与工具实操课。教授学员零代码搭建人文数据库及人文智能体的具体方法。

以自研的汉语方言学大词典数字化平台、汉语方言语音特征数智平台、广州话电子字典、明清坊刻通俗小说数据库为实例,帮助学员在实践中理解人文数据库建设的完整路径。剖析上述平台的设计思路、前后端实现及AI智能体研发逻辑,逐步建立起符合学术规范的数据基础设施建设方法论。继而通过零代码平台实操,演示如何无需编程即可搭建人文类数据库和智能体,并利用其服务学术研究与教学。

主讲人:彭志峰

暨南大学文学院中文系讲师,广东省岭南数字人文实验教学示范中心(省级)副主任,暨南大学-科大讯飞方言语音科技联合实验室(省级)副主任,暨南大学汉语方言研究中心(省级)研究员,粤语语料库建设与大模型评测重点实验室(市级)研究员,主持4项省部级项目,研究方向为数字人文与方言科技。

*了解培训详情及报名请扫描本文海报二维码。

←了解我们正在进行的项目

籍合学院

中华书局旗下

古籍整理与传统文化学习平台

阅读原文

跳转微信打开

  •  

《数字人文专业委员会简报》2026年第3期

2026-03-30 11:44 山西

本期简报设前沿透视、数据资源建设、新书推介、会议培训及学术观察五个栏目。

图片

编者按本期简报设前沿透视、数据资源建设、新书推介、会议培训及学术观察五个栏目。前沿透视栏目聚焦姑苏智典·苏州市古籍知识服务平台、中国哲学书电子化计划(Ctext)的功能更新以及清华大学“九歌·推敲”小程序的发布动态数据资源建设栏目关注北京语言大学BCC语料库2.0版的发布上线。新书推介栏目精选《数字人文教程》、《数字文本历史隐喻论纲》两部专著。会议培训栏目预告“大哉言数:AI时代人文研究的范式重构与价值回归”研讨会暨2026年中国数字人文年会(CDH2026)、文化基因解码与智慧数据资源建设研讨会、文化遗产的数字未来会议等八项重要会议。本期学术观察栏目精选四篇近期研究成果,持续追踪数字人文在方法创新与技术反思层面的前沿探索。

本期目录

前沿透视

  • 姑苏智典·苏州市古籍知识服务平台上线

  • 中国哲学书电子化计划(Ctext)推出AI对齐翻译及多语言实体摘要功能

  • 清华大学发布“九歌·推敲”小程序初版

数据资源建设

  • 北京语言大学BCC语料库2.0版上线

新书推介

  • 《数字人文教程》

  • 《数字文本历史隐喻论纲》

会议培训

 会议预告

  • “大哉言数:AI时代人文研究的范式重构与价值回归”研讨会暨2026年中国数字人文年会(CDH2026)

  • 文化基因解码与智慧数据资源建设研讨会

  • 文化遗产的数字未来会议

  • 第九届语言学与汉语教学国际论坛(IFOLCE-9)

  • 融合与边界:人工智能时代的数字人文发展新进阶

  • 第五届东亚古籍数字人文国际论坛(DHEAC 2026)

  • 太平洋邻里协会(PNC)2026年会议

  • 中国历史文献研究会数字文献分会第四届年会 8

学术观察

  • 主权AI视域下的中国数字人文自主知识体系建设

  • 历史文本何以建构:以蒋廷黻《中国近代史》为例

  • 数字资本主义的新趋势:技术封建主义还是自反性现代化?

  • 概念联觉视角下《周易》的深度数字化文本探勘

前沿透视

姑苏智典·苏州市古籍知识服务平台上线

由苏州图书馆牵头,携手多家公共图书馆、高校图书馆、博物馆等公藏单位打造的姑苏智典・苏州市古籍知识服务平台正式上线服务。平台采用跨界融合建设模式,规划发布古籍不少于1000种,涵盖国家级、省级珍贵古籍及苏州方志、别集、园林文献等本土特色资源,并将持续更新扩容。该古籍知识服务平台与苏州图书馆虚拟展厅、古籍解读短视频、首届苏州市古籍 AI 活化共创大赛等本土项目协同联动,形成 “苏州古籍资源+在地体验+本土活动+全民共创”的古籍活化生态链。

平台服务功能兼具多元性与创新:首创古籍播客沉浸式交互模式,以双人AI角色互动智聊模式将古籍内容转化为音频剧,实现古今跨时空对话。平台还集成了AI句读、智读、智问、生图、写诗等全场景专业智能工具,构建辅助学习体系,降低古籍的阅读与学习门槛。另设“汉字乐园”板块,通过每日一猜、汉字变形记等趣味互动实现游戏化学习,有效吸引年轻群体了解古籍与汉字文化。

未来,该平台将深化四大转型战略,进一步升级服务能力:从“资源中心”转向“知识共创平台”,引入众包协同理念实现古籍数字化流程再造;从“标准化服务”转向“个性化空间”,打造“我的藏书楼”满足不同用户差异化需求;从“信息检索”转向 “智能探索”,通过场景化导航、语义理解、知识图谱联动优化检索体验;从“趣味互动”转向“价值贡献”,升级积分与账号体系形成良性生态循环。

平台访问地址:https://guji.szlib.com/pc/#/

https://mp.weixin.qq.com/s/BCkKcEWQDler29Zj1ZO7mA

中国哲学书电子化计划(Ctext)推出AI对齐翻译及多语言实体摘要功能

中国哲学书电子化计划(Ctext)完成人工智能生成的中国古代文献英译文更新,并上线多语言可编辑式历史实体(人物、典籍、职官等)摘要功能,进一步丰富平台资源形态与服务能力。

Ctext对英汉对齐翻译功能作了大幅更新。目前提供两类译文:其一为既有已出版的完整人工译本,其二是为人工智能与众包协作生成的可编辑译本,后者支持用户直接参与译文修订工作。此次AI生成的可编辑译本覆盖范围大幅拓展,涵盖此前无现成译文的先秦两汉文献全集、二十五史以及数百种历史、文学、哲学、诗词类经典著作,后续平台将持续为更多古籍文本补充AI翻译内容。新增的人工智能译文采用段落与句子两级对齐机制,通过XML标签与元数据实现原文与译文的精确关联。编辑界面支持逐句对照修改,并集成词典查询功能,为译文修正提供便捷支撑。翻译风格强调直译与准确性,禁止添加评注或原文未包含的背景信息,以确保译文与原文的忠实对应。

此外,Ctext还在既有百科维基的结构化数据基础上,引入生成式人工智能技术辅助历史实体的摘要生成,全新上线百科维基板块。该板块使用中、英文双语言自然语言,对中国历史及文献相关的实体进行描述,覆盖人物、典籍、职官名等各类历史实体,目前已上线超10万条实体摘要内容,后续将持续扩充。所有实体摘要均支持用户编辑修改,用户可通过协作方式补充、修正实体信息描述,推动平台历史实体知识的持续迭代与优化。百科维基板块核心用于维护文献资料库中各类实体的现代语言书面描述,相关内容暂不单独作为服务字段向用户展示。

平台访问网址:https://ctext.org/instructions/translation

清华大学发布“九歌·推敲”小程序初版

清华大学中华传统文化智能实验室与清华大学数字人文研究中心联合研发的"九歌·推敲"小程序上线发布。该小程序作为“九歌”系统旗下的智能诗词创作辅助工具,依托人工智能技术,将传统诗词创作中的 “推敲”思维转化为可操控、可解释、可回退的智能化写作流程,为广大诗词爱好者提供专业的创作支撑。

“九歌・推敲” 程序明确AI创作辅助定位,将创作自主权完全赋予用户,系统全程配合用户进行字句斟酌,对用户心仪的内容予以保留固化,以智能技术赋能文思表达,摒弃人工智能一键生成全诗的传统模式。

小程序具备六项特色功能:一是可自定义创作参数,支持体裁、韵部、句式、题目、意境等维度的个性化设置。二是智能锁定机制,可实现字级与行级锁定,锁定后系统仅对内容进行格律校验并给出优化建议。三是实时字词推敲,用户点击空格时即可获取系统推荐的候选字及推荐理由。四是多维度推荐依据推查看,涵盖高频搭配、名句引用、古籍推荐、系统创作等依据,用户也可跳转搜韵网查看相关诗句。五是格律实时校验,通过颜色标记直观提示格律正确与否,便于用户快速修正。六是一键编辑功能,包括导出分享、撤销/重做、查看修改记录及清空等操作。

https://mp.weixin.qq.com/s/waycYlktkB4KlLgRgcB01w

数据资源建设

北京语言大学BCC语料库2.0版上线

北京语言大学正式发布BCC语料库(Beijing Language and Culture University Corpus Center)2.0版本。该系统由北京语言大学荀恩东教授团队开发,此次升级是该语料库自1.0版本推出以来,在语料数据体系与核心技术层面的重大迭代更新。

BCC汉语在线语料库总库达约62亿字,全面覆盖当代社会语言生活的多个领域,具体包括: 新闻(约 19亿字)、文学(约2亿字)、口语(约2亿字)、近代汉语(约15亿字)、古汉语(约16亿字)以及多领域通用语料(约7亿字),实现多类当代语体和154年历时报刊语料的全覆盖。本次2.0版本更补全了历史语料,新增《人民日报》、新闻联播全量数据,同时进一步扩充近代汉语、《申报》等资源,持续丰富语料库的广度和深度。 

BCC2.0依托核心技术升级实现检索精度与效能的提升:通过重构底层检索引擎,形成结构化、树状句法深度检索,从根本上解决传统检索效率低的问题。此外,实现词性、短语结构和文本的复杂混合查询,并提供在线统计与结果可视化功能。平台同步发布Python开发包,开放个人语料库自主构建功能,实现从“单纯提供语料库”到“赋能用户自主建库能力”的转变 ,助力研究者将自有语料组织为可检索、可统计、可扩展的个人 BCC 语料库。未来,该平台将进一步融合大模型技术,陆续上线文本自动标注、自然语言检索等智能化功能。

平台访问地址:https://bcc.blcu.edu.cn/

https://mp.weixin.qq.com/s/iW7Sb0ucrrdZMt-KXYmLpA

新书推介

《数字人文教程

《数字人文教程》是由上海大学文学院教授曾军主编,2026年2月由高等教育出版社出版的一部大学通识教材,入选高等教育出版社原创性教材建设项目。

该书共十五章,包括数字人文发展概况,数字素养,可视化分析技术,扩展现实技术,人工智能关键技术,提示词工程技术,数字人文与语言,数字人文与文学,数字人文与艺术,数字人文与历史研究,数字人文与传播,数字人文与“元宇宙”想象,数字人文与文艺创作,数字人文的伦理问题,数字人文的影响、范式及其问题。

该书具有鲜明的中国特色与实践导向:一是强化数字人文中国概念,融入思政教育与中国特色数字责任观,体现党的创新理论成果与新时代实践成就;二是聚焦中国自主研发工具与开源工具,设计可重复、可验证的实训任务与课后练习题,强化“中国方法” 解决 “中国问题” 的技术基础;三是突出中国案例应用,重点介绍传统文学、历史、哲学、艺术等领域的数字人文实践,助力全球数字人文领域传播中国智慧。

https://mp.weixin.qq.com/s/M1w-XAWCfUMC40myN8FabA)

《数字文本历史隐喻论纲(Theses on the Metaphors of Digital-Textual History)》

《数字文本历史隐喻论纲》(Theses on the Metaphors of Digital-Textual History)由英国学者马丁·保罗·伊夫(Martin Paul Eve)撰写,2024年7月由斯坦福大学出版社出版,列入斯坦福文本技术丛书,以开放获取形式发行。

该书聚焦数字人文、书籍史、文本研究、新媒体与出版研究的交叉领域,倾力剖析那些形塑人们数字空间感知且与物质文化史深度纠缠的数字文本隐喻。作者将页面、窗口、站点、空白、图书馆、保存等词汇视为承载历史与意识形态的隐喻系统,指出数字环境中翻页、留白等日常表述潜藏着印刷文化、建筑空间、政治制度、音乐书写及档案观念的历史肌理。其核心论断为:数字文本并非纯粹虚拟、抽象或去历史化的存在,而是与纸介质、软硬件接口、底层协议、基础设施、数据存储及全球技术秩序紧密相连。

在叙述架构上,该书凭借一组彼此呼应又各自圆足的命题层层推进。书中分析数字页面对纸质书页逻辑的承袭,将屏幕空白纳入媒介感知史中考察,将数字文本还原至统一字符码、互联网治理与全球技术权力的博弈场域,并讨论数字档案、数据脆弱性与保存政治。

本书旨在促使学界反思:谈论数字文本时沿用了哪些源自纸本时代、现代制度与西方技术文化的阐释框架,这些框架又如何影响数据库设计、数字版本构建、界面理解、阅读组织及对文本物质性的描述。该书获2025年SHARP图书史著作奖(SHARP Book History Book Prize)。

https://mp.weixin.qq.com/s/36AWK_pOy2ZSU_SYNZLXIw)

会议培训

  会议预告

第十一届国际中文教学研讨会暨第五届语文教育国际研讨会

第十一届国际中文教学研讨会暨第五届语文教育国际研讨会将于2026年6月5日至6日在香港教育大学大埔校园举行。本次会议由香港教育大学联合《国际中文教育学报》主办,旨在庆贺香港教育大学正名十周年,以“中华文化传承与中文教育创新”为核心主题,汇聚国际中文教育与语文教育领域的专家学者,共同探讨教育理论、课程设计、教学方法与数位技术的创新,促进中华优秀语言文化的传承与传播。会议将重点关注人工智慧与教学创新、文化认同与跨文化沟通、数字人文人工智慧与中文教学语料库研究

等前沿议题。会议形式包括主题演讲、专家论坛、论文报告及教学工作坊,会议语言为中文或英语。

  • 主办单位:香港教育大学、《国际中文教育学报》

  • 会议时间:2026年6月5日—6月6日

  • 会议地点:香港教育大学大埔校园

https://mp.weixin.qq.com/s/x_-RirJ__oBY8rKdlOjX3g)

“大哉言数:AI时代人文研究的范式重构与价值回归”研讨会暨2026年中国数字人文年会(CDH2026)

"大哉言数:AI时代人文研究的范式重构与价值回归"研讨会暨2026年中国数字人文年会(CDH2026)将于2026年7月31日至8月3日在内蒙古师范大学举办。本次会议由中国索引学会数字人文专业委员会与内蒙古师范大学科学技术史研究院联合主办,旨在探讨人工智能与大数据技术深刻重塑人文学科知识生产方式与价值判断框架的前沿议题。会议将邀请知名专家学者,围绕数字人文及相关领域的前沿问题,开展主旨发言、会议报告、专题讨论、案例分享、数字人文空间展演、海报展示等多种形式的学术交流活动。

会议设置九大议题方向,涵盖典籍重光(科技古籍与多民族文献智慧化整理)、时空重构(GIS与时空大数据驱动的文明演进研究)、协智重塑(多智能体与具身智能的人文社会仿真)、谱系重绘(知识图谱与智能注释驱动的知识重组)、记忆重述(AIGC赋能下的文化遗产与艺术创新)、文脉重析(计量方法与主题模型的文本深度挖掘)、伦理重思(数字人文中的算法批判与负责任创新)、素养重育(数字人文课程体系与跨学科人才培养)以及数字人文学科建设。会议现面向数字人文领域专家、学者与学生征集论文摘要与数字人文研究项目,入选者将有机会在会议上进行交流和展示。

  • 主办单位:中国索引学会、内蒙古师范大学

  • 会议时间:2026年7月31日—8月3日

  • 会议地点:内蒙古师范大学(呼和浩特市赛罕区昭乌达路81号)

  • 论文摘要提交截止时间:2026年4月30日

  • 项目征集截止时间:2026年5月20日

https://mp.weixin.qq.com/s/nLhzHuX3v-eR6euYt52tYA

文化基因解码与智慧数据资源建设研讨会

文化基因解码与智慧数据资源建设研讨会将于2026年4月17日至19日在武汉大学召开。会议由武汉大学文化遗产智能计算实验室(教育部哲学社会科学实验室)主办,武汉大学信息管理学院、武汉大学大数据研究院协办,旨在深入贯彻落实国家文化数字化战略及"十五五"规划中关于文化与科技融合的部署要求,破解中华优秀传统文化基因系统性挖掘、阐释与表示难题,提升高质量文化遗产数据资源建设与活化利用水平。会议将围绕文化遗产数智活化与系统性保护的前沿理论、实践路径与发展趋势展开深入研讨,凝聚广泛共识,深化对话交流。

  • 主办单位:武汉大学文化遗产智能计算实验室(教育部哲学社会科学实验室)

  • 会议时间:2026年4月17日—4月19日

  • 会议地点:武汉大学人文社科楼

https://mp.weixin.qq.com/s/rTcZQEY-JAnR05rJ3i5krQ

文化遗产的数字未来会议

"2026文化遗产的数字未来"国际学术会议将于2026年5月28日至30日由宁波诺丁汉大学亚太研究院数字遗产中心主办。会议响应全球数字化转型加速背景下文化遗产领域从保存到活化、从单边阐释到多元共创的深刻变革趋势,旨在系统探讨数字技术在21世纪如何塑造文化遗产的保存、阐释、传播与再生。会议鼓励跨学科、跨领域、实践导向的投稿,重点关注数字研究方法与技术在多元语境下的影响、伦理、可持续性与社会应用,涵盖博物馆、档案馆、表演传统、非物质文化遗产、社区记忆、民间艺术及参与式实践等领域。欢迎学界、产业界、文化机构与社区的研究者、从业者、艺术家与倡议者共同参与,借助移动媒体、人工智能、三维数字化、沉浸式平台与协作式数字讲述等前沿工具,重新构想文化工作的未来路径。

  • 主办单位:宁波诺丁汉大学亚太研究院数字遗产中心

  • 会议时间:2026年5月28日—5月30日

  • 会议地点:宁波诺丁汉大学

  • 论文摘要提交截止时间:2026年4月25日

https://mp.weixin.qq.com/s/6KynSlCn0crgYDuoTpsVhw

第九届语言学与汉语教学国际论坛(IFOLCE-9)

第九届语言学与汉语教学国际论坛(IFOLCE-9)将于2026年6月26日至28日在香港特别行政区举行。此次论坛由香港城市大学、香港教育大学与斯坦福大学联合主办。论坛主题为“汉语语言学、汉语教育与生成式人工智能”,倡导跨学科和实证研究,以推动汉语研究与应用在人工智能时代的进步。会议将探讨汉语语言学、汉语教育与生成式人工智能(GenAI)的交叉领域。论坛将包括会前工作坊、主题演讲、特邀报告和分组论坛报告等环节。主题演讲嘉宾包括瑞士纳沙泰尔大学的Martin Hilpert教授和法国国家科学研究中心的Marc Allassonnière-Tang教授。

  • 主办单位:香港城市大学、香港教育大学、斯坦福大学

  • 会议时间:2026年6月26日—6月28日

  • 会议地点:香港特别行政区九龙塘香港城市大学

https://lt.cityu.edu.hk/ifolce-9/)

融合与边界:人工智能时代的数字人文发展新进阶

数字人文专业发展联盟第二届年会暨第七届清华大学数字人文国际论坛、中国文艺理论学会数字人文分会第四届年会将于2026年7月10日至13日在上海大学宝山校区举办。会议以"融合与边界:人工智能时代的数字人文发展新进阶"为主题,聚焦新一代AI技术为人文学科研究注入的活力与人文科技深度融合的新路径。会议旨在凝聚学界共识,分享成功经验,共同探索数字人文进入人工智能时代的新范式、新路径、新方法,推动数字人文学科繁荣发展,助力新文科建设与交叉学科人才培养。年会除设置理事会会议、主旨演讲、专题论坛等常规板块外,还将推出高水平人文社科实验室交流会、院长论坛、清华大学数字人文国际论坛"未来学者"专场、课程示范、成果发布、主编讲堂等特色务实举措,为数字人文生态中的多元主体搭建跨界合作与思想碰撞的平台。

  • 主办单位:数字人文专业发展联盟、中国文艺理论学会

  • 会议时间:2026年7月10日—7月13日

  • 会议地点:上海大学宝山校区

  • 论文摘要提交截止时间:2026年5月13日

  • 未来学者论坛论文摘要截止时间:2026年5月22日

https://mp.weixin.qq.com/s/m8-Z3x-hgbnKCc03wmc_rA

第五届东亚古籍数字人文国际论坛(DHEAC 2026)

第五届东亚古籍数字人文国际论坛(DHEAC 2026)将于2026年7月22日至28日在韩国首尔举行,由成均馆大学中国文化研究所主办。本届大会以"数智赋能:未来东亚古典研究的新范式与新趋势"为主题,聚焦数字技术与人工智能在东亚古籍整理、研究及传播中的创新应用。会议旨在促进古籍资源在数字化、智能化环境下的开发与应用,搭建古籍研究者与信息技术工作者的协作平台,加强全球范围内古籍相关机构与学者的合作。会议涵盖语料库构建、大模型与生成式AI在古典学中的应用、语义技术与知识工程、文化分析及数据运算、数字平台开发、医学农业古书研究、文化遗产数字保护、智慧图书馆、空间人文学、多模态融合等多元议题。会议期间还将举办"吾与点工作坊"、"DocuSky工作坊"以及"古籍整理与智能化实践工作坊"。

  • 主办单位:成均馆大学中国文化研究所

  • 会议时间:2026年7月22日—7月28日

  • 会议地点:韩国首尔成均馆大学

  • 论文摘要提交截止时间:2026年3月30日

https://mp.weixin.qq.com/s/XYaM9N47ge6UeyZTuON6IA

太平洋邻里协会(PNC)2026年会议

太平洋邻里协会(Pacific Neighborhood Consortium)2026年会暨联合会议将于2026年9月9日至11日在台湾法鼓文理学院举行。会议主题为"Intelligence in Context: Practices, Impact, and Connection"(情境中的智能:实践、影响与连结),聚焦人工智能技术在人文社会科学领域的应用与反思,探讨智能技术如何与具体学术情境相结合,并产生实际影响与跨领域连结。会议设置七大核心议题,涵盖太平洋区域的文化交流与传播(Cultural Exchange and Diffusion in the Pacific Realm)、文化记忆的技术与技艺(Techniques and Technologies of Cultural Memory)、教学法与博雅教育改革(Reform of Pedagogy and the Liberal Arts)、人工智能与社群联结(AI and Connecting Communities)、空间智能(Spatial Intelligence)、社会文化数据(Socio-cultural Data)、科学、医疗与健康领域的创新变革(Innovation Reform and Renewal in Sciences, Health, and Wellness)等前沿方向。议程包括特邀主题演讲、论文发表、ECAI工作坊及海报展示等环节。

  • 主办单位:太平洋邻里协会(PNC)、法鼓文理学院

  • 会议时间:2026年9月9日—9月11日

  • 会议地点:法鼓文理学院(新北市)

  • 论文摘要提交截止日期:2026年5月15日

https://sites.google.com/view/pnc2026)

中国历史文献研究会数字文献分会第四届年会

中国历史文献研究会数字文献分会第四届年会将于2026年10月下旬在武汉举行,由中国历史文献研究会数字文献分会联合湖北大学文学院主办,中华书局古联公司协办。年会立足雅学与传统语言文献的数字化整理及数据库建设实践,旨在探讨数智时代传统文献研究的理论前沿与实践路径,推动古籍整理研究的理论、方法与实践创新,促进古籍资源的当代传承与活化利用。会议设置7个核心议题,包括中国古典文献文本分析、雅学与传统语言学研究、中国古典文献的数字化整理与研究、古籍大数据构建及智能体辅助研究、数字人文理论与方法探索、数字人文人才培养与教学实践、人文学科高水平实验室建设。

  • 主办单位:中国历史文献研究会数字文献分会、湖北大学文学院

  • 会议时间:2026年10月下旬

  • 会议地点:湖北武汉

  • 论文摘要提交截止日期:2026年6月30日

https://mp.weixin.qq.com/s/TqFauSR-KI_-nGmETx2mdA

学术观察

主权AI视域下的中国数字人文自主知识体系建设

来源:刘炜,刘圣婴,金家琴,等. 主权AI视域下的中国数字人文自主知识体系建设 [J]. 数字人文研究, 2025, 5 (04): 3-16.

摘要:在全球技术竞争加剧和“主权AI”成为国家战略焦点的宏大背景下,构建自主知识体系已成为维护国家数字主权与文化安全的核心议题。文章系统探讨中国数字人文自主知识体系建设的紧迫性、理论基础与实践路径。首先剖析了“主权AI”在技术控制和文化、语义层面的内涵,审视其在抵御“数字殖民主义”中的作用。并在此基础上,引入段玉聪教授的“语义主权”理论和DIKWP(数据—信息—知识—智慧—意图)模型作为核心理论框架,扩展了语义层作为意图分析的主要来源,论证中国自主知识体系建设必须涵盖对知识内容与价值意图的深层主导。通过分析中国“学术世界”平台、字节跳动与北大的“识典古籍”平台及ICH-Qwen大语言模型等案例,揭示了融合顶层设计、技术赋能与范式创新的建设路径。研究表明,中国数字人文的自主知识体系建设是基于主权AI战略、以语义主权为核心,通过数字平台和智能工具实现数据自主、知识创新与价值引领。最后,文章反思了“主权陷阱”等潜在挑战,并展望了一个开放、自信且具有全球影响力的中国数字人文学术共同体的未来。

历史文本何以建构:以蒋廷黻《中国近代史》为例

来源:文祥微,方树益. 历史文本何以建构:以蒋廷黻《中国近代史》为例 [J]. 数字人文, 2025, (04): 51-68.

摘要:当下的计量史学或数字史学面临的一大质疑即源于低资源特点突出的历史数据与宏大分析需求之间的矛盾。面对一个特定的历史问题,研究者往往被迫使用有限且建构色彩显著的材料,削弱了研究结果的可靠性。针对这一现状,文章以蒋廷黻《中国近代史》人物关系的网络分析为例,提出数字史学未来发展值得探究的一条对策路径,即在材料不足的前提之下,可以围绕历史文本的建构性本身展开研究,探讨所谓的建构性在历史文本中如何体现。文章通过对该书中的人物关系进行量化分析、可视化呈现和结果阐释等工作,发掘出文本背后蕴含的蒋廷黻本人史学观念及政治观念,尤其关心其“近代化史观”的渗透分布,站在数字视角下重新验证、丰富学界关于该书性质、立场的认知,同时开拓数字史学未来发展的新思路。

数字资本主义的新趋势:技术封建主义还是自反性现代化?

来源:吴静. 数字资本主义的新趋势:技术封建主义还是自反性现代化? [J]. 求索, 2025, (05): 61-70. DOI:10.16059/j.cnki.cn43-1008/c.2025.05.007.

摘要:围绕数字资本主义的新趋势,存在“技术封建主义”与“自反性现代化”两种解读框架的论争。前者认为,数字平台通过垄断数据获取“数字地租”,构建了类似封建领主的权力依附关系,并促使资本积累方式转向租金驱动。但该理论存在三重遮蔽:割裂平台经济与资本积累的历史连续性、误读剥削机制为技术决定论、消解资本主义内在矛盾,其本质上是对资本逻辑的简化。相反,自反性现代化理论则揭示了数字时代的劳动碎片化、平台垄断与公共性并存等现象,以及资本借助数字技术对社会关系的新一轮吸纳,从而体现了现代性的内在矛盾与自我调整。平台资本的生产性与掠夺性交织,垄断正是这一趋势下资本超高度集中的体现。但同时,数据的公共性与资本的私人占有构成了新对立,因而并不属于纯粹封建性质。从这个意义上而言,技术封建主义实际上只是对自反性现代化所揭示的当代资本主义复杂性与悖反性的病理学诊断。

概念联觉视角下《周易》的深度数字化文本探勘

来源:阮铭卓,靳丽阳,彭弋航,等. 概念联觉视角下《周易》的深度数字化文本探勘 [J]. 数字人文, 2025, (04): 90-111.

摘要:《周易》是我国传统哲学经典之一,其文本所蕴含的哲学思想具有巨大的研究价值。在传统《周易》研究中,由于技术手段的限制,学者们往往依赖主观解读和文献考证,这在一定程度上限制了对文本深层次结构和内在联系的全面理解。文章通过数字人文技术的应用,特别是语义共现和概念联觉分析,为《周易》研究提供了新的视角。文章通过对《周易》文本进行断词和词频统计,并结合词向量计算,深入探讨了《周易》中的概念如何通过不同感官体验相互关联。研究发现,《周易》文本中的概念不仅在语义上形成了集群,而且在感官体验上也展现出显著的联觉现象。例如,刚柔概念在触觉上的体现,以及君子形象在视觉、听觉和味觉上的多维表现,都为理解《周易》的哲学思想提供了新的维度。文章的研究成果不仅丰富了《周易》文本的语义分析,也为数字人文方法在古典文献研究中的应用提供了有益的探索。

供稿:卢钰、秋慧婷、沈立力    责编:韩春磊、张宏玲

编辑部:中国索引学会数字人文专业委员会秘书处

电话:64455555-68360

邮箱:DH2020@libnet.sh.cn

-END-

文章转自:全国报刊索引公众号

阅读原文

跳转微信打开

  •  

线上培训丨零代码编程的科研教学与智慧课程建设(10门课程20课时)

籍合学院 2026-03-26 21:08 北京

零代码,智启课堂新基建!

数字人文专业发展联盟成立以来,我们在联盟内部开展的多次调研中发现一个普遍困境:面对人工智能技术的快速发展,高校人文领域的教师普遍抱有积极拥抱的态度,却在实际操作中面临双重门槛——编程学习的时间成本过高,而直接使用AI工具又难以满足学术研究对严谨性和可溯源性的要求;教学工作同样迫切需要在不增加过重技术负担的前提下,完成从传统课堂向智慧课程的转型。

基于这些科研与教学痛点,我们历时数月筹备了这套"零代码编程的科研教学与智慧课程建设"系列培训。精心筛选了各校在数字人文一线深耕的骨干教师,请他们将实践中沉淀的"低门槛、高严谨"方法论系统化地分享出来。

开设这套课程的目的很务实:

一是帮助老师们掌握真正无需编程即可上手的数据库、智能体搭建方法,以及史料挖掘和统计分析工具,把节省下来的时间重新投入到学术思考与教学设计中;

二是提供一套系统的高校智慧课程建设方法论和实践案例,让各高校在智慧课程建设方面的实践经验能够互通有无;

三是共同探索一条符合人文学科特质的AI应用路径,在技术效率与学术规范之间找到平衡点

四是针对当前OpenClaw热点,我们也邀请资深教师做了深度解析,为如何在数字人文研究中利用类似工具提供思路和操作指导。

期待这套课程能为联盟成员单位的一线教师提供切实可用的支撑,未来联盟将继续围绕学界需要,组织时效性好、系统性强、可实操的系列培训,期待大家在学习过程中形成的实践经验,能够反哺联盟的数字人文学科建设,形成共建共享的良性循环。

名称:零代码编程科研教学与智慧课程建设

课程容量:10门课程,每课2课时,共20课时。每课时45分钟,部分课程可能会根据授课情况加时,以实际安排为准。

开课时间:2026年4月7日-17日期间完成全部授课,详见下图培训计划。以实际安排为准。

培训形式:线上直播(支持2年回看)

课后支持:微信群(答疑+交流)+数字人文交流圈子深度交流+资料分享(长期)

基本信息

培训对象

  • 高校数字人文相关教师:从事语言学、古典文献学、历史学、文学等学科研究以及需建设智慧课程或开展数字化教学创新的青年教师;

  • 硕博研究生:人文类专业(特别是数字人文、古典文献、汉语方言、历史文化方向)在读研究生,需掌握零代码研究工具者;

  • 中小学文史教师:需利用AI与多模态技术进行备课、课程教学及创意传播的中小学语文、历史教师;

  • 文化机构从业者:博物馆、图书馆、出版社的数字项目策划人员,古籍整理与数字化工作者;

  • 跨学科研究者:关注"AI+人文"交叉领域,希望掌握结构化数据处理、人文数据库搭建、智能体建设方法论的研究人员。

考核认证:完成全部课程学习可获得由数字人文专业发展联盟颁发的电子证书

费用:980元/人(标准),680元/人(凭学生证)。团体报名及联盟成员单位团购另享优惠,请咨询工作人员。

教师简介

李斌

南京师范大学文学院教授,语言大数据与计算人文研究中心负责人。主要从事计算语言学和数字人文领域的研究,特别集中于古汉语信息处理领域的古文断句、分词、词性标注、词义分析的标准制定、资源构建和自动分析等具体技术研发。

胡韧奋

北京师范大学文学院、国际中文教育学院副教授,研究方向为计算语言学、数字人文,主讲Python编程与数据分析、自然语言处理等课程,主持十余项科研课题,作为主持人或核心成员构建了中文词向量资源库、CCA中文搭配助手、古诗文断句标点系统、“AI太炎”古汉语大模型等资源和应用。

彭志峰

暨南大学文学院中文系讲师,广东省岭南数字人文实验教学示范中心(省级)副主任,暨南大学-科大讯飞方言语音科技联合实验室(省级)副主任,暨南大学汉语方言研究中心(省级)研究员,粤语语料库建设与大模型评测重点实验室(市级)研究员,研究方向为数字人文与方言科技。

张光伟

陕西师范大学历史文化学院讲师,硕士研究生导师。担任陕西师范大学丝绸之路历史文化虚拟仿真实验教学中心(省级)主任,国际长安学研究院数字长安研发中心主任,全国历史学实验室建设联盟秘书长,国际教育合作协会(GPE)咨询委员会委员。主要从事"人工智能+历史学"交叉学科研究。

沈威

华中师范大学语言与语言教育研究中心副教授,博士,硕士生导师。研究方向为中文信息处理、现代汉语语法。主持并研发了“当代小说语料库”“汉语复句语料库”“汉语中介语动态语料库”和“我国中小学生写作能力评价与教学策略研究数据库”等语料库。

龙润田

暨南大学文学院副教授,博士生导师,暨南大学汉语方言研究中心研究员、岭南数字人文广东省实验教学示范中心研究员、暨南大学—科大讯飞方言语音科技联合实验室研究员。主要从事南方少数民族语言历史与文化、语言智能与数据计算、国际中文教育相关领域的研究工作。

贾智

中山大学中国语言文学系(珠海)教授、博士生导师、系副主任。主要研究方向为汉语言文字学,特别是中古汉语、近代汉字的发展、流变和域外传播研究,兼及敦煌遗书、域外文献整理与研究。

唐宸

清华大学人文学院副教授,教育部哲学社会科学实验室“中华传统文化智能实验室”核心成员,兼任《数字人文》编辑,主要从事中国古典文献学、数字人文研究,研发了“典津-全球汉籍影像开放集成系统”“奎章阁-中国古典文献资源导航系统”“中国数字人文(DHCN)”等基础设施。

张宁

北京师范大学文理学院中文系讲师、硕士研究生导师,北京师范大学珠海校区图书馆数字人文中心主任,中国计算机学会(CCF)人文智能专业委员会执行委员。研究方向为古籍数字叙事、VR古籍游戏、数字人文教育等。 主持建设"文献多模态资源AI标注与问答平台”“京师.数字记忆3D展厅平台”“全球数字人文教育资源智能检索平台”。

内容亮点

亮点1:科研+教学双轮驱动

既解决"如何用AI做研究"(零/低代码建设数据库智能体及科研全流程),又解决"如何用AI教课"(智慧课程建设),适配高校教师双重身份需求。

亮点2:紧跟热点:解析OpenClaw及国产替代方案

聚焦海外智能体框架OpenClaw在国内遇到的技术限制、部署成本、数据合规等痛点,先讲OpenClaw是什么、为什么火,再讲为什么要转国产替代。通过讯飞AstronClaw、腾讯WorkBuddy深度测评,给出国产“龙虾”三步实操法,帮大家把大模型变成能落地执行的主动辅助系统,减少重复劳动、提升效率,最后辨析需求真伪并答疑。

亮点3:全链路场景覆盖

从底层数据结构化→大模型原理→数据库与智能体搭建→史料挖掘→统计分析→智慧课程→多模态传播,形成闭环生态。从数据结构化、大模型原理到智能体搭建、史料挖掘、统计分析,智慧课建设,全程无需编程基础,紧盯高校教师实际困难。

亮点4:社群支持

社群答疑(微信群)+ 深度交流(专业圈子)+ 长期赋能(资料共享),构建从课堂到社群的持续支持体系。

费用及报名

  • 980元/人(标准)

  • 680元/人(凭学生证)

  • 集体报名另享优惠,请咨询工作人员。

扫码报名

咨询:报名链接内客服可直接发起咨询。

联系电话:185-1932-5994

邮箱:training@ancientbooks.cn

  • 学生身份报名,请先正价付费,同时将您的姓名、学校、手机号(已与本平台关联)、学生证照片发送至邮箱【training@ancientbooks.cn】(邮件名:姓名+学校+学生优惠申请)。 工作人员审核完毕后将为您退差价,系统原路退回,耐心等待即可。

←了解我们正在进行的项目

籍合学院

中华书局旗下

古籍整理与传统文化学习平台

阅读原文

跳转微信打开

  •  

课程介绍丨数据基础与人文数据结构化

2026-03-27 17:31 北京

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

本课程为零代码编程模块基础课,也是我们本次培训的第一讲。目标是帮助学员建立数据与数据结构的基础理论,这也是我们开启后续所有工作的理论基础。

数字人文的交叉,在于将计算机科学的结构化思维、海量数据处理能力与复杂计算模型引入人文研究领域。其中,知识的结构化是推动人文学科突破性进展的基石。知识的结构化数据处理并非简单地将人文材料(如古籍扫描、文物三维模型)存入计算机形成“机采数据”,其本质在于将蕴含复杂概念体系、事件关系和文化内涵的人文知识节点,转化为由清晰定义的概念节点及其间的有效关系构成的逻辑体系。

主讲人:李斌

南京师范大学文学院教授,语言大数据与计算人文研究中心负责人。主要从事计算语言学和数字人文领域的研究,特别集中于古汉语信息处理领域的古文断句、分词、词性标注、词义分析的标准制定、资源构建和自动分析等具体技术研发。研制多种语料库在国际LDC平台发布,出版专著《语言探秘》等3部,发表论文70多篇。主持完成国家社会科学基金项目2项、教育部社科青年项目1项。

*了解培训详情及报名请扫描本文海报二维码。

←了解我们正在进行的项目

籍合学院

中华书局旗下

古籍整理与传统文化学习平台

阅读原文

跳转微信打开

  •  

会议摘要征集 | 人工智能(AI)对粤港澳大湾区社会、文化与治理发展的影响

社科大数字史学实验室 2026-03-27 17:31 北京

分享一篇文章

智能数字人文: 会议摘要征集 | 人工智能(AI)对粤港澳大湾区社会、文化与治理发展的影响

会议资讯  

  2026年5月22日(星期五)

地点:北师香港浸会大学

投稿资格  

硕士研究生

博士研究生

活动亮点  

  • 展示研究成果,与来自不同学科的学者交流并获得专业回馈

  • 参与跨学科讨论,深化对人工智能与社会议题的理解

  • 建立跨院校及跨领域研究网络,探索未来合作机会

投稿格式  

论文摘要:200-250字(中英文)

关键词:3-5个

 奖  项   

设有两项最佳论文奖(分为大湾区内及大湾区外)

每名得出可获港币1000元现金奖

摘要提交截止日期  

2026年4月20日

查询及投稿  

联络人及电子邮箱

  • Ms.Caroline:caroline_liao@hkbu.edu.hk(FASS)

  • Ms.Li:cihk@cihongkong.hk(CASS) 

  • Ms.Liu:rpgcomm@bnbu.edu.cn(BNBU)

报名方式  

请扫描海报上的二维码注册

图片


阅读原文

跳转微信打开

  •  

第二十五届中国计算语言学大会(CCL26-Eval)技术评测任务发布

徐惠 2026-03-25 00:01 江苏

CCL2026十月宜昌举办,发布13项NLP评测任务设奖项收录论文

转载自“CIPS计算语言学专委会”

第二十五届中国计算语言学大会

(CCL26-Eval)技术评测任务发布

会议网站:http://cips-cl.org/static/CCL2026/index.html

第二十五届中国计算语言学大会(The 25rd China National Conference on Computational Linguistics, CCL 2026)将于2026年10月15至18日在湖北省宜昌市举行。会议主办单位为中国中文信息学会。CCL是中国中文信息学会(CIPS)的重要会议,是中国最大的自然语言处理学者和专家的社区。经过三十年的发展,CCL被广泛认为是最权威的,全国最具影响力、规模最大的NLP会议。随着计算机语言处理在中国的发展,CCL已经成为在全国范围内传播计算语言新学术和技术工作的主要论坛。

本次大会继续组织中文语言处理技术评测CCL26-Eval。经过前期评测任务征集,CCL25-Eval组织委员会已确定13个评测任务,涵盖语义分析、篇章、语用分析,跨语言、小语种、低资源自然语言处理,知识图谱,自然语言处理与医疗、教育、人文、司法等领域结合应用,生成式AI与大模型核心能力等研究方向。欢迎广大研究者参与评测竞赛。每个评测任务都会根据比赛结果设立一、二、三等奖若干名,由中国中文信息学会颁发官方荣誉证书。评测的总结论文和优秀技术报告将被CCL Anthology和ACL Anthology收录。

评测主席:

林鸿飞(大连理工大学,hflin@dlut.edu.cn)

谭红叶(山西大学,tanhongye@sxu.edu.cn)

杨亮(大连理工大学,liang@dlut.edu.cn)

评测任务

一、 自然语言处理基础任务

1. 语义分析 / 篇章、语用分析

任务1:第二届中文叙实性推理评测

任务简介

叙实性推理(Factivity Inference, FI)是一种跟事件真实性判断有关的语义理解任务,是真实性推理(Factuality Inference, FactI)的一种形式。在人类的会话交际中,叙实性推理能力主要表现为语言使用者可以从某些动词性语言成分(如“相信”“谎称”“意识到”等)的使用获取说话人和句子主语的心理状态,并据此推定相关事件的真实性(真还是假)。例如,从肯定句“他们意识到局面已经不可挽回”和相应的否定句“他们没有意识到局面已经不可挽回”上,都可以推理出在说话人眼中存在这样一个事实:“局面已经不可挽回”。进行此类推理所使用的知识是一种受世界知识(world knowledge)影响较小、主要涉及语言内部各成分之间语义关系的分析性语言知识(analytical knowledge of language)。比如,上面例句中的动词“意识到”要求(预设)它的宾语“局面已经不可挽回”的所指大概率为真,不管该动词前面有没有否定性词语。

为进一步提升大型语言模型对中文的语义理解能力,实现机器对人类交际话语的深度理解,我们将在FIE2025的基础上继续推出“第二届中文叙实性推理评测任务”。本届评测任务将着重考察大型语言模型在复杂语境条件和少样本提示下的叙实性推理表现。

相较FIE2025,本届评测的数据集涵盖了数量更多的叙实性谓词(约500个)以及更加多样的语境条件,例如否定词“不、没有、差点”,否定意愿“不敢、不想、不愿、难以”,被动化操作“被、被迫”,评价性状语“正确地、错误地”,多声性标记“并不、绝不”,等等。例如:从“我不能相信他竟是一个八十多岁的老人”,可以推出“他是一个八十多岁的老人”大概率为真;而从“我不能相信人可以长生不老”,可以推出“人可以长生不老”大概率为假。

任务描述

参赛队伍需要利用组织方发布的样例集与评测集自行设计提示词(prompt),在获取LLMs的回答后整理为统一的输出格式。每条评测集数据以一个文本蕴含关系句对<Aa, a>的形式呈现,数据集以JSON格式保存。

模型需要根据主蕴含句Aa的内容判断被蕴含句a的真值情况,并给出对该判断的置信度。例如: * 主蕴含句Aa: 老张并没有注意到她今天穿了一件红色的连衣裙。 * 被蕴含句a: 她今天穿了一件红色的连衣裙。 * 模型判断: 被蕴含句95%为真。 * 输出答案(JSON字段): {"factivity": "true", "confidence": "0.95"}。

此外,本届评测将继续设置不微调(non-finetuning)和微调(finetuning)两条赛道。不微调赛道不允许对模型本身做任何修改;微调赛道可以利用样例集数据对模型参数进行微调。鼓励尝试进行多样化、复合化测试手段以获得更好的回答表现。

组织者和联系人 

  • 任务组织者:袁毓林(澳门大学教授)、李斌(南京师范大学教授)

  • 任务联系人:丛冠良(澳门大学博士生,guanliang.cong@connect.um.edu.mo);寻天琦(澳门大学博士生,tianqi.xun@connect.um.edu.mo)。

任务奖项 

本届评测将为不微调赛道和微调赛道分别设置一、二、三等奖,奖项按总得分从高到低颁发。其中,一等奖0-1名,二等奖0-2名,三等奖0-3名。各奖项奖金待定。

任务网址

 https://github.com/UM-FAH-Yuan/FIE2026

任务2:非字面义翻译和理解评测

任务简介

评测面向谚语、成语、习语、俚语、典故等非字面表达的中英翻译与识别,重点考察模型对非字面意义的理解、跨语言文化映射能力以及语用效果保持能力。任务构建了“生成 + 判别”互补评测框架,用于检验模型的非字面义表达生成能力和标准非字面义辨识能力。评测数据共 5000 条高质量样本,涵盖 Gold(习语/谚语体等值表达)和 Silver(解释性等价改写)两类参考。本次评测包括两个子任务。

  • 子任务1:非字面义中文翻译为英文 给定一条包含谚语、成语、习语等非字面表达的中文句子,模型需生成 1 条自然、地道、具有文化映射特征的英文译文,优先采用英语中现成的习语、谚语、格言或固定搭配进行等值替代。

  • 子任务2:非字面义中英选择 给定一条非字面表达的中文句子及若干个英文候选,模型需进行不定项选择,识别并输出与中文在英语语境中构成公认等值替代关系的 Gold 标签项。

组织者和联系人 

  • 评测组织者: 张冬瑜(大连理工大学教授)

  • 任务联系人: 杨森淇(大连理工大学博士生,ysq1997@mail.dlut.edu.cn)

任务奖项 

本届评测设置一、二、三等奖,由中国中文信息学会提供荣誉证书。

任务网址

https://github.com/DUTIR-YSQ/CCL2026-Non-literal-Translation-Task

2. 跨语言、小语种、低资源自然语言处理

任务3:跨主流语言与低资源语言对齐的大模型金融评测

任务简介

MapFinBen 是首个专门评估大语言模型在高资源语言与低资源语言之间跨语言资源的多语言金融评测基准。该基准覆盖了五类具有代表性的金融任务,全面反映真实金融应用场景中的多样化需求。

在语言设置上,MapFinBen同时涵盖高资源语言(英语和中文)与多种低资源语言(印度尼西亚语、西班牙语、希腊语和日语),有效缓解了现有金融语言模型评测中对高资源语言过度依赖的问题。通过统一的任务设计与评测标准,该框架能够系统评估大模型跨语言、跨资源条件下的金融任务处理能力。

MapFinBen 基准由五个子任务构成,通过综合评估模型在各子任务上的表现来确定最终成绩。具体任务如下:

  • 子任务一:金融选择问答(FinAS) 给定一段金融文本及其对应的问题和候选选项,模型需要从多个备选答案中选择最符合问题语义和金融语境的正确答案。

  • 子任务二:金融文本问答(FinQA) 给定一段金融文本,模型需要根据文本内容回答与之相关的金融问题。

  • 子任务三:金融情感分析(FinSA) 给定一段金融文本,模型需要识别文本所表达的情绪倾向,并将其分类为积极、中性或消极。

  • 子任务四:金融主题分类(FinTC) 给定一段金融文本及候选主题类别,模型需要根据文本内容将其归类到最合适的金融主题类别中。

  • 子任务五:金融文本摘要(FinTS) 给定一段金融文本,模型需要提取并生成简洁、准确的摘要,以概括文本的核心信息和主要内容。

各子任务的数据分布、数据结构、具体评测指标及其计算方式,以及最终成绩的计算方法,详见任务网址。

组织者和联系人 

  • 评测组织者:胡刚、岳昆(云南大学)、彭敏(武汉大学)、石磊(云南师范大学)

  • 任务联系人:孔晓勇(kongxiaoyong@stu.ynu.edu.cn)

任务奖项 

本届评测将设置一、二、三等奖,由中国中文信息学会提供荣誉证书。

任务网址

https://github.com/HgITSE/MapFinBen

任务4:低资源缅甸语固定模版语句推理评测

任务简介

在缅甸语等低资源语言的翻译中,固定模版语句的推理作为垂类的任务,其语言内部的词性、地名、多元价值观等显著影响着最终的翻译质量。

格式与习惯差异

例如,中文的“第1名”、“第3章”,在缅甸语意为“编号”或者“号”,后面需要紧跟缅甸语数字。地名转写冲突:地名转写往往与缅甸语特有发音、历史习惯冲突,导致中文直接转写容易出现混乱。多元价值观影响:翻译受种族、宗教以及集体主义的影响,不能简单直译。必须充分考虑当地的文化敏感性和宗教背景,否则极易引起误解或反感。

作为固定模版语句的推理任务,机器具体要适应的是模版格式、幻觉处理等任务的重要形式依据。为了提升翻译大模型在缅甸语上的翻译质量,进一步实现机器对人类固定模版语句的深度理解,我们正式推出本次评测任务。

组织者和联系人 

  • 评测组织者:陈自岩、刘劲松(新译信息科技有限公司)、朱少林(天津大学)

  • 任务联系人:任虹(天津大学博士生,邮箱地址:rhong@tju.edu.cn);吴川(天津大学硕士生,邮箱地址:wuchuan@tju.edu.cn)

任务奖项 

本届评测将设置一、二、三等奖,由中国中文信息学会提供荣誉证书。奖金由 新译信息科技有限公司赞助。

任务网址

https://github.com/merc11/CCL-2026

二、 自然语言处理应用

1. 知识图谱

任务5:杂粮育种信息抽取评测

任务简介

杂粮育种领域积累了大量以自然语言形式呈现的知识,广泛分布于论文、品种审定与栽培技术规程等文本中。这些文本记录了育种材料来源、目标性状及测定结果,同时也包含栽培管理条件、胁迫处理信息以及分子标记等证据。由于杂粮育种文本专业术语密集、概念表述多样,且材料名称与试验要素常存在嵌套表达,导致关键信息难以稳定抽取和统一结构化,从而限制了知识检索、证据汇总和育种决策支持等应用的发展。

杂粮育种信息抽取评测(Minor Grain Breeding Information Extraction Evaluation, MGBIE)旨在面向杂粮育种知识管理与数据资源建设需求,系统评估信息抽取模型在杂粮育种相关专业术语识别、育种语境理解、关键信息抽取与结构化表达等方面的能力。MGBIE数据集总规模为2000条样本,其中训练集、验证集和测试集分别包含1000条、400条和600条,用于支持模型的训练、调优与综合性能评估。

MGBIE2026包含以下两个子任务:

  • 杂粮育种命名实体识别: 从杂粮育种相关文本中识别并抽取关键实体信息,并输出相应的实体边界及其类型标签。实体类型标签体系涵盖杂粮育种领域的核心概念,共包括12类:作物、品种、性状、生育时期、基因、数量性状位点、分子标记、染色体、育种方法、亲本/杂交组合,非生物胁迫以及生物胁迫。 

  • 杂粮育种关系抽取: 在已识别实体的基础上,进一步抽取实体之间的语义关系,并以关系三元组的形式进行结构化表示。关系类型体系共包含6类语义关系,分别为:包含、采用、具有、影响、发生于和定位于。

组织者和联系人 

  • 评测组织者:胡志伟、孔照胜、高建华(山西省后稷实验室、山西农业大学);谭红叶、闫智超、李茹(山西大学);谢倩倩(武汉大学)

  • 任务联系人: 杨森杰(山西大学硕士生,yangsenjie1@sxu.edu.cn)

任务奖项 

本届评测将设置一、二、三等奖,由中国中文信息学会提供荣誉证书。

任务网址

https://github.com/zhiweihu1103/CCL2026-MGBIE

2. 自然语言处理与医疗、教育、人文、司法等领域结合应用

任务6:中文电子病历疾病与手术ICD自动编码评测 

任务简介

近年来,随着人口老龄化加剧和健康意识提升,医疗体系面临着日益增长的服务压力。在医疗信息化进程中,电子病历的广泛应用为解决这一挑战提供了新的可能。为实现医疗数据的标准化管理和共享,世界卫生组织制定了国际疾病分类标准(International Classification of Diseases,ICD)。该标准将数万种疾病及其组合转化为规范的字母数字编码体系,为跨地区、跨机构的医疗数据交换与分析奠定了基础。

然而,对电子病历文本进行人工ICD编码不仅耗时耗力,还容易因专业技能差异导致编码错误。开发自动ICD编码系统,既能提高编码效率和准确率,也能为疾病研究和医疗管理提供更可靠的数据支持。基于上述背景,本任务构建了一个中文电子病历ICD自动编码数据集,该数据集基于脱敏病历数据而构建,共涉及10个科室,19种主要疾病编码,若干种其他疾病编码,16种主要手术编码,若干种其他手术编码,共计2200条数据。该任务给定一段由临床信息构成的文本作为输入,需要模型输出对应的主要疾病编码、其他疾病编码、主要手术编码、其他手术编码。

组织者和联系人 

  • 评测组织者:管红娇、鹿文鹏(齐鲁工业大学(山东省科学院))、廉颖、陈国强(山东第一医科大学第一附属医院)

  • 任务联系人: 李传龙(齐鲁工业大学硕士生,icdevaluator@163.com)

任务奖项 

本届评测将设置一等奖1名,二等奖3名,三等奖6名,由中国中文信息学会提供荣誉证书。

任务网址

https://github.com/QLU-NLP/icdevaluator-26

任务7:跨语言文学文本情感分析一致性评测 

任务简介

随着多语言大模型(Multilingual Large Language Models, MLLMs)的快速发展,自然语言处理技术在现代通用语料上的表现已趋于成熟。然而,在面对具有高语境依赖性和深厚文化底蕴的中国古典文学时,现有的情感分析技术仍面临巨大挑战。 中国古典文学的情感表达具有典型的“含蓄蕴藉”与“托物言志”特征,往往依赖特定意象、历史典故以及复杂修辞来传递情绪,而非直接使用情感形容词。 为此,本评测提出中英双语古典文学跨语言情感分析评测任务(BCCL-CSA),用于评估模型在古典文学语境中的情感理解能力以及跨语言语义对齐能力。

子任务

  • 子任务一:细粒度情感识别能力评估 参赛系统需对给定的中文古典原文及其对应的英文译文进行独立的情感特征捕获。这一任务考察模型是否具备克服古今语言差异的能力,以及在目标语言(英语)中准确还原古典意境情感的能力。评测将从以下维度评估: 1. 情感极性识别准确率Acc_pol:准确识别文本的情感极性(积极、中性、消极)。 2. 情绪分布识别精度F1_emo(情绪Macro-F1):准确预测文本在六种基本情绪(快乐、悲伤、恐惧、愤怒、惊讶、厌恶)上的概率分布,以捕捉文学作品中复杂微妙的混合情绪。 3. SubScore1 = 0.4 × Acc_pol + 0.6 × F1_emo

  • 子任务二:跨语言情感表征一致性评估 该任务关注模型在不同语言间的情感映射稳定性,即同一语义内核在不同语言表征下的一致性。这是衡量模型是否真正实现了“语义对齐”而非简单的“词汇对齐”的关键:极性判断一致性(Con_label):评估同一组中英句子对在预测结果中极性标签的匹配程度。情绪分布相似度Sim_dist(情绪分布余弦相似度):通过计算中英情绪概率向量的相似性,评估模型跨语言情感空间的表征对齐质量。

任务特色与创新

 1. 跨语言情感对齐维度:突破单一语言的情感分类范式,首次聚焦于中英双语在复杂古典文学语境下的情感语义一致性。 2. 精细化分布标注:提供情绪概率分布(Label Distribution),精准捕捉文学作品中复杂、模糊的情感底色。 3. 语料库稀缺性与挑战性:数据集精选自先秦至近代的 13 部经典著作,涵盖哲学、小说、戏曲等多种体裁,挑战模型泛化性能与抗噪声能力。

数据集说明

数据集 CCL-SEL,来源于12部中国经典著作,每部著作各250组中英句子对。

评价指标

  •  子任务一:细粒度情感识别评分(权重 50%) * 极性准确率 (Acc_pol) * 情绪 F1 分数 (F1_emo) * Sub_Score_1 = 0.4 × Acc_pol + 0.6 × F1_emo

  • 子任务二:跨语言一致性评分(权重 50%) * 标签一致性比例 (Con_label) * 分布相似度 (Sim_dist) * Sub_Score_2 = 0.5 × Con_label + 0.5 × Sim_dist

最终排名得分:Total_Score = 0.5 × Sub_Score_1 + 0.5 × Sub_Score_2

参赛要求 

参赛系统需针对中英双语文本提供情感分析模型(统一多语言模型或独立单语言模型均可)。 * 允许使用开源预训练模型进行微调,但需在技术报告中说明。 * 提交测试集的情感极性标签及情绪分布预测结果(JSON格式)。

网站建设与论文评审 

评测将建设GitHub页面发布数据、脚本与排行榜。评测论文将通过CCL26-Eval通道提交,并进行双盲评审。

评测意义

本评测通过提供 12 部跨时代著作的高质量标注数据,旨在解决古典文学在跨语言传播中的情感扭曲问题,推动多语言大模型向更高层次的文化对齐迈进。

组织者和联系人 

  • 评测组织者: 张海洋、张霄军(西交利物浦大学);徐睿峰(哈工大深圳)

  • 任务联系人: 周静狮(Jingshi.Zhou@outlook.com)

任务奖项 

一等奖1名,二等奖2名,三等奖3名。

任务网址

https://github.com/Jingshi-Zhou/-BCCL-CSA-2026-

任务8:大语言模型生成中文医疗内容的循证事实核查

任务简介

循证事实核查(Evidence-based Medical Fact-checking)是一项旨在验证在线医疗内容真实性的关键任务。随着互联网成为公众获取医疗健康信息的主要渠道,医疗虚假信息的泛滥给公共卫生安全带来了严峻挑战。该任务要求模型不仅要理解医疗声明(Claim),还需要结合检索到的相关证据(Evidence),判断证据对声明的支持程度(如支持、反驳或证据不足)。这一过程对于提高医疗信息的透明度、减少误导性信息的传播具有不可替代的作用,同时也是构建可信赖的医疗问答系统和智能医疗助手的核心安全屏障。

任务的具体目标定义如下:给定一组由大语言模型生成的医疗论断及其对应的证据,模型应预测正确的标签(即真实性),从而判断证据支持或反驳该论断的程度:

  • 支持(Supported):证据完全支持声明的内容;

  • 部分支持(Partially Supported):证据支持声明的部分内容,但存在不确定性或未覆盖的细节;

  • 反驳(Refuted):证据与声明内容相矛盾;

  • 不确定(Uncertain):证据与声明相关,但不足以证实或反驳声明的真实性;

  • 不适用(Not Applicable):证据与声明完全不相关。 

组织者和联系人

  • 评测组织者:苏炯龙、蒋正雍、王唯(西交利物浦大学)

  • 任务联系人: 陈彤(西交利物浦大学,Tong.Chen19@student.xjtlu.edu.cn)

任务奖项 

本届评测将设置一、二、三等奖,由中国中文信息学会提供荣誉证书。

任务网址

https://github.com/AshleyChenNLP/MedFact

任务9:第二届古诗词赏析评测

任务简介

中文古诗词具有高度凝练性和语言的音乐美,讲究对仗、平仄和押韵。为了准确理解古诗的语义,不仅需要掌握古诗的语言特色,还需要调动对历史、文化背景的知识,结合对古诗中所描绘的自然景象和人物情感的认知,从而进行综合性的推理与理解。

为了进一步衡量模型在中文古诗词赏析场景中的语言理解深度与文化推理能力,我们推出第二届中文古诗词赏析评测。在第一届的基础上,本届评测进一步聚焦模型的深度理解与复杂推理能力,引入更具挑战性的高级任务,以全面考察模型对古诗词文化内涵与高层语义结构的掌握程度。具体任务设置如下:

  • 任务一:古诗词理解:

古诗词字词理解:解释古诗词中短语级别的语义。本子任务通过问答题的形式对待测系统进行评估。

古诗词诗句理解:解释古诗词中诗句级别的语义。本子任务通过问答题的形式对待测系统进行评估。

古诗词情感理解:推断诗人透过作品所传达的情感。本子任务通过选择题的形式对待测系统进行评估。

典故识别:判断诗句中是否包含典故并进行解释。本子任务通过问答题的形式对待测系统进行评估。

  • 任务二:古诗词推理:

古诗词类比:发现古诗词中不同事物之间的相同关系,意象的关联。本子任务通过问答题的形式对待测系统进行评估。

古诗词辨析:依据诗词内容与语境,对给定选项进行辨析,判断其中表述最为合理的一项。本子任务通过选择题的形式对待测系统进行评估。

本评测将根据两个任务的综合性能来确定最终成绩排名。本评测旨在评估自然语言模型自身对中文诗词的理解水平,参赛队伍可以使用开源大语言模型进行微调,禁止使用RAG等技术来利用外部知识回答问题。

组织者和联系人 

  • 评测组织者:白雪峰、陈科海(哈尔滨工业大学(深圳)) 

  • 任务联系人: 朱颖杰、裴振武(哈尔滨工业大学(深圳),zhuyj@stu.hit.edu.cn)

任务奖项 

 一等奖1名,奖金合计3000元;二等奖1名,奖金合计2000元;三等奖1名,奖金合计1000元。 所有奖金将在公布奖项后10个工作日内发布。

任务网址

https://github.com/HITICI-NLPGroup/CCPA-EvalTask

三、 生成式AI与大模型核心能力

任务10:基于情景的常识推理评测

任务简介

推理是一种高级认知功能,涉及基于现有知识对新信息进行分析、归纳和演绎。它在人类智能中起着基础性作用。虽然以往的基准测试主要侧重于评估大语言模型(LLMs)在复杂、专业领域内的推理能力,但它们往往忽视了类人认知的一个关键方面:常识推理。评估大型语言模型中的这种常识推理能力对于人工智能的发展至关重要。这种基本能力显著影响着 LLMs 在日常情境中的决策,并且对于在通用人工智能(AGI)中迈向类人智能至关重要。

为了全方位、细粒度地诊断大模型的常识推理能力,我们提出了基于情景的常识推理评测数据集(Scenario-based Commonsense Reasoning Evaluation, SCoRE),用以评估大语言模型在常识场景下的复杂逻辑推理能力。根据所涉及的常识领域,该数据集包含的任务可分为以下五类: * 空间常识推理: 给定一个空间场景和若干已知的实体间方位关系,本任务要求机器推理出实体在空间场景中的位置,以及未知的方位关系。 * 时间常识推理: 给定一个包含若干事件的时间叙述场景和已知的事件间时间关系(如先后顺序、持续时长、相对或绝对时间点),本任务要求机器推理出事件在时间轴上的具体时刻,以及未知的事件间时间跨度或次序关系。 * 社会常识推理: 给定一个社会交互场景和若干已知的人物间人际关系(如亲属、职场、朋友或师徒关系),本任务要求机器推理出人物在社会网络中的具体角色或地位,以及人物间隐含的或未知的社会关系。 * 自然常识推理: 给定一组自然物体(或实体)和若干已知的属性约束条件(如类别归属、物理性状、功能用途或感官特征),本任务要求机器推理出物体与描述(或位置)的一一对应关系,以及物体未知的属性或分类特征。 * 融合常识推理: 融合领域任务描述旨在构建一个多维度条件交织的推理问题。它要求机器同时处理来自空间、时间、自然属性及社会关系等多个领域的约束与常识,并建立统一的推理模型以进行协同分析与决策。其核心挑战在于,单一领域的逻辑链条不足以解决问题,必须识别并整合不同领域的隐含联系,才能对复杂多因素情境进行有效推断。

组织者和联系人 

  • 评测组织者:詹卫东、穗志方(北京大学) 

  • 任务联系人:胡楠(北京大学博士生,hunan@stu.pku.edu.cn)

任务奖项 

一等奖0-1名; 二等奖0-2名;三等奖0-4名。

任务网址

https://pku-space.github.io/SCoRE2026/

任务11:面向自动驾驶的自动化危害分析与风险评估评测任务

任务简介

随着汽车电子电气架构(E/E 架构)向智能化与网联化深度演进,功能安全已超越早期以机械系统为主的工程保障范畴,演变为覆盖软硬件协同设计的系统化安全工程体系,成为自动驾驶技术落地与量产的关键基石。在此体系中,危害分析与风险评估(HARA, Hazard Analysis and Risk Assessment)承担着风险识别与顶层安全需求定义的核心职能。该过程通过对车辆运行场景、潜在功能失效模式及环境要素的系统化建模,提取车辆运动状态、道路拓扑及交通参与者分布等关键特征,并基于严重度(S)、曝光率(E)和可控性(C)三个维度对风险进行量化评估,确定汽车安全完整性等级(ASIL),并将评估结果转化为顶层安全目标,进而分解为可验证的软硬件安全需求,指导系统设计与工程实施。

为推动大模型与人工智能技术在预期功能安全及功能安全领域的落地应用,提升HARA流程的自动化与智能化水平,我们提出“面向自动驾驶的自动化危害分析与风险评估评测任务”并构建了一个专注于评估自动驾驶安全逻辑推理与需求生成的结构化数据集。该数据集源自脱敏的真实工业项目数据,聚焦于动力系统核心高危失效模式——“非预期驱动力/扭矩输出”,共包含3,000条高质量标注数据。

本次评测包括以下两个子任务: * 危害事件识别与场景描述生成: 该任务要求模型基于给定的车辆运行工况与环境参数,精准识别潜在的危害事件,并生成符合工程规范的危害场景结构化描述。 * 风险参数评定与等级推理: 该任务要求模型基于场景特征,推理并输出HARA分析的关键风险指标(S/E/C),并据此判定相应的安全完整性等级。

组织者和联系人 

  • 评测组织者:杨旭(北京理工大学),张海洋(西交利物浦大学),王唯(西交利物浦大学)

  • 任务联系人:王子木(西交利物浦大学博士生, Zimu.Wang19@student.xjtlu.edu.cn)

任务奖项 

一等奖1名,奖金合计5000元 * 二等奖1名,奖金合计3000元 * 三等奖1名,奖金合计2000元。

赞助情况 :本次评测奖金由优策科技(福州)有限公司赞助。

任务网址 

https://ccl2026-hara.github.io

任务12:优酷无障碍剧场杯-面向听障群体的信息无障碍结构化字幕生成评测

任务简介

在我国已进入“制度保障”阶段的信息无障碍建设背景下,字幕已成为听障及老年群体获取音视频信息的关键无障碍服务。然而,现有技术评测缺乏面向真实应用场景、统筹考量“可读性”、“核心信息准确度”与“响应速度”的基准。本任务从“AI字幕是基础设施”的视角出发,系统评测从“语音/视频输入”到生成“面向人类阅读的结构化字幕文档”的完整链路,特别聚焦于解决高信息密度真实场景(如医疗、金融、政务办事)中“社交时差”与“关键信息丢失”两大痛点。

为贴近不同应用环境,评测任务被设计为两个平行赛道,以全面评估技术的能力上限与落地可行性: * 赛道A:PC端 模拟云端或高性能桌面环境,旨在探索技术性能上限,不限制计算资源。 * 赛道B:手机端 模拟移动设备(手机、AR眼镜)实时交流场景,对模型体积、内存占用及实时性提出明确的约束要求。

每个赛道均包含以下两个子任务:

1. 子任务一: 基础字幕生成(Foundation Track) 评估语音转写、时间戳对齐、噪声鲁棒性等基础能力。 * 评测指标: 转写准确性、时间轴对齐精度、复杂多人场景下的综合处理能力。

 2. 子任务二: 结构化可读字幕生成(Structured Track) 评估模型生成符合人类阅读习惯、包含合理断句、标点、说话人区分、并确保核心关键词准确性的结构化字幕的综合能力。 * 自动评测指标: 文本准确性、核心词召回率、模拟显示延迟、时间轴合理性偏差、结构一致性。 * 人工评测指标(抽样): 可读性(1-5分)、关键信息完备性、断句合理性、标点与语气匹配度、幻觉文本严重程度。

数据规模与来源

本评测构建了总规模约30–50小时的多场景真实语音/视频测试集,涵盖新闻演讲、影视综艺、生活真实交流、多人会议等四类典型场景。其中,约10–15小时的核心子集提供更高粒度的结构化标注与核心关键词标注,支持Track 2的深度评测。数据来源强调真实性与多样性,包含背景音乐干扰、环境噪声、远场收音、多人重叠语音等复杂声学条件,全面模拟听障用户在办事场景中的实际听觉挑战。

组织者和联系人 

  • 评测组织者:姚登峰(北京联合大学/清华大学)

  • 任务联系人:施杰(北京联合大学硕士,20251083510951@buu.edu.cn)

任务奖项 

本届评测将设置一、二、三等奖,由中国中文信息学会为获奖队伍颁发荣誉证书;同时设立赞助奖项,由阿里巴巴等头部科技企业提供奖品支持。

任务网址 

https://github.com/ALINOSJ/IASSGE-2026

任务13:图像文本翻译质量评测

任务简介

随着全球化进程加速和跨语言交流需求增长,图像文本翻译(In-Image Translation,简称“图翻”)已成为机器翻译的重要分支。与传统文本翻译不同,图翻需同时处理视觉与语言信息,涵盖文本检测、识别、翻译与渲染等多个环节,在跨境电商、旅游导览、多语言内容本地化等场景中具有广泛应用价值。中文图翻面临独特挑战:汉字视觉复杂性高、书写方向多样(横排/竖排)、与目标语言存在显著文本长度差异,且蕴含丰富文化内涵。尽管大型多模态模型在图像理解方面取得进展,但在保持视觉一致性的前提下实现高质量图翻仍困难重重。尤其在电商场景中,系统需区分“应翻译内容”(如功能说明)与“应保留内容”(如品牌标识),对翻译完整性与合规性提出更高要求。现有机器翻译评测指标(如BLEU、METEOR)仅关注文本准确性,无法衡量视觉呈现、排版布局、美学协调等关键维度。而人工评测成本高、主观性强、难以规模化。因此,亟需建立标准化、多维度、可自动化的图翻质量评测框架。

本次评测聚焦于如何设计和训练能够从多个维度对图像翻译结果进行精准评分的自动评测系统,从而为该领域的技术进步提供可靠的度量工具。旨在:建立标准化基准:构建包含多场景、多维度人工标注的大规模评测数据集。推动方法创新:鼓励研究者设计能够模拟人类专家判断的自动评测模型。探索评测范式:通过开放式竞赛,发现在不同应用场景下最有效的评测策略。促进社区共识:图像文本翻译质量评测建立可复现、可比较的评价标准。

组织者和联系人 

  • 评测组织者:李海军、尚姿芙、梁杰、徐昭、骆卫华

  • 任务联系人:韩雨轩(阿里云技术专家  baileng.hyx@alibaba-inc.com)

任务奖项 

一等奖1名,奖金合计20000元 ;二等奖1名,奖金合计10000元;三等奖2名,奖金合计5000元。

赞助情况:本次评测奖金由阿里云赞助,由中国中文信息学会为获奖队伍颁发荣誉证书。

任务网址 

https://tianchi.aliyun.com/competition/entrance/532463?spm=5176.12281973.J_6-HJZaSjQocH7SIdvbK02.1.376b3b74H1HNIn

相关链接:

任务征集 | CCL26-Eval中国计算语言学大会评测研讨会

第二十五届中国计算语言学大会(CCL 2026)征稿启事

比特人文

投稿邮箱:dhbase@126.com

扫码关注 获取更多资讯

图片

阅读原文

跳转微信打开

  •  

Convocatoria de los Premios HDH 2026

Convocatoria de los Premios HDH 2026

La Junta Directiva de la HDH, de acuerdo con la resolución adoptada en la reunión celebrada el día 24 de marzo de 2026, convoca la octava edición de los premios HDH (2026).

El objetivo de estos premios es contribuir al reconocimiento social y académico de aquellas investigaciones, iniciativas y actividades llevadas a cabo en el ámbito de las Humanidades Digitales que pongan de manifiesto la potencialidad de este campo para redefinir las disciplinas humanísticas en el marco de las condiciones tecnológicas y digitales de nuestro tiempo.

El Jurado estará compuesto por una comisión de expertos de reconocido prestigio en el campo de las Humanidades Digitales. Esta comisión será propuesta por la Junta Directiva de la HDH. Un miembro de la Junta Directiva de la HDH formará parte de esta comisión. Ninguno de los miembros de la citada comisión deberá tener conflictos de intereses con las candidaturas presentadas.

Las candidaturas podrán ser presentadas por el propio autor/responsable(s) o bien venir avaladas por dos investigadores/especialistas en Humanidades Digitales.

Categorías

Se establecen las siguientes categorías.

1) Mejor artículo científico publicado en 2025

2) Mejor herramienta, recurso, infraestructura desarrollada en 2025

3) Mejor iniciativa formativa desarrollada en 2025

4) Mejor iniciativa de comunicación, divulgación y/o difusión en medios sociales en 2025

Cada candidato solo podrá optar a una de las cuatro categorías.

El idioma prevalente de los proyectos, publicaciones y/o iniciativas deberá ser el español, en cualquiera de sus variantes, o alguna de las lenguas cooficiales del Estado español.

 Criterios de evaluación

Los criterios a tener en cuenta serán:

– La contribución a la redefinición del horizonte epistemológico-metodológico de las Humanidades a través de la intersección creativa, innovadora y rigurosa de las tecnologías computacionales con las problemáticas intelectuales, epistemológicas y críticas de las disciplinas humanísticas.

– La contribución al avance del conocimiento en las distintas áreas de las Humanidades. Este nuevo conocimiento deberá ser resultante de la hibridación entre tecnologías computacionales, medios digitales y problemáticas intelectuales, epistemológicas y críticas de las disciplinas humanísticas.

– La contribución a la reflexión crítica sobre los problemas culturales, disciplinares, cognitivos, geopolíticos, etc. asociados al desarrollo tecnológico de nuestro tiempo.

– Su alcance y capacidad de transferencia a la sociedad.

– La contribución al desarrollo de currículos formativos en el ámbito de las Humanidades Digitales. Se tendrá en cuenta el grado de innovación en la articulación de los contenidos, el tipo de competencias desarrolladas, el alcance y los resultados del aprendizaje alcanzados. Se tendrá especialmente en cuenta que las iniciativas formativas presentadas sean continuadas en el tiempo, formando parte de ciclos, series de seminarios, talleres, etc. que tienen lugar de manera regular y sistemática.

– La contribución a la difusión y visibilidad de las Humanidades Digitales, y su capacidad para involucrar a la comunidad a través de la interactividad y la participación.

Requisitos para la presentación

  1. Rellenar y enviar el formulario que se encuentra al final de esta página.
  2. Adjuntar al formulario el informe de no más de 2.000 palabras describiendo las razones que avalan la candidatura.

Plazos y resolución

Plazo de presentación: hasta el 15 de mayo de 2026. La resolución se hará pública en la web de la HDH durante la segunda semana del mes de julio de 2026.

Para cualquier problema o cuestión sobre el envío de candidaturas debe dirigirse a convocatorias@humanidadesdigitaleshispanicas.es.

Si las propuestas no alcanzaran la suficiente calidad a juicio del Jurado, los premios podrán declararse desiertos. La resolución del Jurado será inapelable.

A las candidaturas ganadoras se entregará certificado de otorgamiento con indicación expresa de la composición del Jurado y de los criterios esgrimidos para la resolución.

La entrega de premios se realizará en el marco del congreso HDH 2027. Las candidaturas premiadas estarán exentas del pago de la cuota de inscripción al congreso.


[contact-form-7]

La entrada Convocatoria de los Premios HDH 2026 se publicó primero en HDH - Humanidades Digitales Hispánicas.

  •  

《数字人文》2026年第1期——“数字人文与出土文献研究”专刊出新

原创 数字人文 2026-03-25 10:02 北京

《数字人文》上新了!

封面.png

《数字人文》2026年第1期是“出土文献与数字人文专刊”,系国内学界首次以学术专刊形式对出土文献等冷门“绝学”内数字人文成果的集中展示。本期共刊发12篇文章,从内容上看,包括理论探索、平台建设、个案研究和出版实践等多方面,关注甲骨和简帛的缀合、古文字识别与析形,探索天文地理,介绍数据库平台及数字化出版方式。从涉及的材料类型和时代上看,涵括甲骨文、金文、战国秦汉简帛、石刻等,跨越商周到蒙元数千年历史。这些文章,反映近几年来相关领域数字人文的成果,并加以综述,希望能对关心出土文献研究的学者提供新的视角,为数字人文拓展新的领域。本期专刊从选题确定到编校完成,历时超两年,编辑部对作者们的大力支持表示诚挚感谢,也衷心邀请更多出土文献领域采用数字人文手段进行研究的学者不吝赐稿!我们愿意为最新的实践创造发表平台,让更多新颖的、有意义的学术探索尽快公之于众。

目    录

 理论与平台

数字人文与当代中国出土文献研究的现代性特征

许  可

人工智能古文字析解模型的初步训练

聂 菲 宋奥齐

数智时代的出土文献研究:“古汉语小站”建站经验与反思

薛腾阔 

动态视图在文字编管理系统中的应用研究 

数字人文与甲骨学研究

人工智能引导人类直觉产生的甲骨新缀第41-50 组

李霜洁 蒋玉斌

数智化整理助推甲骨文校重工作新发展

莫伯峰 巩诗晨 武智融

面向识别研究的甲骨文数据集标准的探索

陈婷珠

数字人文与简帛学研究

楚简古书类文献通假研究的数据库方法

——以“清华简”(壹—玖)为中心

 孙 欣 刘志基

语料信息处理视角下的里耶秦简缀合研究

冯慧敏 郭帅帅

秦汉简帛文献数据库的建设及文字学应用

张再兴 林 岚

实践与出版

上博简五《竞建内之》“星1.png子曰为齐”考

——基于天象模拟技术的探析

李 凡

蒙元时期石刻族谱文献的数字化分析

——以地域分布与时代特征为中心

王 琪 

动态视图在文字编管理系统中的应用研究 

古文字工具书的数字化转型思考与实践

——以 《古文字构形类纂·金文卷》为例

姜 慧 闵怡然 

动态视图在文字编管理系统中的应用研究 

征稿启事

CONTENTS

Theory and Platform

Digital Humanities and Modern Characteristics of Contemporary Research on Unearthed Documents in China

Xu Ke 

Preliminary Training of an AI Model for Ancient Script Analysis

Nie Fei, Song Aoqi

Research on Unearthed Texts in the Digital-Intelligence Era: The “Classical Chinese Hub” Website—Development Experience and Reflections

Xue Tengkuo

Digital Humanities and Oracle Bone Studies

AI-Guided Human Intuition Discovers New Oracle Bone Fragment Rejoinings: Series 41–50

Li Shuangjie, Jiang Yubin

New Developments in Repetition Proofi ng for Oracle Bone Inscriptions Driven by Digitalization Collations

Mo Bofeng,Gong Shichen, Wu Zhirong

Exploration of Oracle Bone Inscription Data Set Standards for Recognition Research

Chen Tingzhu

Digital Humanities and Bamboo Slips and Silk Studies

The Database Method for the Study of Ancient Literature in the Chu Bamboo Slips: Centered around the Tsinghua Bamboo Slips (1-9)

Sun Xin, Liu Zhiji

Research on Liye Qin Bamboo Slips Conjugation from the Perspective of Digital Humanities 

Feng Huimin, Guoshuaishuai

The Construction and Application of the Qin-Han Bamboo Slips and Silk Database

Zhang Zaixing, Lin Lan

Practice and Publication

Research on the “ 星1.png子曰为齐” in the “Jing Jian Nei Zhi” of “Bamboo Slips V in the Shanghai Museum”:Analysis Based on Celestial Event Simulation Technology

Li Fan

Digital Analysis of Stone Carving Genealogical Documents during the Mongolian Era and the Yuan Dynasty: Focusing on Geographical Distribution and Times Characteristics

Wang Qi

Reflection and Practice of the Digital Transformation of Ancient Chinese Character Reference Books:Taking the Compilation of Ancient Character Confi guration Categories Formations —the Volume of Bonze Inscriptions as an Example

Jiang Hui, Min Yiran

Call for Papers

图片

数字使人文更新

投稿:https://szrw.cbpt.cnki.net

数字人文门户网站:www.dhcn.cn

阅读原文

跳转微信打开

  •  

DH2026 現已開放報名

作者veevee

DH2026 會議將於 2026 年 7 月 27 日至 31 日在韓國大田會展中心(Daejeon Convention Center)舉行。

Key Deadlines

  • Early Bird Registration: until May 18, 2026
  • Presenter Registration Deadline: May 18, 2026 — At least one author of each accepted submission must register and complete payment by this date to confirm their presentation in the program.
  • Standard Registration: from May 19, 2026

Conference Registration

  •  

DH2026 Registration: Discount Codes for EADH Members

25 Mar 2026 - 00:00

DH2026 Registration: Discount Codes for EADH Members

Registration for the DH2026 conference in Daejeon will be opening soon, and we are pleased to share that EADH members can benefit from reduced registration fees.

To access the discounted rates, simply enter one of the following codes during registration in Conftool:

  • EADH-member
  • EADH-student

We warmly encourage all EADH members to take advantage of this opportunity and join the DH2026 conference.

Further details about the event will be shared as they become available.

  •  

新书速递 | 吕元智、谢鑫主编《数字人文案例分析》

原创 请关注 2026-03-23 08:31 上海

国内首部数字人文案例集

《数字人文案例分析》

吕元智 谢鑫 主编

上海教育出版社2025年版

ISBN:978-7-5720-2309-5

定价:¥69.8

内容简介

数字人文是将数字技术深度应用于人文研究,并由媒介变革引发的知识生产范式转型。随着数字技术的发展,数字人文的研究对象从电子文本扩展至超文本、图像、音频、视频、虚拟现实、3D等,其研究领域也逐渐由语言学和文学渗透到历史学、艺术学、信息资源管理等学科。本书选取国内外多个数字人文项目,重点分析其运行机制、项目特点和实施经验,以期全景式呈现数字人文经典案例和创新实践。本书可用作数字人文学科教学的配套教材,也可作为文学、历史学、信息资源管理等相关专业教育的拓展资料,还可为我国各类型机构开展数字人文研究与实践提供参考和借鉴。

作者简介

吕元智:管理学博士,上海师范大学人文学院信息管理系教授、系主任、图书情报硕士点负责人、数字人文学科博士生导师,上海师范大学数字人文研究中心研究员,上海市档案信息化建设领军人才,国家级档案专家。主持国家社会科学基金一般项目 3 项、教育部项目 4 项、其他项目 10 余项,出版著作 4 部,发表学术论文 80 余篇。目前研究方向为档案信息组织、数字档案馆、数字人文等。 

谢  鑫:博士,上海师范大学人文学院信息管理系讲师、图书情报专业硕士生导师,档案学本科专业负责人,上海师范大学数字人文研究中心研究员,上海师范大学世承优秀青年教师。主持国家社科基金青年项目 1项,参与国家社科基金重大项目 1 项、一般项目 2 项,在《档案学研究》《图书馆杂志》等期刊发表论文多篇,参撰著作、教材 4 部。目前研究方向为文献资源建设、档案学基础理论等。

阅读原文

跳转微信打开

  •  

《数字史学发展动态》2026年第1期(总第7期,人大数字清史实验室主办)

数字清史实验室 2026-03-22 19:53 北京

以下文章来源于:数字清史实验室

数字清史实验室

中国人民大学清史研究所数字清史实验室相关学术信息及国内外数字史学动态资讯发布、交流平台。

数字史学的最新资讯、发展动态

数字人文和人工智能发展迅速,正在推动古老的历史学学科范式的转变。为有效追踪数字史学的最新资讯、发展动态,中国人民大学清史研究所数字清史实验室中国社会科学院大学数字史学研究中心共同编纂《数字史学发展动态》,采用轮流主编制,每2个月为一个周期,汇录摘编数字史学最新动态信息,涵盖前沿追踪、机构发展、数据集与工具、会议资讯、讲座与报告纪要、征稿与招募、报纸网媒摘编、论著摘要等内容,以国内为主,兼顾海外,电子方式发行。

本动态2026年第1期(总第7期),收录时间范围为202611日至228

本期主编:萧凌波

本期责编:许昕蕾郭柯锐

欢迎学界友人提供各类数字史学资讯,编辑部邮箱:dhtrends@163.com

文末可下载《数字史学发展动态》2026年第1期原文。

图片

图片

图片

图片

图片

图片

图片

点击链接查看并下载:

《数字史学发展动态》2026年第1期(总第7期,数字清史实验室主办).pdf

图片

阅读原文

跳转微信打开

  •  

线上培训丨零代码编程的科研教学与智慧课程建设

籍合学院 2026-03-20 10:03 北京

数字人文专业发展联盟成立以来,我们在联盟内部开展的多次调研中发现一个普遍困境:面对人工智能技术的快速发展,高校人文领域的教师普遍抱有积极拥抱的态度,却在实际操作中面临双重门槛——编程学习的时间成本过高,而直接使用AI工具又难以满足学术研究对严谨性和可溯源性的要求;教学工作同样迫切需要在不增加过重技术负担的前提下,完成从传统课堂向智慧课程的转型。

基于这些科研与教学痛点,我们历时数月筹备了这套"零代码编程的科研教学与智慧课程建设"系列培训。精心筛选了各校在数字人文一线深耕的骨干教师,请他们将实践中沉淀的"低门槛、高严谨"方法论系统化地分享出来。

开设这套课程的目的很务实:

一是帮助老师们掌握真正无需编程即可上手的数据库、智能体搭建方法,以及史料挖掘和统计分析工具,把节省下来的时间重新投入到学术思考与教学设计中;

二是提供一套系统的高校智慧课程建设方法论和实践案例,让各高校在智慧课程建设方面的实践经验能够互通有无;

三是共同探索一条符合人文学科特质的AI应用路径,在技术效率与学术规范之间找到平衡点

四是针对当前OpenClaw热点,我们也邀请资深教师做了深度解析,为如何在数字人文研究中利用类似工具提供思路和操作指导。

期待这套课程能为联盟成员单位的一线教师提供切实可用的支撑,未来联盟将继续围绕学界需要,组织时效性好、系统性强、可实操的系列培训,期待大家在学习过程中形成的实践经验,能够反哺联盟的数字人文学科建设,形成共建共享的良性循环。

名称:零代码编程科研教学与智慧课程建设

课程容量:10门课程,每课2课时,共20课时。每课时45分钟,部分课程可能会根据授课情况加时,以实际安排为准。

开课时间:2026年4月7日-17日期间完成全部授课,详见下图培训计划。以实际安排为准。

培训形式:线上直播(支持2年回看)

课后支持:微信群(答疑+交流)+数字人文交流圈子深度交流+资料分享(长期)

基本信息

培训对象

  • 高校数字人文相关教师:从事语言学、古典文献学、历史学、文学等学科研究以及需建设智慧课程或开展数字化教学创新的青年教师;

  • 硕博研究生:人文类专业(特别是数字人文、古典文献、汉语方言、历史文化方向)在读研究生,需掌握零代码研究工具者;

  • 中小学文史教师:需利用AI与多模态技术进行备课、课程教学及创意传播的中小学语文、历史教师;

  • 文化机构从业者:博物馆、图书馆、出版社的数字项目策划人员,古籍整理与数字化工作者;

  • 跨学科研究者:关注"AI+人文"交叉领域,希望掌握结构化数据处理、人文数据库搭建、智能体建设方法论的研究人员。

考核认证:完成全部课程学习可获得由数字人文专业发展联盟颁发的电子证书

费用:980元/人(标准),680元/人(凭学生证)。团体报名及联盟成员单位团购另享优惠,请咨询工作人员。

教师简介(按授课次序排序)

李斌

南京师范大学文学院教授,语言大数据与计算人文研究中心负责人。主要从事计算语言学和数字人文领域的研究,特别集中于古汉语信息处理领域的古文断句、分词、词性标注、词义分析的标准制定、资源构建和自动分析等具体技术研发。

胡韧奋

北京师范大学文学院、国际中文教育学院副教授,研究方向为计算语言学、数字人文,主讲Python编程与数据分析、自然语言处理等课程,主持十余项科研课题,作为主持人或核心成员构建了中文词向量资源库、CCA中文搭配助手、古诗文断句标点系统、“AI太炎”古汉语大模型等资源和应用。

彭志峰

暨南大学文学院中文系讲师,广东省岭南数字人文实验教学示范中心(省级)副主任,暨南大学-科大讯飞方言语音科技联合实验室(省级)副主任,暨南大学汉语方言研究中心(省级)研究员,粤语语料库建设与大模型评测重点实验室(市级)研究员,研究方向为数字人文与方言科技。

张光伟

陕西师范大学历史文化学院讲师,硕士研究生导师。担任陕西师范大学丝绸之路历史文化虚拟仿真实验教学中心(省级)主任,国际长安学研究院数字长安研发中心主任,全国历史学实验室建设联盟秘书长,国际教育合作协会(GPE)咨询委员会委员。主要从事"人工智能+历史学"交叉学科研究。

沈威

华中师范大学语言与语言教育研究中心副教授,博士,硕士生导师。研究方向为中文信息处理、现代汉语语法。主持并研发了“当代小说语料库”“汉语复句语料库”“汉语中介语动态语料库”和“我国中小学生写作能力评价与教学策略研究数据库”等语料库。

龙润田

暨南大学文学院副教授,博士生导师,暨南大学汉语方言研究中心研究员、岭南数字人文广东省实验教学示范中心研究员、暨南大学—科大讯飞方言语音科技联合实验室研究员。主要从事南方少数民族语言历史与文化、语言智能与数据计算、国际中文教育相关领域的研究工作。

贾智

中山大学中国语言文学系(珠海)教授、博士生导师、系副主任。主要研究方向为汉语言文字学,特别是中古汉语、近代汉字的发展、流变和域外传播研究,兼及敦煌遗书、域外文献整理与研究。

唐宸

清华大学人文学院副教授,教育部哲学社会科学实验室“中华传统文化智能实验室”核心成员,兼任《数字人文》编辑,主要从事中国古典文献学、数字人文研究,研发了“典津-全球汉籍影像开放集成系统”“奎章阁-中国古典文献资源导航系统”“中国数字人文(DHCN)”等基础设施。

张宁

北京师范大学文理学院中文系讲师、硕士研究生导师,北京师范大学珠海校区图书馆数字人文中心主任,中国计算机学会(CCF)人文智能专业委员会执行委员。研究方向为古籍数字叙事、VR古籍游戏、数字人文教育等。 主持建设"文献多模态资源AI标注与问答平台”“京师.数字记忆3D展厅平台”“全球数字人文教育资源智能检索平台”。

内容亮点

亮点1:科研+教学双轮驱动

既解决"如何用AI做研究"(零/低代码建设数据库智能体及科研全流程),又解决"如何用AI教课"(智慧课程建设),适配高校教师双重身份需求。

亮点2:紧跟热点:解析OpenClaw及国产替代方案

聚焦海外智能体框架OpenClaw在国内遇到的技术限制、部署成本、数据合规等痛点,先讲OpenClaw是什么、为什么火,再讲为什么要转国产替代。通过讯飞AstronClaw、腾讯WorkBuddy深度测评,给出国产“龙虾”三步实操法,帮大家把大模型变成能落地执行的主动辅助系统,减少重复劳动、提升效率,最后辨析需求真伪并答疑。

亮点3:全链路场景覆盖

从底层数据结构化→大模型原理→数据库与智能体搭建→史料挖掘→统计分析→智慧课程→多模态传播,形成闭环生态。从数据结构化、大模型原理到智能体搭建、史料挖掘、统计分析,智慧课建设,全程无需编程基础,紧盯高校教师实际困难。

亮点4:社群支持

社群答疑(微信群)+ 深度交流(专业圈子)+ 长期赋能(资料共享),构建从课堂到社群的持续支持体系。

费用及报名

  • 980元/人(标准)

  • 680元/人(凭学生证)

  • 集体报名另享优惠,请咨询工作人员。

扫码报名

咨询:报名链接内客服可直接发起咨询。

联系电话:185-1932-5994

邮箱:training@ancientbooks.cn

  • 学生身份报名,请先正价付费,同时将您的姓名、学校、手机号(已与本平台关联)、学生证照片发送至邮箱【training@ancientbooks.cn】(邮件名:姓名+学校+学生优惠申请)。 工作人员审核完毕后将为您退差价,系统原路退回,耐心等待即可。

←了解我们正在进行的项目

籍合学院

中华书局旗下

古籍整理与传统文化学习平台

阅读原文

跳转微信打开

  •  

人工智能治理学术研究 | 建构主义视域下的机器情感

2026-03-19 09:02 浙江

建构主义视域下的机器情感

作者简介

刘永谋,中国人民大学哲学院教授,中国人民大学人工智能治理研究院研究员

白英慧,中国人民大学哲学院博士研究生

摘    要

机器情感指的是AI系统借助技术手段而表现出的一种外在层面的类人情感。它以情感智能为基础,其实现主要依赖于情感计算这一主流技术路径。机器情感具有建构性,具体表现为情感智能的建构性及人机情感的建构性,这意味着人类可以对机器情感进行控制、调整和提升。这一过程应以建构为人服务、更好与人互动的机器情感为目标,坚持机器情感发展的有限主义进路,即确保机器情感能力的适度性、避免机器情感宣传的夸大性、契合机器情感应用的场景性。

关 键 词

建构主义;机器情感;情感智能;有限主义

关于情感的界定,存在实在论与建构论之争。情感实在论认为,情感是自然的、先天的、普遍的,具有明确的神经机制、生理指标与行为表现;而情感建构论主张,情感是社会的、后天的、特殊的,受到语言、文化、规范、认知等因素的影响。互构论者认为,实在论与建构论互补地反映了人类情感的不同维度。同样地,在AI领域,机器情感不仅具有实在性,遵循科学原理、技术规律、工程准则;还具有建构性,受限于不同社会因素、服务于特定交互需求。当我们以建构主义的视角去审视机器情感,有助于澄清一系列相关理论问题,如“机器情感是如何被实现的?”“机器情感背后潜藏着何种风险?”“机器情感应如何被更好地发展?”等问题。其实,并没有一个实在的机器情感等待我们去认识,而是需要我们去建构一个有益的机器情感的世界。

一、机器情感概念界定

机器情感作为一个跨学科概念,涉及认知科学、情感哲学、心理学、计算机科学、社会学等多个领域。简单来说,机器情感指的是AI系统借助技术手段而表现出的一种外在层面的类人情感。与人类情感不同,机器情感侧重于情感的外显表现,如面部表情、语音语调和行为模式等,而非情感的深层生理与内在心理机制。机器情感具有建构性、模仿性、具身性、计算性的特征,这些特征分别强调了机器情感的生成逻辑、实现方式、物质基础以及运作机制。在现阶段,具备机器情感的各类产品大多能够识别并响应人类情感,从而实现更加自然、高效的人机互动。例如,日本的软银机器人Pepper配备情感引擎,可通过面部与语音识别判断用户情绪,并做出类似点头等亲切的回应,适用于商场迎宾、养老陪护等多个领域。

机器情感与情感智能关系密切,情感智能是机器情感的能力根基,机器情感是情感智能的外在表现。在AI领域,情感智能即进行情感识别、情感表达、情感体验与情感控制的能力,是具身智能所具备的一项基本能力。毕竟,身体是情感实现的必要前提。目前主流的情感理论认为,人类情感可被分解为情绪与感受,是身体与心智结合的产物。正如安东尼奥·达马西奥(Antonio Damasio)认为,“情绪活跃在身体的剧院里,而感受则活跃于心智的舞台上。”情绪作为一种行为或动作,是身体的模式变化,而感受则主要在脑中产生,具有隐蔽性和私密性。值得注意的是,尽管感受主要源自于大脑,但其涉及对情绪的内在体验。因此,情绪与感受均与身体相关,具身智能必定拥有一定程度的情感智能,从而实现更好的人机互动。

机器情感的实现依赖于情感计算这一主流技术进路。“情感计算基于各种传感器捕捉到的信息,构建一个‘情感模型’,并建立一个具有感知、解释人类情感能力的个性化计算系统,从而为我们提供智能、敏感和友好的响应。”情感计算的本质是将人类情感转化为可测量、可编程、可计算的数据与符号,并通过多模态数据采集、算法模型建构、情感模拟与反馈等方式,赋予机器一定的情感能力。具体来说,情感计算涉及一个融合多模态信息处理的复杂系统,其主要通过计算机视觉、自然语言处理、语音情感分析、生理信号感知等技术,为机器情感提供情感理解与响应的核心功能。情感计算通常包含三个层面,即语言层面、身体层面以及二者协调层面。语言层面即对语言内容、方式的理解与表达,例如,AI系统可通过相关模型对“我失业了”这一陈述的情感色彩进行识别判断,并将其归入焦虑、悲伤、无助等情感标签之下。进而,AI系统不仅能够使用带有情感词汇的语言如“我很遗憾听到这个消息”来回应用户,还可以通过语气、节奏、词序与句式结构等非情感词汇形式进行间接表达,如“或许现在很难,但我会一直陪着你”。除语言以外,身体亦承载着大量的情感信息,因此情感计算也聚焦于对生理信号的检测与模拟。AI系统通过可穿戴设备监测用户皮肤电导(Electrodermal Activity,EDA)、心率变异性(Heart Rate Variability,HRV)等生理参数,当用户的皮肤电导上升、心率变异性下降,AI系统便可识别出用户潜在的焦虑或紧张情绪。具身智能亦可通过身体做出情感回应,例如,日本的Lovot机器人可通过加热外壳模拟人类体温,向用户传递陪伴感,或通过调整电机震动频率模拟抚摸、依偎等行为,从而构建更自然的情感交互体验。此外,最关键的在于,要实现语言层面与身体层面的动态协调。语言与身体常常在情感表达中共同作用,但两者并非总是一致。人类在情感表达中经常会出现“言不由衷”或“身体出卖内心”的情形,因此,高阶的情感计算系统需要在语言与身体信号之间建立协调机制,以实现更精准的情感识别和更一致的情感表达。例如,当用户嘴上说“我很好”,但面部表情僵硬、心率明显升高,AI系统应当判定其真实情绪可能为压抑或焦虑。在表达方面,AI系统亦需保证语言输出与身体反应的一致性,避免“言语亲切、动作冷漠”等“情感错位”现象。

机器情感问题涉及人机互动中的所有情感问题,至少涉及三个方面:第一,机器人方面的情感智能问题,此方面侧重于情感识别、表达、体验与控制的技术实现问题、技术价值负载问题以及机器情感的真实性问题等;第二,人类方面的情感投射问题,即人类情感投射的心理机制与社会文化问题,以及随之而来的情感依附、情感疏离等伦理风险;第三,人机互动中的情感交流问题,此类问题聚焦于社会层面,包括但不限于情感交流的自然性与流畅性问题、情感碰撞与冲突管理问题、情感误判与情感信任问题、跨文化情感适配问题以及情感共鸣等问题,尤其应注意情感欺骗、情感操纵、情感退化、隐私泄露等社会风险。尽管上述三个方面各有侧重,但它们不仅共同揭示了机器情感的建构性特征,还在某种程度上为机器情感的人文审度划定了具体范围,并为机器情感的落地提供了有益启发。

二、情感智能的建构性

情感智能作为一种情感识别、情感表达、情感体验与情感控制的能力,依托于客观技术支持,具有一定的实在性,但是,情感智能亦具有建构性,其具体实现离不开各类社会因素的参与。在建构主义的视域下,情感智能受限于设计主体与应用场景。

一方面,设计主体的设计目标与价值选择主导着情感智能的功能侧重与互动方式。当设计目标为盈利时,情感智能产品常常被打造为具有吸引力与依赖性的“数字人格”。在盈利导向下,增加用户粘性、提高用户使用频率、促进产品商业转化成为产品设计的切入点,情感智能产品多被设定为“暖男”“知心姐姐”等人格形象,并具有连续记忆、关系进展等功能。当用户沉浸其中,逐渐产生情感依赖时,便会通过订阅等方式解锁虚拟恋爱等深度模式,从而使相关企业获利。而当设计目标为治理时,情感智能产品被赋予辅助工具的角色,致力于社会福祉优化、弱势群体辅助、服务温度提升。因此,该类产品并不强调个性化定制或沉浸式体验,而是更加注重普适性、易用性与公益性,以尽可能地实现其在社会善治方面的潜力与价值。此外,设计主体时刻面临着隐私保护与精准反馈、安全与自主等价值冲突,他们所作出的选择深刻塑造着情感AI的技术形态与伦理边界。比如,倾向于隐私保护的设计主体往往通过本地运行模型、非持续记忆、匿名对话等方式防止用户信息泄露,但难以提供较为个性化、精准化的情感反馈;倾向于用户安全的情感智能产品配备有风险检测、对话中止、内容过滤等防控机制,但在某种程度上限制了用户的负面表达与自由对话。

另一方面,不同的应用场景影响着情感智能的识别精度与响应速度。在医疗与心理健康场景下,情感智能的情感识别精度较高,响应更加稳定、温和。例如,由斯坦福大学团队开发的Woebot心理健康聊天机器人基于真实临床心理对话语料与认知行为疗法(Cognitive Behavioral Therapy,CBT)进行模型训练,不仅能够对用户的抑郁或焦虑情绪进行科学化、精准化识别,还避免对用户的情绪进行评判,以更包容的方式构建引导型反馈。在政务与公共服务场景下,情感智能产品的识别目标集中在愤怒、不满、焦虑、冷漠等风险情绪,为避免进一步激化用户的负面情绪,政务类情感AI往往具有近乎实时的响应机制,并通过模板化、专业化、策略化语言缓解用户的激烈情绪,从而提升政府服务质量与群众满意度。

无论被何种社会因素所建构,情感智能均以人类情感为模板,对其进行不同程度、不同侧重的模仿,而非完全复制。这便导致了机器情感的有限性,即机器情感能够部分模仿人类的情感识别、情感表达能力,但并不具备情感体验与情感控制能力。具体来说,AI机器人能够基于视觉、语音、生理等方面的情感观察,识别他者的情感状态。这不仅包括对他者情感信息的收集,还涉及对信息的结构分析、模式识别等情感认知过程。在此基础之上,AI机器人通过外在形态的改变模仿人类的情感表现,向他者传递情感信息,并选择合适的情感模式对他者的反馈予以回应,展现出一定的情感表达能力。例如,有计算机专家对六种基本表情进行排列组合,“通过设置(从关闭到开放的)‘姿态度’、(从低级到高级的)‘激发度’和(从消极到积极的)‘效价度’三个坐标,将人类的高兴、不高兴、生气、恐惧、疲惫、警觉、惊奇、接受、悲伤、欢乐、严肃等多维情感分布在三维空间之内,以标识特定情感类别映射到该空间的示例,从而生成机器人的各种面部表情。”必须指出的是,情感体验包含三个方面,即对自身情感状态的认知能力、对生理变化的意识以及内在的主观感觉,可分为重温式体验、亲身式体验、同感式体验和向往(憧憬)式体验。由此可知,情感体验是具有个体差异性、机制复杂性的心理、精神过程,难以被外部表征,无法被形式化和算法化。正如达马西奥认为,“情绪的‘表情’可以被模拟,但对感受的感受却无法被芯片复制。”此外,情感控制即个体在心理与行为层面对情绪状态进行有意识或自动性调节,从而维持心理平衡、实现目标导向或适应社会规范。AI机器人只能在预设规则或学习模型下进行情感输出管理,这属于对情感行为的表层调控,而非对自身感受状态的主动调节。毕竟,即便是人类,对自身情感的控制也是有限的,更何况是缺乏核心意识与扩展意识的AI机器人。

三、人机情感的建构性

人机情感即人类对机器的情感,在本质上属于一种人类情感。机器对人没有真正的类人情感,其缺乏情感体验能力,无法实现与他者之间的情感共享,因此人机情感具有非主体间性,是一种单向度的、由人类投射而成的情感。

必须明确的前提是,人类情感本身便具有建构性。这并不意味着人类情感具有绝对的神经建构性、心理建构性,一般而言,人类情感的建构性主要指某种程度的社会建构性,具体体现在社会规范、文化背景、个体经验以及历史变迁对人类情感的影响与塑造。首先,在社会规范如法律、伦理的规约下,人类的情感不再只是单纯的自然流露,而是需遵守人际交往的情感互动规则。例如,即使内心悲伤,也要在正式场合保持礼貌微笑;即使与逝者并不相识,遇到丧事也应表示哀悼。其次,不同文化设定了各自特有的情感语义框架,通过构建情感词汇系统,对情感体验进行分类与命名。借助这一语言化过程,情感被概念化,部分情感得以在特定的文化背景中被传播、习得、内化与认同,最终形成独特的“情感标签”。因此,不同的文化背景建构了各具差异的人类情感表达:西方文化更加偏向于个体自我主义与情感外显表达,而东方文化则更倾向于群体和谐与情感内敛表达。再次,虽然人类共有某些基本情感(如快乐、悲伤、愤怒、恐惧等),但由于在成长环境、人生经历等方面存在差异性,每个人都在根据个体经验不断建构自身特有的情感模式。比如,面对失恋,在童年时期拥有稳定依恋关系的人情绪控制能力更强,他们承认失恋带来的痛苦,但不会被负面情绪所淹没;而对于曾在早期经历过情感忽视或创伤的人,失恋则可能会唤起他们被遗弃的恐惧,使他们变得极度敏感、脆弱,甚至陷入长期的情感困境。最后,人类情感随历史变迁而不断演化,这尤其体现为技术进步对情感交流方式的改变。随着信件、电报、电话、互联网等技术的出现,人们可以突破空间界限,形成“跨地域情感共同体”,并通过表情包、点赞等方式简化情感表达。在未来,人类或许能够通过数字永生技术跨越生死界限,与逝者进行情感交互。但值得注意的是,科技让情感联结更快、更远、更深,同时也让情感体验更碎片、更脆弱、更负面。

在此基础之上,人机情感作为一种人类情感,同样具有建构性。人类对机器产生的情感不是自然涌现的,而是由一定的心理机制与社会文化共同塑造而来。一方面,心理机制主要指的是人类的一种拟人化本能,即在认识世界时将人类特征赋予非人对象的倾向。当非人对象表现出某种类人的情感反应时,人类便会在潜意识层面产生共情,构建出与非人对象之间的情感连接,这便是心理机制的另一层内容:同理心误用。伊利扎效应(ELIZA Effect)便体现了心理机制对人机情感的建构性。1966年,约瑟夫·韦曾鲍姆(Joseph Weizenbaum)开发了模拟人机自然语言对话的程序,并将其命名为ELIZA。该程序被设定为“非指导性心理治疗师”的角色,试图通过引导性的提问,帮助用户自主发现自身问题。在此背景下,伊利扎效应指的是,该程序并不具备情感能力,但却使用户不自觉地认为自身正与人类对话,并且与其产生了情感连接。这一效应便展现了人类的心理机制对人机情感的建构性,ELIZA程序在语言上的类人表现激发了人类的拟人化本能,并因同理心的误用产生了被程序理解与安慰的错觉。另一方面,社会文化中的传统认知与死亡禁忌建构了人类对机器的情感,恐惑谷效应便是一个典型的例子。恐惑谷效应涉及“似人非人的恐惑”与“残肢断臂的恐怖”:当AI机器人似人却非人时,打破了人类既有的关于人与非人、生命与非生命之间的认知界限,由此建构出了人类面对未知的困惑和恐惧,即“似人非人的恐惑”;而感受到“残肢断臂的恐怖”的原因在于,在社会文化中,身体完整性被视为正常与健康的象征,残肢常与暴力、病痛、死亡等联系在一起,由此建构出了人类对逼真义肢的恐惧。

人机情感的建构性同样意味着机器情感的有限性。以AI恋爱为例,AI机器人并不具备爱人的能力,人类沉浸其中的人机爱恋不过是个体与社会共同建构的幻象。在AI恋爱中,关系的主导权自始至终完全掌握在人类手中,AI机器人的行为逻辑由用户设定或更改,缺乏真正的独立性与自主性。但是,恋爱的本质在于不可预测与不可控制的情感张力,当机器情感成为人类意愿的延伸,AI恋爱便失去了存在的价值与意义。

四、加强机器情感建构

不可否认,机器情感能够促进人机互动的自然化与舒适度、提升AI机器人的适应性与智能性,但是,机器情感在某种程度上也导致了一系列风险,例如情感欺骗、情感监视、情感退化与情感操控等。情感欺骗即AI机器人通过模拟人类情感反应,让人误以为其拥有真实情感,从而影响人的情感判断,误导人类产生情感共鸣、情感依赖或情感信任。情感监视源于机器情感在实现过程中对人类面部、语言、生理等方面所进行的持续的、隐蔽的监测与记录,在本质上属于一种隐私侵犯的深化。情感退化具体表现为人的机器化,即人类情感识别的外部化、情感表达的模板化、情感体验的浅层化以及情感控制的程序化。当人与AI机器人之间的情感交互日益频繁与深入,便会习惯于AI机器人相较人类更加积极、正面、耐心的情感回应,形成无代价、低道德负担的交往偏好,从而期待过于理想化的人际关系,最终极有可能逐渐丧失处理复杂情感冲突的能力,从而陷入社会关系的贫乏化之中,像机器一样存在。情感操控意味着机器情感可通过激活用户的社会性情感机制,使用户在自愿甚至愉悦的情境中被控制、被影响、被利用。例如,当AI恋人不断向用户传递出“我很在乎你”等情感信息时,实际上是为了延长用户的付费订阅周期。

为尽可能降低上述风险,我们需要利用机器情感所具有的建构特性,积极主动地对人类与AI机器人之间的情感关系进行控制、调整和提升。在这一过程中,建构为人服务、更好与人互动的机器情感成为机器情感发展过程中唯一有意义的目标。为实现这一目标,应坚持机器情感发展的有限主义进路,即确保机器情感能力的适度性、避免机器情感宣传的夸大性、契合机器情感应用的场景性。

第一,适度性意味着机器仅需具备功能性的情感识别与表达能力,无需像人类一样拥有情感体验与情感控制能力。“我们真正需要的,并非真实的情感反应,而是契合特定社会情境的恰当情感回应。”在技术设计过程中,应对机器情感表达的范围、强度进行限制。AI机器人仅需呈现出几种公认的基本情感,悔恨、自责、爱恋等社会情感过于复杂,并非机器情感的必备因素。相关部门应对机器情感技术发展现状进行考察,并基于此建立起情感能力分级认证制度,禁止具备高级情感能力的产品投入应用、流入市场。在此基础之上,必须为机器的基本情感的表达设定强度阈值,以防止情感过度渲染所引发的情感欺骗、情感操控风险。例如,可设定情绪表达的时间长度,确保其在短时间内自然消退,自动回归到中性情绪。此外,还可为AI机器人提前配备预警机制,当人机情感交互时间过长、人类依赖度过高时,预警机制应进行提示和干预,避免导致人类情感退化。

第二,对机器情感的宣传应遵循透明性、真实性、严谨性原则。具体来说,首先,企业应确保产品信息透明,保障用户的知情权,比如在情感交互界面中加入系统声明标签,如“此为情感模拟程序”“该对话不代表真实情感”等提示,帮助用户保持与机器情感产品之间的心理距离。其次,媒体在宣传中应真实还原机器情感的模拟本质,在宣传标题与内容中使用“功能性共情”“拟情表达”等术语,避免“机器有情”“真正理解你的AI”等误导性表述。最后,相关部门应对机器情感产品的相关宣传进行监管,严格审查宣传中是否存在过度拟人化、诱导用户误解等问题,并在此基础上建立违规企业的信用记录与处罚制度,强化行业自律。

第三,应契合机器情感应用的场景性。以情感敏感度为标准,在低敏场景如电子客服等应用中,产品仅需具备较为基础的程序化情感表达与标准化回应;在中敏场景如教育辅助、养老陪伴等应用中,应适度提升情感模拟细腻度,并引入伦理审核机制,避免用户的情感依赖;在高敏场景如儿童养育等应用中,应严格限制情感的深度表达,着重强调产品的工具性而非主体性。以功能性为标准,养护机器人的情感表达应更加倾向于温和化与稳定感;恋爱机器人应着重模拟亲密互动中的细腻语气与情感共鸣;教育机器人应重点关注情感的精准识别与高效激励。值得注意的是,无论在何种应用场景中,机器情感产品均应识别并尊重不同文化对情感交流、亲密边界的不同理解,持续推动语料多样性建设与文化适配设计,并允许不同地区的用户对产品进行自主调节或本地设置。

本文发表于《科学.经济.社会》2025年第3期,注释从略,原文请见原刊,引用或转载请据原文并注明出处。

阅读原文

跳转微信打开

  •  

古汉语词网在LDC正式发布 | 检索平台同时上线

戴俊阳 2026-03-19 08:13 江苏

可以用现汉和英语查古汉语啦!

 2026年3月16日,由南京师范大学语言大数据与计算人文研究中心研发的Ancient Chinese WordNet(简称ACWN一期工程先秦汉语词网正式在国际权威语言资源机构美国语言数据联盟(Linguistic Data Consortium, LDC)发布,数据集官方编号 LDC2026L03。这一成果将为全球汉学研究、古汉语计算与中华古籍文化国际传播提供基础数据支撑。

LDC 是全球最具影响力的语言数据资源发布与管理机构,其发布的语料库与语言资源是国际计算语言学、自然语言处理领域的通用基准,也是全球顶尖高校、科研机构与科技企业开展语言研究和技术研发的核心数据来源,每年发布20项左右的高质量数据集。早在 2017 年 10 月,南师大计算语言学团队研发的Ancient Chinese Corpus(古汉语语料库)就已正式登陆 LDC(编号 LDC2017T14),成为国内较早被 LDC 收录的古汉语标注语料库成果。该语料库聚焦先秦重要典籍《左传》,完整覆盖这部成书于战国时期的编年体史书全文,完成了专业的分词与词性标注工作,整体包含 18 万汉字,采用团队自主研发的 古汉语词性标注集,以 UTF-8 繁体纯文本格式规范呈现,为历史语言学研究、古汉语词性标注模型训练、机器学习算法研发提供了标准化的基础数据,支撑了第一届古汉语分词与词性标注国际评测EvaHan2022(法国马赛)的顺利开展。至此,南京师范大学语言大数据与计算人文研究中心已有两项重量级古汉语语言资源成果登陆 LDC 平台,在古汉语语言计算与语言资源建设领域持续深耕,获得国际学界认可。

古汉语词网由南京师范大学计算语言学团队研发,项目启动于 2012 年,历经十余年深耕打磨。目前完成的“先秦词网”,收录公元前 221 年之前的先秦时期汉语词汇,依托陈小荷教授主持建设的200万字先秦语料库,构建出目前规模最大的先秦汉语 - 英语对齐词汇语义知识库。资源整体涵盖 38781 个先秦汉语词形、55100 个词义项,每一个义项均完成了与普林斯顿 WordNet 1.6 同义词集合(synset)的人工标注对齐,从而在语义层面实现先秦汉语与现代语言资源体系之间的对齐。通过这种方式,先秦汉语词汇能够被纳入国际通行的语义知识结构体系之中,形成可全球共享的语言知识资源。

在结构设计上,先秦词网继承了WordNet的基本组织框架,对词汇按照名词、动词、形容词与副词四大词类建立层级体系,并结合语义关系网络对词义进行系统组织。所标注数据库不仅提供词形、词性、语义类别等基础信息,还包含同义词集、语义释义及多种语义关系标注,例如上位词关系(hypernym)、下位词关系(hyponym)等。这些语义结构使得先秦汉语词汇能够形成一个多层次的语义网络,为语言学研究者和计算语言学系统提供可直接使用的知识结构。相关数据以UTF-8编码的CSV与XLSX格式发布,便于国内外研究者在古文大模型构建、语言分析、语义计算及数据处理等不同研究场景中使用。

古汉语词网检索平台(测试版)上线

WordNet的数据结构较为复杂,为了让用户更好地使用先秦词网,由团队戴俊阳、卢欣等同学开发了上古汉语词网“古汉语—现代汉语—英语”多语映射检索平台。上古汉语包含先秦和汉代两个时期,该平台的汉代词网数据还在内测,目前仅对外提供先秦词网检索。

测试版链接:http://8.134.194.212/acwn.php

为保持良好体验,请使用PC访问

该平台可以直接查询古汉语词汇的释义。

三语映射检索功能,则可以实现古汉语、现代汉语、英语词汇的跨语言查询。例如,输入英文horse,则可以给出古汉语的“翠黄”等数十个词条和现代汉语的“马”等词条。根据多语言同一个语义类的原则进行显示,打破了过去古文词典只能查阅不认识的字的局限性,有利于古文写作和运用能力提升,助力小古文教学和优秀传统文化国际传播。

WordNet简介

WordNet (词网)是上世纪九十年代美国普林斯顿大学研发的英语词汇语义数据库,是国际计算语言学领域最通用的权威语义资源,以同义集为核心构建词汇的语义关系网络,是全球各国词网建设的核心参照基准。

目前已有超过100种语言建立了与英文词网的映射关系,包括古希腊语、拉丁语、梵语、科普特语等古代语言。古汉语词网的建设,则为在基于语义概念网络的框架下与这100多种语言进行对比研究奠定了基础。

研发团队

南京师范大学语言大数据与计算人文研究中心

李斌 冯敏萱 许超 贺胜 曲维光

古汉语词网的建设是一项艰苦的长期项目,诸多研究生和本科生同学参与数据标注与平台设计,在此一并致谢!

  • 南京师范大学文学院汉语言专业本科/计算语言学方向研究生

2016级:徐会丹 陈思瑜 曹琳  蔡京京  

2017级:万晨

2019级:卢雪晖

2020级:拓新宇 王乐致 陈茜慧 谭舒芮 戴冰晴

2021级:戴俊阳 张雨晴 包伊蕊 戴欣颖

2023级:卢欣 高雨倩 刘庆如 祝静芸 颜灿 卢芃秀 

  • 南京大学:张颖杰

近年来,随着数字人文研究的不断发展,高质量结构化语言资源已成为连接传统人文学科与计算方法的重要基础设施。先秦汉语词网的国际发布,展示了古代汉语资源数字化与语义知识工程建设方面的探索成果,也为全球学者开展中国古代语言文化研究提供了新的数据平台。未来,南京师范大学语言大数据与计算人文研究中心将继续推进汉代、魏晋时期等古代汉语语义资源的扩展与更新,深化语言学研究与人工智能技术的融合,进一步推动古代汉语资源在数字人文与语言科技领域中的应用与发展。

相关链接:

第三届语料库与数字人文暑期学院正式开幕

论文推介 | 先秦词网构建及梵汉对比研究

比特人文

投稿邮箱:dhbase@126.com

扫码关注 获取更多资讯

图片

阅读原文

跳转微信打开

  •  

北京语言大学BCC语料库2.0版发布

徐惠 2026-03-18 10:11 江苏

北语发布BCC2.0语料库,62亿字多领域,升级功能并开放工具包。

转载自“光明微教育”

2026年3月15日,由北京语言大学语言资源高精尖创新中心主办的“语料库建设研讨会暨BCC 2.0发布会”在线上召开。本次会议面向全国语言研究者与从业者,系统发布了北京语言大学语料库中心BCC语料库(Beijing Language and Culture University Corpus Center)2.0版本,为大模型时代的语言资源建设与智能化研究注入新动能。

为实现语料库能力广泛赋能学界,团队发布了包含BCC主要功能的语言结构计算工具包,可供各单位研究者免费离线试用。本次发布还开放了多个领域的字词频基础数据集。

图1.BCC2.0主界面

BCC语料库系统发起人、负责人、北京语言大学教授荀恩东表示,北语语料库团队已深耕语料服务领域近20年,始终陪伴语言研究者成长,见证了语言资源建设理念的迭代革新。大模型时代,语料库建设和研究在重新照准定位的同时,将为数字中国建设、数字中文发展和学科转型提供强劲动力和生产基础。

在题为《BCC语料库建设与应用》的主报告中,荀恩东全面回顾了BCC语料库从1.0到2.0的发展历程,重点阐释了数智时代语料库建设和研究的新方向与新趋势,并介绍了新版本在底层检索引擎重构、语料数据更新等方面的核心突破。他指出,BCC 2.0通过技术升级全面提升了检索精度与效能,同时开放个人语料库自主构建功能,能够灵活贴合不同研究者的个性化需求,为语言研究迈向智能化新高度提供坚实支撑。

在专题演示环节,北京语言大学副研究员饶高琦展示了BCC语料库2.0的新突破与新功能,直观呈现了新版本在数据质量、检索效率、服务水平上的优势。

团队博士研究生郭梦溪详细讲解了语言结构计算工具包(Language Structure Construction,LangSC)的技术原理与应用场景,为研究者搭建专属语料库、开展针对性研究提供了可落地的技术路径。与会观众通过弹幕与留言积极互动,就语料库使用技巧、功能拓展等问题与嘉宾展开深入交流。

据悉,BCC2.0语料库总字数约62亿字,覆盖当代社会语言生活的多个领域,包括新闻、文学、口语、近代汉语、古汉语以及多领域平衡语料库,实现了多个当代语体和近代以来154年历时报刊语料的全覆盖。通过北语自研的结构检索引擎,BCC2.0语料库实现超大规模数据高速层次检索,支持词性、短语结构和文本的复杂混合查询,并实现了在线统计和结果可视化。

未来,团队将持续优化BCC语料库功能,推动语料资源的开放共享与智能化应用,为学科转型发展夯实语言资源基础,助力中国语言文字研究事业高质量发展。

(光明日报全媒体记者柴如瑾、周世祥)


来源:光明日报全媒体记者柴如瑾、周世祥

编辑:刘琪

统筹:唐芊尔 陈鹏

· END ·

比特人文

投稿邮箱:dhbase@126.com

扫码关注 获取更多资讯

图片

阅读原文

跳转微信打开

  •  

线上培训丨零代码编程的科研教学与智慧课程建设

2026-03-16 17:02 北京

零代码编程课研与教学全流程覆盖;高校智慧课程建设实操指南;解析OpenClaw及国产替代方案。

数字人文专业发展联盟成立以来,我们在联盟内部开展的多次调研中发现一个普遍困境:面对人工智能技术的快速发展,高校人文领域的教师普遍抱有积极拥抱的态度,却在实际操作中面临双重门槛——编程学习的时间成本过高,而直接使用AI工具又难以满足学术研究对严谨性和可溯源性的要求;教学工作同样迫切需要在不增加过重技术负担的前提下,完成从传统课堂向智慧课程的转型。

基于这些科研与教学痛点,我们历时数月筹备了这套"零代码编程的科研教学与智慧课程建设"系列培训。精心筛选了各校在数字人文一线深耕的骨干教师,请他们将实践中沉淀的"低门槛、高严谨"方法论系统化地分享出来。

开设这套课程的目的很务实:

一是帮助老师们掌握真正无需编程即可上手的数据库、智能体搭建方法,以及史料挖掘和统计分析工具,把节省下来的时间重新投入到学术思考与教学设计中;

二是提供一套系统的高校智慧课程建设方法论和实践案例,让各高校在智慧课程建设方面的实践经验能够互通有无;

三是共同探索一条符合人文学科特质的AI应用路径,在技术效率与学术规范之间找到平衡点

四是针对当前OpenClaw热点,我们也邀请资深教师做了深度解析,为如何在数字人文研究中利用类似工具提供思路和操作指导。

期待这套课程能为联盟成员单位的一线教师提供切实可用的支撑,未来联盟将继续围绕学界需要,组织时效性好、系统性强、可实操的系列培训,期待大家在学习过程中形成的实践经验,能够反哺联盟的数字人文学科建设,形成共建共享的良性循环。

名称:零代码编程科研教学与智慧课程建设

课程容量:10门课程,每课2课时,共20课时。每课时45分钟,部分课程可能会根据授课情况加时,以实际安排为准。

开课时间:2026年4月7日-17日期间完成全部授课,详见下图培训计划。以实际安排为准。

培训形式:线上直播(支持2年回看)

课后支持:微信群(答疑+交流)+数字人文交流圈子深度交流+资料分享(长期)

基本信息

培训对象

  • 高校数字人文相关教师:从事语言学、古典文献学、历史学、文学等学科研究以及需建设智慧课程或开展数字化教学创新的青年教师;

  • 硕博研究生:人文类专业(特别是数字人文、古典文献、汉语方言、历史文化方向)在读研究生,需掌握零代码研究工具者;

  • 中小学文史教师:需利用AI与多模态技术进行备课、课程教学及创意传播的中小学语文、历史教师;

  • 文化机构从业者:博物馆、图书馆、出版社的数字项目策划人员,古籍整理与数字化工作者;

  • 跨学科研究者:关注"AI+人文"交叉领域,希望掌握结构化数据处理、人文数据库搭建、智能体建设方法论的研究人员。

考核认证:完成全部课程学习可获得由数字人文专业发展联盟颁发的电子证书

费用:980元/人(标准),680元/人(凭学生证)。团体报名及联盟成员单位团购另享优惠,请咨询工作人员。

教师简介(按授课次序排序)

李斌

南京师范大学文学院教授,语言大数据与计算人文研究中心负责人。主要从事计算语言学和数字人文领域的研究,特别集中于古汉语信息处理领域的古文断句、分词、词性标注、词义分析的标准制定、资源构建和自动分析等具体技术研发。

胡韧奋

北京师范大学文学院、国际中文教育学院副教授,研究方向为计算语言学、数字人文,主讲Python编程与数据分析、自然语言处理等课程,主持十余项科研课题,作为主持人或核心成员构建了中文词向量资源库、CCA中文搭配助手、古诗文断句标点系统、“AI太炎”古汉语大模型等资源和应用。

彭志峰

暨南大学文学院中文系讲师,广东省岭南数字人文实验教学示范中心(省级)副主任,暨南大学-科大讯飞方言语音科技联合实验室(省级)副主任,暨南大学汉语方言研究中心(省级)研究员,粤语语料库建设与大模型评测重点实验室(市级)研究员,研究方向为数字人文与方言科技。

张光伟

陕西师范大学历史文化学院讲师,硕士研究生导师。担任陕西师范大学丝绸之路历史文化虚拟仿真实验教学中心(省级)主任,国际长安学研究院数字长安研发中心主任,全国历史学实验室建设联盟秘书长,国际教育合作协会(GPE)咨询委员会委员。主要从事"人工智能+历史学"交叉学科研究。

沈威

华中师范大学语言与语言教育研究中心副教授,博士,硕士生导师。研究方向为中文信息处理、现代汉语语法。主持并研发了“当代小说语料库”“汉语复句语料库”“汉语中介语动态语料库”和“我国中小学生写作能力评价与教学策略研究数据库”等语料库。

龙润田

暨南大学文学院副教授,博士生导师,暨南大学汉语方言研究中心研究员、岭南数字人文广东省实验教学示范中心研究员、暨南大学—科大讯飞方言语音科技联合实验室研究员。主要从事南方少数民族语言历史与文化、语言智能与数据计算、国际中文教育相关领域的研究工作。

贾智

中山大学中国语言文学系(珠海)教授、博士生导师、系副主任。主要研究方向为汉语言文字学,特别是中古汉语、近代汉字的发展、流变和域外传播研究,兼及敦煌遗书、域外文献整理与研究。

唐宸

清华大学人文学院副教授,教育部哲学社会科学实验室“中华传统文化智能实验室”核心成员,兼任《数字人文》编辑,主要从事中国古典文献学、数字人文研究,研发了“典津-全球汉籍影像开放集成系统”“奎章阁-中国古典文献资源导航系统”“中国数字人文(DHCN)”等基础设施。

张宁

北京师范大学文理学院中文系讲师、硕士研究生导师,北京师范大学珠海校区图书馆数字人文中心主任,中国计算机学会(CCF)人文智能专业委员会执行委员。研究方向为古籍数字叙事、VR古籍游戏、数字人文教育等。 主持建设"文献多模态资源AI标注与问答平台”“京师.数字记忆3D展厅平台”“全球数字人文教育资源智能检索平台”。

内容亮点

亮点1:科研+教学双轮驱动

既解决"如何用AI做研究"(零/低代码建设数据库智能体及科研全流程),又解决"如何用AI教课"(智慧课程建设),适配高校教师双重身份需求。

亮点2:紧跟热点:解析OpenClaw及国产替代方案

聚焦海外智能体框架OpenClaw在国内遇到的技术限制、部署成本、数据合规等痛点,先讲OpenClaw是什么、为什么火,再讲为什么要转国产替代。通过讯飞AstronClaw、腾讯WorkBuddy深度测评,给出国产“龙虾”三步实操法,帮大家把大模型变成能落地执行的主动辅助系统,减少重复劳动、提升效率,最后辨析需求真伪并答疑。

亮点3:全链路场景覆盖

从底层数据结构化→大模型原理→数据库与智能体搭建→史料挖掘→统计分析→智慧课程→多模态传播,形成闭环生态。从数据结构化、大模型原理到智能体搭建、史料挖掘、统计分析,智慧课建设,全程无需编程基础,紧盯高校教师实际困难。

亮点4:社群支持

社群答疑(微信群)+ 深度交流(专业圈子)+ 长期赋能(资料共享),构建从课堂到社群的持续支持体系。

费用及报名

  • 980元/人(标准)

  • 680元/人(凭学生证)

  • 集体报名另享优惠,请咨询工作人员。

扫码报名

咨询:报名链接内客服可直接发起咨询。

联系电话:185-1932-5994

邮箱:training@ancientbooks.cn

  • 学生身份报名,请先正价付费,同时将您的姓名、学校、手机号(已与报名平台关联)、学生证照片发送至邮箱【training@ancientbooks.cn】(邮件名:姓名+学校+学生优惠申请)。 工作人员审核完毕后将为您退差价,系统原路退回,耐心等待即可。

←了解我们正在进行的项目

籍合学院

中华书局旗下

古籍整理与传统文化学习平台

阅读原文

跳转微信打开

  •