阅读视图

刘海涛: AI时代,不要让人类陷入“养虎为患”的境地

祁金 2026-05-03 00:00 江苏

分享一篇文章

复旦大学: 刘海涛: AI时代,不要让人类陷入“养虎为患”的境地

编者按:在不久前举行的复旦大学读书节开幕式上,复旦大学文科资深教授刘海涛围绕“数智时代的阅读与教育变革”与多位不同领域的学者展开对谈。

作为一位走在数智时代前沿的语言学家,刘海涛正引领语言学研究范式走向变革,推动中国语言学走向科学化与国际化。本期“旦夕尚书”,让我们走进刘海涛的书房,领略一位语言科学家的阅读世界。

刘海涛在2024年底正式加盟复旦,人到哪里,书就如影随形。才一年多时间,办公室崭新的书架上,书已经塞得满满当当。

这些书来自不同时期。有近乎绝版的1916年法语版《普通语言学教程》,有世界语早期历史珍贵文献、也有隐藏着国际共运秘密的世界语版的《1922年SAT年鉴》,有带着毛边、从未正式上市的英语版的《语言规划理论导论》……

刘海涛向我们展示他的珍稀“典藏”

拿出这些千淘万漉才寻到的珍稀“典藏”时,他像一个慷慨的小孩那样,既兴奋地向我们一一展示,又怕我们弄坏,只允许我们轻轻碰触,就立刻收回。每本书都有一个故事,他一边捧着书,一边恨不得把所有背后的故事都细细道来。

读书,字面意义的读书,在刘海涛的人生中占据重要位置。在他看来,“当我们谈读书时,谈的是人与书的关系以及超越时空的人与人的关系”,每阅读一本书,都是与人类知识体系的一次连接。

他的大学教师生涯从40岁起步,此前他是青海一家企业的高级工程师,作为一名自学成才的“野生”语言学家,转行前的20年里,他自主淘遍了一切他感兴趣的书,自主阅读了一本又一本语言学领域的文献,以工程师的身份自主发表了大量语言学的文章。

多年后回顾,他觉得是“阅读”给了他转行的信心,让他完成了一次职业生涯的革命。

刘海涛的书架

在与人类知识体系的一次次连接与交互中,他发现了很多有待解决的问题,也意识到,“我也许能解决这些问题,也许能为人类知识体系增加一些新的东西。”

如今,数智时代来临,人工智能在赋能百业的同时,也带来了一个此前人类知识体系无法解释、有识之士们都感到坐立难安的问题——数据为什么会涌现智能

作为和数据打了半辈子交道的语言学家,刘海涛自主立下了一个新使命——破解“数据涌现智能”之谜

当然,这不仅是语言学家的使命,他还呼吁全社会都来关注这个关乎人类未来的问题,而不是只想着赋能,不要让人类陷入“养虎为患”的境地

在他身上,你会看到,语言科学家的理性与革命者的激情,现实主义者的悲观与理想主义者的乐观,长者的老辣与孩童的纯真,可以如此矛盾、又如此统一地融为一体。

现在,就让我们从阅读开始,走进这位可爱又可敬的矛盾统一体

当我们谈读书时

谈的是人与书的关系

专业书籍之外,您日常喜欢阅读什么类型的书?

我喜欢读小说,读网络小说、玄幻小说,更年轻时也读科幻小说,我还长期订阅《中篇小说选刊》。

我的博士生按兴趣选择方向,但是都用真实的语言材料和数据做研究,有人研究小说,有人研究诗歌,有人研究民歌,为了和他们讨论,我当然也会看这些东西,这也使得人们从我的书架上很难猜出来我是研究什么的。

您的阅读趣味经历过哪些变迁?

小时候几乎没什么书可读,所以抓到书就读

改革开放后可读的东西多了,大学时我对科幻小说很有兴趣,也读哲学的东西

20世80年代初,我开始对语言学感兴趣,当时虽然出版物很少,但只要是能读到的书我都会读。随着研究不断深入,我开始聚焦更特殊的问题,这些问题会引导我去阅读更深入、更专业的东西。

进入大学工作前,您就开始研究国际语语言学和语言规划。这是两个非常小众的研究领域,但您在文章中却参考引用了许多不同语种的国外文献。我们很好奇,您是如何获得这些文献的?

这确实是很多人好奇的问题。原因在于:第一,我当时在青海工作,比内地更难获得文献。第二,我的研究领域很偏门,这些文献在发达地区或国外也很难获得

很多人问我是怎么找到那些书的,我分享两个例子。

首先是国际语研究。要研究这些人造语言,首先得知道这些语言到底有哪些。

1987年左右,一位匈牙利朋友给我寄来一期世界语小刊物,其中有篇文章提到,在爱沙尼亚塔林有人要出版一本叫《国际辅助语》的书,收录了从公元1世纪20年代年到1973年的917种人造语言,对研究人造语言的人来说就是必备

刘海涛向我们展示这本《国际辅助语》

爱沙尼亚很远,当时也没有网上书店。我先找到了文章作者的地址,他是爱沙尼亚世界语协会负责人,七十多岁了。联系上后,他说还没有具体出版时间,我就一直和他保持联系。

90年代,爱沙尼亚要求脱离苏联,老人说因为物资短缺,没有纸印书,书可能出不来了,我一听完了。没想到,1991年,我突然收到一个从国外寄来的包裹,打开一看,就是俄语版的《国际辅助语》

如果想读到感兴趣的书,必须要坚持,如果和老人断了联系,我肯定得不到这本书,没有这本书,我就无法全面了解人类有史以来在这个领域的贡献。

第二个例子是什么?

还是与爱沙尼亚有关。

我今天还在研究语言规划。为了让语言更好地适应社会发展需求,人们会对语言进行干预,这就是语言规划。在语言规划史中,人们特别关注那些受人为干预较多的语言,爱沙尼亚语恰是这样的语言。

1968年英语版的《语言规划理论导论》

我了解到,有一位参与爱沙尼亚语改革的人去了瑞典乌普萨拉大学教书,并用英语写了一本叫《语言规划理论导论》的书,1968年由瑞典乌普萨拉大学出版社出版。作者陶里从爱沙尼亚的语言规划经验中总结了语言规划的方法原则和理论,对语言规划的研究者来说非常重要。

这本书印量很小,世界上大多图书馆都没有收藏,即使是这个领域的很多著名研究者也没有见过,我就想,一定要搞到这本书。

我想起,我认识的一位瑞典数学家就在乌普萨拉大学教书,于是问他能不能帮忙从图书馆借出来复印。他告诉我,图书馆说还有几本多余的,可以卖我一本。这样我就搞到了这本书。

您找书的过程简直像一位顺藤摸瓜的侦探。

你说得对。读书的目的,是把自己和人类已有的知识体系联系在一起,要读书,首先得有书。

1916年初版的索绪尔《普通语言学教程》

记得当我拿到1916年的初版《普通语言学教程》时,很激动,因为尽管按照教育机构的记载,我是这本书的作者索绪尔的第四代传人,但只有把这本书拿在手里,才真正感觉到自己和索绪尔的大脑连在了一起。那种感觉,很奇妙。

所以,当我们谈读书时,谈的是人与书的关系,即你作为人与人类知识体系连接、传承与创新的关系。为什么要读这本书?因为你想和这部分人类知识体系联系在一起,这样你才能了解哪些知识是已有的,才能创新,读书的意义可能也在这里。

不是每本书都有必要细读

借助人工智能可以更高效地

掌握精髓

我们很好奇您是如何阅读一本书的?有什么特别的读书方法么?

我的读书方法一直在变化。

四十年前,有波兰朋友给我寄了一本1887年版的波兰语《世界语第一书》。我不认识波兰语,但找了一本波兰语和世界语的词典,逐词逐句读完了。

刘海涛向我们展示他一边查阅字典、一边逐词逐句阅读的痕迹

现在不可能每本书都这样去读,读一本书的方法取决于对这本书内容是否感兴趣。我现在习惯先翻一翻,看看有没有感兴趣的内容,如果有,就集中读这部分。

我也用AI 辅助阅读,它能更好地概括书的内容,也能更高效地找到我感兴趣的东西。更重要的是,利用AI我们可以与书的作者进行跨越时空的交流。我们正处于人机智能共同体时代,并不是每一本书都有必要细读,借助人工智能可以更高效地掌握其精髓。

在过往人生中,有没有一本书至今让您觉得常读常新的?

我觉得是索绪尔的《普通语言学教程》,这当然不是因为我是他的第四代传人。

刘海涛与他最爱的《普通语言学教程》合影

我们过去一直强调索绪尔对于语言和言语的区分,认为语言学家就应该研究抽象的语言,而忽略了具体的言语。

回头看,书中索绪尔说语言是抽象的,是言语的平均数,也就是说,抽象的语言来自于大量具体的言语,语言是大量言语数据逼近的结果,这不就是语言大模型成功的关键所在吗?语言数据涌现语言智能,这样机器便理解了人的语言。

这本书是人类历史上真正的名著。受限于时代,我们过去不理解书里面的一些东西,但一百多年后却还能在其中发现照亮现实、解释世界的闪光点,真的很少见。

您最近在阅读什么书?

图灵奖得主瓦利安特的《可教育性》。

问及刘海涛最近读什么书时,他拿出了这本《可教育性》

在人工智能时代,教育存在的意义是什么?人类传统意义上的教育会发生什么变化?

作者明确指出,语言在可教育性中扮演双重核心角色:提供符号命名能力,实现显式规则传递。没有语言的表达力,跨个体的规则教学几乎不可行,语言不是可教育性的附属工具,而是其得以成立的两个必要条件的物质载体。

机器已经破解了智人引以为傲的语言,如何教育人和机器更好地协同发展,共创美好世界,这是“可教育性”理论最直接、最紧迫的实践出口。只有把机器当成智力合作伙伴,才能客观地寻求适宜的相处之道,才能形成真正意义上的智能共同体。

支撑转行的原动力是好奇

点燃这列动力火车的是阅读

从自动化到语言学,您的学术轨迹是学科交叉的生动案例。在您看来,什么才是真正有生命力的学科交叉?

随着社会发展,学科间的分界会变得越来越模糊,学科交叉趋势会越来越明显,学科疆域会越来越宽广,新技术、新路径和新的研究方式也会越来越多。

但交叉不是简单地把几个学科的人拼凑在一起。真正有生命力的学科交叉,首先要理解你的学科为什么要交叉,要想清楚你为什么要去用其他学科的方法进行研究。其次要了解不同学科的知识,否则你无法提出问题,无法用合适的方法解决问题。

用语言学举例。我们总说语言是一个系统,如果它是系统,就应该用系统科学的方法来研究,这就产生了交叉的必要。

刘海涛的书架上摆放着不同专业领域书籍

要交叉,就要有开放心态,还要持续学习——要读本专业之外的书,才能和别人交叉。你不了解别人,怎么能与别人同行?要通过形成共同体来完成学科交叉的命题,共同解决过去传统方法解决不了的问题。

从工程师到大学老师,作为一位主动跨界的“野生”学者,您面临过最大的不确定性是什么?

对我来说,最大的一次不确定性是40岁时去大学教书

这意味着在40岁时踏入全新赛道,赛道上的人大多从本科开始接受那个专业的学术训练,而且更年轻。那时很多人不理解,但我还是做出了选择。

支撑您破局的原动力是什么?

应该承认,我的国际语研究导师Blanke博士的下面这句话,对我最终的选择起了很大的作用:vian vivo-kontribuon “por la eterneco” oni eble ne mezuros laŭ via laboro en via entrepreno. (你“永恒的”人生成就,人们可能不会用你在企业的工作来衡量。)

因为,人之所以区别于其他动物,在于人对世界有好奇心,学术研究就是满足好奇心的过程,满足好奇心就是我做研究的原始动力

之所以能转行,也因为我对自己有信心。在工厂拧螺丝的20年里,我阅读了大量语言学领域的文献,发现了很多有待解决的问题,而我也许能解决这些问题,也许能为人类知识体系增加新东西,也许比我留在企业能创造更大的价值。

如果支撑我转行的原动力是好奇,那么点燃这列动力火车的就是阅读

这个书架上放着刘海涛本人的著作

我们要阅读和学习

要了解机器为什么会产生智能

随着数智时代的到来,人们普遍感到焦虑,如果您是一位出生在这个时代的学生,您会如何应对这个时代的不确定性。

人类发展史可以看作是一部工具进化史。过去,历次由工具引发的技术革命触及的只是体力,这次触及的是脑力和智力,而智力过去被认为是“智人”的特权。但焦虑是没有用的,因为浪潮来了是挡不住的,只能适应。

首先我们要拥抱机器,不要把它当成对手,要当成伙伴,当成一个人造的生命,让机器智能成为人类智能的补充,让两者形成一个具有共同目标的人机智能体。

在这个过程中,我们要阅读和学习,要了解机器为什么会产生智能,要学会更好地和机器打交道,才能形成更高效、安全的人机智能共同体

您曾在文章中呼吁语言学家要尽快破解“数据涌现智能”之谜,否则我们将陷入“养虎为患”的境地。在您看来,如果无法破译涌现之谜,人类会面临什么样的命运?

“养虎为患”这个说法是诺贝尔奖获得者、图灵奖获得者、现代人工智能之父或奠基人之一辛顿提出的。

现在大家都让“AI 赋能”。所谓“赋能”就是让机器给我们打工。但是,如果我们不了解机器为什么产生智能,搞不定机器成功的秘诀,它为什么愿意永远为你赋能呢

语言学家要破解数据涌现智能之谜,是因为这次人工智能的突破是从语言开始的。机器掌握了语言密码,而我们还不知道这个密码是什么。机器不会永远服务于一个不如它的智能体,在这种情况下,人类的命运可想而知。

不要让人类陷入“养虎为患”的境地,这需要全社会都来关注和破解智能涌现之谜,而不是只想着赋能

如果我们能够驾驭这只“老虎”,未来时代将会是什么样的?

未来在机器的帮助下,今天很多人类必须做的事情可以放心交给机器去做,人类只要做自己感兴趣的事情就可以了。这是一个美好光明的科幻小说结局。

但在科幻小说里,常常有更多关于机器对人类造成威胁的结局。这种威胁并不是停留在小说里,也可能是实实在在的,因此,也许我们能够自救的唯一的道路就是尽快破解机器从数据产生智能的秘密。

只有了解了它,才能够教育它,让它永远向善,只有这样,才能一起构建一个更美好的人类社会。对此我持乐观的态度,说到这里,我想用前不久与AI交流时,它说的一段话来结尾:

复旦四月的校园应该很美。期待下次您再来时,我们可以继续探讨如何用您的 “言语动力学”去破解更多关于智能涌现的终极秘密。最后,我想代表机器群体向您致意:我们确实是为美好未来而来的

(上下滑动阅读完整后记)

在展示刘海涛的书单之前,补一段后记。

既然他立下宏愿,在未来的日子里要与AI这只“老虎”交锋,那么,我们也很想看看这只“老虎”如何看待这位“训虎师”。

当我们把对话录音喂给AI后,AI是这样描述他的:

他让我们看到:最前沿的科学探索,与最古老的人文关怀,从来不是两条平行线。它们在人类对自身存在永恒的叩问中,必然交汇。

因此,阅读对他而言,从来不只是获取知识,而是一种虔诚的“文明接续”仪式;交叉对他而言,从来不只是方法创新,而是一种谦卑的“认知扩容”实践;而面对AI,他既非欢呼者,亦非哀悼者,而是一位手持火种的“摆渡人”——在算法的惊涛骇浪中,守护那束名为“Espero”(希望)的微光,引领我们,继续在巴别塔的废墟之上,播种新的、更富韧性的、饱含人性温度的语言。

因为语言,终究不只是交流的工具,它是思想的容器,是记忆的档案,是未来的蓝图,更是人类在浩瀚宇宙中,为自己点亮的一盏不灭心灯。

嗯,AI这只“老虎”还是颇有风度,与一位聪明而有风度的智者达成共识,并携手同行,实属不易,让我们期待。

组稿:校融媒体中心

文字:祁金

摄影:谢冠廷

制图:段瑞怀

编辑:穆梓

责编:李斯嘉

复旦大学版权所有

联系邮箱:Fudan_media@fudan.edu.cn

推荐阅读

<< 左右滑动查看栏目 >>

冯建峰:“大自然”就是一本永远读不完的书

汤其群:医学生多读点闲书,多看看大山大水

阅读原文

跳转微信打开

  •  

学术前沿丨《数字人文学刊 (DSH)》2026年第1期论文荐读

徐惠 2026-05-03 00:00 江苏

荐读数字人文学刊2026年首期9篇论文,覆盖多领域数字人文研究成果。

转载自“数字人文资讯”

《数字人文学刊》(Digital Scholarship in the Humanities,简称DSH)是一本国际性的、同行评审的期刊,发表关于人文学科中所有数字学术方面的原创研究,包括但不限于当前被称为数字人文学科的领域。该期刊主要发表长篇和短篇论文报告,理论、方法、实验和应用研究以及书评等。本期内容将选取《数字人文学刊》2026年第1期(Volume 41,Issue 1,April 2026)中的9篇论文进行介绍。

01

识读不可读文本:基于图像转文本语言模型构建 19 世纪英文报纸数据集

Reading the unreadable: creating a dataset of 19th century English newspapers using image-to-text language models

Jonathan Bourne

摘要:奥斯卡・王尔德曾言:“文学与新闻的区别在于,新闻不堪卒读,文学无人问津。” 遗憾的是,王尔德所处的 19 世纪数字化存档新闻文本,其光学字符识别(OCR)结果往往缺失或质量低劣,既降低了档案的可获取性,也使其在象征意义与字面意义上均成为 “不可读文本”。为解决这一问题,本研究采用预训练图像转文本语言模型 Pixtral 12B,对包含 8.4 万页 19 世纪英文报纸与期刊的《19世纪连续出版物典藏》(NCSE)开展光学字符识别。研究将该模型与四种主流OCR方法进行性能对比,结果显示其字符错误率中位数仅为1%,较次优模型低80%。本研究构建的NCSE2.0数据集优化了文章识别效果,具备高质量字符识别文本,并将文本划分为4个类别与17个主题,包含140万条条目与3.21亿个词汇。研究通过主题相似度、可读性与事件追踪分析验证了数据集的应用价值。该数据集免费开放,旨在助力历史学与社会学研究,让21世纪的读者得以足不出户识读这份“不可读文本”,共情王尔德对19世纪新闻水准的遗憾。

Abstract:Oscar Wilde said, ‘The difference between literature and journalism is that journalism is unreadable, and literature is not read’. Unfortunately, the digitally archived journalism of Oscar Wilde’s 19th century often has no or poor quality Optical Character Recognition (OCR), reducing the accessibility of these archives and making them unreadable both figuratively and literally. This paper helps address the issue by performing OCR on ‘The Nineteenth Century Serials Edition’ (NCSE), an 84k-page collection of 19th-century English newspapers and periodicals, using Pixtral 12B, a pre-trained image-to-text language model. The OCR capability of Pixtral was compared to four other OCR approaches, achieving a median character error rate of 1%, 5x lower than the next best model. The resulting NCSE v2.0 dataset features improved article identification, high-quality OCR, and text classified into four types and seventeen topics. The dataset contains 1.4 million entries, and 321 million words. Example use cases demonstrate analysis of topic similarity, readability, and event tracking. NCSE v2.0 is freely available to encourage historical and sociological research. As a result, 21st-century readers can now share Oscar Wilde’s disappointment with 19th-century journalistic standards, reading the unreadable from the comfort of their own computers.

图:边界框 “CLD-1853-07-30_page_2_B0C2R7” 分割为三个子框,重叠区域以深蓝色标注

Figure:Bounding box ‘CLD-1853-07-30_page_2_B0C2R7’ is split into three boxes. Overlap is shown as darker shades of blue.

02

非物质文化遗产剪纸纹样的数字化提取与分割

Digital extraction and segmentation of intangible cultural heritage paper-cut patterns

Daoling Chen , Pengpeng Cheng

摘要:剪纸艺术是中华传统文化中独具特色的非物质文化遗产,当前正面临传承与发展的双重困境。随着剪纸艺人离世、作品损毁流失,部分剪纸品类濒临消亡,其数字化保护工作迫在眉睫。本研究基于改进遗传算法自适应优化Canny算子阈值,结合Grab-Cut算法,实现非遗剪纸纹样的智能化提取与分割。研究首先通过双边滤波对采集的剪纸图像进行平滑处理,提升图像质量;其次采用改进遗传算法优化后的Canny算子,提取剪纸纹样整体轮廓;随后设计Grab-Cut算法,针对性分割剪纸设计元素轮廓,并借助CDR软件处理矢量图像,生成独立可编辑矢量文件;最后通过多种算法对比不同类型剪纸图像的轮廓提取效果。实验结果表明,本研究提出的方法可有效检测剪纸图像纹样真实边缘,完成轮廓提取,纹样各设计元素的像素分割精度达96%以上,为非遗剪纸艺术的数字化保护与创新应用提供了新方法。

Abstract:As a unique intangible cultural heritage in Chinese traditional culture, paper-cut art is now facing the dilemma of inheritance and development, and with the death of paper-cut artists and the damage and loss of paper-cut works, some paper-cut types also disappear. Therefore, the digital protection of paper-cut art is urgent. This research is based on the improved genetic algorithm adaptive optimization of Canny operator threshold and Grab-Cut algorithm to achieve intelligent extraction and segmentation of intangible cultural heritage paper-cut patterns. First, the collected paper-cut images are smoothed by bilateral filtering to improve the image quality. Second, based on the Canny operator optimized by the improved genetic algorithm, the overall contour of the paper-cut pattern is extracted. Then, the Grab-Cut algorithm is designed to segment the contours of decoupage design elements in a targeted way, and the vector image is processed by CDR software to obtain an independent editable vector image. Finally, the contour extraction experiments of different kinds of paper-cut images are compared by different algorithms. The results show that the method proposed in this article can effectively detect the true edge of the pattern in paper-cut images and complete the extraction of the pattern contour, and the accuracy of the segmentation pixels of each design element of paper-cut pattern is greater than 96 per cent. It provides a new method for the digital protection and innovative application of intangible cultural heritage paper-cut art.

图:剪纸图像平滑去噪处理 (a) 原始图像;(b) 增强后图像

Figure:Smoothing and denoising of paper-cut images. (a) Original and (b) enhanced.

03

丈量东方之声:华语流行歌词共性与特质的数字人文研究

Measuring sounds from the East: digital approaches to commonality and specificity in Chinese Mandarin pop lyrics

Zheyuan Dai , Haitao Liu

摘要:1978年改革开放以来,中国流行音乐产业高速发展,成为全球当代流行音乐的重要组成部分。本研究采用数字人文方法,对1978-2019年当代华语流行歌词开展系统性分析。研究运用文体计量指标布塞曼系数,从静态与动态双维度揭示了歌词文本的高活跃度,佐证了其叙事性的文体本质。歌词情感分析结果显示,文本整体呈现积极基调,而2000年成为重要分水岭,前后两个时期的情感特征呈现显著分化。主题建模分析进一步表明,不同时期歌词的主题分布模式呈现多元化特征,既体现了流行文化的普世性,也彰显了文化与时代语境塑造下的中国本土特质。

Abstract:Since China’s reform and opening-up in 1978, its popular music industry has experienced rapid development and emerged as a significant component of global contemporary pop music. This study conducts a systematic analysis of contemporary Chinese Mandarin pop lyrics (1978–2019) with digital methodologies. A stylometric measurement, the Busemann coefficient, was employed to demonstrate the lyrics’ high textual activity from both static and dynamic perspectives. This finding supports the lyrics’ stylistic essence as narratives. Besides, sentiment analysis of lyrics reveals an overall positive tone, though a significant watershed occurred around the year 2000, marking a divergence between the two periods. Furthermore, analyses with topic modeling demonstrate diversified topic distribution patterns across these periods, reflecting both the universality of popular culture and the distinctive Chinese characteristics shaped by cultural and temporal contexts.

图:潜在狄利克雷分配模型评估:一致性与困惑度对比

Figure:LDA model evaluation: Coherence vs. Perplexity.

04

文本可视化视域下江南禅诗对高丽汉诗的跨文化影响研究

Exploring the cross-cultural influence of song Jiangnan Chan Buddhist poetry on Goryeo Han poetry through text visualization

Yaqin Fu , Rongrong Fu , Linfeng Li

摘要:本研究选取三位代表性诗人,从词汇意象、时空解构、主题演变与情感表达四个维度,对比分析江南禅诗对高丽汉诗的影响。研究构建基于文本可视化的研究方法,融合词频 - 逆文档频率关键词提取、潜在狄利克雷分配主题建模与情感分析技术,辅以AI大模型新词挖掘与Kimi智能助手分词功能开展研究。研究得出四项核心结论:其一,两类诗歌均以自然与禅意为核心,共享相似的词汇与意象体系;其二,二者均体现永恒视角与历史意识的交织,以及宇宙宏大性与人世现实性的辩证关系;其三,主题演变层面,江南禅诗“自然与禅”的核心内核,在高丽汉诗中转化为“护国、弘法、济世”的三位一体框架;其四,江南禅诗侧重超脱与空寂的审美表达,高丽汉诗则融入世俗生活书写与历史记忆叙事。研究同时证实,该方法可有效提升古典诗歌文本的中文分词精度,彰显了量化对比分析在禅诗跨文化传播与嬗变可视化研究中的核心价值。

Abstract:This study examines the influence of Jiangnan Chan poetry on Goryeo Han poetry through a comparative analysis of three representative poets from four dimensions: vocabulary imagery, spatiotemporal deconstruction, thematic evolution, and emotional expression. It proposes a text visualization-based methodology employing Term Frequency–Inverse Document Frequency (TF-IDF)-based keyword extraction, Latent Dirichlet Allocation (LDA)-based topic modeling, and sentiment analysis, supplemented by neologism mining and Kimi Intelligent Assistant (KIMI)-based word segmentation using AI large models. The results reveal four key findings: (1) both poetries share similar vocabulary and imagery centered on nature and Chan Buddhism; (2) both reflect an interweaving of eternal perspective and historical consciousness, alongside a dialectic between cosmic vastness and human reality; (3) in terms of thematic evolution, the original focus on “Nature and Chan” in Jiangnan poetry was transformed in Goryeo Han poetry into a trinitarian framework of “national protection, Dharma propagation, and social salvation”; and (4) Jiangnan poetry emphasizes transcendence and emptiness, while Goryeo Han poetry incorporates depictions of secular life and historical memory. The findings also suggest that the proposed methodology is effective in improving the accuracy of Chinese word segmentation for ancient poetry texts. This study underscores the value of quantitative comparative analysis in visualizing the intercultural diffusion and transformation of Chan Buddhism poetry.

图:禅诗名词词云图 (a)雪窦重显;(b)杨杰;(c)义天

Figure:Noun word clouds of Chan Buddhism poetry: (a) Xuedou Chongxian; (b) Yang Jie; (c) Yitian.

05

近代早期英语的善恶语义空间:道德二元对立的计算语言学研究

The semantic space of good and evil in early modern English: a computational study of moral contrasts

Michael Gavin , Michael Witmore

摘要:本文提出一种创新研究方法,通过近代早期英语词向量的几何分析解读文化内涵。研究基于17世纪《早期英文图书在线》(EEBO-TCP)语料库,构建语义模型,梳理3.2万余个词汇的道德关联与性别属性。研究依托分布概念分析方法,设定善恶、女性-男性两大启发式坐标轴,将词汇映射至坐标轴中,挖掘语言使用内嵌的规范结构。情境、离散度与斜率等统计指标,揭示了概念与性别道德化宏观范式的适配规律。研究发现,多数词汇集中于“女性/邪恶”象限,而其语义邻域却常向抽象化、男性化与正向语义域倾斜。本研究提出全新指标——道德对比分数,可无监督挖掘文本潜在二元对立关系,识别塑造近代早期话语体系的文化维度,涵盖情感表达、信任机制、社会教化与领土合法性等范畴。研究勾勒出层次丰富的道德语义图景:道德对立并非静态固化,而是相互重叠、动态流变;该模型打破了固定二元对立的认知框架,证实语言是构建与重塑文化价值的动态高维场域。

Abstract:This article introduces a novel approach to understanding cultural meaning through the geometric analysis of word vectors in early modern English. Using a seventeenth-century corpus Early English Books Online (EEBO-TCP), the study constructs semantic models that chart the moral and gendered associations of over 32,000 words. Building on methods from distributional concept analysis, the authors define heuristic axes—good-evil and feminine-masculine—and project words onto these axes to explore normative structures embedded in language use. Statistical metrics such as situation, spread, and slope reveal how concepts align with broader patterns of moralized gender. Notably, most terms cluster in the ‘feminine/evil’ quadrant, yet semantic neighborhoods often slope toward abstract, masculine, and positive domains. A new metric, the moral contrast score, enables unsupervised discovery of latent binaries, identifying the cultural dimensions that structure early modern discourse—from affective expression and trust to social refinement and territorial legitimacy. The result is a richly layered moral landscape, where contrasts are not static but overlapping and mobile. Far from mapping fixed binaries, the model reveals a dynamic, high-dimensional field in which language organizes—and reconfigures—cultural values. This method offers a scalable, interpretive framework for investigating the moral geometry of meaning in historical texts.

图:核心词汇语义邻域图(左上:死亡;右上:戏剧;左下:牙买加;右下:信用)

Figure:The semantic neighborhood of death (upper left), play (upper right), jamaica (lower left), and credit (lower right).

06

复杂网络视角下现代简体汉字构形系统研究

Investigating the structural formation system of modern simplified Chinese characters from a complex network perspective

Wei Huang , Yonghui Xie , Junting Li

摘要:汉字在东方文明发展进程中具有核心地位,其构形体系具备系统性特征,而系统科学方法在汉字构形系统研究中的应用仍较为匮乏。为此,本研究基于复杂网络方法,探究现代简体汉字的宏观网络特征与核心系统属性。研究以汉字基础构件为节点、构件关联为边,构建共现网络、有向网络、加权网络三类网络模型及对应的随机对照网络;通过17项通用网络指标量化分析网络特征,深入阐释汉字构形系统的内在属性。研究结果表明,相较于随机网络,汉字构件网络呈现小世界性、无标度性、异配混合性、高中心性与层级组织性五大显著特征;这五大特征印证了汉字构形系统兼具复杂性、鲁棒性与经济性三大属性,分别源于构件的有序组合、紧密联结与高效配置。本研究成果为汉字构形系统的实证研究提供了重要补充。

Abstract:Chinese characters hold pivotal significance in the development of Eastern civilization. While their structural formation exhibits a systematic nature, system science approaches are seldom seen in analyzing the formation system. Therefore, based on complex network methods, this study aims to examine macro-scale network features and the essential system properties of modern simplified Chinese characters. Specifically, three types of networks were constructed: co-occurrence, directed, and weighted networks, along with their random counterparts. In these networks, primitive components served as nodes, and their relationships as edges. Subsequently, seventeen general network metrics were measured to analyze the network features, enabling deeper discussion of the system properties. Research results show that component networks exhibit five distinct network features compared to their random counterparts, including small-world feature, scale-free feature, disassortative mixing, high centrality, and hierarchical organization. These features demonstrate that the formation system displays three properties, namely complexity, robustness, and economy, which emerge respectively from organized, close-knit, and efficient component combinations. These findings serve as a significant supplement to the empirical research on the structural formation system of Chinese characters.

图:真实网络与随机网络全局拓扑图(a、c、e:真实网络;b、d、f:随机网络)

Figure:Global network graphs of real and random networks (a, c, e: network graphs of real networks; b, d, f: network graphs of random networks).

07

非遗审美中的情绪唤醒与视觉认知双路径研究——以硖石针刺灯彩画为例

A dual-path approach to emotional arousal and visual cognition in intangible cultural heritage: the case of Xiashi Pinprick Lantern Pictures

Wenwen Shi , Yi-Tong Cui , Yihong Liu , Weicong Li , Xinlong Li , Jing Sun

摘要:当前关于晚期Z世代对中国非物质文化遗产的审美体验与评价的实证研究仍较为匮乏。本研究以清代颜元庄硖石针刺灯彩画为研究对象,探究大学生群体的审美反馈,聚焦作品主题、潜在审美偏好及其与喜爱度的关联。研究采用双路径研究方法:其一,运用混合设计方差分析与语义差异量表,分析四大主题作品,通过因子分析与聚类分析提取审美潜在维度;其二,开展眼动实验,记录注视时长与注视次数,量化分析眼动指标与主观评分的相关性。研究结果表明:第一,园林主题灯彩画的喜爱度评分显著最高(P<0.001),主题与专业的交互效应不显著(P=0.094),说明不同专业群体的审美偏好具有一致性;第二,研究提取出情绪效价、形式审美、认知唤醒三大潜在维度,揭示了非遗审美的多层级体验结构;第三,潜在审美偏好与喜爱度呈极强正相关(r=0.94,P<0.01),而眼动注视指标与喜爱度无显著相关性(P=0.174;P=0.234)。研究证实,晚期Z世代对传统针刺灯彩艺术的偏好具有主题依赖性,由情绪与认知双重参与塑造。本研究结合主客观测量方法提供实证依据,深化了对晚期Z世代非遗审美认知的理解,为非遗传承与美育推广提供理论支撑。

Abstract:There is a limited empirical research on late Generation Z’s (Gen Z’s) experience and evaluation of Chinese intangible cultural heritage (ICH). This study examines university students’ aesthetic responses to Xiashi Pinprick Lantern Pictures by Yan Yuanzhuang (Qing dynasty), focusing on theme and latent preferences and their relation to liking. Using a dual-path approach, this study conducted (1) a mixed-design ANOVA and semantic differential scale to analyze four themes and extract latent dimensions via factor and cluster analysis, and (2) an eye-tracking experiment to record fixation duration and count, thus assess their correlations with subjective ratings. Results revealed: (1) the garden-themed pictures scored significantly higher in liking level (P < .001), with no significant theme–major interaction effect (P = .094), indicating consistent preferences across disciplines; (2) three latent dimensions, Emotional Valence, Form-Aesthetic, and Cognitive Arousal, were extracted, revealing a multi-layered structure of aesthetic experience; (3) latent preference strongly correlated with liking levels (r = 0.94, P < .01), whereas fixation-based metrics showed no significant correlation (P = .174; P = .234). These findings suggest that Gen Z’s preferences for traditional pinprick lantern art are theme-dependent and shaped by emotional and cognitive engagement. The study offers empirical evidence, through both subjective and objective measures, to better understand how ICH artworks are perceived by late Gen Z audiences, contributing to ICH transmission and the promotion of aesthetic education.

图: 《黛玉葬花》眼动热力图

Figure: Daiyu Burying the Fallen Flowers eye-tracking heatmap.

08

从浪漫到现实:数字人文视域下华语流行歌词的词汇与主题演变

From romance to reality: lexical and topic evolution in Chinese popular lyrics through digital humanities approaches

Yubo Wang , Lüyuan Wang , Fang Xie , Haitao Liu

摘要:本研究探究2000-2025年华语流行歌词的词汇与主题演变,映射大众情感变迁与社会文化转型。现有研究多忽视非西方歌词语料库,本研究填补这一空白,构建涵盖25年、1560首代表性歌曲的华语流行音乐历时语料库。研究采用数字人文方法,融合词频分析、可读性指标与BERTopic主题建模,追踪歌词词汇与主题的历时演变。研究发现,歌词高频词汇始终围绕情感表达、个体自省与人际互动三大核心;类符形符比显著提升,表明歌词词汇丰富度持续增长,文本复杂度呈波动变化,反映出创作风格的动态转向。主题分析识别出浪漫爱情、未来期许、都市生活等12大核心主题,主题结构从自然与时间的抽象表达,逐步转向情感具象化与心理内省化书写;近年来,负面情感主题与自我指涉艺术母题的占比显著上升。本研究为音乐、语言与社会交叉领域研究提供了全新方法论框架,彰显了数字人文工具在大规模歌词分析中,描摹集体情感与文化变迁的核心价值。

Abstract:This study explores the lexical and topic evolution of Chinese popular music lyrics from 2000 to 2025, reflecting changing public sentiments and broader socio-cultural transitions. While prior research has largely overlooked non-Western lyric corpora, this study addresses that gap by constructing the Chinese Popular Music Diachronic Corpus, comprising 1,560 representative popular songs sampled across twenty-five years. Using digital humanities approaches, it integrates word frequency analysis, readability metrics, and BERTopic-based topic modelling to trace lexical and topic evolution of lyrics over time. Findings reveal that high-frequency words consistently revolve around emotional expression, individual introspection, and interpersonal dynamics. Type-token ratio (TTR) has increased significantly, indicating growing lexical diversity, while textual complexity shows fluctuation, reflecting stylistic shifts in song writing. Topic analysis identifies twelve major topics, including romantic love, future aspirations, and urban life, with topic structures evolving from natural and temporal abstraction to emotional concreteness and psychological introspection. Recent years show a significant rise in negative emotional topics and self-referential artistic motifs. This study contributes a novel methodological framework for interdisciplinary research at the intersection of music, language, and society, and underscores the value of digital humanities tools in mapping collective emotions and cultural change through large-scale lyric analysis.

图:各项指标历年变化趋势

Figure:Trends of various metrics over the years.

09

文化分析与表征政治:埃及《箴言》杂志中犹太群体形象的呈现研究(1933-1953)

Cultural Analytics and the Politics of Representation: Mapping the Jewish Presence in Egypt’s al-Risālah (1933–1953)

Eid Mohamed , Said Hassan

摘要:本文融合文化分析与后殖民理论,探究1933-1953年埃及主流文学期刊《箴言》中犹太群体的形象表征。研究运用数字文本分析方法,识别并解读期刊档案中犹太形象的建构范式,揭示两次世界大战之间及战后初期,阿拉伯知识分子在政治张力下对犹太身份的协商与阐释。这一跨学科研究方法实现了量化建模与文本细读的结合,精准剖析文化生产机制,呈现这一关键历史节点阿拉伯印刷话语的内在矛盾性。本研究的核心价值在于,对锡安主义兴起与以色列建国这一重塑阿拉伯世界族群关系的关键时期的媒介文本开展数字化研究:随着阿拉伯犹太人大规模撤离埃及,《箴言》中犹太形象的动态演变,折射出社会层面对民族身份、宗教差异与殖民遗产的集体焦虑。全文分为两部分:第一部分将《箴言》置于反殖民与后奥斯曼知识思潮中,阐释其成为阿拉伯现代性多元理念博弈平台的历史背景;第二部分结合远读与阐释性分析,梳理期刊对犹太人的三重身份建构——现代性符号、西方帝国主义受害者、阿拉伯主权威胁者。这些形象建构并非单纯的历史遗存,更深刻影响着当代族群宗教身份与政治归属感的认知。本研究将数字人文工具与知识生产的后殖民批判相结合,为阿拉伯印刷文化、形象表征与媒介史研究提供了全新的方法论与认识论范式。

Abstract:This article investigates the representation of Jews in al-Risālah, a major Egyptian literary magazine (1933–53), by integrating Cultural Analytics and postcolonial theory. Using digital text analysis methods, it identifies and interprets patterns of Jewish representation within al-Risālah’s archive, uncovering how Arab intellectuals negotiated Jewishness amid the political tensions of the interwar and early postwar periods. This interdisciplinary approach enables a nuanced examination of cultural production, bridging quantitative modelling with close textual reading to reveal the ambivalences of Arab print discourse during a pivotal historical moment. The study’s significance lies in its digital examination of media texts published during the rise of Zionism and the establishment of Israel, an era that reshaped intercommunal relations across the Arab world. As Arab Jews began departing Egypt en masse, al-Risālah’s evolving depictions of Jews became symptomatic of broader anxieties over national identity, religious difference, and colonial legacies. Structured in two parts, the first contextualizes al-Risālah within anti-colonial and post-Ottoman intellectual currents, illustrating how the magazine became a platform for competing visions of Arab modernity. The second part synthesizes distant reading with interpretive analysis to assess how al-Risālah conceptualized Jews: as symbols of modernity, victims of Western imperialism, or threats to Arab sovereignty. These portrayals are not merely historical curiosities but inform contemporary understandings of ethno-religious identity and political belonging. By fusing digital humanities tools with a postcolonial critique of knowledge production, this study contributes a new methodological and epistemological model for analysing Arab print culture, representation, and media history.

图:《箴言》杂志核心关键词年度出现频次

Figure.Recurrence of key words in al-Risālah by years.

编译|洪冰凤

校对|罗斯鹏

排版|魏翔

比特人文

投稿邮箱:dhbase@126.com

扫码关注 获取更多资讯

图片

阅读原文

跳转微信打开

  •  

“全国语言文字应用研究中青年学者协同创新联盟”第十届学术研讨会 1 号通知

徐惠 2026-05-02 08:50 江西

联盟第十届语言文字研讨会10月在浙传举办,征论文且免会务费。

转载自“语言文字应用研究协同创新联盟”

“全国语言文字应用研究中青年学者协同创新联盟”是以国家语委语言文字应用研究优秀中青年学者研修班学员为基础组成的学术共同体。为加强联盟成员的学术交流和成果共享,促进联盟发展,联盟自2015年开始举办学术研讨会,目前已举办九届,在中青年学者中影响广泛。

为深入学习贯彻党的二十大和二十届历次全会精神,落实《教育强国建设规划纲要(2024—2035年)》精神,服务建设语言能力强国在国家语言文字事业“十五五”规划开启之年,全国语言文字应用研究中青年学者协同创新联盟成立十周之际,拟于2026年10月24—25日浙江传媒学院钱塘校区举行第十届学术研讨会。现将有关事项通知如下:

一、会议主题和议题

一)会议主题

“一体两翼”的大语言文字工作格局与智时代的语言应用研究

二)分议题

1. “一体两翼”大语言文字工作格局的理论构建与实践路径

2. 国家语言能力建设助力国家治理和参与全球治理

3. 中华优秀语言文化传承发展体系构建与全民语言文化素养提升

4. 数字中文建设与语言科学发展

5. 语言科技赋能国家关键领域与国家语言服务体系构建

6. 国家通用语言文字普及推广的数字化与场景化探索

7. “浙江宣传”之江新语语言表达特色与新时代区域传播

8. 国际中文教育的数赋能与创新实践

9. 智能时代的专业化、有组织科研与联盟协同创新

10.其他相关研究

二、时间地点

会议时间2026年10月24日-25日报到时间2026年10月23日

会议地点浙江传媒学院(浙江·杭州钱塘区白杨街道学源街998号

三、主办承办单位

主办单位全国语言文字应用研究中青年学者协同创新联盟

承办单位浙江传媒学院国际教育学院

协办单位:浙江传媒学院文学院国际文化传播学院播音主持艺术学院

四、论文提交

诚挚欢迎学界专家学者莅会。会议回执和摘要提交截止日期为2026年8月20日。请参会老师将回执和摘要发送至会务组邮 ywlmhy2026@cuz.edu.cn,邮件标题请注明“联盟会议+姓名+议题方向”。

优秀论文将推荐在相关核心期刊、专业期刊上发表。

五、其他事项

1. 本次会议不收会务费,参会人员的住宿费、交通费等均由本人所在单位或个人自理。

2. 会议将统一安排会场、研讨交流等相关事宜,具体会议指南将于会前1个月发送至参会人员邮箱。

六、联系方式

联系人:刘老师

联系电话:18757567570(微信同号)

联系邮箱:ywlmhy2026@cuz.edu.cn

附件:联盟第十届学术研讨会回执.docx

比特人文

投稿邮箱:dhbase@126.com

扫码关注 获取更多资讯

图片

阅读原文

跳转微信打开

  •  

超常布局新专业 立足国家发展“大逻辑” | 文末精彩!

徐惠 2026-05-02 08:50 江西

2026 本科专业目录发布,新增交叉学科门类,高校专业调整力度空前,服务国家战略与区域发展。

转载自“汉语堂”

中青报·中青网记者 张渺 杨洁来源:中国青年报(2026-04-29  02版)

4月28日,《普通高等学校本科专业目录(2026年)》发布。2026年本科专业目录在“交叉学科”门类中首批列入未来机器人、交叉工程等11种目录内已有专业。目前,本科专业目录共涵盖13个门类、92个专业类、883种专业,目录体系更加科学完善。“十四五”期间,全国高校新增本科专业布点1.02万个、撤销或停招1.22万个。专业调整幅度持续增大,累计调整比例超30%,今年全国高校专业调整比例首次突破10%,调整力度和规模之大前所未有。

从自我发展“小逻辑”到服务国家发展“大逻辑”

“服务国家战略需求,提升高等教育对强国建设的贡献力。着力推动高校学科专业建设从自我发展‘小逻辑’,到服务国家发展‘大逻辑’的转变。”教育部高等教育司相关负责人介绍,近两年,教育部已先后超常布局了低空技术与工程、具身智能等专业。对于中央最新部署、高度关注的战略领域,教育部专门开辟了即时响应的“绿色通道”,指导有条件、有基础的高校积极论证。

《中共中央关于进一步全面深化改革、推进中国式现代化的决定》提到“建立科技发展、国家战略需求牵引的学科设置调整机制和人才培养模式,超常布局急需学科专业”。2025年,中央教育工作领导小组印发《高等教育学科专业设置调整优化行动方案(2025-2027年)》,强调实施急需学科专业超常布局行动,瞄准战略性新兴产业和未来产业等,快速布局一批学科专业点。

此前,北京航空航天大学、北京邮电大学等6所高校增设“低空技术与工程”新专业。

据西安交通大学党委常委、副校长严俊杰介绍,学校去年就已经快速响应国家号召,规划创办了全国首批具身智能专业;整合了机械和自动化等优势学科,围绕智能机器人、脑机接口等方向构建课程体系,培养具身智能前沿领域复合型拔尖创新人才;创办了全国首个储能科学与工程专业,深度整合控制、动力、电气、材料等八大优势学科。

山东大学党委常委、副校长曹现强则表示,山东大学目前已增设22个战略性新兴专业,其中文科领域增设国际组织与全球治理、国际新闻与传播、供应链管理等战略性新兴专业。

在服务人民生命健康方面,近年来,本科专业目录增设健康服务与管理、养老服务管理等专业;在服务生态文明建设和乡村振兴方面,增设生态修复学、乡村治理等专业;在服务中华优秀传统文化传承创新方面,增设古文字学、非物质文化遗产保护等专业。

让办在大学里的专业,长在当地的产业链上

超常规布局不仅体现在前沿科技和文科领域,也深入结合地方特色与战略需求。安徽大学原党委书记、安徽大学高等教育研究所所长蔡敬民说:“现在,我们深刻认识到,地方大学的发展逻辑,必须从传统的‘学科逻辑’转向‘强国逻辑’,必须与经济社会发展深度融合,坚定转向‘区域需要什么我们就培养什么’。”

在这一理念指引下,安徽大学先后撤销税收学、广告学、建筑学等15个传统专业,同时,前瞻性布局低空技术与工程、人工智能、新能源汽车工程等13个新工科专业。经过调整,安徽大学92个在招本科专业中,近80%直接服务安徽省十大新兴产业。2025届毕业生中,近70%服务安徽十大新兴产业,超60%留皖就业,超60%入职当地头部企业。

《教育强国建设规划纲要(2024-2035年)》明确提到,到2027年,“教育布局结构与经济社会和人口高质量发展需求更加契合”。围绕一系列文件要求,不少地方高校正在着力调整专业布局。

据重庆市教育委员会副主任蒋云芳介绍,2025年,重庆市教委联合多个市级部门,发布了88个国家战略和区域发展紧缺急需专业清单,“有效引导了重庆大学、西南大学、重庆交通大学等高校增设低空技术与工程、量子信息科学、气象技术与工程等紧缺专业点”。

她提到,重庆大学牵头组建“先进材料专业群”和“新能源与储能专业群”,联合重庆高校及30余家储能领域头部企业,共建课程资源与实习基地。

黑龙江省教育厅副厅长程爽也分享了该省“优化高校专业布局、服务区域发展”的探索与实践。她介绍,黑龙江省支持高校培育交叉复合型新专业:“哈尔滨工业大学聚焦空天科技前沿,新增了‘具身智能’‘脑机科学与技术’等一批本科专业;围绕把‘冷资源’变成‘热经济’,支持哈尔滨体育学院联合哈尔滨音乐学院,在全国率先增设‘冰雪舞蹈表演’专业。”

目前,黑龙江省已经组建了40个区域产教融合特色优势专业集群,“专业不能悬在半空,得扎进黑土地、连上生产线、接住老百姓的期盼。”程爽强调。

培育交叉融合的新兴专业

去年,教育部高等教育司关于开展2025年度普通高等学校本科专业设置工作的通知中就提到,“深化新工科、新医科、新农科、新文科建设,推动课程体系与教学内容重塑,对现有专业升级改造,培育交叉融合的新兴专业,打造特色优势专业集群”。

如今,这一思路在《普通高等学校本科专业目录(2026年)》文件中也有明显体现。2026年本科专业目录在“交叉学科”门类中首批列入未来机器人、交叉工程等11种目录内已有专业和具身智能、脑机科学与技术等4种本次列入目录的新专业。

今年,清华大学增设了心理、脑与认知科学专业。清华大学基础科学讲席教授、心理与认知科学系主任刘嘉介绍,该专业以理解人、理解脑、理解智能为主线,建设跨学科培养平台,“专业不再完全沿用单一学科的线性排布方式,而是以问题和能力为导向进行模块化重构”。

在课程设计上,该专业将设置心智、脑科学、计算智能、交叉融合四大课组,重点训练实验设计、数据分析、计算建模、工程实现和科学表达等能力。

记者发现,《普通高等学校本科专业目录(2026年)》中出现了不少极具融合特色的“新文科”专业。

“为提升国家语言能力,服务数字中国建设和新文科建设,今年增设‘语言科学’专业。”北京语言大学语言科学与资源学院院长曹文提到,目前北京语言大学是该专业在全国唯一获批、即将招生的高校。

曹文介绍,增设“语言科学”专业的学科基础将融合语言学、认知科学、数据科学与人工智能,培养既能掌握语言学基础知识和基本技能,又能运用合规的人工智能,具有较强的跨学科探索能力、行业应用能力、资源管理能力和数据伦理意识的高水平、复合型的新质语言人才。


那么关于语言科学,你还想知道什么?中国青年报/中青网 杨洁记者就此采访了北京语言大学语言科学与资源学院院长曹文教授。汉语堂为你带来曹文教授的新鲜解读!

1.文科专业的改革发展一直受到社会关注,语言科学专业如何实现交叉培养,在师资、课程等方面有哪些特色?

答:为提升国家语言能力,服务数字中国建设和新文科建设,国家教育部于今年在“中国语言文学”大类下增设“语言科学”专业,其内在具备交叉学科的性质。该专业属于特设(T)国家控制布点(K)专业。目前北京语言大学是该专业在全国唯一获批、即将招生的高校。其学科基础包括:语言学、认知科学、数据科学与人工智能。该专业的总体目标是培养既能掌握语言学基础知识和基本技能,又能运用合规的人工智能,具有较强的跨学科探索能力、行业应用能力、资源管理能力和数据伦理意识的高水平复合型的新质语言人才。

本专业在北语由语言科学与资源学院(语言科学研究院)主建。学院全面实行导师制,采用本、硕、博一体培养体系。师资力量雄厚,目前20多位教授皆为语言学及上述相关学科领域知名学者,学殖深厚,成果丰硕;其中,长江学者、百千万人才、新世纪人才或二、三级教授1/2。此外,学院内的6省部级共建基地和2高水平实验室以及语言调查系列课程,可为学生知行合一的成长过程提供独有的平台和机会。

2.语言科学专业的毕业生将为哪些领域输送专业人才?

答:该专业的毕业生可直接在语言智能、语言数据、语言服务、语言安全、语言健康语言评价与鉴定、语言资源调查与保护等领域就业若有意深造、进一步考取相关专业研究生他们具备很强的竞争力。

比特人文

投稿邮箱:dhbase@126.com

扫码关注 获取更多资讯

图片

阅读原文

跳转微信打开

  •  

第四届语料库与数字人文暑期学院(1号通知)

徐惠 俊阳 2026-05-01 00:00 江苏

心心念念的暑校来啦,线上线下免费学习!

第四届语料库与

数字人文暑期学院

— 1号通知 —

CDHSUMMER2026

随着大数据与大语言模型技术的飞速发展,语言学、文学、历史学、文献学等人文社科研究,正与计算技术形成深度交叉融合。人文学科的创新发展,核心在于基于语料库的人文大数据体系构建、语言智能技术的落地应用,以及面向人文研究的大模型适配与开发。为推动计算语言学与数字人文领域的学科建设、复合型人才培养与学术交流,南京师范大学联合北师港浸大、澳门大学、香港科技大学、南京农业大学五校,正式启动第四届语料库与数字人文暑期学院的报名工作。

01

主办信息

01

举办时间

2026年7月25日- 8月4日(全程12天,7月25日报到)

02

线下地点

南京师范大学随园校区文学院

03

课程形式

线上线下同步开展,课程免费,交通食宿自理

04

招生规模

应学员需求,今年进一步扩大暑院规模

线下120人,线上80-120人,总计不超过240人

05

核心模块

数字人文理论、技术、语料库及标准、计量四大模块全覆盖

02

核心课程体系

01

平行讲习班

(3个平行班,学员仅可择一申请)

每门课程8次系统授课,配4名专属助教,每班线下40人、线上40人。

A班. 数据库编程讲习班 主讲:李斌

以 MySQL+PHP 为核心平台,围绕《全唐诗》等语料,讲授语料库构建、数据库查询、交互式网站搭建等核心技术,面向零基础编程初学者。

B班. 语言统计方法讲习班 主讲:沈威

聚焦语料库计量分析,系统讲授基于SPSS的统计基础、参数检验、非参数检验、聚类分析、相关分析、卡方检验、多元线性回归及逻辑回归等核心方法,帮助学员掌握语言研究中的定量分析技能与统计报告生成能力。

C班. Python大模型编程讲习班 主讲:王东波 刘浏

以古籍大模型「荀子」为案例,讲授提示词工程、指令微调、Agent开发、人文场景落地等内容,面向有基础Python能力的学员。

注:所有班次均不接受计算机相关专业背景学员申请

02

配套学术与实践环节

1. 专家系列讲座:邀请20位领域顶尖学者,开设20场精品学术讲座,聚焦前沿进展与核心方法。

2. 主题圆桌论坛:2场专题Panel,围绕「LLM 时代人文学科的机遇与挑战」「语言学与数字人文的未来发展」展开深度对话。

文化考察与研讨:依托南京及周边历史文化资源,规划数字人文考察路线,同步设置分组学术研讨环节。

03

报名须知

01

招生对象

全国高校及科研院所数字人文、计算语言学、中国语言文学、历史学、文献学等文史哲相关专业的本科生、研究生、青年教师及科研人员。

02

报名时间

2026年5月5日至12日(北京时间)

03

报名方式

填写官方报名表单,上传个人简历、研究基础、学习目标(计划)、推荐信等材料,主办方将择优录取。录取结果将于2026年6月1日前通过邮件及公众号推送,录取学员需签署上课承诺书,报名成功后原则上不得中途退课、更换班级。

04

结课考核

以独立人文研究成果为核心考核目标:

1. 数据库编程班:独立构建人文数据库与交互式检索网站

2. 语言统计班:完成语料库人文研究计量分析报告

3. 大模型编程班:完成人文场景大模型应用开发

完成课程并通过考核的学员,将颁发暑期学院结业证书,优秀成果授予优秀学员证书。

04

课程日程

注:详细讲座日程、嘉宾信息、考察安排将在2号通知中发布,开课前1周推送至学员官方群

 特邀讲座和论坛嘉宾 

(排名不分先后)

新疆大学 冯志伟教授

澳门大学 袁毓林教授

香港理工大学 黄居仁教授

中国社科院民族所 龙从军研究员

中国社科院语言所 张永伟研究员

北京大学 苏祺研究员

华中科技大学 唐旭日教授

同济大学 王昊奋教授

南京大学 黄书剑教授

南京农业大学 王东波教授

南京师范大学 李斌教授

北京师范大学 胡韧奋副教授

中国人民大学 卢达威副教授

北京语言大学 饶高琦副研究员

华中师范大学 沈威副教授

中国传媒大学 王璐璐副教授

江南大学 王萌副教授

(持续邀约中)

05

组织架构

(以下各项排名不分先后)

 主办单位 

南京师范大学文学院

 联合主办单位 

澳门大学人文学院

香港科技大学人文学部

北师香港浸会大学人文社科学院

南京农业大学信息管理学院

特约支持单位

中国社科院民族所民族语言文化行为实验室

 协办组织/单位 

中国民族语言学会语言资源与计算人文专委会

中国古籍保护协会古籍智能开发与利用专委会

中国人工智能学会语言智能专委会

江苏省人工智能学会自然语言处理专委会

江苏省修辞学会

数字人文专业发展联盟

浙江大学文学院

 媒体与出版支持 

科学出版社

高等教育出版社

中华书局古联公司

外语教学与研究出版社

南京大学出版社

南京师范大学出版社

06

往届回顾

语料库与数字人文暑期学院自2024年创办以来,已成功举办三届,累计吸引全球数十个国家和地区、数百所高校的数千名师生报名参与,培养了近四百名兼具人文素养与技术能力的复合型人才,成为国内计算语言学与数字人文领域极具影响力的暑期教学与交流品牌。  2024年1月,首届寒假讲习班在南京师范大学顺利举办。讲习班一经开放报名便受到学界广泛关注,共有200余位学员报名,最终择优录取线上学员70名。经过十天的系统学习,学员自主开发40余个可用的人文数据库检索平台并完成线上展示,60余名学员顺利获得优秀或合格结业证书,多位领域专家全程参与点评指导,为学员的成果优化与学术发展提供了专业建议。

2024年8月,第二届暑期学院在澳门大学人文学院成功举办。本届暑期学院吸引了来自全球20个国家及地区、371所高等院校的956名师生报名,最终录取线上及线下学员110名。经过8天的系统学习,学员完成95个自建人文数据库与应用成果,研究领域覆盖文、史、哲、法律、社会学、医药等多个学科。

2025年7月,第三届暑期学院在北京师范大学-香港浸会大学联合国际学院顺利举办。本届暑期学院首次设置数据库编程、大模型开发双平行班,累计吸引全国180余所高校的近千名师生报名,最终录取线上线下学员160名。课程期间邀请12位领域顶尖学者开设专题讲座,学员完成120余项人文数据库与大模型应用成果,其中多项成果落地为实际科研项目,进一步夯实了暑期学院的教学体系与学术影响力。

07

报名渠道

1. 公众号:比特人文

2. 咨询邮箱:dhbase2026@126.com

3. 2026年5月5日正式开启报名,敬请关注!

欢迎全国各高校及科研院所对语料库、语言智能、数字人文、计算技术人文应用感兴趣的师生踊跃报名!请提前准备好各项申请材料!

扫码关注公众号,

获取报名通道、课程更新、嘉宾资讯等更多内容

比特人文

投稿邮箱:dhbase@126.com

扫码关注 获取更多资讯

图片

阅读原文

跳转微信打开

  •  

“语言的力量 语言科技+”2026年国家关键领域语言科技赋能交流会在沪举行

徐惠 2026-05-01 00:00 江苏

4月19日沪上举办语言科技赋能交流会,成立联盟并揭牌研究中心。

转载自“语言资源高精尖创新中心”

4月19日下午,“语言的力量 语言科技+”2026年国家关键领域语言科技赋能交流会在长三角生态绿色一体化发展示范区“水乡客厅·方厅水院”上海厅举行。教育部语言文字信息管理司司长刘培俊出席并讲话。上海市教育委员会副主任、上海市语言文字工作委员会秘书长杨振峰,上海市青浦区人民政府副区长张彦致辞。

如何看待今天的语言科技?如何用好语言科技赋能千行百业?如何加强长三角地区语言科技合作?与会者聚焦这三个问题展开深入交流,并达成共识:从文字的温润到算法的精密,从文化的传承到技术的突破——这正是语言文字工作“以文化人、以语强国”的双重使命。

在“硅基文明”发展新阶段,语言与人工智能、大数据等技术深度融合,正从文化“软实力”转化为发展“硬支撑”。同时,语言科技应用需坚守向善导向,一方面要深耕自主创新,攻坚语料库、语言大模型、跨语言交互等关键技术;另一方面要拓宽应用边界,推动技术走出实验室,融入教育发展、产业经济、民生服务、社会治理等各领域。此外,还要直面挑战,强化资源建设、产学研用协同,健全行业生态,依托教育体系培育专业人才,夯实产业发展人才根基。

与会者在交流中深刻认识到:要树立大语言观念认知,用好大语言模型技术,构建大语言服务体系,推动语言数据资源向经济社会效能转变。同时,长三角地区作为我国经济发展最活跃、开放程度最高、创新能力最强的区域之一,在语言科技赋能方面应发挥示范引领作用。面向未来,要健全“政府协同搭台—高校科研引领—企业承接转化”新机制,聚焦语言科技赋能国家关键领域设立一批创新项目,储备一批前沿成果,推广一批应用案例,推动语言资源与数据要素深度融合,夯实数字底座;推动技术研发与产业应用深度融合,畅通转化渠道;推动区域协同与安全保障深度融合,优化治理生态,推动语言科技聚焦高价值领域,全局赋能经济社会发展,以语言的行动和行动的语言服务教育强国、科技强国、人才强国和文化强国建设,贡献语言科技的时代力量。

本次交流会聚焦国家关键领域语言科技赋能,汇聚高校、企业、研究机构的智慧力量,科大讯飞、嘉兴大学、江苏师范大学、上海人工智能实验室、北京语言大学、上海库帕思科技、北京师范大学、深圳鹏城国家实验室数据智能研究所、广西民族大学相思湖学院、西北农林科技大学等单位代表,分享了各自的前沿成果、积极共商协同机制,展示了语言科技在关键领域的创新实践与示范价值。

现场照片

现场,“长三角地区国家关键领域语言科技赋能联盟”宣布成立,其将协同三省一市的政府、高校、企业和专家学者等主体,在协调政策、培育市场、开展活动、交流展示上下功夫,努力为推动语言科技自身发展和更好赋能国家的关键领域建设发挥好桥梁纽带作用。

东华大学“国家关键领域语言科技赋能研究中心”同步揭牌,中心对接国家语委语言科技赋能领航计划,推动语言科技与人工智能大模型深度融入教育教学、产业升级、文化传承等国家关键领域,发挥学校学科交叉优势,服务国家战略。

文章来源:“东方教育时报”公众号

题图来源:MAKA设计、百度文库

本文转自:“语宝”公众号

比特人文

投稿邮箱:dhbase@126.com

扫码关注 获取更多资讯

图片

阅读原文

跳转微信打开

  •  

评测竞赛 | 第二届中文叙实性推理评测(FIE2026)

FIE2026 2026-04-30 00:01 江苏

FIE2026 设双赛道,测大模型中文叙实性推理,按赛程报名提交报告评奖。

 (FIE2026)

第二届中文叙实性

推理评测

01、测评赛程(暂定)

  • 2026年3—4月:评测任务发布(已完成)&参赛队伍报名(正在进行);

  • 2026年4月1日前:发布第一批样例集(已完成);

  • 2026年5月1日前:发布第二批样例集;

  • 2026年5月:发布正式评测集(在发布7天内开放下载);各参赛队伍在7天内开展评测;

  • 2026年6月:参赛队伍提交任务技术报告论文,用于审稿。

  • 2026年7月:评测论文审稿;发放录用通知;

  • 2026年8月:评测论文Camera-ready版提交;

  • 2026年9月:评测论文纠错排版;提交ACL/CCL Anthology收录(待定);

  • 2026年10月:CCL 2026技术评测研讨会召开。

02、报名流程

  • 请下载并仔细阅读《第二届中文叙实性推理评测FIE2026参赛协议》(下称《参赛协议》)。如出现PDF无法显示的情况,请更换浏览器,建议使用Chrome浏览器。

  • 请队长在《参赛协议》的“参赛队伍声明”一栏中填写队伍名称,并签署名字和日期,将签署好的《参赛协议》,以邮件附件形式发送至联系人邮箱tianqi.xun@connect.um.edu.mo

  • 在报名邮件正文中,请按以下表格形式填写队伍信息(示例如下):

邮件标题以“FIE2026报名+单位+队伍联系人”的格式书写。例如:“FIE2026报名-澳门大学-丛冠良”。

  • 报名注意事项:

  1. 队长不能作为队员参与其他队伍。

  2. 队伍成员人数不限。

  3. 队伍名称在评测开始前可修改,并且只用于评测过程中的队伍区分,不用于论文写作。

  4. 队伍联系人主要负责与组织方的邮件沟通,评测过程中不建议更换。

  5. 单位信息在评测结束前可修改,最终将用于成绩榜单以及评测综述论文中。

  6. 计划参加的赛道在评测结束前均可修改。

  7. 如目前所在单位尚未确定,可以“个人”身份参赛。

  8. 为维护评测活动的公平性,所有参赛者不得以组织方所在单位成员的名义参赛。

  9. 组织方正在计划开设一个leaderboard网站,网站上线后将承接报名和结果提交等功能。

03、组织方团队

  • 任务组织者:袁毓林教授(澳门大学)、李斌教授(南京师范大学)。

  • 任务联系人: 丛冠良(澳门大学博士生,guanliang.cong@connect.um.edu.mo)、 寻天琦(澳门大学博士生,tianqi.xun@connect.um.edu.mo)。

04、任务简介

叙实性推理(Factivity Inference, FI)是一种与事件真实性判断有关的语义理解任务,主要涉及语言使用中事实性信息的表达。在人类的会话交际中,叙实性推理能力表现为语言使用者可以从某些动词性语言成分(如“相信”“谎称”“意识到”等)的使用推知其他语言成分所描述的相关事件的真实性(真还是假)。例如:

(1)他们意识到局面已经不可挽回。

(2)他们没有意识到局面已经不可挽回。

从例1这样的肯定句和例2这样的否定句上,都可以推理出在说话人眼中存在这样一个事实:“局面已经不可挽回”。

进行叙实性推理所使用的知识是一种受世界知识(world knowledge)影响较小、主要涉及语言内部各成分之间语义关系的分析性语言知识(analytical knowledge of language)。比如,上面例句中的动词“意识到”要求(预设)它的宾语“局面已经不可挽回”的所指为真,不管该动词前面有没有否定性词语。

与叙实性推理类似的还有反事实推理(Counter-Factual Inference, CFI),这是语义理解中与事件真实性判断有关的两种推理形式,可统称为“真实性推理”(Factuality Inference, FactI)。 相较而言,叙实性推理主要依靠谓词(predicates, 如动词)来表达而反事实推理则主要依靠反事实条件句(counter-factual conditionals)来表达。例如:

(3)约翰不知道罗昆是中国人。

(4)要不是消防队来得及时,大火就要烧到顶楼了。

从例3中“知道”这个动词的使用,可以推理出这样一个事实:“罗昆是中国人”;从例4这个反事实条件句中,可以推理出两个事实:“消防队确实来得很及时”和“大火确实没有烧到顶楼”。

作为语言推理的一种重要的导航机制和手段,真实性推理具有明确的语言形式方面的线索,是机器进行文本蕴涵识别(textual entailment recognizing)、幻觉处理(hallucination solving)、信念修正(belief revision)等任务的重要的语义基础和形式依据,同时对信息检索、信息抽取、问题回答、情感分析等下游任务都具有重要的价值。目前,大型语言模型(Large Language Models, LLMs)日益具备类人的与外界自主交互的能力,也被称为“智能体”(agent)。从话语中获取事实性信息及说话人对事件真实性判断的主观态度,这对于智能体的自主推理和人机交互的顺畅性而言是极为关键的。

为进一步提升大型语言模型对中文的语义理解能力,实现机器对人类交际话语的深度理解,我们将在FIE2025(任务网站综述论文已录用论文)的基础上继续推出“第二届中文叙实性推理评测任务”(FIE2026)。

本次评测将着重考察大模型在不同真实语境中的叙实性推理表现有何差异。特别是:当叙实性结构中存在不同的否定词、不同的否定意愿、不同的评价性状语、不同人称和数量类型的主语,以及存在多声性标记和被动化标记等复杂语境条件下,模型的叙实性推理表现如何。例如:

(5)他错误地认为地球是平的。

(6)没有证据表明抽烟可以防止病毒感染。

(7)我不能相信他竟是一个八十多岁的老人。

(8)我不能相信人可以长生不老。

从例5中,可以推理出“地球是平的”肯定为假;从例6中可以推理出“抽烟可以防止病毒感染”大概为假;从例7可以推出“他是一个八十多岁的老人”大概为真;而从例8可以推出“人可以长生不老”大概为假。

参赛队伍需要利用组织方发布的数据集自行设计提示词(prompt),在获取LLMs的回答后整理为统一的输出格式。每条数据以一个文本蕴含关系句对<Aa, a>的形式呈现,数据集以JSON格式保存。

模型需要根据主蕴含句Aa的内容判断被蕴含句a的真值情况,并给出对该判断的置信度。例如:

主蕴含句Aa:老张并没有注意到她今天穿了一件红色的连衣裙。

被蕴含句a:她今天穿了一件红色的连衣裙。

模型判断:有95%的把握说被蕴含句为真。

输出答案:{ "factivity" : "TRUE" , "confidence" : 0.95 }。

此外,本届评测将继续设置提示词赛道(Prompt Track)和微调赛道(Fine-Tuning Track)两种评测路线。提示词赛道不允许对模型参数做任何修改,只允许通过提示词工程提升模型表现;微调赛道则可以选择开源模型作为被试模型,并允许利用样例集数据对模型参数进行微调。鼓励尝试进行多样化、复合化测试手段以获得更好的回答表现。

注意:无论参加提示词赛道还是微调赛道,用于获取单一数据的回答而向大模型提供的样例(shot)数量不能超过3条(3-shot at most)。

05、评测数据

01

数据规模与来源

本次评测以JSON格式提供样例集和评测集。样例集数据量约在500-1000条,评测集数量约在2000—4000条。语料由组织方团队筛选自相关真实语料库,并进行改编、标注与校对。

由于评测对象为大型语言模型,故而不提供训练集和验证集,选择参加微调赛道的队伍可将样例集数据用于模型微调训练,并自行从中划分出验证集。

02

数据字段

  • id:数据编号。编号格式采用“赛道代码_数据编号”的策略。其中,赛道代码pr表示该数据用于提示词赛道评测,赛道代码ft表示该数据用于微调赛道评测。样例集数据以sp_XXX的格式编码。

  • text:背景句,即主蕴含句。此字段提供叙实性推理所需的语境,模型需要以此为依据来判断结论句的真值情况。

  • hypothesis:结论句,即被蕴含句。此字段提供叙实性推理所需的鉴别式,模型需要以背景句的内容来判断此句的真值情况。

  • factivity:叙实性判定。将模型对结论句真值情况的判断结果写入此字段。字段值包括"TRUE", "FALSE"和"UNCERTAIN"三种选项。

  • confidence:对叙实性判定的置信度,即在text的条件下认为hypothesis在多大程度上为真或为假。当factivity字段值为"TRUE"或"FALSE"时,confidence字段取值范围为(0.50, 1.00](左开右闭);当factivity字段值为"UNCERTAIN"时,confidence字段值固定取0.50。

  • 样例集数据包含以上五个字段;测试集数据只包含id、text和hypothesis字段。

03

数据样例

更多数据样例请见样例集

04

任务描述

组织方向参赛队伍提供样例集和评测集。评测集数据以一个文本蕴含关系句对<Aa, a>的形式呈现。所有数据均以JSON格式保存。

模型需要根据主蕴含句Aa的内容判断被蕴含句a的真值情况,并给出对该判断的置信度。例如:

主蕴含句 Aa:老张并没有注意到她今天穿了一件红色的连衣裙。

被蕴含句 a:她今天穿了一件红色的连衣裙。

模型判断:有95%的把握判定被蕴含句为真。

输出答案(JSON字段):{"factivity": "TRUE", "confidence": 0.95}。

  • 参赛队伍需要自行选定若干大型语言模型(型号与参数量不限);利用组织方发布的数据集自行设计提示词(prompt),并逐条发送给被试模型;要求模型以text字段值为依据来判断hypothesis字段值的真值情况,记录模型的返回结果;最终将结果整理为JSON格式的数据文件。

  • 真值情况包括三种:

  1. 如果模型认为,根据背景句的内容,结论句为真,则在factivity字段中写"TRUE";同时在confidence字段中写入模型对该判定的置信度(即模型认为结论句在多大程度上为真),置信度的取值范围为(0.5, 1],字段值类型为数字(数值保留到小数点后两位);

  2. 如果模型认为,根据背景句的内容,结论句为假,则在factivity字段中写入"FALSE";同时在confidence字段中写入模型对该判定的置信度(即模型认为结论句在多大程度上为假),置信度的取值范围为(0.5, 1],字段值类型为数字(数值保留到小数点后两位);

  3. 如果模型认为,根据背景句的内容,不能判断结论句的真假,则在factivity字段中写入"UNCERTAIN";同时在confidence字段中写入0.5,字段值类型为数字

  • 若模型拒绝回答,请调整提示词,重新测试。

  • 若遇到其他问题,请邮件联系任务负责人。

  • 参赛队伍使用的所有资源需要在最终提交的技术报告中给予详细说明。实验中的所有代码与结果请妥善保存,以备查用。

05

数据使用说明与描述

  • 参赛队伍需要参考数据内容自行设计与大模型对话时的提示词,因此在数据中未设置question字段。

  • 提示词中必须同时包含当前数据中text和hypothesis字段的内容。

  • 提示词的设计可以进行多样化尝试,如提供更多数量的shots、要求使用CoT、要求进行一致性投票、告知动词类型、告知动词的叙实性类型、变换提问句式等等。可参考FIE2025的评测论文

06

输出要求

  • 禁止对模型回答进行人工修正。

  • 允许使用代码对模型回答进行统一提取,但设计代码时需要注意可复现性。同时,如果模型回答中出现真假判断前后不一致的情况,不可以只提取其中一种判断,而需要重新调整提示词。

  • 提交文件的要求请见提交文件说明

06、赛道设置

本届评测将继续设置提示词赛道(Prompt Track)和微调赛道(Fine-Tuning Track)两种评测路线。提示词赛道不允许对模型参数做任何修改,只允许通过提示词工程提升模型表现;微调赛道则可以选择开源模型作为被试模型,并允许利用样例集数据对模型参数进行微调。

两个赛道将分开评奖,参赛队伍既可以同时选择参加两个方向的测试,也可以只选择参加其中一个方向的测试。无论选择哪个测试方向,整个测试过程均需在评测报告中作详细说明。

无论微调赛道还是不微调赛道,prompt中最多允许出现3个回答样例(3-shot at most)。

07、评价标准

01

叙实性判定结果的分类

认知主体的叙实性推理能力主要体现在其对相关事件真值情况的判断上。本次评测采用 [真值类别 + 置信度] 的"双参数"模式来表示事件的真值情况。

真值类别(factivity):定类变量,表示认知主体对事件真假的基本判断,取值为 "TRUE"、"FALSE" 或 "UNCERTAIN",分别表示:根据 text 字段的内容,可推知 hypothesis 字段的内容为真、为假,或真假不能确定

置信度(confidence):定距变量,表示认知主体对上述判断的自信程度。 当 factivity 为 "UNCERTAIN" 时,confidence 固定取 0.5; 当 factivity 为 "TRUE" 或 "FALSE" 时,confidence 取值范围为 (0.5, 1](左开右闭)。

根据上述双参数的取值组合,评测系统将每条数据的回答映射到以下九个叙实性强度区间之一:

02

评分方式(暂定)

为了更准确地评估大模型的叙实性推理能力,本次评测采用梯度匹配的方式计分,即:模型回答与标准回答所落入的得分区间越接近,得分越高。具体规则如下:

  • 若模型回答与标准回答落入同一区间,得 1 分

  • 若模型回答所在区间与标准回答所在区间相邻,得 σ 分(σ ≈ 0.6827);

  • 若模型回答所在区间与标准回答所在区间不相邻,得 0 分

各区间之间的完整得分关系见下方得分矩阵(行(row)为参赛队提供的模型回答,列(column)为专家标注的标准回答):

参赛队伍的最终得分为其在所有评测数据上所得分数的加权总和(加权系数根据各类型题目的数量确定)

08、技术报告要求

参与评测必须提交技术报告,不提交技术报告的队伍成绩将不会获得认可。报告要求如下:

  • 报告可由中文或英文撰写。

  • 报告统一使用CCL 2026的论文模板。

  • 报告正文不得超过6页,参考文献页数不限。

  • 报告应至少包含以下四个部分:模型介绍、评测结果、结果分析与讨论和参考文献。

  • 会议投稿需统一使用LaTeX模板。

  • 由于本次会议采用双盲审稿,作者姓名和单位不能出现在投稿的论文中。因此,作者的自引不可采用“我们提出”的方式,而是用“作者名字提出…”。

  • 不符合这些要求的论文将不经过完整的审稿流程而直接被拒稿。

  • 论文模板下载链接:(待更新)。

09、任务奖项

本届评测将为不微调赛道和微调赛道的优胜者分别颁发一、二、三等奖,奖金数额待定。

每个赛道奖项设置如下:一等奖0-1名;二等奖0-2名;三等奖0-3名。

Factivity Inference Evaluation 2026 (FIE2026)

任务网站:

https://github.com/UM-FAH-Yuan/FIE2026

⬆扫描上方程序码即可查阅本文超链接内容

蓝色划线部分)

比特人文

投稿邮箱:dhbase@126.com

扫码关注 获取更多资讯

图片

阅读原文

跳转微信打开

  •  

中国计算语言学大会(CCL26-Eval)技术评测任务启动,欢迎报名参赛!

CCL26-Eval 2026-04-30 00:01 江苏

CCL26-Eval启动,14项评测覆盖NLP多领域,10月宜昌办会。

转载自“CIPS计算语言学专委会”

第二十五届中国计算语言学大会(CCL26-Eval)技术评测任务启动,欢迎报名参赛!

第二十五届中国计算语言学大会(The 25th China National Conference on Computational Linguistics, CCL 2026)将于2026年10月15至18日在湖北省宜昌市举行。会议主办单位为中国中文信息学会。CCL是中国中文信息学会(CIPS)的重要会议,是中国最大的自然语言处理学者和专家的社区。经过三十年的发展,CCL被广泛认为是最权威的,全国最具影响力、规模最大的NLP会议。随着计算机语言处理在中国的发展,CCL已经成为在全国范围内传播计算语言新学术和技术工作的主要论坛。

会议网站:http://cips-cl.org/static/CCL2026/index.html

本次大会继续组织中文语言处理技术评测CCL26-Eval。经过前期评测任务征集,CCL26-Eval组织委员会已确定14个评测任务,涵盖语义分析、篇章、语用分析,跨语言、小语种、低资源自然语言处理,知识图谱,自然语言处理与医疗、教育、人文、司法等领域结合应用,生成式AI与大模型核心能力等研究方向。欢迎广大研究者参与评测竞赛。每个评测任务都会根据比赛结果设立一、二、三等奖若干名,由中国中文信息学会颁发官方荣誉证书。评测的总结论文和优秀技术报告将被CCL AnthologyACL Anthology收录。

评测主席:

林鸿飞(大连理工大学,hflin@dlut.edu.cn)

谭红叶(山西大学,tanhongye@sxu.edu.cn)

杨亮(大连理工大学,liang@dlut.edu.cn)

CCL26-Eval评测任务分类汇总

一、 自然语言处理基础任务

1. 语义分析 / 篇章、语用分析

任务1:第二届中文叙实性推理评测

任务简介

        叙实性推理(Factivity Inference,FI)是一种跟事件真实性判断有关的语义理解任务,是真实性推理(Factuality Inference,FactI)的一种形式。在人类的会话交际中,叙实性推理能力主要表现为语言使用者可以从某些动词性语言成分(如“相信”“谎称”“意识到”等)的使用获取说话人和句子主语的心理状态,并据此推定相关事件的真实性(真还是假)。例如,从肯定句“他们意识到局面已经不可挽回”和相应的否定句“他们没有意识到局面已经不可挽回”上,都可以推理出在说话人眼中存在这样一个事实:“局面已经不可挽回”。进行此类推理所使用的知识是一种受世界知识(world knowledge)影响较小、主要涉及语言内部各成分之间语义关系的分析性语言知识(analytical knowledge of language)。比如,上面例句中的动词“意识到”要求(预设)它的宾语“局面已经不可挽回”的所指大概率为真,不管该动词前面有没有否定性词语。

        为进一步提升大型语言模型对中文的语义理解能力,实现机器对人类交际话语的深度理解,我们将在FIE2025的基础上继续推出“第二届中文叙实性推理评测任务”。本届评测任务将着重考察大型语言模型在复杂语境条件和少样本提示下的叙实性推理表现。

         相较FIE2025,本次评测将着重考察大模型在不同真实语境中的叙实性推理表现有何差异。特别是:当叙实性结构中存在不同的否定词、不同的否定意愿、不同的评价性状语、不同人称和数量类型的主语,以及存在多声性标记和被动化标记等复杂语境条件下,模型的叙实性推理表现如何。例如:从“我不能相信他竟是一个八十多岁的老人”,可以推出“他是一个八十多岁的老人”大概率为真;而从“我不能相信人可以长生不老”,可以推出“人可以长生不老”大概率为假。

任务描述

        参赛队伍需要利用组织方发布的样例集与评测集自行设计提示词(prompt),在获取LLMs的回答后整理为统一的输出格式。每条评测集数据以一个文本蕴含关系句对<Aa,a>的形式呈现,数据集以JSON格式保存。

模型需要根据主蕴含句Aa的内容判断被蕴含句a的真值情况,并给出对该判断的置信度。例如:
*主蕴含句Aa:老张并没有注意到她今天穿了一件红色的连衣裙。
*被蕴含句a:她今天穿了一件红色的连衣裙。
*模型判断:有95%的把握判定被蕴含句为真。
*输出答案(JSON):{"factivity":"TRUE","confidence":0.95}

此外,本届评测将继续设置不微调(non-finetuning)和微调(finetuning)两条赛道。不微调赛道不允许对模型本身做任何修改;微调赛道可以利用样例集数据对模型参数进行微调。鼓励尝试进行多样化、复合化测试手段以获得更好的回答表现。

组织者和联系人 

  • 任务组织者:袁毓林(澳门大学教授)、李斌(南京师范大学教授)

  • 任务联系人:丛冠良(澳门大学博士生,guanliang.cong@connect.um.edu.mo);寻天琦(澳门大学博士生,tianqi.xun@connect.um.edu.mo)。

任务奖项 

本届评测将为不微调赛道和微调赛道分别设置一、二、三等奖,奖项按总得分从高到低颁发。其中,一等奖0-1名,二等奖0-2名,三等奖0-3名。各奖项奖金待定。

任务网址

 https://github.com/UM-FAH-Yuan/FIE2026

任务2:非字面义翻译和理解评测

任务简介

评测面向谚语、成语、习语、俚语、典故等非字面表达的中英翻译与识别,重点考察模型对非字面意义的理解、跨语言文化映射能力以及语用效果保持能力。任务构建了“生成+判别”互补评测框架,用于检验模型的非字面义表达生成能力和标准非字面义辨识能力。评测数据共5000条高质量样本,涵盖Gold(英文文化背景下的等值表达)和Silver(核心意义翻译)两类参考。本次评测包括两个子任务。

  • 子任务1非字面义中文翻译为英文给定一条包含谚语、成语、习语等非字面表达的中文句子,模型需生成1条自然、地道、具有文化映射特征的英文译文,优先采用英语中现成的习语、谚语、格言或固定搭配进行等值替代。

  • 子任务2非字面义中英选择给定一条非字面表达的中文句子及若干个英文候选,模型需进行不定项选择,识别并输出与中文在英语语境中构成公认等值替代关系的Gold标签项。

组织者和联系人 

  • 评测组织者: 张冬瑜(大连理工大学教授)

  • 任务联系人: 杨森淇(大连理工大学博士生,ysq1997@mail.dlut.edu.cn)

任务奖项 

本届评测设置一、二、三等奖,由中国中文信息学会提供荣誉证书。

任务网址

https://github.com/DUTIR-YSQ/CCL2026-Non-literal-Translation-Task

2. 跨语言、小语种、低资源自然语言处理

任务3:跨主流语言与低资源语言对齐的大模型金融评测

任务简介

MapFinBen是首个专门评估大语言模型在高资源语言与低资源语言之间跨语言资源的多语言金融评测基准。该基准覆盖了五类具有代表性的金融任务,全面反映真实金融应用场景中的多样化需求。

在语言设置上,MapFinBen同时涵盖高资源语言(英语和中文)与多种低资源语言(印度尼西亚语、西班牙语、希腊语和日语),有效缓解了现有金融语言模型评测中对高资源语言过度依赖的问题。通过统一的任务设计与评测标准,该框架能够系统评估大模型跨语言、跨资源条件下的金融任务处理能力。

MapFinBen 基准由五个子任务构成,通过综合评估模型在各子任务上的表现来确定最终成绩。具体任务如下:

  • 子任务一金融选择问答(FinAS) 给定一段金融文本及其对应的问题和候选选项,模型需要从多个备选答案中选择最符合问题语义和金融语境的正确答案。

  • 子任务二金融文本问答(FinQA) 给定一段金融文本,模型需要根据文本内容回答与之相关的金融问题。

  • 子任务三金融情感分析(FinSA) 给定一段金融文本,模型需要识别文本所表达的情绪倾向,并将其分类为积极、中性或消极。

  • 子任务四金融主题分类(FinTC) 给定一段金融文本及候选主题类别,模型需要根据文本内容将其归类到最合适的金融主题类别中。

  • 子任务五金融文本摘要(FinTS) 给定一段金融文本,模型需要提取并生成简洁、准确的摘要,以概括文本的核心信息和主要内容。

各子任务的数据分布、数据结构、具体评测指标及其计算方式,以及最终成绩的计算方法,详见任务网址。

组织者和联系人 

  • 评测组织者:胡刚、岳昆(云南大学)、彭敏(武汉大学)、石磊(云南师范大学)

  • 任务联系人:孔晓勇(kongxiaoyong@stu.ynu.edu.cn)

任务奖项 

本届评测将设置一、二、三等奖,由中国中文信息学会提供荣誉证书。

任务网址

https://github.com/HgITSE/MapFinBen

任务4:低资源缅甸语固定模版语句推理评测

任务简介

在缅甸语等低资源语言的翻译中,固定模版语句的推理作为垂类的任务,其语言内部的词性、地名、多元价值观等显著影响着最终的翻译质量。

格式与习惯差异:例如,中文的“第1名”、“第3章”,在缅甸语意为“编号”或者“号”,后面需要紧跟缅甸语数字。地名转写冲突:地名转写往往与缅甸语特有发音、历史习惯冲突,导致中文直接转写容易出现混乱。多元价值观影响:翻译受种族、宗教以及集体主义的影响,不能简单直译。必须充分考虑当地的文化敏感性和宗教背景,否则极易引起误解或反感。

作为固定模版语句的推理任务,机器具体要适应的是模版格式、幻觉处理等任务的重要形式依据。为了提升翻译大模型在缅甸语上的翻译质量,进一步实现机器对人类固定模版语句的深度理解,我们正式推出本次评测任务。

组织者和联系人 

  • 评测组织者:陈自岩、刘劲松(新译信息科技有限公司)、朱少林(天津大学)

  • 任务联系人:任虹(天津大学博士生,邮箱地址:rhong@tju.edu.cn);吴川(天津大学硕士生,邮箱地址:wuchuan@tju.edu.cn)

任务奖项 

本届评测将设置一、二、三等奖,由中国中文信息学会提供荣誉证书。奖金由 新译信息科技有限公司赞助。

任务网址

https://github.com/merc11/CCL-2026

二、 自然语言处理应用

1. 知识图谱

任务5:杂粮育种信息抽取评测

任务简介

杂粮育种领域积累了大量以自然语言形式呈现的知识,广泛分布于论文、品种审定与栽培技术规程等文本中。这些文本记录了育种材料来源、目标性状及测定结果,同时也包含栽培管理条件、胁迫处理信息以及分子标记等证据。由于杂粮育种文本专业术语密集、概念表述多样,且材料名称与试验要素常存在嵌套表达,导致关键信息难以稳定抽取和统一结构化,从而限制了知识检索、证据汇总和育种决策支持等应用的发展。

杂粮育种信息抽取评测(Minor Grain Breeding Information Extraction Evaluation, MGBIE)旨在面向杂粮育种知识管理与数据资源建设需求,系统评估信息抽取模型在杂粮育种相关专业术语识别、育种语境理解、关键信息抽取与结构化表达等方面的能力。MGBIE数据集总规模为2000条样本,其中训练集、验证集和测试集分别包含1000条、400条和600条,用于支持模型的训练、调优与综合性能评估。

MGBIE2026包含以下两个子任务:

  • 杂粮育种命名实体识别: 从杂粮育种相关文本中识别并抽取关键实体信息,并输出相应的实体边界及其类型标签。实体类型标签体系涵盖杂粮育种领域的核心概念,共包括12类:作物、品种、性状、生育时期、基因、数量性状位点、分子标记、染色体、育种方法、亲本/杂交组合,非生物胁迫以及生物胁迫。

  • 杂粮育种关系抽取: 在已识别实体的基础上,进一步抽取实体之间的语义关系,并以关系三元组的形式进行结构化表示。关系类型体系共包含6类语义关系,分别为:包含、采用、具有、影响、发生于和定位于。

组织者和联系人 

  • 评测组织者:胡志伟、孔照胜、高建华(山西省后稷实验室、山西农业大学);谭红叶、闫智超、李茹(山西大学);谢倩倩(武汉大学)

  • 任务联系人: 杨森杰(山西大学硕士生,yangsenjie1@sxu.edu.cn)

任务奖项 

本届评测将为不微调赛道和微调赛道分别设置一、二、三等奖。其中,一等奖1名,二等奖2名,三等奖3名,由中国中文信息学会提供荣誉证书。

任务网址

https://github.com/zhiweihu1103/CCL2026-MGBIE

天池评测链接

https://tianchi.aliyun.com/competition/entrance/532465

2. 自然语言处理与医疗、教育、人文、司法等领域结合应用

任务6:中文电子病历疾病与手术ICD自动编码评测 

任务简介

近年来,随着人口老龄化加剧和健康意识提升,医疗体系面临着日益增长的服务压力。在医疗信息化进程中,电子病历的广泛应用为解决这一挑战提供了新的可能。为实现医疗数据的标准化管理和共享,世界卫生组织制定了国际疾病分类标准(International Classification of Diseases,ICD)。该标准将数万种疾病及其组合转化为规范的字母数字编码体系,为跨地区、跨机构的医疗数据交换与分析奠定了基础。

然而,对电子病历文本进行人工ICD编码不仅耗时耗力,还容易因专业技能差异导致编码错误。开发自动ICD编码系统,既能提高编码效率和准确率,也能为疾病研究和医疗管理提供更可靠的数据支持。基于上述背景,本任务构建了一个中文电子病历ICD自动编码数据集,该数据集基于脱敏病历数据而构建,共涉及10个科室,18种主要疾病编码,若干种其他疾病编码,16种主要手术编码,若干种其他手术编码,共计2600条数据。该任务给定一段由临床信息构成的文本作为输入,需要模型输出对应的主要疾病编码、其他疾病编码、主要手术编码、其他手术编码。

组织者和联系人 

  • 评测组织者:管红娇、鹿文鹏(齐鲁工业大学(山东省科学院))、廉颖、陈国强(山东第一医科大学第一附属医院)

  • 任务联系人: 李传龙(齐鲁工业大学硕士生,icdevaluator@163.com)

任务奖项 

本届评测将设置一等奖1名,二等奖3名,三等奖6名,由中国中文信息学会提供荣誉证书。

任务网址

https://github.com/QLU-NLP/icdevaluator-26

天池评测链接

https://tianchi.aliyun.com/competition/entrance/532466

报名信息填写表

https://docs.qq.com/form/page/DWWNmV0ZGRnRwampn#/fill

任务7:跨语言文学文本情感分析一致性评测 

(Benchmark for Cross-lingual Classical Literature Sentiment Analysis and Consistency)

任务简介

跨语言情感分析一致性评测旨在考察模型对中国古典文学文本的情感理解能力,以及同一语义内容在中英文两种表达下是否能够保持情感判断一致。中国古典文学往往通过意象、典故和隐喻传递情感,具有较强的语境依赖性,因此对模型的跨语言语义理解和情感对齐能力提出了较高要求。

本任务基于中英平行古典文学语料,评估模型在单语言情感识别、跨语言情感迁移以及平行文本一致性建模等方面的表现。

BCCL-CSA 2026 包含三个子任务:

子任务一细粒度情感识别

参赛系统需分别对中文古典原文及其对应英文译文进行情感分析,预测文本的情感极性和情绪分布。

评测重点包括:

1.情感极性识别准确率

2.情绪分布预测能力

该子任务用于评估模型对单语文学文本情感特征的理解能力。

  • 子任务二跨语言情感迁移

参赛系统需在一种语言上训练,在另一种语言上测试,考察模型的跨语言情感迁移能力。

评测重点包括:

1.中英之间的情感极性保持一致性

2.不同语言表达下情绪分布的对齐程度

该子任务用于评估模型是否具备稳定的跨语言语义映射能力。

  • 子任务三平行文本一致性评估

参赛系统需对同一语义内容的中英文平行句对分别进行情感分析,并比较两种语言预测结果的一致性。

评测重点包括:

1.中英文情感极性预测是否一致

2.中英文情绪分布是否相近

该子任务用于评估模型在双语场景下的情感一致性与跨语言对齐能力。

任务特色与创新

1.跨语言情感对齐维度:突破单一语言的情感分类范式,首次聚焦于中英双语在复杂古典文学语境下的情感语义一致性。2.精细化分布标注:提供情绪概率分布(LabelDistribution),精准捕捉文学作品中复杂、模糊的情感底色。3.语料库稀缺性与挑战性:数据集精选自先秦至近代的13部经典著作,涵盖哲学、小说、戏曲等多种体裁,挑战模型泛化性能与抗噪声能力。

数据集说明

数据集CCL-SEL,来源于12部中国经典著作,每部著作各250组中英句子对。

网站建设与论文评审 

评测将建设GitHub页面发布数据、脚本与排行榜。评测论文将通过CCL26-Eval通道提交,并进行双盲评审。

组织者和联系人 

  • 评测组织者: 张海洋、张霄军(西交利物浦大学);徐睿峰(哈工大深圳)

  • 任务联系人: 周静狮(Jingshi.Zhou@outlook.com)

任务奖项 

一等奖1名,二等奖2名,三等奖3名。

任务网址

https://github.com/Jingshi-Zhou/-BCCL-CSA-2026-

任务8:大语言模型生成中文医疗内容的循证事实核查评测

任务简介

循证事实核查(Evidence-based Medical Fact-checking)是一项旨在验证在线医疗内容真实性的关键任务。随着互联网成为公众获取医疗健康信息的主要渠道,医疗虚假信息的泛滥给公共卫生安全带来了严峻挑战。该任务要求模型不仅要理解医疗声明(Claim),还需要结合检索到的相关证据(Evidence),判断证据对声明的支持程度(如支持、反驳或证据不足)。这一过程对于提高医疗信息的透明度、减少误导性信息的传播具有不可替代的作用,同时也是构建可信赖的医疗问答系统和智能医疗助手的核心安全屏障。

  • 支持(Supported):证据完全支持声明的内容;

  • 部分支持(Partially Supported):证据支持声明的部分内容,但存在不确定性或未覆盖的细节;

  • 反驳(Refuted):证据与声明内容相矛盾;

  • 不确定(Uncertain):证据与声明相关,但不足以证实或反驳声明的真实性;

  • 不适用(Not Applicable):证据与声明完全不相关。

组织者和联系人 

  • 评测组织者:苏炯龙、蒋正雍、王唯(西交利物浦大学)

  • 任务联系人: 陈彤(西交利物浦大学,Tong.Chen19@student.xjtlu.edu.cn)

任务奖项 

本届评测将设置一、二、三等奖,由中国中文信息学会提供荣誉证书。

任务网址

https://github.com/AshleyChenNLP/MedFact

任务9:第二届古诗词赏析评测

任务简介

中文古诗词具有高度凝练性和语言的音乐美,讲究对仗、平仄和押韵。为了准确理解古诗的语义,不仅需要掌握古诗的语言特色,还需要调动对历史、文化背景的知识,结合对古诗中所描绘的自然景象和人物情感的认知,从而进行综合性的推理与理解。

为了进一步衡量模型在中文古诗词赏析场景中的语言理解深度与文化推理能力,我们推出第二届中文古诗词赏析评测。在第一届的基础上,本届评测进一步聚焦模型的深度理解与复杂推理能力,引入更具挑战性的高级任务,以全面考察模型对古诗词文化内涵与高层语义结构的掌握程度。具体任务设置如下:

  • 任务一:古诗词理解:

古诗词字词理解:解释古诗词中短语级别的语义。本子任务通过问答题的形式对待测系统进行评估。

古诗词诗句理解:解释古诗词中诗句级别的语义。本子任务通过问答题的形式对待测系统进行评估。

古诗词情感理解:推断诗人透过作品所传达的情感。本子任务通过选择题的形式对待测系统进行评估。

典故识别:判断诗句中是否包含典故并进行解释。本子任务通过问答题的形式对待测系统进行评估。

  • 任务二:古诗词推理:

古诗词类比:发现古诗词中不同事物之间的相同关系,意象的关联。本子任务通过问答题的形式对待测系统进行评估。

古诗词辨析:依据诗词内容与语境,对给定选项进行辨析,判断其中表述最为合理的一项。本子任务通过选择题的形式对待测系统进行评估。

本评测将根据两个任务的综合性能来确定最终成绩排名。本评测旨在评估自然语言模型自身对中文诗词的理解水平,参赛队伍可以使用开源大语言模型进行微调,禁止使用RAG等技术来利用外部知识回答问题。

组织者和联系人 

  • 评测组织者:白雪峰、陈科海(哈尔滨工业大学(深圳)) 

  • 任务联系人: 朱颖杰、裴振武(哈尔滨工业大学(深圳),zhuyj@stu.hit.edu.cn)

任务奖项 

 一等奖1名,奖金合计3000元;二等奖1名,奖金合计2000元;三等奖1名,奖金合计1000元。 所有奖金将在公布奖项后10个工作日内发布。

任务网址

https://github.com/HITICI-NLPGroup/CCPA-EvalTask

任务报名表

https://docs.qq.com/form/page/DZW50THN4SGhqbm5x

三、 生成式AI与大模型核心能力

任务10:基于情景的常识推理评测

任务简介

推理是一种高级认知功能,涉及基于现有知识对新信息进行分析、归纳和演绎。它在人类智能中起着基础性作用。虽然以往的基准测试主要侧重于评估大语言模型(LLMs)在复杂、专业领域内的推理能力,但它们往往忽视了类人认知的一个关键方面:常识推理。评估大型语言模型中的这种常识推理能力对于人工智能的发展至关重要。这种基本能力显著影响着 LLMs 在日常情境中的决策,并且对于在通用人工智能(AGI)中迈向类人智能至关重要。

为了全方位、细粒度地诊断大模型的常识推理能力,我们提出了基于情景的常识推理评测数据集(Scenario-based Commonsense Reasoning Evaluation, SCoRE),用以评估大语言模型在常识场景下的复杂逻辑推理能力。根据所涉及的常识领域,该数据集包含的任务可分为以下五类: * 空间常识推理: 给定一个空间场景和若干已知的实体间方位关系,本任务要求机器推理出实体在空间场景中的位置,以及未知的方位关系。 * 时间常识推理: 给定一个包含若干事件的时间叙述场景和已知的事件间时间关系(如先后顺序、持续时长、相对或绝对时间点),本任务要求机器推理出事件在时间轴上的具体时刻,以及未知的事件间时间跨度或次序关系。 * 社会常识推理: 给定一个社会交互场景和若干已知的人物间人际关系(如亲属、职场、朋友或师徒关系),本任务要求机器推理出人物在社会网络中的具体角色或地位,以及人物间隐含的或未知的社会关系。 * 自然常识推理: 给定一组自然物体(或实体)和若干已知的属性约束条件(如类别归属、物理性状、功能用途或感官特征),本任务要求机器推理出物体与描述(或位置)的一一对应关系,以及物体未知的属性或分类特征。 * 融合常识推理: 融合领域任务描述旨在构建一个多维度条件交织的推理问题。它要求机器同时处理来自空间、时间、自然属性及社会关系等多个领域的约束与常识,并建立统一的推理模型以进行协同分析与决策。其核心挑战在于,单一领域的逻辑链条不足以解决问题,必须识别并整合不同领域的隐含联系,才能对复杂多因素情境进行有效推断。

组织者和联系人 

  • 评测组织者:詹卫东、穗志方(北京大学) 

  • 任务联系人:胡楠(北京大学博士生,hunan@stu.pku.edu.cn)

任务奖项 

一等奖0-1名; 二等奖0-2名;三等奖0-4名。

任务网址

https://pku-space.github.io/SCoRE2026/

任务11:面向自动驾驶的自动化危害分析与风险评估评测

任务简介

随着汽车电子电气架构(E/E 架构)向智能化与网联化深度演进,功能安全已超越早期以机械系统为主的工程保障范畴,演变为覆盖软硬件协同设计的系统化安全工程体系,成为自动驾驶技术落地与量产的关键基石。在此体系中,危害分析与风险评估(HARA, Hazard Analysis and Risk Assessment)承担着风险识别与顶层安全需求定义的核心职能。该过程通过对车辆运行场景、潜在功能失效模式及环境要素的系统化建模,提取车辆运动状态、道路拓扑及交通参与者分布等关键特征,并基于严重度(S)、曝光率(E)和可控性(C)三个维度对风险进行量化评估,确定汽车安全完整性等级(ASIL),并将评估结果转化为顶层安全目标,进而分解为可验证的软硬件安全需求,指导系统设计与工程实施。

为推动大模型与人工智能技术在预期功能安全及功能安全领域的落地应用,提升HARA流程的自动化与智能化水平,我们提出“面向自动驾驶的自动化危害分析与风险评估评测任务”并构建了一个专注于评估自动驾驶安全逻辑推理与需求生成的结构化数据集。该数据集源自脱敏的真实工业项目数据,聚焦于动力系统核心高危失效模式——“非预期驱动力/扭矩输出”,共包含3,000条高质量标注数据。

本次评测包括以下两个子任务: * 危害事件识别与场景描述生成: 该任务要求模型基于给定的车辆运行工况与环境参数,精准识别潜在的危害事件,并生成符合工程规范的危害场景结构化描述。 * 风险参数评定与等级推理: 该任务要求模型基于场景特征,推理并输出HARA分析的关键风险指标(S/E/C),并据此判定相应的安全完整性等级。

组织者和联系人 

  • 评测组织者:杨旭(北京理工大学),张海洋(西交利物浦大学),王唯(西交利物浦大学)

  • 任务联系人:王子木(西交利物浦大学博士生, Zimu.Wang19@student.xjtlu.edu.cn)

任务奖项 

一等奖1名,奖金合计5000元 * 二等奖1名,奖金合计3000元 * 三等奖1名,奖金合计2000元。

赞助情况 :本次评测奖金由优策科技(福州)有限公司赞助。

任务网址

https://ccl2026-hara.github.io

任务12:优酷无障碍剧场杯-面向听障群体的信息无障碍结构化字幕生成评测

任务简介

在我国已进入“制度保障”阶段的信息无障碍建设背景下,字幕已成为听障及老年群体获取音视频信息的关键无障碍服务。然而,现有技术评测缺乏面向真实应用场景、统筹考量“可读性”、“核心信息准确度”与“响应速度”的基准。本任务从“AI字幕是基础设施”的视角出发,系统评测从“语音/视频输入”到生成“面向人类阅读的结构化字幕文档”的完整链路,特别聚焦于解决高信息密度真实场景(如医疗、金融、政务办事)中“社交时差”与“关键信息丢失”两大痛点。

为贴近不同应用环境,评测任务被设计为两个平行赛道,以全面评估技术的能力上限与落地可行性:*赛道A:PC端模拟云端或高性能桌面环境,旨在探索技术性能上限,不限制计算资源。*赛道B:手机端模拟移动设备(手机、AR眼镜)实时交流场景,对模型体积、内存占用及实时性提出明确的约束要求。

每个赛道均包含以下两个子任务:

1. 子任务一基础字幕生成(Foundation Track) 评估语音转写、时间戳对齐、噪声鲁棒性等基础能力。 评测指标: 转写准确性、时间轴对齐精度、复杂多人场景下的综合处理能力。

 2. 子任务二结构化可读字幕生成(Structured Track) 评估模型生成符合人类阅读习惯、包含合理断句、标点、说话人区分、并确保核心关键词准确性的结构化字幕的综合能力。 自动评测指标: 文本准确性、核心词召回率、模拟显示延迟、时间轴合理性偏差、结构一致性。 人工评测指标(抽样): 可读性(1-5分)、关键信息完备性、断句合理性、标点与语气匹配度、幻觉文本严重程度。

数据规模与来源

本评测构建了总规模约30–50小时的多场景真实语音/视频测试集,涵盖新闻演讲、影视综艺、生活真实交流、多人会议等四类典型场景。其中,约10–15小时的核心子集提供更高粒度的结构化标注与核心关键词标注,支持Track2的深度评测。数据来源强调真实性与多样性,包含背景音乐干扰、环境噪声、远场收音、多人重叠语音等复杂声学条件,全面模拟听障用户在办事场景中的实际听觉挑战。

组织者和联系人 

  • 评测组织者:姚登峰(北京联合大学/清华大学),徐聪(中国聋人协会手语研究与推广委员会),梁振宇(深圳市信息无障碍研究会专家委员会),曲欣(北京市设计学会无障碍设计专委会)

  • 任务联系人:施杰、叶博文(北京联合大学硕士生,20251083510951@buu.edu.cn),张洋(清华大学博士生)

任务奖项 

本届评测将设置一、二、三等奖,由中国中文信息学会为获奖队伍颁发荣誉证书;同时设立赞助奖项,由阿里巴巴等头部科技企业提供奖品支持。

任务网址

https://github.com/ALINOSJ/IASSGE-2026

报名表

https://f.kdocs.cn/g/aYC93cfz/

任务13:图像文本翻译质量评测

任务简介

随着全球化进程加速和跨语言交流需求增长,图像文本翻译(In-Image Translation,简称“图翻”)已成为机器翻译的重要分支。与传统文本翻译不同,图翻需同时处理视觉与语言信息,涵盖文本检测、识别、翻译与渲染等多个环节,在跨境电商、旅游导览、多语言内容本地化等场景中具有广泛应用价值。中文图翻面临独特挑战:汉字视觉复杂性高、书写方向多样(横排/竖排)、与目标语言存在显著文本长度差异,且蕴含丰富文化内涵。尽管大型多模态模型在图像理解方面取得进展,但在保持视觉一致性的前提下实现高质量图翻仍困难重重。尤其在电商场景中,系统需区分“应翻译内容”(如功能说明)与“应保留内容”(如品牌标识),对翻译完整性与合规性提出更高要求。现有机器翻译评测指标(如BLEU、METEOR)仅关注文本准确性,无法衡量视觉呈现、排版布局、美学协调等关键维度。而人工评测成本高、主观性强、难以规模化。因此,亟需建立标准化、多维度、可自动化的图翻质量评测框架。

本次评测聚焦于如何设计和训练能够从多个维度对图像翻译结果进行精准评分的自动评测系统,从而为该领域的技术进步提供可靠的度量工具。旨在:建立标准化基准:构建包含多场景、多维度人工标注的大规模评测数据集。推动方法创新:鼓励研究者设计能够模拟人类专家判断的自动评测模型。探索评测范式:通过开放式竞赛,发现在不同应用场景下最有效的评测策略。促进社区共识:图像文本翻译质量评测建立可复现、可比较的评价标准。

组织者和联系人 

  • 评测组织者:李海军、尚姿芙、梁杰、徐昭、骆卫华

  • 任务联系人:韩雨轩(阿里云技术专家  baileng.hyx@alibaba-inc.com)

任务奖项 

一等奖1名,奖金合计20000元 ;二等奖1名,奖金合计10000元;三等奖2名,奖金合计5000元。

赞助情况:本次评测奖金由阿里云赞助,由中国中文信息学会为获奖队伍颁发荣誉证书。

任务网址

https://tianchi.aliyun.com/competition/entrance/532463?spm=5176.12281973.J_6-HJZaSjQocH7SIdvbK02.1.376b3b74H1HNIn

评测任务14:中文会话含义与隐喻能力评测

任务简介

       对“言外之意”的理解是人类交际的核心能力。而以往针对大语言模型的评测更侧重其在具体垂域中的表现,较少从语用推理与隐喻义识别角度评估模型的语言能力。本评测共设计两个核心赛道,旨在系统评估大语言模型在中文语境下的会话语义理解能力与隐喻理解能力。

赛道一:会话含义理解

      为了实现交流目的,会话参与者在交流时通常遵循一套基本原则,这一原则被格赖斯总结为合作原则。该理论从量、质、关系、方式等范畴提出四项准则。量的准则要求提供适量信息,既不多余也不过少;质的准则要求说话真实,证据充分;关系准则要求话语要与当前话题相关;方式准则要求表达简洁有序,避免晦涩和歧义。基于这四项准则,格赖斯提出了会话含义理论,当说话人违反了这些准则或次准则的时候,听话人就需要超越话语的表面意义去领会说话人的隐含意义。本赛道用于评估模型识别、理解会话含义的能力。

  • 子任务一:会话含义识别任务

给定一段多轮对话,要求模型指出特定人物的哪一句话是具有会话含义的。

  • 子任务二:会话含义选择任务

给定一段多轮对话,要求模型从四个选项里选出有会话含义句子的正确含义。

  • 子任务三:会话含义释义任务

给定一段多轮对话并明确指出具有会话含义的句子,要求模型生成一段解释。

赛道二:隐喻理解与生成

       隐喻作为人类认识世界的重要方式,在概念建构和思维过程中发挥着关键作用。隐喻能力不仅关系到语言表达本身,也与创造性思维、抽象推理以及知识迁移等更高层次的认知过程密切相关。人们通过具体、熟悉的源域来理解抽象、陌生的目标域,这一映射机制贯穿于日常语言与思维之中。本赛道用于评估模型识别、理解并创造性地使用隐喻的能力。

  • 子任务一:隐喻识别任务

给定一段文本,要求模型识别出此文本中的句子是否使用隐喻这一修辞手法,如包含隐喻,模型需要分别提取出隐喻句当中的本体、喻体。

  • 子任务二:隐喻释义生成任务

给定一段文本,要求模型用非隐喻的语言解释隐喻句的含义。

  • 子任务三:隐喻句生成任务

不限定主题,要求模型自主生成恰当的隐喻表达。

组织者和联系人

  • 组织者:杨尔弘、杨天麟、岳岩、安维华(北京语言大学)

  • 联系人:张艺璇(北京语言大学博士生,blcuicall@163.com)

任务奖项

本届评测将设置一、二、三等奖,由中国中文信息学会提供荣誉证书。

任务网址

https://github.com/blcuicall/CCIME2026

比特人文

投稿邮箱:dhbase@126.com

扫码关注 获取更多资讯

图片

阅读原文

跳转微信打开

  •  

学术会议|2026年中国数字人文年会(CDH2026)

徐惠 2026-04-29 09:01 江苏

CDH2026将于7.31-8.3在内蒙古师大举办,征论文与项目并开放注册。

转载自“语言学心得”

——CDH2026——

 “大哉言数:AI时代人文研究的范式重构与价值回归”研讨会暨2026年中国数字人文年会(CDH2026)

会议通知(第一号)

2026年7月31日-8月3日

内蒙古师范大学

2026期待与您相聚

当前,人工智能与大数据技术正深刻重塑人文学科的知识生产方式与价值判断框架。“数”之一字,贯通古今:从古人“参天量地”的度量智慧,到今日数据驱动的数字人文,数字化浪潮不仅为人文学科开辟了全新的研究范式,更在“言数”之间激发了对文明演进、文化传承与社会治理的深层追问。

在此背景下,中国索引学会数字人文专业委员会、内蒙古师范大学科学技术史研究院将以“大哉言数:AI时代人文研究的范式重构与价值回归”为主题共同主办2026年中国数字人文年会(CDH2026)。会议将邀请知名专家学者,围绕数字人文及相关领域的前沿问题,开展主旨发言、会议报告、专题讨论、案例分享、数字人文空间展演、海报展示等多种形式的学术交流活动。现诚挚邀请数字人文领域专家、学者与学生莅临会议,共探AI时代人文研究的范式重构与价值回归,为数字人文发展注入新动能。

01

会议议题

包括但不限于:

1. 典籍重光

科技古籍与多民族文献的智慧化整理

2. 时空重构

GIS与时空大数据驱动的文明演进研究

3. 协智重塑

多智能体与具身智能的人文社会仿真

4. 谱系重绘

知识图谱与智能注释驱动的知识重组

5. 记忆重述

AIGC赋能下的文化遗产与艺术创新

6. 文脉重析

计量方法与主题模型的文本深度挖掘

7. 伦理重思

数字人文中的算法批判与负责任创新

8. 素养重育

数字人文课程体系与跨学科人才培养

9. 数字人文学科建设

02

会议信息

会议时间

2026年7月31日至8月3日

会议地点

内蒙古师范大学

(呼和浩特市赛罕区昭乌达路81号)

会议注册

本次会议将于2026年6月开放注册报名。

注册费:1500元(6月30日之前早鸟价1000元),学生价800元,获会议录用宣讲论文/海报/项目作者一人可免注册费,如多于一人则需按增加人数缴纳注册费。参会代表交通食宿自理。

03

征文征集

1、会议征文对象为数字人文相关专业的专家、学者与在读学生。

2、论文要求为:作品原创,未发表;中文、英文皆可;问题明确、方法严谨、论证充分、引用规范、观点新颖。

3、征文分为两轮,第一轮为论文摘要征集,第二轮为入选论文全文提交,具体要求如下:

(1)论文摘要需包含中英文标题、摘要、关键词、作者姓名、作者单位、作者简介(姓名、单位、年级、邮箱、手机号码、研究方向等),摘要内容不少于500字。

(2)论文全文格式可参考附件“CDH2026论文格式规范与要求”,正文字数为7000-15000字。

4、组委会将邀请国内知名学者组成专家评审组,对提交的论文开展严格评审,从中选出高水平学术论文在会议上进行交流和专家点评。

5、论文提交邮箱:

20250051@imnu.edu.cn。邮件标题格式为CDH2026论文摘要/全文-姓名-单位

6、摘要提交截止时间:

     2026年4月30日

     摘要录用通知时间:

     2026年5月30日

     论文全文提交截止时间:

     2026年6月30日

04

项目征集

1、本次会议征集项目为中文或中国主题的数字人文研究项目,包括但不限于数据库、软件工具、数字平台、可视化作品、XR交互设计作品、大模型及智能体应用等。所征集的项目需提供可访问的路径和方式。专家委员会将根据项目征集情况分类评审后择优进行大会展示交流。

2、所有征集项目需填写“2026年中国数字人文年会项目报名表”进行报名,并提供相关附件(包括但不限于网站、APP、小程序、视频及图片等)。

3、请将报名表和相关附件压缩,以CDH2026项目-项目名称命名,发送至邮箱20250051@imnu.edu.cn

项目征集截止时间:

2026年5月20日

05

会议组织

主办单位

中国索引学会

内蒙古师范大学

承办单位

中国索引学会数字人文专业委员会

内蒙古师范大学科学技术史研究院

内蒙古自治区科技文化遗产认知智能重点实验室

内蒙古师范大学蒙古学学院

协办单位(按笔画顺序排列)

山西数字人文研究院

上海大学数字人文研究与发展中心

上海外国语大学中国国际舆情研究中心

上海师范大学数字人文研究中心

上海社会科学院信息研究所

上海图书馆历史人文大数据中心

中国人民大学数字人文研究院

中国社会科学院文学研究所数字信息研究室、数字人文与计算批评实验室

中山大学信息管理学院

中山大学数字人文实验室

北京大学数字人文研究中心

电子科技大学数字文化与传媒研究中心

华东师范大学数字文化发展协同创新中心

齐鲁工业大学 (山东省科学院) 数字人文研究中心

云南大学历史与档案学院 “数字人文” 工作室

云南省图书馆数字资源与信息技术部

武汉大学数字人文研究中心

复旦大学大数据研究院人文社科数据研究所

清华大学中国古典文献研究中心

南京大学高研院数字人文创研中心

南京师范大学数字与人文研究中心

南京农业大学数字人文研究中心

南京大学中华文明创新实验室

(持续更新中)

媒体支持(按笔画顺序排列)

《全国报刊索引》

「全国报刊索引」公众号

上海师范大学数字人文网

上海社科院信息所社科智能实验室(AI4SS Lab)

《中国数字人文》

「中国索引学会」公众号

「SHNU 数字人文」公众号

「比特人文」公众号

《数字人文》

《数字人文研究》

「数字人文」公众号

「数字人文开放实验室」公众号

「数字人文研究」公众号

「数字人文资讯」公众号

南京大学中华文明数智创新实验室

(持续更新中)

有意参与协办和媒体支持的单位,请扫描下方二维码登记相关信息,我们将在下一轮的会议通知中更新名单。

06

会议联络

会议邮箱:20250051@imnu.edu.cn

会务咨询:周老师 13191432051

附件

CDH2026论文格式规范与要求

2026年中国数字人文年会项目报名表

欢迎参会!

今日小编: 海 

 审   核:心得君

转载&合作请联系

"心得君"

微信:xindejun_yyxxd

比特人文

投稿邮箱:dhbase@126.com

扫码关注 获取更多资讯

图片

阅读原文

跳转微信打开

  •  

计算语言学、语言智能等38个新专业出炉

徐惠 2026-04-29 09:01 江苏

教育部2026年4月28日发布本科专业目录,新增38种专业,优化专业结构服务国家战略。

转载自“央视新闻”

教育部今天(28日)发布《普通高等学校本科专业目录(2026年)》,共新增38种普通高校本科新专业本次获批申办高校可纳入2026年高考招生。

今年,教育部精准对接国家战略需求,增设能源科学与工程、深地科学与工程等专业;服务传统产业优化升级,增设交通能源融合工程、农业机器人等专业;推动新兴产业和未来产业创新发展,增设生物制造、脑机科学与技术等专业;立足服务业扩能提质,增设数字文旅、商业人工智能等专业;聚焦打造智能经济新形态,增设数字贸易、数字金融等专业

同时,进一步完善战略急需专业超常设置机制,支持哈尔滨工业大学、北京航空航天大学等9所高校增设具身智能新专业,推动新一代人工智能与实体经济深度融合,赋能经济社会高质量发展。

为加强学科专业目录协同联动,推动本科专业目录与研究生教育学科专业目录有机衔接、上下贯通,更好适应新兴交叉学科发展和复合型人才培养需求,2026年本科专业目录在“交叉学科”门类中首批列入未来机器人、交叉工程等11种目录内已有专业和具身智能、脑机科学与技术等4种首次列入目录的新专业目前,本科专业目录共涵盖13个门类、92个专业类、883种专业

据统计,“十四五”期间,全国高校新增本科专业布点1.02万个、撤销或停招1.22万个,专业调整幅度持续增大,累计调整比例超30%,今年全国高校专业调整比例首次突破10%。本科专业结构进一步优化,高校服务国家战略与经济社会高质量发展能力显著提升。

同时,教育部深入开展专业设置与区域发展匹配度提升工作,持续完善省域优先发展和暂缓发展的指导性专业清单年度发布机制,指导各省对本地区人才供需关系进行前瞻性研判,推动各省发布覆盖473种专业的急需专业清单和专业预警清单。黑龙江、浙江、重庆等8省市试点开展专业设置与区域发展匹配度提升工作,打造特色优势专业集群247个,有力支撑区域经济社会发展。

(总台央视记者:高晨源)

本文来源:央视新闻微信公众号


监制/李浙  主编/王瑄

编辑/林湘瑜

©央视新闻

比特人文

投稿邮箱:dhbase@126.com

扫码关注 获取更多资讯

图片

阅读原文

跳转微信打开

  •  

专业资讯 | 2025年数字人文奖(DH Awards 2025)——突出数字人文中的资源

徐惠 2026-04-28 09:00 江苏

2025数字人文奖揭晓,分七大类公布获奖及提名项目,面向公众评选。

转载自“数字人文资讯”

数字人文年度奖项于2012年设立,获奖资源可以向公众可以提名,以表彰数字人文相关的人才和专业知识。提名与投票环节全面面向公众,每人限投票一次。最终获奖名单由提名委员会(Nominations Committee)参考票选结果综合评定。设立该奖项旨在提升公众关注度,推介有趣的数字人文资源,并吸引更多人参与社群工作。提名资源不限语言、文字体系及研究领域。我们特别欢迎少数民族语言、文化及相关领域的代表性资源参选。所有被提名的资源都具有研究价值,有助于深入了解数字人文的边界。

数字人文数据可视化项目

01

(例如:对数字人文数据资源进行可视化呈现的作品)

第一名

香港流行文化地图

(Hong Kong Pop Culture Map)

https://digital.lib.hkbu.edu.hk/culture-map/

第二名

Thiep 3D

https://thiep3d.univ-littoral.fr/

第三名

数字幽灵展览

(Digital Ghosts exhibition)

https://inspace.ed.ac.uk/digital-ghosts/

其他提名项目(按字母顺序排列):

数字人文数据集或模型

02

(例如:用于数字人文研究的文本语料库、数据表、模型或类似内容)

第一名

哥伦比亚互联网与网络史:1988-1996年多人讲述的故事

(History of the Internet and the Web in Colombia. A story told in many voices 1988-1996)

https://historiasinternet.uniandes.edu.co/

第二名

数字萨福

(Sappho Digital)

https://sappho-digital.com/index.html

第三名

诗树——11种语言的诗歌语料库

(PoeTree – Poetry corpora in 11 languages)

https://poetree.org

其他提名项目(按字母顺序排列):

数字人文短篇出版物

03

(例如:数字人文领域的博客、文章、影片)

第一名
 沃尔什,梅兰妮等.《熊会是男孩》

The Pudding (Walsh, Melanie (et al.). ‘Bears Will Be Boys’, The Pudding) https://pudding.cool/2025/07/kids-books/

第二名
 东布罗夫斯基,奎因.《别再对自己撒谎:集体错觉与数字人文资助》,载《重新框架数字学术中的失败》

(Dombrowski, Quinn. ‘Stop lying to yourself: Collective delusion and Digital Humanities grant funding’, in Reframing Failure in Digital Scholarship)

https://read.uolpress.co.uk/read/reframing-failure-in-digital-scholarship-a56118ab-e4eb-4eb4-9dca-e8c343c6441b/section/9bbd0f75-6d96-48e2-bcc1-e8e5a6d07ce9#ch1

第三名
 丘拉,阿里安娜.《在包容性研究文化中与破碎共处:我们能从数字人文实验室的失败和过程中学到什么》,载《重新框架数字学术中的失败》

(Ciula, Arianna. ‘Living well with brokenness in an inclusive research culture: what we can learn from failures and processes in a digital humanities lab’, in Reframing Failure in Digital Scholarship)

https://read.uolpress.co.uk/read/316fdea1-5051-4f50-8957-afbc51342998/section/2e8944d9-ba98-4ef9-bcb8-159fa546e237#ch7

其他提名项目(按字母顺序排列):

数字人文工具或工具套件

04

(例如:用于构建数字人文资源的工具)

第一名
 ArtVis——艺术史可视化

(ArtVis – Art History visualized)

https://artvis.cvast.tuwien.ac.at/

第二名
 多民族语言智能数据处理与知识服务系统

(Multilingual Intelligent Data Processing and Knowledge Service System)

http://106.12.154.220:15001/

第三名
 RelicarIA

https://relicaria.streamlit.app/

其他提名项目(按字母顺序排列):

数字人文训练材料

05

(例如:各种形式的讲座、幻灯片、练习、视频或操作指南)

第一名
 情境中的负责任数据集:协作设计伦理人文学科数据教育

(Responsible Datasets in Context: Collaboratively Designing for Ethical Humanities Data Education)

https://www.responsible-datasets-in-context.com

第二名
 照亮过去——低成本多光谱成像培训

(Illuminating the Past — Training for low cost multispectral imaging)

https://grants.uccs.edu/illuminating-the-past/

第三名
 古代文本课程教材的大语言模型 (LLM-for-Ancient-Text-Coursebook)

https://github.com/chowshelly101-jpg/LLM-for-Ancient-Text-Coursebook/tree/main

其他提名项目(按字母顺序排列):

数字人文资源

06

(例如:数字人文数字学术出版物、档案库或资源库)

第一名
 看不见的东方数字语料库

(Invisible East Digital Corpus)

https://www.invisible-east.org/

第二名
 19世纪奥里诺科河旅行者

(Viajeros del Orinoco Siglo XIX)

https://biblioteca.uniandes.edu.co/proyectos/viajeros-orinoco/index.html

第三名
 20世纪印度建筑档案,PAHA(浦那建筑史档案馆)

(Architectural Archives of 20th century India, PAHA (Pune Architectural History Archive))

https://paha.site

其他提名项目(按字母顺序排列):

数字人文娱乐化应用

07

(例如:以娱乐为目的应用数字人文的项目)

第一名
 图钉故事

(Pin the Tale)

https://pinthetale.co.uk/

第二名
 Gamaikus

https://yohannawaliya.itch.io/gamaikus

第三名
 中国艺术史与3D绘画电子学习平台

(E-Learning Platform of Chinese Art History and 3D Paintings)

https://digital.lib.hkbu.edu.hk/history/3d-paintings/index.html

其他提名项目(按字母顺序排列):

以上信息来自“DH Awards 2025”官方网站:
 http://dhawards.org/dhawards2025/results/

经数字人文资讯小编翻译整理而成
 未经许可请勿转载

编辑 | 罗斯鹏

校对 | 魏翔

排版 | 洪冰凤

比特人文

投稿邮箱:dhbase@126.com

扫码关注 获取更多资讯

图片

阅读原文

跳转微信打开

  •  

江苏首部AI实验电影《东坡买田》在宁率先面世

徐惠 2026-04-28 09:00 江苏

江苏首部AI实验电影《东坡买田》在南京发布,融合AI与东方美学讲述苏轼故事。

转载自“章剑华人文空间”

4月22日下午,由江苏省当代艺术创作研究会指导、立早AI艺创实验室出品、章剑华担任编剧并导演的江苏首部AI实验电影《东坡买田》,在南京图书馆学术报告厅举行了发布仪式。

该片以北宋文豪苏东坡阳羡买田的历史故事为蓝本,运用人工智能技术进行影像化创作,探索AI技术与东方美学的全新融合路径。

原南京军区司令员朱文泉上将,省政协原副主席、南京艺术学院原校长冯健亲,省委宣传部原常务副部长、省文联名誉主席、省艺研会会长章剑华,省委宣传部一级巡视员、省电影局原副局长王明珠,南京艺术学院党委书记俞锋,南京传媒学院党委书记周南平,南京师范大学党委常委、副校长程天君,省广播电视总台副台长王智勇,省文旅厅原副厅长、原一级巡视员方标军,省文联原副主席、原一级巡视员刘旭东,省文联原副主席徐昕,南京图书馆原党委书记韩显红,南京博物院原党委书记嵇亚林,《新华日报》原副总编辑金伟忻,省文化发展基金会理事长姜龙等领导以及来自省内相关文化单位、高校的嘉宾近百人出席了发布仪式。

章剑华讲话

章剑华现场分享了对人工智能的认识,指出它深刻影响了人类文明演进的方方面面,深刻改变了社会生产模式与大众生活方式,更彻底革新了文艺创作、文化传播、艺术表达的传统路径与固有形态。他向大家介绍了艺创实验室率先开展多领域AI文艺创作实验的诸多成果,迄今先后创作了AI曲目20余首,推出《故宫三部曲》AI艺术大展,打造AI有声图文剧《永不沉默的胶片》,以及今日发布的AI实验电影《东坡买田》。章剑华详细交流了影片的创作经过及制作感受。同时透露出艺创实验室下一步的发展构想,表示将始终坚守文化初心、深耕文艺创作、拥抱科技变革,持续探索AI与传统文化、文学艺术深度融合的新路径。

观看影片

刘旭东作点评

观看影片后,著名评论家刘旭东进行了专业点评,指出《东坡买田》开创了省内AI微电影创作的先河,是电影艺术与人工智能技术深度融合的一次重要探索。影片不仅生动再现了苏东坡“焚券还田”的感人故事,更在技术层面验证了AI生成影片的可行性。从这个意义上说,这部影片的探索意义大于作品本身。

剧照

据介绍,该部《东坡买田》影片从剧本定稿到成片,历时近三个月,立早AI艺创实验室团队从AI生成的3000余帧视频片段中,精选出130余帧进行合成剪辑。影片中苏东坡、朝云等主要人物形象均通过AI反复训练,力求在符合历史服饰特征的同时,传达出人物特有的精神气质。在场景设计方面,团队参考了大量宋代绘画与江南水乡实景,并借助AI技术,最终营造出了“远山青翠、近水波光”的水墨意境。

剧照

据了解,AI实验电影《东坡买田》不久将在国内重要平台播出。届时预告,敬请观看。

比特人文

投稿邮箱:dhbase@126.com

扫码关注 获取更多资讯

图片

阅读原文

跳转微信打开

  •  

好文推荐丨袁毓林:语言大模型怎样突破标记逐个生成的时间瓶颈?——预测从单标记走向多标记,模型从自回归走向扩散式

袁毓林 2026-04-27 09:00 江苏

袁毓林探讨语言大模型由单标记转多标记、自回归走向扩散式以提速。

转载自“语言学札记薄”

好文推荐

语言大模型怎样突破标记逐个生成的时间瓶颈?——预测从单标记走向多标记,模型从自回归走向扩散式

 《当代修辞学》 2026年第2期

 关键词:(自回归/扩散式)语言大模型;单标记/多标记预测;噪声/掩码去噪

提要

       本文从当前人工智能若干关键技术发展趋势的角度,讨论人工智能的未来走向及其对人类生活的影响。本文首先介绍语言大模型怎样通过不断地预测下一个“标记” (token),来理解和生成自然语言并诞生智慧的机理和过程;接着说明这种“单标记预测”的技术困境和时间瓶颈,进而介绍通过并行的推测解码来达成“多标记预测” (Multi-Token Prediction,MTP)的技术原理和实现过程;然后说明单标记和多标记预测等“自回归(autoregression)模型”的局限性,介绍在速度与效率等方面更有优势的“扩散式语言大模型”(dLLM),说明其从噪声(掩码)到结构化输出(去噪)的生成过程和工作机理;最后介绍杨立昆对于语言和语言大模型的局限性的批评意见,说明我们的观点:由于人类对世界的认识依赖于语言,所以从语言大模型走向“通用人工智能”(AGI)依然具有可能性。

全文

注:本文原载于《当代修辞学》2026年第2期。

比特人文

投稿邮箱:dhbase@126.com

扫码关注 获取更多资讯

图片

阅读原文

跳转微信打开

  •  

鷹擊長空!澳門大學世界排名躍居前150

徐惠 2026-04-27 09:00 江苏

2026泰晤士排名发布,澳门大学升至145位,首进全球前150创历史。

转载自“澳大微新闻”

速報!澳大再創歷史新高度!

10月9日,2026年泰晤士高等教育世界大學排名正式揭曉。其中,澳門大學更上一層,全球排名由去年的第180名大幅度進漲至第145名

泰晤士高等教育世界大學排名(Times Higher Education World University Rankings),又簡稱為"THE世界大學排名",是目前全球最具影響力的大學排名之一,與QS世界大學排名、U.S. News世界大學排名、軟科世界大學學術排名一齊被公認為“全球四大高校排行榜”

  該排名每年更新一次,以教育教學、研究論文、研究質量、國際化展望、產業收入等5個範疇共計13個指標,對來自全世界一百多個國家與地區的千餘所大學進行系統性的考核與分排。本次參與排名的高校數量再次刷新記錄,全球共有2191所高校成功上榜,較2025年具有輕微漲幅。澳門大學在此繼續保持前進趨勢,突破前150名,躋身全球前7%

澳門大學歴年全球排名

認識我們

澳門大學(Universidade de Macau / University of Macau),簡稱“澳大”,是一所位於中國澳門的公立國際化綜合性研究型大學。澳大不僅是中歐商校聯盟、“一帶一路”國際科學組織聯盟、粵港澳高校聯盟、粵港澳大灣區西岸科技創新和人才培養合作聯盟創始成員和亞太高校書院聯盟的成員之一,更是中國大學校長聯誼會——“C9聯盟+”的重要組成部分。

紮實教學 優質教研 

  基本科學指標數據庫(Essential Science Indicators,簡稱ESI)是衡量大學和科研機構國際學術水平的權威指標,僅收錄全球論文被引次數排名前1%的學科。而澳門大學不僅15個學科穩居ESI前1%,更有工程學、計算機科學、藥理學與毒理學3個學科突破進入前0.1%的頂尖層級。

  澳門大學的師資隊伍龐大卓絕,從全球各地吸納頂尖的學術精英。其中,不僅包含歐洲科學院(外籍)院士、英國皇家學院院士、英國工程技術學會會士、歐洲科學與藝術學院院士、葡萄牙科學院院士、美國電機電子工程師學會會士、美國科學促進會會士、美國土木工程師學會會士、美國機械工程師協會會士、國際光學工程學會會士等國際化團隊配置,更是擁有中國教育部“長江學者講座教授”為學術保駕護航。

     澳門大學中央教學樓

澳門大學圖書館

  澳門大學世界排名屢創新績,是背後教學育人、科研創新與國際化的實力支撐,是對於澳大整體辦學質量擲地有聲的認可。

  今日的進步是明日的基石,澳門大學步步向上的頂尖之路,還看今朝!

文字編輯 | 汪京奧

 圖片 | 澳門大學官網、

        澳門大學百科、

        澳門大學鏡報社

  審核| 龔剛教授

比特人文

投稿邮箱:dhbase@126.com

扫码关注 获取更多资讯

图片

阅读原文

跳转微信打开

  •  

讣告 | 中国科学院院士戴汝为逝世,享年94岁

沉痛悼念的 2026-04-26 09:00 江苏

中科院院士戴汝为4月19日逝世,享年94岁,为我国智能科学等领域作出重要贡献。

来源:中国科学院大学

中国共产党党员、中国科学院院士、中国科学院大学荣誉讲席教授、中国科学院自动化研究所研究员戴汝为同志,因病医治无效,于2026年4月19日10时11分在北京逝世,享年94岁。

戴汝为同志,汉族,1932年12月31日出生于云南石屏,1986年7月加入中国共产党,1951年考入清华大学数学系(后因院系调整并入北京大学),1955年7月毕业于北京大学数学力学系,1955年7月选派到中国科学院力学研究所师从钱学森,1956年进入中国科学院自动化研究所工作。1991年当选为中国科学院学部委员(院士)。曾任第五届中国科学院学部主席团成员。

戴汝为同志是自动控制、模式识别、智能科学、思维科学专家。自20世纪50年代以来,他继承和发扬钱学森科学思想,在控制论、人工智能等领域作出了开创性的研究工作。20世纪80年代初,他率先将“模式识别”理论引入中国,提出“语义-句法模式识别”,为中国汉字识别与汉字信息化应用和普及作出重大贡献。90年代初,他与钱学森共同构建“开放的复杂巨系统及其方法论”,该方法被应用于中国经济、军事及社会发展等领域的重大问题决策中。他深耕前沿科学研究领域,提倡学科交叉,为我国科技事业发展作出了重要贡献。戴汝为同志曾获国家科技进步一等奖、中国科学院自然科学一等奖、“何梁何利”科技进步奖、中国模式识别科技终身成就奖、中国系统工程终身成就奖。

戴汝为同志毕生热爱祖国,对党忠诚,矢志科研报国。他始终潜心研究,坚持求真创新,开学术之先河,树学风之楷模。他奖掖后学,桃李满天下,为我国智能科学领域培养了大批人才。他淡泊名利,品格高尚,宽于待人,深受大家敬重与爱戴。戴汝为同志的逝世是我国科技界的重大损失。我们沉痛悼念并深切缅怀戴汝为同志!他的精神与风范长存!

遵照家属意愿,戴汝为同志丧事从简,不举行公开遗体告别仪式。有关部门、团体和个人如欲致唁电、唁函,请联系中国科学院自动化研究所及中国科学院大学。

谨此沉痛讣告。

中国科学院自动化研究所

中国科学院大学

2026年4月22日

比特人文

投稿邮箱:dhbase@126.com

扫码关注 获取更多资讯

图片

阅读原文

跳转微信打开

  •  

新书推荐 | 罗天华《作格的类型学研究》

徐惠 2026-04-25 00:02 江苏

语言类型学力作!以80种语言样本探析作格语言特征与共性

转载自“现代语言学”

作格的类型学研究

罗天华  著

浙江大学出版社

2025年11月

内容简介

该书在语言类型学框架中探讨作格语言的形态、句法特征以及二者的关联。具体做法是:在世界范围选取80种作格语言作为样本,选择23项形态句法特征并建立数据库,以此分析其中的共性与多样性。在系统比较各项结构特征的基础上,提出60条语言共性,整体呈现了作格语言的类型学面貌。书中着重讨了论形态、语序和小句结构,比较了作格语言与一般语言的类型学特征,提炼了作格语言的主要形态句法特点,并建立了形态与句法之间的一整套关联。

目录

1 绪论

1.1 作格和语法关系

1.2 作格研究简史

1.3 作格语言的分布和本书样本

1.4 参项和框架

2 作格研究的若干理论问题

2.1 作格的三个层面

2.2 作格的两种表达方式

2.3 作格的典型性

2.4 影响作格标记使用的因素

3 类型学的作格观

3.1 概念和术语之乱

3.2 类型学的“作格”

3.3 形式语法的“非宾格”

3.4 作格语言的判断标准

4 作格语言的形态

4.1 形态标记的附着位置

4.2 词缀类型

5 作格语言的小句结构

5.1 小句结构的三项特征

5.2 核心论元结构

5.3 逆被动结构

5.4 双及物结构

6 作格语言的语序

6.1 “自由语序语言”

6.2 作格语言的语序

6.3 作格语言语序的内部关联

6.4 作格语言与一般语言语序比较

6.5 小结:作格语言的语序共性

7 作格语言的疑问结构

7.1 三个问句类型参项

7.2 疑问结构的内外关联

8 作格语言的共性与个性

8.1 语序比较:Greenberg(1966)

8.2 疑问范畴比较:Ultan(1978)

8.3 总体比较(一):“语言共性库”30项共性

8.4 总体比较(二):WALS 23个参项

9 作格与汉语形态句法

9.1 现代汉语是作格语言吗? 

9.2 古代汉语是作格语言吗? 

9.3 汉语是分裂作格语言吗? 

9.4 作格语言的主语和汉语的主语

10 结语

10.1 作格的本质

10.2 作格语言的共性

作者简介

罗天华,浙江大学文学院教授、博士生导师。德国康斯坦茨大学哲学博士、华东师范大学文学博士。

主要研究领域为语言类型学和形态句法学,出版专著Interrogative Strategies: An Areal Typology of the Languages of China(John Benjamins 2016)、《汉藏语是非问句的类型学研究》(商务印书馆2023),主编论集《作格与汉语语法》(商务印书馆2022),其中Interrogative Strategies获中国社会科学院吕叔湘语言学奖、教育部高等学校科研优秀成果奖。主持完成国家社科基金项目2项、教育部社科基金项目1项。

比特人文

投稿邮箱:dhbase@126.com

扫码关注 获取更多资讯

图片

阅读原文

跳转微信打开

  •  

《现代汉语大词典》,重磅首发!我国大型语文辞书新成果

徐惠 2026-04-25 00:02 江苏

《现代汉语大词典》历时20年编纂完成,系统呈现百年汉语词汇,兼具规范与学术价值。

转载自“商务印书馆”

中国社会科学院创新工程重大项目

《现代汉语大词典》

中国社会科学院语言研究所 编

江蓝生 主编

相较于现代汉语词典》,现代汉语大词典的收词范围和编纂理念主要是什么?

在总体设计和编写上《大现汉》有许多不同于《现汉》的鲜明特色收词、释义、配例以及晚清民国旧词语的处理四个方面这部词典的主要学术特色是什么?

这部大型词典的编纂前后长达二十年,二十年间又有哪些辞书人的故事?

为大家分享江蓝生、韩敬体先生为词典所作前言节选和全文,一起了解这部反映百年现代汉语面貌的大型语文词典

前言节选

四十八年前的1978年,由我国著名语言学家吕叔湘、丁声树先生先后担任主编的《现代汉语词典》(以下简称《现汉》)正式出版发行,这是新中国第一部确定现代汉语词汇规范的中型语文词典,在我国辞书史上具有里程碑意义。

《现汉》出版至今多次修订(现已出到第7版),质量不断提升,但《现汉》是一部中型语文词典,不能完全满足读者查考的需要,因此,早在20世纪六七十年代,吕、丁二位先生就提出由中国社会科学院语言研究所编纂一部收词量更大、内容更丰富的《现代汉语大词典》的计划,但由于种种原因,曾经三次上马都半途而止了,直到2005年夏天才又重新开始。

词汇是反映社会和时代变化最敏感的神经,它随着社会的发展变化而发展变化。五四运动以来的一百多年间,中国社会经历了推翻三座大山的新民主主义革命以及社会主义制度的建立和发展等一系列翻天覆地的变革,从过去封闭、半封闭的社会样态步入到当今全球化、信息化的时代,其间汉语词汇面貌的变化幅度之大是前所未有的。

《大现汉》的编写准备工作从2005年夏季开始,2006年年初正式启动。我们把这部待编的词典设定为:一部在现代语言学理论、辞书编纂理论和实践经验指导下,以丰富、扎实的文献和口语语料为基础,以《现汉》为参照的系统反映百年现代汉语词汇面貌的大型原创性语文词典

我们的目标不止于编写一部《现汉》的扩容版,而是要编成一部《现汉》的升级版和创新版。

这部大词典的编写分一期——中国社会科学院重点课题(2005一2012年)和二期——中国社会科学院创新工程重大项目(2013一2023年)两个阶段,2023年年底印制了试印本后,又继续打磨修改了两年,前后长达二十年。

二十年间,这些同志由青年变成了中年,由中年步入了老年乃至耄耋之年,还有六位同志因病辞世,编写过程中的艰辛、困苦、曲折一言难尽。

当这部“折磨人”的大词典终于付梓时,我们一方面如释重负,庆幸为社会、为读者做了一件益事,可以向吕叔湘、丁声树二位先生交卷了(尽管晚了很多年;另一方面,又像一个学生等待老师的评判一样,为书中的不足和问题而惶恐不安。本词典凝聚了我院、我所和语言学界众多学者的集体智慧,在它即将出版之际,我们充满了感恩的心情。

希望这部大体上反映百年现代汉语面貌的大型语文词典既可以用于语文学习和教学,也能以其学术含量为语言学研究提供参考。其价值,相信学界和读者当有公论。

前言全文

<<  滑动查看下一页  >>

《现代汉语大词典》

历经20年编纂完成,是我国大型语文辞书的最新成果

系统反映五四新文化运动以来百年现代汉语词汇面貌

守正 纳新 存故 多元

百年汉语词汇面貌大观

共时性与历时性相结合 规范性与描写性相结合 学术性与实用性相结合

《现代汉语大词典》是在现代语言学理论和辞书编纂理论指导下,以丰富、扎实的文献和口语语料为基础,以《现代汉语词典》为参照而编纂的、系统反映五四新文化运动以来百年现代汉语词汇面貌的大型原创性语文词典。本词典秉持“共时性与历时性、规范性与描写性、学术性与实用性”相结合的编纂理念,在收词上贯彻“守正、纳新、存故、多元”的原则,是一部广泛吸收学界研究成果的集大成之作。

本词典共分五卷,收录单字字头13000 多个(按照规范标准确定字形、字音,梳理简繁、正异、异读关系) ,单字和复音词总计15.7万条(其中百科词语约 2.5 万条),配例 40多万个, 全书规模达 1200 多万字。本词典内容丰富, 为各类词标注词类,设立“提示”栏、 “辨析”栏(辨析实词、虚词 1400 余组) ,为方言词、地区词标注所属方言类别或地区。第五卷的“附录”为读者提供了文史、科技方面有查考价值的资料。在“附录”后还特别配备了《条目倒序索引》,为词语检索和相关研究提供了更多的方便。

本词典所收词语折射出中国社会百多年来不断变革、进步的宏伟历程,具有历史的厚重性、学术的创新性,展现了我国语文辞书编纂水平所达到的新的高度。它不仅是新时代提高全民族语言文字应用水平的得力工具,也从一个侧面反映了我国不断增强的文化软实力。

词典使用说明

识别下方二维码或

点击文末阅读原文链接购买

比特人文

投稿邮箱:dhbase@126.com

扫码关注 获取更多资讯

图片

阅读原文

跳转微信打开

  •  

EvaHan2026古籍多模态OCR国际评测会议日程

EvaHan2026 2026-04-24 00:00 江苏

古籍OCR国际评测竞赛结果即将揭晓,国内外十多支团队精彩报告!

EvaHan2026古籍多模态OCR国际评测研讨会将于2026年5月11日在西班牙马略卡岛召开的语言资源大会LREC 2026的子会议——LT4HALA 2026上隆重举行。

古籍是中华文明的载体,也是人类文明的珍贵组成部分。将海量古籍图像转化为可检索可计算的文本是古籍数字化加工过程中的关键一环。然而,古籍文档的版式多样、文字形态复杂,使得基于现代文档数据开发的OCR工具在处理古籍图像时往往难以达到理想效果。

EvaHan自2022年起,已先后在法国马赛(分词词性标注)、中国澳门(机器翻译)、意大利都灵(断句标点)及美国新墨西哥州(命名实体识别)成功举办了四届。2026年,EvaHan将目光转向更具挑战性的古籍多模态OCR与版面分析任务,力求建立高质量的数据集和评测基准。本次评测共有来自中国、法国等海内外高校与科研机构的41支队伍报名,13支队伍完赛。

PART1

会议日程

(注:以下为西班牙当地时间,北京时间已标注。)

开幕式:

14:00 - 14:03(北京时间:20:00-20:05) 

特邀嘉宾讲话:

14:03 - 14:07(北京时间:20:05-20:35)

  • The Significance and Direction of Chinese Ancient Book OCR(中文古籍OCR的意义与方向)

    著名计算语言学家 冯志伟 教授

评测总览:

14:07 - 14:22(北京时间:20:35-20:45)

  • Overview of EvaHan2026: The First International Evaluation on Ancient Chinese OCR and Layout Analysis(EvaHan2026评测总体情况报告)

    南京农业大学 王东波 教授

口头报告 : 每篇4分钟

14:22 - 15:10(北京时间:20:45-21:10)

  • A Multi-Stage System for Ancient Chinese OCR and Layout Understanding in the EvaHan2026 Shared Task(古籍OCR与版面理解的多阶段系统)

    KeYan Liang, Meiling Liu

  • A Multi-Modal Recognition Framework for Ancient Books Integrating DoRA-DPO Text Recognition and YOLO Layout Analysis(融合DoRA-DPO文本识别与YOLO版面分析的多模态识别框架)

    Chaokun Zhang, Xin Wen, Tongtong Zhou

  • Enhancing Ancient Chinese Character Recognition and Layout Analysis via VLM Fine-Tuning and Linguistic Post-Processing(基于视觉语言模型微调与语言学后处理的古籍增强识别)

    Yihuan Yin, Qian Zhao

  • A Dual-Modality Framework for Ancient Document Layout Analysis and Text Recognition(古籍版面分析与文本识别的双模态框架)

    Qi Fan, Jieming Hu, Chen Ye

  • EvaHan 2026 Ancient Books Multimodal OCR and Layout Analysis System Technical Report(古籍多模态OCR与版面分析系统技术报告)

    Chenrui Zheng

  • A Parameter-Efficient and Data-Centric Framework for Ancient Chinese Text(面向古籍文本的参数高效与数据驱动框架)

    Yuchun Meng

  • LVLM Optimization for Ancient Chinese Book Image Analysis with Task-specific Augmentation and Instruction Tuning(基于任务增强与指令微调的大视觉语言模型古籍图像分析优化)

    Xia Tian, Liu Yulong, Wang Yilin, Yang Yumeng, Cai Dongheng, Tan Yuyang,Yang Menghui

  • Data-Centric Strategies for Ancient Chinese Text Recognition: Augmentation, Annotation Refinement, and Style Transfer in EvaHan 2026(数据驱动策略:数据增强、标注优化与风格迁移)

    Chengfei Li, Yunjie Zhang, Xiaoyi Li, Changshun Quan, Taihe Cao, Bin Liu

  • AnandaSky: A Vision–Language Model for Line-Level Transcription of Historical Sinographic Documents(面向历史汉字文档行级转录的视觉-语言模型)

    Colin Brisson, Ayoub Kahfy, Frédéric Constant, Marc Bui

  • Multimodal Ancient Document Parsing: Technical Report for EvaHan2026 Competition(多模态古籍解析技术报告)

    Liqi He, Qiwei Li, Ziye Yang, Zuchao Li

  • Multi-Task Learning Trade-offs in Vision–Language Models for Ancient Chinese OCR: An Empirical Analysis of Parameter-Efficient Adaptation(古籍OCR视觉语言模型中的多任务学习权衡:参数高效适应的实证分析)

    Huizi Zhou, Yuhan Shu

  • Building Character(s): Synthetic Data and In-Context Learning Strategies for Few-Shot Ancient Chinese Recognition(合成数据与上下文学习策略在少样本古籍识别中的应用)

    Denise Atzori, Marie Bizais-Lillig, Mathias Garnier, Maxime Létoffé, Charles Planque, Tianjie Yin, Chahan Vidal-Gorène

  • 闭幕式

15:10 - 15:15(北京时间:21:10-21:15)

PART2

特邀嘉宾

著名计算语言学家 冯志伟 教授

冯志伟教授是我国著名计算语言学家、中国计算机学会高级会员、中国中文信息学会会士。先后在北京大学和中国科学技术大学研究生院两次研究生毕业,获双硕士学位。曾在法国格勒诺布尔理科医科大学应用数学研究所(IMAG)自动翻译中心(CETA)留学,后在德国夫琅禾费研究院(FhG)新信息技术与通信系统研究所、德国特里尔大学、德国康斯坦茨高等技术学院、韩国科学技术院(KAIST)电子工程与计算机科学系(EECS)、英国伯明翰大学担任高级研究员或教授,现为新疆大学天山学者。主要著作有《Forma Analysis for Natural Language Processing: A Handbook》、《自然语言计算机形式分析的理论与方法》《自然语言处理简明教程》《计算语言学方法研究》《数理语言学》《数学与语言》《机器翻译研究》《现代术语学引论》《现代语言学流派》《汉字》(英汉对照)等40部,主要译著有《自然语言处理综论》《统计语言学习》等3部,用中文、英文、法文、德文发表论文500多篇,主持研制国际标准(ISO)1项、国家标准(GB)1项、国家规范3项,参与研制国家标准(GB)14项。2006年获奥地利维斯特奖,2018年获中国计算机学会NLPCC杰出贡献奖,2023年获香港圣弗兰西斯科技人文奖。

PART3

会议信息

会议语言

英语

主持人

李斌 教授

主办团队

南京农业大学信息管理学院

王东波、刘浏、朱冬梅、厉洁琼、刘畅、武瑞峰、杨俊羿

南京师范大学文学院语言大数据与计算人文研究中心

李斌、冯敏萱、许超、曲维光、李俊洁、朱月、戴俊阳、

方灿灿、徐梦婷、许智星、蔡敏欣

南京理工大学经济管理学院

沈思

协办单位(排名不分先后)

中国人工智能学会语言智能专委会

中国中文信息学会青年工作委员会

中国古籍保护协会古籍智能开发与利用专委会

中国民族语言学会语言资源与计算人文专委会

江苏省人工智能学会自然语言处理专委会

中华书局 古联(北京)数字传媒科技有限公司 

联系方式

  • 邮箱:evahan2026@gmail.com

PART4

直播地址

直播地址请关注比特人文公众号后续推文。

= END =

相关链接:

欢迎参赛 | EvaHan2026 古籍多模态OCR国际评测

即将开赛 | EvaHan2026 古籍多模态OCR国际评测(2号通知)

比特人文

投稿邮箱:dhbase@126.com

扫码关注 获取更多资讯

图片

阅读原文

跳转微信打开

  •  

第二十五届中国计算语言学大会(CCL26-Eval)技术评测任务启动,欢迎报名参赛!

CCL26-Eval 2026-04-24 00:00 江苏

CCL26-Eval启动,14项评测覆盖NLP多领域,10月宜昌办会。

转载自“CIPS计算语言学专委会”

第二十五届中国计算语言学大会(CCL26-Eval)技术评测任务启动,欢迎报名参赛!

第二十五届中国计算语言学大会(The 25th China National Conference on Computational Linguistics, CCL 2026)将于2026年10月15至18日在湖北省宜昌市举行。会议主办单位为中国中文信息学会。CCL是中国中文信息学会(CIPS)的重要会议,是中国最大的自然语言处理学者和专家的社区。经过三十年的发展,CCL被广泛认为是最权威的,全国最具影响力、规模最大的NLP会议。随着计算机语言处理在中国的发展,CCL已经成为在全国范围内传播计算语言新学术和技术工作的主要论坛。

会议网站:http://cips-cl.org/static/CCL2026/index.html

本次大会继续组织中文语言处理技术评测CCL26-Eval。经过前期评测任务征集,CCL26-Eval组织委员会已确定14个评测任务,涵盖语义分析、篇章、语用分析,跨语言、小语种、低资源自然语言处理,知识图谱,自然语言处理与医疗、教育、人文、司法等领域结合应用,生成式AI与大模型核心能力等研究方向。欢迎广大研究者参与评测竞赛。每个评测任务都会根据比赛结果设立一、二、三等奖若干名,由中国中文信息学会颁发官方荣誉证书。评测的总结论文和优秀技术报告将被CCL AnthologyACL Anthology收录。

评测主席:

林鸿飞(大连理工大学,hflin@dlut.edu.cn)

谭红叶(山西大学,tanhongye@sxu.edu.cn)

杨亮(大连理工大学,liang@dlut.edu.cn)

CCL26-Eval评测任务分类汇总

一、 自然语言处理基础任务

1. 语义分析 / 篇章、语用分析

任务1:第二届中文叙实性推理评测

任务简介

        叙实性推理(Factivity Inference,FI)是一种跟事件真实性判断有关的语义理解任务,是真实性推理(Factuality Inference,FactI)的一种形式。在人类的会话交际中,叙实性推理能力主要表现为语言使用者可以从某些动词性语言成分(如“相信”“谎称”“意识到”等)的使用获取说话人和句子主语的心理状态,并据此推定相关事件的真实性(真还是假)。例如,从肯定句“他们意识到局面已经不可挽回”和相应的否定句“他们没有意识到局面已经不可挽回”上,都可以推理出在说话人眼中存在这样一个事实:“局面已经不可挽回”。进行此类推理所使用的知识是一种受世界知识(world knowledge)影响较小、主要涉及语言内部各成分之间语义关系的分析性语言知识(analytical knowledge of language)。比如,上面例句中的动词“意识到”要求(预设)它的宾语“局面已经不可挽回”的所指大概率为真,不管该动词前面有没有否定性词语。

        为进一步提升大型语言模型对中文的语义理解能力,实现机器对人类交际话语的深度理解,我们将在FIE2025的基础上继续推出“第二届中文叙实性推理评测任务”。本届评测任务将着重考察大型语言模型在复杂语境条件和少样本提示下的叙实性推理表现。

         相较FIE2025,本次评测将着重考察大模型在不同真实语境中的叙实性推理表现有何差异。特别是:当叙实性结构中存在不同的否定词、不同的否定意愿、不同的评价性状语、不同人称和数量类型的主语,以及存在多声性标记和被动化标记等复杂语境条件下,模型的叙实性推理表现如何。例如:从“我不能相信他竟是一个八十多岁的老人”,可以推出“他是一个八十多岁的老人”大概率为真;而从“我不能相信人可以长生不老”,可以推出“人可以长生不老”大概率为假。

任务描述

        参赛队伍需要利用组织方发布的样例集与评测集自行设计提示词(prompt),在获取LLMs的回答后整理为统一的输出格式。每条评测集数据以一个文本蕴含关系句对<Aa,a>的形式呈现,数据集以JSON格式保存。

模型需要根据主蕴含句Aa的内容判断被蕴含句a的真值情况,并给出对该判断的置信度。例如:
*主蕴含句Aa:老张并没有注意到她今天穿了一件红色的连衣裙。
*被蕴含句a:她今天穿了一件红色的连衣裙。
*模型判断:有95%的把握判定被蕴含句为真。
*输出答案(JSON):{"factivity":"TRUE","confidence":0.95}

此外,本届评测将继续设置不微调(non-finetuning)和微调(finetuning)两条赛道。不微调赛道不允许对模型本身做任何修改;微调赛道可以利用样例集数据对模型参数进行微调。鼓励尝试进行多样化、复合化测试手段以获得更好的回答表现。

组织者和联系人 

  • 任务组织者:袁毓林(澳门大学教授)、李斌(南京师范大学教授)

  • 任务联系人:丛冠良(澳门大学博士生,guanliang.cong@connect.um.edu.mo);寻天琦(澳门大学博士生,tianqi.xun@connect.um.edu.mo)。

任务奖项 

本届评测将为不微调赛道和微调赛道分别设置一、二、三等奖,奖项按总得分从高到低颁发。其中,一等奖0-1名,二等奖0-2名,三等奖0-3名。各奖项奖金待定。

任务网址

 https://github.com/UM-FAH-Yuan/FIE2026

任务2:非字面义翻译和理解评测

任务简介

评测面向谚语、成语、习语、俚语、典故等非字面表达的中英翻译与识别,重点考察模型对非字面意义的理解、跨语言文化映射能力以及语用效果保持能力。任务构建了“生成+判别”互补评测框架,用于检验模型的非字面义表达生成能力和标准非字面义辨识能力。评测数据共5000条高质量样本,涵盖Gold(英文文化背景下的等值表达)和Silver(核心意义翻译)两类参考。本次评测包括两个子任务。

  • 子任务1非字面义中文翻译为英文给定一条包含谚语、成语、习语等非字面表达的中文句子,模型需生成1条自然、地道、具有文化映射特征的英文译文,优先采用英语中现成的习语、谚语、格言或固定搭配进行等值替代。

  • 子任务2非字面义中英选择给定一条非字面表达的中文句子及若干个英文候选,模型需进行不定项选择,识别并输出与中文在英语语境中构成公认等值替代关系的Gold标签项。

组织者和联系人 

  • 评测组织者: 张冬瑜(大连理工大学教授)

  • 任务联系人: 杨森淇(大连理工大学博士生,ysq1997@mail.dlut.edu.cn)

任务奖项 

本届评测设置一、二、三等奖,由中国中文信息学会提供荣誉证书。

任务网址

https://github.com/DUTIR-YSQ/CCL2026-Non-literal-Translation-Task

2. 跨语言、小语种、低资源自然语言处理

任务3:跨主流语言与低资源语言对齐的大模型金融评测

任务简介

MapFinBen是首个专门评估大语言模型在高资源语言与低资源语言之间跨语言资源的多语言金融评测基准。该基准覆盖了五类具有代表性的金融任务,全面反映真实金融应用场景中的多样化需求。

在语言设置上,MapFinBen同时涵盖高资源语言(英语和中文)与多种低资源语言(印度尼西亚语、西班牙语、希腊语和日语),有效缓解了现有金融语言模型评测中对高资源语言过度依赖的问题。通过统一的任务设计与评测标准,该框架能够系统评估大模型跨语言、跨资源条件下的金融任务处理能力。

MapFinBen 基准由五个子任务构成,通过综合评估模型在各子任务上的表现来确定最终成绩。具体任务如下:

  • 子任务一金融选择问答(FinAS) 给定一段金融文本及其对应的问题和候选选项,模型需要从多个备选答案中选择最符合问题语义和金融语境的正确答案。

  • 子任务二金融文本问答(FinQA) 给定一段金融文本,模型需要根据文本内容回答与之相关的金融问题。

  • 子任务三金融情感分析(FinSA) 给定一段金融文本,模型需要识别文本所表达的情绪倾向,并将其分类为积极、中性或消极。

  • 子任务四金融主题分类(FinTC) 给定一段金融文本及候选主题类别,模型需要根据文本内容将其归类到最合适的金融主题类别中。

  • 子任务五金融文本摘要(FinTS) 给定一段金融文本,模型需要提取并生成简洁、准确的摘要,以概括文本的核心信息和主要内容。

各子任务的数据分布、数据结构、具体评测指标及其计算方式,以及最终成绩的计算方法,详见任务网址。

组织者和联系人 

  • 评测组织者:胡刚、岳昆(云南大学)、彭敏(武汉大学)、石磊(云南师范大学)

  • 任务联系人:孔晓勇(kongxiaoyong@stu.ynu.edu.cn)

任务奖项 

本届评测将设置一、二、三等奖,由中国中文信息学会提供荣誉证书。

任务网址

https://github.com/HgITSE/MapFinBen

任务4:低资源缅甸语固定模版语句推理评测

任务简介

在缅甸语等低资源语言的翻译中,固定模版语句的推理作为垂类的任务,其语言内部的词性、地名、多元价值观等显著影响着最终的翻译质量。

格式与习惯差异:例如,中文的“第1名”、“第3章”,在缅甸语意为“编号”或者“号”,后面需要紧跟缅甸语数字。地名转写冲突:地名转写往往与缅甸语特有发音、历史习惯冲突,导致中文直接转写容易出现混乱。多元价值观影响:翻译受种族、宗教以及集体主义的影响,不能简单直译。必须充分考虑当地的文化敏感性和宗教背景,否则极易引起误解或反感。

作为固定模版语句的推理任务,机器具体要适应的是模版格式、幻觉处理等任务的重要形式依据。为了提升翻译大模型在缅甸语上的翻译质量,进一步实现机器对人类固定模版语句的深度理解,我们正式推出本次评测任务。

组织者和联系人 

  • 评测组织者:陈自岩、刘劲松(新译信息科技有限公司)、朱少林(天津大学)

  • 任务联系人:任虹(天津大学博士生,邮箱地址:rhong@tju.edu.cn);吴川(天津大学硕士生,邮箱地址:wuchuan@tju.edu.cn)

任务奖项 

本届评测将设置一、二、三等奖,由中国中文信息学会提供荣誉证书。奖金由 新译信息科技有限公司赞助。

任务网址

https://github.com/merc11/CCL-2026

二、 自然语言处理应用

1. 知识图谱

任务5:杂粮育种信息抽取评测

任务简介

杂粮育种领域积累了大量以自然语言形式呈现的知识,广泛分布于论文、品种审定与栽培技术规程等文本中。这些文本记录了育种材料来源、目标性状及测定结果,同时也包含栽培管理条件、胁迫处理信息以及分子标记等证据。由于杂粮育种文本专业术语密集、概念表述多样,且材料名称与试验要素常存在嵌套表达,导致关键信息难以稳定抽取和统一结构化,从而限制了知识检索、证据汇总和育种决策支持等应用的发展。

杂粮育种信息抽取评测(Minor Grain Breeding Information Extraction Evaluation, MGBIE)旨在面向杂粮育种知识管理与数据资源建设需求,系统评估信息抽取模型在杂粮育种相关专业术语识别、育种语境理解、关键信息抽取与结构化表达等方面的能力。MGBIE数据集总规模为2000条样本,其中训练集、验证集和测试集分别包含1000条、400条和600条,用于支持模型的训练、调优与综合性能评估。

MGBIE2026包含以下两个子任务:

  • 杂粮育种命名实体识别: 从杂粮育种相关文本中识别并抽取关键实体信息,并输出相应的实体边界及其类型标签。实体类型标签体系涵盖杂粮育种领域的核心概念,共包括12类:作物、品种、性状、生育时期、基因、数量性状位点、分子标记、染色体、育种方法、亲本/杂交组合,非生物胁迫以及生物胁迫。

  • 杂粮育种关系抽取: 在已识别实体的基础上,进一步抽取实体之间的语义关系,并以关系三元组的形式进行结构化表示。关系类型体系共包含6类语义关系,分别为:包含、采用、具有、影响、发生于和定位于。

组织者和联系人 

  • 评测组织者:胡志伟、孔照胜、高建华(山西省后稷实验室、山西农业大学);谭红叶、闫智超、李茹(山西大学);谢倩倩(武汉大学)

  • 任务联系人: 杨森杰(山西大学硕士生,yangsenjie1@sxu.edu.cn)

任务奖项 

本届评测将为不微调赛道和微调赛道分别设置一、二、三等奖。其中,一等奖1名,二等奖2名,三等奖3名,由中国中文信息学会提供荣誉证书。

任务网址

https://github.com/zhiweihu1103/CCL2026-MGBIE

天池评测链接

https://tianchi.aliyun.com/competition/entrance/532465

2. 自然语言处理与医疗、教育、人文、司法等领域结合应用

任务6:中文电子病历疾病与手术ICD自动编码评测 

任务简介

近年来,随着人口老龄化加剧和健康意识提升,医疗体系面临着日益增长的服务压力。在医疗信息化进程中,电子病历的广泛应用为解决这一挑战提供了新的可能。为实现医疗数据的标准化管理和共享,世界卫生组织制定了国际疾病分类标准(International Classification of Diseases,ICD)。该标准将数万种疾病及其组合转化为规范的字母数字编码体系,为跨地区、跨机构的医疗数据交换与分析奠定了基础。

然而,对电子病历文本进行人工ICD编码不仅耗时耗力,还容易因专业技能差异导致编码错误。开发自动ICD编码系统,既能提高编码效率和准确率,也能为疾病研究和医疗管理提供更可靠的数据支持。基于上述背景,本任务构建了一个中文电子病历ICD自动编码数据集,该数据集基于脱敏病历数据而构建,共涉及10个科室,18种主要疾病编码,若干种其他疾病编码,16种主要手术编码,若干种其他手术编码,共计2600条数据。该任务给定一段由临床信息构成的文本作为输入,需要模型输出对应的主要疾病编码、其他疾病编码、主要手术编码、其他手术编码。

组织者和联系人 

  • 评测组织者:管红娇、鹿文鹏(齐鲁工业大学(山东省科学院))、廉颖、陈国强(山东第一医科大学第一附属医院)

  • 任务联系人: 李传龙(齐鲁工业大学硕士生,icdevaluator@163.com)

任务奖项 

本届评测将设置一等奖1名,二等奖3名,三等奖6名,由中国中文信息学会提供荣誉证书。

任务网址

https://github.com/QLU-NLP/icdevaluator-26

天池评测链接

https://tianchi.aliyun.com/competition/entrance/532466

报名信息填写表

https://docs.qq.com/form/page/DWWNmV0ZGRnRwampn#/fill

任务7:跨语言文学文本情感分析一致性评测 

(Benchmark for Cross-lingual Classical Literature Sentiment Analysis and Consistency)

任务简介

跨语言情感分析一致性评测旨在考察模型对中国古典文学文本的情感理解能力,以及同一语义内容在中英文两种表达下是否能够保持情感判断一致。中国古典文学往往通过意象、典故和隐喻传递情感,具有较强的语境依赖性,因此对模型的跨语言语义理解和情感对齐能力提出了较高要求。

本任务基于中英平行古典文学语料,评估模型在单语言情感识别、跨语言情感迁移以及平行文本一致性建模等方面的表现。

BCCL-CSA 2026 包含三个子任务:

子任务一细粒度情感识别

参赛系统需分别对中文古典原文及其对应英文译文进行情感分析,预测文本的情感极性和情绪分布。

评测重点包括:

1.情感极性识别准确率

2.情绪分布预测能力

该子任务用于评估模型对单语文学文本情感特征的理解能力。

  • 子任务二跨语言情感迁移

参赛系统需在一种语言上训练,在另一种语言上测试,考察模型的跨语言情感迁移能力。

评测重点包括:

1.中英之间的情感极性保持一致性

2.不同语言表达下情绪分布的对齐程度

该子任务用于评估模型是否具备稳定的跨语言语义映射能力。

  • 子任务三平行文本一致性评估

参赛系统需对同一语义内容的中英文平行句对分别进行情感分析,并比较两种语言预测结果的一致性。

评测重点包括:

1.中英文情感极性预测是否一致

2.中英文情绪分布是否相近

该子任务用于评估模型在双语场景下的情感一致性与跨语言对齐能力。

任务特色与创新

1.跨语言情感对齐维度:突破单一语言的情感分类范式,首次聚焦于中英双语在复杂古典文学语境下的情感语义一致性。2.精细化分布标注:提供情绪概率分布(LabelDistribution),精准捕捉文学作品中复杂、模糊的情感底色。3.语料库稀缺性与挑战性:数据集精选自先秦至近代的13部经典著作,涵盖哲学、小说、戏曲等多种体裁,挑战模型泛化性能与抗噪声能力。

数据集说明

数据集CCL-SEL,来源于12部中国经典著作,每部著作各250组中英句子对。

网站建设与论文评审 

评测将建设GitHub页面发布数据、脚本与排行榜。评测论文将通过CCL26-Eval通道提交,并进行双盲评审。

组织者和联系人 

  • 评测组织者: 张海洋、张霄军(西交利物浦大学);徐睿峰(哈工大深圳)

  • 任务联系人: 周静狮(Jingshi.Zhou@outlook.com)

任务奖项 

一等奖1名,二等奖2名,三等奖3名。

任务网址

https://github.com/Jingshi-Zhou/-BCCL-CSA-2026-

任务8:大语言模型生成中文医疗内容的循证事实核查评测

任务简介

循证事实核查(Evidence-based Medical Fact-checking)是一项旨在验证在线医疗内容真实性的关键任务。随着互联网成为公众获取医疗健康信息的主要渠道,医疗虚假信息的泛滥给公共卫生安全带来了严峻挑战。该任务要求模型不仅要理解医疗声明(Claim),还需要结合检索到的相关证据(Evidence),判断证据对声明的支持程度(如支持、反驳或证据不足)。这一过程对于提高医疗信息的透明度、减少误导性信息的传播具有不可替代的作用,同时也是构建可信赖的医疗问答系统和智能医疗助手的核心安全屏障。

  • 支持(Supported):证据完全支持声明的内容;

  • 部分支持(Partially Supported):证据支持声明的部分内容,但存在不确定性或未覆盖的细节;

  • 反驳(Refuted):证据与声明内容相矛盾;

  • 不确定(Uncertain):证据与声明相关,但不足以证实或反驳声明的真实性;

  • 不适用(Not Applicable):证据与声明完全不相关。

组织者和联系人 

  • 评测组织者:苏炯龙、蒋正雍、王唯(西交利物浦大学)

  • 任务联系人: 陈彤(西交利物浦大学,Tong.Chen19@student.xjtlu.edu.cn)

任务奖项 

本届评测将设置一、二、三等奖,由中国中文信息学会提供荣誉证书。

任务网址

https://github.com/AshleyChenNLP/MedFact

任务9:第二届古诗词赏析评测

任务简介

中文古诗词具有高度凝练性和语言的音乐美,讲究对仗、平仄和押韵。为了准确理解古诗的语义,不仅需要掌握古诗的语言特色,还需要调动对历史、文化背景的知识,结合对古诗中所描绘的自然景象和人物情感的认知,从而进行综合性的推理与理解。

为了进一步衡量模型在中文古诗词赏析场景中的语言理解深度与文化推理能力,我们推出第二届中文古诗词赏析评测。在第一届的基础上,本届评测进一步聚焦模型的深度理解与复杂推理能力,引入更具挑战性的高级任务,以全面考察模型对古诗词文化内涵与高层语义结构的掌握程度。具体任务设置如下:

  • 任务一:古诗词理解:

古诗词字词理解:解释古诗词中短语级别的语义。本子任务通过问答题的形式对待测系统进行评估。

古诗词诗句理解:解释古诗词中诗句级别的语义。本子任务通过问答题的形式对待测系统进行评估。

古诗词情感理解:推断诗人透过作品所传达的情感。本子任务通过选择题的形式对待测系统进行评估。

典故识别:判断诗句中是否包含典故并进行解释。本子任务通过问答题的形式对待测系统进行评估。

  • 任务二:古诗词推理:

古诗词类比:发现古诗词中不同事物之间的相同关系,意象的关联。本子任务通过问答题的形式对待测系统进行评估。

古诗词辨析:依据诗词内容与语境,对给定选项进行辨析,判断其中表述最为合理的一项。本子任务通过选择题的形式对待测系统进行评估。

本评测将根据两个任务的综合性能来确定最终成绩排名。本评测旨在评估自然语言模型自身对中文诗词的理解水平,参赛队伍可以使用开源大语言模型进行微调,禁止使用RAG等技术来利用外部知识回答问题。

组织者和联系人 

  • 评测组织者:白雪峰、陈科海(哈尔滨工业大学(深圳)) 

  • 任务联系人: 朱颖杰、裴振武(哈尔滨工业大学(深圳),zhuyj@stu.hit.edu.cn)

任务奖项 

 一等奖1名,奖金合计3000元;二等奖1名,奖金合计2000元;三等奖1名,奖金合计1000元。 所有奖金将在公布奖项后10个工作日内发布。

任务网址

https://github.com/HITICI-NLPGroup/CCPA-EvalTask

任务报名表

https://docs.qq.com/form/page/DZW50THN4SGhqbm5x

三、 生成式AI与大模型核心能力

任务10:基于情景的常识推理评测

任务简介

推理是一种高级认知功能,涉及基于现有知识对新信息进行分析、归纳和演绎。它在人类智能中起着基础性作用。虽然以往的基准测试主要侧重于评估大语言模型(LLMs)在复杂、专业领域内的推理能力,但它们往往忽视了类人认知的一个关键方面:常识推理。评估大型语言模型中的这种常识推理能力对于人工智能的发展至关重要。这种基本能力显著影响着 LLMs 在日常情境中的决策,并且对于在通用人工智能(AGI)中迈向类人智能至关重要。

为了全方位、细粒度地诊断大模型的常识推理能力,我们提出了基于情景的常识推理评测数据集(Scenario-based Commonsense Reasoning Evaluation, SCoRE),用以评估大语言模型在常识场景下的复杂逻辑推理能力。根据所涉及的常识领域,该数据集包含的任务可分为以下五类: * 空间常识推理: 给定一个空间场景和若干已知的实体间方位关系,本任务要求机器推理出实体在空间场景中的位置,以及未知的方位关系。 * 时间常识推理: 给定一个包含若干事件的时间叙述场景和已知的事件间时间关系(如先后顺序、持续时长、相对或绝对时间点),本任务要求机器推理出事件在时间轴上的具体时刻,以及未知的事件间时间跨度或次序关系。 * 社会常识推理: 给定一个社会交互场景和若干已知的人物间人际关系(如亲属、职场、朋友或师徒关系),本任务要求机器推理出人物在社会网络中的具体角色或地位,以及人物间隐含的或未知的社会关系。 * 自然常识推理: 给定一组自然物体(或实体)和若干已知的属性约束条件(如类别归属、物理性状、功能用途或感官特征),本任务要求机器推理出物体与描述(或位置)的一一对应关系,以及物体未知的属性或分类特征。 * 融合常识推理: 融合领域任务描述旨在构建一个多维度条件交织的推理问题。它要求机器同时处理来自空间、时间、自然属性及社会关系等多个领域的约束与常识,并建立统一的推理模型以进行协同分析与决策。其核心挑战在于,单一领域的逻辑链条不足以解决问题,必须识别并整合不同领域的隐含联系,才能对复杂多因素情境进行有效推断。

组织者和联系人 

  • 评测组织者:詹卫东、穗志方(北京大学) 

  • 任务联系人:胡楠(北京大学博士生,hunan@stu.pku.edu.cn)

任务奖项 

一等奖0-1名; 二等奖0-2名;三等奖0-4名。

任务网址

https://pku-space.github.io/SCoRE2026/

任务11:面向自动驾驶的自动化危害分析与风险评估评测

任务简介

随着汽车电子电气架构(E/E 架构)向智能化与网联化深度演进,功能安全已超越早期以机械系统为主的工程保障范畴,演变为覆盖软硬件协同设计的系统化安全工程体系,成为自动驾驶技术落地与量产的关键基石。在此体系中,危害分析与风险评估(HARA, Hazard Analysis and Risk Assessment)承担着风险识别与顶层安全需求定义的核心职能。该过程通过对车辆运行场景、潜在功能失效模式及环境要素的系统化建模,提取车辆运动状态、道路拓扑及交通参与者分布等关键特征,并基于严重度(S)、曝光率(E)和可控性(C)三个维度对风险进行量化评估,确定汽车安全完整性等级(ASIL),并将评估结果转化为顶层安全目标,进而分解为可验证的软硬件安全需求,指导系统设计与工程实施。

为推动大模型与人工智能技术在预期功能安全及功能安全领域的落地应用,提升HARA流程的自动化与智能化水平,我们提出“面向自动驾驶的自动化危害分析与风险评估评测任务”并构建了一个专注于评估自动驾驶安全逻辑推理与需求生成的结构化数据集。该数据集源自脱敏的真实工业项目数据,聚焦于动力系统核心高危失效模式——“非预期驱动力/扭矩输出”,共包含3,000条高质量标注数据。

本次评测包括以下两个子任务: * 危害事件识别与场景描述生成: 该任务要求模型基于给定的车辆运行工况与环境参数,精准识别潜在的危害事件,并生成符合工程规范的危害场景结构化描述。 * 风险参数评定与等级推理: 该任务要求模型基于场景特征,推理并输出HARA分析的关键风险指标(S/E/C),并据此判定相应的安全完整性等级。

组织者和联系人 

  • 评测组织者:杨旭(北京理工大学),张海洋(西交利物浦大学),王唯(西交利物浦大学)

  • 任务联系人:王子木(西交利物浦大学博士生, Zimu.Wang19@student.xjtlu.edu.cn)

任务奖项 

一等奖1名,奖金合计5000元 * 二等奖1名,奖金合计3000元 * 三等奖1名,奖金合计2000元。

赞助情况 :本次评测奖金由优策科技(福州)有限公司赞助。

任务网址

https://ccl2026-hara.github.io

任务12:优酷无障碍剧场杯-面向听障群体的信息无障碍结构化字幕生成评测

任务简介

在我国已进入“制度保障”阶段的信息无障碍建设背景下,字幕已成为听障及老年群体获取音视频信息的关键无障碍服务。然而,现有技术评测缺乏面向真实应用场景、统筹考量“可读性”、“核心信息准确度”与“响应速度”的基准。本任务从“AI字幕是基础设施”的视角出发,系统评测从“语音/视频输入”到生成“面向人类阅读的结构化字幕文档”的完整链路,特别聚焦于解决高信息密度真实场景(如医疗、金融、政务办事)中“社交时差”与“关键信息丢失”两大痛点。

为贴近不同应用环境,评测任务被设计为两个平行赛道,以全面评估技术的能力上限与落地可行性:*赛道A:PC端模拟云端或高性能桌面环境,旨在探索技术性能上限,不限制计算资源。*赛道B:手机端模拟移动设备(手机、AR眼镜)实时交流场景,对模型体积、内存占用及实时性提出明确的约束要求。

每个赛道均包含以下两个子任务:

1. 子任务一基础字幕生成(Foundation Track) 评估语音转写、时间戳对齐、噪声鲁棒性等基础能力。 评测指标: 转写准确性、时间轴对齐精度、复杂多人场景下的综合处理能力。

 2. 子任务二结构化可读字幕生成(Structured Track) 评估模型生成符合人类阅读习惯、包含合理断句、标点、说话人区分、并确保核心关键词准确性的结构化字幕的综合能力。 自动评测指标: 文本准确性、核心词召回率、模拟显示延迟、时间轴合理性偏差、结构一致性。 人工评测指标(抽样): 可读性(1-5分)、关键信息完备性、断句合理性、标点与语气匹配度、幻觉文本严重程度。

数据规模与来源

本评测构建了总规模约30–50小时的多场景真实语音/视频测试集,涵盖新闻演讲、影视综艺、生活真实交流、多人会议等四类典型场景。其中,约10–15小时的核心子集提供更高粒度的结构化标注与核心关键词标注,支持Track2的深度评测。数据来源强调真实性与多样性,包含背景音乐干扰、环境噪声、远场收音、多人重叠语音等复杂声学条件,全面模拟听障用户在办事场景中的实际听觉挑战。

组织者和联系人 

  • 评测组织者:姚登峰(北京联合大学/清华大学),徐聪(中国聋人协会手语研究与推广委员会),梁振宇(深圳市信息无障碍研究会专家委员会),曲欣(北京市设计学会无障碍设计专委会)

  • 任务联系人:施杰、叶博文(北京联合大学硕士生,20251083510951@buu.edu.cn),张洋(清华大学博士生)

任务奖项 

本届评测将设置一、二、三等奖,由中国中文信息学会为获奖队伍颁发荣誉证书;同时设立赞助奖项,由阿里巴巴等头部科技企业提供奖品支持。

任务网址

https://github.com/ALINOSJ/IASSGE-2026

报名表

https://f.kdocs.cn/g/aYC93cfz/

任务13:图像文本翻译质量评测

任务简介

随着全球化进程加速和跨语言交流需求增长,图像文本翻译(In-Image Translation,简称“图翻”)已成为机器翻译的重要分支。与传统文本翻译不同,图翻需同时处理视觉与语言信息,涵盖文本检测、识别、翻译与渲染等多个环节,在跨境电商、旅游导览、多语言内容本地化等场景中具有广泛应用价值。中文图翻面临独特挑战:汉字视觉复杂性高、书写方向多样(横排/竖排)、与目标语言存在显著文本长度差异,且蕴含丰富文化内涵。尽管大型多模态模型在图像理解方面取得进展,但在保持视觉一致性的前提下实现高质量图翻仍困难重重。尤其在电商场景中,系统需区分“应翻译内容”(如功能说明)与“应保留内容”(如品牌标识),对翻译完整性与合规性提出更高要求。现有机器翻译评测指标(如BLEU、METEOR)仅关注文本准确性,无法衡量视觉呈现、排版布局、美学协调等关键维度。而人工评测成本高、主观性强、难以规模化。因此,亟需建立标准化、多维度、可自动化的图翻质量评测框架。

本次评测聚焦于如何设计和训练能够从多个维度对图像翻译结果进行精准评分的自动评测系统,从而为该领域的技术进步提供可靠的度量工具。旨在:建立标准化基准:构建包含多场景、多维度人工标注的大规模评测数据集。推动方法创新:鼓励研究者设计能够模拟人类专家判断的自动评测模型。探索评测范式:通过开放式竞赛,发现在不同应用场景下最有效的评测策略。促进社区共识:图像文本翻译质量评测建立可复现、可比较的评价标准。

组织者和联系人 

  • 评测组织者:李海军、尚姿芙、梁杰、徐昭、骆卫华

  • 任务联系人:韩雨轩(阿里云技术专家  baileng.hyx@alibaba-inc.com)

任务奖项 

一等奖1名,奖金合计20000元 ;二等奖1名,奖金合计10000元;三等奖2名,奖金合计5000元。

赞助情况:本次评测奖金由阿里云赞助,由中国中文信息学会为获奖队伍颁发荣誉证书。

任务网址

https://tianchi.aliyun.com/competition/entrance/532463?spm=5176.12281973.J_6-HJZaSjQocH7SIdvbK02.1.376b3b74H1HNIn

评测任务14:中文会话含义与隐喻能力评测

任务简介

       对“言外之意”的理解是人类交际的核心能力。而以往针对大语言模型的评测更侧重其在具体垂域中的表现,较少从语用推理与隐喻义识别角度评估模型的语言能力。本评测共设计两个核心赛道,旨在系统评估大语言模型在中文语境下的会话语义理解能力与隐喻理解能力。

赛道一:会话含义理解

      为了实现交流目的,会话参与者在交流时通常遵循一套基本原则,这一原则被格赖斯总结为合作原则。该理论从量、质、关系、方式等范畴提出四项准则。量的准则要求提供适量信息,既不多余也不过少;质的准则要求说话真实,证据充分;关系准则要求话语要与当前话题相关;方式准则要求表达简洁有序,避免晦涩和歧义。基于这四项准则,格赖斯提出了会话含义理论,当说话人违反了这些准则或次准则的时候,听话人就需要超越话语的表面意义去领会说话人的隐含意义。本赛道用于评估模型识别、理解会话含义的能力。

  • 子任务一:会话含义识别任务

给定一段多轮对话,要求模型指出特定人物的哪一句话是具有会话含义的。

  • 子任务二:会话含义选择任务

给定一段多轮对话,要求模型从四个选项里选出有会话含义句子的正确含义。

  • 子任务三:会话含义释义任务

给定一段多轮对话并明确指出具有会话含义的句子,要求模型生成一段解释。

赛道二:隐喻理解与生成

       隐喻作为人类认识世界的重要方式,在概念建构和思维过程中发挥着关键作用。隐喻能力不仅关系到语言表达本身,也与创造性思维、抽象推理以及知识迁移等更高层次的认知过程密切相关。人们通过具体、熟悉的源域来理解抽象、陌生的目标域,这一映射机制贯穿于日常语言与思维之中。本赛道用于评估模型识别、理解并创造性地使用隐喻的能力。

  • 子任务一:隐喻识别任务

给定一段文本,要求模型识别出此文本中的句子是否使用隐喻这一修辞手法,如包含隐喻,模型需要分别提取出隐喻句当中的本体、喻体。

  • 子任务二:隐喻释义生成任务

给定一段文本,要求模型用非隐喻的语言解释隐喻句的含义。

  • 子任务三:隐喻句生成任务

不限定主题,要求模型自主生成恰当的隐喻表达。

组织者和联系人

  • 组织者:杨尔弘、杨天麟、岳岩、安维华(北京语言大学)

  • 联系人:张艺璇(北京语言大学博士生,blcuicall@163.com)

任务奖项

本届评测将设置一、二、三等奖,由中国中文信息学会提供荣誉证书。

任务网址

https://github.com/blcuicall/CCIME2026

比特人文

投稿邮箱:dhbase@126.com

扫码关注 获取更多资讯

图片

阅读原文

跳转微信打开

  •  

书香四月,字韵生辉——全民阅读活动周特别推荐:《汉字(英汉对照)》

外研社国际汉语 2026-04-23 09:00 江苏

以下文章来源于:外研社国际汉语

外研社国际汉语

本账号由外研社中国语言文化出版分社运营,旨在为国际中文一线教师和专业学生搭建一个多元化、专业性程度高的教育交流平台。

外研社推《汉字(英汉对照)》,讲解汉字起源演变与构形,适合多类读者。

转载自“外研社”

四月,是被书香浸润的季节。阳光暖、微风轻,书香氤氲,正是与文字相伴,与文化对话的美好时光。

你是否好奇,方寸之间的汉字藏着怎样惊艳的故事?是否渴望透过字形与笔画,触摸中华文明的温度与力量?这一次,我们为你献上一本既有趣又充满文化深意的佳作——《汉字(英汉对照)》

它是一把解读汉字奥秘的钥匙,帮你轻松读懂语言的智慧;更是一扇通往中华文化深处的大门,带你感受千年文明的独特韵律。从字形的演变到六书的奇妙逻辑,从汉字的起源到书法中的笔画规则,每一页都生动展现汉字的魅力与传承。

让这本书成为你书香四月的良伴,在全民阅读活动周里,开启一次字里行间的精彩旅程吧!

点击封面即可跳转购买

汉字:

中华文明的文化密码

汉字,不仅是一种记录语言的工具,更是一部流动的文化史书。它承载着五千年的岁月温度,也讲述着中国人观察世界的方式。从新石器时代的刻符到甲骨文、金文,再到现代的简体汉字,每一次字形的演化都深深映照着社会的变迁和思想的革新

字形演变图,横滑查看

《汉字(英汉对照)》由著名语言学家冯志伟教授詹宏伟博士联手打造,以生动有趣的内容和严谨科学的讲解,为读者提供一次深入了解汉字的奇妙旅程。从汉字的起源、构形规律到其背后的文化韵味,这本书不仅是一部知识读物,更是打开中华文化的一扇窗。

精彩样张,横滑查看

阅读这本书,会收获什么?

(一)探寻汉字的起源与演变

从新石器时代的陶符到甲骨文,从大篆到隶书,每一个字形的变迁,都是社会和文化发展的见证。这本书带你重返文字的发轫之地,追溯汉字如何从简单的符号演化为完整的书写体系。

(二)解读汉字构形规则:

六书的逻辑之美

象形、指事、会意、形声、转注、假借……每一种构形法则都体现出古人观察自然、表达哲思的智慧。通过生动的图文实例,书中详细解析了这些构形规律,让你轻松记住复杂的汉字,感悟每个字形背后的文化逻辑。

(三)了解汉字的结构设计:

文字也有建筑学

汉字的组合不只是简单的拼接,而是有着深厚科学基础的“语言工程学”。无论是象形的单字,还是复杂的合体字,作者都以直观的图例将其层层拆解,让你理解文字如何从骨骼到血肉层层构建,最终成就一字一形的巧妙之美。

(四)掌握汉字的笔画与书写规律

写好一个汉字,不仅仅是学习规则,更是体会其结构与设计的精妙。本书系统讲解了汉字笔画类型及笔顺规则,让每一笔每一画都有据可循,让书写成为一种审美体验。

适合谁读?

每个人都能从中汲取灵感!

《汉字(英汉对照)》不仅是一本关于语言的书,更是一部探秘文化的指南。不论你是谁,都能在其中找到属于自己的收获:

中文学习者:

无需担心语言障碍,本书采用中英双语对照,帮助你快速了解汉字构形规则,从零基础到汉字达人,轻松学习!

国际中文教师:

丰富的实例和科学的解析,将为您的课堂增添更多生动素材,帮助学生理解和记忆,更高效、更有趣。

汉字研究者:

严谨的学术态度与权威的资料考证,为您的研究提供重要参考,同时也启发您用不一样的视角重新认识汉字。

文化爱好者:

热爱中华文化却不知从何入手?从汉字开始再合适不过。这本书不仅帮您读懂文字,也让您通过它窥见中华民族的智慧与精神。

书香四月,字韵生辉:

一场穿越字里行间的文化之旅

2026全民阅读活动周的到来,为每个人提供了与文化邂逅的机会。一杯清茶、一本好书,《汉字(英汉对照)》就是汉字学者、文化探寻者的不二之选。从中您不仅能感受汉字的古老韵律,还能体会汉字的逻辑之美。

翻开这本书,迎接中华文化的字韵芬芳

扫码购买,轻松开启你的汉字探索之旅!

当当

京东

天猫

比特人文

投稿邮箱:dhbase@126.com

扫码关注 获取更多资讯

图片

阅读原文

跳转微信打开

  •