普通视图

Received today — 2026年4月10日学术机构(中国大陆)

数字人文:文科在人工智能时代的定力与新出路

2026年4月9日 18:01

原创 联盟观察 2026-04-09 18:01 北京

从“文科消亡论”到“文科抢手潮”,舆论场在过去一年间经历了戏剧性的反转。2026年春招季,“大厂月薪3万疯抢文科生”“AI叙事设计师”“人机交互伦理顾问”等话题接连登上热搜。与此同时,“文科无用”“文科危机”的论调从未真正消失。

看似矛盾的现象背后,本质上并非文理之争,面对新技术革命,所有学科从业者都必须直面“如何应变”之问。

有研究者指出:“一个仅擅代码编写而不理解代码将服务于何种人群、产生何种社会影响的程序员,难以在人工智能时代保持核心竞争力。”同样,一位仅知埋首故纸堆而对数字工具一无所知的人文研究者,亦难在人工智能时代发出属于自己的声音。

技术从不“偏袒”任何一个学科,它只会鼎力相助那些善于驾驭它向善的人。那么,文科如何以技术之力激活人文之思?答案,藏在“数字人文”里。

从“文科价值”到“数字人文”

在技术浪潮中,文科真正不可替代的价值从未改变,只是表达方式需要更新。

技术擅长回答“怎么做”,而“做什么”“为什么做”需要文科进行价值判断。当AI在工具理性层面越走越远时,恰恰需要文科来回答“应该往哪走”。技术可以提供答案,但无法回答更关键的问题:这些答案意味着什么?它们将把我们带向何处?

“而这正是文科长期承担的任务。问题不在于文科“该不该存在”,而在于它能否以新的形态存在——不是被保留下来的旧文科,而是被重构出来的新文科。”郭英剑老师在《中国科学报》 (2026-03-24 第3版 大学观察)如是说。

数字人文,正是这一重构的重要路径。一名数字人文专业的毕业生,也许在文化遗产机构里从事数字档案的知识图谱构建,也许在科技企业中参与文化类大模型的内容策略与价值对齐。他们既保留人文研究的批判性思维与阐释传统,又掌握数据建模、文本挖掘、空间分析等数字方法,形成“问题导向、方法多元、实践驱动”的综合素养。

政策与专业布局

数字人文的发展,已从学术探索上升为国家战略与教育实践。

政策层面

《教育强国建设规划纲要(2024—2035年)》明确提出:深化新文科建设,强化科技教育和人文教育协同,让人工智能助力教育变革。这为数字人文的发展提供了顶层设计与制度保障。

专业建设层面

数字人文的发展格局已初步形成。2022年,教育部正式将数字人文纳入《普通高等学校本科专业目录》。目前,全国已有15所院校获批设立数字人文本科专业。

数字人文专业发展联盟成立与发展

2025年1月,数字人文专业发展联盟在北京成立,由中华书局古联公司联合25家高校共同组建。仅一年,联盟理事单位已从25家增至近50家。该联盟聚焦专业发展方向与路径、师资培训、课程设置、人才培养与就业、数字人文实验室建设等议题,为数字人文教育的标准化、国际化与可持续发展提供了平台支撑。

点击图片购买《中国数字人文发展报告》一览中国数字人文发展全貌,内含数字人文专业介绍、相关政策、就业前景与相关机构名录等。

课程与培养——复合型人才的锻造路径

数字人文要培养的是“兼具人文精神和科技素养的复合型人才”。从培养目标、课程体系、教学模式到评价管理体系,各高校正在展开系统性探索。

以内蒙古师范大学蒙古学学院为例,作为国内第一个开设数字人文本科专业的院校,其专业定位强调产学研融合——人才培养、学科研究和产业服务三位一体。在课程体系建设中,紧密结合社会需求,融合传统与新兴,兼顾学生背景多样性以促进文理交叉,并强化实践与实验教学环节。

从多所院校的课程设置来看,数字人文专业通常包含三大模块:人文基础课程(文史哲核心)、技术工具课程(编程、数据库、可视化等)、交叉应用课程(数字档案、文化遗产数字化、人文知识图谱等)。这种结构使学生既保有深厚的人文底蕴,又具备驾驭数字工具的能力。

中国数字人文官网:https://nav.dhcn.cn/

实践成果——数字人文的落地与突破

数字人文并非空中楼阁,已在文化遗产保护、学术研究、文化传播等领域取得实质性突破。

“数字敦煌”:通过三维扫描、VR技术,将莫高窟“搬”到全世界,实现文化遗产的永久保存与全球共享。

故宫博物院:数字化文物建档、智慧展览,让文物“活”起来,使公众得以突破时空限制亲近历史。

“九歌·推敲”小程序:由清华大学中华传统文化智能实验室和数字人文研究中心研发,借助人工智能技术,将“推敲”功夫落地为一套可操控、可解释、可回退的智能化写作流程,让诗词爱好者拥有自己的“韩愈”。

中华智慧阅读空间:古联公司依托中华书局古籍经典资源,深度融合智能交互投影与AIGC技术,研制了《天工开物》《本草纲目》等沉浸式智慧阅读空间,实现从“读书”到“入书”的认知升维。

这些案例表明,数字人文正在使人文研究从“解释世界”向“改变世界”延伸。

就业前景——复合型人才的广阔空间

数字人文人才就业方向多元,前景广阔:

  • 文化机构:

    博物馆、图书馆、档案馆,负责数字化项目的规划与实施;

  • 政府部门:

    参与文化产业数字化升级;

  • 教育研究机构:

    从事数字人文教学与研究;

  • 企业与新媒体:

    文化企业、互联网公司,从事数字内容策划、数据分析、信息架构等工作。

热门岗位包括数字内容策划、数字资源管理员、文化遗产数字化专员等。据行业调研,数字人文领域人才缺口持续扩大,复合型人才更受市场青睐。

结语

从“文科消亡论”到“文科抢手潮”,这一年多的舆论反转,与其说是文科的命运转折,不如说:技术越发展,人类对意义、价值、伦理与文明的理解需求就越强烈。

文科不会因AI而消亡,它将借势改变——不是变成另一种东西,而是回到它本该在的位置:在技术飞速奔跑时,提醒人们不要忘记为什么出发。

数字人文,正是这种改变的实践形态。它以交叉融合的学科特质,培养兼具理论深度与技术能力的复合型学术力量,为人文研究的当代转化与体系创新提供了坚实基础。对于每一位身处浪潮之中的主体而言,与其被“文科生”或“理科生”的标签定义,不如主动成为学习者与创造者——去拓展技术的边界,也去追寻科技与人类的意义。

技术改变的是能力,人文守护的是方向。 这或许就是从“消亡论”到“抢手潮”背后,最值得我们记住的那条线。

END

点击往期文章,申请加入或更多了解数字人文专业发展联盟:

欢迎加入丨数字人文专业发展联盟入会方式

转载丨数字人文专业发展联盟正式成立

首届数字人文专业发展联盟年会暨第六届清华数字人文国际会议在昆明学院成功举办

会议通知丨融合与边界:人工智能时代的数字人文发展新进阶

阅读原文

跳转微信打开

杨庆峰|智能增强工具与新型生产关系的构建

2026年4月9日 09:01

2026-04-09 09:01 浙江

智能增强工具与新型生产关系的构建

原载于《理论探索》2025年第4期

摘要〕

        人工智能作为增强工具逐渐取得了共识,如通过大模型工具实现了知识增强、推理增强,可穿戴、外骨骼工具实现了身体增强。因此,智能增强是通过人工智能工具反思智能科技对人类的增强效应及新型生产关系构建的规范性范畴。人工智能若作为工具性存在,生产关系依然是基于人-人的,劳动具有社会性、属人性;人工智能若作为智能体存在,生产关系的变革就成为必然,必须与新质生产力相耦合,劳动者将演变为人-机融合的形态,劳动对象从实在存在演变为虚拟存在,劳动工具消融在主体中或者取代人类主体。

〔关键词〕

        智能增强工具,新质生产力,新型生产关系

杨庆峰复旦大学科技伦理与人类未来研究院研究员复旦大学哲学学院教授、博士生导师

当前,人工智能理解存在着一种规范性特征:人工智能用来增强人类而不是取代人类。然而,这一理解并不是静态的,还需要注意到未来的变化。总体来说,人工智能理解的未来变化是从无人工智能的工具进化为具备自主性的智能体(agent)。在这一特征前提下,生产关系与生产力的关系问题也将发生根本的翻转:以智能科技为代表的生产力走在了生产关系的前面。换句话说,这些智能科技正在提高生产力并呼吁与之相适应的新型生产关系类型。从劳动过程来看,机器劳动成为可能,劳动活动的属人性、社会性前提变得摇摆;劳动主体将演变为人-机协同体;劳动工具将消融在主体之中或者取代主体;劳动对象已经从实在对象变为虚拟存在;更可能的是,随着企业智能体的运用,未来工厂完全可能会出现智能体同事。鉴于此,本文将讨论智能增强工具如何构建形态多异的生产关系以及如何理解这种新的生产关系。

一、智能增强工具:人工智能理解的规范性特征

笔者曾经讨论过当前我们时代的特征这一问题,初步的结论是无论从国家战略还是从事物本质层面看,数智时代已经取代智能时代、信息时代成为我们当前所处时代的最好概括。在人工智能本质的理解中,工具论成为很显著的一个叙事特征,深深地隐藏在不同群体关于人工智能叙事中。人工智能领域存在四种叙事类型:科学化叙事、科幻化叙事、媒介化叙事和诗意化叙事。科学化叙事中科学理性最强、技术想象最弱;媒介化叙事中实用理性最强、技术想象最强;科幻化叙事中则科学理性弱化、技术想象最强;诗意化叙事中科学理性适中、技术想象适度。从不同的叙事中窥到其中隐含的工具论前提。

工具论观念在科学化叙事中表现尤其明显,这种叙事强调人工智能是一个独特的工具。人工智能科学家李飞飞指出人工智能是一个文明意义强大的工具。人类文明发展的轨迹是我们创造工具,是为了让生活变得更好。当然,工具也可能被滥用,这就更需要我们思考如何使其更好地服务于人类。这正是李飞飞“以人为本的人工智能研究所”的根本理念。也正是因为人工智能是一个具有文明意义的强大工具,接下来的事情是尽早建立将人类福祉置于核心位置的理论框架。因此,以人为本的人工智能最重要的就是赋能于人的理念。在她看来,思考人工智能与人类的关系建立需要遵循两个原则:尊重人类的主体性和尊重人性。第一个原则是避免将人工智能作为主语,因为将人工智能作为主体会剥夺人类的主体性;第二个原则是开发和使用人工智能过程中,尊重每个人渴望健康、希望富有成效、渴望成为受人尊重的人的品性。在2025年法国人工智能峰会上,李飞飞提出了一个以人为本的三原则和人工智能治理框架。三原则给人印象深刻:尊严、能动性和社区;治理框架强调应该摆脱科幻、意识形态以及割裂化思维。摆脱科幻意味着把治理放置在经验的数据与严格的研究之上,强调人的理性;摆脱意识形态意味着要防止滥用误用,也是强调人的理性;防止割裂思维意味着要把人工智能看作是一个生态系统,开源才能发展。

在剩下的三种叙事中,都是反思工具论设定的。诗意化叙事和科幻化叙事中,将人工智能看作是工具的理解是被反思和批判的。海德格尔在《技术的追问》中重点批判了工具论的观念,强调了现代技术的集置本质。在集置中,人和一切对象都变成了持存物。从这一观念出发,人工智能作为现代技术的极致形式更是如此,成为“存在升级”的主导因。科幻化叙事更是突出人工智能和机器人的自主意识,这种叙事突出人与机器的对立,如果机器仅仅是一般工具,那么冲突无法达到极致。媒介化叙事对于工具论这一平淡观念也是拒绝的。出于对公众的引导,即便是承认工具论观念,也是把这种观念导致的社会效应最大化。所以,在四种不同叙事中,对于人工智能的理解存在着极大差异:从工具到主体。如果我们继续追问人工智能的工具性,那么面临的两个问题:人工智能是体现什么关系的工具?它是什么性质的工具?

人工智能是体现什么关系的工具?人工智能与使用者的关系一直是学者们讨论的话题。DeepMind根据通用性和成效将通用人工智能划分为笨手(no AI)、熟手(emerging,胜过一些)、能手(Competent,胜过50%)、专家(expert,胜过90%)、大师(Virtuoso,胜过,99%)、超人(superhuman)。我们可以看到辅助、增强、协同等三种关系都有所体现。熟手与能手意味着人工智能工具可以超出50%的一般人做事情,这对于使用者来说,发挥协同作用没有问题。因为在科研领域,已经胜过了大多数的研究生;协同的关系已经出现在专家层面,在这个层面,人工智能工具已经胜过90%的人。大多数的教授专家与人工智能工具可以分工协作,完成目标任务。还有一类大师,则会对使用者进行必要的指导。此时人工智能开始指导使用者,类似于导师。在这个划分中,笨手不仅不会产生帮助,还会减少使用者的效率。至于超人作用,还没有具体的论文进行研究。我们只能从文学作品中获得一些启发,人类要突破自己的感官和知识的限制,必须达到超人层面。在尼采那里,凡人则通过三级变形——骆驼、狮子和孩子——达到超人,能够实现权力意志的自由支配。

人工智能是什么性质的工具?我们从两个最常见的概念谈起:人工智能作为日常工具(tool)和人工智能作为科研工具(instrument)。在不同场景中,人工智能作为工具出现。如家庭场景中有扫地机器人、服务场景有迎宾机器人、商业场景经常见到咖啡机器人等。这些工具略有智能成分,实现特定功能。作为日常工具的人工智能和生活世界高度融合,成为很重要的辅助工具。但是人工智能作为科研工具则有极大的专业特殊性,可以看作是身体器官的延伸。比如在AI4ScienceAI4Social Science领域,人工智能是作为科研工具起到作用,在科学研究准备阶段、科学研究进行阶段、科学研究发展阶段以及成果分享阶段发挥着不同的作用。人工智能作为科研工具很容易让我们想到现象学的例子。现象学工具箱里有很多范畴工具。如今,人工智能已经表现出明显的现象学特性,因为众多的人工智能工具已经让学术研究者感到眼花缭乱,这在很大程度上增加了学术界的负担。此时,所谓的辅助、增强和协同作用反而大受影响,甚至会对研究者造成不必要的扰乱。

 然而,这种工具论的理解却存在着明显的问题。哲学上的反思在于如果是技术,那么工具可以被替换。因为需要不同,所以可以采用不同的工具。对于人工智能来说,如果是作为笨手、熟手和能手,这种替换的概率还是很大的。然而进入专家和超人层面,恐怕就不是那么容易更替的了。如今例如ChatGPTDeepSeek等大模型被使用顺手了,那么它很难被放弃,此时工具论的观念限制就会出现。约书亚·本杰明(Yoshua Bengio)从另外一个角度指出了工具论存在的问题。“很多人都希望人工智能可以成为工具。但智能体(Agent)作为一个自主的实体,有自己的目标,会自主选择如何实现这些目标,希望智能体成为工具就有些一厢情愿了。”在海德格尔看来,把现代技术看作是人类的活动和满足人类需要的方法的工具论观念并没有看到现代技术集置的本质特性,看不到现代技术呈现为一种天命。这种海德格尔式的理解对于人工智能来说始终触不到痛点。现在国内的学者看到了人工智能与人类的双主体特性、看到了人工智能具有的能动性这一关键点。赵汀阳看到了人工智能会演变为新的主体,带来新的存在论问题。主体意识觉醒或者能动性呈现是“新主体”独有的特性。“由于大量应用需求的推动,以及‘接受’评价原则的采纳及相关研究的深入和成果推广,人工智能技术的发展已形成了一种新的可能性:在不远的将来,某些人工智能产品或技术载体如情感交互机器人,会被部分大众接受为‘非人非物、亦人亦物’的第三种存在物。”非人非物的“第三种存在”是人工智能的独特规定性。所以从两位学者的论述中可以看出,人工智能作为新的主体、人工智能作为第三种存在都显示了人工智能具有的一种超越工具的规定性。这一转变让我们意识到对人工智能的工具论理解存在的局限。

对人工智能的工具论反思导致的可能性出路,我们要进行追问。很多学者开始提出人类与人工智能出现了一种共在、协同、协调的关系,在这种关系中,人工智能表现为具备甚至超越人类主体的存在,双方为了完成共同生存和进化而共在一个宇宙。为了适合这一规定性,人工智能需要新的规定性。

人工智能作为智能体(agent)存在,表现出能动性(agency)。在这一规定中,人工智能与环境、场景、语境形成了良性互动,能够适应环境的演变、对来自环境的危机作出及时反应,采取最优化行动。无论是在强调历史过去的人类数据构造的环境下,还是来自机器合成的数据构造的环境下,都能够作出上述行为。这一点意味着人工智能可以很好地利用合成数据,而不只是会产生模型崩溃这样唯一的结果。模型崩溃的担忧来自一种线性思维:机器在错误的数据基础上产生新的合成数据,无限下去,必然会产生灾难性后果。但是,错误的数据只是在传统人类中心立场下的判断结果,而非机器认可的数据。对于机器来说,数据是否可以识别才是有效的标准。就如同01形式的数据可能被解读,而其他形式的数据是无法被解读的,因此也就没有意义。此外,“无限下去”的设定如同回形针的设定一样,机器设计者不允许出现无限的情况,机器自身也不会允许自身无限无效率地运行下去。

此外,智能体与包括人类在内的环境因素必然会合成在一起。因此人工智能作为系统将是另一个重要的规定性。此处的系统并不是一个控制论系统,一个封闭式的机器依靠自动性运转,而是人类掌控着这个自动进程。此处的系统主要突出的是与智能本身无限繁殖特性相关的扩容性。但是对于智能系统来说,它会通过不同的接口(interface),其中最为主要的代表形式是应用程序编程接口,这是一种程序之间的接口。主程序随时通过特定的机制调取其他子程序。接口类似于人体的关节,使得不同的智能体程序产生关联,从而构成一个系统。所以人工智能系统是通过一种特定接口如应用程序编程接口实现行动的系统,只要赋予不同对象以接入的可能性,最终会实现万物互联的一个总体系统。

 因此,我们通过对人工智能工具论的分析最终展现了对人工智能理解的变化,反思工具论理解的狭隘,将作为智能体、系统总体的人工智能面貌呈现出来。在这个过程中,一种类似于第三世界的观念——“第三种存在”——被提出来,但是非人非物过于模糊。作为新的主体的人工智能始终是哲学阐述,也就是诗意化叙事的构造物,展现了构造智力自身的精细结构,同时人工智能具有人格这样的心理学阐述。人工智能系统被视为人格所需的三个核心条件:自主性、心智理论和自我意识。可以说让我们感受到对人工智能在内的智能科技有了一个总体把握。而在智能科技与数智时代的变迁中,生产力与生产关系也获得了进一步分析的智能化背景。

二、数智时代生产关系与生产力关系模式的四种类型

“形成与新质生产力相适应的生产关系”是最近理论界讨论的问题。但是从历史角度看,生产关系与生产力的关系问题一直以来都是学术界关心的问题。20世纪60年代前后,中国学界曾有过一场生产关系与生产力的关系的讨论。李达指出劳动过程涉及劳动者、劳动工具和劳动对象等三个要素;“人类的劳动”是社会的劳动,具有社会性、在基于人的社会关系中进行,人类劳动的特征贯穿在各个历史形态中;相比之下,经济学领域则讨论生产关系与生产力的关系问题。这个时期以农业为例,呈现出生产关系走在了生产力前面的特征。

我们将在不同情况下考察生产关系与生产力的关系问题的不同模式,最终指向与新质生产力相适应的生产关系如何理解?“不同情况”是一个权宜称呼,它指代我们对生产关系与生产力的反思要建立在人工智能理解的嬗变逻辑下理解。当人们把人工智能看作是一般工具时,理解依然处在传统生产力阶段;当人们意识到工具的增强性,有着一种突破的可能性;但是只有人们充分理解人工智能具有的能动性规定,也就是说突破了工具论思维时,我们才可以说进入新质生产力的了解中。我们将通过四象限构筑生产力与生产关系的框架便于展开分析。

 第一种情况是传统生产关系与传统生产力的关系问题。传统生产力主要是指与农业时代、工业时代相适应的生产力。从动力形式来说,比如来自畜力、蒸汽动力和电力。当前人力被比喻为牛马,这在一定程度上将人还原到自然力。人在无技术装备的情况下,靠体力来进行劳动,那么还是停留在自然层面。蒸汽动力和电力是来自于人工的力量,或者是所谓的工业技术的力量。与这种生产力共在的生产关系就呈现为二元的关系,比如奴隶与奴隶主、农民与地主、工人与资本家。从劳动过程来看更为清楚。劳动主体是作为依附个体的人,或者是没有技术装备或者有技术装备;劳动对象是实在对象,比如种植农产品和生产工业产品;劳动工具是无智能的工具,只是按照物理原理组装的工具而已。从适应关系的性质来看,这种关系是一种非实质性适应,其实质是一种比喻性描述。畜力、蒸汽动力、电力的使用之后出现二元社会关系的划分,人们会想当然地将二者看作是因果关系。但是这或许类似于原始思维的效果,把两个相继出现的现象如布谷鸟、春天看作是具有因果关系,而忽略了对其内在关联的阐述。

 第二种情况是新型生产关系与传统生产力的关系问题。这种关系状态下,生产力依然是传统的,比如自然能源消耗型的技术占主导,如石油、畜力在社会中继续使用。但是生产关系会发生变化,因为随着社会制度的变化,二元结构本质上发生变化,随之进入的是一种来自外在影响的新型生产关系的出现,比如合同关系的出现。这种关系是现代社会变迁的产物,合同作为一种新的形式成为维护人与人之间权益的方式,受到当事人意愿决定和时间的限制。原先的二元层次之间存在着生死冲突的可能性,而且在常规时期,双方默认了不可变更,只是在特殊时期才出现反抗。新的二元形式中,主体具有了自由选择的可能性。从动力形式来说,没有变化,依然处在工业时代或者农业时代;从劳动过程来看,首先劳动者发生了变化,作为独立个体的人开始出现,可以按照理性作出自由选择,而且能够获得一定技术的加持;劳动工具、劳动对象与上述基本相同。从适应关系来看,新的生产关系开始呼吁新的技术的合理运用,具备理性的人利用老的技术。理性的人与老的技术始终表现出各种不适应性的冲突。

 第三种情况是传统生产关系与新质生产力的关系问题。新质生产力是随着信息技术、智能技术等新兴技术出现而形成的范畴。新质生产力不仅是技术类型上的新,而且也是性质上的新。如果是技术类型上的新,那么只可以成为新型生产力,更多是表达了生产力的指向上的新,体现了科技的伦理关怀,如科技向善、智能向善;如果是性质上的新,也体现了指向构筑人民的美好生活,如通过各类数字技术可以确保数字福祉、通过智能技术可以构筑未来智能化生活,做到智能养老、智能护幼。但此时,生产关系落后于生产力的变化。以自动驾驶汽车为例,旧有的法律无法考虑将汽车看作是责任主体,所以面对自动驾驶汽车的事故责任划分时显得力不从心;还有智能科技提出许多全新的问题,而现有的法律制度没有办法应对这种变化。所以这种落后是非常明显的。而新的技术创新需要更好的法律法规加以保护和约束。从劳动过程来看,劳动主体没有发生一些变化,停留在自由选择的个体层面,但是劳动主体必须意识到人类与智能工具之间具有的多种复杂关系;劳动工具带有了一定的智能性,称之为具备智能的工具。按照Deep Mind的划分,进入了熟手、专家,甚至大师的水平。人工智能语言模型在感知道德专业知识方面可与专家伦理学家相媲美,也就是说达到了专家水平。劳动对象出现了很多新的形式,如数字劳动对象、机器劳动对象等。

   第四种情况是新型生产关系与新质生产力的关系问题。在这种关系中,新型生产关系可以从多个方面进行呈现。劳动主体不但有自由意志,还有更强大的推理、感知和记忆能力,甚至抵达超人状态,这是增强人类的问题。增强人类将成为新型生产关系的一个重要变化。增强人类可以从两个层面进行理解,其一人类利用药物、神经技术和智能技术对个体的增强,从而出现所谓的增强人类,这种增强技术与人类的融合是永久性的或者是无法断开的连接。这个维度的极致形式就是超人的出现。而且不是比喻意义上的超人。其二是人类借助各种智能增强工具实现的增强,个体可以作出选择能够断开连接。此外,生产关系中出现了新的关系形式,如机器人同事、虚拟同事或者增强同事。这种关系无疑是新鲜的,机器人超强的同理心、超强的推理能力会给人类造成倒逼。大模型在社会情境判断方面可以胜过人类。社会情境判断(SJT)是一种标准化的心理测试工具,提供行为选项,让参与者选择最适当与最不适当的行为。这意味着在人机共存的关系中,机器能够优于人类进行情境判断并处理好社会关系。当然未来工厂甚至可能出现的情况是人类完全退场,工厂原先人声嘈杂的情况不再有,只剩下自动机器运转的声音;黑夜不再有人需要加班,不再有灯光。因为机器无休止的运转,不再需要所谓的光源。原先的适用关系将会有实质性适应作为内涵充实起来。与原先的比喻性适应不同,这种适应已经有各种关系类型开始呈现出来,比如智能契约关系用来约束超级人类与超级机器、共在关系引导人类与超级智能体的相处等。在这种关系中一切都是全新的有待于讨论的问题。

三、智能增强工具的本质与新型生产关系变革

总体来说,数智时代下构建适应新质生产力的生产关系要对劳动主体和劳动工具的新特征有认识。在这一基础上,才能理解劳动过程发生的性质变化。

首先,劳动过程出现性质的变化。人类劳动的社会性、基于人类关系进行的两种性质会发生逐渐地改变。如果人工智能作为一般工具性存在,那么在新型生产关系的构建时,“人类劳动”或者劳动的主体依然是没有本质变化的,这种劳动依然是基于人-人的,具有社会性、属人性。因为工具无法改变使用者的本质规定,所以这种社会性和属人性依然是不变的,在问题出现时或者责任的承担上,依然是使用者承担责任。“在人工智能发展中的‘对齐问题’上,人工智能带来的危害从根本上说来自于人工智能的研发者、制造者和使用者。因此,需要规范和约束的不是人工智能技术本身,而是研发、制造和使用人工智能的人。”在赛博格主体下,劳动性质还保留社会性、与人相关,但是已经变得微弱;而在纯粹的机器主体下,劳动的社会性、人际性会完全消失。因为对于机器而言,社会性是不存在的。机器与机器之间只是系统构成的关系,从本质上看,是功能耦合的结果,没有社会性可言。而没有社会性、属人性的劳动关系不存在。但是生产关系依然会存在。因为机器生产创造的价值却是实在的。就如同数字流量带来财富可以进入流通领域,购买商品。但是数字流量本身却没有任何的属人性。

其次,劳动主体会发生两个方面的变化。一方面,人类劳动主体依然存在。人类在通用目的工具或者通用人工智能的加持下实现增强,这也就是上面所说的智能增强。智能增强会以两种形式与人类实现融合,嵌入与非嵌入。未来主体会成为赛博格形式,比如利用脑机接口进行融合;还有装着外骨骼设备进行各种劳动。利用大模型实现增强,能够处理额外的任务;另一方面,机器劳动主体逐渐涌现。自动机器、智能决策系统会逐渐取代传统人类角色而变成劳动主体。比如在一些工厂已经出现了智能安全检查员取代了人工检查。劳动主体成为机器或者平台,比如在生产中人工智能利用合成数据生成新的数字产品。人工智能科学家的出现就属于这种形式。在生物医药领域,人工智能科学家在虚拟实验室从事科研工作。诸如DeepSeek等可以撰写科学论文等。目前以DeepSeek-R1为代表的开放模型用于科学研究的尝试已经从这里开始了,覆盖数学和神经科学研究。“选题包括生物信息学、计算化学、认知神经科学等。”这些都说明知识生产主体发生的变化。如果人工智能作为agent存在,生产关系的变革就成为必然。从生产关系的主体来看,会出现新的主体形式。

 (1)独立个体:人-机、机-机。比如我开着一辆自动驾驶汽车,借助车上的导航装置行进。在这个常见的现实场景中,人与汽车相对,人类司机控制着车辆,去往人类设定的目的地。如果是一般的非智能汽车,那么掌控权完全在人手中,当然,出现问题也只是司机走神或者疏忽犯错。但是如果是L3级别汽车,L3自动驾驶指的是在特定条件下,车辆能够完全自主驾驶,驾驶员可以在系统请求时接管车辆。这种级别的自动驾驶被称为“有条件自动化”,因为它依赖于特定的场景,如高速公路,在这些条件下系统可以完全接管驾驶任务。在高速路上,驾驶系统掌管驾驶任务。此时驾驶系统掌管汽车就成为另一个关系模式。如果是L4级汽车,那么要求系统在其设计运行条件下持续地执行全部动态驾驶任务并自动执行最小风险策略。在这种关系中,驾车的人与汽车是可分离的,我们称之为独立个体。

 (2)复合实体:在复合主体中,会出现多种类型,比如人-机与人、人-机与机、人与人-机、机与人-机。因此,生产关系会出现非人的形式,比如人机协同关系、人机协调关系、人机共在关系等。与新质生产力相符合生产关系类型根基不是单个实体,而更可能是人-机融合的存在对象。

第三,劳动工具也会发生变化。然而,我们想说的是,这种成见需要反思。当我们站在人工智能的另外一个规定性上,这种成见的牢固性就会发生变化。按照陈小平的看法,人工智能产品是非人非物的第三类存在。大胆设想一下,第三类存在最终会以超级智能的形式出现。本文指出,要认识到人工智能作为工具性存在特征,因为在伦理规范的范围内,人类的主导地位始终要确保,而人工智能的辅助作用就要保持着;还要认识到人工智能的主体性变化。无论人们是否承认,人工智能作为新主体的齿轮已经发生转动,趋势难以避免。有两种力量在推进这个转动。一些学者通过赋予人工智能的人格、道德地位、自我意识来确保其主体性。另一些学者较为聪明地将这个问题转变为准主体或者拟主体来处理,认识阻力没那么大了。但是一切都是悄然在发生变化。

第四,劳动对象也会发生极大的变化。以能源开采为例,以往是开采地球自然资源,如石油、天然气、煤炭,或者利用风能等,自然资源是实体对象。但是数智时代中劳动对象会成为数字对象。在这种情况下,数据就变成了资产,变成了财富。如果一个公众号能够吸粉10万人以上,就能够带来明显受益。不少平台也给出免费、各种各样优惠措施来吸引用户,用户的数据就构成了保障。因此,数字经济成为与实体经济相并列的新的经济形式,生产劳动对象也变为数字对象。从劳动对象来看,虚拟对象开始层出不穷,比如各类数字产品开始出现。笔者曾经在上海当代艺术博物馆看到一个数字艺术作品,艺术家把观众看新闻产生的微表情用3D打印设备打印出来,从而作为展品放在场馆中展览。倘若能够进入商品流通,恐怕每个个体都要回购自己的情感数字品。勒汉·埃拉舍科(Reham A.Elsheikh)等指出,可以采取创新的深度卷积网络(AA-DCN)模型识别出包括愤怒、悲伤、快乐、轻蔑、厌恶、惊讶、恐惧和中性等八类情感。从适应关系角度看,传统的个体关系根本无法与新质生产力相适应。

从上面分析看出,劳动主体、劳动工具和劳动对象的变化意味着劳动过程的性质变化。这种变化表现为劳动主体从人到非人的变化的性质变化,劳动对象从实在对象变为数据对象的变化,劳动工具从单个的实体变为与人的融合形态的变化,而这影响新型生产关系的构建。这种关系中机器主体、赛博格主体将成为新的形式,影响着生产关系的构建。

  四、超工具人工智能的哲学根据与新型生产关系构建

 如果我们接受本杰明·约书亚的观点,很多人坚持的“人工智能仅仅是工具”的想法只是一厢情愿。我们需要做的是通过澄清人工智能多于工具的规定性内容让这些一厢情愿的人认清现实是什么。当这一点澄清之后,对于适应于新质生产力的生产关系讨论就有了一个全新的出发点。正如上面论述的,人工智能超出工具性的理解有三个方面内容,而且我们也可以为这三种理解找到合适的哲学根据。

从技术本身看,人工智能成为智能体,智能体是实体,能够自主选择目标,自主决策并且选择实现目标的方式。在这一观点中,自主性成为关键的哲学概念,它是人工智能进行感知、决策和行动的一个重要特征。从传统人工智能系统中,学习过程是有人类监督的学习过程,人类对数据进行标注,然后人工智能机器进行学习,所以标注行为的主观性很容易演变为人工智能的偏见;在决策中,人类的主导地位不容撼动,机器决策的天花板就出现了。但是在智能体的情况下,学习过程变成了无监督学习、机器决策变成完全自主。以具身智能机器人为例,新一代的机器人将通过现实生活中实际人的行为进行模仿学习,而这以前是通过视频数据完成学习。在这一情况下,辛顿的担忧也就变得可以理解了。因为人类的行为存在极大偶然性,人性的复杂使得行为变得难以理解,如果机器可以在现实中模仿并超越,那么的确危险很大。

从哲学角度看,人工智能是主体,具有意识、自主性。更为重要的是,计算机科学界已经开始介入意识问题的讨论中。谭铁牛指出,“通用人工智能旨在研制出具有与人类相同智能水平乃至超过人类智能水平的机器,甚至可能使机器拥有自主意识”。这一观点刺激了科学界,与辛顿对话的周伯文指出,“这一个观点可能让在坐的许多研究者感到惊讶” 。同时也激励了哲学界,因为意识问题关乎概念的理解,而且反思性极强,辛顿指向的是使用词语的一套理论,人们可能正确地运用某个词语,但是理论也可能是错误的。有意思的是,李飞飞拒绝这一概念的使用。她认为人工智能利用了先进的数据学习、模式识别,重要的是理解,而意识是一种科幻想象中的东西。辛顿与李飞飞之间表面是对立的,但深层却是一致的:对意识的非实在论设定。对于辛顿而言,意识是概念的理解和运用;对于李飞飞而言,意识是科幻的想象或者是形而上学的想象结果,她的态度让我们想起了牛顿。物理学要远离哲学。所以说,这两个人目前越来越清晰地表现出来一种认识张力。但是意识的说法带有太强的形而上学色彩,并且与智能科学的实证研究方法形成了鲜明的冲突。尽管意识的说法具有吸引力,但是关于意识的讨论框架极具冲突性。这种冲突性大大影响观点的可用性。最为重要的是,这种认识并没有将人与机器的关系纳入其中,而依然是把二者看作割裂的两级。

 从系统看,人工智能作为系统存在,这种理解不显山露水,但是却慢慢浸润到社会肌体内部,以一种深度智能化的形式表现出来。在这个过程中,有些对象是以不同形式、不同层次纳入系统,比如程序员利用应用程序编程接口在另一个系统中嵌入其他应用程序,用户使用母体APP进行一个平台,然后无数个APP嵌入在母体上,就让我们想到藤壶附着在鲸鱼的身体上。这个母体最希望产生的行为是无数个体涌入系统深处,这将是一个没有底、可以无限突破的过程。我们可以在西蒙栋(Gibert Simondon)和埃吕尔(Jacques Ellul)的技术哲学中找到哲学根据。这两位在人工智能的系统理解上提供了哲学根据。西蒙栋通过元素(element)、个体(individual)、组装(ensemble)等三个范畴完成了技术物系统的构建。这种观点认为技术物自身呈现为一个系统,比如复杂的汽车、电话等都是不同技术个体组装的结果。然而这个系统却是自封闭系统,而与社会没有链接起来。比如已开发的、但未普及使用的技术物或者已经为社会淘汰的技术物品,甚至演变为其他意义形式存在的技术物品。此时,技术功能完全丧失,尽管其作为技术组装的形式尚在,但是已经完全丧失了技术物的特征。埃吕尔的哲学则使得技术物系统和社会系统链接起来,构成了一个更大的系统。技术物从来不是一个单独的存在,它必须和社会系统以不同形式整合在一起。以基础设施的形式成为社会运行的物质基础。以城市智能治理为例,首先,视频采集系统布局城市角落,这是智能体的感知来源;其次,视频对象的数据进入到数据中心,进行数据分析智能化处理,这是决策的基础;最后,智能机器采纳数据中心给出的数据进行智能化行动,比如智能红绿灯与自动驾驶汽车。这个系统作为基础设施而存在。此外,以智能辅助工具的形式成为人们决策的一个重要伙伴。现在的导航系统、各类APP都是如此,能够辅助人类实现自己的目标。

人工智能新的认识内涵已经为我们反思新型生产关系提供了一个完全不同的基础。从总体上看,劳动过程智能化嵌入深度逐渐变得明显,劳动过程的社会性与属人性开始消失;劳动主体也出现了和智能机器协同的新形态,这种协同不仅仅表现在劳动层面,而且还表现在日常相处,一种新的伙伴关系会阻碍或者刺激劳动的效率;劳动工具的智能化程度开始加大甚至变成了主体,这种新主体会成为他者,嵌入原有劳动者的自然身体或者社会身体中;劳动对象也成为虚拟存在,而处置虚拟劳动对象将成为一种常态。这四者会影响到新型生产关系的整体构建。因此,新型生产关系的构建必须要考虑整个劳动过程、主体、工具和对象的改变。

阅读原文

跳转微信打开

江苏省修辞学会2026年年会暨第二届语言战略与话语修辞国际学术研讨会(三号通知)

2026年4月9日 09:01

徐惠 2026-04-09 09:01 江苏

苏大7月办修辞学国际研讨会,设青年优秀论文奖,5月31日截止报名。

转载自“江苏省修辞学会”


会议通知

为推动我国中西修辞学界的深度对话,探索在全球化和跨文化背景下修辞学发展的新路径、新范式,进一步深化语言战略与话语修辞研究,江苏省修辞学会拟于20267在苏州举办江苏省修辞学会2026年年会暨第二届语言战略与话语修辞国际学术研讨会。会议由江苏省修辞学会主办、苏州大学外国语学院承办、西交利物浦大学语言学院和苏州城市学院协办。会议主题为:中西修辞研究的交流互鉴。届时,大会将邀请国内外知名学者做主旨发言,并组织专题论坛。

一、会议主题

中西修辞研究的交流互鉴

主要议题

包括但不限于以下议题:

1)话语、修辞与社会变革

2)修辞学跨领域融合研究

3)中西修辞史研究

4)中西修辞教育研究

5)“修辞能力”研究

6)中西修辞范畴研究

7)中西修辞批评研究

8)修辞与传播研究

主旨发言专家(音序)

1)Angeliki Athanasiadou (希腊塞萨洛尼基亚里士多德大学教授)

2)Randy Harris (加拿大滑铁卢大学教授)

3)Mark Turner (美国凯斯西储大学学院教授)

4)皇甫素飞(淮阴师范学院教授)

5)鞠玉梅(齐鲁工业大学教授)

6)苗兴伟(北京师范大学教授)

7)束定芳 (上海外国语大学教授)

8)谭学纯 (福建师范大学教授)

9)袁影 (苏州大学教授)

10)祝克懿(复旦大学教授)

11)宗守云(上海师范大学教授)

主编论坛(音序)

1)方小兵(南京大学教授、《中国语言战略》主编)

2)高群(阜阳师范大学教授、《阜阳师范大学学报(社会科学版)》“修辞学论坛”主持人)

3)束定芳(上海外国语大学教授、《外国语》主编)

4)王军(苏州大学教授、Language and Semiotic Studies主编)

二、优秀论文奖

本次会议面向四十岁及以下的青年学者设置优秀论文奖,获奖者将颁发“王希杰修辞学奖”,并获得由袁氏奖励金赞助的奖金。申报参评者(包括青年教师、博士后、博士及硕士研究生)需成为江苏省修辞学会会员(填写会员申请表并发送至表中指定邮箱)(附件1)并提交论文全文及参会回执(附件2)。申报截至时间:2026531日。

提交邮箱:soochow2026@126.com

三、时间和地点

会议时间:

2026710日报到,711-12开会,712离会。

会议地点:

苏州大学(天赐庄校区)

四、会务

普通参会人员会务费为800/,全日制学生凭学生证减半。用餐由组委会统一安排,住宿与往返交通费用自理。

五、联系方式

会务邮箱:soochow2026@126.com

请有意参会者将参会回执(见附件)于2026531日前通过电子邮件发送至会务邮箱。论文摘要经专家评审合格后,会务组将发出正式邀请函。

江苏省修辞学会
苏州大学外国语学院

  202647

附件下载

比特人文

投稿邮箱:dhbase@126.com

扫码关注 获取更多资讯

图片

阅读原文

跳转微信打开

Received yesterday — 2026年4月9日学术机构(中国大陆)

論文徵集 - 第四屆粵港澳大灣區跨學科博士論壇:數字驅動的社會公平:技術、身份與人文的研究

2026年4月8日 10:31

澳大高研院 2026-04-08 10:31 广东

以下文章来源于:澳大高研院UMIAS

澳大高研院UMIAS

澳大人文社科高等研究院(簡稱高研院)是澳大於2019年底成立的學術單位,致力打造跨越學院疆界的校級研究平台,建設澳大在人文範疇的跨學科國際水平研究團隊,實現學術資源協同效應的戰略佈局。

澳門大學人文社科高等研究院(高研院)現就「第四屆粵港澳大灣區跨學科博士論壇:數字驅動的社會公平:技術、身份與人文的研究」進行論文徵集,誠摯邀請

由澳門大學人文社科高等研究院主辦的第四屆粵港澳大灣區跨學科博士論壇現已正式啟動徵稿。本屆論壇以「數字驅動的社會公平:技術、身份與人文的研究」為主題,延續前三屆論壇推動跨學科對話的宗旨,致力於搭建一個回應全球性挑戰、探索未來發展方向的重要學術平台。在數字化快速發展的當代,數字驅動的社會公平已成為我們共同面對的重大課題。我們需要深入剖析技術系統中隱含的權力結構,審視數字身份如何重塑公民權利,並在工具理性之外重新確立人文關懷與社會責任的價值坐標。本屆論壇將繼續促進跨學科視野的融合,匯聚人文、社會、科技等多元領域的智慧與方法,共同探索兼具有創新意義與實踐可能的研究方案,為建設可持續、公平且包容的未來社會貢獻學術力量。

論壇目標

本屆論壇面向在讀及即將畢業的博士生,議題涵蓋人文、社會科學、自然科學與技術科學等多個學科領域,旨在為青年學者提供一個跨學科交流與合作的平臺。參與者將有機會展示研究成果、交流學術思想,並與不同領域的青年學者及知名專家深入對話,獲得寶貴的建設性意見。論壇不僅能促進學術思想的碰撞,還致力於構建跨學科的學術網絡,拓展青年研究者的學術視野,建立長期合作關係,並以創新觀點回應全球面臨的挑戰。

論壇分議題

(包括但不限於以下方向)

  • 數字素養

  • 數字公平與政府治理

  • 數字身份與公民權利

  • 數字正義與平台勞動

  • 數字福祉與社會

  • 算法偏見與排斥

  • 公平機器學習實踐

  • 量子計算與法律

鑒於議題的廣泛性,論壇將設置中英文雙語分論壇,以確保來自全球的學者能充分參與與交流。

投稿與參會指南

1. 稿對象

歡迎所有在人文、社會科學、自然科學、技術科學等領域從事研究的在讀及即將畢業的博士生投稿。

2. 論文要求

  • 語言:英文或中文

  • 篇幅:7,000 – 10,000字

  • 格式要求

  • 英文稿件請遵循『牛津格式』(Oxford Style)。相關寫作規範請閱讀全文

  • 中文稿件請參照『南國學術-澳門大學學報』。相關寫作規範請閱讀全文。

  • 投稿形式:請掃海報上的二維碼,填寫個人資料並提交論文全文及個人簡介。

  • 原創性:論文須為原創且未發表,組委會保留查重與學術審核之權利。

  • 入選優秀論文將有機會在人文社科高等研究院出版之刊物『數字素養研究』中審議發表。

3. 個人簡介

  • 字數:150-200字

  • 語言須與論文一致(英文或中文)

  • 含作者學術背景、研究興趣及近期成果

4. 保密條款

  • 組委會承諾對所有提交的論文與個人資料嚴格保密。

參會事宜

1. 免費參會 

  • 本次論壇對所有參與者免費開放,不收取任何參會費用。

2. 優秀論文評選與現場報告

  • 組委會將評選出優秀論文,並邀請作者於論壇期間在澳門大學現場匯報研究成果。受邀報告者之在澳期間住宿及餐飲費用將由組委會承擔。

重要日期

  • 5月31日:徵稿截止日期

  • 6月15日:入選通知

  • 8月26日至27日: 論壇舉辯日期

聯繫方式

有關高研院更多內容,請訪問高研院網站:https://ias.um.edu.mo/。如果您有任何疑問,請通過電子郵件的方式隨時與我們聯繫:ias.phdforum@um.edu.mo

我們誠摯邀請各位博士生踴躍投稿與參與,共同在技術與人文的交匯處,探尋數字時代的公平與未來。

阅读原文

跳转微信打开

转载 | 交叉前沿:AAAI2026:Convergent Semantics for Weighted Bipolar Argumentation

2026年4月8日 10:31

2026-04-08 10:31 广东

近年来,哲学系积极推动学科交叉发展,成立了多向度心灵与智能跨学科研究创新团队等一批面向交叉前沿的平台与团队。近期,中山大学哲学系、逻辑与认知研究所王宗顺博士后与沈榆平教授合作的成果《Convergent Semantics for Weighted Bipolar Argumentation》被人工智能国际学术会议AAAI 2026接收为(ORAL)论文并作现场报告。

会议信息

国际先进人工智能协会年会(AAAI Conference on Artificial Intelligence,简称AAAI)是人工智能领域历史最悠久、最具影响力的国际学术会议之一,也是中国计算机学会(CCF)推荐的A类学术会议,在全球人工智能学术界和工业界享有盛誉。会议涵盖人工智能的广泛方向,包括机器学习、知识表示与推理、自然语言处理、计算机视觉等议题。

论文简介

形式论辩是人工智能中用于处理复杂情境的非单调推理模型,现已成为知识表示与推理的重要范式。加权双极论辩框架是该领域内最具代表性的工作之一。在该框架中,多主体论证场景被刻画成带权有向图,论证点之间的边可表示支持或攻击关系。由于全面的表达能力,该框架被广泛应用于互动推理、信息决策以及可解释性人工智能等场景。然而,由于交互关系的复杂性,尤其是在含圈结构的论证图中,如何定义合理收敛的推理语义,成为该领域中一个长期开放问题。针对此问题,本文提出利用论证的接受度与拒绝度分别刻画论证间的支持与攻击关系,进而定义了一类新的推理语义,并从理论上证明其在任意加权双极论辩框架中均能稳定收敛。实验结果表明,该语义在计算效率方面具有良好表现。本工作为形式论辩领域的理论与实践提供了一种重要基础。

Abstract: Establishing convergent semantics for weighted argumentation graphs is a long-standing fundamental issue. Particularly, it is challenging to develop convergent semantics for weighted bipolar argumentation graphs (wBAG), which include both support and attack relations on weighted arguments. Existing semantics in the literature are not general enough in the sense that they only apply to acyclic graphs or special cyclic cases. In this paper, we provide an elegant solution to this issue by adopting the so-called bilateral gradual semantics, so that the strength of arguments can be defined as the limits of iterative functions that always converge for any wBAG including cyclic ones. A preliminary experimental analysis shows that our semantics appear quite efficient in calculating argument strength. Overall, this paper offers a solid and promising foundation for weighted bipolar argumentation in theoretical and practical aspects.

作者信息

王宗顺(第一作者),中山大学哲学系、逻辑与认知研究所博士后,研究方向为形式论辩、知识表示与推理,研究成果发表于AAAI、Journal of Logic and Computation、CLAR等人工智能与逻辑学重要会议及期刊,曾获“2025年中山大学优秀博士学位论文”等奖励。

沈榆平(通讯作者),中山大学哲学系、逻辑与认知研究所教授,研究方向为逻辑与计算、知识表示与推理,代表成果发表于ACM Transactions on Computational Logic、AAAI、KR等人工智能与逻辑学重要会议及期刊。

文章来源:中山大学哲学系

编辑:陈旖旎

初审:蔡一峰

复审:林  耿、陈诗诗

审定发布:张  伟

阅读原文

跳转微信打开

重磅 | 教育部、国家语委规范《机器合成普通话水平测评等级标准及测评大纲》全文(附下载链接)

2026年4月8日 09:02

教育部、国家语委 2026-04-08 09:02 江苏

教育部、国家语委发布两项语言规范,明确机器合成普通话测评标准,全文可在官网下载。

近日,教育部、国家语言文字工作委员会正式发布两项语言文字规范:《机器合成普通话水平测评等级标准及测评大纲》和《人工智能 语料库 基础术语》,标志着我国在人工智能语音技术与语言规范融合发展方面迈出关键一步。

其中,《机器合成普通话水平测评等级标准及测评大纲》规定了机器合成普通话水平的等级标准和测评大纲,适用于机器合成语音的普通话水平测评,可用于技术研发、产品优化及应用评价。该规范首次从国家规范层面对相关测评体系进行了系统构建,对推动智能语音技术高质量发展具有重要意义。

规范全文现已在教育部官网发布,可通过以下链接获取:

http://www.moe.gov.cn/jyb_sjzl/ziliao/A19/202604/t20260407_1433014.html

比特人文

投稿邮箱:dhbase@126.com

扫码关注 获取更多资讯

图片

阅读原文

跳转微信打开

重磅 | 教育部、国家语委规范《人工智能 语料库 基础术语》全文(附下载链接)

2026年4月8日 09:02

教育部、国家语委 2026-04-08 09:02 江苏

教育部、国家语委发布语料库术语规范,统一界定概念,全文可在官网下载查阅。

近日,教育部、国家语言文字工作委员会正式发布两项语言文字规范:《机器合成普通话水平测评等级标准及测评大纲》和《人工智能 语料库 基础术语》,标志着我国在人工智能语音技术与语言规范融合发展方面迈出关键一步。

其中,《人工智能 语料库 基础术语》聚焦语料库领域的基础概念与核心术语,对相关术语的定义、内涵及使用范围进行了系统规范,旨在解决当前语料库建设与应用中术语使用不统一、概念界定不清等问题。该标准面向人工智能语料资源建设与应用需求,构建统一、规范、可复用的术语体系,是语料工程领域的重要基础性规范。

标准全文现已在教育部官网发布,可通过以下链接获取:

http://www.moe.gov.cn/jyb_sjzl/ziliao/A19/202604/t20260407_1433016.html

比特人文

投稿邮箱:dhbase@126.com

扫码关注 获取更多资讯

图片

阅读原文

跳转微信打开

Received before yesterday学术机构(中国大陆)

博士生论坛第五十八期|大规模石窟寺全链条数字化保护的技术路径与跨学科应用研究

2026年4月7日 12:34

2026-04-07 12:34 湖北

大型石窟寺作为不可移动文物的典型代表,其数字化保护面临空间跨度大、形制复杂、数据量庞大等核心挑战。本报告系统性提出一套全链条数字化解决方案。

👆👆👆点击蓝字 · 关注我们

摘要:大型石窟寺作为不可移动文物的典型代表,其数字化保护面临空间跨度大、形制复杂、数据量庞大等核心挑战。本报告系统性提出一套全链条数字化解决方案:首先,通过多源数据融合技术,构建兼具高空间精度与视觉真实感的三维模型,突破单一采集手段局限。其次,建立覆盖崖面与洞窟的全局时空基准,实现超大规模石窟整体数字化与细节的统一。再次,借助众源云端快速重建技术,利用云计算高效处理海量数据,推动数字化工作常态化与便捷化。最后,聚焦超高精细度记录,极限还原文物表面微痕与凿刻技法等关键信息。该方案旨在为石窟寺构建科学、动态的“数字档案”,支撑其从基础记录向数字考古、虚拟修复及智慧管理的跨越式发展。

跨学科合作方向:该研究主题未来的跨学科合作方向应以“数字模型”为纽带,深度联动测绘遥感、考古学、计算机科学与艺术保护等领域。依托多源数据融合与超高精细度记录,可联合材料工程学科,对石刻的细微病害进行科学模拟与预警;同时,结合超大规模整体数字化与云端快速重建带来的高效能,协同大数据技术实现海量文化资产的智能管理。这种深层次的交叉协同不仅能将数字化成果从“静态档案”转化为“深度知识库”,辅助考古研究中的空间演变探索与残损虚拟复原,更将为数字人文视角下的遗产价值阐释与公众沉浸式传播提供坚实的实证基础,推动文化遗产保护从传统的“经验驱动”向“数据驱动”的智能时代跨越。

主讲人张雯靖

武汉大学历史学院博士研究生

时间

2026 年 4 月 10 日 11:30-13:00

地点

人文社科楼 B305 会议室

腾讯会议:775-6968-3346

主办单位

武汉大学文化遗产智能计算实验室(教育部哲学社会科学实验室)

武汉大学大数据研究院

线下参会报名方式

扫描下方二维码填写报名表:

欢迎参与

编辑 | 文化遗产智能计算实验室

审校 | 刘争

           武汉大学人文社科楼       

阅读原文

跳转微信打开

徐永明 | 明代文学文献的数字化、结构化和智能化

2026年4月7日 09:01

徐惠 2026-04-07 09:01 江西

文章围绕明代文学文献,阐述其数字化、结构化与智能化的现状、实践及意义。

转载自《中国韵文学刊》2025年第4期

明代文学文献的数字化、结构化和智能化

徐永明

【作者简介】

徐永明(1967—),男,浙江遂昌人,浙江大学文学院教授,研究方向为明代文学、数字人文。

摘要

明代文学文献的数量在1万种以上,然而影像数字化和文本数字化的工作依然任重道远。在大数据和人工智能时代,文本的结构化和智能化也提上了日程。结构化的数据,可以计量统计、定位查询及可视化呈现,同时,结构化的数据与文本结合,可以进行数据关联,为文本的阅读扫除障碍。AI通用大模型的引入,可以与专业数据结合,提升知识问答的准确率,激活学者的研究成果,而AI创意视频与古代文学的结合,则大大加强了古籍的活化利用,提高了学生学习古代文学的兴趣,促进了传统文化的普及和传播。

关键词:明代;文学文献;数字化;结构化;智能化;AI

在数字化时代,人们常见的文献形态,有纸质文献、金石文献、数字文献等样式。其中数字文献,又有影像数字文献、文本数字文献、结构化数据、智能数据等。基于芯片的数字文献,在算力、算法、模型等的加持下,在我们的学习和生活中,产生了越来越重要的影响。我们的祖先,给我们留下了浩如烟海的历史典籍,如何有计划地将这些典籍数字化、结构化和智能化,是我们这一代乃至几代人的历史使命。下面,笔者就明代文学文献的数字化、结构化和智能化谈点个人的观察和实践。

一  明代文学文献的数字化

根据《中国古籍总目·集部》的著录,明代楚辞、别集、总集、词集、诗文评及戏曲的著述有9600余种,如果再加上《中国古籍总目·子部》“小说类”1000余种的著述,则明代文学文献的数量有1万余种。当然,这不是明代文学文献的全部,因为《中国古籍总目》主要是几个大馆的联合目录,不能真正反映明代文学文献的全貌。国家后来启动的“全国古籍普查”项目已告一段落,各馆的古籍登记目录在陆续出版中。古籍普查结果显示,现存古籍总数为20余万种,比《中国古籍总目》的17余万种,多出3万余种。就明代文学文献来说,估计数量会有些增加,但总数应在15000种以内。 

根据国家图书馆原馆长张志清的说法,截至2025年,国图网站发布的数字化影像古籍大约有13万部。如以现存20余万种古籍平均3个版本计算,则古籍的实体总数为60多万部。13万部与60余万部的比例,大约为1/5。具体的影像数字化古籍的查询,可以访问“中国古典文献资源导航系统”(https://www.wenxianxue.cn/top.html?type=art),这个平台汇集了全球几乎所有图书馆、出版社、公司及个人的古籍影像数据库网址,分门别类,可以自由切换摆渡。此外,平台的建设者唐宸副教授还建立了“全球汉籍影像开放集成系统”,挂在首页。该系统提供书名和作者的一键式查询,其结果可以直接登录浏览,为学者的研究提供了极大的便利。

明代文学文献的文本数字化,在智能的OCR软件出来之前,主要是一些公司提供的产品,如北京爱如生数字化技术研究中心制作的“中国基本古籍库”软件有明别集785种,香港迪志文化出版有限公司制作的文渊阁“四库全书”有明别集239种。北京鼎秀科技有限公司开发的“鼎秀”数据库有明别集636种。由于机器学习和人工智能的出现,古籍版刻体字识别的瓶颈被突破,书同文、阿里、古联、如是、龙泉寺、汉王、字节跳动等公司和机构,纷纷推出了各自训练的古籍智能OCR软件,准确率均在95%以上。于是,古籍的文本数字化进入了快车道。按照现在的算力,如开足马力,13万种图像古籍,可以在短短的几年内文本数字化。不过,再智能的OCR软件,也不可能做到100%的准确率。人工校对,依然需要投入大量的人力和财力,不是短时间内能够完成的。

在智能的OCR软件出现的同时,也出现了智能的古籍标点软件,其准确率也达到了95%以上,一些高校和大公司都有自己开发的古籍标点软件。由于智能的OCR软件、智能的标点软件,加上众包技术的出现,古籍的整理,开始了规模化和工程化作业的模式。如文旅部自2024年开始,每年投入近1.5亿元给各省公共图书馆进行古籍数字化(影像和文本数字化)。图书馆作为收藏单位,本身没有能力承担古籍影像数字化和文本数字化的项目,于是采取招标的方式,由公司投标进行古籍的数字化项目。而国家图书馆作为牵头单位,建立一个中华古籍智慧化服务平台(https://guji.nlc.cn/),各馆数字化的古籍,均提交到这个平台来发布。

除了文旅部下属公共图书馆大规模的古籍数字化外,一些高校和公司利用众包技术,召集高校师生和专业校对机构进行古籍文本数字化的项目。如北京大学王军团队与字节跳动合作,建立了识典古籍平台(https://www.shidianguji.com/)。温州大学侯荣川团队和中华书局古联公司合作,进行明代别集的文本数字化工作。据古联公司总编辑朱翠萍介绍,明代别集的文本数字化,目前已完成600余种。浙江大学徐永明团队建立了“智慧古籍平台”(https://csab.zju.edu.cn),主要也是以整理明代别集为主。与前两者不同的是,该平台更多地侧重智能的呈现和利用。如文本要进行标点和审核,内容要进行标引和标注,人物有行迹图、世系图和社会关系图,大模型可以对文本进行翻译和赏析等(详见下文介绍)。目前已发布200余部明别集数据。

从上述的分析来看,明代文学文献的影像数字化虽然距离全部完成还有较长的路要走,但随着国家古籍数字化专项资金的持续投入,我们有信心看到,前方的终点会变得越来越清晰。明代文学文献的文本数字化,情况有些复杂,因为影像有版刻字体,有草书、行书等手写字体。如果是版刻字体,那有多少影像,就可以几乎同时得到多少未经校对的文本。不要标点的校对,可能需要一代或两代人的努力才能完成;高质量标点的校对,那可能需要数代人的努力才能完成。

二  明代文学文献的结构化

所谓结构化,就是将数据以表格的方式组织和呈现。表格,小的有Excel、Access,大的,可以是SQL Server、MySQL、Oracle等,甚至可以是标记过的text 文本。与非结构化的数据相比,结构化数据有以下几大好处。一是可以计量统计。如我们已经有了《全宋文》作家分字段的数据表,那么,我们可以利用表格中的函数(如数据透视)一键统计出各省或各县作家的人数。二是可以批量匹配。如果我们手头有两张表,一张是人物著作表,一张是人物籍贯表,那么,利用表格中的函数(如VLookup)可以生成一张带有籍贯的人物著作表。三是可以可视化。如可以将统计的结果生成柱状图、饼状图。四是可以进行空间分析。如通过不同时代的人物籍贯表,可以分析人物的分布情况及版图的变化情况。五是可以进行社会网络分析。如著录了亲属关系和社会关系的表格,就可以利用Pajk、Gephi等软件进行可视化呈现,从边和点对人物的交往亲疏和影响力进行分析。六是结构化的数据可以为语言大模型提供数据增强检索和分析,提高问答的准确率。

结构化数据的种类很多,如有人物、地名、名物、时间、职官、科举、图像、书目、篇目等。在数字技术出现以前,人们其实已经做了很多有关结构化的工作,我们可以称之为准结构化文献。如正史中的人物传记、地理志书、各类辞典等,都是带有结构化特征的文献。就明代来说,准结构化的数据,人物类如《明史》中的人物列传、《国朝献征录》(焦竑)、《明人传记资料索引》、《明人室名别称字号索引》、《明遗民传记索引》、《中国文学家大辞典》(李时人,明代卷)、《明代名人传》(英文)、《明人碑传索引》(汤志波,十四册)等;地理类如《明史》中的地理志、《大明一统志》、《天下水陆路程》(明黄汴)、《客商一览醒迷》(明李晋德)、《大明一统志》等;职官类如《明史·职官志》、《明代职官年表》、《明代职官中英辞典》(张颖等);科举类如《明清进士录》、《明清进士题名碑录索引》、《明代登科总录》(二十五册)等;年代类如《明人年谱知见录》(李佳琪,志传)、各类明人年谱等;书目类如《千顷堂书目》、《明史·艺文志》、《明代传奇全目》(傅惜华)、《明代杂剧全目》(傅惜华)、《明别集版本志》、《明别集整理总目》(汤志波)、《明人别集经眼叙录》(徐永明、赵素文)、《台湾藏稀见明别集总目提要》(李玉宝)等;篇目类如《20世纪中国古代文学研究文献总目·明代论文卷》(曹鑫)等。

然而,准结构化数据毕竟不等于数据库。如就人物辞典来说,其主要的构成是人名的词条加上小传。而人物数据库,则有人名、字号、朝代、生卒年、籍贯、经纬度、仕履、著述、亲属关系、社会关系等不同字段的信息,而且,一个人物数据库,可以是各种不同表格组合构成的关系型数据库。譬如,哈佛大学与北京大学、台湾“中央研究院”联合开发的中国历代人物传记资料库(CBDB)就是一个关系型数据库,该数据库迄今已收入了65万人物,其中明代人物为222194人(截至2025年6月11日)[该数据为CBDB项目经理王宏甦提供。]

图1中国历代人物传记资料库人物数据统计表

CBDB数据库,可以实现过去准结构化辞典不能实现的功能。如统计女性的死亡年龄、中进士或中举人的年龄、男女的婚配年龄等。因为是对群体人物的研究,故有所谓“群体传记学”之说。数据库可以多条件查询人物信息,如某地某时的官员任职情况。这个在纸本时代,即便有工具书,也是不易查找的。此外,CBDB的人物籍贯地理信息、亲属关系、社会关系信息,在查出结果后,可以保存为地理信息或社会关系的格式,用专门的软件进行可视化的呈现和分析。

现代意义的结构化数据,除了CBDB外,与明代有关的尚有哈佛大学与复旦大学史地所合作建的“中国地理信息平台”(CHGIS)、哈佛大学的“世界地图平台”(Worldmap)、浙江大学的“学术地图发布平台”(http://amap.zju.edu.cn) 、浙江大学建立的“智慧古籍平台”(https://csab.zju.edu.cn) 发布的数据。CHGIS是数字人文的基础设施平台,里面包含了历代地名所属的行政区域、地名的经纬度等信息。Worldmap是应用地图,发布过“明代卫所分布”及“明代驿站路线图”等。

浙江大学的“学术地图发布平台”发布的地图有两类,一是人物行迹图,一是分布图。就明代的人物行迹来说,目前发布的主要有张以宁、危素、宋濂、陶宗仪、戴良、刘基、杨基、张羽、徐贲、胡奎、高启、瞿佑、杨士奇、解缙、于谦、沈周、陈献章、李东阳、王鏊、杨一清、祝允明、湛若水、王九思、唐寅、文徵明、王阳明、刘节、李梦阳、王廷相、康海、边贡、陆深、严嵩、夏言、何景明、杨慎、李濂、木公、李元阳、李开先、徐阶、吴承恩、归有光、唐顺之、王慎中、冯惟敏、茅坤、李攀龙、海瑞、沈明臣、梁辰鱼、徐渭、吴国伦、张居正、汪道昆、王世贞、李贽、沈一贯、焦竑、顾大典、屠隆、孙鑛、陈与郊、梅鼎祚、汤显祖、臧懋循、胡应麟、沈璟、冯琦、叶向高、袁宗道、徐复祚、徐光启、叶宪祖、谢肇淛、袁宏道、袁中道、钟惺、曹学佺、冯梦龙、冯梦熊、王思任、刘宗周、凌濛初、钱谦益、文震亨、苍雪、叶绍袁、徐霞客、担当、吴炳、张岱、张溥、陈子龙等人。有关明代的分布图,有《中国文学家大辞典》(明代卷)分布图、明代布政使司任职名单定位查询、明代山东散曲家地域分布图等。

浙江大学建立的“智慧古籍平台”目前主要以整理明代文学文献为主。平台发布的著述,不仅篇目独立成结构化的数据,进行了文体分类,而且对文章的地域关系进行了标注,形成可按行政区查询的结构化数据。此外,人物还有世系图、社会关系图。世系图主要的人物有杨维祯(1296)[括号内为人物生年,下同。]、张以宁(1301)、宋濂(1310)、刘基(1311)、章溢(1314)、胡深(1314)、陶宗仪(1320)、王袆(1322)、高启(1336)、方孝孺(1357)、杨士奇(1365)、夏原吉(1366)、胡广(1370)、薛瑄(1389)、商辂(1414)、姚夔(大章)(1415)、谢一夔(1425)、刘健(1433)、李东阳(1447)、杨廷和(1459)、席书(1461)、唐寅(1470)、文徵明(1470)、王守仁(1472)、康海(1475)、徐祯卿(1479)、严嵩(1480)、夏言(1482)、何景明(1483)、杨慎(1488)、韩邦靖(1488)、许宗鲁(1490)、归有光(1507)、海瑞(1514)、李攀龙(1514)、徐中行(1517)、梁辰鱼(1520)、徐渭(1521)、袁尊尼(1524)、张居正(1525)、王世贞(1526)、王穉登(1535)、焦竑(1540)、孙鑛(1542)、屠隆(1543)、邹迪光(1550)、汤显祖(1550)、胡应麟(1551)、袁宏道(1568)、冯梦龙(1574)、钟惺(1574)、钱谦益(1582)、叶绍袁(1589)等。

社会关系图主要有宋濂(1310)、刘基(1311)、陶宗仪(1320)、王袆(1322)、方孝孺(1357)、虞谦(1366)、商辂(1414)、李东阳(1447)、王鏊(1450)、杨一清(1454)、祝允明(1461)、文徵明(1470)、李梦阳(1473)、顾璘(1476)、张含(1479)、徐祯卿(1479)、严嵩(1480)、何景明(1483)、韩邦靖(1488)、苏祐(1493)、李开先(1502)、田汝成(1502)、王慎中(1509)、李攀龙(1514)、徐中行(1517)、梁辰鱼(1520)、张居正(1525)、汪道昆(1526)、王世贞(1526)、李贽(1527)、戚继光(1528)、杨时乔(1531)、孙鑛(1542)、屠隆(1543)、臧懋循(1550)、汤显祖(1550)、董其昌(1555)、叶向高(1559)、冯梦龙(1574)、钟惺(1574)、凌濛初(1580)、钱谦益(1582)、倪元璐(1593)、宋征舆(1617)、董说(1620)等。

从目前结构化数据来看,明代的数据主要还集中在地名、人名方面。从今后的发展来看,要建设明代结构化数据的任务还很重。如人物的行迹数据,现在主要还局限于比较有名望的人物,而二、三流的人物行迹数据,还有待今后来建设。此外,明代人物的日记、年谱,也有待结构化。就地名来说,CHGIS主要还是省府县三级的数据,大量地方志中县级以下的地名需要结构化。就图像来说,明代文献中的图像标注还没有真正启动。

三  明代文学文献的智能化

数字技术的发展,为明代文学文献的智能化提供了可能。那么,现代的数字技术能使明代文学文献达到怎样程度的智能呢?能为我们的学术研究提供怎样的便利呢?根据笔者的认知和实践,数字技术可以在以下几个方面使文献智能化。

其一,数据生产的智能化。智能OCR、智能标点、智能标引使古籍的整理时间大大缩短,极大地提高了古籍整理的效率,并大幅度降低整理的成本。可以说,古籍整理90%以上的工作可以让机器替代,人工只要负责10%的工作量。此外,线上众包技术让众多的文史爱好者参与其中,分工合作,使得纸本时代单一作业的模式变为集体作业的模式,改变了传统古籍整理的方式,建立了全新的古籍整理范式。目前,古联科技公司、“识典古籍平台”、“智慧古籍平台”均采用了线上众包作业的模式。由于是众包作业,每个人完成的工作量都有记录,且有排行榜,有利于结算酬劳。如果有国家的经费支持,可以解决文科生的就业问题。

其二,数据呈现的智能化。就“智慧古籍平台”来说,发布在前台的文本,由于经过标引,文本数据与后台的工具书产生了关联。这样,文本的地名可以定位,人名、词语、职官、时间等实体均有工具书的关联和解释。一般的阅读障碍就基本消除了。平台引入语言大模型后,古诗文还可以今译、英译,还可以赏析。这对于传统文化的传播,起到了极大的推广作用。此外,人物的行迹图、世系图和社会关系图,又加深了读者对人物的了解。兹就地名的定位举一例说明。刘基曾写过一首《稽句岭》的诗。诗云:“白日隐岩嶅,千崖气势豪。溪流婺女阔,山入少微高。危石天敧侧,长风谷怒号。干戈方自此,行役敢辞劳!”[1](卷八)刘基的这首诗,描写的是他返乡或奉命赴任途中,经由此岭,触景生情,描绘了稽勾岭一带险峻壮丽的自然山川,抒发了诗人身处乱世、肩负使命的豪情与责任感。按:稽句岭,即稽勾岭,今名金钩岭,是丽水至武义稽勾古道上的一个要冲,在武义境内。《栝苍汇纪》:“由寿玄而北百里为稽勾山岭,曰稽勾岭,崔嵬盘绕亘二十余里。”[2](卷七)由于智慧古籍平台对稽句岭作了标引,在后台添加了经纬度,因此,阅读此诗时,就可以精确定位。这样,对诗歌的理解就有了地理空间的认知。

其三,数据问答的智能化。大语言模型的出现,使得人机交互成为人们学习和工作不可或缺的工具。浙江大学文学院数字人文中心与杭州云四库科技有限公司联合开发了文史垂类模型——云四库智能问答系统(https://www.aiyskqa.cn) 。该系统基于杭州深度求索公司的DeepSeek R1、DeepSeek V3和阿里通义千问的Qwen72B、Qwen-QwQ、 Qwen3-235B、Qwen Plus 、Qwen 2.5-max等通用大模型为底座进行数据增强。目前已投喂古籍、研究著作及论文共二百多亿字的数据,能较好地回答各类文史问题。譬如,我们问一个“杨维祯为什么被称为文妖”的问题,机器给予了如下的回答:

杨维祯被称为“文妖”,这一称号源于其独特的文学风格与当时主流文学观念之间的冲突。以下从多个角度对这一称号的由来及意义进行分析:

一、杨维祯文学风格的“怪异”与“奇谲”

杨维祯(号铁崖)是元末明初的重要文学家,他所创作的“铁崖体”诗文以奇诡、放纵、夸张、浪漫为主要特色。他不拘泥于传统格律,敢于突破形式的束缚,融合古乐府、民歌、戏曲等元素,形成了极具个性的风格。这种风格在内容上也表现出对个性自由的追求,甚至在某些诗作中流露出对传统道德观念的反叛。例如,他的一些艳情诗大胆描写情感与欲望,这种表现方式在当时理学盛行、讲究“雅正”的语境中显得格格不入。

二、王彝的《文妖》批评

明代文人王彝在其《文妖》一文中,对杨维祯的文风进行了严厉批评。他将杨维祯比作“狐妖”,指出其文章“以淫辞怪语,裂仁义,反名实,浊乱先圣之道”,并批评其文风“柔曼倾衍,黛绿朱白”,具有“妖媚惑众”的力量。王彝认为,这种文风不仅偏离了儒家正统思想,还具有蛊惑人心、影响青年的危险性,因此称之为“文妖”。

三、“文妖”称号的多重含义

“文妖”这一称号并非仅指杨维祯文风的怪诞或形式上的奇诡,更深层地反映了其文学思想与当时主流意识形态之间的冲突。在王彝等理学派文人看来,杨维祯的创作不仅形式上不守规矩,内容上也挑战了儒家伦理,是对“文以载道”传统观念的背离。因此,“文妖”不仅是对其风格的形容,更是一种道德与思想上的批判。

四、后世对“文妖”称号的再评价

尽管杨维祯在当时受到如王彝等人的严厉批评,但后世学者如胡应麟等人却对其才情给予了高度评价。胡应麟认为杨维祯的艳情诗“才情缥缈,独步当代”,其诗风“超异神俊,追踪谪仙”,甚至将其与李白、温庭筠、李贺等古代名家相提并论。这说明,随着时代观念的变迁,“文妖”这一称号逐渐被赋予了另一种解读——它成为对杨维祯文学个性与创新精神的肯定。

五、结语

综上所述,杨维祯之所以被称为“文妖”,主要源于其文学风格的奇谲怪异、内容上的个性张扬,以及与当时儒家正统文学观念的冲突。这一称号既包含了对其文学创新的否定性批评,也折射出当时文化语境中对“异端”文学的排斥。然而,从文学史的发展来看,这种“妖”的标签恰恰体现了杨维祯作为一位文学革新者的独特价值。

机器注明了大模型使用了Qwen-72B,并注明了文献来源,分别有《古代文学理论研究丛刊》(第二辑)、邱江宁撰《元代文人群体的地理分布与文学格局研究》、孙小力《杨维祯在嘉定的活动及其影响考论》、《元明清诗鉴赏辞典》、廖可斌《压抑与躁动——明代文学论集》、《明代文学思潮史》、《明代文学复古运动》。应该说,这样的回答基本是符合实际的。

上述的例子,仅仅是云四库一个应用案例。实际上,云四库的功能远不止于止,限于篇幅,此处不再展开。“智慧古籍平台”接入了云四库智能问答系统,因此,不仅“智慧古籍平台”上的诗文能今译、英译及赏析,而且还随时可以跳转到云四库智能问答系统进行人机交互问答,这样的便利是纸本时代不可想象的。

其四,AI创意与古籍的活化利用。我们除了利用语言大模型进行知识的智能问答外,还可以利用大模型文生图、文生视频的功能进行古籍AI视频创作。这是一个崭新的天地,能够极大地促进古籍的活化利用,调动学生学习古文的积极性。大语言模型刚推出的时候,央视就推出国内首部AI全流程微短剧《中国神话》。 智慧古籍平台发布了多个刘基《郁离子》的AI创意视频,附在相应的文本之后。

图2  用AI制作的相马图

千里马 绀鹊 https://abm.zju.edu.cn/share.html?id=z5gAyIrNg&type=vod

千里马 绀羽鹊 https://abm.zju.edu.cn/share.html?id=z5gAyIrNg&type=vod

千里马 规执政 https://abm.zju.edu.cn/share.html?id=h9Ax4reHR&type=vod

千里马 良桐 https://abm.zju.edu.cn/share.html?id=M4ziI9eHR&type=vod

千里马 乱几 https://abm.zju.edu.cn/share.html?id=FFPWS96Hg&type=vod

千里马 戚之次且 https://abm.zju.edu.cn/share.html?id=SddVSreNg&type=vod

千里马 巫鬼  https://abm.zju.edu.cn/share.html?id=WJKIS96NR&type=vod

千里马 献马 https://abm.zju.edu.cn/share.html?id=MZzHS96Hg&type=vod

千里马 燕王好乌 https://abm.zju.edu.cn/share.html?id=za9NS96Ng&type=vod

千里马 养枭 https://abm.zju.edu.cn/share.html?id=mK1DI9eHR&type=vod

千里马 忧时 https://abm.zju.edu.cn/share.html?id=BkAOS96NR&type=vod

鲁般 萤与烛 https://abm.zju.edu.cn/share.html?id=4eeBN9eHg&type=vod

鲁般 东都旱 https://abm.zju.edu.cn/share.html?id=TYNLN9eHg&type=vod

鲁般 https://abm.zju.edu.cn/share.html?id=RCALHr6HR&type=vod

鲁般 九尾狐 https://abm.zju.edu.cn/share.html?id=ce_LNreHR&type=vod

我们还可以将这一应用进行广泛推广。譬如,明代诗文、小说、戏曲均可以用AI进行短视频的创作,从而激发学生学习古代文学的兴趣,推动古代文化的普及和传播。

需要指出的是,不论哪一款大语言模型,DeepSeek也好,通义千问也好,都不能解决古文深度语义交互的问题。譬如,我们要问机器关于明代乐府诗的成就和特点,机器只会根据现在的研究材料来回答这个问题,而不能从明代作家所有原典文献中去查询分析来回答。假如机器能根据提供的古书,通过检索和分析,回答提问者任何问题,那么,我们可以说,古籍的智能化真的是到达了一种理想的状态。

四  余论

从上面的叙述中我们可以看到,明代文学文献的数字化、结构化和智能化,是一个漫长且极有意义的系统工程。所谓漫长,是因为明代文学文献的体量过于浩大,即便是先进的技术能帮助解决90%以上的工作量,但依然有大量的工作需要人力来完成,这需要几代人的努力。所谓有意义,一是能提高人们的工作效率,促进学术的研究向纵深的方向发展;二是借助数字技术和优质数据,有利于文化的普及和传播;三是可以激活学者的研究成果,使高冷的学术研究成果走向社会,服务大众;四是发挥数据在人工智能时代的要素作用,使其成为推动社会发展的新质生产力。

参考文献

[1]刘基.诚意伯刘先生文集[M].明成化六年(1470)戴用、张僖刻本.

[2]熊子臣,何镗.栝苍汇纪[M]//四库全书存目丛书:193册.济南:齐鲁书社,1996.

此文原载于《中国韵文学刊》2025年第4期。

原创内容如需转载,须经本刊编辑部授权。

订阅·投稿·查询

1. 点文章标题下的“中国韵文学刊”进行订阅,或扫码下方二维码订阅,或直接搜微信公共帐号:中国韵文学刊。

2. 投稿网站:https://YWXB.cbpt.cnki.net/

投稿邮箱:yunwenxuekan@163.com

3. 关注后输入关键字可浏览过刊目录及部分文章,如查询2014年第1期,输入“201401”即可浏览。本刊为季刊,一年四期。

《中国韵文学刊》

长按左侧二维码识别即可关注

比特人文

投稿邮箱:dhbase@126.com

扫码关注 获取更多资讯

图片

阅读原文

跳转微信打开

经典回顾 | 数字人文主义者需要了解算法吗?(2016)

2026年4月7日 09:01

本杰明·M·施密特 2026-04-07 09:01 北京

本杰明·M·施密特:数字人文主义者完全不需要理解算法本身,但必须洞悉算法试图实现的转换过程。

图片

《傅立叶艺术》Juan López Gómez

https://www.fourierart.com/

Do Digital Humanists Need to Understand Algorithms? 

数字人文主义者需要了解算法吗?

作者:本杰明·M·施密特 (Benjamin M. Schmidt)

译者:丁怡瑞(剑桥大学数字人文系硕士研究生)

算法与转换

伊恩·博戈斯特(Ian Bogost)最近发表了一篇文章,认为对算法的过度迷恋会损害我们准确描述所处世界的能力。他写道:“像‘算法’这样的概念已经沦为草率的简写,成了将多部分复杂系统误认为简单单一系统的俚语”。他指出,即使是计算文化的批评者也难以抵挡这种诱惑,将算法描述得仿佛它们拥有某种无可辩驳的美;这导致他们对计算行为形成了一种“扭曲的、神学式的理解”,忽略了人类的能动性。

作为少数在人文学科领域内创造并应用算法的领域,数字人文拥有得天独厚的优势,能够帮助人文学者更好地理解算法的运作机制,而不是盲目地崇拜或谴责它们。然而,我们常常刻意忽略算法背后的理解和意义,转而采用一种工具化的方法,仅仅将算法视为可以凭直觉判断其效用的手段。计算机底层的复杂性使得某种程度的认知盲区在所难免。当复杂度超越临界点时,人文学者确实无需理解产出结果的算法机制;鉴于现代软件的复杂性,他们即便想理解也难以企及。

尽管软件中有些元素我们可以忽略,但要将人文数据分析作为一项学术活动而非仅仅是一项技术活动来实践,一些基本的理解标准仍然必不可少。有些算法的确是繁复冗杂、缺乏连贯性和目的性的程序,而另一些算法则包含着我们完全能够理解的假设。算法的运行方式与算法的运行方式截然不同,理解算法的运行方式更为重要。我想在此论证的是,一个成熟的人文数据分析领域不应仅仅从外部检验算法的有效性;相反,它应该探索软件所描述的流程背后假设的意义。简而言之:数字人文主义者完全不需要理解算法本身,但必须洞悉算法试图实现的转换过程。唯有如此,我们的实践才能更具成效,更可能真正实现原创性突破。

这一论点的核心在于区分算法和转换。算法是一组可精确指定的步骤,用于产生特定的输出结果。“算法”是计算机科学的核心研究对象;关于算法的主要理论问题涉及运行这些步骤所需的资源(特别是时间和内存)。另一方面,“转换”是指算法可能进行的重构。这个术语与计算机科学的联系相对较弱。其最紧密的学科联系在于数学(例如几何学中描述对形状可施加的操作)和语言学(构成诺姆·乔姆斯基“转换语法”理论的核心)。

从计算角度来看,算法创造转换。然而,从认知层面来说,人们设计算法是为了自动执行特定的转换。也就是说:转换表达了一个连贯的目标,这个目标可以独立于产生它的算法而被理解。也许最简单的例子就是排序的转换。“有序性”是一个普遍属性,任何人都可以独立于产生它的操作来理解它。在人文研究中,字母排序的用途,例如生成文本索引或整理姓名索引,与用于排序的具体算法无关。事实上,计算机排序列表的具体算法存在多种变体。某些经典的排序算法,例如快速排序,是计算机科学教学的基础。(对排序算法的经典汇编和解释是克努特经典计算机科学著作的前半部分。)如果认为人文学者需要理解像快速排序这样的算法才能使用排序后的列表,那就太荒谬了。但是, 我们确实需要理解有序性本身,才能充分利用排序列表的独特特性。

理解转换意义的另一种方法是将算法工具化地使用;例如,寄希望于潜在狄利克雷分配(LDA)之类的算法能够近似表示“主题”、“论述”或“论题”等现有对象,并探索其无法做到的细小领域。然而,这种将软件视为工具的方法,对于理解它几乎毫无益处;它寄希望于算法能够近似地表示现有意义,往往也阻碍了其创造新意义的可能性。传统人文主义者对大规模文本分析的主要批评是,它未能为学者提供任何新知。此类批评虽常有谬误,却确实触及了一个令人沮丧的缺陷:当前普遍采用的远读方法往往无法开辟理解文本的新路径。

将大规模分析与斯蒂芬·拉姆齐(Stephen Ramsay)所谓的“算法批评(algorithmic criticism)”相结合,虽然可能不那么立竿见影,但却更有趣。算法批评是指运用算法转换来开启文本的新解读方式。即便某些算法(如拉姆齐所描述的案例)在转换过程中本身不具意义,这一方法依然有效。但那些本身就蕴含某种目的的转换,更可以帮助我们创造出新的文本版本,从而提供新颖或有用的视角。探寻并描述这些转换如何运作,正是我们应该更加重视和推广的工作。

傅里叶变换与文学时间

安妮·斯沃福德(Annie Swafford)和马特·乔克斯 (Matt Jockers)就乔克斯的“Syuzhet”软件包展开的辩论。Annie Swafford 与 Matt Jockers 围绕 Jockers 的 “Syuzhet” 软件包所展开的争论,为我们提供了一个有用的案例,说明深入探讨某种“转换”本身的目的,如何能够丰富我们描述文本的词汇。尽管斯沃福德最初的批评指出了该软件包的几个问题,但她与乔克斯的后续讨论主要集中在乔克斯使用信号处理中的低通滤波器(low-pass filter)作为“平滑函数(smoothing function)”的恰当性上。乔克斯认为,这提供了一种“滤除情感轨迹中极端值”的绝佳方法。而斯沃福德则认为,这种方法常常会受到“振铃伪影(ringing artifacts)”的影响。在实践中,这意味着生成的曲线几乎只关注“最低点,而忽略了两侧的上升或下降”。

斯瓦福德和乔克斯的争论不仅围绕一个算法,更围绕一个被具体定义的“变换”展开。Jockers 用来分析情节结构的低通滤波器,其数学基础是离散傅里叶变换(Discrete Fourier Transform, DFT)。将傅里叶变换视为理解叙事结构的一种“构成方式”,这个想法本身颇具吸引力;但正如斯瓦福德所论证的,它很可能是错误的。斯瓦福德所描述的“振铃伪影”源于一个更大的问题:变换本身所蕴含的对时间的基本理解。

傅里叶变换的的目的,是通过将复杂信号拆解为其组成部分,把周期性事件表示为频率。人类经验中最基本的一些元素,尤其是光和声音,在物理上是以重复波的形式存在的。而傅里叶变换提供了一种简便的方法,可以将这些无限长的波描述为一组不断重复的短频率。例如,纯音“A(La音)”是以每秒 440 次的频率持续脉动的;但当由单簧管演奏时,这个“A”音包含大量规则的泛音(overtones)——这些泛音是频率更高、能量较低的成分音,使声音比单一纯音更丰富。像 Jockers 使用的那种滤波器会去除这些规律性;它通常用于 MP3 压缩等处理过程中,以去除人耳听不到的高频音符。如果对这样的单簧管音色应用更强烈的滤波,它会去除高频部分,保留音符“A” , 但会削弱乐器独特的音色。

将“情节”表示在频率域中,这一想法颇具吸引力,但也建立在一些高度可疑的假设之上。其中最令人惊讶的假设是:情节如同声音或光一样,由无穷无尽重复的信号组成。乔克斯使用的这种“低通滤波器”会忽略文本中任何呈现周期性重复的要素,而是聚焦于最长周期的变化,比如那些跨度超过文本长度四分之一或三分之一的趋势。这个过程类似于根据一段仅持续 1/440 秒(基频的一个节拍)的“A”音符音频片段来预测单簧管的后续音效。令人惊讶的是,这对于音符来说是可行的,但这仅仅是因为这个音调会无限重复。而Syuzhet 软件包中的默认平滑处理假设书籍也遵循同样的规律;除其他因素外,这意味着:经过平滑后的情绪曲线会把整本书开头的情绪视为结尾情绪的“延续”。(我在《Commodius Vici》一书中对此有更详细的解释。)

对于某些情节,包括乔克斯使用的主要例子《一个青年艺术家的肖像》, 这种假设并不明显错误。但对于其他文本结构,它会造成很大的问题。图 48.1 展示了 《一个青年艺术家的肖像》 和其他四部小说的情节,文本均取自古腾堡计划。威廉·迪安·豪威尔斯的 《塞拉斯·拉帕姆的发迹》讲述的是一个关于毁灭的故事; 霍瑞修·爱尔杰的 《衣衫破烂的迪克》是十九世纪典型的“白手起家”小说; 《包法利夫人》 则是经典的关于衰落的悲剧故事。图中展示了三种不同的平滑函数:加权移动平均,这是最简单的函数之一;局部加权回归散点平滑法(LOESS),这是探索性数据分析中最基本、假设最少的算法之一;以及 Syuzhet 软件自带的低通滤波器。

这里,傅里叶变换的问题显而易见。这种周期性的函数使得包法利夫人死后境况与她出轨前一样“好”。而假设较少的方法则允许她的命运在结尾崩塌,也允许衣衫破烂的迪克的命运轨迹向上而非向下倾斜。 安德鲁·派珀(Andrew Piper)指出 , 回答 “我们如何判断一条曲线是否‘错误’?”这个问题可能相当困难。但在本例中,错误之处显而易见;只有试图闭合循环才能解释小说结尾拉格德·迪克命运的下跌。(译者注:因为傅里叶变化的循环结束点必须接上开头)

这是什么类型的证据? 根据乔克斯的说法,包法利的例子仅仅是对该方法的一种“否定性验证”(negative validation),我认为他的意思是,这是一种对“该方法在所有情况下都是最佳方法”这一论断的经验性证伪(empirical falsification)。斯瓦福德的文章也暗示,逐案验证和证伪衡量方法优劣的黄金标准。用她的话来说,这套方法(或许整个数字人文领域)需要“更多的同行评审和严格的测试——旨在证实或反驳假设”。

从这个角度来看,算法的本质是一个操作过程不透明的系统;我们可以尝试或检验它是否符合我们的预期,但我们永远无法真正了解它。然而,当算法成为实现有意义变换的手段时,例如傅里叶变换,我们就能做得比“质量测试”更好;我们可以预先通过解释性分析来判断变换会在哪些方面失败。我选择 《包法利夫人》 并非随意之举,并非为了检验它是否足够好;相反,平滑方法的推论让我意识到,悲剧类小说整体上都无法被 Syuzhet 的平滑方式正确处理。我有些忐忑地承认,我从未真正读过 《包法利夫人》 或 《衣衫褴褛的迪克》 ;但它们都是情节与低通滤波器平滑完全不相容的典型例子。任何其他以死亡和绝望或非凡好运结尾的小说都会以同样的方式“被算法误读”。

图片

图 48.1  以极坐标绘制的四条轨迹图

这些问题也贯穿于乔克斯的一系列基本情节模式中:所有图表都以完全相同的情绪开始和结束。然而,在软件包推出后的头两个月里(这期间的审查力度肯定远超任何同行评审流程),这种假设的明显问题却并未被发现。这些缺陷未能立即显现的一个特别有趣的原因是 ,像图 48.1 这样的折线图并不能完全体现傅里叶变换的假设。我们用来展示结果的统计图形本身就可以被视为一种转化,它将数据带入一个新的分析领域。在这种情况下,我们用来绘制图表的几何图形和坐标系本身就带有特定的模型。这类折线图假设时间是线性且无限的。一般来说,这无疑是纸上表示时间最简单、最准确的方法。然而,它并不符合傅里叶变换所假定的频域(frequency domain)。如果傅里叶变换是观察图表的正确方法,我们应该使用极坐标系作图,因为极坐标系会循环回到起点。我在图 48.2 中重新绘制了相同的数据,其中百分比用一个角度表示,该角度从时钟的 12 点钟位置开始,而情感倾向则不是由高度而是与中心的距离来定义。

图片

图 48.2 以极坐标绘制的四条轨迹线

在这里,傅里叶变换的假设更加清晰。对于这里的所有小说而言,时间构成了一个闭合的循环;结尾点必须扭曲自身以与开头对齐,反之亦然。而其他算法则允许存在巨大的断层:《 包法利夫人》的弧线向内盘旋,仿佛坠入下水道,而 《衣衫破烂的迪克》 则向外推进飞升。

这些环形情节图不仅仅是为了证伪。以这种方式全面理解转换背后的假设,不仅凸显了模型的缺陷,也为我们思考情节提供了一种新的视角。这种观点强调了开头与结尾之间的鸿沟是小说的核心特征;由此,它挑战我们去思考情节所占据的时间究竟是不是一种单向线性的(straightforwardly linear)存在。

这场讨论之所以值得继续,部分原因在于它提醒我们重新审视自己对于情节与时间的诸多前设。笛卡尔坐标系(直角坐标系)所暗示的无限时间,在某种程度上与极坐标图一样是错误的。许多平滑方法(包括我希望在 Syuzhet 中使用的 loess 回归)很容易将时间外推到情节的开头和结尾之外。这恰恰表明,它们在某种程度上同样不适用于当前的任务。事实上, fabula(故事顺序)与syuzhet(叙述顺序)之间的区别核心在于,我们无法谈论小说“开始之前”的内容,也无法预测莎士比亚如果在 《哈姆雷特》 结尾之后再多花几个小时创作,会写出什么文字 。任何暗示存在此类短语的模型显然都是错误的。

但即便这些转变可能并非完全正确,它们或许仍能带来新的理解和分析方法。虽然这种“循环回归”的结构显然不适用于小说,但它对更广泛意义上的情节研究却具有重要意义。通过探究频域图的适用范围,我们可以从抽象层面识别出更适合应用此类方法的领域。

例如:理想的“三机位情景喜剧”剧本应该允许剧集在轮播中以任意顺序播出。也就是说,在某些方面,它们应该是循环往复的。对于情景喜剧剧集而言,循环性是一个值得牢记的有用框架。情感、主题或其他属性的契合度,对于理解商业影响如何与创作自由交织在一起,或者理解一个类型随时间的演变,都可能是一个极其有用的工具。这种信号处理的技术或许还能用于识别,例如,电视台在何时、何处允许编剧展开跨多集的剧情线。

尽管斯瓦福德和乔克斯的对话主要围绕“平滑”问题展开,但许多数字人文主义者似乎发现斯瓦福德提出的第二个批评更有意思。她认为,乔克斯软件包提供的情感分析算法(其中大部分基于带有情感评分的词典)产生的结果经常违背“常识”。第一个问题看似枯燥乏味,但第二个问题为数字人文主义者提供了一个平台,让他们探讨如何更好地理解我们运行的算法的“黑箱”。一个算法“符合常识”意味着什么?为了实用,它需要 100%正确吗?95%?还是 50.1%?如果数字人文要成为一个会采用他人创造工具的领域,那么这些正是它需要练习解答的问题。

然而,这样表述问题,就再次将算法本身视为不可知的。就像傅里叶变换一样,我们最好有意识地探究情感分析的转换究竟做了什么。例如,我们不应该将 Syuzhet 的情感分析部分视为一组待匿名受试者测试的词表,而应该思考如何以最佳方式实现情感分析背后的底层算法——或许是逻辑回归( logistic regressio)——来区分“褒贬”二元分类之外的事物。例如,乔克斯的灵感来源库尔特·冯内古特(Kurt Vonnegut)认为,情节的核心二元不是“快乐/悲伤”,而是“顺境/逆境”;也就是说,虽然情感分析提供了一个有用的捷径,但大规模平台更应创建一个真正能区分其领域中核心二元对立的分类器。安德鲁·派珀对情节结构的研究涉及小说内部的比较。这样的研究可以帮助我们更好地理解情节。他让文本与自身对话,并从其他领域中找到新的有用的转换方式。

这样做意味着,数字人文主义者可以帮助消除博戈斯特所揭示的“算法统治神话”,而不是参与构建此类神话。当历史学家将精神分析应用于历史研究时,我们并没有建议他们与精神分析学家“合作”,然后用历史记录来检验他们的论断有多少真实性;相反,历史学家会主动运用这些概念,将其视为具有解释力、本身就有意义的理论工具。当底层算法难以理解或过于复杂时,人文主义者能够深入探究算法的“黑箱”固然有益且有用。但即便如此,数字人文主义者的首要任务也应该是理解算法所服务的转换和系统的目标和意图,这样我们才能成为新思想的创造性使用者,而不是对工具的目的和前提一无所知、只是被动使用工具的人。

/来源:Gold, Matthew K., et al.“48. Do Digital Humanists Need toUnderstand Algorithms?Benjamin M. Schmidt." Debatesin the Digital Humanities 2016, 2.0, University ofMinnesota Press,13 Apr. 2016.

推荐阅读:

凯特·克劳福德、特雷弗·帕格伦《采掘人工智能:机器学习训练集中的图像政治学》(2019

凯特·克劳福德、弗拉丹·乔勒:《人工智能解剖学》(2019)

转自“左手数字右手人文”公众号

图片

初审:徐碧姗

复审:段婧怡

终审:夏翠娟

阅读原文

跳转微信打开

AAAI 2026 论文:从语言神经元视角理解多语言对齐如何增强大模型能力

2026年4月6日 10:50

张世茂 2026-04-06 10:50 江西

分享一篇文章

南大NLP: AAAI 2026 论文:从语言神经元视角理解多语言对齐如何增强大模型能力

南大NLP组2026论文:从语言神经元视角理解多语言对齐如何增强大模型能力

【该工作由南京大学自然语言处理组与微软亚洲研究院合作完成,论文入选AAAI2026Oral。扩展版论文链接:https://arxiv.org/abs/2505.21505,代码:https://github.com/NJUNLP/Language-Neurons-Alignment】

01

研究动机

大型语言模型在多语言场景下已经展现出较强的整体能力,但由于预训练语料在不同语言之间分布不均衡,高资源语言与低资源语言之间仍存在显著性能差距。鉴于低资源语言的数据本身难以获取、难以支撑额外的大规模预训练,如何在现有模型基础上提升其能力成为实际需求。在这一背景下,多语言对齐(Multilingual Alignment)作为一种更具可操作性的途径,为增强低资源语言的推理表现提供了有效方向。

目前,多语言对齐方法的效果已在多项任务中得到验证,然而一个关键问题始终缺乏系统性解释:多语言对齐为什么有效?它在模型内部究竟改变了哪些结构与表征方式?为回答这一问题,近期研究开始尝试从神经元粒度理解多语言能力来源。现有主流划分通常将与语言相关的神经元分为两类:一类仅在某一种或极少数语言上表现出较高激活,被称为语言特定神经元(language-specific);另一类在所有语言中均保持较强激活,被视为通用神经元(general)。这一二元框架为分析多语言能力提供了初步结构化视角,但在实际统计中,如图所示,仍存在无法被准确归类的激活模式:有相当数量的神经元会在多种语言上频繁激活,却并未在所有语言中保持一致作用:在现有体系下,它们通常被笼统归入语言特定,但其跨多语言的激活特征又与真正意义上的语言特定神经元并不一致。这一现象提示,要深入理解多语言对齐的内部机制,仅依赖“语言特定—通用”的二元划分可能不足,亟需更精细的描述与分析框架。

1:某神经元在不同语言上激活概率的示例

02

方法:语言神经元的三元分类法与识别算法

2.1 三类语言神经元的划分与定义

结合激活概率统计,我们重新整理并扩展了语言神经元的定义体系:

  • 语言特定神经元: 只在某一种语言上具有高激活概率,对其他语言激活很弱。它们主要承担该语言特有的输入 / 输出形式的编码与解码。

  • 语言相关神经元: 在多种但非全部语言中保持高激活,用来刻画跨若干语言共享的结构与模式。(这是重点刻画的“中间层次”类别,也是以往工作容易混入语言特定的部分)

  • 通用神经元: 在所有语言上都具有较高激活,更多与任务相关的通用知识和推理模式有关,而不是绑定于某一种语言。

2.2 神经元识别算法

仅根据在哪些语言上出现激活难以准确判断神经元的功能,我们更关心其是否真实参与多语言推理过程,而非在与任务无关的文本上偶然被激活。为此,我们在语言维度上引入两个核心指标:

(1)激活概率分布的熵: 用于衡量神经元在不同语言间的激活偏好,即语言特异性

(2)跨语言的最大激活概率: 用于衡量神经元在至少某些语言上是否具有足够高的激活强度,即有效性

我们将两项指标整合为统一评分体系,对所有神经元进行排序:

从而同时过滤掉激活弱、语言偏好不明显的神经元,以及“看似特化但实际不参与推理”的神经元

在此基础上,我们取语言数量 N=10,根据神经元激活概率超过阈值的语言数量完成最终分类:

  • 仅在 1 种语言上高激活 → 语言特定

  • 在 2–9 种语言上高激活 → 语言相关

  • 在全部 10 种语言上高激活 → 通用

需要强调的是,我们在多语言数学推理数据集(MGSM、MSVAMP)的模型回答生成过程中统计激活,而非在一般多语言文本上,确保识别到的神经元确实与多语言推理能力相关。

03

实验设置

为在可控成本下系统分析多语言对齐前后的神经元变化,我们选择两种 7B 规模的开源数学推理模型作为研究对象:

  • MistralMathOctopus-7B

  • MetaMathOctopus-7B

两者均在多步数学推理数据上进行过微调,适合作为研究多语言推理能力及其内部结构变化的基座模型。

在任务设置方面,我们使用两个具有代表性的多语言数学推理基准:

  • MGSM:经典的多语言数学推理评测集,用于主要实验结果以及神经元激活统计;

  • MSVAMP:分布与 MGSM 不同的 out-of-domain 数据集,用于验证分析结论的泛化能力。

覆盖十种语言:英语(en)、中文(zh)、俄语(ru)、德语(de)、法语(fr)、西班牙语(es)、日语(ja)、斯瓦希里语(sw)、泰语(th)和孟加拉语(bn)。其中英语作为中枢语言,用于构造对齐信号。

在对齐方法上,我们采用 MAPO 框架 (Multilingual-Alignment-as-Preference Optimization) 中基于 DPO 的变体来实现多语言对齐,具体包括:

  • 利用多语言算术推理数据构造偏好对;

  • 使用多语言翻译模型将非英语回答翻译回英语,并计算其与英语回答之间的一致性;

  • 将该一致性作为偏好优化中的奖励信号,对模型进行对齐训练。

对齐前后,我们分别统计模型在多语言推理生成过程中的神经元激活概率分布,比较三类神经元对齐前后的数量变化及其在不同层的分布差异,以分析对齐对模型内部结构的影响。

04

主要发现:多语言对齐如何改变模型内部结构

4.1 神经元失活实验

基于前述识别方法,我们在 base 模型中识别三类神经元,并通过 Accuracy 和 Perplexity 消融实验检验它们在多语言推理中的作用,如图所示:

2:失活基于MistralMathOctopusMGSM得到的不同种类神经元后的模型准确率

3:失活基于MistralMathOctopusMGSM得到的不同种类神经元后的模型困惑度

  • 禁用某语言的语言特定神经元会降低该语言的回答准确率,并提升该语言 PPL,表明模型在该语言上依赖其语言特定神经元;

  • 在此基础上,若进一步禁用该语言的语言相关神经元(即同时禁用 language-specific 与 language-related),模型性能进一步下降,且 PPL 上升幅度更大,说明语言相关神经元在多语言推理中同样起到关键作用;

  • 禁用某语言的语言相关神经元对其他语言的性能影响相对较小,表明这些神经元在多个语言之间呈“分散共享”结构,而非被单一语言强依赖;

  • 当同时禁用某语言对应的语言特定、语言相关及通用神经元时,不仅该语言性能显著下降,其他语言性能亦受到明显影响,说明通用神经元承载跨语言共享的推理能力。

这些结果表明:某语言的推理能力同时依赖语言特定语言相关神经元,而语言相关神经元在多语言之间形成“局部共享”的支撑结构,是连接多种语言的重要桥梁。

4.2 四阶段多语言推理流程

在识别出语言特定、语言相关和通用三类神经元后,我们进一步分析了它们在模型各层的数量分布情况。结果显示,这三类神经元在深度方向上呈现出结构化的变化模式,如图所示,据此可将大模型的多语言推理过程概括为以下四个阶段:

4:不同种类神经元的层级别分布

(1)多语言理解

在模型的底部若干层中,语言特定与语言相关神经元数量同时处于较高水平,而通用神经元相对较少。该阶段主要负责将不同语言的输入映射到统一或相近的语义空间,为后续的语言无关推理奠定基础。

(2)共享语义空间推理

在中间层区域,通用神经元占据主要位置,而语言特定 与语言相关神经元的数量显著减少。模型在此阶段主要执行与语言无关的推理与计算,不同语言共用相同的推理结构。

(3)多语言输出空间转换

接近输出端的若干层中,语言特定与语言相关神经元数量再次明显上升,而通用神经元数量下降至较低水平。该阶段的功能是将共享语义表示重新投射到各目标语言的输出空间中,恢复语言间的结构差异。

(4)词汇空间输出

在最终输出层,三类神经元的数量分布再次出现特征性变化:

  • 语言特定神经元在该层达到数量峰值,强调其在目标语言词汇选择中的重要作用

  • 语言相关神经元数量则呈下降趋势,与上一阶段形成对比,表明跨语言共享结构在词汇级生成中的作用相对减弱

  • 通用神经元数量重新回升,与输入层的分布较为一致,可能与模型依赖共享词表和通用知识来完成最终输出有关

这一四阶段框架体现了不同类型神经元在模型内部的分层组织关系,相比现有对多语言推理的粗粒度描述,更系统地揭示了模型内部表征从输入到最终输出的转换机制。

4.3 多语言对齐的影响

在明确 base 模型的层级结构后,我们进一步比较了对齐前后三类神经元在不同层次的数量变化,如图所示。

5:对齐后不同种类神经元的层级别变化

分析显示,多语言对齐并不仅是对输出分布的调整,而是在模型内部引发了系统性的结构重组,主要体现在以下方面:

(1)输入阶段:更依赖语言敏感结构

多语言理解阶段,语言特定与语言相关神经元数量均有所上升,而通用神经元数量相应下降。这表明模型在输入侧更依赖语言相关结构来建立跨语言间的映射,为后续推理的对齐提供基础。

(2)输出阶段:从“单语言特化”转向“跨语言共享”

多语言输出空间转换阶段,语言相关神经元的数量显著增加,而语言特定 神经元有所减少。这一反向变化说明,对齐后的模型在生成目标语言输出时,会更多利用跨语言共享的结构,而减少对高度语言特化神经元的依赖。

(3)整体趋势:由“单语言依赖”转向“多语言共享”

跨层统计如图所示,这进一步显示对齐后:

6:对齐后被不同数量语言(N)所共享的神经元的数量变化

  • 语言特定神经元整体减少

  • 语言相关神经元显著增加

  • 通用神经元数量也呈现上升趋势

结合多语言激活模式进一步观察可以发现:部分原本仅在少数语言中活跃的神经元,在对齐后会在更多语言间被共同激活,其语言覆盖范围呈扩大趋势。这一现象在不同模型与数据集上均具有一定一致性,提示多语言对齐可能使模型更倾向于使用在多语言间具有更高共享度的神经元结构。

4.4 自发多语言对齐现象

此前研究提出了自发多语言对齐(Spontaneous Multilingual Alignment)现象:即使对齐训练仅涉及少数语言,其他未参与对齐的语言也会同步受益。本文在 MAPO 框架下验证了这一现象:

1MistralMathOctopus对齐前后模型在MGSM上的准确率。“X/Y  T“表示多语言对齐中语言XY向语言T进行对齐

  • 例如仅在中文与德语上执行对齐训练(zh/de ⇒ en),模型在 MGSM 上的平均准确率由 57.8 提升至 63.6

  • 多种未直接参与对齐的语言(如西班牙语、法语、泰语等)也出现了不同程度的性能提升。

为了理解这一现象背后的内部机制,我们进一步统计了对齐前后,不同语言对应的神经元数量变化。结果显示:

2:自发多语言对齐实验中训练和未经训练语言上不同种类神经元数量变化的平均结果

  • 对齐语言中:语言特定神经元数量减少,而语言相关神经元数量显著上升;

  • 未对齐语言中:同样观察到语言相关神经元数量上升的趋势,尽管幅度较小。

这一结果说明,对齐训练不仅改变了对齐语言内部的神经元参与模式,也在一定程度上影响了其他语言的神经元结构:与多种语言共同相关的语言相关神经元在更多语言间得到使用,其共享范围有所扩大。

因此,自发多语言对齐不仅体现在性能提升上,也在神经元层面呈现出一致的结构变化,为这一现象提供了进一步的证据支持。

05

总结

本文从神经元粒度系统分析了多语言对齐对大型语言模型内部结构的影响。通过提出更精细的三元神经元分类体系,并构建结合特异性与有效性的统一识别方法,我们揭示了语言相关神经元在多语言能力中的关键作用,并据此刻画了模型在多语言推理中经历的四阶段内部流程。进一步的对齐前后对比显示,多语言对齐会重塑模型内部的神经元参与模式,使模型更倾向于依赖在多种语言间共享的表征结构。这一视角同时为“自发多语言对齐”等现象提供了神经元层面的支持。

总体来看,本文为理解多语言对齐的内部机制提供了更具结构化与可验证性的解释路径,也为后续改进多语言模型的训练方法和对齐策略提供了新的分析依据。

参考文献

[1] She, S.; Zou, W.; Huang, S.; Zhu, W.; Liu, X.; Geng, X.; and Chen, J. 2024. MAPO: Advancing Multilingual Reasoning through Multilingual-Alignment-as-Preference Optimization. In Ku, L.-W.; Martins, A.; and Srikumar, V., eds., Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), 10015–10027. Bangkok, Thailand: Association for Computational Linguistics.

[2] Tang, T.; Luo, W.; Huang, H.; Zhang, D.; Wang, X.; Zhao, X.; Wei, F.; and Wen, J.-R. 2024. Language-Specific Neurons: The Key to Multilingual Capabilities in Large Language Models. In Ku, L.-W.; Martins, A.; and Srikumar, V., eds., Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), 5701–5715. Bangkok, Thailand: Association for Computational Linguistics.

[3] Wendler, C.; Veselovsky, V.; Monea, G.; and West, R. 2024. Do llamas work in english? on the latent language of multilingual transformers. In Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), 15366–15394.

[4] Zhao, Y.; Zhang, W.; Chen, G.; Kawaguchi, K.; and Bing, L. 2024b. How do large language models handle multilingualism? arXiv preprint arXiv:2402.18815.

[5] Zhang, S.; Gao, C.; Zhu, W.; Chen, J.; Huang, X.; Han, X.; Feng, J.; Deng, C.; and Huang, S. 2024. Getting More from Less: Large Language Models are Good Spontaneous Multilingual Learners. In Al-Onaizan, Y.; Bansal, M.; and Chen, Y.-N., eds., Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing, 8037–8051. Miami, Florida, USA: Association for Computational Linguistics.

[6] Huang, H.; Tang, T.; Zhang, D.; Zhao, W. X.; Song, T.; Xia, Y.; and Wei, F. 2023. Not all languages are created equal in llms: Improving multilingual capability by cross-lingual-thought prompting. arXiv preprint arXiv:2305.07004.

阅读原文

跳转微信打开

课程介绍丨基于AIGC工具的文献多模态资源制作与数字叙事设计

2026年4月5日 17:30

2026-04-05 17:30 北京

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

本课聚焦AI时代下的文献多模态资源制作,为教师及其他文化工作者带来更多在教学和创意领域的新思路、新工具。

课程针对古籍、古诗词理解困难和大众传播普及率不高的问题,课程从可信数据视角切入,以敦煌遗书、古诗词为例,演示文献内容从“数据化-信息化-知识化-艺术再造”处理全流程涉及的资料考证、文案策划、视觉传达设计、多模态制作的实操过程和成果展示。

可供中小学文史教师、数字人文教学科研人员、文化创意工作者、爱好者学习借鉴,用于备课、课程教学、创意传播。

主讲人:张宁

北京师范大学文理学院中文系讲师、硕士研究生导师,北京师范大学珠海校区图书馆数字人文中心主任,中国计算机学会(CCF)人文智能专业委员会执行委员。研究方向为古籍数字叙事、VR古籍游戏、数字人文教育等。 主持国家社会科学青年基金1项、省部级课题3项、获中国发明专利授权2项,发表中外学术论文30余篇,主持建设"文献多模态资源AI标注与问答平台”“京师.数字记忆3D展厅平台”“全球数字人文教育资源智能检索平台”。

*了解培训详情及报名请扫描本文海报二维码。

←了解我们正在进行的项目

籍合学院

中华书局旗下

古籍整理与传统文化学习平台

阅读原文

跳转微信打开

课程介绍丨AI时代的数字目录学及其基础设施

2026年4月4日 17:30

2026-04-04 17:30 北京

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

本课程将视角延伸至数字目录学与数字人文基础设施建设,并结合教学反馈展开讨论。

教师将聚焦人工智能时代的数字目录学发展,结合清华大学团队近年来在相关基础设施研发与课程教学中的实践经验,对数字目录学的未来发展方向、基础设施建设路径及相关教学活动进行系统性梳理与反思。

主讲人:唐宸

清华大学人文学院副教授,教育部哲学社会科学实验室“中华传统文化智能实验室”核心成员,兼任《数字人文》编辑,主要从事中国古典文献学、数字人文研究,研发了“典津-全球汉籍影像开放集成系统”“奎章阁-中国古典文献资源导航系统”“中国数字人文(DHCN)”等基础设施。

*了解培训详情及报名请扫描本文海报二维码。

←了解我们正在进行的项目

籍合学院

中华书局旗下

古籍整理与传统文化学习平台

阅读原文

跳转微信打开

上海人工智能研究院2026年人才招聘启事

2026年4月3日 19:49

请关注 2026-04-03 19:49 浙江

重点开展人工智能领域底层关键技术原始创新、核心应用技术突破,研发产业转化、人才培养及产业生态建设工作。

上海人工智能研究院

【在招岗位】

Hot

关于我们:

上海人工智能研究院是由上海市与上海交通大学共建,旨在落实国家对人工智能发展的重大决策部署,深入实施创新驱动发展战略成立的人工智能创新平台,于2019年世界人工智能大会上正式揭牌成立。

研究院承担上海市人工智能研发与转化功能平台建设任务,肩负上海科创中心建设人工智能板块战略发展重要使命,重点开展人工智能领域底层关键技术原始创新、核心应用技术突破,研发产业转化、人才培养及产业生态建设工作,已成为我国人工智能领域具有影响力的新型研发机构。

图片

左右滑动查看更多

在这里,您将接触到:

战略级创新平台: 由上海市与上海交通大学共建,承载国家人工智能发展战略,是上海科创中心建设“AI板块”的核心载体与新型研发机构标杆。

全链条创新体系: 研究院构建覆盖“技术研发-成果转化-产业孵化”的全链条创新体系,具备从基础研究到产业应用的全方位创新能力。

高水平科研团队:研究院已形成“战略科学家+领军人才+青年骨干”梯队结构,打造产学研用深度融合的顶尖创新梯队。

【招聘岗位】

图片

job@sairi.com.cn 

(注明应聘职位及工作年限)

【投递方式】

扫码投递邮箱投递

邮箱:job@sairi.com.cn (注明应聘职位及工作年限)

(岗位详情请阅读下文↓)

【全职岗位】

图片

扫码投递简历

01

算法工程师

Hot

工作职责:

1. 参与各类算法模型的开发、训练和部署;

2. 负责下游多模态、跨语言等方向的任务复现,并在已有平台上进行性能优化;

3. 参与多模态、跨语言等方向的前沿共性技术和应用的研究和实践;

4. 负责项目技术文档的撰写及相关技术工作汇报;

5. 知产、专利方向上与专利工程师/标准化工程师配合,支撑好相关工作。

任职要求:

1. 硕士研究生及以上学历,计算机、人工智能或相关专业;

2. 需要具备复现跨模态数据处理相关算法的能力,优秀的跨语言阅读能力,优秀信息收集整理能力。具备前沿技术研究与实践的能力,能够敏锐捕捉行业最新动态;

3. 熟练掌握Python、C++等编程语言,熟悉TensorFlow、PyTorch等深度学习框架,能够运用工具进行算法开发与模型训练;

4. 项目经验:有算法模型开发、训练和部署的实际项目经验,最好在多模态、跨语言等领域有相关实践经历;

5. 擅长撰写技术文档,能清晰、准确地记录项目流程、技术细节和实验结果,具备良好的技术汇报能力,能有效传达关键信息;

6. 善于跨部门团队协作,共同推进知产、专利相关工作,有团队合作精神和沟通协调能力。

02

数字/智能电网专家

Hot

工作职责:

1. 技术应用创新:探索人工智能与电力电网等能源行业融合应用,推动落地实施。

2. 项目规划与管理:负责相关项目的规划、组织与实施,协调跨部门资源,把控项目进度与质量,确保项目目标达成。

3. 数据分析与决策支持:收集和分析能源数据,运用人工智能技术挖掘数据价值,为企业战略决策、生产运营优化提供数据驱动的建议。

4. 商务拓展及谈判:挖掘潜在的项目商业机会,寻找合作伙伴,推动业务增长。主导或参与商务合同的谈判与签订,把控合同风险,保障合作顺利开展。

5. 客户关系维护:负责重要客户的关系管理,深入了解客户需求,提供定制化解决方案,提升客户满意度和忠诚度,促进长期合作。

6. 行业交流与合作:跟踪行业前沿动态,参与行业研讨会,与高校、科研机构开展合作,引进先进理念和技术,提升行业影响力。

任职要求:

1. 本科及以上学历,具备扎实的电力电网领域专业知识,熟悉新型电力系统、新能源等;精通人工智能技术,包括机器学习、深度学习算法等。

2. 有丰富的商务拓展、客户关系管理和商务谈判经验,熟悉商务流程和合同条款,具备敏锐的商业洞察力。

3. 拥有丰富的人工智能项目开发和电力电网数字化转型、新型电力系统建设等项目经验,能够独立承担复杂项目。

4. 优秀的沟通协作能力,能与不同专业背景的人员有效合作,推动项目顺利开展。对电力电网行业市场动态和商业机会有敏锐的感知,能够及时调整业务策略,适应市场变化。

03

科技发展中心副主任

Hot

工作职责:

1. 科研项目全生命周期管理:负责项目申报、过程监控与验收管理。跟踪国家及地方科技政策,组织策划重大科研项目申报;监控项目进度与经费使用,确保按计划完成;组织结题验收,推动成果鉴定与科技奖励。

2. 对外合作与资源链接:维护政府关系,争取政策与资源支持;拓展高校及科研机构合作,推动联合实验室、产学研项目落地;参与行业活动,挖掘合作机会,提升研究院影响力。

3. 内部协同与团队建设:统筹内部科研资源,优化项目配置;完善科研管理制度与流程;指导培养项目专员,提升团队专业能力。

任职要求:

1. 硕士及以上学历,理工科背景,人工智能、计算机、自动化、电子信息等相关专业优先;

2. 3年以上科研项目管理经验,其中1年以上团队管理经验;

3. 精通国家及上海市各类科技计划项目管理流程、申报规范和评审要点,具备优秀的文字功底;

4. 具备较强的对外沟通和资源链接能力,有政府事务对接经验或高校合作资源者优先;

5. 具备出色的统筹管理能力、合规意识,高度的责任心、敬业精神和抗压能力。

04

品牌发展经理

Hot

工作职责:

1. 科创生态运营规划:结合市场趋势与生态需求,制定生态发展战略、市场策略及渠道运营规划。

2. 产业生态体系搭建:链接政府、高校、科研机构、科技企业、创新平台等生态伙伴,构建稳定合作网络。

3. 项目合作与市场开拓:深刻了解合作伙伴在科创生态的综合发展需求,挖掘品牌及业务合作机会,结合研究院品牌与生态资源,策划并推进合作项目,协同内部相关团队,达成年度工作目标。

任职要求:

1. 本科及以上学历,五年以上科技生态合作、渠道管理、商务拓展BD或产业联盟相关管理经验,具备科技大厂、科创平台、政企合作相关背景,具备政府资源、头部AI企业资源、科技产业上下游资源者优先。

2. 具备较强资源整合能力,高效串联内外部资源,识别机会挖掘合作潜力,聚焦营收转化。具备突出商务洽谈与业务增长思维,独立与合作伙伴中高层建立信任并推进业务,结果导向。

3 执行力强,具备跨部门协同能力、复杂项目推进能力及成本管控意识,善于统筹协调,推动合作与营收目标落地。

4. 熟悉国家及上海科创政策、产业运营模式,推动资源变现与合作伙伴拓展。

05

人才发展业务总监(高等教育)

Hot

工作职责:

1. 营收目标达成与市场开拓:确保达成并超越年度营收指标。独立或带领团队,主动识别、开拓并深耕高教领域(高校、高职)目标客户,建立稳固的客户关系网络,持续挖掘商业机会,推动合同签订与回款。

2. 高教业务资源整合与方案设计:深入了解高教客户在人才培养、学科建设、数字化转型(如AI+教育、智慧教学、科研赋能、师资培训、产教融合)等方面的核心痛点和需求,整合研究院内外部资源,设计并包装符合市场需求、具备竞争力且能规模化推广的相关解决方案及服务产品包(如:AI赋能专业建设方案、智能教学平台与资源服务、高水平师资AI能力培训项目、定制化产教融合服务、科研转化合作项目等)。

3. 科研成果商业化转化:深刻理解研究院在人工智能领域的前沿科研成果,将其有效转化为可面向高教市场销售的产品、服务或解决方案,打通从技术到市场应用的链条,直接服务于营收目标。

4. 业务生态建设与伙伴合作:积极拓展并维护与高教领域的核心院校、关键决策者、行业协会以及互补型科技企业、服务商的战略合作关系,建立互利共赢的业务生态,共同开发市场,实现资源共享与联合销售,扩大业务覆盖面和影响力。

5. 市场洞察与策略调整:紧密跟踪国家教育政策、高教改革趋势、人工智能技术发展及其在教育领域的应用动态,及时调整市场策略、产品方向和销售打法,保持竞争优势。

任职要求:

1. 本科及以上学历;教育、市场营销、工商管理、计算机科学、人工智能等相关专业背景优先。

2. 5年以上工作经验,其中至少3年专注于高等教育(高校、高职)领域的商业化拓展经验(如:销售、商务拓展、解决方案销售、大客户管理)。具备可验证的、成功的业绩达成记录。拥有教育产品/服务销售、解决方案销售、政府/高校大客户管理经验者优先。有教育生态资源整合、产学研合作、科研成果市场转化经验者优先。

3. 熟悉高教业务模式,具备极强的客户需求挖掘、方案价值呈现、商务谈判、合同签订及关系维护能力。

4. 对数字敏感,以达成和超越营收目标为第一要务,具备强烈的进取心和抗压能力。

5. 能够快速理解客户需求,整合内外部资源,设计出有竞争力的综合性解决方案。

6. 深刻理解中国高等教育体系、院校运作机制、决策流程、预算来源及当前热点需求。

7. 出色的跨部门协作能力和高层客户沟通能力,能有效影响内外部关键决策者。

06

生态建设经理(教育方向)

Hot

工作职责:

1. 战略规划:深刻洞察教育及人才培养市场的宏观趋势与微观动态,结合政策导向与研究院的战略目标,主导制定人才培养项目的发展战略及渠道运营规划,确保业务的前瞻性与竞争力。

2. 生态构建:对教育行业全产业链有深入理解,积极开拓政府、中小学、高等院校、职业院校、头部企业及行业组织等关键合作伙伴,构建覆盖上下游的完整、高效、共赢的教育生态体系。

3. 生态运营:维护并深化与现有生态伙伴的战略合作关系,通过策划并执行高端峰会、主题沙龙、工作坊、联合课题等多元化生态活动,持续吸引新的高质量伙伴加入,显著提升生态伙伴的合作体验与粘性。

4. 项目落地:具备卓越的商务谈判技巧与跨部门项目统筹能力,能有效整合内外部生态资源,协调各方诉求,确保教育合作项目及市场活动的顺利策划、高效执行与高质量交付。

任职要求:

1. 本科及以上学历。教育、市场营销、工商管理、计算机科学、人工智能等相关专业背景优先。

2. 3年以上工作经验,其中至少2年专注于教育(K12、基础教育)领域的生态建设经验(如:教育领域的行业协会等任职)。具备可验证的、成功的达成记录。有教育生态资源整合、产学研合作、科研成果市场转化经验者优先。

3. 熟悉教育领域的业务模式,具备极强的生态延展商业方案价值呈现、商务接洽及关系维护能力。

4. 具备强烈的进取心和抗压能力。

5. 能够快速理解院级生态战略意图,整合内外部资源,设计出综合性生态建设方案。

6. 深刻理解中国教育体系、院校运作机制、决策流程、预算来源及当前热点需求。

7. 出色的跨部门协作能力和教育侧合作方的沟通能力,能有效影响内外部关键决策者。

07

国际合作项目主管

(全球工业人工智能联盟卓越中心)

Hot

工作职责:

1. 梳理、识别并持续拓展中心在政府、标准制定组织、国际行业联盟等合作机构中可调动的各类生态资源;建立并维护动态化资源台账,形成结构化资源图谱,确保资源信息完整、准确和可溯源;

2. 对已积累的生态资源进行系统分类与价值评估,分析不同类型资源对产业端和企业端的应用潜力;构建资源对接矩阵,确保资源在不同场景下的精准匹配和高效调配;

3. 积极参与面向产业和企业的业务拓展工作,结合合作企业的实际需求,针对性地组织调动政策、标准、网络等多维度支持资源;为商务解决方案提供有效输入,增强方案竞争力,助力业务拓展目标达成;

4. 在资源盘点与业务支持过程中,主动识别潜在商业合作机会;通过深度分析客户需求与中心资源的结合点,推动合作意向向实质性商业项目转化,贡献中心整体商业可持续发展;

5. 参与关键项目的过程推进,协调内外部资源,跟踪资源到位与利用效果;关注客户侧业务成效,及时反馈并优化资源支持策略,共同保障项目的稳健、高质量落地交付。

任职要求:

1. 本科及以上学历,工商管理、国际关系/事务、经济学、工程管理或相关专业优先;具备工业人工智能、智能制造或相关领域的基础认知;

2. 3年及以上相关从业经验(优秀者可放宽);具有政府资源对接、国际组织合作、产业生态构建或企业业务拓展经验者优先;具备跨文化背景下的商务合作经验者加分;

3. 具备较强的资源整合、生态构建与关系维护能力;

4. 具备良好的商务沟通、谈判能力和客户关系管理能力;

5. 具备结构化思维,能清晰梳理和呈现复杂资源信息;

6. 英语听说读写流利,可独立开展国际合作沟通与谈判;

7. 工作主动、抗压能力强,具备良好的跨部门协作意识。

08

商业分析师

Hot

工作职责:

1. 与客户深入沟通,全面了解其业务现状与技术需求,挖掘潜在问题并提供针对性解决方案建议;

2. 依据客户需求和行业最佳实践,设计技术方案,包括但不限于技术选型、实施方案、项目计划、经费测算等内容;

3. 与客户深入沟通方案,并按需做针对性修改;

4. 在项目实施过程中,提供技术指导,协助解决技术难题,确保项目按方案顺利推进;

5. 总结项目经验,整理成内部知识库,定期进行内外部分享,辅助提升团队水平;

6. 论文、标准、专利等方向上与专利工程师/标准化工程师配合,支撑好相关工作。

任职要求:

1. 本科及以上学历,精通并热爱人工智能技术与产业化应用,具备一定技术功底;

2. 优秀的方案撰写与沟通能力,擅长精准理解客户需求,并交付高质量方案;

3. 出色的沟通技巧,能够将复杂技术概念清晰传达给不同背景人员;

4. 拥有丰富项目经验,能独立应对各类技术挑战,把控项目风险;

5. 持续关注行业动态,快速掌握新技术,为客户提供前沿技术建议。

09

财务主管

Hot

工作职责:

1. 财务管理与规划

- 制定财务计划:根据公司整体经营目标和战略,协助制定财务收支计划、成本费用计划等,确保公司资金的有效配置和使用。

- 预算编制与执行:组织编制年度、季度财务预算,并监督预算的执行情况,及时调整预算以应对市场变化,确保公司财务目标的实现。

2. 会计核算与报告

- 会计核算:负责公司的会计核算工作,确保会计信息的真实、准确、完整。这包括编制会计凭证、登记账簿、编制会计报表等。

- 财务报告:定期编制财务报表,如资产负债表、利润表、现金流量表等,并向管理层和外部利益相关者提供财务报告,反映公司的财务状况和经营成果。

3. 成本控制与分析

- 成本控制:制定成本控制制度和措施,对生产经营过程中的各项成本进行监控和管理,确保成本控制在预算范围内。

- 财务分析:定期进行财务分析,包括盈利能力分析、偿债能力分析、营运能力分析等,为公司经营决策提供财务依据和建议。

4. 税务管理与筹划

- 税务申报:负责公司各项税费的计算、申报和缴纳工作,确保公司依法纳税。

- 税务筹划:根据国家税收政策,进行税务筹划工作,合理降低公司税负,提高公司经济效益。

5. 风险管理与内部控制

- 风险管理:识别、评估公司面临的财务风险,制定风险应对措施,确保公司财务活动的稳健进行。

- 内部控制:建立健全内部控制体系,对公司的财务活动进行监督和检查,防止财务舞弊和违法违规行为的发生。

6. 公司资产管理与规划

熟悉各项资质补贴政策,可针对性规划公司技术资产、专利证书、企业资质等无形资产。

7. 其他工作

- 参与决策:参与公司重大经济事项的决策过程,提供财务分析和建议。

- 协调沟通:与公司内部其他部门及外部相关机构保持良好的沟通和协调关系,确保财务工作的顺利进行。

任职要求:

1. 财务、会计、经济等相关专业本科及以上学历,中级及以上职称;

2. 5年以上财务管理或相关领域工作经验,具备深厚的财务理论基础及实践经验;

3. 精通国家财经法规、税务政策及会计准则,具备较强的财务分析能力和预算管理能力,能够独立完成财务分析报告;

4. 了解企业融资、投资、并购等资本运作流程;

5. 良好的职业素养、具备高度的责任心和职业道德。

10

产业合作经理

Hot

工作职责

1. 政府关系与项目对接

- 负责与地方政府、开发区、科技主管部门等建立并维护良好合作关系

- 对接政府产业规划与政策资源,推动符合地方产业发展方向的重点项目落地

- 参与政府项目申报、政策解读及政企洽谈,提升我院在地方合作中的影响力

2. 孵化企业服务与落地支持

- 对接我院孵化及引进的科技企业,了解企业落地需求(空间、政策、融资、市场等)

- 协调内外部资源,为企业提供从选址、注册到政策兑现的全流程落地服务

- 跟踪企业落地后发展情况,推动形成标杆案例,提升孵化成功率

3. 产业资源整合与活动组织

- 整合产业园区、投资机构、行业协会等资源,构建产业合作生态

- 组织或参与产业对接会、项目路演、政策宣讲等活动,促进项目高效匹配

- 定期梳理地方产业动态与合作进展,形成工作报告

工作要求:

1. 硕士及以上学历,理工科、经济管理、公共管理等相关专业优先

2. 3年以上政府事务、产业合作、园区运营或科技服务相关工作经验

3. 熟悉地方政府运作机制及产业政策,具备政企对接成功案例者优先

4. 有孵化器、科技园区、科技成果转化相关经验者优先

5. 优秀的沟通协调与商务谈判能力,能够高效对接政企双方诉求

6. 较强的项目管理与执行力,能独立推进项目从洽谈到落地全过程

7. 良好的政策理解与文字表达能力,能撰写项目方案、汇报材料等

8. 具备资源整合意识与团队协作精神,抗压能力强

图片

联系邮箱:job@sairi.com.cn (注明应聘职位及工作年限)

(来源:上海人工智能研究院)

阅读原文

跳转微信打开

在典籍中看文明——访中国国家版本馆党委书记、馆长刘成勇

2026年4月5日 09:01

2026-04-05 09:01 江西

分享一篇文章。

中国新闻出版广电报: 在典籍中看文明——访中国国家版本馆党委书记、馆长刘成勇

在文化遗产保护传承日益受到重视的当下,如何理解典籍版本在文明传承中的核心作用?“代代相传的典籍版本见证了世界上唯一没有中断的文明,可以说版本蕴藏着中华民族的精神基因和文化根脉,它是记录历史、见证文明的金种子。”中国国家版本馆党委书记、馆长刘成勇近日在接受《中国新闻出版广电报》记者采访时说,作为国家版本资源总库和中华文化种子基因库,中国国家版本馆肩负着赓续中华文脉、坚定文化自信、展示大国形象、推动文明对话的历史使命。他从历代传世版本谈起,分享了对文化遗产里的中国的深刻思考。

《中国新闻出版广电报》:您怎么看古籍与大众日常生活的联系以及近年持续升温的文博热?

刘成勇:许多人觉得古籍遥不可及,其实不然,古籍与今天大众生活的关联,是“日用而不觉”的。例如,在古籍雕印中有一种常见的“宋体字”,它是在唐楷的基础上,经过宋元明的演变逐渐形成,笔画劲挺峻峭,结构匀称整齐,端庄典雅,适合雕刻,便于阅读,利于传播。到今天,我们仍然在广泛使用这种字体。不论是图书报刊、公文函件、合同协议,还是证件招牌、标题字幕等等,都有宋体字的身影。可以说,古籍中的宋体字已经成为中国人的文化符号之一,在社会生活中一直发挥着巨大的作用,具有重要的实用价值和审美功能。从这个层面上说,古籍就在我们身边,从未走远。

现在有许多人热衷到各个博物馆打卡、集章,包括中国国家版本馆每天都有十几个团来参观,旺季时团队预约甚至排到一两个月之后。我觉得这是一个非常好的事情,令人十分欣喜,这背后,折射出的正是公众日益增强的文化自信与对中华优秀传统文化的由衷热爱。

《中国新闻出版广电报》:相较于各大博物馆,中国国家版本馆有定位与藏品的特殊性,请简要介绍版本馆及藏品对大众了解中华文化的作用,参观前可以做哪些准备?

刘成勇:中国国家版本馆是文明大国建设的基础工程,是功在当代、利在千秋的标志性文化工程,集图书馆、博物馆、档案馆、美术馆等功能形态于一体,全面履行国家版本资源规划协调、普查征集、典藏展示、研究交流和宣传使用的重要职能。在这里,读者可以从中华版本中获得精神滋养,直观感悟中华文明的浩瀚璀璨和中华民族生生不息的精神脉络。

在参观前,可以通过国家版本馆官网或媒体报道提前了解国家版本馆“藏之名山、传之后世”的存藏理念和建设意义。重点关注“明星藏品”,提前熟悉它们的背景知识,比如武则天组织抄写的唐代写本《妙法莲华经》,了解唐代的“三审三校”制度;宋拓孤本《西楼苏帖》,感受苏轼书法的魅力和宋代文人的精神世界。

《中国新闻出版广电报》:如果观众参观后有进一步了解的兴趣,您有什么建议?

刘成勇:若参观之后仍意犹未尽,可从三个方面加深了解。一是阅读书籍,建议从通识性、普及性、趣味性的书籍入手,推荐《馆长眼中的镇馆之宝》,这本书从经济、科技、文明传承视角讲述文物背后的精彩故事,值得一读。若想深入研究,可以订阅《中华版本学刊》,这是新时代版本学领域创刊的第一本学术期刊,方便及时获取版本研究的新动态与新方法。二是中国国家版本馆设有研学项目,精心设计了参观路线,沉浸式VR互动、体验雕版印刷乐趣、创意甲骨文互动,还有宣传画互动屏,每一场研学之旅既有知识厚度,又有互动乐趣。三是参加“文瀚雅集”等交流活动,在“版本展示+晒书鉴赏+座谈交流”中,了解版本征集、版本收藏、研究出版、文创开发等知识。

《中国新闻出版广电报》:您在全国两会上提到正在建设中的中华典籍线上展示平台,可否描绘一下平台建成后的数字阅读体验?

刘成勇:中华典籍线上展示平台是中国国家版本馆建设的综合性数字资源展示平台,实现了对珍贵典籍数字化资源保存、展示与服务。目前平台处于建设起步阶段,已上线展示了17万种古籍和近现代文献资源,让原本“藏在深闺”的文化瑰宝走进了公众视野。

未来我们将着力构建“平台+用户”共建共享生态,逐步上线面向社会各界开放的资源入藏共建、规范审核、发布展示专属模块,打通民间珍贵典籍入藏国家版本资源总库的渠道,同时鼓励公众参与典籍研读、知识分享、校勘补充等活动,营造“人人可参与、人人可传播、人人可传承”的文化氛围。

《中国新闻出版广电报》:中国国家版本馆将如何更好地服务“加强文化遗产保护传承”这一要求?

刘成勇:中国国家版本馆致力于赓续中华文脉,构建中华文化种子基因库,把自古以来能收集到的典籍资料收集全、保护好,把世界上唯一没有中断的文明继续传承下去。我们综合运用法定呈缴、捐赠、采购、寄存、数字化等多种方式,广泛征集中华文明典籍资料,包括中华古籍、甲骨简牍、革命文献、宗教文献、碑帖拓片、方志家谱、雕版印章、档案文书、影音影像、现代出版物、数字版本等,截至目前共收藏实物版本3400余万册/件,数字文献36亿页。

此外,《全民阅读促进条例》正式施行,中国国家版本馆作为国家重大文化工程,其历史使命与“全民阅读”主题天然契合,今年我们将立足丰富的版本资源,以“书香中国 文脉赓续”为主题,推出系列阅读活动,在第五届全民阅读大会上策划举办阅读主题展览,传承弘扬中华文脉,助力书香社会建设。


编辑:吴 凡

审核:樊 凡

图片

最近更新了微信版本的人,大家很难在杂乱的消息列表里找到我!

其实只要简单的几步操作,将我置顶起来——

图片

图片

中国新闻出版传媒集团微信矩阵

↓看看更有针对性的细分领域↓

版话儿

版人版语

传媒瞭望

发行观察

广电家

好书品读

印业独家

中国农家书屋

中国出版

↑喜欢我,就点开二维码图片并识别我吧↑

阅读原文

跳转微信打开

课程介绍丨AI+文献学课程建设与科研思考

2026年4月3日 17:30

2026-04-03 17:30 北京

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

本课开始,老师们将在智慧课程建设这个主题的基础上围绕科研与教学展开进一步思考。

课程以AI+文献学课程为案例,探讨AI在文献学智慧课程设计中的教学应用场景与创新边界;最终落脚于数字化研究方法的学理反思,构建技术工具与人文阐释互鉴共生的文献学研究新生态。

课程的内容要点分别有数字人文与古典文献学的交叉融合路径与思考,AI辅助下的文献学课程设计、教学创新与反思以及文献学的数字化研究方法的思考。

主讲人:贾智

中山大学中国语言文学系(珠海)教授、博士生导师、系副主任。主要研究方向为汉语言文字学,特别是中古汉语、近代汉字的发展、流变和域外传播研究,兼及敦煌遗书、域外文献整理与研究。

*了解培训详情及报名请扫描本文海报二维码。

←了解我们正在进行的项目

籍合学院

中华书局旗下

古籍整理与传统文化学习平台

阅读原文

跳转微信打开

山东大学边疆治理研究院召开技术工作专题研讨会

2026年4月3日 11:07

2026-04-03 11:07 山东

3月27日,山东大学边疆治理研究院召开技术工作专题研讨会。数字人文实验室副主任陈建红主持会议,技术小组成员袁庆豪、王振担任主讲。

会上,袁庆豪详细介绍了研究院依托前沿大语言模型以及检索增强生成技术,针对边疆历史领域开展的一系列系统探索与实践工作。研究院目前完成了近十年(2015-2025),边疆历史学术成果文献的数据清洗工作。通过自动化命名实体识别(NER)与关系抽取流程,构建了包含数十万条边(Edge)的知识图谱体系,在记录层—图谱层联动机制下,实现了面向证据绑定的深度检索(Deep Retrieval)与结构化推理能力。该体系为后续应用提供了可复用的数据基础,并在多轮校验与模态约束机制支持下,有效提升了历史信息的结构化准确性与完整性。

研究院部署了多智能体协作框架,如知识检索Agent、因果分析Agent和内容生成Agent。这些Agent具备任务分解和工具调用能力,不仅解决了一般Agent的数据来源碎片化和推理不透明问题,还探索了“知识图谱+智能体”的融合范式,推动边疆历史研究向智能化方向转型,为数字人文领域提供了实用参考。

王振结合自身研究领域,阐述了数智化相关工作的推进方向及现存问题。他认为AI在处理历史人物相关信息时,可能因训练数据偏差产生认知偏差与叙事失衡,形成片面化的人物评价,进而影响历史研究的客观性。解决办法可依托人机对齐技术,从文献智能整理分析、历史场景三维重建、社会关系量化推演等多个方向推进。

研究院执行院长苗威教授做总结:一是在推进技术开发的同时,需深耕经典文献,不断涵养学术底蕴、提升学术品位;二是要秉持理论高度,面向国家需求,结合具体问题落地实施,经世致用;三是要以技术手段回应历史研究问题,始终与历史学家的学术需求同频共振。她进一步要求大家扎实人文功底,精进技术能力,做好学术传承。

文以载道,数以启新。本次研讨会不仅加深了大家对技术研发与学术研究结合的理解,更激发了运用数智工具开展科研创新的热情。山东大学边疆治理研究院将继续以国家需求为导向以智能技术为支撑,在边疆研究与实践中勇毅前行。

作者|王振、许嫄

图片|徐晓婷、姜思彤

编辑|徐晓婷

审核|刘加明

编审|陈建红

阅读原文

跳转微信打开

饶高琦 | 基于市场需求的新质语言教育探索

2026年4月4日 09:00

徐惠 2026-04-04 09:00 江苏

数智时代新质语言教育成刚需,探析人才培养、困境及重构路径。

转载自“语言教学与研究”


本文来源:魏晖,施春宏,刘晓海,等.“新质语言教育”大家谈[J].语言教学与研究,2026,(02):1-15.

图片

编者按

语言教学与研究

数智时代的到来与技术的飞速发展引发市场对人才需求结构的根本性转变,着力培养“懂语言十懂技术”以及能应用、会管理的多元化、技术化、场景化复合型人才已成为时代发展的迫切要务,这一趋势正驱动着语言教育的深层次变革。有学者认为,变革的方向是以服务新质生产力发展为根本导向,以培养国家和社会急需的新质语言人才为根本任务,以高科技为驱动,以高效能为追求,以高质量为目标,可称之为新质语言教育。本期刊发的“大家谈”讨论了新质语言教育的基本定位、属性特征和相关学科建设问题,分析了新质语言人才的核心能力与培养面临的现实困境,提出了新质语言教育的路径重构,讨论了面向应用场景的语言工程人才的核心能力,基于实践初步构建了培养卓越语言工程师的新质语言教育体系。欢迎学界同仁积极参与、共献智慧,大力推进新质语言教育研究和实践工作,欢迎大家就相关专题做出具体的实证研究和理论思考。本刊将持续推动相关研究,以践行“推进学术,建设学科,发展事业,服务社会”的办刊宗旨。


基于市场需求的新质语言教育探索

北京语言大学语言科学与资源学院 饶高琦

在人工智能与数字经济的双重驱动下,市场对语言人才的需求已从单一技能型,转为“语言学十技术十场景”的复合能力型。2025年初教育部、国家语委、中央网信办联合印发《关于加强数字中文建设 推进语言文字信息化发展的意见》,明确提出“构建数字时代语言人才培养体系,强化语言智能与多领域融合应用”,这为语言人才培养的转型发展指明了方向。在教育强国战略背景下,立足语教融合理念与“大语言学观”,变革语言教育,培养适应市场需求的语言人才(可称之为新质语言人才,相应的语言教育称为新质语言教育),既是语言学学科自身发展的内在要求,也是服务国家数字经济建设的必然选择。

一、市场需求驱动下新质语言人才的核心能力构成

(一)新质语言人才的市场需求

当前,语言人才市场呈现多元化、技术化、场景化特征。从招聘市场数据看(基于本课题组在几大主流招聘网站进行的相关招聘广告的抓取和分析),人工智能与数据标注相关岗位占比已达62%,成为新质语言人才的核心需求领域,典型岗位包括AI训练师、数据标注师、提示词工程师等。数据标注产业的蓬勃发展直观反映了市场对基础语言人才的迫切需求。我国目前已有5.8万全职数据标注员(数据来源:中国信通院《数据标注产业发展研究报告(2025)》)。经估算,2025年我国数据标注员岗位缺口将高达100万,数据标注市场规模达到102.1亿元(数据来源:中商产业研究院)。数据产业不仅提供了大量基础岗位,更催生了对数据标注管理、语料库建设、标注规范制定等中高端人才的需求。这些岗位从业人员不再局限于传统语言学的培养内容,而是要求将语言学理论转化为机器可识别、可处理的结构化数据与规则体系。而大模型背景下的人机交互则进一步拓展了新质语言人才的就业边界,催生了大模型产品经理、提示词工程师等岗位。它们要求从业者兼具语言学素养、逻辑思维与产品意识。除技术导向型岗位外,文化传媒与编辑、教育科研、技术支持与本地化等领域对语言人才的需求也呈现出交叉融合特征。本地化技术支持岗位要求掌握多语言翻译与跨文化沟通技能。这种多元化需求图景表明,新质语言人才必须突破单一学科局限,形成适应多场景应用的能力体系。

(二)新质语言人才的核心能力

2018年,谷歌公司在语言资源与评测大会(LREC)上发布了“语言学者工业界就业能力量表”(下称“谷歌能力量表”)。虽然IT技术在过去7年出现爆发式增长,但其能力侧面依然有效。结合我国特点,我们认为新质语言人才的核心能力可从语言学本体、技术应用、交叉融合与场景落地四个维度进行概括。

语言学本体能力是基础,涵盖语音学、句法学等核心理论,需掌握国际音标、语料库技术。

该能力在谷歌能力量表占比33%,是区分专业与普通语言从业者的关键。技术应用能力是核心竞争力,包括编程、数据处理、大模型使用等技能。本课题调研数据显示,60%以上A1相关岗位要求编程与数据处理能力,基础标注岗有脚本编写能力者晋升更优。

交叉融合能力体现“大语言学观”,要求打破文理藩篱,融合计算机、社会学等多学科知识。如社交媒体运营需结合语言学与社会学挖掘语言规律,医疗、金融相关岗位需融合对应行业知识。这是市场需求,也是语言学科创新发展的路径。

场景落地能力强调理论落地,须具备需求分析、产品思维等素养。

二、新质语言人才培养的现实困境

(一)学科壁垒尚未打破,培养体系滞后

当前传统中国语言文学、外国语言文学等专业课程设置偏重理论研究,与计算机科学、数据科学等技术学科的融合不足。本课题调研了多所高校语言学专业课程发现,编程、数据处理、AI技术处理相关课程占比不足10%,导致学生技术应用能力薄弱,难以满足市场对“懂语言十懂技术”复合型人才的需求。本课题调研显示,58%语言工程类岗位明确要求计算机或数学背景;即使是数据标注等基础岗位,也有近68%要求应聘者有相关经验。

在学科困境中,尤为凸显的是跨学科师资力量匮乏和教学模式创新不足的问题。新质语言人才培养需兼具语言学理论功底与技术应用能力的跨学科师资。但当前教师队伍,缺乏产业实践经验与技术训练,难以有效开展跨学科教学。部分高校虽尝试引人计算机专业教师参与,但由于学科差异巨大,协同难度大,课程内容衔接不畅,难以形成系统的培养体系。

此外,教学模式创新不足也制约了人才培养质量提升。当前教学仍以课堂讲授为主,互动式、项目式教学占比偏低,导致学生实践能力较弱。

(二)语言资源建设与利用不充分,人才供需匹配度不高

语言资源的建设和研究是数智时代对语言学学科提出的重大需求,特别强调语言资源的监测、挖掘和利用。但当前高校语料库建设普遍存在规模小、类型单一、更新缓慢等问题,缺乏多领域、多模态的真实语料资源,与企业实际应用场景脱节。语言智能技术平台建设滞后,多数高校尚未配备先进的AI训练工具、语音处理设备等,学生既缺乏相关意识培养,也不具备实践操作的软硬件条件。

三、基于市场需求的新质语言教育路径重构

(一)坚持语教融合,构建跨学科培养体系

语教融合是新质语言教育的核心理念,这要求打破语言学和语言教学、语言和技术、理论与实践的教学壁垒,实现知识、技能与素养的一体化培养。在课程体系重构方面,应立足“大语言学观”,以语言本体计算为核心,构建“基础理论十技术技能十场景应用”的模块化课程体系,基础理论模块保留普通语言学、应用语言学等核心课程,增设语料库语言学、计算语言学、语言资源学等交叉课程,夯实语言学基础;技术技能模块引入脚本编程、数据结构、机器学习基础、A1工具应用等课程,培养技术应用能力;场景应用模块根据市场需求设置NLP应用、语言模型训练、跨文化沟通、舆情分析等课程,提升场景落地能力。

在教学模式创新方面,应推广项目式教学、案例教学等方法,以真实产业项目为载体,引导学生主动参与问题解决。建立校企联合教学团队,邀请企业专家参与课程设计与教学,将技术需求与实践案例引入课堂。为此可构建“课堂实践十校内实训十企业实习”的三级实践教学体系,强化学生的场景落地能力。

此外,还应加大投入建设校内实训平台,配备数据标注工具、语音合成系统、大模型训练平台等条件,为学生提供常态化的实践环境。

(二)立足资源导向,强化语言资源建设与利用

语言资源建设是新质语言教育的重要方面。在语料库建设方面,应联合高校、企业、科研机构共建共享超大规模、轻度加工、来源多样、动态更新、建设主体多元化的语料库。建立语料库标注规范与质量控制体系,提升语料库的可用性,同时培养学生的语料库建设与使用能力,新质语言教育的实施过程,也是推动语料库建设的过程。

构建语言资源共享机制,打破高校、企业间的资源壁垒,建立国家级语言资源共享平台。整合各类语料库、技术工具、教学等资源,实现资源的高效利用。鼓励高校教师基于共享资源开展教学改革与科研创新,开发个性化的教学案例与实践项目。

(三)对接教育强国战略,完善人才培养保障体系

应加强顶层设计,将新质语言人才培养纳入国家语言人才发展规划,明确人才培养的日标、任务与路径。教育行政部门加大对语言学学科建设的支持力度,引导高校优化专业结构:加快跨学科专业建设,重点支持AI与计算语言学、语言智能教育等新兴方向。加强师资队伍建设,打造一支兼具语言学理论功底、技术应用能力与产业实践经验的跨学科师资队伍。

四、结语

实施新质语言教育是一项系统工程,需要立足教育强国战略,坚持语教融合理念与“大语言学观”,打破学科壁垒,创新培养模式,强化资源支撑,构建适应数字时代发展要求的人才培养体系

高校作为人才培养的主阵地,应主动适应市场需求变化,深化教学改革,加强校企合作,提升人才培养质量;企业应积极参与人才培养过程,提供实践平台与技术支持,实现人才供需精准匹配;政府应加强政策引导与资源支持,营造良好的人才培养环境。

图片

作者简介

语言教学与研究

饶高琦,北京语言大学副研究员、硕士生导师。北京语言大学语言学及应用语言学博士。中国中文信息学会青年工作委员会、计算语言学专委会、社会媒体计算专委会委员。主要研究方向为语言资源学、教育技术、语义规划学和数字人文。主持国家语委科研项目、教育部人文社科基金项目等多项课题,发表学术论文 50 余篇,参与起草规范、标准 5 种

比特人文

投稿邮箱:dhbase@126.com

扫码关注 获取更多资讯

图片

阅读原文

跳转微信打开

Call for paper | NLPCC 2026

2026年4月3日 09:00

NLPCC 2026 2026-04-03 09:00 江苏

NLPCC 2026于11月在澳门举办,6月13日截稿,录用论文由Springer出版。

转载自“计算机科学讲义”

会议全称:

The 15th CCF International Conference on Natural Language Processing and Chinese Computing (NLPCC 2026)

时间地点:

2026年11月3-5日,澳门

会议网址:

http://tcci.ccf.org.cn/conference/2026/

联系人:

info@nlpcc2026.org

投稿链接:

https://openreview.net/group?id=ccf.org/NLPCC/2026/Conference#tab-recent-activity

大会简介

CCF International Conference on Natural Language Processing and Chinese Computing (NLPCC 2026) 是中国计算机学会自然语言处理技术委员会的年度会议。自2012年创办以来,已在郑州(2020)、青岛(2021)、桂林(2022)、佛山(2023)、杭州(2024)和乌鲁木齐(2025)等地成功举办。NLPCC是自然语言处理和中文计算领域领先的国际会议。它为来自学术界、产业界和政府部门的研究人员和实践者提供了一个重要的交流平台,分享思想、研究成果和经验,并促进相关领域的研究和技术创新。

NLPCC 2026 将延续这一传统,欢迎提交原创性、高质量的研究成果。所有录用论文将由 Springer Lecture Notes in Artificial Intelligence (LNAI) 出版,并提交至主要学术数据库检索,确保研究成果的国际传播与学术影响力。

征稿方向

NLPCC 2026 欢迎以下领域的原创研究成果(包括但不限于):

  • 语言学与自然语言处理基础:Discourse and Pragmatics; Linguistic Theories, Cognitive Modeling and Psycholinguistics; Phonology, Morphology and Word Segmentation; Semantics; Syntax: Tagging, Chunking and Parsing

  • 机器学习、模型与智能体:Machine Learning for NLP; Interpretability and Analysis of Models for NLP; Large Language Models; LLM Agents

  • 多模态与交互系统:Machine Translation and Multilinguality; Speech and Multimodality; Dialogue and Interactive Systems

  • 信息抽取、检索与文本理解:Information Extraction and Knowledge Acquisition; Information Retrieval and Text Mining; Question Answering; Text Summarization and Generation

  • 应用与伦理:NLP Applications; Computational Social Science and Social Media; Sentiment Analysis; Ethics and NLP; Resources and Evaluation; AI for Science; AI for Software Engineering

重要日期

  • 投稿截止:2026年6月13日

  • 录用通知:2026年8月4日

  • 终稿提交:2026年8月15日

大会组委会

General Chair

Yue Zhang, Westlake University

Program Chairs

Roy Ka-Wei Lee, Singapore University of Technology and Design

Qi Zhang, Fudan University

Meishan Zhang, Harbin Institute of Technology (Shenzhen)

Workshop Chairs

Tieyun Qian, Wuhan University

Yang Zhao, Institute of Automation, Chinese Academy of Sciences

Evaluation Chairs

Jie Yang, Harvard University

Kunli Zhang, Zhengzhou University

Tutorial Chairs

Zhaochun Ren, Leiden University

Wenbin Jiang, Beijing Normal University 

Xiting Wang, Renmin University of China

Publication Chairs

Jianxing Yu, Sun Yat-sen University

Jin Wang, Yunnan University

Organization Chairs

Derek F. Wong, University of Macau

Haofen Wang, Tongji University

往届论文推荐

欢迎通过Springer出版您组织的学术会议,联系编辑团队获取合作信息!

比特人文

投稿邮箱:dhbase@126.com

扫码关注 获取更多资讯

图片

阅读原文

跳转微信打开

辅助,而非取代:声像档案的AI元数据生成模型与文化诠释

2026年4月3日 09:10

原创 魏小石 等 2026-04-03 09:10 北京

影音档案; 人工智能; 元数据生成; 文化诠释; 人机协同; 声音遗产; 检索增强生成(RAG); 民族音乐学; 知识图谱

转载请注明“刊载于《数字人文研究》2025年第4期”;参考文献格式:魏小石,马修·詹姆斯.辅助,而非取代:声像档案的AI元数据生成模型与文化诠释[J].数字人文研究,2025,5(4):60-67.全文PDF已在知网、万方及编辑部网站(http://dhr.ruc.edu.cn)上发表,此处注释及参考文献从略。

辅助,而非取代:声像档案的

AI 元数据生成模型与文化诠释

魏小石  马修·詹姆斯

摘要:文章探讨了在全球影音档案快速增长、文化语境日趋多元而机构资源普遍受限的背景下,如何借助AI技术实现从“数字化”到“知识化”的转型。面对资金紧缩、人才短缺及知识更新滞后等“三重困境”,传统的档案编目方式难以应对海量且多语种的声音材料。文章强调AI工具应定位于“辅助”而非“取代”人类专家的文化诠释能力。通过二位作者执行的人机协同著录案例,文章展示了如何结合RAG(检索增强生成)技术、专业标注框架与古典文献知识库,构建具备文化敏感性与语义深度的专用AI著录系统。最终,文章主张民族音乐学及相关领域学者应主动参与专用AI模型的共建,推动人机协同的编目新范式,在提升档案可及性的同时,维护文化诠释的准确性与多元性。

关键词:影音档案; 人工智能; 元数据生成; 文化诠释; 人机协同; 声音遗产; 检索增强生成(RAG); 民族音乐学; 知识图谱

作者简介:魏小石,中国音网(cdtmusic.com)总编辑,伦敦大学亚非学院客座研究员; 马修·詹姆斯(Matthew James),传统音乐智能体平台“Echo Arc”(声穹)联合创始人。

0  序言:

声像档案领域的“三重困境”

今天在此向学界同仁郑重介绍一项正处于起步阶段的研究计划——“EchoArc”(声穹)。这项计划的核心,远不止于构建一个技术性的概念原型;其更深层的旨趣,在于尝试搭建一个促进全球范围内档案馆、图书馆、博物馆(以下简称“GLAM机构”)以及相关机构之间系统性对话与协同共建的框架。我们怀揣这样一个愿景:在声音与视听档案数字化与知识化转型的关键历史节点,借助合乎伦理且智能化的技术中介,让散落于世界各个角落、承载着人类多元记忆与文化表达的声音档案收藏,能够以前所未有的深度与广度“被听见”(discoverable)、“被理解”(comprehensible),并最终更公平、更高效地“被获取”(accessible)

这一愿景的紧迫性,正源于一个我们共同面临的宏观趋势:全球声音档案(sound archives)的物理与数字存量正呈指数级增长(尤其是原生数字档案),其载体格式日益复杂,内容所涉语言与文化语境更加多元。与之形成根本张力的是,对声像影音遗产(及其文本格式的元数据及描述)进行高质量的组织与管理——包括其鉴定、著录、编目、保存与诠释,至今仍是一个深度融合了高度专业化人工判断与精细化操作的体系。这一过程不仅是劳动密集型的,其核心更在于对文化语境进行智慧密集型的解读与表征,因而难以被当前主流的自动化逻辑所简化和替代。

当下,GLAM机构正面临三种结构性的困境。首先,持续性的资金紧缩与预算不确定性已成为常态。许多GLAM机构的研究与典藏部门预算常年停滞甚至削减,而数字保存、基础设施升级与专业软件采购的成本却在不断攀升(Terras, 2015)。这使得机构在资源分配上往往陷入艰难抉择:是优先保障实体物料的物理安全,还是投资于数字化转型的长期需求?这种资源窘境直接导致了许多珍贵但“非核心”或未被充分描述的声像典藏被迫“沉睡”,难以进入整理与编目的序列。

其次,专业人才的结构性短缺与流失危机日益严峻。精通音响档案理论与实践、具备音乐人类学(民族音乐学)、语言学、民俗学知识,同时熟悉当代元数据标准(如MARC、Dublin Core、EBUCore等)的编目专家本身便是稀缺资源(Lee et al., 2021)。随着资深专家的退休,机构内部往往出现严重的知识和技能断代。与此同时,就业市场对数字技能的重塑,使得新一代信息专业人才的职业选择更加多元化,传统GLAM机构的吸引力相对下降,导致专业人力资源的补给线异常脆弱。

最后,传统知识与技能的更新速度与复杂的档案工作需求之间的落差在不断拉大。声像档案的内容包罗万象,从濒危语言录音、传统音乐表演、口述历史到环境声音景观,每一种类型都需要编目者具备相应的背景知识、文化敏感度与描述词汇表(Matusiak et al., 2019)。面对海量、多语种、多文化的待处理资料,任何单个机构、单个领域的工作团队,其知识储备都显得捉襟见肘。人工创建高质量的、具备多平台易用性的元数据,不仅要求描述事实的准确性,更要求对文化语境、表演实践、历史背景进行深度诠释,这是一项极其耗时、费力且需要持续学习与协作的智力工作。

正是这“三重困境”的交织与加剧,将一个明确而急迫的需求推至我们面前:开发具有可扩展性、可持续性的智能辅助工具,为GLAM机构的声像档案工作所用。这类工具的核心目标,并非天真的“自动化替代”,而是在尊重个体学者不可替代的核心判断力的前提下,赋能档案工作者与编目人员。在预算受限、人力不足的客观条件下,借助这些工具,能更高效地处理数据录入、格式转换、基础标引等重复性劳动,从而将宝贵且有限的人力(学者)资源释放到更需要人文洞察、批判性思维与跨文化沟通的环节中去——例如语境构建、关系关联、伦理审核与深层知识挖掘。唯有通过这种人机协同的新模式,我们才有希望系统性地整理、激活那些目前“被遗落的声景”,让这些承载着族群认同、历史记忆与生态智慧的珍贵声音,真正融入当代文化遗产网络之中,在数字(智)时代获得新生。

1  “辅助”而非“取代”

任何旨在辅助档案工作的工具,在处理那些承载社群历史、情感认同等复杂(且敏感)的民族志信息时,其设计与应用必须以维护信息的准确性与文化的细微差异为前提,而非将其作为效率的代价。这一原则构成了我们工作的基石。

为此,我们正致力于开发专门面向图书文献与文化遗产领域的特定AI模型。该模型的核心功能是辅助生成并翻译声像档案的元数据。在开发过程中,我们严格遵循MARC、Dublin Core等国际主流元数据标准,并将精准性、文化敏感度及学术协作规范嵌入模型的设计目标。通过自动生成符合这些标准的不同格式元数据文件,该工具旨在直接减少档案工作者在数据录入、格式转换等环节的重复性劳动负荷,从而有效提升档案材料在编目与收录初始阶段的处理效率和基础可访问性。我们的技术路径规划是从单个集合(及其条目)的细粒度描述入手,经过验证与迭代后,逐步扩大应用规模,从一个收藏扩展到另一个收藏。在此过程中,目标是将不同社群、不同学术传统中多层次、细节丰富的知识结构与描述逻辑,持续、可控地嵌入AI的学习过程,使其理解并尊重文化描述的复杂性

将AI技术引入高度专业化且充满诠释多样性的文化研究领域,引发疑虑是自然而然的。现实是,生成式AI已在诸多行业展现出大面积替代人力的趋势,我们亲历目睹了自由撰稿、基础编辑等领域在短时间内发生的职业重构。然而,必须清醒认识到:生成式AI虽然能够快速生成文本,但其产出在准确性、事实丰富性、真正的创造性以及具有文化说服力的叙事方面,尚未证明其能够超越受过严格训练的人类专家。它的“快”未必等同于“好”,更不意味着在理解文化深层意义方面具有优势

基于此,我们亟需明晰项目的根本定位:我们的目标绝非是利用自动化技术“取代”人类在元数据生成、翻译与著录模式整合(schema integration)等环节的专业技能。我们致力于打造的是能够与人类专家协同工作、并能在专家反馈下持续学习的智能工具。其核心价值在于,将专家学者从繁重、机械的数据处理工作中解放出来,将他们宝贵且有限的智力与时间资源,重新配置到那些无可替代、更需要人文洞察与批判性思维的任务中去。工具的价值,在于增强(而非削弱)人类知识的核心判断力。

2  如何开发AI编目工具?

——从通用模型到专用系统的路径

那么,我们该如何开始开发真正适用于文化遗产领域的AI辅助工具?首要步骤是明确认识到当前技术方案的局限性。目前,ChatGPT和DeepSeek这类通用型、“一体适用”的大型语言模型,在处理高度专业化、对文化语境极其敏感的档案编目任务时,其“表现”仍然相当粗糙。我们曾进行过一项具体测试:向DeepSeek模型输入来自一套哈萨克音乐集合的数字化音频文件、与之配套的原始档案说明文字,以及数篇经过同行审校、权威出版的民族音乐学研究文献,指令是生成符合图书馆行业标准的MARC编目记录。从表面产出看,模型在短时间内确实生成了一套结构上看似完整的MARC记录,包含了一些基础字段。然而,经过与领域专家的仔细核验,一系列明显且关键的错误与遗漏暴露无遗,这些缺陷系统性地揭示了通用模型的根本不足。

首先,在基础数据准确性与规范性层面,问题显而易见。例如,在涉及西里尔字母书写的哈萨克语人名、地名音译时,模型生成的文本并未遵循国际图书馆界通用的音译标准(如ALA-LC罗马化表)。这种细微的偏差并非无足轻重,它直接破坏了元数据在未来进行跨机构、跨数据库交叉引用与聚合时的互操作性,也严重影响了用户在检索时通过不同书写形式准确找到目标资源的能力。类似地,在地点和日期这类核心描述字段中,模型给出了“20世纪”或“阿勒泰—新疆”等极为模糊的信息。在强调精确来源出处与特定文化地理背景的档案著录语境中,此类描述非但无用,反而会引入歧义,使得后续研究者难以确定录音具体的地理归属与历史时段。

其次,在描述深度与语义丰富性层面,通用模型的输出显得过于笼统和扁平化。对于表演者的角色标注,模型通常仅列出姓名,却完全未能具体说明其在一段录音中的具体职能——某个人究竟是器乐演奏者、歌手、叙述者,还是兼而有之?此外,也未区分其贡献是表演一首经典传统曲目,还是对某个特定版本进行了个人化的诠释。在主题标引方面,模型往往只能提取最表层的、形式化的类别,如“民间音乐,哈萨克斯坦”,而完全忽视了深嵌在音乐之中的文化、信仰与生态维度,例如反映自然崇拜的“泛灵论”(animism)主题,或是录音中可能包含的特定“环境声音”(如风声、水流、牲畜叫声)。这些深层主题标签对于理解录音的文化意义至关重要,尽管它们在提供的背景文献中已有明确论述,模型却无法有效识别并转化为结构化元数据。

最后,在数据结构完整性层面,模型生成的MARC记录常常在关键字段中只保留空泛的占位符或指示性文本,而缺失了实质性的具体内容。这导致记录在形式上看似完整,在机读格式上也无错误,但在编目员和研究者看来,却缺乏进行有效知识组织与检索所必需的核心信息单元。

上述种种问题,绝不仅仅是单纯的技术瑕疵或数据训练不足。它们共同指向一个更深层、更本质的事实:元数据从来不是中性中立的;它并非是对客观事实的简单转录,而是一种文化的诠释,是特定知识体系、学术传统乃至认同观念的体现。一个主题词的选择、一种音译规则的采用、一个地理名称的表述方式,都蕴含着对文化内容的解读框架与价值判断。因此,即便是连字符的使用、主题标目的粒度、MARC字段内的分隔符,或是人名音译的标准这类最微小的细节,都会对这段录音未来如何被保存、如何被发现,以及最终如何被学术界和社会所重视,产生深远的影响。对于哈萨克音乐这类(可能)处于主流话语边缘的文化传统而言,高质量的元数据不仅仅是一种描述工具,更是一种伦理基础设施。它承担着公正表征文化身份、确保其能在全球知识体系中获得可见性与可理解性的责任

这一点,在田野录音的语境下显得尤为沉重,且紧迫。许多珍贵的实地录音,是民族音乐学者历经数十载,辗转于多个田野地点,克服重重困难才采集到的文化瑰宝;也有些录音,承载着一个家族对散居他乡或已故亲人的声音记忆,是社群情感与历史传承的非物质载体。对于这些凝结着巨大智力投入与深厚情感价值的材料,元数据的著录质量,直接决定了这些声音在未来数字环境中能否被尊重地对待、被准确理解其语境,并得以有效传承给后代。粗糙或错误的元数据,无异于在数字世界中对这些珍贵遗产进行二次损害,使其陷入新的“沉默”或“误读”之中。

3  AI技术实践的“一小步”:

赋能中国近现代声音文献检索

以下,以一项针对20世纪20—30年代78转唱片的具体研究为例,阐述我们在AI辅助编目领域的初步实践。刚才所讨论的关于AI工具设计的核心问题,并非空泛的理论推演,而恰恰源于我们此前对一项基础性测试的直接观察。在该测试中,我们系统地探究了AI如何从庞杂的、非结构化的原始信息中,自动识别并提取出符合专业编目要求的结构化元数据。这一尝试,其意义超越了单纯的技术验证;它本质上是对传统编目方法论边界的一次主动拓展,旨在探索人机协作模式下,知识组织逻辑所能延伸至的新领域与可能达到的新深度。

必须承认,当前对汉语有声文献——尤其是历史录音——进行系统化数据采集与智能化处理,面临着多层次的现实挑战。在图书馆学与信息科学领域,对文献资源进行准确、规范的描述,是一切知识组织与服务的基础。我们的实践表明,现有通用AI模型的知识库与认知框架存在显著局限。具体而言,对于具有强烈地方性特色的声音或音乐表演内容,例如那些依赖于特定地域文化、使用小众乐器或承载独特曲艺形式的录音,AI的认知表现出明显的匮乏与不确定性,其生成文本描述时常包含事实性谬误或文化误读。这种“知识盲区”使得AI难以独立承担对这类遗产进行高质量编目的任务。

正是为了应对这一核心挑战,我们与中国人民大学国学院吴洋教授的研究团队建立了跨学科合作,共同启动了名为“AI赋能中国近现代声音文献检索、深度描述与古典学研究——以北方曲艺为例”的项目。该项目旨在构建一个新颖的研究范式,即尝试利用经过严谨校勘、体系严整的中国国学经典文献所构成的权威知识库,作为AI模型理解相关文化内容的“锚点”与“基石”,进而对北方曲艺(如京韵大鼓、单弦、岔曲等)唱片中的唱词文本,进行系统化、多维度的深度语义标注。

北方曲艺的唱词文本,是一个蕴藏丰富的文化信息复合体,其中频繁用典、化用诗文、涉及大量历史人物、事件、民俗事象与地方性语言表达。然而,长期以来,这些唱词所承载的深厚文化内涵,并未与其源头的古典文献建立起深度、系统化的知识关联。传统的整理工作可能止步于唱词文本的转写与基本说明,未能将其置于更宏大的中华典籍与历史语境中进行互证与阐释,从而未能催生出经过深度考据与跨文本验证的、立体化的知识网络。

目前,我们(中国音网团队)已完成了相当规模的北方曲艺78转唱片的数字化转储,并初步整理了对应的唱词文本,形成了基础的、“结构化的”数据层。本项目当前阶段的核心任务,正是要突破这一层,致力于从历代文集、笔记小说、方志、韵书等浩瀚的“非结构化”古典文献中,提取相关知识单元(如典故出处、历史背景、词汇源流、民俗考释),并将这些提取出的知识点,精准地“编织”回北方曲艺唱词所对应的具体声音语境中去。

项目的学术核心,由人大国学院团队主导,师生们创造性地构建了一个从文献学、文学、历史学、民俗学、语言学五个核心维度出发的唱词深度标注框架与知识图谱模型。这五个维度并非孤立,而是相互交织:文献学考究版本与源流,文学分析文体与修辞,历史学定位事件与人物,民俗学解读仪式与风物,语言学辨析音韵与词汇。项目组成员需要手动标注至少1000个知识点,为AI理解提供结构化的认知地图。

在技术实现层面,中国音网团队负责提供关键的RAG技术架构。RAG,即“检索增强生成”,并非一个“开箱即用”的解决方案,而是需要精心设计和训练的技术范式。在本项目中,我们利用RAG的核心机制,为AI智能体赋能,使其能够:首先,在面对一段具体唱词时,自动识别其中可能涉及的知识点(如,某个典故、某个古地名),并触发对海量古典文献数据库的精准检索;其次,将检索到的相关文献片段作为增强的上下文信息,与原始唱词一并输入生成模型;最终,引导模型生成具有溯源依据的深度描述、注释或关联性分析。这一过程旨在系统性提升三大能力:一是语义还原能力,即准确理解唱词在古代汉语语境中的本义与引申义;二是跨域关联能力,即在曲艺唱词、历史记载、文学作品、民俗报告等多类型文本间建立有意义的链接;三是知识注释能力,即产出符合学术规范的考据性说明。

其后,更为关键的是“情境训练”。这一阶段的训练目标,是让AI模型学习并掌握“进入关联性知识图谱的路径”,实质上是教会它如何像该领域的学者那样,不仅能“回答”问题,更能帮助大众读者以符合学术探究习惯的方式“提出”问题,并自主进行知识追溯与关联分析。具体而言,这一过程高度依赖项目组成员——特别是具备文献学与曲艺研究背景的专家——进行手动的、高度情境化的问答训练。专家们并非简单地提供标准答案,而是需要模拟研究过程中真实的思维链条与探究场景。例如,他们不会直接问“《击鼓骂曹》中‘渔阳三挝’的典故出处是什么?”,而是可能从一个更开放、更具引导性的情境切入,比如:“如果我们听到一段鼓曲唱词中提到了‘祢衡’和‘曹操’,并伴有激昂的鼓点描述,我们该如何联想到汉代的相关史实与文学形象?又如何进一步探究‘鼓’在这一叙事中的象征意义及其与具体曲艺表演程式的关联?”

通过大量此类情境化、多轮次的问答“对话”,AI模型被引导去理解:一个知识点(如“祢衡”)如何作为入口,自然地关联到人物传记、历史事件、文学作品、音乐表现等多个知识图谱节点。更重要的是,它学习到人类专家在探索这些关联时所使用的语言模式、逻辑递进方式以及提问策略。这相当于为AI注入了专业领域内的“探究性思维”模板,使其能够逐渐学会从非结构化的文本中自主识别出潜在的知识关联线索,并以更贴近人类学术习惯的、连贯且富有逻辑的语言,进行深度的语义还原与知识注释。这一训练是将静态的知识库转化为动态、可推理的智能系统的核心环节。

本项目这“一小步”技术实践的长远目标,正是希望借助AI的赋能,系统性地应对声像档案著录、编目与诠释的核心挑战。将声音背后那些分散于不同典籍、隐含在表演细节中、且需极高专家素养方能建立的文化知识关联(如唱词典故、音乐程式、历史语境),转化为显性、系统、可规模化的结构化知识,我们旨在构建一座桥梁。这座桥梁连接着原始的声音资料与丰富的文化语义网络,使这些档案不仅能被听见,更能被深度理解与文化传承。

4  结语

利用AI技术构建MARC编目记录通用架构,仍存在诸多疑虑,也兼具多重利弊,但曲艺有声文献的案例,也展示了AI整合非结构化数据集(特别是源自中国古代文学经典的叙事音乐资料)的潜力。我们实践的个体项目之力难以改变整体格局,但我们坚信,唯有以具体问题为起点,启动AI智能体的领域化训练,方能切实迈出推动人文学科与AI技术深度融合、激活声音文献遗产的第一步。

我们主张,民族音乐学(及相关领域)学者必须摒弃技术旁观者心态,深度参与到数字工具与方法论的共同建构中。其核心路径在于:放弃“一体适用”的对大模型的幻想,不能坐视简单的、缺乏文化理解的通用数字工具被以“省时省钱”的名义草率地强加于文化遗产机构,最终牺牲档案工作中不可或缺的学术准确性与文化差异性;而应该转向开发本领域专用的AI模型。这要求学科专家与技术团队进行实质性协作:共同制定贴合文化语境的术语体系与受控词表,编写细致周详的描述与翻译指南,并构建由权威学术资源构成的高质量训练语料库。更为关键的是,必须建立一种持续迭代、人机协同的审校与反馈机制,使学者和档案工作者能以其专业知识直接校验输出、纠正偏差、注入文化洞察,从而驱动AI系统在“实践—反馈—优化”的循环中不断完善。因此,我们将AI模型的开发视作一个持续稳健、可协商的渐进过程。短期计划是务实而清晰的:与少数拥有特定声音典藏的机构合作,以小型馆藏为试点,全面评估实际编目挑战与人机协作模式,并以此为基石推进更系统性的工具开发。

我们深信,若此路径得以贯彻,AI技术有望成为一座关键桥梁,助力打破语言与元数据规范间的壁垒,显著提升音响档案的全球可及性。尽管前路充满风险,但我们坚信,唯有通过主动参与和积极建构,才能在人工智能的时代浪潮中,为多样的地方声音争取到应有的、公正的表征权,共同建造一个真正尊重文化差异、珍视声音内在价值的下一代编目基础设施。

“数字时代的声音档案专题”

声音档案在数字人文领域的创造性重构

民族志电影的时间维度:瓦罕走廊与南印度的案例

在博物馆中展示民间声音文献

从数字化到著录:音响档案的再语境化

图片

排版:覃子椿

初审:徐碧姗

复审:段婧怡

终审:夏翠娟

阅读原文

跳转微信打开

❌