阅读视图

AAAI 2026 论文:从语言神经元视角理解多语言对齐如何增强大模型能力

张世茂 2026-04-06 10:50 江西

分享一篇文章

南大NLP: AAAI 2026 论文:从语言神经元视角理解多语言对齐如何增强大模型能力

南大NLP组2026论文:从语言神经元视角理解多语言对齐如何增强大模型能力

【该工作由南京大学自然语言处理组与微软亚洲研究院合作完成,论文入选AAAI2026Oral。扩展版论文链接:https://arxiv.org/abs/2505.21505,代码:https://github.com/NJUNLP/Language-Neurons-Alignment】

01

研究动机

大型语言模型在多语言场景下已经展现出较强的整体能力,但由于预训练语料在不同语言之间分布不均衡,高资源语言与低资源语言之间仍存在显著性能差距。鉴于低资源语言的数据本身难以获取、难以支撑额外的大规模预训练,如何在现有模型基础上提升其能力成为实际需求。在这一背景下,多语言对齐(Multilingual Alignment)作为一种更具可操作性的途径,为增强低资源语言的推理表现提供了有效方向。

目前,多语言对齐方法的效果已在多项任务中得到验证,然而一个关键问题始终缺乏系统性解释:多语言对齐为什么有效?它在模型内部究竟改变了哪些结构与表征方式?为回答这一问题,近期研究开始尝试从神经元粒度理解多语言能力来源。现有主流划分通常将与语言相关的神经元分为两类:一类仅在某一种或极少数语言上表现出较高激活,被称为语言特定神经元(language-specific);另一类在所有语言中均保持较强激活,被视为通用神经元(general)。这一二元框架为分析多语言能力提供了初步结构化视角,但在实际统计中,如图所示,仍存在无法被准确归类的激活模式:有相当数量的神经元会在多种语言上频繁激活,却并未在所有语言中保持一致作用:在现有体系下,它们通常被笼统归入语言特定,但其跨多语言的激活特征又与真正意义上的语言特定神经元并不一致。这一现象提示,要深入理解多语言对齐的内部机制,仅依赖“语言特定—通用”的二元划分可能不足,亟需更精细的描述与分析框架。

1:某神经元在不同语言上激活概率的示例

02

方法:语言神经元的三元分类法与识别算法

2.1 三类语言神经元的划分与定义

结合激活概率统计,我们重新整理并扩展了语言神经元的定义体系:

  • 语言特定神经元: 只在某一种语言上具有高激活概率,对其他语言激活很弱。它们主要承担该语言特有的输入 / 输出形式的编码与解码。

  • 语言相关神经元: 在多种但非全部语言中保持高激活,用来刻画跨若干语言共享的结构与模式。(这是重点刻画的“中间层次”类别,也是以往工作容易混入语言特定的部分)

  • 通用神经元: 在所有语言上都具有较高激活,更多与任务相关的通用知识和推理模式有关,而不是绑定于某一种语言。

2.2 神经元识别算法

仅根据在哪些语言上出现激活难以准确判断神经元的功能,我们更关心其是否真实参与多语言推理过程,而非在与任务无关的文本上偶然被激活。为此,我们在语言维度上引入两个核心指标:

(1)激活概率分布的熵: 用于衡量神经元在不同语言间的激活偏好,即语言特异性

(2)跨语言的最大激活概率: 用于衡量神经元在至少某些语言上是否具有足够高的激活强度,即有效性

我们将两项指标整合为统一评分体系,对所有神经元进行排序:

从而同时过滤掉激活弱、语言偏好不明显的神经元,以及“看似特化但实际不参与推理”的神经元

在此基础上,我们取语言数量 N=10,根据神经元激活概率超过阈值的语言数量完成最终分类:

  • 仅在 1 种语言上高激活 → 语言特定

  • 在 2–9 种语言上高激活 → 语言相关

  • 在全部 10 种语言上高激活 → 通用

需要强调的是,我们在多语言数学推理数据集(MGSM、MSVAMP)的模型回答生成过程中统计激活,而非在一般多语言文本上,确保识别到的神经元确实与多语言推理能力相关。

03

实验设置

为在可控成本下系统分析多语言对齐前后的神经元变化,我们选择两种 7B 规模的开源数学推理模型作为研究对象:

  • MistralMathOctopus-7B

  • MetaMathOctopus-7B

两者均在多步数学推理数据上进行过微调,适合作为研究多语言推理能力及其内部结构变化的基座模型。

在任务设置方面,我们使用两个具有代表性的多语言数学推理基准:

  • MGSM:经典的多语言数学推理评测集,用于主要实验结果以及神经元激活统计;

  • MSVAMP:分布与 MGSM 不同的 out-of-domain 数据集,用于验证分析结论的泛化能力。

覆盖十种语言:英语(en)、中文(zh)、俄语(ru)、德语(de)、法语(fr)、西班牙语(es)、日语(ja)、斯瓦希里语(sw)、泰语(th)和孟加拉语(bn)。其中英语作为中枢语言,用于构造对齐信号。

在对齐方法上,我们采用 MAPO 框架 (Multilingual-Alignment-as-Preference Optimization) 中基于 DPO 的变体来实现多语言对齐,具体包括:

  • 利用多语言算术推理数据构造偏好对;

  • 使用多语言翻译模型将非英语回答翻译回英语,并计算其与英语回答之间的一致性;

  • 将该一致性作为偏好优化中的奖励信号,对模型进行对齐训练。

对齐前后,我们分别统计模型在多语言推理生成过程中的神经元激活概率分布,比较三类神经元对齐前后的数量变化及其在不同层的分布差异,以分析对齐对模型内部结构的影响。

04

主要发现:多语言对齐如何改变模型内部结构

4.1 神经元失活实验

基于前述识别方法,我们在 base 模型中识别三类神经元,并通过 Accuracy 和 Perplexity 消融实验检验它们在多语言推理中的作用,如图所示:

2:失活基于MistralMathOctopusMGSM得到的不同种类神经元后的模型准确率

3:失活基于MistralMathOctopusMGSM得到的不同种类神经元后的模型困惑度

  • 禁用某语言的语言特定神经元会降低该语言的回答准确率,并提升该语言 PPL,表明模型在该语言上依赖其语言特定神经元;

  • 在此基础上,若进一步禁用该语言的语言相关神经元(即同时禁用 language-specific 与 language-related),模型性能进一步下降,且 PPL 上升幅度更大,说明语言相关神经元在多语言推理中同样起到关键作用;

  • 禁用某语言的语言相关神经元对其他语言的性能影响相对较小,表明这些神经元在多个语言之间呈“分散共享”结构,而非被单一语言强依赖;

  • 当同时禁用某语言对应的语言特定、语言相关及通用神经元时,不仅该语言性能显著下降,其他语言性能亦受到明显影响,说明通用神经元承载跨语言共享的推理能力。

这些结果表明:某语言的推理能力同时依赖语言特定语言相关神经元,而语言相关神经元在多语言之间形成“局部共享”的支撑结构,是连接多种语言的重要桥梁。

4.2 四阶段多语言推理流程

在识别出语言特定、语言相关和通用三类神经元后,我们进一步分析了它们在模型各层的数量分布情况。结果显示,这三类神经元在深度方向上呈现出结构化的变化模式,如图所示,据此可将大模型的多语言推理过程概括为以下四个阶段:

4:不同种类神经元的层级别分布

(1)多语言理解

在模型的底部若干层中,语言特定与语言相关神经元数量同时处于较高水平,而通用神经元相对较少。该阶段主要负责将不同语言的输入映射到统一或相近的语义空间,为后续的语言无关推理奠定基础。

(2)共享语义空间推理

在中间层区域,通用神经元占据主要位置,而语言特定 与语言相关神经元的数量显著减少。模型在此阶段主要执行与语言无关的推理与计算,不同语言共用相同的推理结构。

(3)多语言输出空间转换

接近输出端的若干层中,语言特定与语言相关神经元数量再次明显上升,而通用神经元数量下降至较低水平。该阶段的功能是将共享语义表示重新投射到各目标语言的输出空间中,恢复语言间的结构差异。

(4)词汇空间输出

在最终输出层,三类神经元的数量分布再次出现特征性变化:

  • 语言特定神经元在该层达到数量峰值,强调其在目标语言词汇选择中的重要作用

  • 语言相关神经元数量则呈下降趋势,与上一阶段形成对比,表明跨语言共享结构在词汇级生成中的作用相对减弱

  • 通用神经元数量重新回升,与输入层的分布较为一致,可能与模型依赖共享词表和通用知识来完成最终输出有关

这一四阶段框架体现了不同类型神经元在模型内部的分层组织关系,相比现有对多语言推理的粗粒度描述,更系统地揭示了模型内部表征从输入到最终输出的转换机制。

4.3 多语言对齐的影响

在明确 base 模型的层级结构后,我们进一步比较了对齐前后三类神经元在不同层次的数量变化,如图所示。

5:对齐后不同种类神经元的层级别变化

分析显示,多语言对齐并不仅是对输出分布的调整,而是在模型内部引发了系统性的结构重组,主要体现在以下方面:

(1)输入阶段:更依赖语言敏感结构

多语言理解阶段,语言特定与语言相关神经元数量均有所上升,而通用神经元数量相应下降。这表明模型在输入侧更依赖语言相关结构来建立跨语言间的映射,为后续推理的对齐提供基础。

(2)输出阶段:从“单语言特化”转向“跨语言共享”

多语言输出空间转换阶段,语言相关神经元的数量显著增加,而语言特定 神经元有所减少。这一反向变化说明,对齐后的模型在生成目标语言输出时,会更多利用跨语言共享的结构,而减少对高度语言特化神经元的依赖。

(3)整体趋势:由“单语言依赖”转向“多语言共享”

跨层统计如图所示,这进一步显示对齐后:

6:对齐后被不同数量语言(N)所共享的神经元的数量变化

  • 语言特定神经元整体减少

  • 语言相关神经元显著增加

  • 通用神经元数量也呈现上升趋势

结合多语言激活模式进一步观察可以发现:部分原本仅在少数语言中活跃的神经元,在对齐后会在更多语言间被共同激活,其语言覆盖范围呈扩大趋势。这一现象在不同模型与数据集上均具有一定一致性,提示多语言对齐可能使模型更倾向于使用在多语言间具有更高共享度的神经元结构。

4.4 自发多语言对齐现象

此前研究提出了自发多语言对齐(Spontaneous Multilingual Alignment)现象:即使对齐训练仅涉及少数语言,其他未参与对齐的语言也会同步受益。本文在 MAPO 框架下验证了这一现象:

1MistralMathOctopus对齐前后模型在MGSM上的准确率。“X/Y  T“表示多语言对齐中语言XY向语言T进行对齐

  • 例如仅在中文与德语上执行对齐训练(zh/de ⇒ en),模型在 MGSM 上的平均准确率由 57.8 提升至 63.6

  • 多种未直接参与对齐的语言(如西班牙语、法语、泰语等)也出现了不同程度的性能提升。

为了理解这一现象背后的内部机制,我们进一步统计了对齐前后,不同语言对应的神经元数量变化。结果显示:

2:自发多语言对齐实验中训练和未经训练语言上不同种类神经元数量变化的平均结果

  • 对齐语言中:语言特定神经元数量减少,而语言相关神经元数量显著上升;

  • 未对齐语言中:同样观察到语言相关神经元数量上升的趋势,尽管幅度较小。

这一结果说明,对齐训练不仅改变了对齐语言内部的神经元参与模式,也在一定程度上影响了其他语言的神经元结构:与多种语言共同相关的语言相关神经元在更多语言间得到使用,其共享范围有所扩大。

因此,自发多语言对齐不仅体现在性能提升上,也在神经元层面呈现出一致的结构变化,为这一现象提供了进一步的证据支持。

05

总结

本文从神经元粒度系统分析了多语言对齐对大型语言模型内部结构的影响。通过提出更精细的三元神经元分类体系,并构建结合特异性与有效性的统一识别方法,我们揭示了语言相关神经元在多语言能力中的关键作用,并据此刻画了模型在多语言推理中经历的四阶段内部流程。进一步的对齐前后对比显示,多语言对齐会重塑模型内部的神经元参与模式,使模型更倾向于依赖在多种语言间共享的表征结构。这一视角同时为“自发多语言对齐”等现象提供了神经元层面的支持。

总体来看,本文为理解多语言对齐的内部机制提供了更具结构化与可验证性的解释路径,也为后续改进多语言模型的训练方法和对齐策略提供了新的分析依据。

参考文献

[1] She, S.; Zou, W.; Huang, S.; Zhu, W.; Liu, X.; Geng, X.; and Chen, J. 2024. MAPO: Advancing Multilingual Reasoning through Multilingual-Alignment-as-Preference Optimization. In Ku, L.-W.; Martins, A.; and Srikumar, V., eds., Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), 10015–10027. Bangkok, Thailand: Association for Computational Linguistics.

[2] Tang, T.; Luo, W.; Huang, H.; Zhang, D.; Wang, X.; Zhao, X.; Wei, F.; and Wen, J.-R. 2024. Language-Specific Neurons: The Key to Multilingual Capabilities in Large Language Models. In Ku, L.-W.; Martins, A.; and Srikumar, V., eds., Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), 5701–5715. Bangkok, Thailand: Association for Computational Linguistics.

[3] Wendler, C.; Veselovsky, V.; Monea, G.; and West, R. 2024. Do llamas work in english? on the latent language of multilingual transformers. In Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), 15366–15394.

[4] Zhao, Y.; Zhang, W.; Chen, G.; Kawaguchi, K.; and Bing, L. 2024b. How do large language models handle multilingualism? arXiv preprint arXiv:2402.18815.

[5] Zhang, S.; Gao, C.; Zhu, W.; Chen, J.; Huang, X.; Han, X.; Feng, J.; Deng, C.; and Huang, S. 2024. Getting More from Less: Large Language Models are Good Spontaneous Multilingual Learners. In Al-Onaizan, Y.; Bansal, M.; and Chen, Y.-N., eds., Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing, 8037–8051. Miami, Florida, USA: Association for Computational Linguistics.

[6] Huang, H.; Tang, T.; Zhang, D.; Zhao, W. X.; Song, T.; Xia, Y.; and Wei, F. 2023. Not all languages are created equal in llms: Improving multilingual capability by cross-lingual-thought prompting. arXiv preprint arXiv:2305.07004.

阅读原文

跳转微信打开

  •  

课程介绍丨基于AIGC工具的文献多模态资源制作与数字叙事设计

2026-04-05 17:30 北京

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

本课聚焦AI时代下的文献多模态资源制作,为教师及其他文化工作者带来更多在教学和创意领域的新思路、新工具。

课程针对古籍、古诗词理解困难和大众传播普及率不高的问题,课程从可信数据视角切入,以敦煌遗书、古诗词为例,演示文献内容从“数据化-信息化-知识化-艺术再造”处理全流程涉及的资料考证、文案策划、视觉传达设计、多模态制作的实操过程和成果展示。

可供中小学文史教师、数字人文教学科研人员、文化创意工作者、爱好者学习借鉴,用于备课、课程教学、创意传播。

主讲人:张宁

北京师范大学文理学院中文系讲师、硕士研究生导师,北京师范大学珠海校区图书馆数字人文中心主任,中国计算机学会(CCF)人文智能专业委员会执行委员。研究方向为古籍数字叙事、VR古籍游戏、数字人文教育等。 主持国家社会科学青年基金1项、省部级课题3项、获中国发明专利授权2项,发表中外学术论文30余篇,主持建设"文献多模态资源AI标注与问答平台”“京师.数字记忆3D展厅平台”“全球数字人文教育资源智能检索平台”。

*了解培训详情及报名请扫描本文海报二维码。

←了解我们正在进行的项目

籍合学院

中华书局旗下

古籍整理与传统文化学习平台

阅读原文

跳转微信打开

  •  

课程介绍丨AI时代的数字目录学及其基础设施

2026-04-04 17:30 北京

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

本课程将视角延伸至数字目录学与数字人文基础设施建设,并结合教学反馈展开讨论。

教师将聚焦人工智能时代的数字目录学发展,结合清华大学团队近年来在相关基础设施研发与课程教学中的实践经验,对数字目录学的未来发展方向、基础设施建设路径及相关教学活动进行系统性梳理与反思。

主讲人:唐宸

清华大学人文学院副教授,教育部哲学社会科学实验室“中华传统文化智能实验室”核心成员,兼任《数字人文》编辑,主要从事中国古典文献学、数字人文研究,研发了“典津-全球汉籍影像开放集成系统”“奎章阁-中国古典文献资源导航系统”“中国数字人文(DHCN)”等基础设施。

*了解培训详情及报名请扫描本文海报二维码。

←了解我们正在进行的项目

籍合学院

中华书局旗下

古籍整理与传统文化学习平台

阅读原文

跳转微信打开

  •  

上海人工智能研究院2026年人才招聘启事

请关注 2026-04-03 19:49 浙江

重点开展人工智能领域底层关键技术原始创新、核心应用技术突破,研发产业转化、人才培养及产业生态建设工作。

上海人工智能研究院

【在招岗位】

Hot

关于我们:

上海人工智能研究院是由上海市与上海交通大学共建,旨在落实国家对人工智能发展的重大决策部署,深入实施创新驱动发展战略成立的人工智能创新平台,于2019年世界人工智能大会上正式揭牌成立。

研究院承担上海市人工智能研发与转化功能平台建设任务,肩负上海科创中心建设人工智能板块战略发展重要使命,重点开展人工智能领域底层关键技术原始创新、核心应用技术突破,研发产业转化、人才培养及产业生态建设工作,已成为我国人工智能领域具有影响力的新型研发机构。

图片

左右滑动查看更多

在这里,您将接触到:

战略级创新平台: 由上海市与上海交通大学共建,承载国家人工智能发展战略,是上海科创中心建设“AI板块”的核心载体与新型研发机构标杆。

全链条创新体系: 研究院构建覆盖“技术研发-成果转化-产业孵化”的全链条创新体系,具备从基础研究到产业应用的全方位创新能力。

高水平科研团队:研究院已形成“战略科学家+领军人才+青年骨干”梯队结构,打造产学研用深度融合的顶尖创新梯队。

【招聘岗位】

图片

job@sairi.com.cn 

(注明应聘职位及工作年限)

【投递方式】

扫码投递邮箱投递

邮箱:job@sairi.com.cn (注明应聘职位及工作年限)

(岗位详情请阅读下文↓)

【全职岗位】

图片

扫码投递简历

01

算法工程师

Hot

工作职责:

1. 参与各类算法模型的开发、训练和部署;

2. 负责下游多模态、跨语言等方向的任务复现,并在已有平台上进行性能优化;

3. 参与多模态、跨语言等方向的前沿共性技术和应用的研究和实践;

4. 负责项目技术文档的撰写及相关技术工作汇报;

5. 知产、专利方向上与专利工程师/标准化工程师配合,支撑好相关工作。

任职要求:

1. 硕士研究生及以上学历,计算机、人工智能或相关专业;

2. 需要具备复现跨模态数据处理相关算法的能力,优秀的跨语言阅读能力,优秀信息收集整理能力。具备前沿技术研究与实践的能力,能够敏锐捕捉行业最新动态;

3. 熟练掌握Python、C++等编程语言,熟悉TensorFlow、PyTorch等深度学习框架,能够运用工具进行算法开发与模型训练;

4. 项目经验:有算法模型开发、训练和部署的实际项目经验,最好在多模态、跨语言等领域有相关实践经历;

5. 擅长撰写技术文档,能清晰、准确地记录项目流程、技术细节和实验结果,具备良好的技术汇报能力,能有效传达关键信息;

6. 善于跨部门团队协作,共同推进知产、专利相关工作,有团队合作精神和沟通协调能力。

02

数字/智能电网专家

Hot

工作职责:

1. 技术应用创新:探索人工智能与电力电网等能源行业融合应用,推动落地实施。

2. 项目规划与管理:负责相关项目的规划、组织与实施,协调跨部门资源,把控项目进度与质量,确保项目目标达成。

3. 数据分析与决策支持:收集和分析能源数据,运用人工智能技术挖掘数据价值,为企业战略决策、生产运营优化提供数据驱动的建议。

4. 商务拓展及谈判:挖掘潜在的项目商业机会,寻找合作伙伴,推动业务增长。主导或参与商务合同的谈判与签订,把控合同风险,保障合作顺利开展。

5. 客户关系维护:负责重要客户的关系管理,深入了解客户需求,提供定制化解决方案,提升客户满意度和忠诚度,促进长期合作。

6. 行业交流与合作:跟踪行业前沿动态,参与行业研讨会,与高校、科研机构开展合作,引进先进理念和技术,提升行业影响力。

任职要求:

1. 本科及以上学历,具备扎实的电力电网领域专业知识,熟悉新型电力系统、新能源等;精通人工智能技术,包括机器学习、深度学习算法等。

2. 有丰富的商务拓展、客户关系管理和商务谈判经验,熟悉商务流程和合同条款,具备敏锐的商业洞察力。

3. 拥有丰富的人工智能项目开发和电力电网数字化转型、新型电力系统建设等项目经验,能够独立承担复杂项目。

4. 优秀的沟通协作能力,能与不同专业背景的人员有效合作,推动项目顺利开展。对电力电网行业市场动态和商业机会有敏锐的感知,能够及时调整业务策略,适应市场变化。

03

科技发展中心副主任

Hot

工作职责:

1. 科研项目全生命周期管理:负责项目申报、过程监控与验收管理。跟踪国家及地方科技政策,组织策划重大科研项目申报;监控项目进度与经费使用,确保按计划完成;组织结题验收,推动成果鉴定与科技奖励。

2. 对外合作与资源链接:维护政府关系,争取政策与资源支持;拓展高校及科研机构合作,推动联合实验室、产学研项目落地;参与行业活动,挖掘合作机会,提升研究院影响力。

3. 内部协同与团队建设:统筹内部科研资源,优化项目配置;完善科研管理制度与流程;指导培养项目专员,提升团队专业能力。

任职要求:

1. 硕士及以上学历,理工科背景,人工智能、计算机、自动化、电子信息等相关专业优先;

2. 3年以上科研项目管理经验,其中1年以上团队管理经验;

3. 精通国家及上海市各类科技计划项目管理流程、申报规范和评审要点,具备优秀的文字功底;

4. 具备较强的对外沟通和资源链接能力,有政府事务对接经验或高校合作资源者优先;

5. 具备出色的统筹管理能力、合规意识,高度的责任心、敬业精神和抗压能力。

04

品牌发展经理

Hot

工作职责:

1. 科创生态运营规划:结合市场趋势与生态需求,制定生态发展战略、市场策略及渠道运营规划。

2. 产业生态体系搭建:链接政府、高校、科研机构、科技企业、创新平台等生态伙伴,构建稳定合作网络。

3. 项目合作与市场开拓:深刻了解合作伙伴在科创生态的综合发展需求,挖掘品牌及业务合作机会,结合研究院品牌与生态资源,策划并推进合作项目,协同内部相关团队,达成年度工作目标。

任职要求:

1. 本科及以上学历,五年以上科技生态合作、渠道管理、商务拓展BD或产业联盟相关管理经验,具备科技大厂、科创平台、政企合作相关背景,具备政府资源、头部AI企业资源、科技产业上下游资源者优先。

2. 具备较强资源整合能力,高效串联内外部资源,识别机会挖掘合作潜力,聚焦营收转化。具备突出商务洽谈与业务增长思维,独立与合作伙伴中高层建立信任并推进业务,结果导向。

3 执行力强,具备跨部门协同能力、复杂项目推进能力及成本管控意识,善于统筹协调,推动合作与营收目标落地。

4. 熟悉国家及上海科创政策、产业运营模式,推动资源变现与合作伙伴拓展。

05

人才发展业务总监(高等教育)

Hot

工作职责:

1. 营收目标达成与市场开拓:确保达成并超越年度营收指标。独立或带领团队,主动识别、开拓并深耕高教领域(高校、高职)目标客户,建立稳固的客户关系网络,持续挖掘商业机会,推动合同签订与回款。

2. 高教业务资源整合与方案设计:深入了解高教客户在人才培养、学科建设、数字化转型(如AI+教育、智慧教学、科研赋能、师资培训、产教融合)等方面的核心痛点和需求,整合研究院内外部资源,设计并包装符合市场需求、具备竞争力且能规模化推广的相关解决方案及服务产品包(如:AI赋能专业建设方案、智能教学平台与资源服务、高水平师资AI能力培训项目、定制化产教融合服务、科研转化合作项目等)。

3. 科研成果商业化转化:深刻理解研究院在人工智能领域的前沿科研成果,将其有效转化为可面向高教市场销售的产品、服务或解决方案,打通从技术到市场应用的链条,直接服务于营收目标。

4. 业务生态建设与伙伴合作:积极拓展并维护与高教领域的核心院校、关键决策者、行业协会以及互补型科技企业、服务商的战略合作关系,建立互利共赢的业务生态,共同开发市场,实现资源共享与联合销售,扩大业务覆盖面和影响力。

5. 市场洞察与策略调整:紧密跟踪国家教育政策、高教改革趋势、人工智能技术发展及其在教育领域的应用动态,及时调整市场策略、产品方向和销售打法,保持竞争优势。

任职要求:

1. 本科及以上学历;教育、市场营销、工商管理、计算机科学、人工智能等相关专业背景优先。

2. 5年以上工作经验,其中至少3年专注于高等教育(高校、高职)领域的商业化拓展经验(如:销售、商务拓展、解决方案销售、大客户管理)。具备可验证的、成功的业绩达成记录。拥有教育产品/服务销售、解决方案销售、政府/高校大客户管理经验者优先。有教育生态资源整合、产学研合作、科研成果市场转化经验者优先。

3. 熟悉高教业务模式,具备极强的客户需求挖掘、方案价值呈现、商务谈判、合同签订及关系维护能力。

4. 对数字敏感,以达成和超越营收目标为第一要务,具备强烈的进取心和抗压能力。

5. 能够快速理解客户需求,整合内外部资源,设计出有竞争力的综合性解决方案。

6. 深刻理解中国高等教育体系、院校运作机制、决策流程、预算来源及当前热点需求。

7. 出色的跨部门协作能力和高层客户沟通能力,能有效影响内外部关键决策者。

06

生态建设经理(教育方向)

Hot

工作职责:

1. 战略规划:深刻洞察教育及人才培养市场的宏观趋势与微观动态,结合政策导向与研究院的战略目标,主导制定人才培养项目的发展战略及渠道运营规划,确保业务的前瞻性与竞争力。

2. 生态构建:对教育行业全产业链有深入理解,积极开拓政府、中小学、高等院校、职业院校、头部企业及行业组织等关键合作伙伴,构建覆盖上下游的完整、高效、共赢的教育生态体系。

3. 生态运营:维护并深化与现有生态伙伴的战略合作关系,通过策划并执行高端峰会、主题沙龙、工作坊、联合课题等多元化生态活动,持续吸引新的高质量伙伴加入,显著提升生态伙伴的合作体验与粘性。

4. 项目落地:具备卓越的商务谈判技巧与跨部门项目统筹能力,能有效整合内外部生态资源,协调各方诉求,确保教育合作项目及市场活动的顺利策划、高效执行与高质量交付。

任职要求:

1. 本科及以上学历。教育、市场营销、工商管理、计算机科学、人工智能等相关专业背景优先。

2. 3年以上工作经验,其中至少2年专注于教育(K12、基础教育)领域的生态建设经验(如:教育领域的行业协会等任职)。具备可验证的、成功的达成记录。有教育生态资源整合、产学研合作、科研成果市场转化经验者优先。

3. 熟悉教育领域的业务模式,具备极强的生态延展商业方案价值呈现、商务接洽及关系维护能力。

4. 具备强烈的进取心和抗压能力。

5. 能够快速理解院级生态战略意图,整合内外部资源,设计出综合性生态建设方案。

6. 深刻理解中国教育体系、院校运作机制、决策流程、预算来源及当前热点需求。

7. 出色的跨部门协作能力和教育侧合作方的沟通能力,能有效影响内外部关键决策者。

07

国际合作项目主管

(全球工业人工智能联盟卓越中心)

Hot

工作职责:

1. 梳理、识别并持续拓展中心在政府、标准制定组织、国际行业联盟等合作机构中可调动的各类生态资源;建立并维护动态化资源台账,形成结构化资源图谱,确保资源信息完整、准确和可溯源;

2. 对已积累的生态资源进行系统分类与价值评估,分析不同类型资源对产业端和企业端的应用潜力;构建资源对接矩阵,确保资源在不同场景下的精准匹配和高效调配;

3. 积极参与面向产业和企业的业务拓展工作,结合合作企业的实际需求,针对性地组织调动政策、标准、网络等多维度支持资源;为商务解决方案提供有效输入,增强方案竞争力,助力业务拓展目标达成;

4. 在资源盘点与业务支持过程中,主动识别潜在商业合作机会;通过深度分析客户需求与中心资源的结合点,推动合作意向向实质性商业项目转化,贡献中心整体商业可持续发展;

5. 参与关键项目的过程推进,协调内外部资源,跟踪资源到位与利用效果;关注客户侧业务成效,及时反馈并优化资源支持策略,共同保障项目的稳健、高质量落地交付。

任职要求:

1. 本科及以上学历,工商管理、国际关系/事务、经济学、工程管理或相关专业优先;具备工业人工智能、智能制造或相关领域的基础认知;

2. 3年及以上相关从业经验(优秀者可放宽);具有政府资源对接、国际组织合作、产业生态构建或企业业务拓展经验者优先;具备跨文化背景下的商务合作经验者加分;

3. 具备较强的资源整合、生态构建与关系维护能力;

4. 具备良好的商务沟通、谈判能力和客户关系管理能力;

5. 具备结构化思维,能清晰梳理和呈现复杂资源信息;

6. 英语听说读写流利,可独立开展国际合作沟通与谈判;

7. 工作主动、抗压能力强,具备良好的跨部门协作意识。

08

商业分析师

Hot

工作职责:

1. 与客户深入沟通,全面了解其业务现状与技术需求,挖掘潜在问题并提供针对性解决方案建议;

2. 依据客户需求和行业最佳实践,设计技术方案,包括但不限于技术选型、实施方案、项目计划、经费测算等内容;

3. 与客户深入沟通方案,并按需做针对性修改;

4. 在项目实施过程中,提供技术指导,协助解决技术难题,确保项目按方案顺利推进;

5. 总结项目经验,整理成内部知识库,定期进行内外部分享,辅助提升团队水平;

6. 论文、标准、专利等方向上与专利工程师/标准化工程师配合,支撑好相关工作。

任职要求:

1. 本科及以上学历,精通并热爱人工智能技术与产业化应用,具备一定技术功底;

2. 优秀的方案撰写与沟通能力,擅长精准理解客户需求,并交付高质量方案;

3. 出色的沟通技巧,能够将复杂技术概念清晰传达给不同背景人员;

4. 拥有丰富项目经验,能独立应对各类技术挑战,把控项目风险;

5. 持续关注行业动态,快速掌握新技术,为客户提供前沿技术建议。

09

财务主管

Hot

工作职责:

1. 财务管理与规划

- 制定财务计划:根据公司整体经营目标和战略,协助制定财务收支计划、成本费用计划等,确保公司资金的有效配置和使用。

- 预算编制与执行:组织编制年度、季度财务预算,并监督预算的执行情况,及时调整预算以应对市场变化,确保公司财务目标的实现。

2. 会计核算与报告

- 会计核算:负责公司的会计核算工作,确保会计信息的真实、准确、完整。这包括编制会计凭证、登记账簿、编制会计报表等。

- 财务报告:定期编制财务报表,如资产负债表、利润表、现金流量表等,并向管理层和外部利益相关者提供财务报告,反映公司的财务状况和经营成果。

3. 成本控制与分析

- 成本控制:制定成本控制制度和措施,对生产经营过程中的各项成本进行监控和管理,确保成本控制在预算范围内。

- 财务分析:定期进行财务分析,包括盈利能力分析、偿债能力分析、营运能力分析等,为公司经营决策提供财务依据和建议。

4. 税务管理与筹划

- 税务申报:负责公司各项税费的计算、申报和缴纳工作,确保公司依法纳税。

- 税务筹划:根据国家税收政策,进行税务筹划工作,合理降低公司税负,提高公司经济效益。

5. 风险管理与内部控制

- 风险管理:识别、评估公司面临的财务风险,制定风险应对措施,确保公司财务活动的稳健进行。

- 内部控制:建立健全内部控制体系,对公司的财务活动进行监督和检查,防止财务舞弊和违法违规行为的发生。

6. 公司资产管理与规划

熟悉各项资质补贴政策,可针对性规划公司技术资产、专利证书、企业资质等无形资产。

7. 其他工作

- 参与决策:参与公司重大经济事项的决策过程,提供财务分析和建议。

- 协调沟通:与公司内部其他部门及外部相关机构保持良好的沟通和协调关系,确保财务工作的顺利进行。

任职要求:

1. 财务、会计、经济等相关专业本科及以上学历,中级及以上职称;

2. 5年以上财务管理或相关领域工作经验,具备深厚的财务理论基础及实践经验;

3. 精通国家财经法规、税务政策及会计准则,具备较强的财务分析能力和预算管理能力,能够独立完成财务分析报告;

4. 了解企业融资、投资、并购等资本运作流程;

5. 良好的职业素养、具备高度的责任心和职业道德。

10

产业合作经理

Hot

工作职责

1. 政府关系与项目对接

- 负责与地方政府、开发区、科技主管部门等建立并维护良好合作关系

- 对接政府产业规划与政策资源,推动符合地方产业发展方向的重点项目落地

- 参与政府项目申报、政策解读及政企洽谈,提升我院在地方合作中的影响力

2. 孵化企业服务与落地支持

- 对接我院孵化及引进的科技企业,了解企业落地需求(空间、政策、融资、市场等)

- 协调内外部资源,为企业提供从选址、注册到政策兑现的全流程落地服务

- 跟踪企业落地后发展情况,推动形成标杆案例,提升孵化成功率

3. 产业资源整合与活动组织

- 整合产业园区、投资机构、行业协会等资源,构建产业合作生态

- 组织或参与产业对接会、项目路演、政策宣讲等活动,促进项目高效匹配

- 定期梳理地方产业动态与合作进展,形成工作报告

工作要求:

1. 硕士及以上学历,理工科、经济管理、公共管理等相关专业优先

2. 3年以上政府事务、产业合作、园区运营或科技服务相关工作经验

3. 熟悉地方政府运作机制及产业政策,具备政企对接成功案例者优先

4. 有孵化器、科技园区、科技成果转化相关经验者优先

5. 优秀的沟通协调与商务谈判能力,能够高效对接政企双方诉求

6. 较强的项目管理与执行力,能独立推进项目从洽谈到落地全过程

7. 良好的政策理解与文字表达能力,能撰写项目方案、汇报材料等

8. 具备资源整合意识与团队协作精神,抗压能力强

图片

联系邮箱:job@sairi.com.cn (注明应聘职位及工作年限)

(来源:上海人工智能研究院)

阅读原文

跳转微信打开

  •  

在典籍中看文明——访中国国家版本馆党委书记、馆长刘成勇

2026-04-05 09:01 江西

分享一篇文章。

中国新闻出版广电报: 在典籍中看文明——访中国国家版本馆党委书记、馆长刘成勇

在文化遗产保护传承日益受到重视的当下,如何理解典籍版本在文明传承中的核心作用?“代代相传的典籍版本见证了世界上唯一没有中断的文明,可以说版本蕴藏着中华民族的精神基因和文化根脉,它是记录历史、见证文明的金种子。”中国国家版本馆党委书记、馆长刘成勇近日在接受《中国新闻出版广电报》记者采访时说,作为国家版本资源总库和中华文化种子基因库,中国国家版本馆肩负着赓续中华文脉、坚定文化自信、展示大国形象、推动文明对话的历史使命。他从历代传世版本谈起,分享了对文化遗产里的中国的深刻思考。

《中国新闻出版广电报》:您怎么看古籍与大众日常生活的联系以及近年持续升温的文博热?

刘成勇:许多人觉得古籍遥不可及,其实不然,古籍与今天大众生活的关联,是“日用而不觉”的。例如,在古籍雕印中有一种常见的“宋体字”,它是在唐楷的基础上,经过宋元明的演变逐渐形成,笔画劲挺峻峭,结构匀称整齐,端庄典雅,适合雕刻,便于阅读,利于传播。到今天,我们仍然在广泛使用这种字体。不论是图书报刊、公文函件、合同协议,还是证件招牌、标题字幕等等,都有宋体字的身影。可以说,古籍中的宋体字已经成为中国人的文化符号之一,在社会生活中一直发挥着巨大的作用,具有重要的实用价值和审美功能。从这个层面上说,古籍就在我们身边,从未走远。

现在有许多人热衷到各个博物馆打卡、集章,包括中国国家版本馆每天都有十几个团来参观,旺季时团队预约甚至排到一两个月之后。我觉得这是一个非常好的事情,令人十分欣喜,这背后,折射出的正是公众日益增强的文化自信与对中华优秀传统文化的由衷热爱。

《中国新闻出版广电报》:相较于各大博物馆,中国国家版本馆有定位与藏品的特殊性,请简要介绍版本馆及藏品对大众了解中华文化的作用,参观前可以做哪些准备?

刘成勇:中国国家版本馆是文明大国建设的基础工程,是功在当代、利在千秋的标志性文化工程,集图书馆、博物馆、档案馆、美术馆等功能形态于一体,全面履行国家版本资源规划协调、普查征集、典藏展示、研究交流和宣传使用的重要职能。在这里,读者可以从中华版本中获得精神滋养,直观感悟中华文明的浩瀚璀璨和中华民族生生不息的精神脉络。

在参观前,可以通过国家版本馆官网或媒体报道提前了解国家版本馆“藏之名山、传之后世”的存藏理念和建设意义。重点关注“明星藏品”,提前熟悉它们的背景知识,比如武则天组织抄写的唐代写本《妙法莲华经》,了解唐代的“三审三校”制度;宋拓孤本《西楼苏帖》,感受苏轼书法的魅力和宋代文人的精神世界。

《中国新闻出版广电报》:如果观众参观后有进一步了解的兴趣,您有什么建议?

刘成勇:若参观之后仍意犹未尽,可从三个方面加深了解。一是阅读书籍,建议从通识性、普及性、趣味性的书籍入手,推荐《馆长眼中的镇馆之宝》,这本书从经济、科技、文明传承视角讲述文物背后的精彩故事,值得一读。若想深入研究,可以订阅《中华版本学刊》,这是新时代版本学领域创刊的第一本学术期刊,方便及时获取版本研究的新动态与新方法。二是中国国家版本馆设有研学项目,精心设计了参观路线,沉浸式VR互动、体验雕版印刷乐趣、创意甲骨文互动,还有宣传画互动屏,每一场研学之旅既有知识厚度,又有互动乐趣。三是参加“文瀚雅集”等交流活动,在“版本展示+晒书鉴赏+座谈交流”中,了解版本征集、版本收藏、研究出版、文创开发等知识。

《中国新闻出版广电报》:您在全国两会上提到正在建设中的中华典籍线上展示平台,可否描绘一下平台建成后的数字阅读体验?

刘成勇:中华典籍线上展示平台是中国国家版本馆建设的综合性数字资源展示平台,实现了对珍贵典籍数字化资源保存、展示与服务。目前平台处于建设起步阶段,已上线展示了17万种古籍和近现代文献资源,让原本“藏在深闺”的文化瑰宝走进了公众视野。

未来我们将着力构建“平台+用户”共建共享生态,逐步上线面向社会各界开放的资源入藏共建、规范审核、发布展示专属模块,打通民间珍贵典籍入藏国家版本资源总库的渠道,同时鼓励公众参与典籍研读、知识分享、校勘补充等活动,营造“人人可参与、人人可传播、人人可传承”的文化氛围。

《中国新闻出版广电报》:中国国家版本馆将如何更好地服务“加强文化遗产保护传承”这一要求?

刘成勇:中国国家版本馆致力于赓续中华文脉,构建中华文化种子基因库,把自古以来能收集到的典籍资料收集全、保护好,把世界上唯一没有中断的文明继续传承下去。我们综合运用法定呈缴、捐赠、采购、寄存、数字化等多种方式,广泛征集中华文明典籍资料,包括中华古籍、甲骨简牍、革命文献、宗教文献、碑帖拓片、方志家谱、雕版印章、档案文书、影音影像、现代出版物、数字版本等,截至目前共收藏实物版本3400余万册/件,数字文献36亿页。

此外,《全民阅读促进条例》正式施行,中国国家版本馆作为国家重大文化工程,其历史使命与“全民阅读”主题天然契合,今年我们将立足丰富的版本资源,以“书香中国 文脉赓续”为主题,推出系列阅读活动,在第五届全民阅读大会上策划举办阅读主题展览,传承弘扬中华文脉,助力书香社会建设。


编辑:吴 凡

审核:樊 凡

图片

最近更新了微信版本的人,大家很难在杂乱的消息列表里找到我!

其实只要简单的几步操作,将我置顶起来——

图片

图片

中国新闻出版传媒集团微信矩阵

↓看看更有针对性的细分领域↓

版话儿

版人版语

传媒瞭望

发行观察

广电家

好书品读

印业独家

中国农家书屋

中国出版

↑喜欢我,就点开二维码图片并识别我吧↑

阅读原文

跳转微信打开

  •  

课程介绍丨AI+文献学课程建设与科研思考

2026-04-03 17:30 北京

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

本课开始,老师们将在智慧课程建设这个主题的基础上围绕科研与教学展开进一步思考。

课程以AI+文献学课程为案例,探讨AI在文献学智慧课程设计中的教学应用场景与创新边界;最终落脚于数字化研究方法的学理反思,构建技术工具与人文阐释互鉴共生的文献学研究新生态。

课程的内容要点分别有数字人文与古典文献学的交叉融合路径与思考,AI辅助下的文献学课程设计、教学创新与反思以及文献学的数字化研究方法的思考。

主讲人:贾智

中山大学中国语言文学系(珠海)教授、博士生导师、系副主任。主要研究方向为汉语言文字学,特别是中古汉语、近代汉字的发展、流变和域外传播研究,兼及敦煌遗书、域外文献整理与研究。

*了解培训详情及报名请扫描本文海报二维码。

←了解我们正在进行的项目

籍合学院

中华书局旗下

古籍整理与传统文化学习平台

阅读原文

跳转微信打开

  •  

山东大学边疆治理研究院召开技术工作专题研讨会

2026-04-03 11:07 山东

3月27日,山东大学边疆治理研究院召开技术工作专题研讨会。数字人文实验室副主任陈建红主持会议,技术小组成员袁庆豪、王振担任主讲。

会上,袁庆豪详细介绍了研究院依托前沿大语言模型以及检索增强生成技术,针对边疆历史领域开展的一系列系统探索与实践工作。研究院目前完成了近十年(2015-2025),边疆历史学术成果文献的数据清洗工作。通过自动化命名实体识别(NER)与关系抽取流程,构建了包含数十万条边(Edge)的知识图谱体系,在记录层—图谱层联动机制下,实现了面向证据绑定的深度检索(Deep Retrieval)与结构化推理能力。该体系为后续应用提供了可复用的数据基础,并在多轮校验与模态约束机制支持下,有效提升了历史信息的结构化准确性与完整性。

研究院部署了多智能体协作框架,如知识检索Agent、因果分析Agent和内容生成Agent。这些Agent具备任务分解和工具调用能力,不仅解决了一般Agent的数据来源碎片化和推理不透明问题,还探索了“知识图谱+智能体”的融合范式,推动边疆历史研究向智能化方向转型,为数字人文领域提供了实用参考。

王振结合自身研究领域,阐述了数智化相关工作的推进方向及现存问题。他认为AI在处理历史人物相关信息时,可能因训练数据偏差产生认知偏差与叙事失衡,形成片面化的人物评价,进而影响历史研究的客观性。解决办法可依托人机对齐技术,从文献智能整理分析、历史场景三维重建、社会关系量化推演等多个方向推进。

研究院执行院长苗威教授做总结:一是在推进技术开发的同时,需深耕经典文献,不断涵养学术底蕴、提升学术品位;二是要秉持理论高度,面向国家需求,结合具体问题落地实施,经世致用;三是要以技术手段回应历史研究问题,始终与历史学家的学术需求同频共振。她进一步要求大家扎实人文功底,精进技术能力,做好学术传承。

文以载道,数以启新。本次研讨会不仅加深了大家对技术研发与学术研究结合的理解,更激发了运用数智工具开展科研创新的热情。山东大学边疆治理研究院将继续以国家需求为导向以智能技术为支撑,在边疆研究与实践中勇毅前行。

作者|王振、许嫄

图片|徐晓婷、姜思彤

编辑|徐晓婷

审核|刘加明

编审|陈建红

阅读原文

跳转微信打开

  •  

饶高琦 | 基于市场需求的新质语言教育探索

徐惠 2026-04-04 09:00 江苏

数智时代新质语言教育成刚需,探析人才培养、困境及重构路径。

转载自“语言教学与研究”


本文来源:魏晖,施春宏,刘晓海,等.“新质语言教育”大家谈[J].语言教学与研究,2026,(02):1-15.

图片

编者按

语言教学与研究

数智时代的到来与技术的飞速发展引发市场对人才需求结构的根本性转变,着力培养“懂语言十懂技术”以及能应用、会管理的多元化、技术化、场景化复合型人才已成为时代发展的迫切要务,这一趋势正驱动着语言教育的深层次变革。有学者认为,变革的方向是以服务新质生产力发展为根本导向,以培养国家和社会急需的新质语言人才为根本任务,以高科技为驱动,以高效能为追求,以高质量为目标,可称之为新质语言教育。本期刊发的“大家谈”讨论了新质语言教育的基本定位、属性特征和相关学科建设问题,分析了新质语言人才的核心能力与培养面临的现实困境,提出了新质语言教育的路径重构,讨论了面向应用场景的语言工程人才的核心能力,基于实践初步构建了培养卓越语言工程师的新质语言教育体系。欢迎学界同仁积极参与、共献智慧,大力推进新质语言教育研究和实践工作,欢迎大家就相关专题做出具体的实证研究和理论思考。本刊将持续推动相关研究,以践行“推进学术,建设学科,发展事业,服务社会”的办刊宗旨。


基于市场需求的新质语言教育探索

北京语言大学语言科学与资源学院 饶高琦

在人工智能与数字经济的双重驱动下,市场对语言人才的需求已从单一技能型,转为“语言学十技术十场景”的复合能力型。2025年初教育部、国家语委、中央网信办联合印发《关于加强数字中文建设 推进语言文字信息化发展的意见》,明确提出“构建数字时代语言人才培养体系,强化语言智能与多领域融合应用”,这为语言人才培养的转型发展指明了方向。在教育强国战略背景下,立足语教融合理念与“大语言学观”,变革语言教育,培养适应市场需求的语言人才(可称之为新质语言人才,相应的语言教育称为新质语言教育),既是语言学学科自身发展的内在要求,也是服务国家数字经济建设的必然选择。

一、市场需求驱动下新质语言人才的核心能力构成

(一)新质语言人才的市场需求

当前,语言人才市场呈现多元化、技术化、场景化特征。从招聘市场数据看(基于本课题组在几大主流招聘网站进行的相关招聘广告的抓取和分析),人工智能与数据标注相关岗位占比已达62%,成为新质语言人才的核心需求领域,典型岗位包括AI训练师、数据标注师、提示词工程师等。数据标注产业的蓬勃发展直观反映了市场对基础语言人才的迫切需求。我国目前已有5.8万全职数据标注员(数据来源:中国信通院《数据标注产业发展研究报告(2025)》)。经估算,2025年我国数据标注员岗位缺口将高达100万,数据标注市场规模达到102.1亿元(数据来源:中商产业研究院)。数据产业不仅提供了大量基础岗位,更催生了对数据标注管理、语料库建设、标注规范制定等中高端人才的需求。这些岗位从业人员不再局限于传统语言学的培养内容,而是要求将语言学理论转化为机器可识别、可处理的结构化数据与规则体系。而大模型背景下的人机交互则进一步拓展了新质语言人才的就业边界,催生了大模型产品经理、提示词工程师等岗位。它们要求从业者兼具语言学素养、逻辑思维与产品意识。除技术导向型岗位外,文化传媒与编辑、教育科研、技术支持与本地化等领域对语言人才的需求也呈现出交叉融合特征。本地化技术支持岗位要求掌握多语言翻译与跨文化沟通技能。这种多元化需求图景表明,新质语言人才必须突破单一学科局限,形成适应多场景应用的能力体系。

(二)新质语言人才的核心能力

2018年,谷歌公司在语言资源与评测大会(LREC)上发布了“语言学者工业界就业能力量表”(下称“谷歌能力量表”)。虽然IT技术在过去7年出现爆发式增长,但其能力侧面依然有效。结合我国特点,我们认为新质语言人才的核心能力可从语言学本体、技术应用、交叉融合与场景落地四个维度进行概括。

语言学本体能力是基础,涵盖语音学、句法学等核心理论,需掌握国际音标、语料库技术。

该能力在谷歌能力量表占比33%,是区分专业与普通语言从业者的关键。技术应用能力是核心竞争力,包括编程、数据处理、大模型使用等技能。本课题调研数据显示,60%以上A1相关岗位要求编程与数据处理能力,基础标注岗有脚本编写能力者晋升更优。

交叉融合能力体现“大语言学观”,要求打破文理藩篱,融合计算机、社会学等多学科知识。如社交媒体运营需结合语言学与社会学挖掘语言规律,医疗、金融相关岗位需融合对应行业知识。这是市场需求,也是语言学科创新发展的路径。

场景落地能力强调理论落地,须具备需求分析、产品思维等素养。

二、新质语言人才培养的现实困境

(一)学科壁垒尚未打破,培养体系滞后

当前传统中国语言文学、外国语言文学等专业课程设置偏重理论研究,与计算机科学、数据科学等技术学科的融合不足。本课题调研了多所高校语言学专业课程发现,编程、数据处理、AI技术处理相关课程占比不足10%,导致学生技术应用能力薄弱,难以满足市场对“懂语言十懂技术”复合型人才的需求。本课题调研显示,58%语言工程类岗位明确要求计算机或数学背景;即使是数据标注等基础岗位,也有近68%要求应聘者有相关经验。

在学科困境中,尤为凸显的是跨学科师资力量匮乏和教学模式创新不足的问题。新质语言人才培养需兼具语言学理论功底与技术应用能力的跨学科师资。但当前教师队伍,缺乏产业实践经验与技术训练,难以有效开展跨学科教学。部分高校虽尝试引人计算机专业教师参与,但由于学科差异巨大,协同难度大,课程内容衔接不畅,难以形成系统的培养体系。

此外,教学模式创新不足也制约了人才培养质量提升。当前教学仍以课堂讲授为主,互动式、项目式教学占比偏低,导致学生实践能力较弱。

(二)语言资源建设与利用不充分,人才供需匹配度不高

语言资源的建设和研究是数智时代对语言学学科提出的重大需求,特别强调语言资源的监测、挖掘和利用。但当前高校语料库建设普遍存在规模小、类型单一、更新缓慢等问题,缺乏多领域、多模态的真实语料资源,与企业实际应用场景脱节。语言智能技术平台建设滞后,多数高校尚未配备先进的AI训练工具、语音处理设备等,学生既缺乏相关意识培养,也不具备实践操作的软硬件条件。

三、基于市场需求的新质语言教育路径重构

(一)坚持语教融合,构建跨学科培养体系

语教融合是新质语言教育的核心理念,这要求打破语言学和语言教学、语言和技术、理论与实践的教学壁垒,实现知识、技能与素养的一体化培养。在课程体系重构方面,应立足“大语言学观”,以语言本体计算为核心,构建“基础理论十技术技能十场景应用”的模块化课程体系,基础理论模块保留普通语言学、应用语言学等核心课程,增设语料库语言学、计算语言学、语言资源学等交叉课程,夯实语言学基础;技术技能模块引入脚本编程、数据结构、机器学习基础、A1工具应用等课程,培养技术应用能力;场景应用模块根据市场需求设置NLP应用、语言模型训练、跨文化沟通、舆情分析等课程,提升场景落地能力。

在教学模式创新方面,应推广项目式教学、案例教学等方法,以真实产业项目为载体,引导学生主动参与问题解决。建立校企联合教学团队,邀请企业专家参与课程设计与教学,将技术需求与实践案例引入课堂。为此可构建“课堂实践十校内实训十企业实习”的三级实践教学体系,强化学生的场景落地能力。

此外,还应加大投入建设校内实训平台,配备数据标注工具、语音合成系统、大模型训练平台等条件,为学生提供常态化的实践环境。

(二)立足资源导向,强化语言资源建设与利用

语言资源建设是新质语言教育的重要方面。在语料库建设方面,应联合高校、企业、科研机构共建共享超大规模、轻度加工、来源多样、动态更新、建设主体多元化的语料库。建立语料库标注规范与质量控制体系,提升语料库的可用性,同时培养学生的语料库建设与使用能力,新质语言教育的实施过程,也是推动语料库建设的过程。

构建语言资源共享机制,打破高校、企业间的资源壁垒,建立国家级语言资源共享平台。整合各类语料库、技术工具、教学等资源,实现资源的高效利用。鼓励高校教师基于共享资源开展教学改革与科研创新,开发个性化的教学案例与实践项目。

(三)对接教育强国战略,完善人才培养保障体系

应加强顶层设计,将新质语言人才培养纳入国家语言人才发展规划,明确人才培养的日标、任务与路径。教育行政部门加大对语言学学科建设的支持力度,引导高校优化专业结构:加快跨学科专业建设,重点支持AI与计算语言学、语言智能教育等新兴方向。加强师资队伍建设,打造一支兼具语言学理论功底、技术应用能力与产业实践经验的跨学科师资队伍。

四、结语

实施新质语言教育是一项系统工程,需要立足教育强国战略,坚持语教融合理念与“大语言学观”,打破学科壁垒,创新培养模式,强化资源支撑,构建适应数字时代发展要求的人才培养体系

高校作为人才培养的主阵地,应主动适应市场需求变化,深化教学改革,加强校企合作,提升人才培养质量;企业应积极参与人才培养过程,提供实践平台与技术支持,实现人才供需精准匹配;政府应加强政策引导与资源支持,营造良好的人才培养环境。

图片

作者简介

语言教学与研究

饶高琦,北京语言大学副研究员、硕士生导师。北京语言大学语言学及应用语言学博士。中国中文信息学会青年工作委员会、计算语言学专委会、社会媒体计算专委会委员。主要研究方向为语言资源学、教育技术、语义规划学和数字人文。主持国家语委科研项目、教育部人文社科基金项目等多项课题,发表学术论文 50 余篇,参与起草规范、标准 5 种

比特人文

投稿邮箱:dhbase@126.com

扫码关注 获取更多资讯

图片

阅读原文

跳转微信打开

  •  

Call for paper | NLPCC 2026

NLPCC 2026 2026-04-03 09:00 江苏

NLPCC 2026于11月在澳门举办,6月13日截稿,录用论文由Springer出版。

转载自“计算机科学讲义”

会议全称:

The 15th CCF International Conference on Natural Language Processing and Chinese Computing (NLPCC 2026)

时间地点:

2026年11月3-5日,澳门

会议网址:

http://tcci.ccf.org.cn/conference/2026/

联系人:

info@nlpcc2026.org

投稿链接:

https://openreview.net/group?id=ccf.org/NLPCC/2026/Conference#tab-recent-activity

大会简介

CCF International Conference on Natural Language Processing and Chinese Computing (NLPCC 2026) 是中国计算机学会自然语言处理技术委员会的年度会议。自2012年创办以来,已在郑州(2020)、青岛(2021)、桂林(2022)、佛山(2023)、杭州(2024)和乌鲁木齐(2025)等地成功举办。NLPCC是自然语言处理和中文计算领域领先的国际会议。它为来自学术界、产业界和政府部门的研究人员和实践者提供了一个重要的交流平台,分享思想、研究成果和经验,并促进相关领域的研究和技术创新。

NLPCC 2026 将延续这一传统,欢迎提交原创性、高质量的研究成果。所有录用论文将由 Springer Lecture Notes in Artificial Intelligence (LNAI) 出版,并提交至主要学术数据库检索,确保研究成果的国际传播与学术影响力。

征稿方向

NLPCC 2026 欢迎以下领域的原创研究成果(包括但不限于):

  • 语言学与自然语言处理基础:Discourse and Pragmatics; Linguistic Theories, Cognitive Modeling and Psycholinguistics; Phonology, Morphology and Word Segmentation; Semantics; Syntax: Tagging, Chunking and Parsing

  • 机器学习、模型与智能体:Machine Learning for NLP; Interpretability and Analysis of Models for NLP; Large Language Models; LLM Agents

  • 多模态与交互系统:Machine Translation and Multilinguality; Speech and Multimodality; Dialogue and Interactive Systems

  • 信息抽取、检索与文本理解:Information Extraction and Knowledge Acquisition; Information Retrieval and Text Mining; Question Answering; Text Summarization and Generation

  • 应用与伦理:NLP Applications; Computational Social Science and Social Media; Sentiment Analysis; Ethics and NLP; Resources and Evaluation; AI for Science; AI for Software Engineering

重要日期

  • 投稿截止:2026年6月13日

  • 录用通知:2026年8月4日

  • 终稿提交:2026年8月15日

大会组委会

General Chair

Yue Zhang, Westlake University

Program Chairs

Roy Ka-Wei Lee, Singapore University of Technology and Design

Qi Zhang, Fudan University

Meishan Zhang, Harbin Institute of Technology (Shenzhen)

Workshop Chairs

Tieyun Qian, Wuhan University

Yang Zhao, Institute of Automation, Chinese Academy of Sciences

Evaluation Chairs

Jie Yang, Harvard University

Kunli Zhang, Zhengzhou University

Tutorial Chairs

Zhaochun Ren, Leiden University

Wenbin Jiang, Beijing Normal University 

Xiting Wang, Renmin University of China

Publication Chairs

Jianxing Yu, Sun Yat-sen University

Jin Wang, Yunnan University

Organization Chairs

Derek F. Wong, University of Macau

Haofen Wang, Tongji University

往届论文推荐

欢迎通过Springer出版您组织的学术会议,联系编辑团队获取合作信息!

比特人文

投稿邮箱:dhbase@126.com

扫码关注 获取更多资讯

图片

阅读原文

跳转微信打开

  •  

辅助,而非取代:声像档案的AI元数据生成模型与文化诠释

原创 魏小石 等 2026-04-03 09:10 北京

影音档案; 人工智能; 元数据生成; 文化诠释; 人机协同; 声音遗产; 检索增强生成(RAG); 民族音乐学; 知识图谱

转载请注明“刊载于《数字人文研究》2025年第4期”;参考文献格式:魏小石,马修·詹姆斯.辅助,而非取代:声像档案的AI元数据生成模型与文化诠释[J].数字人文研究,2025,5(4):60-67.全文PDF已在知网、万方及编辑部网站(http://dhr.ruc.edu.cn)上发表,此处注释及参考文献从略。

辅助,而非取代:声像档案的

AI 元数据生成模型与文化诠释

魏小石  马修·詹姆斯

摘要:文章探讨了在全球影音档案快速增长、文化语境日趋多元而机构资源普遍受限的背景下,如何借助AI技术实现从“数字化”到“知识化”的转型。面对资金紧缩、人才短缺及知识更新滞后等“三重困境”,传统的档案编目方式难以应对海量且多语种的声音材料。文章强调AI工具应定位于“辅助”而非“取代”人类专家的文化诠释能力。通过二位作者执行的人机协同著录案例,文章展示了如何结合RAG(检索增强生成)技术、专业标注框架与古典文献知识库,构建具备文化敏感性与语义深度的专用AI著录系统。最终,文章主张民族音乐学及相关领域学者应主动参与专用AI模型的共建,推动人机协同的编目新范式,在提升档案可及性的同时,维护文化诠释的准确性与多元性。

关键词:影音档案; 人工智能; 元数据生成; 文化诠释; 人机协同; 声音遗产; 检索增强生成(RAG); 民族音乐学; 知识图谱

作者简介:魏小石,中国音网(cdtmusic.com)总编辑,伦敦大学亚非学院客座研究员; 马修·詹姆斯(Matthew James),传统音乐智能体平台“Echo Arc”(声穹)联合创始人。

0  序言:

声像档案领域的“三重困境”

今天在此向学界同仁郑重介绍一项正处于起步阶段的研究计划——“EchoArc”(声穹)。这项计划的核心,远不止于构建一个技术性的概念原型;其更深层的旨趣,在于尝试搭建一个促进全球范围内档案馆、图书馆、博物馆(以下简称“GLAM机构”)以及相关机构之间系统性对话与协同共建的框架。我们怀揣这样一个愿景:在声音与视听档案数字化与知识化转型的关键历史节点,借助合乎伦理且智能化的技术中介,让散落于世界各个角落、承载着人类多元记忆与文化表达的声音档案收藏,能够以前所未有的深度与广度“被听见”(discoverable)、“被理解”(comprehensible),并最终更公平、更高效地“被获取”(accessible)

这一愿景的紧迫性,正源于一个我们共同面临的宏观趋势:全球声音档案(sound archives)的物理与数字存量正呈指数级增长(尤其是原生数字档案),其载体格式日益复杂,内容所涉语言与文化语境更加多元。与之形成根本张力的是,对声像影音遗产(及其文本格式的元数据及描述)进行高质量的组织与管理——包括其鉴定、著录、编目、保存与诠释,至今仍是一个深度融合了高度专业化人工判断与精细化操作的体系。这一过程不仅是劳动密集型的,其核心更在于对文化语境进行智慧密集型的解读与表征,因而难以被当前主流的自动化逻辑所简化和替代。

当下,GLAM机构正面临三种结构性的困境。首先,持续性的资金紧缩与预算不确定性已成为常态。许多GLAM机构的研究与典藏部门预算常年停滞甚至削减,而数字保存、基础设施升级与专业软件采购的成本却在不断攀升(Terras, 2015)。这使得机构在资源分配上往往陷入艰难抉择:是优先保障实体物料的物理安全,还是投资于数字化转型的长期需求?这种资源窘境直接导致了许多珍贵但“非核心”或未被充分描述的声像典藏被迫“沉睡”,难以进入整理与编目的序列。

其次,专业人才的结构性短缺与流失危机日益严峻。精通音响档案理论与实践、具备音乐人类学(民族音乐学)、语言学、民俗学知识,同时熟悉当代元数据标准(如MARC、Dublin Core、EBUCore等)的编目专家本身便是稀缺资源(Lee et al., 2021)。随着资深专家的退休,机构内部往往出现严重的知识和技能断代。与此同时,就业市场对数字技能的重塑,使得新一代信息专业人才的职业选择更加多元化,传统GLAM机构的吸引力相对下降,导致专业人力资源的补给线异常脆弱。

最后,传统知识与技能的更新速度与复杂的档案工作需求之间的落差在不断拉大。声像档案的内容包罗万象,从濒危语言录音、传统音乐表演、口述历史到环境声音景观,每一种类型都需要编目者具备相应的背景知识、文化敏感度与描述词汇表(Matusiak et al., 2019)。面对海量、多语种、多文化的待处理资料,任何单个机构、单个领域的工作团队,其知识储备都显得捉襟见肘。人工创建高质量的、具备多平台易用性的元数据,不仅要求描述事实的准确性,更要求对文化语境、表演实践、历史背景进行深度诠释,这是一项极其耗时、费力且需要持续学习与协作的智力工作。

正是这“三重困境”的交织与加剧,将一个明确而急迫的需求推至我们面前:开发具有可扩展性、可持续性的智能辅助工具,为GLAM机构的声像档案工作所用。这类工具的核心目标,并非天真的“自动化替代”,而是在尊重个体学者不可替代的核心判断力的前提下,赋能档案工作者与编目人员。在预算受限、人力不足的客观条件下,借助这些工具,能更高效地处理数据录入、格式转换、基础标引等重复性劳动,从而将宝贵且有限的人力(学者)资源释放到更需要人文洞察、批判性思维与跨文化沟通的环节中去——例如语境构建、关系关联、伦理审核与深层知识挖掘。唯有通过这种人机协同的新模式,我们才有希望系统性地整理、激活那些目前“被遗落的声景”,让这些承载着族群认同、历史记忆与生态智慧的珍贵声音,真正融入当代文化遗产网络之中,在数字(智)时代获得新生。

1  “辅助”而非“取代”

任何旨在辅助档案工作的工具,在处理那些承载社群历史、情感认同等复杂(且敏感)的民族志信息时,其设计与应用必须以维护信息的准确性与文化的细微差异为前提,而非将其作为效率的代价。这一原则构成了我们工作的基石。

为此,我们正致力于开发专门面向图书文献与文化遗产领域的特定AI模型。该模型的核心功能是辅助生成并翻译声像档案的元数据。在开发过程中,我们严格遵循MARC、Dublin Core等国际主流元数据标准,并将精准性、文化敏感度及学术协作规范嵌入模型的设计目标。通过自动生成符合这些标准的不同格式元数据文件,该工具旨在直接减少档案工作者在数据录入、格式转换等环节的重复性劳动负荷,从而有效提升档案材料在编目与收录初始阶段的处理效率和基础可访问性。我们的技术路径规划是从单个集合(及其条目)的细粒度描述入手,经过验证与迭代后,逐步扩大应用规模,从一个收藏扩展到另一个收藏。在此过程中,目标是将不同社群、不同学术传统中多层次、细节丰富的知识结构与描述逻辑,持续、可控地嵌入AI的学习过程,使其理解并尊重文化描述的复杂性

将AI技术引入高度专业化且充满诠释多样性的文化研究领域,引发疑虑是自然而然的。现实是,生成式AI已在诸多行业展现出大面积替代人力的趋势,我们亲历目睹了自由撰稿、基础编辑等领域在短时间内发生的职业重构。然而,必须清醒认识到:生成式AI虽然能够快速生成文本,但其产出在准确性、事实丰富性、真正的创造性以及具有文化说服力的叙事方面,尚未证明其能够超越受过严格训练的人类专家。它的“快”未必等同于“好”,更不意味着在理解文化深层意义方面具有优势

基于此,我们亟需明晰项目的根本定位:我们的目标绝非是利用自动化技术“取代”人类在元数据生成、翻译与著录模式整合(schema integration)等环节的专业技能。我们致力于打造的是能够与人类专家协同工作、并能在专家反馈下持续学习的智能工具。其核心价值在于,将专家学者从繁重、机械的数据处理工作中解放出来,将他们宝贵且有限的智力与时间资源,重新配置到那些无可替代、更需要人文洞察与批判性思维的任务中去。工具的价值,在于增强(而非削弱)人类知识的核心判断力。

2  如何开发AI编目工具?

——从通用模型到专用系统的路径

那么,我们该如何开始开发真正适用于文化遗产领域的AI辅助工具?首要步骤是明确认识到当前技术方案的局限性。目前,ChatGPT和DeepSeek这类通用型、“一体适用”的大型语言模型,在处理高度专业化、对文化语境极其敏感的档案编目任务时,其“表现”仍然相当粗糙。我们曾进行过一项具体测试:向DeepSeek模型输入来自一套哈萨克音乐集合的数字化音频文件、与之配套的原始档案说明文字,以及数篇经过同行审校、权威出版的民族音乐学研究文献,指令是生成符合图书馆行业标准的MARC编目记录。从表面产出看,模型在短时间内确实生成了一套结构上看似完整的MARC记录,包含了一些基础字段。然而,经过与领域专家的仔细核验,一系列明显且关键的错误与遗漏暴露无遗,这些缺陷系统性地揭示了通用模型的根本不足。

首先,在基础数据准确性与规范性层面,问题显而易见。例如,在涉及西里尔字母书写的哈萨克语人名、地名音译时,模型生成的文本并未遵循国际图书馆界通用的音译标准(如ALA-LC罗马化表)。这种细微的偏差并非无足轻重,它直接破坏了元数据在未来进行跨机构、跨数据库交叉引用与聚合时的互操作性,也严重影响了用户在检索时通过不同书写形式准确找到目标资源的能力。类似地,在地点和日期这类核心描述字段中,模型给出了“20世纪”或“阿勒泰—新疆”等极为模糊的信息。在强调精确来源出处与特定文化地理背景的档案著录语境中,此类描述非但无用,反而会引入歧义,使得后续研究者难以确定录音具体的地理归属与历史时段。

其次,在描述深度与语义丰富性层面,通用模型的输出显得过于笼统和扁平化。对于表演者的角色标注,模型通常仅列出姓名,却完全未能具体说明其在一段录音中的具体职能——某个人究竟是器乐演奏者、歌手、叙述者,还是兼而有之?此外,也未区分其贡献是表演一首经典传统曲目,还是对某个特定版本进行了个人化的诠释。在主题标引方面,模型往往只能提取最表层的、形式化的类别,如“民间音乐,哈萨克斯坦”,而完全忽视了深嵌在音乐之中的文化、信仰与生态维度,例如反映自然崇拜的“泛灵论”(animism)主题,或是录音中可能包含的特定“环境声音”(如风声、水流、牲畜叫声)。这些深层主题标签对于理解录音的文化意义至关重要,尽管它们在提供的背景文献中已有明确论述,模型却无法有效识别并转化为结构化元数据。

最后,在数据结构完整性层面,模型生成的MARC记录常常在关键字段中只保留空泛的占位符或指示性文本,而缺失了实质性的具体内容。这导致记录在形式上看似完整,在机读格式上也无错误,但在编目员和研究者看来,却缺乏进行有效知识组织与检索所必需的核心信息单元。

上述种种问题,绝不仅仅是单纯的技术瑕疵或数据训练不足。它们共同指向一个更深层、更本质的事实:元数据从来不是中性中立的;它并非是对客观事实的简单转录,而是一种文化的诠释,是特定知识体系、学术传统乃至认同观念的体现。一个主题词的选择、一种音译规则的采用、一个地理名称的表述方式,都蕴含着对文化内容的解读框架与价值判断。因此,即便是连字符的使用、主题标目的粒度、MARC字段内的分隔符,或是人名音译的标准这类最微小的细节,都会对这段录音未来如何被保存、如何被发现,以及最终如何被学术界和社会所重视,产生深远的影响。对于哈萨克音乐这类(可能)处于主流话语边缘的文化传统而言,高质量的元数据不仅仅是一种描述工具,更是一种伦理基础设施。它承担着公正表征文化身份、确保其能在全球知识体系中获得可见性与可理解性的责任

这一点,在田野录音的语境下显得尤为沉重,且紧迫。许多珍贵的实地录音,是民族音乐学者历经数十载,辗转于多个田野地点,克服重重困难才采集到的文化瑰宝;也有些录音,承载着一个家族对散居他乡或已故亲人的声音记忆,是社群情感与历史传承的非物质载体。对于这些凝结着巨大智力投入与深厚情感价值的材料,元数据的著录质量,直接决定了这些声音在未来数字环境中能否被尊重地对待、被准确理解其语境,并得以有效传承给后代。粗糙或错误的元数据,无异于在数字世界中对这些珍贵遗产进行二次损害,使其陷入新的“沉默”或“误读”之中。

3  AI技术实践的“一小步”:

赋能中国近现代声音文献检索

以下,以一项针对20世纪20—30年代78转唱片的具体研究为例,阐述我们在AI辅助编目领域的初步实践。刚才所讨论的关于AI工具设计的核心问题,并非空泛的理论推演,而恰恰源于我们此前对一项基础性测试的直接观察。在该测试中,我们系统地探究了AI如何从庞杂的、非结构化的原始信息中,自动识别并提取出符合专业编目要求的结构化元数据。这一尝试,其意义超越了单纯的技术验证;它本质上是对传统编目方法论边界的一次主动拓展,旨在探索人机协作模式下,知识组织逻辑所能延伸至的新领域与可能达到的新深度。

必须承认,当前对汉语有声文献——尤其是历史录音——进行系统化数据采集与智能化处理,面临着多层次的现实挑战。在图书馆学与信息科学领域,对文献资源进行准确、规范的描述,是一切知识组织与服务的基础。我们的实践表明,现有通用AI模型的知识库与认知框架存在显著局限。具体而言,对于具有强烈地方性特色的声音或音乐表演内容,例如那些依赖于特定地域文化、使用小众乐器或承载独特曲艺形式的录音,AI的认知表现出明显的匮乏与不确定性,其生成文本描述时常包含事实性谬误或文化误读。这种“知识盲区”使得AI难以独立承担对这类遗产进行高质量编目的任务。

正是为了应对这一核心挑战,我们与中国人民大学国学院吴洋教授的研究团队建立了跨学科合作,共同启动了名为“AI赋能中国近现代声音文献检索、深度描述与古典学研究——以北方曲艺为例”的项目。该项目旨在构建一个新颖的研究范式,即尝试利用经过严谨校勘、体系严整的中国国学经典文献所构成的权威知识库,作为AI模型理解相关文化内容的“锚点”与“基石”,进而对北方曲艺(如京韵大鼓、单弦、岔曲等)唱片中的唱词文本,进行系统化、多维度的深度语义标注。

北方曲艺的唱词文本,是一个蕴藏丰富的文化信息复合体,其中频繁用典、化用诗文、涉及大量历史人物、事件、民俗事象与地方性语言表达。然而,长期以来,这些唱词所承载的深厚文化内涵,并未与其源头的古典文献建立起深度、系统化的知识关联。传统的整理工作可能止步于唱词文本的转写与基本说明,未能将其置于更宏大的中华典籍与历史语境中进行互证与阐释,从而未能催生出经过深度考据与跨文本验证的、立体化的知识网络。

目前,我们(中国音网团队)已完成了相当规模的北方曲艺78转唱片的数字化转储,并初步整理了对应的唱词文本,形成了基础的、“结构化的”数据层。本项目当前阶段的核心任务,正是要突破这一层,致力于从历代文集、笔记小说、方志、韵书等浩瀚的“非结构化”古典文献中,提取相关知识单元(如典故出处、历史背景、词汇源流、民俗考释),并将这些提取出的知识点,精准地“编织”回北方曲艺唱词所对应的具体声音语境中去。

项目的学术核心,由人大国学院团队主导,师生们创造性地构建了一个从文献学、文学、历史学、民俗学、语言学五个核心维度出发的唱词深度标注框架与知识图谱模型。这五个维度并非孤立,而是相互交织:文献学考究版本与源流,文学分析文体与修辞,历史学定位事件与人物,民俗学解读仪式与风物,语言学辨析音韵与词汇。项目组成员需要手动标注至少1000个知识点,为AI理解提供结构化的认知地图。

在技术实现层面,中国音网团队负责提供关键的RAG技术架构。RAG,即“检索增强生成”,并非一个“开箱即用”的解决方案,而是需要精心设计和训练的技术范式。在本项目中,我们利用RAG的核心机制,为AI智能体赋能,使其能够:首先,在面对一段具体唱词时,自动识别其中可能涉及的知识点(如,某个典故、某个古地名),并触发对海量古典文献数据库的精准检索;其次,将检索到的相关文献片段作为增强的上下文信息,与原始唱词一并输入生成模型;最终,引导模型生成具有溯源依据的深度描述、注释或关联性分析。这一过程旨在系统性提升三大能力:一是语义还原能力,即准确理解唱词在古代汉语语境中的本义与引申义;二是跨域关联能力,即在曲艺唱词、历史记载、文学作品、民俗报告等多类型文本间建立有意义的链接;三是知识注释能力,即产出符合学术规范的考据性说明。

其后,更为关键的是“情境训练”。这一阶段的训练目标,是让AI模型学习并掌握“进入关联性知识图谱的路径”,实质上是教会它如何像该领域的学者那样,不仅能“回答”问题,更能帮助大众读者以符合学术探究习惯的方式“提出”问题,并自主进行知识追溯与关联分析。具体而言,这一过程高度依赖项目组成员——特别是具备文献学与曲艺研究背景的专家——进行手动的、高度情境化的问答训练。专家们并非简单地提供标准答案,而是需要模拟研究过程中真实的思维链条与探究场景。例如,他们不会直接问“《击鼓骂曹》中‘渔阳三挝’的典故出处是什么?”,而是可能从一个更开放、更具引导性的情境切入,比如:“如果我们听到一段鼓曲唱词中提到了‘祢衡’和‘曹操’,并伴有激昂的鼓点描述,我们该如何联想到汉代的相关史实与文学形象?又如何进一步探究‘鼓’在这一叙事中的象征意义及其与具体曲艺表演程式的关联?”

通过大量此类情境化、多轮次的问答“对话”,AI模型被引导去理解:一个知识点(如“祢衡”)如何作为入口,自然地关联到人物传记、历史事件、文学作品、音乐表现等多个知识图谱节点。更重要的是,它学习到人类专家在探索这些关联时所使用的语言模式、逻辑递进方式以及提问策略。这相当于为AI注入了专业领域内的“探究性思维”模板,使其能够逐渐学会从非结构化的文本中自主识别出潜在的知识关联线索,并以更贴近人类学术习惯的、连贯且富有逻辑的语言,进行深度的语义还原与知识注释。这一训练是将静态的知识库转化为动态、可推理的智能系统的核心环节。

本项目这“一小步”技术实践的长远目标,正是希望借助AI的赋能,系统性地应对声像档案著录、编目与诠释的核心挑战。将声音背后那些分散于不同典籍、隐含在表演细节中、且需极高专家素养方能建立的文化知识关联(如唱词典故、音乐程式、历史语境),转化为显性、系统、可规模化的结构化知识,我们旨在构建一座桥梁。这座桥梁连接着原始的声音资料与丰富的文化语义网络,使这些档案不仅能被听见,更能被深度理解与文化传承。

4  结语

利用AI技术构建MARC编目记录通用架构,仍存在诸多疑虑,也兼具多重利弊,但曲艺有声文献的案例,也展示了AI整合非结构化数据集(特别是源自中国古代文学经典的叙事音乐资料)的潜力。我们实践的个体项目之力难以改变整体格局,但我们坚信,唯有以具体问题为起点,启动AI智能体的领域化训练,方能切实迈出推动人文学科与AI技术深度融合、激活声音文献遗产的第一步。

我们主张,民族音乐学(及相关领域)学者必须摒弃技术旁观者心态,深度参与到数字工具与方法论的共同建构中。其核心路径在于:放弃“一体适用”的对大模型的幻想,不能坐视简单的、缺乏文化理解的通用数字工具被以“省时省钱”的名义草率地强加于文化遗产机构,最终牺牲档案工作中不可或缺的学术准确性与文化差异性;而应该转向开发本领域专用的AI模型。这要求学科专家与技术团队进行实质性协作:共同制定贴合文化语境的术语体系与受控词表,编写细致周详的描述与翻译指南,并构建由权威学术资源构成的高质量训练语料库。更为关键的是,必须建立一种持续迭代、人机协同的审校与反馈机制,使学者和档案工作者能以其专业知识直接校验输出、纠正偏差、注入文化洞察,从而驱动AI系统在“实践—反馈—优化”的循环中不断完善。因此,我们将AI模型的开发视作一个持续稳健、可协商的渐进过程。短期计划是务实而清晰的:与少数拥有特定声音典藏的机构合作,以小型馆藏为试点,全面评估实际编目挑战与人机协作模式,并以此为基石推进更系统性的工具开发。

我们深信,若此路径得以贯彻,AI技术有望成为一座关键桥梁,助力打破语言与元数据规范间的壁垒,显著提升音响档案的全球可及性。尽管前路充满风险,但我们坚信,唯有通过主动参与和积极建构,才能在人工智能的时代浪潮中,为多样的地方声音争取到应有的、公正的表征权,共同建造一个真正尊重文化差异、珍视声音内在价值的下一代编目基础设施。

“数字时代的声音档案专题”

声音档案在数字人文领域的创造性重构

民族志电影的时间维度:瓦罕走廊与南印度的案例

在博物馆中展示民间声音文献

从数字化到著录:音响档案的再语境化

图片

排版:覃子椿

初审:徐碧姗

复审:段婧怡

终审:夏翠娟

阅读原文

跳转微信打开

  •  

课程介绍丨AI+语言学的智慧课程建设与实践设计

2026-04-02 17:30 北京

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

本讲开始,我们进入智慧课程建设模块。首要的工作就是夯实理论基础,构建系统的方法论。

本课紧扣“AI课程建设”的核心主题,以《语言学概论》课程为具体案例,分析从顶层设计到课堂落地的智慧课程建设全流程。

首先,教师带领学员解读国家教育数字化战略行动的最新政策,剖析智慧课程建设的核心意义和内涵。

在此基础上,进一步探讨大语言模型、自动化知识图谱分析、课程多源数据库建设等前沿信息技术,如何从底层逻辑上重塑语言学乃至整个新文科的教学目标、内容体系与课堂中的师生关系。

最后,通过“语言学概论”课程从0到1的建设实录,真实展示如何借助信息技术破解文科教学长期存在的难点,构建数智化混合式教学新形态。

主讲人:龙润田

暨南大学文学院副教授,博士生导师,北京市课程思政教学名师,暨南大学汉语方言研究中心研究员、岭南数字人文广东省实验教学示范中心研究员、暨南大学—科大讯飞方言语音科技联合实验室研究员。主要从事南方少数民族语言历史与文化、语言智能与数据计算、国际中文教育相关领域的研究工作。主持国家社科基金、国家出版基金、教育部国家语委专项等国家级、省部级项目多项。在国内外权威期刊发表论文20余篇。获国家发明专利授权2项,软件著作权3项,研发TonePro、FormantPro等语言调查软件,建设“新发现少数民族古文字数据库”等数据资源。研究成果获第二十二届中国社会科学院吕叔湘语言学奖,教学成果曾获北京高校优质本科教材课件奖等省部级教学成果奖两项。

*了解培训详情及报名请扫描本文海报二维码。

←了解我们正在进行的项目

籍合学院

中华书局旗下

古籍整理与传统文化学习平台

阅读原文

跳转微信打开

  •  

《学习与探索》|| 仰海峰 | 同一性、直观与颠倒——商品拜物教的内在逻辑

2026-04-02 09:00 浙江

《学习与探索》2025年第8期

仰海峰   教育部“长江学者”特聘教授,北京大学哲学系教授、博士生导师。主要从事国外马克思主义哲学、马克思主义哲学史与哲学理论、当代思潮研究。出版专著《形而上学批判》《<资本论>的哲学》《西方马克思主义的逻辑》《符号之镜》等学术专著10余部;在《中国社会科学》《哲学研究》《求是》《人民日报》《光明日报》等报刊发表学术论文200余篇。主持国家社会科学基金、教育部人文社会科学重大攻关项目等多项。在本刊发表的论文有:《学术进展的镜子 青年学人的摇篮》(2009年第5期)、《历史唯物主义的政治经济学解读》(2011年第6期)、《机器与资本逻辑的结构化——基于<资本论>的哲学探讨》(2016年第8期)、《同一性、直观与颠倒——商品拜物教的内在逻辑》(2025年第8期)。

摘   要:商品拜物教是《资本论》商品章的重要内容。商品拜物教将人与人的关系归结为物与物的关系,并以此来理解资本主义社会的商品生产与交换过程。商品拜物教是由同一性、直观与颠倒这三个环节构成的。同一性体现为物与物的同一性、人与人的同一性、人与物的同一性。直观表现为对市民社会的镜像认同。颠倒指的是商品存在方式中的倒置状态,这种倒置被商品拜物教直接认同。在这三个环节中,对资本主义社会的直观构成了商品拜物教的基础。

关键词:同一性;直观;颠倒;商品拜物教;《资本论》

DOI:10.20231/j.cnki.xxyts.2025.08.001

仰海峰:《同一性、直观与颠倒——商品拜物教的内在逻辑》,《学习与探索》2025年第8期,第1-7页。

     在《资本论》第一卷第一篇的第一章,马克思在分析商品二重性、劳动二重性和价值形式后,写下了第四节“商品的拜物教性质及其秘密”。对于经济学家来说,这一部分无疑是多余的,因为它无法从经济学上得到说明。但对于《资本论》的结构与写作目的来说,这一章恰恰非常重要。《资本论》的重要意图在于对资本主义社会的科学分析与批判,拜物教部分展现的正是对资本主义社会存在及其思想的批判,这一批判又以前面关于商品与商品交换的政治经济学分析为基础,并实现了对前面章节的思想性提升。在过去关于拜物教的批判中,学界更多是从异化到拜物教批判的进路展开,讨论马克思思想的内在逻辑转变;或者结合拜物教这一章节,来讨论人与人的关系是如何简化为物与物的关系的。这些讨论无疑都是拜物教所要揭示的内容。在笔者看来,拜物教是商品生产与交换普遍化时代的思维模式,是对这一时代思想型的揭示。作为一种认知模式,同一性、直观与颠倒,构成了拜物教意识的基本认知方式,这样一种认知方式,既体现了资本主义社会商品生产与交换对人们思维方式的影响,又体现了这一思维方式对所处社会的认同与强化。社会存在与思想意识的这种内在回路,体现了拜物教意识的认知特色。

一、商品生产与商品交换中的同一性问题

     要理解商品拜物教,首先要确定的是这里所说的商品并不是一般意义上的商品,而是资本主义社会中的商品,正如马克思在《资本论》开篇所说的:“资本主义生产方式占统治地位的社会的财富,表现为‘庞大的商品堆积’,单个的商品表现为这种财富的元素形式。”在前资本主义社会,虽然有商品交换,但这种交换只具有局部性的特征,对整个社会的结构与行为方式的影响较为有限,比如在中国的农业文明时代,商人一直存在,但商品交换并不构成人在社会中的基本行为模式,建立在这一行为模式上的思维也就不会对整个社会产生根本性的影响。只有在资本主义社会,商品作为社会财富的细胞,商品交换才会渗透到社会生活的一切领域,商品才会取得社会生活中的统治地位。

     按照马克思的讨论,商品具有二重性,即使用价值与交换价值。使用价值满足人的需要,是社会财富的物质内容,同时又是交换价值的物质承担者。交换价值表现为一种使用价值与另一种使用价值相交换时的量的关系或比例。在两种商品的交换过程中,起决定作用的并不是商品的使用价值,而是商品的交换价值,这里就出现了商品交换中的第一重同一性,即不同质的商品化约为可比较的同质性商品,这种同一性可以扩展到所有商品间的交换中,这时任何一个商品虽然是同个别商品发生关系,但实际上是同整个商品世界发生社会关系,任何一个商品,都是商品世界的一个公民。这也意味着,处于普遍交换中的商品,作为它们质性规定的使用价值,让位于商品之间的同一种规定性,即交换价值,质性的关系转化为量的关系,质的差别被抽象掉了,剩下的是可比较的量的关系,这构成了商品交换中的第一重同一性。

     当事物的质不再成为其存在的依据时,事物之间的关系就会转变为量的关系,这是一种形式上可以比较的关系。具有使用价值的两种商品,本身无法化约为量的关系来进行比较,比如一瓶水和一支笔,这是两种不同质的商品,它们之间的作用也完全不同,对于沙漠中的旅行者来说,水无疑至关重要,而对于书写者来说,没有笔就无法工作。但在商品交换中,两种不同质的东西必须置于一种同质性的层面,只有这样才能比较。这时内在于商品中的质被抽离了,两种不同质的商品或物成为一种无质性差别的存在物。这种存在物存在于所有商品之中,是不同于使用价值与交换价值的第三者,即劳动。“如果把商品体的使用价值撇开,商品体就只剩下一个属性,即劳动产品这个属性。”商品的交换价值与人类劳动紧密相关,商品具有价值,就是因为其里面有抽象的人类劳动对象化或物化。

     商品的二重性源于劳动的二重性,即具体劳动与抽象劳动。具体劳动与使用价值相关,就像桌子是木匠的作品,衣服是裁缝的作品,体现了劳动者的具体技能。但正如使用价值是交换价值的载体一样,具体劳动是抽象劳动的现实化。在商品交换中,具体的劳动是无法比较的,商品交换的过程就是把具体劳动抽象化的过程,劳动的各种具体形式也消失了,剩下的就是无差别的抽象劳动,即价值无差别的人类劳动的单纯凝结。商品交换中所体现出来的价值量,就是对无差别的人类劳动的量的计算与比较,体现的是人类劳动力的耗费。

     在这里,我们遇到了商品交换中的第二重同一性,即人与人之间的同一性。正如物与物之间无法比较一样,人与人之间差异更大。就劳动而言,木工的劳动与瓦工的劳动就无法比较,这两种劳动具有各自的质性规定。但在普遍化的商品交换中,与质性相关的具体劳动让位于抽象劳动,比较的是两种不同质性劳动中的抽象劳动——可以用数量来标定的劳动,这是从具体劳动走向抽象劳动的过程。近代以来劳动价值论的创立过程充分反映了这一进程。在重商主义时代,人们把货币看作财富的本质,这是从外在对象来定义财富的。在重农学派中,人们把农业劳动看作财富的来源,这种劳动还有具体劳动的特征,但当把这种劳动看作一切财富的规定时,其已经具有了抽象性。财富的本质不再是外在性的规定,而是人的特定劳动的外化,这是财富的外在规定性向人回归的重要一环。当斯密把一般意义上的人类劳动看作财富的本质规定时,这种劳动已经抽象了各种具体劳动的质性规定,是抽象劳动,这种抽象劳动正是商品生产与交换普遍化时代的工业劳动。这种劳动抽象了人的一切特定劳动的质性,体现的是所有劳动中都存在的抽象劳动,也正是在这样的意义上,劳动价值论表明只有人才是财富的根本。人的类存在正是在这样的意义上成立的。表面看来,这是对人的极其尊重,但实际上在这样的尊重中,人的个性被抹平了,人已经被化约为同一化的个体。正如青年马克思所评论的:“如果上述国民经济学是从表面上承认人、人的独立性、自主活动等等开始,并由于把私有财产移入人自身的本质中而能够不再受制于作为存在于人之外的本质的私有财产的那些地域性的、民族的等等的规定,从而发挥一种世界主义的、普遍的、摧毁一切界限和束缚的能量……它十分片面地,因而也更加明确和彻底地发挥了关于劳动是财富的唯一本质的论点,然而它表明,这个学说的结论与上述原来的观点相反,实际上是敌视人的。”在可以比较的抽象劳动中,个性的人不再重要,重要的是他能够把自身的劳动化约为可比较的抽象劳动,这是把有个性的人等同为可以量化比较的人,这样的人实际上是一种与物相似的存在。

     上文分别讨论了人与人的同一性、物与物的同一性,但这还不足以揭示资本主义社会最为重要的一种同一性,即人与物的同一性。在常人的一般理解中,商品指的是人的劳动产品,这样的界定比较适合于前资本主义社会,在资本主义社会,商品不仅指人的劳动产品,而且还包括人本身,即当人成为劳动力时,人已经成为商品。

     在资本主义社会,商品交换的目的是为卖而买,即获得比购买时更多的价值。这种更多的价值从何而来?这当然不能从贱买贵卖而得,因为当所有人都这样做时,最后一切归零。如果这种多余的价值不能从买卖中得到,那就只能来自生产过程。资本主义生产的一个非常重要的条件是劳动力成为商品。劳动力成为商品需要两个重要的条件:一是劳动者与劳动资料的分离,二是人是自由平等的。劳动者只有成为一无所有者时,才能出卖自身。只有当个体是自由平等的,其才能在市场上自由地出卖自己,否则就只能是依附性的奴隶或农奴。在这个意义上,自由与平等正是自由市场的内在要求,也是劳动力成为商品的重要条件。在《资本论》中,劳动力成为商品这部分的内容,在“货币转化为资本”章得到了充分的说明。到这里可以看出,在商品生产与交换普遍化的时代,商品不仅指人的劳动产品,而且指人本身,这是将人与物同一化的过程。到这里我们更能看出斯密劳动价值论的哲学底蕴。马克思在《1844年经济学哲学手稿》中已经指出了古典经济学劳动价值论的异化本质,这在上文已经引证。当劳动力成为商品时,马克思并不是从道德层面来讨论这一问题的非人性,而是从商品生产与交换中来客观地说明这一问题,即人的物化,这是资本逻辑的现实必然,只有实现了人与物的同一化,才能彻底实现商品生产与交换的普遍化。

     可见,在商品生产与单打独斗中,存在着三重同一性,即物与物的同一性、人与人的同一性、人与物的同一性。正是这三重同一性,造就了一个同质化的商品世界,商品才能无差别地延伸到所有领域,成为至高无上的统治者。

二、直观与社会镜像

     在《关于费尔巴哈的提纲》与《德意志意识形态》中,马克思批判了费尔巴哈的哲学,特别是费尔巴哈哲学的直观意识。

     费尔巴哈哲学有两个基本主题:一是将哲学从僵死的宗教世界中解放出来,引向活生生的人间世界;二是按照人的方式来重新阐述哲学,并以此来建构尘世生活。前者构成了他的宗教批判的基本主题,后者则是他阐释未来哲学的基本内容,在这两重问题意识中,人的类本质及其异化批判构成了一以贯之的逻辑。

“近代哲学的任务,是将上帝现实化和人化,就是说,将神学转变为人类学,将神学溶解为人类学。”这是费尔巴哈1943年“未来哲学原理”的第一条。在费尔巴哈看来,无所不能的上帝,实际上是人的类本质的理想化,是对人的各种能力的汇聚与神化,在这个意义上,“神学之秘密是人本学”。上帝就是人,人就是上帝,只不过在宗教中这一点是通过否定的方式表现出来的。宗教先使上帝成为人,然后使这个具有人的模样、像人一样感知和思想的上帝成为人的崇拜和敬仰的对象,因此,上帝是人的类本质的对象化,是人所创造出来的想象对象,人对上帝的跪拜实际上是对人本身的跪拜。这就是费尔巴哈所说的拜物教,即人跪倒在自己的创造物面前。近代哲学的任务就是要将人从这种拜物教中解放出来,将哲学的眼光回到人本身,这是费尔巴哈哲学批判的任务。

     在这个批判中,人的类本质是整个论述的基础。怎么理解人的类本质呢?在费尔巴哈看来,人的类本质体现在以下几个方面。第一,类本质是自由自主的。在人的类本质中,理智、意志、心构成最为基本的东西。“一个完善的人,必定具备思维力、意志力和心力。思维力是认识之光,意志力是品性之能量,心力是爱。理性、爱、意志力,这就是完善性,这就是最高的力,这就是作为人的人底绝对本质,就是人生存的目的。”人类的生存,就是为了认识、为了爱、为了愿望,意志的目的就是为了自由,只有凭借这些,人才成为人。第二,类本质是完满的、无限的。宗教是对无限的东西的意识,但宗教在本质上又只是对人的本质的意识,无限者的意识同样不过是对意识之无限性的意识,因此在上帝这个无限者的意识中,实际上是人对自身本质无限性与完满性的意识。第三,人的类本质是在人与人的交往关系中形成的。“孤立的,个别的人,不管是作为道德实体或作为思维实体,都未具备人的本质。人的本质只是包含在团体之中,包含在人与人的统一之中。”在这种统一中,人不仅把自己当作“我”,也当作他人的对象“你”,“我”与“你”,是不同于“我”与“他人”的关系,体现的是人的类本质,“人本身,既是‘我’,又是‘你’;他能够将自己假设成别人,这正是因为他不仅把自己的个体性当作对象,而且也把自己的类、自己的本质当作对象”,“我”与“你”的关系是一种非常亲近的关系,这种亲近关系在男人与女人的情爱中得到了充分体现。从这里大概可以理解费尔巴哈为什么将爱作为哲学的核心范畴了。

     费尔巴哈关于人的类本质的讨论,实际上是对市民社会的反思。在《法哲学原理》中,黑格尔曾指出:“在市民社会中,每个人都以自身为目的,其他一切在他看来都是虚无。但是,如果他不同别人发生关系,他就不能达到他的全部目的,因此,其他人便成为特殊的人达到目的的手段。”以劳动分工体系为基础的市民社会,虽然能够促进个人与社会的发展,但也存在着几个负面的特征:第一,这是一个原子式个人的社会;第二,这是一个自私自利的社会;第三,这是一个将个人碎片化的社会。也就是说,市民社会在本质上是以自私自利的原子式个人构成的社会。熟悉黑格尔的费尔巴哈当然了解这些,他关于类本质的讨论,针对的正是市民社会中人的存在状态,以人的类本质取代市民社会中自私自利的个人。在《论犹太人问题》中,马克思同样是在黑格尔的意义上来论述市民社会的,他指出鲍威尔所讲的宗教解放,最多只是将宗教的人变成市民社会中的人,即自私自利的原子式个人,这并不能真正地将人解放出来。那么怎么批判市民社会呢?借助于费尔巴哈的这一逻辑,马克思通过阅读古典经济学,在《1844年经济学哲学手稿》中提出了劳动异化理论,以劳动本体论与人的类本质为基础,批判分析了异化劳动的四重形式,以此批判市民社会的异化本质与人的异化状态,并提出以共产主义取代市民社会的解放方案。

     但到了《关于费尔巴哈的提纲》与《德意志意识形态》中,马克思批判了费尔巴哈哲学的直观性问题。在《关于费尔巴哈的提纲》第一条中,马克思这样写道:“从前的一切唯物主义——包括费尔巴哈的唯物主义——的主要缺点是:对对象、现实、感性,只是从客体的或直观的形式去理解,而不是把它们当做人的感性活动,当做实践去理解,不是从主体方面去理解。”在这里,从客体的视角与从直观的视角是一致的,仅从客体出发也就是从直观出发。从客体出发,看不到人的实践活动对客体的影响,这时的认识就是对客体的镜像,即像照镜子一样去反映客体。费尔巴哈对客体的直观体现在两个层面:一是面对自然,强调对自然的直观。对此,马克思批评道,如果不考虑人的实践对自然的影响,那么费尔巴哈的自然大约只有在“澳洲新出现的一些珊瑚岛以外今天在任何地方都不再存在的、因而对费尔巴哈来说也是不存在的自然界”。马克思以此强调人的实践对自然界的影响。二是对市民社会的直观。这里的问题是,费尔巴哈面对市民社会时,并没有像照镜子一样,认为这样一个自私自利的、原子式的个人的社会是正确的,然后从原子式个人出发来理解现实,就像古典经济学家那样。在古典经济学家看来,只要个人能够按照经济最大化原则进入自由市场,那么市民社会就会实现良性发展。按照费尔巴哈关于人的类本质的讨论,市民社会中的人并不是人的类本质的体现,而是异化的个体,这意味着从原则上来说,费尔巴哈是批判市民社会的,那么为什么还说费尔巴哈完成了对市民社会的镜像认同呢?或者说,他虽然没有像照镜子似地直接认同市民社会,为什么还说他的哲学是对市民社会的直观呢?就像马克思所说的,费尔巴哈诉诸感性的直观,这种直观的唯物主义的立足点是市民社会,“至多也只能做到对‘市民社会’中的单个人的直观”。马克思指出,在面对社会存在时,费尔巴哈“不得不求助于某种二重性的直观,这种直观介于仅仅看到‘眼前’的东西的普通直观和看出事物的‘真正本质’的高级的哲学直观之间”。这种直观,从根本上来说是对社会的镜像认同。

     直观分为两种类型:一是镜像认同,二是镜像倒置。镜像认同是一种直面观照。这种直观意味着,社会呈现出什么样就被认为是什么样。比如在当时的资本主义社会,随着市民社会的形成,市民社会中的个体都以自己的私人利益为一切目的,人与人之间为了自己的利益形成竞争与冲突关系,为了私利而不顾一切,人与人的这种关系被霍布斯描述为狼与狼的关系。古典经济学将市场上的商品交换与自由贸易看作人类的自然状态,就像斯密在《国富论》中所论述的那样,由于人不能生产出自己所需要的全部用品,只有在市场上进行自由交换才能实现上述要求,所以这种以市场为中介的交换是最合乎人性的。在这样的论述中,实际上已经将市民社会的存在状态看作人类的自然社会状态和最合乎人性的状态,这就是对市民社会的直观。在1862年致恩格斯的信中,马克思在谈到达尔文的生物进化论时指出:“达尔文在动植物界中重新认识了他自己的英国社会及其分工、竞争、开辟新市场、‘发明’以及马尔萨斯的‘生存斗争’,这是霍布斯的一切人反对一切人的战争,这使人想起黑格尔的《现象学》,那里面把市民社会描写为‘精神动物的世界’,而达尔文则把动物世界描写为市民社会。”不是达尔文为马克思的学说提供了自然科学的基础,而是达尔文按照市民社会的方式认识了自然界,这就更加确证了市民社会是自然社会。这是一种直接的镜像认同。

     镜像倒置则是直接以反题的方式面对市民社会。正如市民社会是自私自利的社会,其反面则应该是爱的;市民社会中的个人是原子式的,其反面则应该是体现人的类本质的;市民社会中的个体是异化的,其反面则应该是自由自觉的;等等。从这种反面入手,可以得出市民社会的本质是颠倒的,需要重新将之颠倒过来,费尔巴哈所讲的人的类本质并以此来批判市民社会,就体现了这一点。人的类本质是自由自觉的、完满的,体现了人的本质的交往关系,其根本特征体现在以男女自然之爱为基础的“爱”的关系中。恩格斯在《费尔巴哈与德国古典哲学的终结》中指出,费尔巴哈强调追求幸福,要求从“爱”出发,但这种思想在本质上体现了证券交易所的内在逻辑。“如果我的追求幸福的欲望把我引进了交易所,而且我在那里又善于正确地估量我的行为的后果,因而这些后果只使我感到愉快而不引起任何损失,就是说,如果我经常赚钱的话,那么费尔巴哈的指示就算执行了。我也并没有因此就妨碍另一个人的同样的追求幸福的欲望,因为另一个和我一样,是自愿到交易所去的,他和我达成投机交易时是按照他追求幸福的欲望行事,正如我是按照我追求幸福的欲望行事一样。如果他赔了钱,那么这就证明他的行为是不道德的,因为他盘算错了,而且我在对他执行应得的惩罚时,甚至可以摆出现代达拉曼的威风来。只要爱不纯粹是温情的空话,交易所也是由爱统治的,因为每个人都靠别人来满足自己追求幸福的欲望,而这就是爱应该做的事情,爱也在这里得到实现。”费尔巴哈以一种颠倒的方式实现了对社会的镜像反映,如同硬币的正面与反面实际上是同一回事那样。在这个意义上,作为思辨哲学家的黑格尔,在其哲学的起点上同样是直观的,因为他关注的同样是对资本主义社会的直接改良,这仍然是以资本主义社会存在作为自然存在来确立自己的思考的。

三、颠倒与拜物教

     直观是将倒立的社会看作正常的社会,要打破直观,需要深入到资本主义市民社会中去,去看看这个社会是如何倒立成像的,或者说要揭示这个社会是如何自我颠倒的,这正是马克思在商品拜物教中揭示的问题。

     “最初一看,商品好像是一种简单而平凡的东西。对商品的分析表明,它却是一种很古怪的东西,充满形而上学的微妙和神学的怪诞,就商品是使用价值来说,不论从它靠自己的属性来满足人的需要这个角度来考察,或者从它作为人类劳动的产品才具有这些属性这个角度来考察,它都没有什么神秘的地方。很明显,人通过自己的活动按照对自己有用的方式来改变自然物质的形态。例如,用木头做桌子,木头的形状就改变了。可是桌子还是木头,还是一个普通的可以感觉的物。但是桌子一旦作为商品出现,就转化为一个可感觉而又超感觉的物。它不仅用它的脚站在地上,而且在对其他一切商品的关系上用头倒立着,从它的木脑袋里生出比它自动跳舞还奇怪得多的狂想。”马克思用这段话描述出了商品拜物教中商品的存在方式,即其神秘性与倒置性。

     劳动产品是由具体的物质构成的,这种物质有其自身的物性,比如桌子,虽然木头的形状改变了,但作为具体存在,其质的规定性并没有变。但如果劳动产品成为商品,这种物性自身便消失了,作为商品的桌子与作为劳动产品的桌子存在着根本的差异,后者是一种具体的物性存在,而前者则消除了作为具体物的物性才能处于商品流通之中,并以新的物性来确立自身的存在,这是物品存在方式的倒置,这种新的物性即一种新的关系,即人与人的关系,而物与物的关系必须依赖于人与人的关系,这是在劳动中结成的关系。处于这种劳动关系中的个体看起来是自由、平等的,体现了人的本质规定。但从实际的情况来看,这种自由与平等只是个体进入一种新型关系的入口,一旦进入到商品生产与交换的关系中,个体的特性就不再重要,重要的是可比较的特性,商品生产与交换就是量化的劳动、一种抽象的劳动。这是人与人关系的颠倒。在这种关系中,费尔巴哈所讲的那种体现人的类本质的状态并不存在,马克思上述的描述,揭示的正是商品的这一存在方式。这是一种双重的物化关系,一是将人与人的关系还原为物与物的关系,二是将物与物的关系还原为非物性的商品间关系,真实的关系被遮蔽了,生产过程与交换过程中的颠倒以一种直接的商品关系表现出来,正是在这一转换中,作为商品的劳动产品,获得了一种可感觉又超感觉的属性,获得了与其物性不一样的生命,这才是商品的神秘性所在,也是拜物教的本质所在。

     从商品世界的结构倒置来看,拜物教本性不在于物与物之间的关系,而在于人与人之间的关系,但这种关系在表面看来恰恰是合乎人性的。近代以来,人天生是自由而平等的,这构成了西方文化的一个重要内容。马克思指出,这种自由与平等恰恰是商品生产与交换的条件,也就是说,按照自由而平等建立起来的契约关系恰恰是自由市场得以可能的条件,在这个意义上,自由与平等不是目的,而是手段,是价值增殖的手段。这意味着在市民社会中,由于商品生产与交换的普遍化,人与人的关系本身就是倒置的,只有在人与人的关系发生颠倒的情况下,才可能将人与人的关系还原为物与物的关系,人们在劳动中的直接的社会关系,才能表现为人们之间的物的关系和物与物之间的关系。

     商品生产与交换中的这种颠倒与同一性相伴相随,可以说正是同一性的过程才使得这种颠倒成为可能,同样也正是这种同一性,才使得颠倒了的社会关系呈现为一种抽象的关系,当这种抽象的关系物化为商品之间的关系时,拜物教得以完成。在这个意义上,直观是一种拜物教意识,从思辨出发的抽象同样是一种直观。当抽象成为统治,反映抽象的思辨在具体的展开中,其逻辑虽然是辩证的,但其理论前提同样是直观的。在这个意义上,直观唯物主义与思辨的唯心主义并无二致,这种无差别的原因在于:两者都以市民社会为直接的对象,两者都没有想到要从根本上解决市民社会的问题,即从市民社会走向一个更高级的社会存在。也正是基于这样的理由,我们可以看到在讨论拜物教时,马克思落脚于共产主义的问题。在他看来,要彻底摆脱拜物教思维与拜物教的社会,必须走向另一个社会,即“设想有一个自由人联合体,他们用公共的生产资料进行劳动,并且自觉地把他们许多个人劳动力当做一个社会劳动力来使用”。在这种状态中,人们在日常生活中才能建构一种极其清晰而合理的关系,“只有当社会生活过程即物质生产过程的形态,作为自由联合的人的产物,处于人的有意识有计划的控制之下的时候,它才会把自己的神秘的纱幕揭掉”。只有这时,才能真正走出商品拜物教。

结   语

     商品拜物教体现了资本主义社会的意识形态,构成了资本主义社会思想的基本原型。根据马克思的思想精神,近代以来的哲学,不管是旧的唯物主义,还是旧的唯心主义,实质上都是一种拜物教思维。旧的唯物主义的直观,是对资本主义社会的直观,即使是费尔巴哈的人本学,表面上看起来是对市民社会的批判,但实际上仍然是对市民社会的另一种认可。旧唯心主义,即使是黑格尔的唯心主义,对资本主义社会进行了深入的反思和批判,看到了市民社会的问题,强调以国家理性来干预市民社会,但从总体上来说,对资本主义社会保持着一种自信。也正是在这个意义上,借用福柯的概念,拜物教体现了一种思想型。马克思对拜物教的批判,才是对资本主义社会思想观念的底层逻辑的批判,这正是我们今天重新思考拜物教时,需要深入讨论的。

略去参考文献,如有需要请参阅原文

【责任编辑:张圆圆

【网络编辑:姜新旸】

【审     核:房宏琳

阅读原文

跳转微信打开

  •  

《语言与智能》征稿启事

BFSU AI 2026-04-02 09:00 江苏

以下文章来源于:北外人工智能与人类语言实验室

北外人工智能与人类语言实验室

实验室立足学校外语教学与研究传统优势,聚焦国家人工智能与教育领域的前沿问题,创新机制体制,凝聚国内外交叉学科智库资源,着力开展语言学习机理研究、基于人工智能的语言教学研究、多语言语料库、多语自然语言处理和外语健脑强智研究。

第1辑正式出版,第2辑开始征稿,欢迎各位专家学者赐稿,感谢大力支持!

近年来,以ChatGPT为代表的大语言模型的出现使语言智能研究成为人们关注的热点领域。为充分发挥教育部哲学社会科学实验室、语言智能教育部工程研究中心的科研育人作用,深化科教融合,加快科研成果转化,北京外国语大学人工智能与人类语言重点实验室联合外语教学与研究出版社,推出《语言与智能》学术期刊(ISBN:978-7-5213-5692-2)。期刊聚焦人工智能与人类语言领域前沿问题,旨在推动语言学、认知科学和人工智能等领域的深入研究,促进学科交叉融合,加强研究者相互交流,传播高水平前沿学术研究成果,支持优秀学术人才成长。

《语言与智能》第1辑已于2024年10月正式出版,包含语言认知、语言智能服务、语言智能教学、语言智能翻译四个栏目,共8篇学术文章,感兴趣的读者可在文末选购本书。

《语言与智能》第2辑 征稿启事

1. 期刊定位与目标

《语言与智能》是一个涵盖语言学、人工智能、认知科学、神经科学、临床医学等领域的跨学科学术中文期刊,主要刊发语言与智能领域原创性研究成果、理论性文章和反映研究现状的评论性文章。每年出版2期,面向国内外公开发行。

秉承“交叉融合、守正创新”的办刊宗旨。坚持以多元领域的前沿重大理论问题和重要现实问题为导向,择优录用能够引导交叉学科发展的原创性稿件,刊载具有理论性、实证性及前沿性的研究成果。本刊根据国际学术期刊惯例,不以职称、学历、单位等标准判定论文质量,全程实行匿名评审制度,及时向作者反馈审稿意见。

2. 主要栏目

(1)语言智能研究:涉及语言学与其他认知科学、智能科学的交叉领域研究,包括语言与认知、语言与脑科学、机器翻译、计算语言学、知识图谱研究、语言蚀失和语言障碍研究、语料库研究、智慧语言教学等。

(2)言语规律及其机理研究重点研究人类言语现象和规律,基于脑科学、认知科学的语言现象机理研究,人类言语行为与机器智能的互动促进研究等。

(3)语言数据和语言模型研究:包括语言数据的收集、标注、应用以及数据驱动的语言研究技术等。

(4)语言智能技术研究:包括语音识别与合成、机器翻译、自然语言处理、人机对话、大模型原理与对齐技术、智能搜索等领域的关键技术创新研究。

(5)语言智能创新应用研究:包括大语言模型应用场景、策略的研究等。

(6)前沿综述与评述:涉及学科研究的前沿动态、最新发展趋势等的研究综述与反映研究现状的评论性文章。

(7)学界动态:包括书刊评介(对近2年内的语言学外文原版专著进行内容介绍和评价,需突出重点及新兴信息)、交叉学科建设资讯等。

3. 稿件要求

(1)原创性论文:要求具有较新的观点,或在研究过程中采用新的理论视角、研究方法;基于数据且比较扎实的个案研究;写作规范,方法科学,论证围绕核心观点展开,长度10,000—12,000字。

(2)书评:主要针对近三年出版的语言智能研究领域论著,以国内外新书为主;在介绍的同时,以研究性评论为主;内容可涉及该书的选题、价值、特点、研究方法以及不足之处等,长度8,000—12,000字。

(3)来搞要求遵守学术规范。参考文献格式体例参照中华人民共和国国家标准《信息与文献 参考文献著录规则》(GB/T 7714-2015)。

(4)投稿请直接发送投稿邮箱bfsu_ai@126.com,邮件请以“专题+标题+姓名+作者单位”命名,来稿附件请用Word文件。初审通过后,编辑部将邀请专家进行外审,一般在三个月内就刊登与否予以答复,若到期未收到录用通知,作者可自行处理稿件。稿件内容文责自负,编辑部保留对稿件进行必要修改的权利。

(5)来稿请于文末注明作者简介,包括姓名、单位、职称(在读研究生请规范注明“博士研究生”或“硕士研究生”;在站博士后请规范注明博士后流动站名称或所在二级学院和“在站博士后”)、研究方向、通讯地址、邮编、电话及电子邮箱。若有多个作者,请用分号隔开。获得基金资助的项目,请注明项目名称及项目编号。

    欢迎各位专家学者赐稿,感谢大力支持。

《语言与智能》期刊编辑部

2024年11月

《语言与智能》第1辑正式出版

 点击图片看大图

感兴趣的读者请点击下方小程序选购本书。

阅读原文

跳转微信打开

  •  

会议通知丨中国历史文献研究会数字文献分会第四届年会

2026-04-03 08:30 湖北

为深入贯彻落实国家相关战略部署,中国历史文献研究会数字文献分会联合湖北大学文学院,立足雅学与传统语言文献的数字化整理及数据库建设实践,拟于2026年10月在武汉举办“中国历史文献研究会数字文献分会第四届年会”。

2026

国历史文献研究会数字文献分会

第四届年会

中国·武汉

在数字人文蓬勃发展的时代背景下,古籍文献的整理、研究与传承已步入数智赋能的新阶段。国家高度重视古籍资源的转化利用,明确以体系化整理、知识化构建、智能化应用为导向,系统推进古籍数字化进程。

为深入贯彻落实国家相关战略部署,进一步探讨数智时代传统文献研究的理论前沿与实践路径,中国历史文献研究会数字文献分会联合湖北大学文学院,立足雅学与传统语言文献的数字化整理及数据库建设实践,拟于2026年10月武汉举办“中国历史文献研究会数字文献分会第四届年会”。

会议拟围绕数智赋能下的传统文献本体研究、数据库及数据平台建设、数字人文教育教学理论与实践、人文学科高水平实验室建设等问题展开深入研讨,旨在推动古籍整理研究的理论、方法与实践创新,促进古籍资源的当代传承与活化利用。诚邀海内外专家学者与青年学子踊跃投稿、莅临研讨,携手推进古籍数字化研究与传承创新,共促数字文献研究高质量发展。

1

会议时间

2026年10月下旬

2

会议地点

湖北武汉

3

会议议题

共设置7个议题

1. 中国古典文献文本分析

2. 雅学与传统语言学研究

3. 中国古典文献的数字化整理与研究

4. 古籍大数据构建及智能体辅助研究

5. 数字人文理论与方法探索

6. 数字人文人才培养与教学实践

7. 人文学科高水平实验室建设

4

参会与投稿

请有意参会者于2026年6月30日前扫码提交参会回执;

2026年8月31日前提交会议论文全稿至会议邮箱shuziwenxian@ancientbooks.cn。

扫码填写参会回执

5

会议费用

1. 会议不收会务费;

2. 交通费、住宿费自理;

  1. 承办方负责会期餐食及会议其他费用。

6

会议联系

杜老师 :027-88661842

朱老师 :010-63311541

会议邮箱:

shuziwenxian@ancientbooks.cn

中国历史文献研究会数字文献分会

湖北大学文学院

中华书局古联公司

2026年 2月14日

END

来源 | 数字人文专业发展联盟

阅读原文

跳转微信打开

  •  

案例征集 | 面向全球!2026年世界互联网大会文化遗产数字化案例征集即日启动!

世界互联网大会 2026-04-03 08:30 湖北

以下文章来源于:世界互联网大会

世界互联网大会

世界互联网大会国际组织总部设在中国北京,宗旨是搭建全球互联网共商共建共享平台,推动国际社会顺应数字化、网络化、智能化趋势,共迎安全挑战,共谋发展福祉,携手构建网络空间命运共同体。

三星堆青铜神树借助裸眼3D技术动态呈现纹饰密码;应县木塔的榫卯结构在数字世界里实现完整“重生”;永乐宫壁画穿越700多年时空,“衣袂飘飘、裙裾飞扬”……2025年7月,世界互联网大会首次面向全球启动文化遗产数字化案例征集,最终遴选出40项案例,汇编成《世界互联网大会文化遗产数字化案例集(2025)》,为相关领域工作提供了可借鉴的实践经验。

今年,世界互联网大会继续面向全球征集文化遗产数字化优秀案例,促进数字技术赋能文化遗产保护,推动文化与科技高度交融,历史与现代深入交织,在数字浪潮中拓展文化遗产的崭新边界。

1

参与征集能获得哪些机遇

1. 入选《世界互联网大会文化遗产数字化案例集(2026)》,获颁证书。

2. 受邀出席世界互联网大会乌镇峰会等重要会议活动,与全球政企学研大咖交流合作。

3. 在世界互联网大会重要活动中对案例进行展览展示

4. 多语种媒体平台宣传曝光。

2

如何参与征集

01

面向对象

  • 本次案例征集面向政府部门、国际组织、社会团体、文博单位、科研机构、高等院校、企业等多种机构开放。

  • 鼓励跨领域联合申报

02

申报地址及截止时间

  • 申报机构请于北京时间2026年4月20日18:00前登录在线申报系统(文化遗产数字化项目)完成申报。

03

案例类型

    • 案例征集分文化遗产保护”“考古”“展示利用三个方向。

    • 依据文化遗产数字化工作特性,每一大类又下设若干小类,请结合案例实际情况选择适合的类别。详细分类标准见附件

    3

    评选如何进行

    将邀请全球文化遗产数字化领域的权威专家对申报材料进行多轮评审,最终确定入选案例。

    4

    申报要注意哪些事项

    1.申报案例符合时间要求

    申报案例开始实施或部署的时间应在2023年之后。

    2.申报信息准确、清晰

    申报方须保证申报内容真实、准确,避免虚构。案例实施过程中,如有其他参与机构,须如实完整填写。

    3.内容契合申报类别

    申报单位可选择一个领域或多个领域下的分类进行申报,每个领域选择一个具体案例。案例须与所选申报类型相契合。

    4.上传文件及时,大小适中

    • 正式评审前,案例申报方须按形式审核要求及时完善申报材料。

    • 建议上传文件大小适中的材料,以便评委下载查看。

    5.材料可公开

    确认所有申报材料中的数据、内容可公开。

    05

    征集咨询

    联系人

    陈先生 86-13187127549

    常女士86-18811567609

    张女士 86-15210397801

    邮  箱

    media@wicinternet.org

    digitalCH2025@163.com

    附件:《世界互联网大会文化遗产数字化案例集(2026)》征集分类

    点击文末“阅读原文”

    进入世界互联网大会官网

    来源 | 世界互联网大会公众号

    阅读原文

    跳转微信打开

    •  

    课程介绍丨AI驱动的数字人文统计研究全流程重构

    2026-04-01 17:30 北京

    零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

    零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

    本讲我们继续模块三的学习,从统计的视角切入。

    针对人文学者在量化转型中普遍面临的“门槛高、应用难”等困境,本课尝试提炼一套“数据筑基、逻辑领航、AI协同”的研究路径。应当明确,统计学并非点石成金的魔法,若原始数据本身存在严重的“幸存者偏差”,任何精妙的方法都只能是徒劳的修饰。

    在筑牢数据严谨性这一底线的前提下,讲座旨在通过RTCO提示词框架实现人文逻辑与AI执行力的深度对接,使大模型从“不可知的黑箱”转化为透明、专业的“虚拟统计专家”。

    这套流程的本质,是将学者从繁琐、低效的代码纠缠中释放,把宝贵的精力重新投入到“变量洞察”与“深度学理阐释”的科研本位之中,真正实现在AI时代下人文研究效率与解释深度的同步飞跃。

    主讲人:沈威

    华中师范大学语言与语言教育研究中心副教授,博士,硕士生导师。研究方向为中文信息处理、现代汉语语法。主持、参与各级各类项目15项,出版独著1部,合著2部,参编教材1部。发表论文40余篇。主持并研发了“当代小说语料库”“汉语复句语料库”“汉语中介语动态语料库”和“我国中小学生写作能力评价与教学策略研究数据库”等语料库。

    *了解培训详情及报名请扫描本文海报二维码。

    ←了解我们正在进行的项目

    籍合学院

    中华书局旗下

    古籍整理与传统文化学习平台

    阅读原文

    跳转微信打开

    •  

    《数字人文》2026年第1期——“数字人文与出土文献研究”专刊出新

    数字人文 2026-04-01 17:30 北京

    以下文章来源于:DH数字人文

    DH数字人文

    清华大学、中华书局联合主办《数字人文》(Journal of Digital Humanities)季刊,旨在为方兴未艾的数字人文研究提供理论探讨和专题研究的平台。

    《数字人文》上新了!

    《数字人文》2026年第1期是“出土文献与数字人文专刊”,系国内学界首次以学术专刊形式对出土文献等冷门“绝学”内数字人文成果的集中展示。本期共刊发12篇文章,从内容上看,包括理论探索、平台建设、个案研究和出版实践等多方面,关注甲骨和简帛的缀合、古文字识别与析形,探索天文地理,介绍数据库平台及数字化出版方式。从涉及的材料类型和时代上看,涵括甲骨文、金文、战国秦汉简帛、石刻等,跨越商周到蒙元数千年历史。这些文章,反映近几年来相关领域数字人文的成果,并加以综述,希望能对关心出土文献研究的学者提供新的视角,为数字人文拓展新的领域。本期专刊从选题确定到编校完成,历时超两年,编辑部对作者们的大力支持表示诚挚感谢,也衷心邀请更多出土文献领域采用数字人文手段进行研究的学者不吝赐稿!我们愿意为最新的实践创造发表平台,让更多新颖的、有意义的学术探索尽快公之于众。

    目    录

     理论与平台

    数字人文与当代中国出土文献研究的现代性特征

    许  可

    人工智能古文字析解模型的初步训练

    聂 菲 宋奥齐

    数智时代的出土文献研究:“古汉语小站”建站经验与反思

    薛腾阔 

    动态视图在文字编管理系统中的应用研究 

    数字人文与甲骨学研究

    人工智能引导人类直觉产生的甲骨新缀第41-50 组

    李霜洁 蒋玉斌

    数智化整理助推甲骨文校重工作新发展

    莫伯峰 巩诗晨 武智融

    面向识别研究的甲骨文数据集标准的探索

    陈婷珠

    数字人文与简帛学研究

    楚简古书类文献通假研究的数据库方法

    ——以“清华简”(壹—玖)为中心

     孙 欣 刘志基

    语料信息处理视角下的里耶秦简缀合研究

    冯慧敏 郭帅帅

    秦汉简帛文献数据库的建设及文字学应用

    张再兴 林 岚

    实践与出版

    上博简五《竞建内之》“星子曰为齐”考

    ——基于天象模拟技术的探析

    李 凡

    蒙元时期石刻族谱文献的数字化分析

    ——以地域分布与时代特征为中心

    王 琪 

    动态视图在文字编管理系统中的应用研究 

    古文字工具书的数字化转型思考与实践

    ——以 《古文字构形类纂·金文卷》为例

    姜 慧 闵怡然 

    动态视图在文字编管理系统中的应用研究 

    征稿启事

    CONTENTS

    Theory and Platform

    Digital Humanities and Modern Characteristics of Contemporary Research on Unearthed Documents in China

    Xu Ke 

    Preliminary Training of an AI Model for Ancient Script Analysis

    Nie Fei, Song Aoqi

    Research on Unearthed Texts in the Digital-Intelligence Era: The “Classical Chinese Hub” Website—Development Experience and Reflections

    Xue Tengkuo

    Digital Humanities and Oracle Bone Studies

    AI-Guided Human Intuition Discovers New Oracle Bone Fragment Rejoinings: Series 41–50

    Li Shuangjie, Jiang Yubin

    New Developments in Repetition Proofi ng for Oracle Bone Inscriptions Driven by Digitalization Collations

    Mo Bofeng,Gong Shichen, Wu Zhirong

    Exploration of Oracle Bone Inscription Data Set Standards for Recognition Research

    Chen Tingzhu

    Digital Humanities and Bamboo Slips and Silk Studies

    The Database Method for the Study of Ancient Literature in the Chu Bamboo Slips: Centered around the Tsinghua Bamboo Slips (1-9)

    Sun Xin, Liu Zhiji

    Research on Liye Qin Bamboo Slips Conjugation from the Perspective of Digital Humanities 

    Feng Huimin, Guoshuaishuai

    The Construction and Application of the Qin-Han Bamboo Slips and Silk Database

    Zhang Zaixing, Lin Lan

    Practice and Publication

    Research on the “ 星子曰为齐” in the “Jing Jian Nei Zhi” of “Bamboo Slips V in the Shanghai Museum”:Analysis Based on Celestial Event Simulation Technology

    Li Fan

    Digital Analysis of Stone Carving Genealogical Documents during the Mongolian Era and the Yuan Dynasty: Focusing on Geographical Distribution and Times Characteristics

    Wang Qi

    Reflection and Practice of the Digital Transformation of Ancient Chinese Character Reference Books:Taking the Compilation of Ancient Character Confi guration Categories Formations —the Volume of Bonze Inscriptions as an Example

    Jiang Hui, Min Yiran

    Call for Papers

    数字使人文更新

    投稿:https://szrw.cbpt.cnki.net

    数字人文门户网站:www.dhcn.cn

    阅读原文

    跳转微信打开

    •  

    讲座预告|张林:人工智能与语文教育的发展

    请关注 2026-04-01 06:26 浙江

    主讲人:张林 上海交通大学附属中学高级教师

    讲座时间:2026年4月10日 13:00-15:00

    讲座地点:上海师范大学徐汇校区东部第三教学楼314室

    温馨提醒:讲座座位有限,请点击“阅读原文”登记。本系系友优先。

    (来源:学思中文)

    阅读原文

    跳转微信打开

    •  

    New | 澳门大学语言学学科QS排名首度跻身全球百强

    镜海语言学 2026-04-01 09:00 江苏

    以下文章来源于:镜海语言学

    镜海语言学

    澳门大学语言学研究中心官方公众号

    澳大语言学 QS2026 排全球 98,凭多元发展登百强并扩招生。

    转载自“镜海语言学”

    澳门大学语言学学科QS国际排名

    首度跻身全球百强!

    近日,国际高等教育权威机构Quacquarelli Symonds(简称“QS”)正式发布了2026年世界大学及学科的国际排名。澳门大学语言学学科表现卓越,以全球第98位的靓丽成绩首次跻身世界百强!这一历史性突破,标志着澳门大学语言学的国际影响力和学术竞争力迈上了一个全新的台阶。

    回顾过去六年的排名历程,澳门大学语言学科走出了一条扎实的上升曲线。2021年起基本上以一年上一个台阶的速度进步,从当年的251-300区位,一路上升到2026年第98位,成功跻身全球百强。每一步提升都凝聚着澳大语言学学科全体师生的智慧与汗水,凝结着领导的关心和学界的支持。

    在本年度QS语言学学科全球百强榜单中,中国两岸四地共有12所高校入围。年轻的澳门大学竟与北京大学、香港大学和台湾大学等一众语言学传统重镇同列,我们深感荣幸,心怀感激!

    澳门大学语言学学科近些年来始终秉持“精钻研、跨学科、国际化”的发展理念,在学术研究、平台建设与国际合作领域持续深耕,取得了一系列重要进展。

    组建研究中心,协同创新发展

    2022年3月,澳门大学语言学研究中心在澳门大学人文学院揭牌成立。澳门特别行政区长期通行多种语言,文化景观多元并存,堪称“多元文化的鲜活博物馆”和“多种语言的天然实验室”;澳门大学人文学院针对不同语种,同时设有中文系、英文系、葡文系、日文系。这为中心整合学术资源,组织跨语种课题合作打下了坚实的基础。中心自成立以来,致力于推动各学系、各语种研究团队之间的协同发展,聚焦跨语言比较、深耕理论探索,持续产出大量高水平有影响的学术成果,同时进一步壮大了澳门大学语言学研究集群的力量。

    欢迎访问澳门大学语言学研究中心官网:https://linguistics.fah.um.edu.mo/home/

    深耕特色期刊,推动学术对话

    《澳门语言学刊》2022年起由澳门大学人文学院接手主办。作为港澳地区最具权威性的语言学专业期刊之一,学刊始终坚持严格的匿名审稿制度,聚焦中国境内语言及跨语言研究,近年来又特别增设“境外语言学著作文摘”等特色栏目,促进境内外学术成果交流。我们还连续多年主办了“70后语言学优秀学者”的国际评选活动,其目的是尽可能减轻项目经费和刊物档次等时下所谓的指标对学术研究的过度干扰和扭曲,引导年轻学人聚焦体系性和原创性的学术贡献,受到了学界的广泛好评。2025年起,刊物携手香港三联书店升级出版流程,进一步扩大了国际传播力和学术影响力。

    共筑学术高地,深化国际合作

    澳门大学自2023年开始跟北京语言大学共同主办《中国语言学报》(Journal of Chinese Linguistics,JCL)。是年8月,“《中国语言学报》创刊50周年学术研讨会”在澳大成功举办,澳门编辑部同时启用。澳大参与主办后,积极推动刊物扩容。本刊原为半年刊,2024年起扩容为一年3期,2027年起又将进一步扩容为一年4期。作为入选SSCI和A&HCI双索引系统的语言学领域重要期刊,JCL汇聚海内外顶尖学者,探讨一系列前沿议题。澳门编辑部的成立,不仅强化了刊物的全球协作网络,也为澳大语言学学科进一步融入国际学术共同体注入了新动能。

    拓新跨学科研究,筑牢神经语言学

    与语言加工研究根基

    澳大人文学院语言学学科积极开展跨学科研究的深度探索与实践,其中以神经语言学和多语言加工为核心的跨学科研究成果尤为突出。该领域的研究工作由翻译传译认知研究中心牵头,深度联动澳门大学认知与脑科学研究中心,并与科技学院、社会科学学院心理学系等机构开展跨院系合作,同时整合校内外多领域学术资源形成研究合力,成为推动学科创新发展的重要引擎。研究团队聚焦澳门多语言社会的独特优势,围绕中、葡、英三语展开跨语言、跨模态迁移的神经认知机制研究,综合运用眼动追踪、脑电图(EEG)、功能磁共振成像(fMRI)等前沿实验技术,系统探究三语者的语言加工、跨语言切换及执行功能的神经基础,为双语/多语优势假说提供关键的神经认知证据。在研究过程中,团队攻克了 MRI 扫描中多模态刺激呈现、头部运动控制、声音采集与降噪等多项技术难题,构建了澳门大学脑图谱(University of Macau Brain Atlas)—— 这一基于表面的功能性脑图谱数据库,整合了多语言、多模态、多人群的脑功能映射数据,即将面向全球科学界发布并开放使用,成为国际语言学与神经认知科学领域的重要公共研究资源,也让澳大在多语言脑认知研究领域形成了鲜明的国际特色与学术优势。

    助力学科创新,搭建全球平台

    2024年3月17日,由澳门大学语言学研究团队牵头,国际语法研究学会(International Association of Grammar Studies,IAGS)在中国澳门成立。学会筹备成立期间便得到了海内外知名学者的广泛响应和大力支持。2024年12月1-4日,澳门大学成功举办了学会的首届学术研讨会。中山大学2025年11月20-23日成功承办了第二届学术研讨会。两次研讨会都吸引了百余位语法学者踊跃参加。大家围绕形式语法、构式语法、方言研究、语言类型学、汉外对比、人工智能与语法研究等多个前沿议题展开热烈讨论。第三届学术研讨会即将于2026年11月20-22日在郑州大学召开。欢迎各位同仁共襄盛举,踊跃投稿!

    有兴趣参加者请提供A4纸尺寸一页以内的中文或英文论文摘要。会议投稿截止日期是2026年8月14日,投稿邮箱为:iags_2026@163.com。

    国际语法研究学会在内容上倡导“跨学科、跨学派、跨语种、跨国界、跨古今”的“五跨”新理念,在会议形式上倡导“平等、和谐、自在、简约、高效”的“五项”的新风尚。我们在国内外语言学领域的学术社团总数已经很多的情况下,之所以要成立一个新学会,绝不是为了赶热闹,凑数字,而是为了突破当今语法研究领域基于语种和学派的条块分割现状。我们就是要在语法研究领域打通古今与中外,对接事实与理论,引导跨界交流,激活大脑风暴,推动理论创新。我们尊重观点不同,享受学术差异!

    虚心地学习他人,自信地展示自我

    本着“平等、亲切、务实”的圆桌精神,由本校博士生主导的学术俱乐部“镜海语言学社”自2021年起每年举办一届“镜海语言学圆桌研讨会”,邀请澳门地区其他兄弟院校师生及在澳访问的学者跟澳大师生一起探讨共同感兴趣的学术问题,发表研究报告,交流研究心得。宾主一致认为我们的圆桌研讨会“极度宽松、极度务实、极度自在”。我们倡导师生互动、主客互动、内外互动。会议形式虽然简单,但是效果显著,意义重大。作为承办单位,我们自己的老师,我们的同学,不仅搭台,更要唱戏,人人都是此一学术活动平等的推动者和参与者。

    创新学术传播,连接学界社群

    由澳门大学语言学团队运营的微信公众号“镜海语言学”自创立以来,充分平衡专业深度与大众传播,一方面建立了“成果速递”“论文推介”等栏目,持续推送来自《澳门语言学刊》《中国语言学报》和澳门大学语言学团队的最新研究成果,另一方面特别设置了“镜海心得”专栏,积极接收来自学界同仁的踊跃投稿,将晦涩的学术问题转化为鲜活易懂的随笔,不间断地分享诸位同仁从日常研究工作中总结得来的宝贵经验。得益于学界同行的关注和支持,短短3年间,账号关注人数已由不足千人快速增长近万人,用户覆盖海内外众多高校的师生。公众号以新鲜活泼的内容和别具一格的形式赢得了学界朋友的广泛赞誉,成为澳大连接海内外语言学人的“云端俱乐部”和澳大语言学团队在学界发声的“天空麦克风”。欢迎更多同道扫码关注!

    我们深知,自己的工作虽然取得了些许进步,但是仍有很多缺点和不足,有很多地方需要向兄弟院校学习。正因为如此,我们才更有必要以此为新的起点,不骄不躁,再接再厉,继续开拓创新,再攀高峰!站在全球百强的新起点上,澳门大学语言学学科将继续依托澳门“一国两制”的独特优势,以更开放的姿态、更扎实的工作,与全球语言学同仁携手,为语言科学的创新发展贡献更多“澳大智慧”。

    此外,澳大语言学科为配合学校的发展战略,近年来大幅度地扩大硕士生和博士生的招生名额。我们热忱海内外有志学子积极报读!

    让我们共同期待,澳门大学语言学学科在国际学术舞台上书写更加辉煌的篇章!

    比特人文

    投稿邮箱:dhbase@126.com

    扫码关注 获取更多资讯

    图片

    阅读原文

    跳转微信打开

    •