阅读视图

数字人文门户网站：www.dhcn.cn

会议通知 | “大哉言数：AI时代人文研究的范式重构与价值回归”研讨会暨2026年中国数字人文年会（CDH2026）

2026年3月25日 10:02

2026-03-25 10:02 北京

2026年7月31日-8月3日，内蒙古师范大学，“大哉言数：AI时代人文研究的范式重构与价值回归”研讨会暨2026年中国数字人文年会（CDH2026）

——CDH2026——

“大哉言数：AI时代人文研究的范式重构与价值回归”研讨会暨2026年中国数字人文年会（CDH2026）

会议通知(第一号)

2026年7月31日-8月3日

内蒙古师范大学

2026期待与您相聚

当前，人工智能与大数据技术正深刻重塑人文学科的知识生产方式与价值判断框架。“数”之一字，贯通古今：从古人“参天量地”的度量智慧，到今日数据驱动的数字人文，数字化浪潮不仅为人文学科开辟了全新的研究范式，更在“言数”之间激发了对文明演进、文化传承与社会治理的深层追问。

在此背景下，中国索引学会数字人文专业委员会、内蒙古师范大学科学技术史研究院将以“大哉言数：AI时代人文研究的范式重构与价值回归”为主题共同主办2026年中国数字人文年会（CDH2026）。会议将邀请知名专家学者，围绕数字人文及相关领域的前沿问题，开展主旨发言、会议报告、专题讨论、案例分享、数字人文空间展演、海报展示等多种形式的学术交流活动。现诚挚邀请数字人文领域专家、学者与学生莅临会议，共探AI时代人文研究的范式重构与价值回归，为数字人文发展注入新动能。

会议议题

包括但不限于：

1. 典籍重光

科技古籍与多民族文献的智慧化整理

2. 时空重构

GIS与时空大数据驱动的文明演进研究

3. 协智重塑

多智能体与具身智能的人文社会仿真

4. 谱系重绘

知识图谱与智能注释驱动的知识重组

5. 记忆重述

AIGC赋能下的文化遗产与艺术创新

6. 文脉重析

计量方法与主题模型的文本深度挖掘

7. 伦理重思

数字人文中的算法批判与负责任创新

8. 素养重育

数字人文课程体系与跨学科人才培养

9. 数字人文学科建设

会议信息

会议时间

2026年7月31日至8月3日

会议地点

内蒙古师范大学

（呼和浩特市赛罕区昭乌达路81号）

会议注册

本次会议将于2026年6月开放注册报名。

注册费：1500元（6月30日之前早鸟价1000元），学生价800元，获会议录用宣讲论文/海报/项目作者一人可免注册费，如多于一人则需按增加人数缴纳注册费。参会代表交通食宿自理。

征文征集

1、会议征文对象为数字人文相关专业的专家、学者与在读学生。

2、论文要求为：作品原创，未发表；中文、英文皆可；问题明确、方法严谨、论证充分、引用规范、观点新颖。

3、征文分为两轮，第一轮为论文摘要征集，第二轮为入选论文全文提交，具体要求如下：

（1）论文摘要需包含中英文标题、摘要、关键词、作者姓名、作者单位、作者简介（姓名、单位、年级、邮箱、手机号码、研究方向等），摘要内容不少于500字。

（2）论文全文格式可参考附件“CDH2026论文格式规范与要求”，正文字数为7000-15000字。

4、组委会将邀请国内知名学者组成专家评审组，对提交的论文开展严格评审，从中选出高水平学术论文在会议上进行交流和专家点评。

5、论文提交邮箱：

20250051@imnu.edu.cn。邮件标题格式为“CDH2026论文摘要/全文-姓名-单位”。

6、摘要提交截止时间：

2026年4月30日

摘要录用通知时间：

2026年5月30日

论文全文提交截止时间：

2026年6月30日

项目征集

1、本次会议征集项目为中文或中国主题的数字人文研究项目，包括但不限于数据库、软件工具、数字平台、可视化作品、XR交互设计作品、大模型及智能体应用等。所征集的项目需提供可访问的路径和方式。专家委员会将根据项目征集情况分类评审后择优进行大会展示交流。

2、所有征集项目需填写“2026年中国数字人文年会项目报名表”进行报名，并提供相关附件（包括但不限于网站、APP、小程序、视频及图片等）。

3、请将报名表和相关附件压缩，以“CDH2026项目-项目名称”命名，发送至邮箱20250051@imnu.edu.cn。

项目征集截止时间：

2026年5月20日

会议组织

主办单位

中国索引学会

内蒙古师范大学

承办单位

中国索引学会数字人文专业委员会

内蒙古师范大学科学技术史研究院

内蒙古自治区科技文化遗产认知智能重点实验室

内蒙古师范大学蒙古学学院

协办单位（按笔画顺序排列）

山西数字人文研究院

上海大学数字人文研究与发展中心

上海外国语大学中国国际舆情研究中心

上海师范大学数字人文研究中心

上海社会科学院信息研究所

上海图书馆历史人文大数据中心

中国人民大学数字人文研究院

中国社会科学院文学研究所数字信息研究室、数字人文与计算批评实验室

中山大学信息管理学院

中山大学数字人文实验室

北京大学数字人文研究中心

电子科技大学数字文化与传媒研究中心

华东师范大学数字文化发展协同创新中心

齐鲁工业大学 (山东省科学院) 数字人文研究中心

云南大学历史与档案学院 “数字人文” 工作室

云南省图书馆数字资源与信息技术部

武汉大学数字人文研究中心、武汉大学文化遗产智能计算实验室

复旦大学大数据研究院人文社科数据研究所

清华大学中国古典文献研究中心

南京大学高研院数字人文创研中心

南京师范大学数字与人文研究中心

南京农业大学数字人文研究中心

南京大学中华文明创新实验室（持续更新中）

媒体支持（按笔画顺序排列）

「DH数字人文」公众号

《全国报刊索引》

「全国报刊索引」公众号

上海师范大学数字人文网

上海社科院信息所社科智能实验室（AI4SS Lab）

《中国数字人文》

「中国索引学会」公众号

「SHNU 数字人文」公众号

「比特人文」公众号

《数字人文》

《数字人文研究》

「数字人文」公众号

「数字人文开放实验室」公众号

「数字人文研究」公众号

「数字人文资讯」公众号

南京大学中华文明数智创新实验室

（持续更新中）

有意参与协办和媒体支持的单位，请扫描下方二维码登记相关信息，我们将在下一轮的会议通知中更新名单。

会议联络

会议邮箱：20250051@imnu.edu.cn

会务咨询：周老师 13191432051

附件

CDH2026论文格式规范与要求

2026年中国数字人文年会项目报名表

基于改进YOLOv8的刺绣动态检测与分类研究.pdf

基于改进YOLOv8的刺绣动态检测与分类研究

2026年3月20日 10:03

原创鲍亚林吉国秀 2026-03-20 10:03 北京

针对现在检测和分类算法存在分类种类少、准确率低、无法满足实时检测需求等问题，本文将实时分类技术应用于传统刺绣行业，为刺绣文化研究和保护提供宝贵的算法支持。文章对现有YOLOv8算法进行改进。

多模态学习

鲍亚林 / 辽宁大学文学院

吉国秀 / 辽宁大学文学院

摘要：针对现在检测和分类算法存在分类种类少、准确率低、无法满足实时检测需求等问题，本文将实时分类技术应用于传统刺绣行业，为刺绣文化研究和保护提供宝贵的算法支持。文章对现有YOLOv8算法进行改进。首先，基于DCGAN网络均衡刺绣图像数据集，解决小样本刺绣图像类别不均衡问题。其次，将YOLOv8的主干网络替换为InceptionNeXt模块，实现在不同尺度上提取特征，增强特征提取能力；增加GAM模型作为过渡模块，在特征融合前对信息进行筛选，提升网络的特征融合能力。最后，使用改进后的网络模型对测试集进行实验，并使用图片、视频和摄像头进行离线和在线验证。实验证明，改进后的模型对10种刺绣类别的分类性能表现出色，整体平均准确率达到0.9043，平均精度达到0.9151。与其他分类检测算法相比，改进后的YOLOv8模型具有明显的优势，达到了较高的泛化能力和鲁棒性，能够满足实际应用中的实时性需求。

关键词：动态检测刺绣分类 YOLOv8 实时分类数字人文

作为中国传统历史文化的工艺象征之一，刺绣蕴含着丰富的文化意蕴与美学价值。在技术转型的背景下，刺绣传承的方式悄然发生改变。刺绣由以往博物馆式静态传承走向面向大众的活态传承。刺绣活态传承由囿于以往“口传心授”的谱系性方式，转向突破自身专业性和排他性的多方互动。立足于数智时代，技术是缩减主体间隔与形成文化交流的关键枢纽。借助于数智技术的传输路径，刺绣内部的专业知识扩散并渗透到民众的日常生活世界，人们在感受传统刺绣带来的意象气韵时，也在享受当代技术建构的创新实践。因此，数智技术成为刺绣回归日常生活的重要介质。

当下，非遗数据库是整合、完善非遗传承人及其代表性项目的重要系统化存储手段。非遗数据库建构的首要基础是数据的完备性。从广义上来看，数据完备性至少包括体量的充盈及分类的合理化两大方面。对于我国刺绣类非遗来说，其数据集种类多样，具备数据量庞杂的特点。但传统的刺绣分类识别主要依靠专业人员，耗时大、成本高、能力差异等因素都限制资源的合理化利用。因此，刺绣分类智能化是打破传统人工藩篱的基本思路。例如，董馥伊^[1]首次引入计算机技术局部矢量化的方法，实现了传统栽绒毯纹样特征的智能检索分类。

近年来，深度学习技术被广泛地应用到刺绣分类识别领域中。刘净净、郭飞等^[2]改进BP神经网络，使得模型的正确识别率高达78%，开辟了刺绣深度学习分类的先河。目前基于深度学习的刺绣研究现状如表1所示，刺绣的深度学习分类方法虽然能实现刺绣的智能检测，构建较为完善的非遗分类结构体系，但是这些方法以静态识别为主，程序烦琐、局限性大、灵活性低，尚未真正实现刺绣实时检测的功能。因此，本文旨在借助目标检测领域先进、高效、准确的YOLOv8模型^[3]，为刺绣动态实时视频分类提供有力支持。

def 图1.png

表1 基于深度学习的刺绣研究现状[4][5][6][7][8][9][10]

针对现在检测和分类算法存在的问题，本文将计算机视觉和人工智能技术与数字人文领域结合，对现有YOLOv8算法进行改进。基于DCGAN网络均衡刺绣图像数据集，解决小样本刺绣图像类别不均衡问题；改进YOLOv8的主干网络，引入InceptionNeXt模块，实现在多个尺度上高效提取特征，从而提升特征提取能力；增加GAM模型作为过渡模块，在特征融合前对信息进行筛选，提升网络的特征融合能力。最后使用改进后的网络模型对测试集进行实验，将实验结果进行可视化分析，与现有的技术进行比较，并验证所提出的方法的有效性。同时，使用图片、视频和摄像头进行离线、在线验证。通过这一研究，为刺绣文化的传承与创新提供一种全新的技术手段，将传统手工艺与现代科技有机融合，为刺绣艺术的发展注入新的活力。本文的研究成果不仅对于刺绣文化的传承和推广具有重要意义，还将为多端部署技术在文化艺术领域的应用提供有益的参考和借鉴，其基于YOLOv8的刺绣动态检测与分类流程图如图1所示。

一、整理和优化刺绣数据集

本文的分类对象为中国传统十大名绣：汴绣、汉绣、杭绣、京绣、鲁绣、瓯绣、蜀绣、苏绣、湘绣和粤绣。每种刺绣因其历史背景和地域文化的差异，形成了独特的针法与风格，例如汴绣的“蒙针绣”、苏绣的“双面绣”、京绣的“打籽针”、蜀绣的“锦纹针”、鲁绣的“抽丝编花”、瓯绣的“八字针”、杭绣的“贴续绣”、粤绣的“乱底针”、汉绣的“齐针”和湘绣的“掺针”，都是各自绣种的工艺代表。为了构建全面的刺绣样本库，本研究的刺绣作品来源广泛，包括小红书、抖音、微博、京东等线上网络渠道和博物馆、文化馆等线下文化机构公开的数字图像资源（共计1,263件），以及刺绣大师与传承人提供的作品图像（共计152件）。此外，还补充和吸收相关刺绣艺术书籍和刊物中的高质量图片（共计315件）。所有采集的图像均经过非遗领域专家的严格质量把控与品种鉴定，以确保样本的艺术代表性和数据完整性。

图2.png 图1 基于YOLOv8的刺绣动态检测与分类流程图

数据预处理技术是指在将数据输入模型之前，对数据进行一系列处理操作，以提高模型的性能和泛化能力。常见的数据预处理技术包括数据均衡、数据增强、数据标准化、归一化和数据降维等，在医学影像分析、农业检测、遥感影像等领域，已广泛应用于各类计算机视觉任务中。针对数据集样本不均衡问题，郭忠远等^[11]利用DCGAN模型均衡和扩充红枣外观缺陷数据集，使得模型准确率上升2.18%—3.26%；袁卫民等^[12]利用DCGAN模型，生成虚拟样本，使得准确率优于其他算法，解决了轴承故障数据不均衡的问题。同时，针对数据集样本容量较小问题，郑慧怡等^[13]利用添加椒盐噪声和随机旋转技术，实现了数据样本容量的扩充。陈金荣等^[14]利用翻转、亮度转换和旋转等技术扩充了数据集的总量，从而提高模型的准确率，极大地降低了漏检率。

针对当前刺绣数据集种类不均衡和样本较少等问题，本文在已有前沿方法的基础上，采用对抗生成网络技术和数据增强技术，整理和优化刺绣数据集，有效增加少样本类别的数据量，增强模型对不同类别特征的捕捉能力，从而提高分类的准确性。相比于现有前沿数据预处理方法，本文针对不同刺绣针法和图案的特点，进行优化适配，确保增强后的图像仍然保留了刺绣特有的细节和艺术性。

（一）类别均衡

由于地域和文化背景的差异，一些刺绣因其历史悠久或地理位置偏远，获取相关图像的难度较大，导致此类别的数据样本较少；而另一些刺绣因文化传播广泛、应用场景多样，相关图像较多。因此，在实际收集这些刺绣图像时，往往会面临类别不均衡的问题。在不均衡的数据集中，模型容易偏向于多样本类别，忽视少样本类别，从而导致分类结果偏向常见类别，严重影响分类的准确性和可靠性。

为了实现不同类别刺绣样本的均衡，可以考虑收集更多的小样本刺绣图像，或者减少大样本的刺绣集图像数量。但由于刺绣类别的不均衡性，获取较多的小样本刺绣图像存在较大难度。利用生成对抗网络（Generative Adversarial Networks，GAN）生成图片，可以有效解决上述问题。^[15]传统GAN尽管在生成逼真图像方面表现出色，但在训练稳定性和生成图像质量上存在诸多挑战，导致模型在训练过程中容易出现梯度消失、模型崩塌和生成的样本类别不可控等现象。^[16]

深度卷积生成对抗网络（Deep Convolutional Generative Adversarial Networks，DCGAN）通过引入卷积层、批量归一化、去掉池化层、使用Leaky ReLU激活函数以及改进架构设计，显著提升了传统GAN的性能。^[17]通过改进，DCGAN在生成图像质量、训练稳定性和模型鲁棒性方面表现出色，因此，本研究使用DCGAN来生成小样本刺绣图像，以缓解类别不均衡问题。为了确保传统刺绣样本和非遗数据库数据的真实性和完整性，基于DCGAN生成的刺绣图像仅作为模型训练中的辅助数据，旨在提升分类性能，而非用于非物质文化遗产数据库的核心数据保存。同时，为了保证DCGAN生成的刺绣图像在艺术性和工艺上的代表性，生成过程严格依据各类刺绣的针法和纹理特征进行，且由非遗领域专家进行审查和筛选，以确保生成图像在风格和工艺上与传统刺绣相符，从而避免偏离原有的工艺特色和文化价值。

DCGAN的结构如图2所示。从中可以看出，DCGAN由生成器和判别器组成。生成器的任务是从随机噪声中生成逼真的图像，判别器的任务是区分真实图像和生成器生成的假图像。通过生成器和判别器的反复对抗训练，不断迭代优化，两者共同提升，生成高质量的图像。

利用DCGAN生成特定类别的刺绣图像，有助于平衡数据类别，有效扩充数据集，使各类别的数据量趋于一致，从而提升模型在各类别上的分类性能。生成的刺绣图像变化情况如图3所示。

（二）数据增强

利用深度学习进行刺绣检测与分类时需要大量的刺绣图片作为训练样本，如果没有足够的训练样本支撑，当网络深度较深时就极易出现过拟合的情况。在深度学习中，数据增强是提升模型性能的一种常用手段，可以在不降低网络深度的同时又能够有效地拟合数据，提高模型的鲁棒性和泛化能力。亚历克斯·克里泽夫斯基（Alex Krizhevsky）等人[18]通过对CIFAR-10数据集的图像进行随机裁剪和水平翻转，显著提高了分类准确率。西哈姆·塔比克（Siham Tabik）等人^[19]则在手写数字识别任务MNIST数据集中使用了扭曲和缩放等变换手段，成功提升了模型的表现性能。

在刺绣图像分类领域，目前的研究主要集中在特征提取和模型设计方面，对于数据增强的研究较为有限。刺绣作为一种兼具生命情感与审美意象的手工艺，其图案庞杂丰富，但由于刺绣图像收集和标注的困难，训练样本通常较为有限。为有效缓解这一问题，支撑更深的神经网络训练，本研究采用常见的数据增强方法，包括旋转、水平翻转、垂直翻转、随机裁剪、随机改变亮度和添加高斯噪声。^[20]在数据预处理阶段，对原始刺绣图像应用上述增强方法，提高模型分类性能、防止网络过拟合，并生成新的训练样本，部分刺绣数据增强示例如图4所示。

图3.png 图2 DCGAN结构

图4.png 图3 刺绣图像生成过程示例

图5.png 图4 部分刺绣数据增强示例

原始数据集分别按照0.7、0.2和0.1的比例随机分为训练集、验证集和测试集。原始刺绣数据集、刺绣增强数据集和经过DCGAN均衡后的刺绣图像图幅数如表2所示。

图6.png 表2 均衡和生成数据集划分情况

二、YOLOv8原理及改进

（一）网络结构设计

在目标检测算法中根据检测过程的不同，可以分为双阶段算法和单阶段算法。双阶段算法先提取图像候选区域再进行类别的判定，其漏识别率较低，但速度较慢，典型网络有RCNN和Faster-RCNN。^[21]单阶段算法则不需要产生候选区域阶段，一步到位直接产生物体的类别概率和位置坐标值，经过单次检测即可直接得到，因此有着更快的检测速度，最典型的是YOLO系列算法。^[22]考虑到刺绣在线检测的实时性，因此采用YOLO算法来分类刺绣图像。

YOLOv8是由Ultralytics公司于2023年1月发布的一种目标检测算法，^[23]本研究基于YOLOv8算法，旨在对十种刺绣图像进行分类。针对当前YOLOv8算法存在的分类准确率不足等问题，我们对其进行了改进，以提高刺绣分类的准确度。为增强多尺度信息提取能力，我们将YOLOv8的主干网络替换为InceptionNeXt模块，从而提升特征提取的性能。通过引入并行卷积操作，模型能够捕捉到更多的图像细节和上下文信息，从而提高特征提取的效率和整体性能。在原始的YOLOv8中，主干网络提取特征后，直接将其输入到颈网络。尽管YOLOv8在特征融合方面已有一定设计，但对于关键信息的针对性提取和识别仍显不足。因此，我们引入全局注意机制（Global Attention Mechanism，GAM）模型作为过渡模块，在特征融合前对信息进行筛选，以增强关键信息的识别能力。

1.InceptionNeXt模块

InceptionNeXt模块在ConvNeXt和Inception架构的基础上进行了一系列改进，同时引入更优化的模块设计，适用于图像分类、目标检测等多种计算机视觉任务。^[24]用InceptionNeXt模块取代原有的C2F模块，可以实现在提高模型特征提取能力的同时，不额外增加网络参数数量。InceptionNeXt通过并行卷积操作（3×3，1×11，11×1）在不同尺度上提取特征，同时引入跳跃连接并添加了常量映射，这种分解不仅有效减少了参数量和计算量，还保留了大核深度卷积的优点，扩大了感知领域，提高了模型性能。InceptionNeXt模块的主要结构如图5所示。

图7.png 图5 InceptionNeXt模块结构图

2.GAM注意力机制模块

近年来，注意力机制已成为目标检测任务中的关键组成部分。^[25]注意力机制的灵感来源于人类视觉系统，能够筛选大量信息并找到重要数据。GAM注意力机制模块使用通道注意力机制和空间注意力机制，通过关注全局信息和局部信息的交互，增强特征表达能力，并广泛应用于图像分类、目标检测等计算机视觉任务，其结构如图6所示。GAM通过引入全局和局部的注意力机制，对全局上下文信息进行引导，调节局部特征的表达，提升网络对重要特征的捕捉能力，最终提高网络的识别和分类能力。^[26]对于给定的输入特征，图8.png ，中间状态特征F₂和输出特征F₃定义为：

图9.png （1）

其中，表示按元素进行乘法操作。

图10.png 图6 GAM注意力机制模块结构图

3.改进后的网络结构

改进后的网络结构如图7所示，使用刺绣增强均衡数据集，将输入的刺绣图像首先通过主干网络部分逐步提取特征。在主干网络部分中，刺绣图像特征通过5个卷积模块、4个InceptionNeXt模块和1个SPPF模块后，得到不同尺度的特征图。再由颈部网络将不同尺度的刺绣特征图进行融合，最后头部网络根据分类需求输出预测结果以及置信度。改进后的网络结构通过多尺度特征提取和全局特征交互与融合等操作，提高了目标检测与分类的性能和鲁棒性，并在复杂场景下取得更准确的分类结果。

图11.png 图7 改进后的YOLOv8网络结构

（二）超参数设置

本研究模型在CPU（Intel Core I7-12700K，20线程，3.6GHz）和GPU（NVIDIA RTX 3070，8GB，5888CUDA）上进行训练，使用Adam作为模型的优化算法。为加速网络收敛，避免网络陷入局部最优解，学习率自适应调节方法，其超参数具体设置如表3所示。

图12.png 表3 超参数设置

（三）评价指标

在图像分类问题中，通常使用二元交叉熵损失函数（Binary Cross Entropy，BCE）作为分类损失函数。^[27]在刺绣十分类问题中，BCE的梯度形式更优，训练时更加稳定，训练输出时对每一种类别k进行判断，并输出置信度，其公式如（2）所示：

图13.png （2）

其中，y_i为第i刺绣样本的真实类别，p_i为网络对刺绣样本i的预测类别。

为了能够有效评估改进后的YOLOv8模型对刺绣的检测和分类结果，本研究采用召回率（Recall）、准确率（Accuracy）、精度（Precision）、F1值（F1-Score）和AP作为评价指标。上述五种评价指标均为数值越大，代表模型的分类性能越优，公式如下所示：

图14.png （3）

图15.png （4）

图16.png （5）

图17.png （6）

其中，TP为真正例，表示模型正确地将类别k的刺绣样本预测为类别k；TN为真负例，表示模型正确地将不属于类别k的刺绣样本预测为不是类别k；FP为假正例，表示模型错误地将不属于类别k的刺绣样本预测为类别k；FN为假负例，表示模型错误地将属于类别k的刺绣样本预测为其他不是类别k的类别。

图18.png （7）

以召回率为横坐标，精度为纵坐标，便能绘制出精度召回率（Precision-Recall，P-R）曲线。P-R曲线与横纵轴围成的面积代表对应刺绣类别的AP。其中，围成的面积越大，AP值就越高，对应模型的检测效果就越好。

为了防止模型出现过拟合状态，采用早停法策略确定合适的训练周期。^[28]假设E_opt(t)是在第t个周期下的最优验证集损失值，GL(t)为泛化误差。当泛化误差GL(t)的增长率大于指定值时，则停止训练，如公式（8）所示：

图19.png （8）

三、实验结果可视化分析

（一）训练结果可视化

1.损失曲线

图8展示了改进后的YOLOv8模型在训练过程中随着迭代周期次数的增加，训练集和验证集损失值的变化趋势。从图8可以看出，由于前期学习率较大，导致模型在验证集上的损失曲线出现震荡，但总体呈下降趋势，表明模型在持续学习特征并不断地进行优化。在第25个周期后，预测损失的偏差逐渐减小。在第40个周期后，验证集的损失值逐渐趋于稳定，并在第45个周期左右基本达到收敛状态。选择在验证集上损失值最小时的权重，即第48个周期下的权重作为模型最终权重。

图20.png 图8 训练集与验证集损失曲线

2.分类结果评价指标

将测试集的刺绣图像输入到最终的分类模型中，检测改进后的YOLOv8模型的分类效果，其刺绣分类结果评价指标如表4所示。再对表4的内容进行可视化分析与展示，其结果如图9所示。

图21.png 表4 改进后的模型刺绣分类结果评价指标

图22.png 图9 刺绣分类结果评价指标柱状图

从图9中可以看出，刺绣分类模型在各个类别上表现出色，整体平均召回率为0.90434，平均准确率为0.90434，平均精度为0.91505，平均F1值为0.90751，平均AP达到0.96889。鲁绣、京绣和蜀绣表现尤为突出，鲁绣的各项指标几乎达到最佳。汉绣、瓯绣和湘绣在各项指标上表现均衡，特别是汉绣的精度和AP较高，显示出较强的分类能力。而杭绣虽然精度较高，但是其召回率较低，表示模型可能遗漏了部分真正例。从整体来看，改进后的分类模型在大多数刺绣类别上能保持高识别精度和召回率。

3.分类结果可视化分析

图10展示了改进后的分类模型在不同刺绣类别上的混淆矩阵，图11展示了不同刺绣类别的P-R曲线。从图10的混淆矩阵可以看出，改进后的分类模型在大多数刺绣类别上的分类表现较好，特别是鲁绣，其主对角线上的值较高，表明这一类别的样本大部分被正确分类。然而，对于汴绣和湘绣，存在较明显的分类错误，其他类别的样本被误分类为这些类别的频率较高，说明模型在这两个类别上的区分能力有待提升。

图11的P-R曲线进一步展示了模型在不同阈值下的精度和召回率之间的权衡关系。曲线上每个点表示在对应召回率下的最大精度值，当P=R时对应的阈值点即为均衡点（Best Event Point，BEP），BEP越大，则说明模型对此类别的分类性能越好，即P-R曲线越靠近右上角。对于综合混淆矩阵和P-R曲线的分析，证明改进后的分类模型整体性能较好，能够较准确地分类大部分刺绣类别。对于鲁绣，模型的分类效果几乎没有误分类。尽管杭绣的P-R曲线明显低于其他类别，表明模型在识别杭绣时的效果不佳，但其精度较高，使得在目标检测过程中有较好的性能。改进后的模型在对刺绣图像的识别和分类的表现稳定且优异，这表明模型在处理大部分刺绣类别时已经达到了较高的精度和可靠性，展示了很强的泛化能力和鲁棒性，能够满足实际应用中的需求。

图23.png 图10 混淆矩阵

图24.png 图11 P-R曲线

t-分布随机邻域嵌入（t-Distributed Stochastic Neighbor Embedding，t-SNE）^[29]是一种用于高维数据降维的非线性算法，特别适用于在二维或三维空间中可视化高维数据。由劳伦斯·范德马滕（Laurens van der Maaten）和杰弗里·辛顿（Geoffrey Hinton）于2008年提出，t-SNE通过将高维数据点嵌入到低维空间中，同时尽可能保持相似数据点的邻近关系，因而广泛用于数据可视化和探索性数据分析。t-SNE首先在高维空间中计算数据点之间的相似度。对于每对高维数据点i和j，t-SNE使用基于高斯分布的条件概率图25.png 表示数据点j在给定数据点i的情况下作为邻居的概率，如公式（9）所示：

图26.png （9）

其中，图27.png 是根据数据点i的局部密度自动调整的，k是所有数据点的索引（除去数据点i本身）。

在低维空间中，t-SNE使用类似的方法计算数据点基于学生氏t分布，y_i和y_j之间的相似度q_ij的关系如公式（10）所示：

图28.png （10）

其中，y_k和y_l表示降维后的数据点。t-SNE通过最小化高维空间和低维空间相似度分布之间的Kullback-Leibler散度^[30]，使得低维空间中的数据点配置尽可能反映高维空间中的邻近关系，实现高维数据的有效降维，从而成为数据科学和机器学习领域的常用工具之一。将YOLOv8模型的颈网络输出特征图作为输入，基于t-SNE算法进行高维数据降维，原始网络和改进后的网络的降维结果可视化如图12所示。

图29.png 图12 t-SNE降维可视化

对于t-SNE降维结果，在理想情况下，同一类别的刺绣样本会聚集在一起，不同类别的刺绣样本应该形成相对清晰的簇，簇与簇之间有明显的间隙。由图12可知，使用原始YOLOv8模型对刺绣进行分类，降维结果表明模型对不同类别的刺绣在二维空间中有一定程度的分离，例如，汴绣和鲁绣有较为明显的聚集区，表明这些类别的样本特征较为一致。但图中存在一些不同类别之间的重叠，特别是在图的中央区域，湘绣和京绣的样本较为紧密地聚集在一起，表明这些类别内部的样本特征相对一致，原始YOLOv8模型没能有效提取到这些刺绣的独特特征，表明模型在区分这些类别时存在一定困难。而对于粤绣，其簇分布较为分散，表明该类别的样本特征差异较大，分类效果不理想。

改进后的YOLOv8模型进一步优化了特征提取部分，使得同一类别的特征更加一致，不同类别刺绣的特征更加可分离、类别分布更加集中、边界更加清晰，各个团簇之间的间距也更加合理，这将有利于模型区分不同类别的刺绣。对于部分类别的刺绣，如湘绣和京绣，在降维图像不同区域形成了多个相对独立的小团簇，表明这些类别的刺绣存在多种独特特征，其特征分布存在一定的异质性。改进后的模型从可视化角度权衡分类性能表现，分类效果更加理想，有助于提高模型对于不同类别刺绣的识别准确性和稳定性。这种优化使得模型更能够捕捉到刺绣类别之间的微妙差异，有效地区分湘绣和京绣等部分类别的刺绣，并且能够在降维图像中形成相对独立的小团簇，进一步凸显了这些类别之间的特征差异和异质性，从而提高了模型的泛化能力和分类精度。

（二）消融实验结果及分析

表5为消融实验结果，采用准确率、精度和F1值作为评价指标，并对使用不同数据集训练的结果进行比较。从表5可以看出，采用原始刺绣数据集的YOLOv8的准确率仅为52.02%，说明在少量刺绣样本的数据集下，YOLOv8对刺绣图像的分类效果较差。B和C都是对数据集的数据增强，从表中可以看出，当数据集采用刺绣增强数据集时，B较于A的准确率提高了30.02%，精度提高了62.2%，说明模型泛化能力增强。C是在B的基础上引入了刺绣增强均衡数据集，训练数据量显著增加了，模型的训练效果也进一步提升，准确率随之提高，达到了70.15%，增强了模型的稳定性。

D在YOLOv8中引入了InceptionNeXt模块，准确率为85.74%，相较于C，提高了22.22%，F1值为89.74%，提高了18.37%，说明模型提取了有效的特征，提高了分类准确率。E为YOLOv8中引入了GAM模块，准确率为84.88%，相较于C，提高了21%，F1值为89.17%，提高了17.62%，说明GAM模块通过关注全局信息和局部信息的交互，增强特征表达能力。F为本研究改进后的YOLOv8模型，在C的基础上，准确率、精度和F1值分别提高了28.91%、27.04%和19.71%。准确率达到最大值90.43%，比D和E分别提高了5.47%和6.54%。

图30.png 表5 消融实验结果

（三）与其他网络对比实验分析

为了验证本研究改进后的YOLOv8模型的分类性能，本文选取LeNet^[31]、AlexNet^[32]、VGGNet^[33]、ResNet^[34]、Inception^[35]和Xception^[36]经典分类网络进行比较。以上6个网络均使用相同的网络参数和软硬件平台进行训练。表6为本研究改进后的YOLOv8模型和其他经典分类网络模型对十种刺绣分类的实验结果，粗体表示评估指标的最佳值。从表6中可以看出，本研究提出的方法在所有指标都达到了最优值，表明该模型对十种刺绣的分类表现出了优越的性能。

图31.png 表6 与不同经典分类网络的对比结果

本研究选择刘净净等人改进的MLP网络^[37]、周泽聿等人改进的Xception-TD网络^[38]和刘羿漩等人改进的DenseNet网络^[39]进行比较，比较结果如表7所示。可以看出，本研究提出的方法支持最多10种类型刺绣图像，且同时支持在线检测，除了准确率指标外，其余指标均达到最优值。

图32.png 表7 与不同改进分类网络的对比结果

四、实验结果检测验证

（一）静态图片验证

随机从刺绣图像测试集中选取不同种类的刺绣图像作为验证样本，进行基于CAM（Class Activation Map，类激活映射）热力图的可解释性分析。CAM热力图是一种用于解释卷积神经网络决策过程的可视化技术，它通过突出输入图像中对最终分类结果最有贡献的区域，帮助研究者和用户理解模型在做出决策时关注的部分。^[40]

首先将输入的刺绣图像通过神经网络中的多层卷积和池化操作，提取出包含不同区域空间信息和语义信息的高层次的特征图。在特征提取之后，通过全连接Softmax层进行处理，以输出每个刺绣类别的概率。同时在训练过程中进行权重映射，将每个特征图的权重w_c与其对应的特征图进行加权求和，然后进行ReLU操作，其公式如下：

图33.png （11）

其中，f_x(x,y)表示第k个特征图在位置(x,y)的值。最终生成一个与输入图像大小相同的CAM热力图，并将其与原始图像叠加，以直观地显示不同区域对最终分类决策贡献程度，不同随机刺绣样本检测结果及热力图如图13所示。

图34.png 图13 静态图片检测结果及热力图

从图13中可以看出，改进后的模型在对杭绣进行分类时，主要关注作品中光滑的针脚和细致的纹理部分。杭绣针法以精细、柔和的细节处理著称，特别是对眼部线条和光影的处理，采用对口、走势、平金、吊角、提金、拨路、盘棕等二十余种技法，创作出的作品具有光泽、平整、顺滑、洁净、巧妙的特质。热力图中亮度最高的区域集中在猫眼周围，表明模型识别出这部分刺绣的细腻和顺滑之处，这与杭绣针法柔中带刚的特征相一致。针对汴绣的图样，模型的关注点集中在人物的服装和发饰部分，热力图高亮区域表明模型识别出蒙针和滚针绣律动、庄重的表形效果，这与汴绣针法精致细腻、稳静柔和的特点相吻合。鲁绣针法强调虚实结合，通过通镶拼、花边、小扣锁、绣花等技法，使不同针法和谐统一，作品层次清晰、色调淡雅，呈现出浮雕般的立体效果，给人以深邃而生动的视觉体验。针对鲁绣作品，模型特别关注了图案中层次分明、浮雕般的刺绣部分。热力图显示，模型对这些立体感强烈的部分给予了高度关注，这正是鲁绣通过虚实结合和不同针法的巧妙运用所体现出的特点。在京绣分类中，模型重点关注了作品中富有宫廷风格的金线和色彩鲜艳的图案。热力图的高亮部分集中在图像的边角处，覆盖了具有端庄质朴、绣线配色鲜艳而不俗的区域，这与京绣针法强调华贵典雅和“平金打籽”的特征相一致。

改进后的YOLOv8分类模型在四种刺绣图像上均能准确识别出对应的刺绣类型，能够正确地关注到刺绣图像中的典型区域，这些区域包含了刺绣的重要细节和特征，显示了其在特征提取和分类上的有效性。

（二）离线视频验证

刺绣视频是由一系列连续的图像组成，在进行视频分类检测时，通常会将视频数据拆解成单帧图片，并对单帧图片进行提取，转换成一系列静态图片，然后将静态图片输入到模型进行独立分类。由于视频的每一帧都会得到一个独立的分类结果，通常需要对这些结果进行整合，以获得最终的分类结果。本研究使用多数投票法对分类结果进行整合，^[41]分别统计每种刺绣类别的出现频率，再整合所有帧的分类结果，实现对视频内容的准确分类。

视频测试集选取4段长度在13秒至28秒的刺绣展示片段，使用视频处理库OpenCV^[42]将视频文件打开，并转化为RGB格式，输入到改进后的分类模型中，执行前向预测，并生成CAM热力图，结果如图14所示。

从图14中可以看出，在对湘绣视频的分类过程中，热力图显示模型主要关注熊猫的头部区域（左上）和梅花部分（右上）。这部分图像的针法异样，柔中带刚，粗中呈细，线隐针藏，体现了湘绣独有的全异绣和鬅毛针等针法的特点。针对蜀绣视频的分类，模型的关注点集中在山峦的边缘和顶部区域。热力图的高亮部分表明模型识别出这些区域所展示的晕针和掺针技法所形成的柔和渐变效果，这与蜀绣“针脚整齐、线片光亮、紧密柔和”的技艺特点相吻合。在粤绣视频的分类中，热力图显示模型的关注点主要在作品中表现物象肌理的部分，特别是凤凰羽毛的细节。这些区域展示了粤绣中的平针和乱底等针法，表现了复杂的肌理和图案设计，进一步凸显了粤绣在针法运用上的灵活性与独特性。所有四个刺绣视频的预测结果都与实际结果一致，进一步验证了改进后的YOLOv8模型在刺绣分类任务中的高准确性和可靠性，为刺绣视频分类提供了一种可靠的实现途径。

（三）在线验证

基于摄像头的在线分类技术可以实现对刺绣作品的实时检测和分类，自动采集和记录每件作品的分类信息，从而构建一个完整的刺绣数据库。这些数据可以用于后续的分析和研究，如优化生产工艺、改进设计方案和市场需求预测等。该实时检测系统主要由摄像头、图像处理单元、刺绣检测与分类算法、数据存储系统和用户界面组成。摄像头用于实时采集刺绣作品的图像数据，本研究选取海康威视的工业面阵相机，型号为MV-CU013-A0GC，以确保图像的细节清晰度和质量。图像处理单元负责对摄像头捕获的图像进行预处理，包括图像去噪、裁剪、尺寸调整和颜色校正等，通常配备GPU加速，以支持实时图像处理和深度学习模型的推理。刺绣分类算法使用本文改进的YOLOv8深度学习模型。数据存储系统负责存储每一件刺绣作品的分类信息和对应的图像数据。用户界面提供一个图形化界面，用于监控刺绣作品的检测和分类过程，用户可以实时查看分类结果、图像数据和统计信息。为提高资源使用效率，图像处理单元由个人计算机组成，搭载英特尔I5-12500H处理器和512GB固态硬盘，满足存储和算法运行的要求。

通过使用cv2库函数，调用生产线或非遗工坊的摄像头，实时捕捉每件刺绣作品的图像。将捕获的图像传输到图像处理单元，进行预处理，以确保图像质量适合后续的分类任务。预处理后的图像由刺绣分类算法进行特征提取，提取图像中的关键特征，再对提取的特征进行进一步分析，实现对刺绣作品的实时分类。最后，将分类结果连同图像数据一起存储到数据存储系统中，生成每件作品的唯一标识符和分类标签。本次选取10个不同种类的刺绣手工艺品（团扇、手帕、桌布和书签）共计16件，在不同角度下进行在线验证，所得到的评价指标如表8所示。

图35.png 表8 不同种类刺绣在线验证评价指标

图36.png 图14 离线视频检测结果

根据表8的结果，对每种刺绣作品进行6次验证后，平均置信度达到了0.9171，平均帧率为43.6FPS，超过了目标检测实时性要求的30FPS。这表明该系统不仅能够准确地识别刺绣作品，还能够在高于实时性要求的速度下进行处理。以苏绣团扇、汴绣团扇、湘绣手帕、鲁绣桌布和蜀绣书签为例，在不同角度下进行检测，检测结果如图15所示。从图15中可以看出，在不同种类、不同角度下的刺绣图像的置信度均高于0.865，改进后的分类模型可以精准检测出画面中出现的刺绣，并实时返回检测结果。

五、结论

本文基于改进的YOLOv8算法对刺绣图像进行分类，首先，基于DCGAN网络均衡刺绣图像数据集，解决小样本刺绣图像类别不均衡问题。其次，将YOLOv8的主干网络替换为InceptionNeXt模块，实现在不同尺度上提取特征，增强特征提取能力。再次，增加GAM模型作为过渡模块，在特征融合前对信息进行筛选，提升网络的特征融合能力。最后，使用改进后的网络模型对测试集进行实验，并使用图片、视频和摄像头进行离线和在线验证。

实验结果表明，改进后的算法在各个类别上分类性能表现出色，整体平均召回率为0.90434，平均准确率为0.90434，平均精度为0.91505，平均F1值为0.90751，平均AP达到0.96889。在对刺绣图像、视频和摄像头检测的识别和分类的表现稳定且优异，达到了较高的精度和可靠性，实现了较强的泛化能力和鲁棒性，能够满足实际应用中的需求。

图37.png 图15 在线验证检测结果

未来的工作重点是收集更多刺绣图像，丰富不同种类刺绣数据集，让模型能够在更多样的样本上进行训练。研究使用更高效、轻量化的主干网络进行替换，来达到更高的分类精度和满足更高要求的实时性。同时将分类模型进行多端部署，开发满足桌面端、移动端（iOS和Android）和Web端的刺绣检测与分类系统，将实时分类技术与数字人文结合，有助于更好地保护和传承刺绣文化。通过数字化和系统化的管理，刺绣作品可以被详细记录和保存，为后续的文化研究和保护提供宝贵的数据支持。

将实时分类技术应用于传统刺绣行业，体现了现代技术与传统手工艺的跨领域融合与创新，不仅为传统手工艺注入了新的活力，促进了刺绣行业的现代化发展，同时也为计算机视觉和人工智能技术开辟了新的应用场景，推动了传统手工艺与现代技术的协同进步。

Research on Embroidery Dynamic Detection and Classification Based on Improved YOLOv8

Bao Yalin, Ji Guoxiu

Abstract: Aiming at the current detection and classification algorithms, which have problems such as few classification types, low accuracy rate, and inability to meet the real- time detection needs, the real-time classification technology is applied to the traditional embroidery industry to provide valuable algorithmic support for the research and protection of embroidery culture.To address these issues, this paper proposes improvements to the existing YOLOv8 algorithm.Firstly, a DCGAN network is employed to balance the embroidery image dataset, addressing the imbalance in small sample embroidery image categories. Secondly, the backbone network of YOLOv8 is replaced with the InceptionNeXt module, enabling feature extraction at different scales, enhancing the feature extraction capabilities. Additionally, the GAM model is introduced as a transition module to filter information before feature fusion, thereby improving the network’s feature fusion capabilities. Finally, the improved network model is tested on the test set, with experiments conducted using images, videos, and real-time validation via camera.Experimental results demonstrate that the improved model excels in classifying 10 types of embroidery, achieving an overall average accuracy of 0.9043 and an average precision of 0.9151. Compared with other classification and detection algorithms, the improved YOLOv8 model has obvious advantages, achieves high generalisation ability and robustness, and is able to meet the real-time demand in practical applications.

Keywords: Dynamic Detection; Embroidery Classification; YOLOv8; Real-Time Classification; Digital Humanities

编辑 | 臧杰

本文系辽宁省“兴辽英才计划”项目“新时代文化遗产保护、利用的新理念、新方法研究”（XLYC1904008）阶段性成果。

向上滑动查看注释

[1]董馥伊：《传统栽绒毯单独纹样的特征检索与应用》，《装饰》2015年第12期。

[2]刘净净、郭飞、刘玉：《刺绣图片的计算机智能识别》，《电脑知识与技术》2012年第35期。

[3]Jia Rong et al., “Underwater Object Detection in Marine Ranching Based on Improved YOLOv8,”Journal of Marine Science and Engineering, vol. 12, no.1, 2024, p. 55.

[4]郑锐、钱文华、徐丹等：《基于卷积神经网络的刺绣风格数字合成》，《浙江大学学报（理学版）》2019年第3期。

[5]赵含笑：《基于深度学习的刺绣图像分类与识别研究》，硕士学位论文，青海师范大学，2020年。

[6]张贝：《青海刺绣纹样的边缘提取研究与应用》，硕士学位论文，青海师范大学，2021年。

[7]周泽聿、王昊、张小琴等：《基于Xception-TD的中华传统刺绣分类模型构建》，《数据分析与知识发现》2022年第Z1期。

[8]刘羿漩、齐振岭、董苗苗等：《基于改进DenseNet的刺绣图像分类识别的研究》，《计算机测量与控制》2023年第1期。

[9]李圆、陈志豪、张慧等：《基于深度学习的服装图案刺绣风格化设计探析》，《武汉纺织大学学报》2023年第5期。

[10]刘羿漩、葛广英、齐振岭等：《基于改进深度卷积生成对抗网络的刺绣图像修复》，《激光与光电子学进展》2023年第20期。

[11]Zhongyuan Guo, Hong Zheng, and Xiaohang Xu et al., “Quality Grading of Jujubes Using Composite Convolutional Neural Networks in Combination with RGB Color Space Segmentation and Deep Convolutional Generative Adversarial Networks,”Journal of Food Process Engineering, vol. 44, no. 2, 2021, pp.1-14.

[12]袁卫民、周凯峰、陈飞宇等：《数据不平衡下基于DCGAN和AMCNN的滑动轴承故障诊断方法》，《工业控制计算机》2023年第9期。

[13]郑慧怡、吴华煊、杜志强：《肠道宏基因组图像增强和深度学习改善代谢性疾病分类预测精度》，《遗传》2024年第10期。

[14]陈金荣、许燕、周建平等：《基于改进YOLOv5的红花目标检测算法研究》，《农机化研究》2025年第1期。

[15]王坤峰、苟超、段艳杰等：《生成式对抗网络GAN的研究进展与展望》，《自动化学报》2017年第3期。

[16]徐永士、贲可荣、王天雨等：《DCGAN模型改进与SAR图像生成研究》，《计算机科学》2020年第12期。

[17]Alec Radford, Luke Metz, Soumith Chintala, “Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks,”arXiv preprint, arXiv:1511.06434, 2015.

[18]Alex Krizhevsky, Ilya Sutskever, and Geoffrey Hinton, “ImageNet Classification with Deep Convolutional Neural Networks,” Communications of the ACM, vol. 60, no. 6, 2017, pp. 84-90.

[19]Siham Tabik, Daniel Peralta et al., “A Snapshot of Image Pre-Processing for Convolutional Neural Networks: Case Study of MNIST,” International Journal of Computational Intelligence Systems, vol.10, no. 1,2017, pp. 555-568.

[20]鲍亚林、唐戈：《基于AlexNet深度学习的刺绣图像分类研究》，《毛纺科技》2023年第6期。

[21]Sultan Daud Khan, Yasir Ali, Basim Zafar et al., “Robust Head Detection in Complex Videos Using Two-Stage Deep Convolution Framework,” IEEE Access, vol. 8, 2020, pp. 98679-98692.

[22]陈科圻、朱志亮、邓小明等：《多尺度目标检测的深度学习研究综述》，《软件学报》2021年第4期。

[23]Sohan Mupparaju, Sai Ram Thotakura, Rami Reddy et al., “A Review on YOLOv8 and Its Advancements,”International Conference on Data Intelligence and Cognitive Informatics, Springer, Singapore, 2024, pp. 529-545.

[24]Tiantian Su, Anan Liu, Yongran Shi et al., “IremulbNet: Rethinking the Inverted Residual Architecture for Image Recognition,” Neural Networks, vol.172, 2024, pp. 106-140.

[25]车万翔、窦志成、冯岩松等：《大模型时代的自然语言处理：挑战、机遇与发展》，《中国科学：信息科学》2023年第9期。

[26]Yichao Liu, Zongru Shao, Nico Hoffmann, “Global Attention Mechanism: Retain Information to Enhance Channel-Spatial Interactions,” arXiv preprint, arXiv:2112.05561, 2021.

[27]Petr Hurtik, Stefania Tomasiello, Jan Hula et al., “Binary Cross-Entropy with Dynamical Clipping,” Neural Computing and Applications, vol. 34, no. 14, 2022, pp. 12029-12041.

[28]T. Zhang, T. Zhu, K. Gao et al., “Balancing Learning Model Privacy, Fairness, and Accuracy with Early Stopping Criteria,” IEEE Transactions on Neural Networks and Learning Systems, vol. 34, no. 9, 2021, pp. 5557-5569.

[29]Matthew C. Cieslak, A. Castelfranco et al., “t-Distributed Stochastic Neighbor Embedding (t-SNE): A Tool for Eco-Physiological Transcriptomic Analysis,” Marine Genomics, vol.51, 2020.

[30]陈挺、李国鹏、王小梅：《基于t-SNE降维的科学基金资助项目可视化方法研究》，《数据分析与知识发现》2018年第8期。

[31]Yann LeCun, L. Bottou, Yoshua Bengio et al., “Gradient-Based Learning Applied to Document Recognition,” Proceedings of the IEEE, vol. 11, no. 86, 1998, pp. 2278-2324.

[32]Alex Krizhevsky, Ilya Sutskever, Geoffrey E. Hinton, “Imagenet Classification with Deep Convolutional Neural Networks,”Advances in Neural Information Processing Systems, 2012, p. 25.

[33]Karen Simonyan, Andrew Zisserman, “Very Deep Convolutional Networks for Large-Scale Image Recognition,” arXiv preprint, arXiv:1409.1556, 2014.

[34]Kaiming He, Xiangyu Zhang, Shaoqing Ren et al., “Deep Residual Learning for Image Recognition,”Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2016, pp.770-778.

[35]Christian Szegedy, Vincent Vanhoucke, Sergey Ioffe et al., “Rethinking the Inception Architecture for Computer Vision,”Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2016, pp. 2818-2826.

[36]François Chollet, “Xception: Deep Learning with Depthwise Separable Convolutions,”Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2017, pp. 1251-1258.

[37]刘净净、郭飞、刘玉：《刺绣图片的计算机智能识别》，《电脑知识与技术》2012年第35期。

[38]周泽聿、王昊、张小琴等：《基于Xception-TD的中华传统刺绣分类模型构建》，《数据分析与知识发现》2022年第Z1期。

[39]刘羿漩、葛广英、齐振岭等：《基于改进深度卷积生成对抗网络的刺绣图像修复》，《激光与光电子学进展》2023年第20期。

[40]窦慧、张凌茗、韩峰等：《卷积神经网络的可解释性研究综述》，《软件学报》2024年第1期。

[41]王爱丽、张宇枭、吴海滨等：《基于集成卷积神经网络的LiDAR数据分类》，《哈尔滨理工大学学报》2021年第4期。

[42]J. Yang, “Real-Time Object Tracking Using OpenCV,” 3rd International Conference on Data Science and Computer Application (ICDSCA), IEEE, 2023, pp. 1472-1475.

点击下方链接，下载原文

如需购买《数字人文》期刊，请扫描下方二维码

封面.jpg

校对 | 肖爽

美编 | 王秀梅

数字使人文更新

●会议通知丨融合与边界：人工智能时代的数字人文发展新进阶

数字人文门户网站：www.dhcn.cn

●概念联觉视角下《周易》的深度数字化文本探勘

线上培训丨零代码编程的科研教学与智慧课程建设

2026年3月20日 10:03

籍合学院 2026-03-20 10:03 北京

数字人文专业发展联盟成立以来，我们在联盟内部开展的多次调研中发现一个普遍困境：面对人工智能技术的快速发展，高校人文领域的教师普遍抱有积极拥抱的态度，却在实际操作中面临双重门槛——编程学习的时间成本过高，而直接使用AI工具又难以满足学术研究对严谨性和可溯源性的要求；教学工作同样迫切需要在不增加过重技术负担的前提下，完成从传统课堂向智慧课程的转型。

基于这些科研与教学痛点，我们历时数月筹备了这套"零代码编程的科研教学与智慧课程建设"系列培训。精心筛选了各校在数字人文一线深耕的骨干教师，请他们将实践中沉淀的"低门槛、高严谨"方法论系统化地分享出来。

开设这套课程的目的很务实：

一是帮助老师们掌握真正无需编程即可上手的数据库、智能体搭建方法，以及史料挖掘和统计分析工具，把节省下来的时间重新投入到学术思考与教学设计中；

二是提供一套系统的高校智慧课程建设方法论和实践案例，让各高校在智慧课程建设方面的实践经验能够互通有无；

三是共同探索一条符合人文学科特质的AI应用路径，在技术效率与学术规范之间找到平衡点。

四是针对当前OpenClaw热点，我们也邀请资深教师做了深度解析，为如何在数字人文研究中利用类似工具提供思路和操作指导。

期待这套课程能为联盟成员单位的一线教师提供切实可用的支撑，未来联盟将继续围绕学界需要，组织时效性好、系统性强、可实操的系列培训，期待大家在学习过程中形成的实践经验，能够反哺联盟的数字人文学科建设，形成共建共享的良性循环。

	名称：零代码编程科研教学与智慧课程建设
	课程容量：10门课程，每课2课时，共20课时。每课时45分钟，部分课程可能会根据授课情况加时，以实际安排为准。
	开课时间：2026年4月7日-17日期间完成全部授课，详见下图培训计划。以实际安排为准。
	培训形式：线上直播（支持2年回看）
	课后支持：微信群（答疑+交流）+数字人文交流圈子深度交流+资料分享（长期）
基本信息	培训对象：高校数字人文相关教师：从事语言学、古典文献学、历史学、文学等学科研究以及需建设智慧课程或开展数字化教学创新的青年教师；硕博研究生：人文类专业（特别是数字人文、古典文献、汉语方言、历史文化方向）在读研究生，需掌握零代码研究工具者；中小学文史教师：需利用AI与多模态技术进行备课、课程教学及创意传播的中小学语文、历史教师；文化机构从业者：博物馆、图书馆、出版社的数字项目策划人员，古籍整理与数字化工作者；跨学科研究者：关注"AI+人文"交叉领域，希望掌握结构化数据处理、人文数据库搭建、智能体建设方法论的研究人员。
	考核认证：完成全部课程学习可获得由数字人文专业发展联盟颁发的电子证书
	费用：980元/人（标准），680元/人（凭学生证）。团体报名及联盟成员单位团购另享优惠，请咨询工作人员。

教师简介（按授课次序排序）

李斌

南京师范大学文学院教授，语言大数据与计算人文研究中心负责人。主要从事计算语言学和数字人文领域的研究，特别集中于古汉语信息处理领域的古文断句、分词、词性标注、词义分析的标准制定、资源构建和自动分析等具体技术研发。

胡韧奋

北京师范大学文学院、国际中文教育学院副教授，研究方向为计算语言学、数字人文，主讲Python编程与数据分析、自然语言处理等课程，主持十余项科研课题，作为主持人或核心成员构建了中文词向量资源库、CCA中文搭配助手、古诗文断句标点系统、“AI太炎”古汉语大模型等资源和应用。

彭志峰

暨南大学文学院中文系讲师，广东省岭南数字人文实验教学示范中心（省级）副主任，暨南大学-科大讯飞方言语音科技联合实验室（省级）副主任，暨南大学汉语方言研究中心（省级）研究员，粤语语料库建设与大模型评测重点实验室（市级）研究员，研究方向为数字人文与方言科技。

张光伟

陕西师范大学历史文化学院讲师，硕士研究生导师。担任陕西师范大学丝绸之路历史文化虚拟仿真实验教学中心（省级）主任，国际长安学研究院数字长安研发中心主任，全国历史学实验室建设联盟秘书长，国际教育合作协会（GPE）咨询委员会委员。主要从事"人工智能+历史学"交叉学科研究。

沈威

华中师范大学语言与语言教育研究中心副教授，博士，硕士生导师。研究方向为中文信息处理、现代汉语语法。主持并研发了“当代小说语料库”“汉语复句语料库”“汉语中介语动态语料库”和“我国中小学生写作能力评价与教学策略研究数据库”等语料库。

龙润田

暨南大学文学院副教授，博士生导师，暨南大学汉语方言研究中心研究员、岭南数字人文广东省实验教学示范中心研究员、暨南大学—科大讯飞方言语音科技联合实验室研究员。主要从事南方少数民族语言历史与文化、语言智能与数据计算、国际中文教育相关领域的研究工作。

贾智

中山大学中国语言文学系（珠海）教授、博士生导师、系副主任。主要研究方向为汉语言文字学，特别是中古汉语、近代汉字的发展、流变和域外传播研究，兼及敦煌遗书、域外文献整理与研究。

唐宸

清华大学人文学院副教授，教育部哲学社会科学实验室“中华传统文化智能实验室”核心成员，兼任《数字人文》编辑，主要从事中国古典文献学、数字人文研究，研发了“典津-全球汉籍影像开放集成系统”“奎章阁-中国古典文献资源导航系统”“中国数字人文（DHCN）”等基础设施。

张宁

北京师范大学文理学院中文系讲师、硕士研究生导师，北京师范大学珠海校区图书馆数字人文中心主任，中国计算机学会（CCF)人文智能专业委员会执行委员。研究方向为古籍数字叙事、VR古籍游戏、数字人文教育等。主持建设"文献多模态资源AI标注与问答平台”“京师.数字记忆3D展厅平台”“全球数字人文教育资源智能检索平台”。

内容亮点

亮点1：科研+教学双轮驱动

既解决"如何用AI做研究"（零/低代码建设数据库智能体及科研全流程），又解决"如何用AI教课"（智慧课程建设），适配高校教师双重身份需求。

亮点2：紧跟热点：解析OpenClaw及国产替代方案

聚焦海外智能体框架OpenClaw在国内遇到的技术限制、部署成本、数据合规等痛点，先讲OpenClaw是什么、为什么火，再讲为什么要转国产替代。通过讯飞AstronClaw、腾讯WorkBuddy深度测评，给出国产“龙虾”三步实操法，帮大家把大模型变成能落地执行的主动辅助系统，减少重复劳动、提升效率，最后辨析需求真伪并答疑。

亮点3：全链路场景覆盖

从底层数据结构化→大模型原理→数据库与智能体搭建→史料挖掘→统计分析→智慧课程→多模态传播，形成闭环生态。从数据结构化、大模型原理到智能体搭建、史料挖掘、统计分析，智慧课建设，全程无需编程基础，紧盯高校教师实际困难。

亮点4：社群支持

社群答疑（微信群）+ 深度交流（专业圈子）+ 长期赋能（资料共享），构建从课堂到社群的持续支持体系。

费用及报名

980元/人（标准）
680元/人（凭学生证）
集体报名另享优惠，请咨询工作人员。

扫码报名

咨询：报名链接内客服可直接发起咨询。

联系电话：185-1932-5994

邮箱：training@ancientbooks.cn

学生身份报名，请先正价付费，同时将您的姓名、学校、手机号（已与本平台关联）、学生证照片发送至邮箱【training@ancientbooks.cn】（邮件名：姓名+学校+学生优惠申请）。工作人员审核完毕后将为您退差价，系统原路退回，耐心等待即可。

←了解我们正在进行的项目

籍合学院

中华书局旗下

古籍整理与传统文化学习平台

基于人机协同的泰国巴森苏塔瓦寺“三国”主题壁画与小说插图相似度研究——兼及《三国志演义》在泰国前现代时期流传情况的更新.pdf

基于人机协同的泰国巴森苏塔瓦寺“三国”主题壁画与小说插图相似度研究 ——兼及《三国志演义》在泰国前现代时期流传情况的更新

2026年3月17日 10:01

原创林莹韩烨楠等 2026-03-17 10:01 北京

泰国曼谷巴森苏塔瓦寺存有绘于1838年的“三国”主题壁画364幅，是中国名著《三国志演义》在泰国前现代时期流传的重要见证。画中多见汉字榜题和专名标注，构图近似中国明清时期的小说版刻插图。

多模态学习

林莹 / 同济大学人文学院

韩烨楠 / 同济大学人文学院

方梁 / 闽南师范大学智能优化与信息处理实验室

吴泓润 / 闽南师范大学智能优化与信息处理实验室

喻飞 / 闽南师范大学智能优化与信息处理实验室（通讯作者）

摘要：泰国曼谷巴森苏塔瓦寺存有绘于1838年的“三国”主题壁画364幅，是中国名著《三国志演义》在泰国前现代时期流传的重要见证。画中多见汉字榜题和专名标注，构图近似中国明清时期的小说版刻插图。本研究首次采集巴寺壁画，使之与现存16个代表性《三国志演义》小说插图本中的639幅同主题版画共建数据集，并搭建对比学习模型SimCLR，提取图像特征，生成相似度评分。通过结合基于对比学习的模型计算与基于文史积累的人工分析，本研究得以更新《三国志演义》以汉籍形式在泰国的流传与接受情况：一是将入泰时间上限提前至泰国前现代时期，二是确认巴寺壁画兼有江南本和建阳本两个系统的影响，尤以前者代表周曰校本影响最大，榜题则主要借鉴毛评本。该结论对古代小说域外传播情形及现有研究作出补充，也促进了人机协同机制在传统图文分析与文化遗产保护方面的新探索。

关键词：三国志演义图像对比学习人机协同

早在明清之际，中国小说名著《三国志演义》（为便于行文，以下径称《三国演义》^[1]）便传入周边国家，产生重大影响。与日本、朝鲜、越南等东亚、东南亚汉文化圈内的情况相似，“三国”故事在泰国流播甚广，颇受欢迎。据学者推断，在17世纪初，也就是泰国阿瑜陀耶王朝中期，《三国演义》已伴随华人移民或“东南亚人士来华购买及书籍贸易”^[2]等途径传入泰国。初入泰国，“三国”故事的传播以流动的神庙活动和戏曲表演为主，以图文、雕塑等凝定的形式为辅。^[3]视听演出转瞬即逝，现场细节无从还原。而因战乱频仍、气候炎热、中文识字率低、文献保存意识淡漠等原因，汉籍在泰国的保存情况也不理想。泰国现存最早的《三国演义》是清光绪九年（1883）善美堂藏版《绣像第一才子书》^[4]，该书比史称“洪版《三国》”的首部泰译本《三国》晚了80多年。由于“洪版《三国》”译者本人不谙汉语，其翻译底本是在泰华人据汉籍意译的质朴泰文，^[5]因此，若想通过译本寻觅其所依据的小说版本，进而推断彼时可能流传于泰国的汉籍情况，无疑是困难重重的。换言之，如欲探究《三国演义》在泰国的早期传播情形，便不得不诉诸间接证据。唯一可行的路径就是充分利用非文字资料。^[6]

幸运的是，在作为《三国演义》泰国早期传播关键渠道的绘画雕塑领域，至今仍有实物资料留存，其主流为佛寺壁画。泰国全境共有绘制“三国”故事壁画的佛寺五座：纳浓寺、切都蓬寺、巴森苏塔瓦寺、波汶尼威寺和建安宫。绘制时间最晚的是建安宫的90幅壁画，完成于光绪二十五年（1899），内容以《三国演义》为主，兼有少量《隋唐演义》等其他题材作品，其中与“三国”有关的54幅，其底本很可能是晚清石印本《增像全图三国演义》。^[7]时间次晚的是修建于曼谷王朝拉玛四世时期（1851—1868）的波汶尼威寺，配殿壁画绘有从“刘备送徐庶”到“关羽义释曹操”的28段故事，该寺为皇家寺庙，画风趋近泰式格调。^[8]余下三座寺庙均修建于曼谷王朝拉玛三世时期（1824—1851）。^[9]纳浓寺有“三国”壁画48幅，内容始于“刘备投奔刘表”，至“赵云独战曹军”止，破损严重。切都蓬寺壁画绘于户外中式亭子内部，因处于开放环境，损坏程度更甚，经辨认，仅描绘了赤壁之战情节。^[10]唯独巴森苏塔瓦寺存有泰国境内绘制时间早、体量大、华人参与度高的“三国”主题壁画，学术价值重大，但壁画图像尚未经过系统采集和整理，所受关注和研究极其不足。

一、背景信息：泰国巴森苏塔瓦寺“三国”壁画概述

巴森苏塔瓦寺（Wat Prasoet Sutthawat, วัดประเสริฐสุทธาวาส）位于泰国曼谷，原名“卡琅寺”（Wat Klang），兴建于阿瑜陀耶王朝时期（1351—1767）。曼谷王朝拉玛三世在位（1824—1851）时，福建漳州府海澄县籍华人郑宝因在泰经商有道，出资重修该寺并将之献给国王，受封爵号“帕巴森瓦尼”，该寺遂更名为“巴森苏塔瓦寺”^[11]（以下简称“巴寺”）。寺内供奉上座部佛教神像，大殿四壁绘制“三国”主题壁画364幅，呈逆时针分布（见图1-1至图1-5），内容从“刘备观榜文”到“张飞战张任”，^[12]大部分保存完好，风格接近于中式绘画，以线描笔法为主，有较多汉字标注。^[13]寺中主殿后壁上石碑题“大清国道光拾八年岁次戊戌福建省漳州府海澄县弟子郑”，可知壁画绘制于清道光十八年（1838），这个时间点不仅早于前述泰国现存最早的汉籍《三国演义》，也早于1865年的泰译插图本。^[14]壁画绘制时间正处在泰国前现代末期，[15]尚无可能如前述建安宫壁画那样依据晚清石印本，其底本应是晚明以降的小说刻本插图。也就是说，无论从历史、政治，抑或文学、技术的维度来看，巴寺壁画均在时间轴上处于《三国演义》在泰传播的早期，如能探究壁画依据的底本，便可更新《三国演义》在泰国前现代时期的流传和接受情况，不仅可以将入泰时间上限提前，也有助于进一步认识在泰流播的具体版本。图1.png 图1-1 大殿内壁画分布与阅读顺序（“ 图2.png ”指代佛像位置）

图3.png 图1-2 佛像左侧墙壁壁画分布示意图

图4.png 图1-3 佛像背后墙壁壁画分布示意图

图5.png 图1-4 佛像右侧墙壁壁画分布示意图

图6.png 图1-5 佛像对面墙壁壁画分布示意图

壁画分行布列于佛寺四壁，佛像两侧墙壁布图较多，共计7层，每面墙壁128幅；位于佛像背面和对面的壁画较少，分为6层，每面墙壁54幅。这些壁画长宽比均约为4∶3，皆从右向左排列，符合中式阅读传统。每幅壁画皆有画框，唯其形制略异：第1—58幅（第一排的全部壁画），画面内容占据画框全部；第59—174幅（第二、三排），画框内加绘一个长方形边框；第175—232幅（第四排），画框内加绘一个四角为弧形的长方形边框；第233—364幅（第五、六、七排），画面内容再次占据画框全部。巴寺壁画中人物、建筑、植物、兵马、城门等元素以及构图模式与中国明清时期《三国演义》小说版刻插图十分接近，很可能是参照一个或多个明清版刻插图本绘制的。^[16]但若仅靠人工对照壁画和小说版画的相似性，一则工作量过大，二则难以避免主观性带来的偏差，因此，本研究引入机器计算以提高工作效率及其客观程度。

在现有的相关研究中，泰国学者初蓬·厄初翁对巴寺壁画作出了图文介绍，但侧重美术分析，并未涉及来源推测问题，更未从文学视角加以关注。^[17]泰国来华留学生陈柳玲的博士论文提及巴寺壁画，认为其底本是关帝庙或关公殿的同类壁画，巴寺修建之目的是推崇关公。^[18]中国学者方面，金勇曾对巴寺壁画略有介绍，他指出这是泰国境内最丰富翔实的“三国”主题壁画，还附上亲赴现场所摄彩图3张。^[19]王少杰亦曾专论巴寺壁画，但未展开图绘底本的具体分析。^[20]胡春涛则围绕另一寺庙建安宫的“三国”壁画展开分析，关注壁画内容、绘制年代和底本来源，虽然其关注重点在于建安宫，仍为巴寺壁画的研究提供了参考范例。^[21]本研究在借鉴上述成果基础上，对数字人文的人机协同研究范式进行探索：首先采集巴寺全部壁画并进行数字化整理，其次构建出一个相似度预测框架，使之自动计算壁画与小说版刻插图的视觉相似度，最后回归传统文史分析方法，发挥人力解读图文细节的优势。

二、机器计算：基于对比学习的图像视觉相似度评估

在开始机器计算之前，首先需要人工采集壁画并建立数据集。本研究的数据集由1,003幅图片组成，包括364幅壁画和639幅来自16个具有代表性的小说插图本。

（一）数据集的建立与划分

截至1838年巴寺壁画绘制前，带有情节性插图的《三国演义》小说版本共计34个。尽管学界关于《三国演义》的版本研究已臻成熟，但对插图本的版本梳理，仍需基于图像特点另行展开。这一方面是因为按文字和按图像划分的版本系统未必一致，如清初金阊艺海堂本《四大奇书第一种》^[22]，内封题“毛声山评点三国志”，正文出自毛评本无疑，然其插图为回目画，共240幅，图目5—7字不等，与明刊《李卓吾先生批评三国志》^[23]所配插图基本相同，应属于周曰校本插图体系。另一方面，对小说来说，插图在很多情况下具有一定独立性，是可以被灵活拆卸和再度拼装的版刻资源。明万历建阳忠正堂熊佛贵刊本《新锲音释评林演义合相三国志史传》^[24]，其版式为上评中图下文，图像比例也与传统上图下文不同，宽度仅占版面的二分之一，左右半叶图像合为一图，即“合相式”，书前又插入“桃园结义”“刘备称帝”两张半叶竖幅插图，应为江南版画拼入的结果，不能因为书坊出自建阳就将之简单归入建本系统。^[25]因此，本研究从图像特征出发，重新梳理这34个出现于巴寺壁画绘制前的《三国演义》插图本，通过合并同类版本，提炼出具有代表性的16种（详见表1），并沿用通行的小说图像地域风格分类维度，^[26]将这16种代表性插图本分为三个系统：一是江南系统，包括双面连式和半叶竖幅式；二是建阳系统，即上图下文式；三是江南与建阳的合流系统，前述兼有上图下文“合相式”插图和半叶竖幅插图的忠正堂熊佛贵刊本即属此类。

随后，本研究在364幅巴寺壁画中，根据图像表达和榜题、人物、建筑等文字标注，提取出可以辨认小说情节的代表性壁画88幅^[27]，又从上述16种代表性小说插图本中整理出与88幅壁画对应的小说插图639幅（出自不同小说插图本的图像数量不一，详见表1最右栏），共同构成本研究的核心数据集。

图7.png 表1 出自代表性小说插图本的插图数据统计表

注：序号1—4插图属于江南风格，5—14属于建阳风格，15、16为江南与建阳的融合风格。总计639幅。

为方便机器学习和全面评估相似度预测框架的性能，本研究采用一种系统的数据集划分策略：将88幅壁画分为两个数量均等的部分，分别命名为“训练集”和“测试集”。训练集旨在训练机器优化其有效提取图像特征、为图像相似度打分方面的性能，测试集用于测试机器在训练集上习得的特征提取能力及相似度打分能力。小说插图本与壁画对应的图像，则跟随壁画的流向归入训练集或测试集。由于测试集中的训练数据既包括一半数量的壁画，又包括这一半壁画所对应的小说插图，这就确保了训练的模型在能充分学习到壁画特征的同时，也能充分接触小说刻本图像的多样性。

（二）面向训练集的对比学习模型SimCLR

对比学习（Contrastive Learning）广泛应用于图像处理和自然语言处理领域，如图像分类、目标检测、文本表示（text representation）等。作为一种自监督学习方法，对比学习主要用于训练机器学习和深度学习模型，尤其广泛应用于缺少标签数据的场景。其核心在于通过对比数据样本学习特征，将相似样本映射到相近的特征空间，将不相似样本映射到不同空间，从而使机器习得更有区分力的图像特征。在那些复杂耗时、存在较多主观差异的场景中，对比学习因其自监督学习机制而具有的优势显得尤为明显。巴寺壁画与小说插图的相似度评估任务，即对比学习模型适用的领域之一。

在样本数量受限的情况下，本研究利用对比学习模型SimCLR（A Simple Framework for Contrastive Learning of Visual Representations），通过数据增强技术生成图像的多个变体，构建“正样本对”（positive sample pairs），并通过对比损失函数来训练模型的优化。SimCLR的单阶段训练策略简化了负样本的选择，使其在小样本环境下依然能有效捕捉图像之间的微妙差异，充分学习到具有高区分力的特征。对于样本数量相对较小的巴寺壁画和小说插图来说，SimCLR模型的这些特点有助于精确评估二者图像的相似性。该模型的研究框架包括如图2所示的多个步骤，以下将逐一拆解。预测框架相关代码和本研究部分数据，见Github开源平台https://github.com/MiyaWu/Romance-of-the-Three-Kingdoms。

图8.png 图2 壁画与小说插图的相似度预测框架

1.数据预处理

本步骤首先对巴寺壁画和小说插图进行图片缩放，确保它们符合输入模型的尺寸规范，其次对图片进行归一化、标准化处理，确保图片数据的稳定性与一致性。

2.特征提取

本步骤将预处理后的图像输入到训练成熟的SimCLR模型（训练过程详后）中，SimCLR模型将自动提取图像的关键视觉特征，以特征向量的形式进行输出。具体来说，针对每一组待评价的壁画与小说插图{壁画x,插图1,……,插图i,……,插图y}，SimCLR模型提取出特征向量{e_x，e₁，……,e_i,……,e_y}。e_x表示壁画x的特征向量，e₁……e_y分别表示y种小说插图相应的特征向量。

3.相似度检测

完成巴寺壁画和小说插图的特征提取后，本步骤运用余弦相似度计算二者特征向量之间的相似性。余弦相似度的定义如公式（1）所示，通过计算壁画与训练集中每一幅小说插图的相似性，得到壁画与y种插图的余弦评分{s_x1,……s_xi,……s_xy}。

图9.png （1）

4.度量指标

为了评估基于SimCLR模型的相似度预测框架的性能，本步骤请专家从局部细节、全局构图等角度，对部分巴寺壁画与小说插图的相似度进行打分，并采用肯德尔等级相关系数度量指标，衡量框架预测的评分与专家标注的评分之间的一致性。

（三）关于对比学习模型SimCLR的训练及其有效性确认

SimCLR模型通过对比同一图像的不同增强变体实现自我训练，从而有效提取图像特征。这一训练过程包括如下步骤（图3）。

图10.png 图3 SimCLR模型的训练流程图

1.数据增强

SimCLR模型运用随机裁剪、颜色调整、水平翻转等数据增强技术，增加了输入图像的多样性。这些技术使图像在视觉表现上呈现出不同变化，但图像的核心内容保持不变。本步骤旨在提供多样化样本，帮助模型在不同的视觉变换中习得提取图像核心特征的能力。

2.特征提取

在特征提取阶段，SimCLR使用ResNet50作为编码器（Encoder），将数据增强后的图像转化为高维特征空间中的初步特征向量。对于每个增强后的输入图像m_i，编码器f(·)通过卷积层和残差连接等机制，逐层提取图像的局部和全局特征，输出一个高维的特征表示向量h_i。h_i的公式定义如公式（2）所示。

图11.png （2）

随后，将特征向量h_i输入投影头网络g(·)进行映射，最终生成一个能够充分代表该图像的特征向量z_i：

图12.png （3）

投影头网络g(·)通常由一个包含ReLU激活函数的带两个隐藏层的多层感知机（MLP）构成，负责将编码器产生的高维特征向量h_i映射到低维空间，从而生成更适用于对比损失计算的特征表示z_i。这一过程提高了特征表示的质量和区分度，使模型在处理经过视觉变化的图像时，能够更加精确地识别和提取图像的关键特征。

3.对比损失

最终生成的特征向量z_i被输入到NT-Xent（Normalized Temperature-Scaled Cross Entropy Loss）对比损失函数中，定义如公式（4）所示。其中z_c和z_d是通过投影头生成的特征向量；sim（z_c，z_d）是两向量的余弦相似度；τ是温度参数，控制相似度的缩放；1_[_k_≠_c_]是一个指示函数，保证不同图像之间不会被误认为具有相似性。

图13.png （4）

NT-Xent损失函数通过公式（1）中的余弦相似度来衡量特征向量之间的相似性，并引入一个温度参数τ来调节相似度对模型的影响。这种设计能够放大或减弱相似性评分的敏感度，使模型在训练过程中能够更细致地区分特征向量（即图像）之间的细微差别，进而提升对相似图像的识别能力。

模型在训练集和测试集上的损失值如图4a所示，训练集损失值在前40次迭代中经历快速下降阶段，随后进入渐进收敛期，至第60次迭代后损失值稳定于约0.01；测试集损失同步收敛至0.07±0.02区间，该收敛模式表明模型在有效学习数据特征的同时，未出现显著过拟合现象，具备稳健的收敛性和泛化能力。

在训练集中，本研究利用训练后的相似度预测框架从壁画和插图中提取特征，并基于这些特征计算壁画与插图之间的相似性分值。本研究采用肯德尔等级相关系数作为度量标准，评估框架预测与专家评价之间的一致性。如图4b所示，基于肯德尔等级相关系数的箱形图显示，它的范围在0.3到1.0之间，中位数约为0.75。箱体的上下边缘分别代表第一四分位数（0.62）和第三四分位数（0.88），表明中间50%数据集中在0.62—0.88之间。第一四分位数0.62意味着75%的模型预测与专家标注达到中等强度以上相关性，第三四分位数0.88显示前25%的优秀预测已接近完美一致性。这些数值表明，框架预测与专家标注之间的一致性真实且可靠，框架在检测小说插图与壁画之间相似性方面具备有效性，在大多数类别中，框架的预测结果与专家评分相对接近，显示出较小的绝对差值。

（四）面向测试集的对比学习模型SimCLR计算结果

鉴于上述SimCLR模型在评估小说插图与壁画相似性方面具备有效性，本研究将该模型应用于测试集，计算巴寺壁画与《三国演义》小说插图的相似程度，并通过图5的“小提琴图”，将壁画与不同版本小说插图相似性分值的分布特征进行可视化呈现。图中每个黑色散点代表框架预测的相似度分值，红、黄横线分别代表相似度分数的平均值和中位数。

在“李”“余”“魏”“郑”“康”“荣”“北”“种”这8个版本中，相似度分布呈现明显的双峰特征：一部分数据集中在箱体的上部，另一部分集中在箱体的下部。这种分布模式表明，在这些版本中，部分小说插图与壁画的相似度较高，而另一部分则存在显著偏差。“朱”“笠”“遗”“叶”“诚”“忠”诸版本尽管呈现单峰分布，但极端低值的出现频率较高，表明这些版本中存在大量壁画和小说插图相似度偏低的情况。余下的“周”和“刘”两个版本均为单峰分布，周本箱体较小，数据点聚集在平均值附近，显示出较低离散性，且其平均相似度分数高达0.91；刘本平均分数仅为0.86，并且存在明显的极端低值。因此，壁画总体上与周曰校本小说插图最为相似，少量也与刘龙田本等建本系统插图较为相似。

三、人工解读：基于传统文史方法的图像分析

根据对比学习模型SimCLR的计算结果，巴寺壁画在整体上与周曰校本插图最为相似，与建本则具有部分相似性。以下从传统文史研究方法出发，人工分析壁画的图文信息。

图14.png 图4a 训练集和测试集损失值曲线图

图15.png 图4b 肯德尔等级相关系数统计分布箱形图

图16.png 图5 壁画—小说相似度分值的可视化“小提琴图”

（一）壁画构图：以周曰校本插图影响为主

1.三英战吕布

嘉靖本和毛评本对“三英战吕布”情节的书写几乎相同，壁画和周曰校本插图的画面呈现也与文字基本相符：

旁边一将，圆睁环眼，倒竖虎须，挺丈八矛，飞马大叫：“三姓家奴休走！燕人张飞在此！”吕布见了，弃了公孙瓒，便战张飞。飞抖搜神威，酣战吕布。八路诸侯见张飞渐渐枪法散乱，吕布越添精神。张飞性起，大喊一声。云长把马一拍，舞八十二斤青龙偃月刀，来夹攻吕布。三匹马丁字儿厮杀。又战到三十合，两员将战不倒吕布。刘玄德看了，心中暗想：“我不下手，更待何时！”掣双股剑，骤黄骠马，刺斜里去砍。这三个围住吕布，转灯儿般厮杀。八路人马都看得呆了。（嘉靖本^[28]，第50页）

从构图模式来看，壁画（图6a）和周曰校本插图（图6b）均将画面分成左右两部分，画面右侧刘关张三人各骑快马、各执武器，自上而下一字排开。三人兵器指向处，是策马且战且走的吕布，吕布身后的城门，占据了图画左侧偏上的局部。

以李评本（图6c，此处选李评本中时间最早的吴观明本，见表1第2项）和刘龙田本（图6d）的同场景插图为参照，二者长宽比例均与壁画和周曰校本迥异，李评本为半叶竖幅式，构图纵向展开，刘关张虽也自上而下排开，但兵器朝向及三人与吕布的相对位置，较周曰校本和壁画有所区别。已知李评本的文字与周曰校本属于同一系统，^[29]李评本插图也是周曰校本插图的衍生品，^[30]此幅壁画同时有周曰校本和李评本插图的影子不足为奇，就构图和细节来看，壁画显然与周曰校本关系更密，不可能绕开周曰校本而直接取法李评本。此外，建阳本系统的刘龙田本插图更扁平局促，加之上图下文版式每半叶均有插图，如连环画一般，从文字到图像的转换率较高，故而在题为“虎牢关三战吕布”的插图中只画出关羽、吕布二人（图6d下），张飞和吕布的对战已出现在前一幅中（图6d上）。与其他同主题插图对读可知，巴寺壁画与周曰校本的相似度最为显著，这一人工判定结果也与模型计算分值（表2）一致。

图17.png 图6a 壁画第36幅“破关兵三英战吕布”（榜题未写入预留方框内）

图18.png 图6b 周曰校本卷1第47叶左、第48叶右插图“虎牢关三战吕布”

图19.png 图6c 李卓吾评本“虎牢关三战吕布”

图20.png 图6d 刘龙田本“三英战吕布”

图21.png 表2 SimCLR模型对“三英战吕布”小说插图与壁画相似度计算结果

2.吕布戏貂蝉

描绘“吕布戏貂蝉”的巴寺壁画（图7a）右下角已然损蚀，但仍可以看出与周曰校本（图7b）的构图十分雷同，几乎是周曰校本的简化版本：居于两幅图中心的太湖石比人略高，既在视觉上有分割画面的作用，又能起到遮挡窥听者董卓的叙事功能。石头的轮廓、镂空，及其上方点缀的草木和祥云亦如出一辙。山石的左侧立着吕布的方天画戟，画戟之旁的吕布正与貂蝉倾谈，二人身后露出画面最左端的凤仪亭一角。小说写道：

（貂）蝉见布寻觅，慌忙出曰：“汝可去后园中凤仪亭边等我，我便来。”布提戟径往，立于亭下曲阑之傍。良久，见貂蝉分花拂柳而来，果然如月宫仙子，泣与布曰……言毕，手攀曲阑，望荷花池便跳。……卓寻入后园，见吕布倚戟，和貂蝉在凤仪亭下。卓走至跟前，大喝一声。布回头见卓，大惊。卓夺下吕布手中戟，吕布便走。卓赶来。吕布走得快，董卓胖，赶不上。卓提戟来杀吕布，布手起一拳，打戟落于草中。（嘉靖本，第77—78页）

壁画和周曰校本定格的画面，即“卓寻入后园，见吕布倚戟，和貂蝉在凤仪亭下”。若是参照其他小说插图的处理方法，李笠翁本（图7c）虽与周曰校本相同，均取小说则目“凤仪亭布戏貂蝉”来结构画面，但描绘的是稍后的时刻，即“卓提戟来杀吕布，布手起一拳”。并且由于半叶竖幅的纵向布局，凤仪亭和假山的置景迥然不同。郑少垣本作为典型的建本形制，每半叶均有插图，文图转换率高，在临近两幅图里，分别表现了上述“吕布倚戟，和貂蝉在凤仪亭下”（图7d上）与“卓提戟来杀吕布，布手起一拳”两个瞬间（图7d下）。总的来说，SimCLR模型对表现该场景的插图与壁画相似度打分与人工读图结果吻合（表3）。

图22.png 图7a 壁画第47幅“董太师大闹凤仪亭”（榜题未写入预留方框内）

图23.png 图7b 周曰校本卷1第73叶左面、第74叶右面插图“凤仪亭布戏貂蝉”

图24.png 图7c 李笠翁评本“凤仪亭布戏貂蝉”

图25.png 图7d 郑少垣本“吕布戏貂蝉”

图26.png 表3 SimCLR模型对“吕布戏貂蝉”小说插图与壁画相似度计算结果

3.擂鼓斩蔡阳

巴寺壁画尽管在构图上受周曰校本影响颇深，但有不少地方进行了针对细节的调整，比如弱化血腥暴力元素，这也与壁画所处寺庙场域相统一。在表现“擂鼓斩蔡阳”的画面中，壁画（图8a）整体上相似于周曰校本，但有意避开小说所叙“一通鼓未尽，云长刀一起处，蔡阳头已落地”的瞬间。周曰校本（图8b）径绘出蔡阳人头落地之景象，细看之下，似乎还有血溅痕迹，李笠翁本从文字异同上属于周曰校系统，^[31]其插图也有衍生关系：所绘情形与周曰校本类似，只是将落地的人头改为腾空（图8c）。在建本代表之一余象斗本（图8d）中，擂鼓的张飞与城墙的一角出现在画面右上方，画面的中心是关羽持刀砍蔡阳落马，虽然画幅比例不同，但与周曰校本、李笠翁本均有类似之处，足以说明当时的小说坊刻存在跨地域的借鉴关系。这也可以解释在模型计算结果中，建本与壁画为何具有局部的高相似度。

在这组图像中，SimCLR模型的打分结果是这样的（表4）：

图27.png 表4 SimCLR模型对“擂鼓斩蔡阳”小说插图与壁画相似度计算结果

（二）壁画构图：以建本系统的影响为辅

巴寺壁画主要受周曰校本的影响，同时部分吸收了建本的图像资源。此中原因大致有二，一方面是周曰校本插图属于“则目画”，依照“则目”来绘制图像，每则只有一幅插图，文图转换率较低，而建本的上图下文版式决定其每半叶均有插图，文图转换率较高。^[32]当周曰校本无图可依的时候，建本就能够提供很好参考的价值。

图28.png 图8a 壁画第167幅，无榜题，右上角标注“张飞”，左侧标注“蔡阳”

图29.png 图8b周曰校本卷3第62叶左面、第63叶右面插图“云长擂鼓斩蔡阳”

图30.png 图8c 李笠翁评本“擂鼓斩蔡阳”

图31.png 图8d 余象斗本“擂鼓斩蔡阳”

1.蒋干盗书

关于“蒋干盗书”，周曰校本（图9c）、李卓吾本（图9d）等江南本系统插图仅有“群英会”的酒宴画面（这是壁画第252幅，即图9a取法的对象），未描绘盗书；建本系统的叶逢春本（图9e）、朱鼎臣本（图9f）亦无盗书配图。因此，第253幅壁画（图9b）更有可能参考了建本系统的刘龙田本（图9g-1）和刘荣吾本（图9h-1）。

图32.png 图9a 壁画第252幅，无榜题，有文字标注“甘宁”“周瑜”“蒋干”“张昭”等

图33.png 图9b 壁画第253幅，无榜题，有文字标注“周瑜”“蒋干”

图34.png 图9c 周曰校本“群英会瑜智蒋干”

图35.png 图9d 李卓吾评本“群英会”

图36.png 图9e 叶逢春本“群英会”

图37.png 图9f 朱鼎臣本“群英会”

图38.png 图9g-1 刘龙田本“蒋干盗书”

图39.png 图9g-2 刘龙田本“群英会”

图40.png 图9h-1 刘荣吾本“蒋干盗书”

图41.png 图 9h-2刘荣吾本“往说周瑜”

2.周瑜战曹仁

壁画在周曰校本之外可能部分参考建本的原因之二是，建本插图时代更早，[33]画幅较小，绘制的条件和水平相对有限，呈现的画面稍显简单。从另一个角度来说，比起周曰校本插图的繁复精丽，建本插图显得更为重点突出，易于模仿。因此，在周曰校本有相应插图的情况下，壁画偶尔依然选择参照建本，例如“周瑜战曹仁”壁画（图10a），更接近于朱鼎臣本（图10d）和刘龙田本（图10e）。考虑到出资重修巴寺的商人郑宝来自闽南，壁画构图受到建本影响是具备现实可能性的。

图42.png 表5 SimCLR模型对“周瑜战曹仁”小说插图与壁画相似度计算结果

（三）壁画细节和榜题：以毛本影响为主

巴寺壁画中的文字信息表明，在壁画的修建中，一定有毛评本的影响。

1.细节：曹操以手掩面

壁画第65幅“曹操濮阳遇吕布”（图11a），乍看上去，仅是周曰校本插图（图11b）的左右镜像对调：吕布御马横戟朝左前方刺去，曹操身着常服，未持兵器，策马遁走。然而，画中曹操以手掩面的动作值得格外注意。

图43.png 图10a 壁画第284幅“周瑜中箭”

图44.png 图10b 周曰校本卷6第1叶左面、第2叶右面插图“周瑜南郡战曹仁”

图45.png 图10c 李卓吾评本“周瑜南郡战曹仁”

图46.png 图10d 朱鼎臣本“周瑜中箭败绩”

图47.png 图10e 刘龙田本“陈矫箭射周公瑾”

图48.png 图11a 壁画第65幅“曹操濮阳遇吕布”（榜题未写入预留方框内）

图49.png 图11b 周曰校本卷3第6叶左面、第7叶右面“吕温侯濮阳大战”

壁画中曹操这一动作，与周曰校本一手挥鞭、一手紧拽缰绳不同，却与毛评本第十二回中“操以手掩面”的细节描述完全一致：

却说曹操见典韦杀出去了，四下里人马截来，不得出南门；再转北门，火光里正撞见吕布挺戟跃马而来。操以手掩面，加鞭纵马竟过。吕布从后拍马赶来，将戟于操盔上一击，问曰：“曹操何在？”操反指曰：“前面骑黄马者是他。”吕布听说，弃了曹操，纵马向前追赶。曹操拨转马头，望东门而走，正逢典韦。（毛评本^[34]，第102页）

然而，该细节在嘉靖本文字中未曾出现：

却说曹操见典韦杀出去了，四下里人马截来，不得南门；再转北门，火光里正撞见吕布挺戟跃马，追杀曹兵。操加鞭纵马过去。吕布从后拍马赶来，用戟于曹操盔上一击，问曰：“曹操何在？”操反指曰：“前面骑黄马者是他。”吕布弃了曹操，拍马赶前面的。曹操拨转马头，却望东门而走，正逢典韦。（嘉靖本，第113页）

壁画凸显了曹操的掩面行为，自然更接近于毛评本的描述。当然，也可能直接受到了其他根基于毛评本的衍生作品如戏曲表演的影响。

2.回目文字

如果说“曹操掩面”的细节未必能确证毛评本对壁画的直接影响，那么，毛评本回目与壁画榜题的高度相似，则可以反映二者的直接关联。本研究梳理了全部可辨识的壁画榜题，将其中可与毛评本回目、周曰校本图题（即嘉靖本则目）对照的部分胪列出来（见表6），这些榜题涉及毛评本前六十五回的内容，加粗者为壁画榜题与毛评本、周曰校本相同的部分。

图50.png 表6 壁画榜题与毛评本回目、周曰校本图题对照表^[35]

如表所示，壁画榜题与毛评本回目完全相同或仅有细微差别的占绝大部分，其中包括毛评本独有而不见于周曰校本，这就说明壁画与毛评本的关联绝非偶然，壁画榜题直接参考了毛评本的回目。此外，壁画前249幅在左上或右上角均有以细窄竖框预留的榜题位置，大多与周曰校本图题位置相同，但壁画榜题却实际写在画中空白处。据此推测，巴寺壁画的画工与文字书写者当非一人，可能是画工预留了榜题位置，画至第249幅，书写者才开始增添文字，此时发觉预留榜题空间有限，遂将题目写到画中留白处，画工自此便不再绘出题框。假如这一假设不误，则说明壁画图文各有来源，制作亦非同时，也可佐证周曰校本和毛评本对壁画创作兼有影响。

四、结论与思考

结合机器计算和人工解读，本研究更新了古代小说《三国演义》以汉籍形式在泰国的流传情况。早在泰国前现代阶段，境内流传的《三国演义》汉籍版本相当丰富，包括周曰校本、毛评本以及一个或多个建阳本。图像方面，江南本插图和建阳本插图对巴寺壁画兼有影响，以江南本系统中周曰校本插图的影响为主；文字方面，对壁画榜题影响较大的主要是毛评本。由于传统上汉籍在泰国保存不力，汉语在泰国未居主流，上述结论均为本研究借助图像分析首次提出。这些结论细化了关于中国古代小说域外传播的认识，也为进一步探讨小说在泰国所受的本土化改造，以及中国尤其是闽南地区和泰国的“文化互化”（transculturation）[36]情况提供了基础。例如，对于刘关张齐上阵的小说情节，建本系统由于文图转换率高，在画面设计时往往给予三人均等空间，周曰校本插图以刘备为主，壁画则在综合两者基础上，偏重突出关羽，并常以汉字注出“关公”，这说明了关公信仰在东南亚的强大影响力。而壁画对小人物服饰细节的改造，也显现出“三国”故事为植根异域而被动接受或主动拥抱的新变化。

本研究是对人机协同机制的一次实践。人机协同首先需要明确机器和人工各自的优势与不足。机器的优势在于受工作强度影响较小、对于视觉评估的客观性更强。但机器学习和判断更依赖于一种确定的关系，这就不能完全适用于文字与图像的转化关系对应，因为文字与图像是一对多的关系，一段文字可以想象为无数种图像；也无法单纯依靠图像视觉相似度计算来判定变迁脉络，因为现实中存在兼采多种图像进行再创作的情况。人工的优势则在于具备文史领域的知识积累，主要包括以下几个层面：一是熟悉小说文献研究方法，掌握相关的版本源流关系，能够基于现有的文献和图像研究成果，划定小说插图的版本体系，选定具有代表性的插图本，建立合适的数据集。二是知晓不同版本文图转换率的差异，举例来说，建阳本系统为上图下文，每半叶均有插图，文图转换率较高，这就导致建本插图往往稀释了关键情节的要素聚集度，而周曰校本等江南本系统一回只有一至二张插图，选择定格的时刻更为考究，构图要素浓度较高。三是可以根据学界在小说版本源流、图像版式演进方面的共识，判断不同小说版刻插图的先后关系。这些人工优势，都是机器所不具备的，既构成了机器展开学习的基础，又提供了最终判定必不可少的合作力量。因此，人机协同机制的要点是充分利用机器的高效率和客观性，与此同时，也充分利用人工的文史知识储备、传统分析能力以及文字想象能力，避免机器由于执着求取唯一确定性而过于求实的倾向，[37]也避免以往同类研究中仅凭人工判断视觉相似度而过于主观的局限。[38]人机协同机制结合了模型计算量化数据和人工细读质性分析，所谓“协同”并不是通过机器和人工在同一路径上重复两次，而是取长补短，相互配合，有同行之时也有分工之处，最终实现相得益彰、殊途同归的效果。

近年来，人机协同和对比学习在图像分析中应用颇多，是文化遗产和跨文化交流领域的研究热点之一。本文将之用于中国古代小说的域外传播研究，提出了新结论，证明古典文本与图像分析吸收新方法的必要与可能，也为文化遗产的数字化保护和创造性研究积累了新的案例与经验。

A Study on the Similarity between the Three Kingdoms-Themed Murals and Novel Illustrations at Wat PrasoetSutthawat in Thailand Based on Human-ComputerCollaboration: An Update on the Spread of Romance of theThree Kingdoms in Thailand’ s Premodern Period

Lin Ying, Han Yenan, Fang Liang, Wu Hongrun, Yu Fei

Abstract: The 364 Three Kingdoms-themed murals at Wat Prasoet Sutthawat in Bangkok, Thailand, completed in 1838, serve as pivotal evidence of the dissemination of the Chinese novel Romance of the Three Kingdoms in Thailand during the premodern era. These murals frequently include textual annotations, and their compositions are highly similar to the woodblock-printed illustrations from Chinese novels during the Ming-Qing dynasties. This study has compiled a dataset that includes 364 murals and 639 printed illustrations from 16 representative editions of Romance of the Three Kingdoms. A contrastive learning model (SimCLR) was employed to extract image features and generate similarity scores. Integrating computational analysis through contrastive learning with humanities-based interpretation, this research revises our understanding of the novel’s dissemination and reception in Thailand: 1) pushing back the earliest confirmed arrival time of Romance ofthe Three Kingdoms as Chinese texts to Thailand’s premodern period; 2) revealing that the murals show dual influences from both Jiangnan and Jianyang illustrated editions (particularly the Zhou Yuejiao edition), while their captions primarily reference the Mao Zonggang commentary edition. These findings refine studies on the overseas transmission of classical Chinese novels and propose new approaches for traditional image-text analysis and human-computer collaborative mechanisms in cultural heritage preservation.

Keywords:Romance of the Three Kingdoms; Images; Contrastive Learning; Human-Computer Collaboration

编辑 | 韩玉凤

本研究得到国家社科基金后期资助一般项目“古代小说人物研究新论”（20FZWB038）支持。

向上滑动查看注释

[1]准确地说，《三国志演义》指嘉靖年间序刊本《三国志通俗演义》，《三国演义》为清初毛氏父子评改本，本文统称《三国演义》，必要时以“嘉靖本”和“毛评本”加以区分。

[2]中国古代典籍传入东南亚的途径，主要有中国政府赐赠、东南亚人士来华购买及书籍贸易等三种，明清通俗小说传入东南亚的途径主要是后两种。参见潘建国：《古代小说书目简论》，上海：上海古籍出版社，2005年，第76页。

[3]金勇：《形似神异：〈三国演义〉在泰国的古今传播》，北京：北京大学出版社，2018年，第48—79页。

[4]参见黄汉坤：《中国古代小说在泰国的传播与影响》，博士学位论文，浙江大学，2007年，第20页。该书藏于泰国历史最悠久、藏书最宏富的曼谷（塔瓦苏吉）国家图书馆，馆中藏有中国明清两代小说典籍39部。

[5]洪版《三国》诞生在1802年，由昭帕耶帕康（洪）在曼谷王朝一世王（1782—1809在位）授命下主持译成，是最经典的泰译本《三国演义》，见丹隆拉查努帕：《〈三国〉纪事》，曼谷：文学艺术馆，1973年。该书尚无中译本，中文信息译自ชพูลเออื้ชูวงศ.สมเดจฯกรมพระยาดรงราชานภาพตนานสามกก.กรงเทพฯ:บรรณาคาร,2516。笔者按：泰国图书采用佛历纪年，佛历2516年即公元1973年。

[6]如前述洪版《三国》影响强盛所示，泰国的本土语言十分发达，不像古代越南长期使用汉文进行小说创作，可以利用越南汉文小说对中国古代小说的称引来进行研究（参见林莹：《从称引维度探求古代小说在越南的影响——兼谈〈金瓶梅〉在越传播的特殊性》，中国《金瓶梅》研究会（筹）编：《金瓶梅研究》第十三辑，上海：复旦大学出版社，2021年，第364—382页），对泰国来说，间接证据无法从文字中获取。

[7]胡春涛：《泰国曼谷建安宫〈三国演义〉壁画探讨》，《湖北美术学院学报》2019年第4期。笔者按：《增像全图三国演义》为清光绪十四年（1888）上海鸿文书局石印本。而在巴寺壁画绘制的道光十八年（1838），石印技术尚未引入中国，更无可能施用于小说插图（石印技术引入中国后印制的首部插图本小说为光绪八年（1882）《三国演义全图》，详见潘建国：《铅石印刷术与明清通俗小说的近代传播——以上海（1874—1911）为考察中心》，收入氏著《物质技术视阈中的文学景观：近代出版与小说研究》，北京：北京大学出版社，2016年），故对巴寺壁画起到影响的不可能是石印本插图。

[8]“虽然内容是中国的《三国》故事，但壁画布局和画工风格已和泰国当时的其他壁画十分接近了，即将不同情节的内容以山水连携或结构布局的方式串联成一幅鸿篇壁画，绘在大殿的四壁之上，既可以作为一个整体的画卷来欣赏，又可以根据局部提供的经典情节提示以及文字说明分段欣赏。壁画画工精美，色彩艳丽，显见该壁画泰国画匠参与的程度要高一些。壁画中虽然士兵衣物中有‘车’‘兵’‘军’等中文字样，但各部队打出的大旗上却是用仿汉字的花体的泰文写就的‘曹操’‘张辽’‘甘宁’‘周瑜’等字样。此外，在壁画人物的服饰上出现了不少戏服的样式，许多大将脸上画着脸谱，不少士兵的衣着甚至是中国清朝士兵的打扮，战船也是中国南方商船鸡眼船的外观，可见这些形象都是画匠从泰国的中国戏曲和华人移民那里得来的印象。”参见金勇：《形似神异：〈三国演义〉在泰国的古今传播》，第378页。

[9]曼谷王朝拉玛三世在位期间是中泰文化艺术交流的鼎盛时期，佛寺作为泰国文化艺术交流的中心，佛寺内的壁画艺术也进入繁荣时代。泰国的宗教比较包容开放，此时期的寺院壁画内容已经不限于宗教，还包括了历史题材的描绘。因此，三国故事得以进入泰国佛寺。参见郎天咏：《东南亚艺术》，石家庄：河北教育出版社，2003年。

[10]金勇：《形似神异：〈三国演义〉在泰国的古今传播》，第377页。

[11]郑宝获封爵号为“帕巴森瓦尼”，“帕”（Phra,พระ）为爵位，“巴森瓦尼”（Prasoet Vani,ประเสริฐวานี）是其泰文名：“巴森”（Prasoet,ประเสรฐิ）意为崇高，“瓦尼”（Vani,วานิช）通常与商业相关。“巴森苏塔瓦”即郑宝泰文名字中的“巴森”（Prasoet,ประเสรฐิ）加上意为纯洁的“苏塔”（Suttha,สทุธา）和意为寺庙的“瓦”（Wat,วดั）而成。

[12]即中川渝《〈三国志演义〉版本研究》（上海：上海古籍出版社，2010年）分类的二十四卷系统诸本前13卷、二十卷繁本系统诸本和二十卷简本系统诸本前11卷的内容。中川谕划分的版本系统，详见本文第125页注释②。

[13]壁画采用界格分行列排布，用汉字在画面上标注了大量的人名、地名和图题——这是比较典型的中式画面传统形式，中国寺庙壁画和木刻书籍插图都保存有这一画面布局习惯。而窗户众多的泰式寺庙的壁绘多在两窗之间布置图像，且画面汉字题记稀少，即使有题记也为汉字夹杂着泰文，书法稚拙粗糙。因此，巴寺壁画是“比较典型的中式画面传统形式”。参见胡春涛：《泰国曼谷建安宫〈三国演义〉壁画探讨》，《湖北美术学院学报》2019年第4期。

[14]黄汉坤：《中国古代小说在泰国的传播与影响》，博士学位论文，浙江大学，2007年，第61页。

[15]19世纪中叶，泰国开始从封建王权国家向现代国家转型，标志是1855年与英国签订《鲍林条约》，时值曼谷王朝拉玛四世时期。参见金勇：《形似神异：〈三国演义〉在泰国的古今传播》，第180—181页。

[16]壁画与小说版刻插图的联系并不少见。李朝霞在《清代晋东南地区民间神祠壁画研究》（博士学位论文，中国美术学院，2021年）讨论了山西长治大峪村关帝庙万历年间所绘壁画与晚明周曰校本、李卓吾评本《三国演义》插图的相似性，见第104—109页。

[17]初蓬·厄初翁：《三国：巴森苏塔瓦寺佛殿中的壁画艺术》，硕士学位论文，泰国艺术大学，2005年。此论文无中译本，中文信息译自ชูพลเอื้อชูวงศ์.สามก๊กจิตรกรรมฝาผนังในพระอุโบสถวัดประเสริฐสุทธาวาส.มหาวิทยาลัยศิลปากร,2005。

[18]陈柳玲：《泰国拉玛二、三世时期佛教美术中的中国美术影响》，博士学位论文，北京大学，2012年，第103页。

[19]金勇：《形似神异：〈三国演义〉在泰国的古今传播》，第376页。

[20]王少杰：《泰国曼谷王朝壁画刍议——以巴森苏塔瓦寺壁画的中国元素为中心》，《中外艺术研究》2020年第3期。

[21]胡春涛：《泰国曼谷建安宫〈三国演义〉壁画探讨》，《湖北美术学院学报》2019年第4期。

[22]清初艺海堂本《四大奇书第一种》，北京师范大学图书馆藏。

[23]明刊《李卓吾先生批评三国志》，南京图书馆藏，收入《三国志演义古版丛刊续辑》（陈翔华主编，全国图书馆文献缩微复制中心，2005年）第11、12册影印本。

[24]明万历忠正堂本《新锲音释评林演义合相三国志史传》，日本睿山文库藏，收入《三国志演义古版丛刊续辑》第10册影印本。

[25]陈翔华《关于日本藏熊佛贵忠正堂刊本三国志史传》一文亦称，这种（插图）体式，“在《三国志演义》诸明刻本中殊不多见”，见《三国志演义古版丛刊续辑》第10册前言。

[26]涂秀虹：《明代建阳刊小说丰富多彩的插图形式》，中国古代印刷史学术研讨会论文，北京，2018年。

[27]部分壁画信息过少，难以辨认；部分壁画由于年深日久，保存不力，画面侵蚀较多，亦难以辨认。

[28]本文引用嘉靖本，皆据罗贯中：《三国志通俗演义》，上海：上海古籍出版社，1980年。后不出注。

[29]根据中川谕基于文字异同的考证，《三国志演义》可以分为三个系统：一是“二十四卷系统”，包括嘉靖本、夏振宇本、周曰校本、李评本、毛评本等（其中夏振宇本、李评本都继承了周曰校本插入的嘉靖本中不存在的11个故事）；二是“二十卷繁本系统”，包括余象斗本、郑少垣本、杨闽斋等；三是“二十卷简本系统”，包括刘龙田本、朱鼎臣本、杨美生本等。见中川谕：《〈三国志演义〉版本研究》，林妙燕译，上海：上海古籍出版社，2010年，第38页。

[30]李评本主要有吴观明本、绿荫堂本、藜光楼本等，其中最早的是推测为天启年间刊刻的吴观明本，见中川谕：《〈三国志演义〉版本研究》，第67—79页。而吴观明本插图对周曰校本吸收借鉴颇多，“有三分之二左右深受周曰校刊本的影响，其中泰半是构图布景方面的影响”，见胡小梅：《明刊〈三国志演义〉图文关系研究》，博士学位论文，福建师范大学，2015年，第144页。

[31]中川谕指出，李笠翁本“与二十四卷系统诸本中的周曰校本属于同一个系统”，并且在这一系统内部，“相对于周曰校本、夏振宇本……更接近李卓吾评本”。见中川谕：《〈三国志演义〉版本研究》，第145—146页。

[32]参见李小龙：《试论中国古典小说回目与图题之关系》，《文学遗产》2010年第6期。

[33]在建本系统中，叶逢春本刊于嘉靖二十七年（1548），是现存最早的《三国志演义》插图本，也是现存较早的古代小说插图本。

[34]本文引用毛评本皆据罗贯中：《三国演义》，北京：人民文学出版社，2019年。此书底本为大魁堂本。

[35]按：壁画此处排序有误。按小说叙述，当为“孙伯符大战严白虎”在前，“吕奉先辕门射戟”在后。

[36]所谓“文化互化”，简言之，即当一种文化进入到另一种文化，必然涉及母体文化的损失。参见Yolanda Martínez-San Miguel, Ben Sifuentes-Jáuregui, Marisa Belausteguigoitia, Critical Terms in Caribbeanand Latin American Thought: Historical and Institutional Trajectories, New York: Palgrave Macmillan, 2016, p.133。原文为“While acculturation described the assimilation processes into US society, where European, African, and other immigrant populations learned English and assimilated into American society, transculturation addressed the complex processes of exchange—linguistic, economic, racial, gendered, and cultural—involved in these exchanges. For Ortiz, cultural assimilation was not a one-way process that involved one less powerful culture assimilating into a more powerful one, giving bicultural peoples a sense of ‘loss’ as Malinowski’s proposed for US acculturation, but a two- or more way exchange of cultural influences, layering upon each other in complex processes of power, loss, and production”。施坚雅也指出，华人为了融入泰国社会，会向泰人的文化方向过渡，参见施坚雅（G. William Skinner）：《泰国华人社会：历史的分析》，许华等译，厦门：厦门大学出版社，2010年，第137—139页。巴寺壁画因处在泰国宗教文化场域而呈现的变化，正是这一同化过程的一种佐证。

[37]对人工来说，文字转换为图像是一对多的关系，一段文字可以对应多种图像，但对机器学习来说，一一对应更方便学习。前述“吕布戏貂蝉”一处的分析，靠人力可以判断壁画与周曰校本的高度相似性，但对机器来说，二者的相似度计算结果并无绝对压倒性的优势。此处涉及图文关系综合研判，人工的优势大于机器。

[38]前述胡春涛《泰国曼谷建安宫〈三国演义〉壁画探讨》关于建安宫壁画与晚清石印本小说插图关系、李朝霞《清代晋东南地区民间神祠壁画研究》关于山西长治大峪村关帝庙万历年间所绘壁画与晚明版刻小说插图的相似性探究，就是单纯依靠人力的研究，其可信度如何，取决于人工识图习惯、能力以及处理的图像数据规模。当涉及图像计算客观性和数量级的提升时，机器优势大于人工。

点击下方链接，下载原文

如需购买《数字人文》期刊，请扫描下方二维码

封面.jpg

校对 | 肖爽

美编 | 王秀梅

数字使人文更新

●会议通知丨融合与边界：人工智能时代的数字人文发展新进阶

数字人文门户网站：www.dhcn.cn

●概念联觉视角下《周易》的深度数字化文本探勘

概念联觉视角下《周易》的深度数字化文本探勘.pdf

概念联觉视角下《周易》的深度数字化文本探勘

2026年3月11日 10:01

原创阮铭卓靳丽阳等 2026-03-11 10:01 北京

《周易》是我国传统哲学经典之一，其文本所蕴含的哲学思想具有巨大的研究价值。在传统《周易》研究中，由于技术手段的限制，学者们往往依赖主观解读和文献考证，这在一定程度上限制了对文本深层次结构和内在联系的全面理解。

文本分析

阮铭卓 / 清华大学日新书院

靳丽阳 / 清华大学日新书院

彭弋航 / 清华大学日新书院

邱伟云 / 南京大学历史学院暨学衡研究院（通讯作者）

摘要：《周易》是我国传统哲学经典之一，其文本所蕴含的哲学思想具有巨大的研究价值。在传统《周易》研究中，由于技术手段的限制，学者们往往依赖主观解读和文献考证，这在一定程度上限制了对文本深层次结构和内在联系的全面理解。文章通过数字人文技术的应用，特别是语义共现和概念联觉分析，为《周易》研究提供了新的视角。文章通过对《周易》文本进行断词和词频统计，并结合词向量计算，深入探讨了《周易》中的概念如何通过不同感官体验相互关联。研究发现，《周易》文本中的概念不仅在语义上形成了集群，而且在感官体验上也展现出显著的联觉现象。例如，刚柔概念在触觉上的体现，以及君子形象在视觉、听觉和味觉上的多维表现，都为理解《周易》的哲学思想提供了新的维度。文章的研究成果不仅丰富了《周易》文本的语义分析，也为数字人文方法在古典文献研究中的应用提供了有益的探索。

关键词：《周易》数字人文概念联觉

一、前言：从文献考证到数字人文的转变

《周易》作为中国古典哲学的精髓，其深邃的哲学思想和丰富的象征意义一直是学术界研究的热点。历代学者通过文献考证、哲学阐释和历史解读等传统方法，对《周易》的卦象、爻辞进行了深入研究，揭示了其哲学内涵和实践指导意义。

李玮如从《周易》中的“象”概念出发，探讨了易学中“象”“理”“数”三者的重要性和相互关联，尝试通过概念探源和寻找概念之间的联系两种并行的操作方法，从纵向和横向两个维度对“象”这一概念产生更丰富的认识，借以理解《周易》的内在思想。^[1]由于《周易》的文本具有言简意赅的特点，对于其概念的多维度认识尤为重要。胡士颍深入分析了“道”概念的多维度认识及其与其他概念的复杂关系，而王莹则分别论述了“道”与“德”的概念，强调了《周易》在理性思维框架内融合了多种思维方式。^[2]此外，吴根友和李顺连分别对“复”和“神”的概念进行了深入探讨，进一步丰富了对《周易》哲学思想的理解。^[3]

然而，尽管这些研究从概念的深入分析入手，为我们理解《周易》提供了宝贵的视角，但在概念理解的全面性和深度上仍有提升空间。这些传统研究在处理大量文本数据时存在局限性，难以全面把握文本的宏观结构和内在联系。因此在用传统方法开展研究时，只能围绕自己所讨论的一个或几个“中心概念”展开论述，容易忽视其他概念。这一问题可能直接导致对于某一概念的过分解读，或者曲解文本原意。考虑到《周易》文本中各概念并非孤立存在，其内部概念之间的联系非常紧密，因此如果要对《周易》中的哲学内涵有一个全面的认识，就必须从更加宏观的视角看待《周易》中各概念之间的相互联系。要实现上述目标，至少需要解决两个问题：第一，《周易》文本涉及的概念是方方面面的，应确定合适的概念归类与整理标准，且尽可能统摄所有概念，减小因主观选择而带来的理解误差；第二，应选取合适的方法，对《周易》中的这些概念进行分析，在保证科学性的同时，尝试拓展文本的解释空间。

要解决第一个问题，不妨从《周易》的文本特征入手。《周易》作为先秦哲学的集大成之作，其中涉及的许多思想能够集中反映先秦时期的人们对于天道、人事等抽象规律最为朴素的认识，对后世产生了深远影响。《周易》通过将抽象规律客观化，并映射于具象的客观事物中，以进行抽象概念与规律的发微，尽可能准确地传达对某一抽象概念或规律的认识。《泰》：“后以财成天地之道，辅相天地之宜，以左右民。”^[4]这强调了人既要深刻地认识自然，又要主动地协调自然，体现出人与自然之间辩证统一的关系。赵国求指出，人类对于本体的认知首先观察到的是现象，这些现象是外在的、零散的、易变的“感觉表象”。^[5]这表明人类认知自然的起点是感觉，所谓的将抽象概念客观化实际上就是使得本不能轻易被感知或理解的事物或规律变得可感知，进而变得可理解。也就是说，客观化的标准就是能够直接触动人的某些感觉。《周易》中存在着以感官联觉串联起的一群重要概念，这些就是《周易》中重要的基本概念。通过这些基本概念，《周易》触动着人的五种感觉，即视觉、听觉、嗅觉、味觉、触觉，将抽象的哲学思想蕴藏到自然界和日常生活中的具体事物中，从而将人类与自然界与人事的规律联系到一起。这种认识的首要优点是能够更加立体地认识某个概念。例如“风”不仅可以在触觉上与人产生联系，同时可以在视觉、听觉、嗅觉上触动人的感受。当综合这些感受以后，对于这一事物的认识就更加立体、全面，其中的哲学思想也就更加利于发掘和感受。同时，由于不同概念可以触动人的不同感觉，但又无法超出人的五感限制，就人类本身来说，对于事物的认识应该是从五感中共同产生，因此，如果从“联觉”的角度加以分析，不仅可以对概念本身有更深入的认识与理解，同时可以对概念之间的联系进行整体研究。

基于此，本文从“联觉”的角度出发，研究《周易》文本中的联觉现象并探索其应用价值，在《周易》哲学思想的研究思路与模式上举出新例。在传统的研究中，受技术因素的限制和研究者个人情感、经历的干扰，很难在整体上分析《周易》文本各部分内容。然而随着数字人文方法的发展，实现这一目标已经成为可能，且传统文本解读与计算思维的结合为《周易》等古籍研究提供了新的视角和工具。本文将采用数字人文方法，以点带面，深入探讨《周易》中的概念联觉现象。特别是将“触觉”作为重点分析对象，同时关联“味觉”“嗅觉”“听觉”和“视觉”，以期揭示《周易》文本中概念之间的深层次联系和感知模式。

神经学界普遍认为，通感和联觉现象可能共享相似的生理机制。维拉亚努尔·拉马钱德兰（Vilayanur Ramachandran）和爱德华·哈伯德（Edward Hubbard）提出，这两种现象可能都受到大脑中生理联结的调控。^[6]劳伦斯·马克思（Lawrence Marks）进一步指出，通感可以被视为联觉的一种边缘形式，它们反映了人类普遍的感知过程。^[7]然而，语言中的通感现象并非仅由生理联结所驱动。赵青青等人通过对通感系统的分析，提出通感是神经认知活动和语言概念化之间相互作用的结果。^[8]这意味着通感现象虽然以神经活动为基础，但与直接表现的神经活动不完全等同。而且，基于神经与认知科学的研究表明，人类的感知体验可以被语言中的概念所左右。例如，劳伦斯·马克思等人和罗科·周（Rocco Chiou）、安妮娜·里奇（Anina Rich）的研究显示，语言概念能够反向作用于人的感知。^[9]这与我们的推测一致，即联觉现象可能是生理神经活动，还可能涉及抽象概念的认知加工，这种认知加工就是读者端将客观概念产生的感觉转化为对抽象概念的认识的过程，在本研究中反映为对《周易》相关抽象概念的认识与理解。在特殊类型的联觉中，语言概念能够触发味觉体验，如词语味觉联觉（见迈克尔·巴尼西等人的研究），这进一步支持了上述观点。^[10]语言中的通感现象具有重要的跨学科研究价值。深入研究通感与联觉的关系，有助于我们更好地理解人类大脑的神经活动与认知概念化之间的联系。例如，王锳《试论“通感生义”——从“闻”字说起》中提到，“闻”的词义除了可以从听觉转移到嗅觉之外，还可转移到视觉。几种感觉可以互通，也不仅仅限于“闻”字的个别现象。比如“闹”本义是喧闹，但也可以由听觉转移到视觉，比如李商隐的“闹若雨前蚁”中的“闹”字，还可以理解为浓密；“抹”字除了手部动作的“一抹”之意，还能有“用眼一瞥”的意思；“满意”除了一般心理感觉，还能转移到视觉，比如程垓《醉落魄·赋石榴花》：“夏围初结，绿深深处红千叠，杜鹃过尽芳菲歇。只道无春，满意春犹惬。”^[11]这些研究与例证都为概念联觉的研究思路提供了理论基础，而数字人文技术则为概念联觉分析提供了方法支撑。

本文基于前人研究以及通感和概念联觉的方法，对《周易》文本进行分析，试图以一种全新的视角，整体性地研究《周易》夹带的哲学思考和认知结构。通过运用数字人文技术，本文尝试发现计算语言概念如何触发感官体验路径的方法，为《周易》的认知结构和哲学思考提供新的解释路径。这种跨感官的分析视角，有助于我们更深入地理解《周易》文本的丰富性和复杂性，也为数字人文在古典文献研究中的应用提供了新的范例。

二、概念计算与语义分布

首先，我们利用库博语料库分析软件（CORPRO）中自带的概率模型对《周易》文本进行断词，采用的标准语料库是《周易》原文，数据总字数为32,332，按照一爻辞为一个语料段落，将文本分为1,698个语料段落。根据初次的词频统计结果，将标点符号、常见虚词以及无关实词放入停用词表。通过断词和筛选，我们总结出了词频排名前十位的词汇。为了方便宏观统计与观察，我们将类似的相关概念进行了同类词处理。例如在《周易》中，“吉、贞、利”三词各有侧重，“吉”作为占断词可独立成义，“利”后多加行为指导，一般不独立成词，“贞”较为复杂，某些语境下有“占卜”之义。然而在《周易》的具体语境中，三者经常连用或并用，共同指向积极的结果或状态。例如《坤》：“元亨，利牝马之贞。”《需》：“有孚，光亨。贞吉，利涉大川。”《蹇》：“利见大人，贞吉。”吉、贞、利三者不仅共现频率高，而且在语义上也有相通之处，这一点历来为《周易》的解读者所重视。《周易注疏》：“乾元者，始而亨者也。利贞者，性情也。”“以有乾之元德，故能为物之始而亨通也……‘利贞者，性情也’者，所以能利益于物而得正者，由性制于情也。”^[12]“亨”即连始，“贞”又连“利”，亨、利、贞三者皆出于乾元，并为乾始万物之后，生长美善，皆能有利于天下。“元、亨、利、贞”为乾卦四德，本为整体，“吉”是对四者的概括性描述。《周易大传》读法是，“元，善也。亨，美也。利，利物也。贞，正也。天有善、美、利物、贞正之德，故曰：‘《乾》：元，亨，利，贞。’《文言》谓君子亦有此德。”^[13]由此可见，吉、贞、利这三个概念在哲学上均体现了顺应自然规律和道德准则的重要性，它们在卦象和爻辞中常常相互联系，共同构成了《周易》对理想行为和决策的描述，意义相近；且在《周易》文本中的出现频次均非常高，全部排名进前五位，所以我们将这三个词放入同一类分析，以与其他词区分并进行比较。^[14]经过筛选，词频排名前十位的概念分别为吉、贞、利（250+176+141），无咎（140），君子（127），往、来（103+68），终（95），刚（92），万物（90），行（90），得（84），见（77）。^[15]表1显示了词频统计结果。

图1.png 表1 词频统计结果

对表1中数据进行初步观察和分析可知，《周易》对生生不息、新而又新的哲学理念在时间、空间、事物品类三方面都进行了解释，但是由于材料分散，既往的研究很难凭人力寻找到证据进而为这一观点提供有力支撑。然而运用上述使用数字人文计算后得到的客观数据结果，可以尝试给出一种合理的解释。由表1数据可以看出，《周易》中排名第四位的词语是“往、来”，事物的盈虚消长在时间上体现为一个连绵不断的过程，“日往月来”“暑往寒来”是《周易》所描述的时间上生而又生的直接例证。同时，《周易》中排名第七位的词语是“万物”，其代表性的搭配是“万物始”“万物兴”，其意义是世间万物不断地更新与发展，新事物不断从旧事物中兴起和前进，代表了事物在空间和种类上的生生不息，源源不断。《乾》：“大哉乾元，万物资始。”《坤》：“至哉坤元，万物资生，乃顺承天。”根据张学智先生的研究：“天给万物以存在及其性质，地给万物以存在之展开与性质所以发生功效的现实能量。存在及其性质是知，性质之展开及功效为能。这是天地的德与业……万物为杂，乾坤为纯，杂物撰德，各有其能，万能皆发而不害纯之为纯，一分一合，皆自然之事。”^[16]天地是承载万物的场所，也是万物始兴的凭借；故而万物的兴起、发展，都顺应天地的规律，也就是自然规律。《老子》：“无名天地之始，有名万物之母。”《庄子·天地篇》：“天地虽大，其化均也；万物虽多，其治一也。”前者揭示出从混沌到秩序的生成逻辑，后者则对天地万物的“化”与“治”进行补充，形成了一个完整的“本体—运化—治理”框架。《周易》的众多卦象本身即是对“有名”的极致演绎，而又能时刻回归于天地万物，注意到万物作为整体性的存在。《系辞上》：“是故《易》有太极，是生两仪。两仪生四象。四象生八卦。”这描述了从无形本体到有形符号的演化过程，与《老》《庄》所描述的演化逻辑相一致，可见《周易》与《老》《庄》在思想渊源上的共通之处。

从表1中可以看出，无论是表示状态还是动作的词汇，其许多相关搭配显示出了变化的态势及可能性，并强调了应加强自身修养，顺应自然规律。这揭示了某种状态的产生和维持都是有条件的。以表1中词频排名第三的“君子”一词为例，《周易》重视探究君子在变化中的经权定位，强调君子既需要立于常道，以到达“元亨利贞”的境界，又需要在不同环境中随时权变。如果说前者是抽象层面的理想状态，后者常常表现为具体要求。例如，《益》“风雷，益，君子以见善则迁，有过则改”；《既济》“水在火上，既济，君子以思患而豫防之”；《未济》“火在水上，未济，君子以慎辨物居方”。这些关于“君子”的要求彼此有别，但都是针对具体情况下的实际选择，展现了《周易》对君子的内在要求与约束逻辑。《乾》《坤》中对君子提出“自强不息，厚德载物”的要求，开宗明义，是“君子”含义的统摄性表述。下文诸卦中所展现的君子的不同状态，是不同情境下的具体选择。二者相互联系，更加明确了《周易》中“君子”的形象解释。

这样的文本探勘结果还有助于整体性地认识处于一对矛盾中的词汇。《周易》中提到了许多反义词，各组反义词侧重于不同方面。根据计算结果，刚（柔）排名第六位，词频非常高，说明关于这对矛盾词组的处理是《周易》对阴阳和谐思想的阐发的重要体现。《睽》“二女同居，其志不同行。说而丽乎明，柔进而上行，得中而应乎刚，是以小事吉”；《解》“刚柔之际，义无咎也”，表现了刚与柔和谐统一的状态。《损》“损刚益柔有时，损益盈虚，与时偕行”，这体现出刚与柔的变化消长也随时而动，矛盾的偏向性不是一成不变的。类似地，《升》“柔以时升，巽而顺，刚中而应，是以大亨”；《兑》“刚中而柔外，说以利贞，是以顺乎天而应乎人”；《涣》“刚来而不穷，柔得位乎外而上同”；《中孚》“柔在内而刚得中，说而巽孚，乃化邦也”，可见刚柔是事物的内在特性，事物本身即具有矛盾性。《周易》善于通过刚柔之交、刚柔之际等描述将抽象的哲学思想具象化，代表了万物相通和相互转换的重要视角。

图2.png 图1 热力图

但是，仅凭这样分析依旧不够直观，不能很好地将计算结果与原文进行联系。基于此，我们课题组又使用ChartCool制作了热力图（图1），用以表征这些词汇的词频随卦象的分布情况，横坐标是表1中词频统计排名前十位的词汇，纵坐标是64卦，颜色越深代表该词在这一卦中的词频越高。在此图中，64卦的排序我们选择按照《周易》原文的叙述顺序进行排列（由下至上为：乾、坤、屯、蒙、需、讼、师……），观察热力图，可以得出更多结论。

按这样《序卦传》所编排的相传已久的卦序，可以将《周易》分为上、下两部分，上经三十卦，下经三十四卦。^[17]孔颖达《周易正义》提出《周易》分上、下两篇，以象阴阳。^[18]《二程集》中记载了关于上、下经的另一则论述。刘牧曾提出上经主要叙述的是“形器以上事”，是“天地生万物”，相对应的下经主要是“形器以下事”“男女生万物”。这一说法将孔说延伸至上经主要与天道相关，下经主要与人道相关，其论更加具体。程颐随即提出反驳，认为“男女所生”即“天地所生”，二者没有区别。^[19]然而，刘说却为我们提供了《周易》的一种可供讨论的结构化叙事模式。依照上、下经的分割方法，词语的分布位置就能够标明其意义指向。例如“往、来”主要分布在下经部分，那么可以初步推断这个词体现在《周易》对于人事发展的指导上。《蹇》“山上有水，蹇，君子以反身修德”，《兑》“说以利贞，是以顺乎天而应乎人”，这些卦辞与爻辞所显示的结果都体现着对人的行为的引导。

但是，我们可以发现，“君子”一词主要分布在上经部分，也就是多与谈宇宙的基本结构和变化规律的“天道”部分相关。然而在一般性认知中，《周易》中与君子有关的叙述多是在具体环境下对君子的行为要求，与谈人类社会的具体事务和行为规范的“人道”关联性更加密切。通过数字人文技术打开的这一认知缝隙，启发了我们通过结构分布式意义的视角，重新审视君子在上、下经中的分布与描述，进一步思考君子的概念意涵。当我们特别关注上经中的君子论述时可见，如《乾》“天行健，君子以自强不息”，《坤》“地势坤，君子以厚德载物”，这两句作为《周易》中有关君子形象的流传最广、影响最大的两句话，在《周易》的开端即对君子提出了纲领性的要求。其中的“厚德载物”与“自强不息”分别对君子的“德”与“行”进行了规定。在这个基础上，考察《周易》中其他关于君子的描述，可以发现实际上是在“自强不息”与“厚德载物”的规定下，提出的对君子更为具体的要求。这里试举几例：

《讼》：“君子以作事谋始。”

《师》：“君子以容民畜众。”

《履》：“君子以辨上下，定民志。”

《否》：“君子以俭德辟难，不可荣以禄。”

《颐》：“君子以慎言语，节饮食。”

《既济》：“君子以思患而豫防之。”

《小过》：“君子以行过乎恭，丧过乎哀，用过乎俭。”

由此产生的问题是，既然这些表述大都描述了对于君子的思想与行为规范要求，那么“君子”这一概-念理应更贴近于“人道”，为什么会在以描述“天道”为主的上经中集中出现呢？赵爽已经注意到，“《易经》对天的认识已经实现由感性到理性的飞跃”。^[20]这一飞跃导致的直接结果，就是将对于“天道”的感性认知转化为理性实践。即将较虚的“天道”外在化，表现为具体的行为，就是融入卦辞和爻辞中。通过计算结果，我们可以寻找到《周易》对于君子的核心要求，即行为顺应天道。证以《大有》“君子以遏恶扬善，顺天休命”，“顺天”即《周易》对君子的核心要求。通过概念计算所产生的对君子应规范行为以顺应天道的这一认识，与既往一般自明性地以为与人道更为相关的认识不同，完善了我们对于《周易》中“君子”这一概念的全面认知。

综上可见，数字人文技术在《周易》研究中揭示的新现象具有重要意义。首先，它通过词频统计和分布分析，使我们认识到“君子”一词在上经中的集中分布，这与“君子、人道存在紧密联系”这一宋明之后的认知似乎不同，引导我们重新思考君子行为与天道顺应的关系。然而，经过深入分析我们可以发现，这二者在深层是统一的，共同揭示了《周易》对“君子”的独到理解。这样的认识引领我们对此概念进行更为深入的思考。其次，“往、来”一词在《周易》下经的频繁出现，突出了其在人事发展中的重要性。这一现象为我们提供了一个新的视角，帮助我们更深入地理解《周易》在时间维度上如何阐释变化与连续性的哲学概念。它揭示了《周易》不仅关注事物的动态发展，也强调了在变化中寻找恒常与秩序的重要性。这些通过数字人文视角而得出的新发现，着实丰富并加深了我们对《周易》文本与思想的理解，为我们揭示了数字人文带来的方法与视角，在传统概念研究与古籍文本探勘中的巨大潜在效用。

三、概念共现与联觉分析

联觉是指一种感官刺激能够触发另一种感官体验的现象，它在认知科学和心理学中是一个重要的研究领域。传统研究中，《周易》的概念研究多依赖于学者的直观感受和个人经验，这在一定程度上限制了对文本深层次结构和概念内在联系的全面理解。在《周易》的文本中，概念之间存在一种不同感官体验之间相互隐喻和象征的关系，这种联觉特性为理解《周易》中的概念关系提供了重要线索。尽管一些本身就容易引发多重感官体验的概念能够被研究者发掘，但多数更深层更隐含的联觉现象却常常被忽略，而这些现象恰恰可能揭示《周易》概念之间更为复杂和微妙的内在联系。

在自然语言处理技术中，词嵌入（word embedding）是一种将词汇映射到向量空间的方法，每个词汇都与该空间中的一个点相关联。这种表示方式能够捕捉词汇之间的语义相似性，因为语义相近的词汇在向量空间中会呈现出相近的分布。^[21]例如，“国王”和“女王”在向量空间中的距离会比“国王”和“桌子”更近，因为它们在语义上更为相似。这种方法在语义相似度计算、词义消歧等任务中得到了广泛应用，为文本分析提供了新的工具和视角。^[22]通过词嵌入技术，我们可以更深入地挖掘《周易》文本中概念之间的语义关联，尤其是那些隐含的、跨感官的联觉现象，从而为理解《周易》的哲学思想和认知结构提供新的解释路径。本节在方法上，主要基于Word2Vec模型进行词向量计算，以期从其他视角捕捉《周易》感官概念之间的语义关系及其相似性，并通过相似性分析帮助发掘和思考概念之间直观感受下潜藏的联系，以探索《周易》文本中隐含的感知模式和认知结构。^[23]

在文本准备与预处理环节，团队选取了《周易》的完整文本作为研究对象，并选用黄寿祺、张善文执笔，上海古籍出版社于2018年出版的新修订版《周易译注》作为参考。由于库博语料库分析软件自带的概率模型在执行断词任务时容易过度断词，例如将“明出地上”断为“明/出/地上”，这样就失去了词的整体性意义，不能进一步与五感对应。因此，团队采用了可调整性与可训练性更强的jieba分词工具^[24]进行分词处理，为了消除jieba分词带来的歧义，保证分析的准确性，团队手动对文本进行了去除无关符号、标点和格式化错误等处理，最终形成了自己的语料库。

分词结果交由Word2Vec实现词向量构造。Word2Vec是自然语言处理Gensim库提供的一种用于生成词向量的模型，它通过神经网络技术将词语映射到一个低维的连续向量空间中。这个模型能够捕捉词语之间的语义关系，使得语义上相近的词在向量空间中也相近。词向量的构造表现为：

图3.png

收集并预处理《周易》文本数据，形成分词结果，将这些文本数据作为训练Word2Vec模型的数据底本。在训练过程中，模型学习每个词的向量表示，这些向量能够反映词之间的语义关系。“向量提取”意为：训练完成后，从模型中提取特定词（如“易经”）的向量表示。

在这里，团队利用《周易》原文文本作为数据底本。考虑到《周易》中的词汇此前未必包含在jieba词库中，团队首先利用jieba库的新词识别模式（HMM，隐马尔可夫模型）实现词汇列表构造，从而为Word2Vec的训练提供标准化接口“句子”，该“句子”并非自然语言，而是一个分别包含100个词汇的词组分划列表。然后使用Gensim库中的Word2Vec类训练词向量模型，并将模型保存。例如，我们通过将“易经”一词作为键值对匹配，实现了由自然语言词汇到数学向量的映射，如图2所示。

图4.png 图2 《易经》的词向量

Word2Vec主要包括CBOW（Continuous Bag of Words）和Skip-Gram两种模型架构。在实现上，Word2Vec模型通过训练大量文本数据，学习到每个词的向量表示。它的局限性之一在于需要大量的语料库进行训练，无法直接处理未见过的词语。此外，Word2Vec是一种静态的方式，虽然通用性强，但是无法针对特定任务做动态优化。因此，在实际应用中，可以使用Gensim库对其进行训练。Gensim是一个专门针对自然语言处理的高效Python库，内置了Word2Vec模型的实现。团队将已形成的语料库导入Gensim库，并使用能够提供更丰富语义信息的Skip-Gram模型对其进行训练，以得到更适合本次研究的模型。

通过人工阅读和理解，并借助大语言模型提供的分类标准，^[25]团队分工进行了概念的挑选与归类，选取了与五感概念语义相近的词语，作为标定的典型词汇。^[26]接着利用这些标定的典型词汇，进一步手动选取与这些概念语义相近的其他词语；通过计算这些词语与典型词汇之间的词向量相似度，挑选出相似度最高的词语进行增广，形成增广列表。由于《周易》文本包含古汉语词汇，这些词汇可能无法被常用的分词工具（如jieba）准确识别。这导致一些手动挑选的词汇在自动分词结果中没有出现。为了解决这个问题，团队对分词结果进行了手动调整。例如，将一些长词汇拆分成更短的词汇，以便更好地适应分词工具的识别能力。

图5.png 表2 典型词汇表^{[27][28][29][30][31][32]}

最后，为了更直观地展示词向量分类结果，我们采用了非监督学习算法T-SNE对词向量进行二维可视化处理。首先，团队分别为五感（视觉、听觉、嗅觉、味觉、触觉）选取若干词汇作为分类锚点，然后利用词向量欧式距离差异分别为每个词找出最近的十个词汇，比如针对“嗅觉”我们先手动选取了“风、草木、泽、巽”四个词汇，然后利用词向量模型对每个词都找出十个最接近的词，并将它们和锚定词汇聚类在一起，作为最终“嗅觉”类别的词汇。接着，利用T-SNE算法对所有词汇进行可视化，训练所用向量的大小为3,320×100。

图6.png 图3 五感（视觉、听觉、嗅觉、味觉、触觉）词向量可视化

上述分类在T-SNE分类图中用不同的颜色标注出来，结果如图3所示。将图3中的五感（视觉、听觉、嗅觉、味觉、触觉）相关的词汇进行分离，可以得到如图4至图8所示的五感相关的向量图。

图7.png 图4 视觉词向量可视化

图8.png 图5 听觉词向量可视化

图9.png 图6 嗅觉词向量可视化

图10.png 图7 味觉词向量可视化

图11.png 图8 触觉词向量可视化

根据图中的词向量可视化结果，可以看到五感相关的概念在向量空间中形成了特定的集群。这些集群在二维可视化图像中主要集中在图像右侧的“尾巴”区域，显示出它们之间在语义和词频等多个维度上具有强关联性。进一步分析这些感官概念的分布特征，可以看出视觉概念在向量空间中的分布最为广泛，其词向量在图中呈现出较大的扩散范围。这表明在阅读和理解《周易》的过程中，视觉元素在感官体验中占据了主导地位，文本中涉及了大量的视觉描述或视觉相关的隐喻。相比之下，听觉、嗅觉、味觉和触觉的概念则相对较为集中，它们在图中的分布范围较小。特别是味觉和嗅觉相关的词汇，在图中的分布被隐藏得尤为明显。这说明这些感官元素在文本中可能不如视觉元素那样频繁出现，或者它们的描述更加隐晦，需要更加细致地分析才能被充分识别。

特别地，根据上文语义共现探勘的结果，刚（柔）在文本中的出现频率排名第六，词频非常高，同时“刚”与“柔”等概念又与触觉紧密相关，这让我们看到了触觉相关的概念在《周易》体系中也占有一席之地，从触觉的角度描述和阐释思想是分析《周易》的一种新的思路。《周易》强调阴阳平衡，并尝试从各个角度对这一对辩证概念进行解释，刚与柔正是其中的一例。从直观上来讲，触觉体验中刚柔的平衡十分重要，过刚或过柔的触感都会使人不适，而适度原则才能带来舒适自如的感受。更进一步来说，刚柔影响和象征着人的心理状态：刚强使人感到振奋和鼓舞，柔和则常与安慰和放松的感受关联，但过刚或过柔都不是相宜的处世心态。然而人们的处世心态常常为环境所影响，因此还需要积极调整以达到一种和谐、稳定的状态，这与《周易》中刚柔相生相克、变化无常的思想相契合。正是在阴阳、刚柔等概念相调和与相转化的谱系中，两端概念的不同比重导向了不同的卦象。比如《大过》“刚过而中”，中立调和下凸显了“刚”的特征，阳刚过甚时能够中立调和，不至于过刚易折，方能“利有攸往”，尽管去行动；再如《随》“刚来而下柔，动而说”，阳刚者位于阴柔之下，便于行随从之事，既体现了一种因势利导的调和取向，还蕴含着守持正固的不移心智。说明《周易》正是通过每个人都具备的触觉意识，将刚柔思想潜移默化于读者的潜意识中。

通过概念联觉分析，我们还可以多元化地认识理解文本中的经典概念。如前文分析，《周易》中多处内容都体现着对“君子”的期待与要求；而在将天道的现象外化为行动准则时，联觉现象就发挥着重要的作用。

根据词向量计算结果，“君子”概念与视觉、听觉、味觉、触觉都有关联，与嗅觉的关联性却不甚明确。视觉方面，君子可以被理解为具有远见卓识，能够洞察事物的本质，不局限于细枝末节和表面现象。如《观》的爻辞，通过比较“童观”“窥观”与“观我生”“观国之光”“观其生”，说明不同的观察视角反映了身份与眼界的高低，并且及时省察自我和他人行为的做法可以成就君子感悟成人之道。

在触觉方面，君子之行可以解读为对事物的敏感和细腻，能够通过触觉来感知和理解外界，体现出对关键细节的关注。在《周易》“解”卦中，“解而拇”的意象出现在九四爻辞：“解而拇，朋至斯孚。”按《周易译注》，“解而拇”意为“像舒解你脚拇指的隐患一样摆脱小人的纠附”，从而收获“朋至斯孚”的结果。^[33]这一概念巧妙利用触觉感知的比喻，描绘出摆脱小人纠附后心理的自由和放松，侧面表现出了触觉在概念客观化认知中发挥的重要作用，体现了从触觉出发的深层认知。

在听觉方面，君子的品德体现在他们对声音的敏感度和分辨能力上，这不仅仅是对声音的简单接收，更是一种对信息的深度理解和判断力。君子善于倾听，能够从各种声音中辨别出规律与秩序，并衍生出深刻的思想，这种能力象征着他们对周遭世界的深刻洞察。《恒》：“雷风，恒。君子以立不易方。”君子长期通过耳朵接收声音，总结出一种声音规律秩序，亦即雷声震动，风声随之而起，并从这样的声音秩序中，体悟雷风之声相互作用和相互依存的关系是恒久不变的。这里的雷声象征着力量和警醒，而风则代表着迅速和传播。君子从雷风之声相随而起的自然现象中领悟到一种恒久不变的秩序，故得出应当坚守自己的立场和原则，不随外界的变化而轻易改变的思想。因此，君子的听觉品德不仅体现在对声音的敏感和分辨上，更体现在通过倾听自然现象中的规律与秩序，维护内心的恒定和平静，并在复杂多变的环境中始终坚守原则与方向的能力。这种能力使君子能够在纷繁复杂的世界中保持清醒的头脑和坚定的信念，正如雷风之声的恒久不变，君子亦能在变化中寻得恒常。

在味觉方面，“君子”的多元特性被揭示得更为明显。观察图7和图8，发现味觉相关的图像与触觉相关的图像词汇分布相较于其他感官图像词汇分布形态更为相似，可推论二者之间可能存在某种较强的关联性。这种关联的存在可以丰富人们对同一事物的认知，进而实现“联觉”的效果。例如《噬嗑》“噬干胏，得金矢，利艰贞，吉”，此处“噬干胏”描述了咬食带骨头的干肉这一种艰难的状态，随后“得金矢”是指“具备金质箭矢似的刚直气魄”，告诫君子应于艰难中守正，最终会得到好的结果。^[34]“噬干胏”当然会使人直接联想到给触觉带来的不快体验，然而如果再联想到味觉也同时被触动，可以更加感同身受那种艰难的感觉，也更能体现出于艰难中守正的不易与可贵。《井》：“井洌，寒泉食。”井水清洌可食，喻示君子应像清澈的井水一样，源源不断地给人们带来益处。这里除了将井水给人以清新凉爽之感的触觉与井水清洁、清凉，适合饮用的味觉纳入认知体系外，视觉上的井水清澈见底，清洁透明的“清洌”也是重要的方面。从多个感觉对“井水”这一事物进行修饰，可以使这一客观物象与人的主观感受联系更为紧密，因而强化了“寒泉食”与“君子阳刚中正”这两种表述之间的关联性，通过联觉达到主客观相通的效果。

计算结果并没有直接将君子与嗅觉联系起来，或许有以下原因。一则，君子在嗅觉体验中可能象征着的、对美好气味的欣赏和对恶臭的警觉，与味觉方面用味道象征善恶美丑的逻辑相似，因而被包含在味觉的联系之下，嗅觉方面的联系被隐藏；二则，对嗅觉的感触也可以解读为君子对环境和氛围的敏感，这种直觉性的感受包含着多重感官体验，本身就难以划分，嗅觉在其中发挥的作用更加难以发掘。嗅觉在《周易》中不具备独立性，被含摄于其他感觉之中，与其他感觉一起发挥作用，增强人对同一客观事物的认识与理解。这与《楚辞》等古籍对于嗅觉的应用不太一样。《楚辞》中多有“香草美人”的隐喻，建立嗅觉与主观感受的强关联。未来可从“感官人类学”（Sensory Anthropology）的角度出发，更聚焦地探讨嗅觉在《周易》中君子论述时缺位的深刻原因。^[35]

多重感官体验的构筑之下，抽象的概念得以外化并与君子形象联系起来，使得周人心目中的道德化身有了现实追求的可能。本节通过Word2Vec模型和联觉分析，深入探讨了《周易》中的概念和感官体验，尽管传统研究依赖直观感受，但联觉现象揭示了文本中更深层次的结构和内在联系。《周易》中的五感概念集中展现了阴阳平衡和对生活品质的追求。通过T-SNE算法的可视化，研究进一步分析了概念在向量空间中的分布，并结合概念计算结果，揭示了文本中的深层次结构特征：视觉和触觉概念在文本中占据了显著的地位，相比之下，味觉和嗅觉的提及则较为稀少。这种感官分布的不均衡，反映了《周易》对视觉和触觉的重视。从人类学的视角来看，视觉与触觉在《周易》中的显著性，与人类早期生存环境和感官体验的依赖有关。在早期社会，视觉和触觉是获取环境信息和进行物理互动的关键感官，视觉对于识别环境、寻找食物、避免危险至关重要，而触觉则与物体的直接接触和操作相关，对于制作工具、建造住所等生存活动发挥着核心作用。与《周易》中这种感官分布的特性类似，在西方宗教实践中，视觉与触觉依然常常得到强化。以基督教的传播为例，其最重要的两种传播媒介——语言文字与艺术的方式（绘画、诗歌、建筑等），都是以视觉为基础的。郑伟指出：“对于基督宗教传播来说，视觉媒介是教义传播过程中的一个环节，是物质性的载体结合视觉观看来传递精神性的力量。在基督宗教传播中通过视觉的方式传递关于上帝的信息，自古以来一直具有公认的必要性。”[36]同时，触觉体验也被纳入到许多宗教传统之中，“宗教接触”因而成为宗教传播与实践中相当重要的部分。例如在基督教的洗礼中，受洗者通过水的触摸来洗净原罪和完成重生；在伊斯兰的朝觐中，信徒们会围绕天房（Ka’aba）行走，并亲吻或触摸黑石以表达敬意。加拿大学者康斯坦丝·克拉森（Constance Classen）指出，触觉在西方文明的形成期具有广泛的社会性和宗教中心性，并且有关触觉的各种集体实践和信念长期持存。[37]而嗅觉和味觉虽然在宗教仪式中也有重要应用（例如香料和香油的使用），但与视觉和触觉的实践效果与方式相比，嗅觉与味觉实践并不是主要的感官焦点。这与《周易》中所体现的感官分布特性不谋而合，或许从哲学、宗教、文化层面上反映了更高层次的人类对于自然世界与社会的原初认识。这种感官分布的特性，不仅向我们展示了《周易》对感官体验与心理状态关联的深刻洞察，也体现了对人类认知的全面把握。它甚至激发我们去探索那些过去未曾深思的内在意涵。通过数字技术揭示的《周易》中隐藏的内在五感结构，为我们提供了理解这部古典文献的新视角，并展现了数字人文方法在探索古代文本中的潜力。

四、研究未来展望和局限性

本研究成果为《周易》文本的语义和感官体验分析提供了新的视角和方法，不仅加深了我们对《周易》文本涉及的概念与整体结构的理解，也为传统哲学思想的现代诠释提供了新的证据和思路，有助于深化我们对古代智慧的认识，并促进其在当代社会的应用与发展。特别地，通过数字人文方法的应用与对实验结果的分析，我们可以重新审视从前的研究成果，并针对相关问题展开进一步的讨论。例如前文提到，学者不断提出自己话语体系下的《周易》中的核心概念，并纷纷给出了解释。基于本文的讨论，我们知道《周易》是通过将抽象概念（包含哲学理念、感性思维等）客观化的手段，来构建其哲学体系并向读者传达关于自然、人道等事物或规律的认识。这一手段实际上是努力在这些概念与人的五感之间建立联系，以使得客观化成为可能。那么，如果要判定一个概念是不是《周易》中的核心概念，它至少应具备如下的必要条件，即这个概念必须能够与五感发生强联系。否则这个概念就不能够很好地向读者呈现《周易》中的哲学体系与哲学思想，也就是没有充分被“感知”，自然也就不具备成为《周易》中核心概念的条件了。举例来说，我们计算了“道”“德”“神”三个概念在五感向量图中的位置，结果如图9。

图12.png 图9 “道”“德”“神”三个概念在五感向量图中的位置

可以看出，“道”与“神”两个概念在向量空间中的位置更加接近“尾巴”处，也就是更加接近五感相关的词汇相对集中的区域，具备成为《周易》中核心概念的可能性，可以进一步讨论研究。相比之下，“德”所在位置五感词汇的分布较稀疏，表示在本研究的模型与参数条件下，该概念不太容易与五感相关的词汇发生联系，因此可能较难实现概念具身五感联觉的客观化呈现。基于这样的实验结果与分析，可以进一步加深学界对于《周易》相关问题的探讨。

然而，本研究作为利用数字人文技术与概念联觉视角对古籍进行深度探勘的初期探索与尝试，仍存在一定的局限性，现简述如下。

首先，尽管数字人文技术的应用提高了分析的效率和深度，但算法和模型的选择可能会影响最终的分析结果。例如，jieba分词工具在处理古汉语文本时可能存在一定的局限性。这种局限性的产生，一方面来自技术本身，另外一方面来自人工制定的分类标准不够细化。在以后的研究中，应进行分类标准的再提升，同时加以人工二次检验，以适应《周易》等古典文献的特点。

其次，本研究以《周易》中的高频词汇和五感概念为主要研究方向，但对文中其他词汇、概念的深入剖析仍需加强。本文所关注的还是对于同一概念的联觉解释，有关于这种联觉解释其他的可能贡献，本文在许多地方并没有深入剖析，随着其他研究的深入与联觉研究文本的增多，联觉可解释和研究的空间将可能进一步扩大。未来的研究可以延伸到不同文化、哲学背景下的更多词汇和概念以及它们的语义演变等方面，也可以进行更多文本的研究。由于联觉分析是一种新兴的研究方法，在《周易》文本中的应用目前还处于探索阶段，今后可以对联觉现象在《周易》中的表现形式和认知机制进行进一步探讨，以及将联觉分析与其他文本分析方法相结合，从而获得更全面、更深入的认识和理解。

最后，本研究的可视化结果虽然提供了直观的展示，但在解释和应用这些结果时仍需谨慎。概念联觉分析依赖于机器对大量文本的处理与计算，同时也依赖人的主观感受。机器能力的边界或许还难以确定，在此课题中，机器更多的功能是为我们提供一种新的视角与观点，我们筛选其中有启发性的部分，并以此出发进行“由果及因”的探讨，以获得更多发现。对于今后的研究而言，可以探索更多的可视化技术，并积极尝试应用最新的计算方法与处理工具，以便更准确地反映《周易》文本的复杂性和丰富性。同时，也需要更多的实证研究来验证本研究的假设和结论，以推动《周易》文本研究的进一步发展。

本研究尽管存在一定的局限性，但确实为《周易》文本的语义和感官体验分析提供了新的视角和方法，具有开拓性意义。通过数字人文技术与认知科学的交叉应用，本研究不仅提高了对《周易》文本分析的效率和深度，也为后续研究奠定了坚实的基础。未来，随着技术的不断进步和方法的持续完善，我们有理由相信，对《周易》乃至更多古典文献的深入挖掘将展现出更加丰富和精准的学术图景。此外，本研究在可视化展示方面的尝试，也为后续探索更多维度的文本分析提供了经验和启发。随着更多学者的加入和实证研究的积累，将不断推动《周易》文本研究向更深层次发展，为理解人类文化遗产贡献新的洞见。

Exploring the Deep Digital Text of Zhou Yi from thePerspective of Conceptual Synaesthesia

Ruan Mingzhuo, Jin Liyang, Peng Yihang, Qiu Weiyun

Abstract:Zhou Yi is one of the classics of traditional Chinese philosophy, and the philosophical ideas embedded in its text hold significant research value. In traditional studies of Zhou Yi, limitations in technical means have led scholars to rely heavily on subjective interpretation and philological examination, which to some extent restricts a comprehensive understanding of the text’s deeper structures and internal connections. By applying digital humanities methods, particularly semantic co-occurrence and conceptual synesthesia analysis, this study oﬀers a new perspective on Zhou Yi. The article explores in depth how concepts in Zhou Yi are interrelated through different sensory experiences by analyzing word segmentation and frequency statistics, and combining word vector calculations. The results reveal that the concepts in Zhou Yi not only form semantic clusters but also exhibit notable synesthetic phenomena in sensory perception. For example, the concept pair “rigid–soft” is embodied in tactile perception, and the image of the “gentleman” manifests multidimensionally across visual, auditory, and gustatory experiences. These findings enrich the semantic analysis of Zhou Yi and provide valuable insights into the application of digital humanities methods in classical text studies.

Keywords:Zhou Yi; Digital Humanities; Conceptual Synesthesia

编辑 | 韩玉凤

向上滑动查看注释

[1]李玮如：《〈周易·系辞传〉“象”概念初探》，《周易研究》1998年第4期。

[2]胡士颍：《关于〈周易正义〉“道”概念的理解与辨析》，《佳木斯教育学院学报》2010年第2期；王莹：《关于〈周易〉经文“道”“德”概念的思考》，《周易研究》2003年第2期。

[3]吴根友：《〈周易〉、〈老子〉中“复”的概念与观念及其美学意义》，《周易研究》2013年第3期；李顺连：《论〈周易〉中的“神”概念》，《中南民族大学学报（人文社会科学版）》2003年第5期。

[4]阮元校刻：《十三经注疏·周易正义》，北京：中华书局，2009年，第55页。下文所引《周易》文本均源自此书，不再单独标明。

[5]赵国求：《相互作用原理及人类认知自然的三种进路》，《武汉理工大学学报（社会科学版）》2008年第1期。

[6]Vilayanur Ramachandran, Edward Michael Hubbard, “Synaesthesia-A Window into Perception, Thought and Language,” Journal of Consciousness Studies, vol. 8, no. 12, 2001.

[7]Jennifer M. Brewer et al.,“Identification of Gustatory-Olfactory Flavor Mixtures: Effects of Linguistic Labelling,” Chemical senses, vol. 38, no.4, 2013, pp. 305-313.

[8]Qingqing Zhao, Churen Huang, and Yunfei Long, “Synaesthesia in Chinese: A Corpus-Based Study on Gustatory Adjectives in Mandarin,” Linguistics, vol. 56, no.5, 2018, pp. 1167-1194.

[9]Rocco Chiou, Anina N. Rich, “The Role of Conceptual Knowledge in Understanding Synesthesia: Evaluating Contemporary Findings from a ‘Hub-and-Spokes’ Perspective,” Frontiers in Psychology, vol.5, 2014.

[10]Michael J.Banissy, Clare Jonas, and Roi Cohen Kadosh, “Synesthesia: An Introduction,” Frontiers inPsychology, vol.5, 2014.

[11]王锳：《试论“通感生义”——从“闻”字说起》，《语言教学与研究》1997年第4期。

[12]王弼、韩康伯注，孔颖达疏，于天宝点校：《宋本周易注疏》，北京：中华书局，2018年，第31—32页。

[13]高亨：《周易大传今注》，《高亨著作集林》第二卷，北京：清华大学出版社，2004年，第58页。

[14]可能有人认为“吉”“贞”“利”在《周易》语境中具有不同的本义与功能：“吉”为独立占断辞，“利”多附行为指导且较少独立使用，“贞”含占卜本义且表达形式复杂（如“利某某之贞”“贞吉”等），三者并非同一分类标准下的概念，不宜径直归入同一类分析。对此，本研究的分类逻辑需进一步说明：本文分类标准以“主题相关性”和“语义层次适配性”为核心——三者虽功能有别，但均深度嵌入占断逻辑，共现频率高且后世解读（如《周易注疏》《周易大传》）常强调其内在关联，构成“吉凶判断体系”的有机组成部分。这种分类选择是基于当前研究颗粒度的操作化处理：若强行分离，反而会与“无咎”等涉及更宽泛时空领域的概念形成分类层次的失衡。当然，若将本义差异的“吉”“贞”“利”分开计算，亦当具有重要学术价值，未来或可结合占断辞的功能差异（如占断辞、行为指导、占卜本义）进一步细化分类标准，开展更精细化的研究。

[15]概念之后的括号中的数字代表此概念的频数，多个数字相加代表每一个概念分别的频数。例如“吉、贞、利（250+176+141）”代表吉、贞、利三个概念的频数分别为250、176、141。

[16]张学智：《王夫之“乾坤并建”的诠释面向——以〈周易外传〉为中心》，《复旦学报（社会科学版）》2012年第4期。

[17]黄寿祺、张善文：《周易译注》，上海：上海古籍出版社，2018年，第7页。按照上、下经编排《周易》六十四卦，应为传统编排次序。但是，长沙马王堆出土的《帛书周易》卦序与通行本不同，卦名亦多相异。其六十四卦编次规律，是以上卦为纲，分为八组；各组又以下卦为目。（转引自本书第30页注释）这种编次方式与本文无关，此处不详加赘述，然而或可作为一种新的分类依据加以研究。

[18]《十三经注疏·周易正义》，第18页。

[19]程颢、程颐著，王孝渔点校：《二程集》，《遗书》卷18《伊川先生语四》，北京：中华书局，2004年，第223页。

[20]赵爽：《先秦儒家天道观研究》，博士学位论文，山东大学，2023年，第21页。

[21]Yoshua Bengio et al., “A Neural Probabilistic Language Model,” Journal of Machine Learning Research, no.2, 2003, pp. 1137-1155.

[22]Bin Wang et al., “Evaluating Word Embedding Models: Methods and Experimental Results,” APSIPATransactions on Signal and Information Processing, no.e19, 2019.

[23]研究者曾比较过几个不同的词嵌入模型，如Word2vec SGNS、CBOW、GloVe、FastText、Ngram2Vec、Dictvec，评测结果以Word2vec SGNS整体表现最好，虽然它可能不是每项任务的最佳方法，但在任何情况下都不会表现得太差。参见B. Schmidt, “Vector Space Models for the Digital Humanities,” http://bookworm.benschmidt.org/posts/2015-10-25-Word-Embeddings.html, accessed on April 12, 2025.

[24]https://github.com/fxsjy/jieba.

[25]分类标准如下：

视觉：描述颜色、光线、形状、运动或任何视觉现象的文本；使用视觉隐喻或象征，如“明”与“暗”、“升”与“降”；涉及观察或看见的动作，如“观”“见”。

听觉：描述声音、音乐、噪声或任何听觉现象的文本；使用听觉隐喻或象征，如“雷”“风”；涉及听或听见的动作，如“听”“闻”。

嗅觉：描述气味、香气或任何嗅觉现象的文本；使用嗅觉隐喻或象征，如“香”“臭”；涉及闻或嗅的动作，如“嗅”“闻”。

味觉：描述味道、食物或任何味觉现象的文本；使用味觉隐喻或象征，如“甘”“苦”；涉及品尝的动作，如“尝”“味”。

触觉：描述触感、温度、压力或任何触觉现象的文本；使用触觉隐喻或象征，如“硬”“软”“冷”“热”；涉及触摸或感觉的动作，如“摸”“触”。

[26]或有人认为本文进行《周易》联觉分析所涉及的词量较少，且《周易》中“象”存在任意性，如《说卦传》中一卦多象，王弼亦有相关主张，这可能会对研究结论产生影响。对于这些疑问，本研究确实目前的词量有提升空间，后续可通过扩大《周易》经传中相关词汇的选取范围，同时明确直接感官词与隐喻性感官词的筛选标准，以增强研究的实证基础。而关于“象”的任意性与联觉分析的关系，二者并非不可调和。本研究的联觉分析，聚焦的是文本中已呈现的感官体验关联，并非与预设的“象”有固定对应关系。《周易》中“象”的多义性，恰恰体现了古人对感官经验与抽象概念关联的灵活认知，这反而可能成为联觉现象的一种文本体现。同时，研究严格限定分析范围，聚焦卦爻辞中明确的感官词汇，并结合具体语境进行分析，以规避“象”的任意性可能带来的风险，与王弼所反对的过度执着于象的固定解读并不相悖。

[27]或有观点认为“自昭明德”中的“明德”形容德性光明、自我昭显，是不可见而可感的，并非视觉性词汇。对此，本研究将其纳入视觉词汇范畴，主要基于其譬喻性的视觉特征考量。“明德”虽指向内在的光明德性，但其表述中“昭”与“明”的使用，实则是以视觉领域中“光明”“显明”的意象为喻体。在《周易》的语境中，这种以视觉经验里的光亮、显见等特征来譬喻抽象德性的显明可感，构建起了从具体视觉意象到抽象精神境界的关联。“自昭明德”通过视觉性的譬喻，让抽象的德性有了可依托的视觉化表达，这种譬喻性的呈现使其具有了视觉词汇的特质，故本研究将其归入视觉词汇之列。

[28]风从直观上看，可触动人的触觉、听觉，然而其中所包含的嗅觉触动常常为人所忽略。例如，其可能包含草木、泥土的清香，给人以舒适、愉悦之感。

[29]泽从直观上看，可触动人的视觉，然而在特定的情境下，嗅觉触动可能要先于视觉或触觉的触动。例如《咸》：“山上有泽，咸，君子以虚受人。”如果说“山上有泽”，那么人在山下时，湿润、清香的空气应首先给人以美好的联觉体验，以此体现人与万物交感，从而更好地理解“君子以虚受人”。

[30]意为舒解脚大拇趾中的病患，与触觉强关联。

[31]《彖》曰：“夬，决也，刚决柔也。”将“夬”与“刚柔”进行直接关联，可认为其本义与触觉有关联。

[32]柅，刹车器。

[33]黄寿祺、张善文：《周易译注》，第457页。

[34]黄寿祺、张善文：《周易译注》，第284页。

[35]关于感官人类学，可参见Constance Classen, “Foundations for an Anthropology of the Senses,” InternationalSocial Science Journal, no.153,1997.

[36]郑伟：《基督宗教视觉艺术传播》，北京：中国社会科学出版社，2018年，第19页。

[37]康斯坦丝·克拉森：《最深切的感觉：触觉文化史》，王佳鹏、田林楠译，上海：上海人民出版社，2022年，前言第4页。

点击下方链接，下载原文

如需购买《数字人文》期刊，请扫描下方二维码

封面.jpg

校对 | 肖爽

美编 | 王秀梅

数字使人文更新

数字人文门户网站：www.dhcn.cn

往期回顾

https://pcn08dpdjolp.feishu.cn/share/base/form/shrcnhA0MGEBpltCoo2wPZYqUTb

会议通知丨融合与边界：人工智能时代的数字人文发展新进阶

2026年3月9日 18:44

联盟大事记 2026-03-09 18:44 北京

以下文章来源于：数字人文专业发展联盟

数字人文专业发展联盟

数字人文专业发展联盟官方账号

时间2026年7月10日至13日地点上海大学宝山校区：上海市上大路99号2026 数字人文专业发展联盟第二

时间

2026年7月10日至13日

地点

上海大学宝山校区：上海市上大路99号

2026

数字人文专业发展联盟第二届年会

暨第七届清华大学数字人文国际论坛、中国文艺理论学会数字人文分会第四届年会

会议背景

新一代AI技术的不断突破，为人文学科研究注入前所未有的活力，也为人文与科技的深度融合开辟了新的路径，提供了更广阔的发展空间。在此背景下，数字人文专业发展联盟第二届年会暨第七届清华大学数字人文国际论坛、中国文艺理论学会数字人文分会第四届年会拟定于7月10日—13日在上海大学宝山校区举办。

本次会议旨在凝聚学界共识，分享成功经验，共同探索数字人文进入人工智能时代的新范式、新路径、新方法。会议将邀请国内外专家学者，围绕人工智能时代数字人文研究的前沿与学科建设核心议题展开深度研讨，通过跨学科对话，推动数字人文学科繁荣发展，助力新文科建设与交叉学科人才培养，服务国家文化数字化战略与教育强国建设。为最大程度地促进思想碰撞与跨界合作，本次会议面向数字人文生态中的多元主体发出诚挚邀请。

组织机构

主办单位

数字人文专业发展联盟

中国文艺理论学会

承办单位

上海大学文学院

上海大学文化遗产与信息管理学院

中国文艺理论学会数字人文分会

协办单位

清华大学中华传统文化智能实验室

清华大学-同方知网数字人文联合研究中心

中华书局古联（北京）数字传媒科技有限公司

高等教育出版社上海出版事业部

会议时间地点

2026年7月10日-13日共4天

报到 7月10日

会议 7月11日—12日

赋归 7月13日

上海大学宝山校区（上海市上大路99号）

会议合作酒店

上海衡山北郊宾馆

地址：上海市宝山区沪太路4788号

总机： 021-56040088

（注：若实际报名人数超过酒店接待上限，会务组可能新增其他酒店安排接待）

会议主题

核心主题包括但不限于：

数字人文专业发展的路径探索与实践创新

跨学科融合驱动的人文知识生产新模式

数字人文基础设施与数字批判反思

大语言模型赋能人文研究的新范式

生成式AI与创意实践价值

人工智能对人文艺术的赋能与边界

人工智能文艺的社会性与人文性

古籍文献智能化处理与数字保护

数字遗产的创造转化与传承

待完善扩充……

会议特色

本届联盟年会聚焦学科建设与人才培养，除设置理事会会议、主旨演讲、专题论坛等常规板块外，拟推出多项务实举措。

高水平人文社科实验室交流会

拟邀请人文社科实验室建设专家闭门交流

院长论坛

围绕数字人文专业建设展开深度交流，创新设立虚拟协同教研室，探索跨校协作机制，促进校际互鉴，推动教学资源与科研力量的整合优化，共创联盟合作新模式

清华大学数字人文国际论坛“未来学者”专场

为海内外青年学者搭建交流平台，围绕数字人文的跨学科研究、古籍数字化、大模型应用等热点议题，展现新文科背景下青年一代的创新探索

课程示范

展示分享优质数字人文教学案例，推动课程资源共建共享

成果发布

集中呈现数字人文代表性建设成效和项目案例，为各单位提供参考借鉴

主编讲堂

特邀知名学术期刊主编就论文写作、投稿策略、评审标准等进行专题指导，切实提升学术发表能力

媒体支持

网站

中国数字人文官网

期刊

《数字人文》

《文艺理论研究》

《山东社会科学》

《东南学术》

《文化研究》

《探索与争鸣》

《上海交通大学学报》

《广州大学学报》

《福建师范大学学报》

《南京师范大学文学院学报》

《数字人文与科幻研究学刊》

《东岳论丛》

《电影艺术》

Chinese Semiotic Studies

《中国创意写作研究》

《上海大学学报（社会科学版）》

（学术支持单位持续更新中，感谢支持！）

……

公众号

DH数字人文

数字人文专业发展联盟

经典古籍库

京狮人文

比特人文

……

参会注册、报名

相关流程

联络人及电话：

苗老师 18236902942

段老师 13391253562

1.注册报名

截止时间：2026年4月13日

2.论文提交

截止时间：2026年5月13日

3.报名方式

扫码填写参会回执，会务组将组织专家预审，2026年5月30日前确定参会名单，并发送会议邀请函。

投稿须知

所有参会人员均需填写参会回执。未来学者论坛请先完成大会回执填写，另将论文投稿至指定刊物投稿系统。

向大会投稿

（面向数字人文生态中的多元主体征集）

投稿论文请注明：

联盟年会投稿+作者名+作者单位

投稿方式：

扫描下方参会回执二维码填写上传

向未来学者论坛投稿

（面向本/硕/博阶段在读学生，不含博士后）

摘要提交截止日期：2026年5月22日

全文提交截止日期：2026年6月12日

投稿地址：https://szrw.cbpt.cnki.net

投稿说明：

来稿请投“未来学者专栏”，文章作者除指导教师（请标记为“通讯作者”）外，须全部为本/硕/博阶段在读学生，不含博士后。

参会要求

参会人员收取会务费，会务费标准为800元/人，学生半价优惠400元/人，每个联盟理事单位免1人参会费。会议期间的餐饮费用由承办方承担，交通、住宿费敬请自理，会务组可代订酒店。入选“未来学者”论坛发言的作品每篇免1人参会、住宿费。缴费时间及缴纳方式将另行通知。

【备注】

1.电脑端阅读用户可复制网址填写：

2.手机端用户请先将论文全文定稿使用【手机文档/文件中心】打开或保存至【手机文档/文件中心】。扫描或长按识别二维码填写回执，点击上传附件按钮，在【手机文档/文件中心】选中论文全文文件即可成功上传。

3.电脑端查看填写遇到问题，辛苦您切换尝试使用手机端完成，或与我们的工作人员取得联系，联系方式详见注册报名版块。

数字人文专业发展联盟

中国文艺理论学会数字人文分会

上海大学文学院

上海大学文化遗产与信息管理学院

清华大学中华传统文化智能实验室

清华大学-同方知网数字人文联合研究中心

中华书局古联（北京）数字传媒科技有限公司

高等教育出版社上海出版事业部

2026年3月9日

END

古诗生成图像数据集的构建及研究范式

2026年3月6日 10:01

原创张正骁袁非牛等 2026-03-06 10:01 北京

古诗生成图像是一项跨人文、自然语言处理以及计算机视觉领域的交叉学科任务。其核心在于理解古诗中包含的各类主体特征及其相互关系，挖掘古诗蕴含的情感基调，并将这些元素通过绘画方式表达出来。

基础设施

张正骁 / 上海师范大学人文学院

袁非牛 / 上海师范大学信息与机电工程学院、上海市中小学在线教育研究基地

向标 / 上海师范大学信息与机电工程学院

摘要：古诗生成图像是一项跨人文、自然语言处理以及计算机视觉领域的交叉学科任务。其核心在于理解古诗中包含的各类主体特征及其相互关系，挖掘古诗蕴含的情感基调，并将这些元素通过绘画方式表达出来。随着人工智能生成内容（AIGC）的蓬勃发展，AIGC正在影响甚至引领数字人文研究，人文垂直领域大模型的研究需求在日益提升。垂直领域大模型通常采用预训练加微调的范式进行训练，而微调工作则需要为垂直领域任务而专门标注训练数据集。本文首先针对古诗生成图像的任务，以《唐诗三百首》为例，构建了一个唐诗配图训练数据集，为生成式人工智能在该领域的研究开创了条件；其次提出一种采用大语言模型与图像扩散生成模型（Stable Diffusion）的结构，作为完成古诗生成图像任务的基本范式。在本范式中，使用大语言模型生成描述古诗配图的提示词，将提示词输入扩散生成模型，采用低秩适配模型（LoRA）微调生成模型得到最终的配图。在实验环节，本文分别对数据集的必要性、新研究范式的可行性进行评估，而后，对新数据集在新研究范式下的实用性以主观测评和客观指标结合的方式进行评估。结果表明，本文所提出的主要方法是科学合理的。

关键词：古诗生成图像垂直领域大模型新数据集基本范式 LoRA模型

引言

数字人文（Digital Humanities，DH）是一个典型的文理交叉学科领域，在当今人工智能时代背景下，指的是在相关的计算机技术支撑下开展人文研究而形成的新兴学科。^[1]目前的数字人文研究，其落脚点仍然主要在于人文社科领域，大部分学者的研究思路是利用计算机技术作为一种数据分析与可视化的工具来进行传统的人文研究，而对于工具本身的创新研究还略显不足。数字与人文应是相辅相成、携手共进的关系，数字技术为人文学科领域中长期存在的问题提供新的研究思路，从深度和广度两个维度重构人文学科，^[2]而人文学科存在的难题和需求又能促进数字技术的研究。例如，针对某些垂直领域提供全新的研究范式，抑或是促进进一步的技术革新，两者互相依赖不可分割。

近年来，自然语言处理作为人工智能领域中的一个重要分支正在飞速发展，自然语言处理也是与数字人文专业最为契合的技术方向。我们提出将基于自然语言处理的数字人文学科分为两大方向，分别为人文计算和文化生成。人文计算包括人文风格的识别，例如某位文学家的写作语言风格、书法家的字体风格、诗人的文风等；还包括情感分析，例如对古诗文蕴含的情感进行分类或回归评分，抑或是风格迁移等。文化生成依赖AIGC（Artificial Intelligence Generated Content）技术，各类大语言模型、图像生成模型等都被称为生成式人工智能。采用AIGC可以做到文本生成，包括机器翻译、人机对话、AI（Artificial Intelligence）写诗等，也能在视觉领域中完成图像描述和图像生成。本文的古诗生成图像任务实质上就是图像生成任务，是一种跨模态的AI生成任务。

古诗是中国传统文化瑰宝，是千百年来中国劳动人民的思想结晶。^[3]许多名篇佳句传世至今，蕴含了丰富的思想价值和文化价值，值得我们传承并发扬光大。然而古诗相对于现代文来说终究较为晦涩难懂，初学者难以快速把握诗中描绘的场景或者理解作者想表达的意境，加之文字所能传达的信息也是有限且单一的。图片相比于文字则具有更丰富的语义信息，例如图片中的景物、人物的动作、绘画风格、整体色调。如果利用人工智能对输入的古诗生成一幅对应内容的配图，读者能够通过图片更直观地把握古诗的意境以及诗人所表达的情感，这对于古诗在文化传播或中小学生教育等方面都有着积极的推动作用。

目前文生图领域的现有技术还不足以直接运用于古诗生成图像任务。首先，目前大部分的文生图任务相对简单，输入的文本往往简短易于理解。^[4]但古诗往往包含了多个主体，环境描写复杂，需要体现出古诗的意境和诗人情感，因此古诗生成图像难度大，具有挑战性。其次，目前文生图领域大量的研究集中在图像编辑方面，^[5]例如利用用户自己的宠物或物件这些特定的东西，^[6]通过图像生成模型得到新图像，或者保留原图整体特点的同时，改变图中物体的位置姿态等应用类型研究，^[7]研究重点与本文不同。最后，直接使用现有的大语言模型的图像生成功能，并不能生成较好的符合诗意以及意境的图片，这是由于通用大语言模型的文本编码器的预训练是在大量的现代文数据集上进行的，且文本十分精简，含有大量现代生活的元素，但很少会触及古诗中的物品、地点、服装、建筑等描述，使得通用大语言模型不一定生成得准确合理。所以，针对该任务，本文提出了构建垂直领域模型的思想，使用预训练加微调的方式来完成图像生成。而微调则是需要在针对特定任务的小型数据集上进行的，因此本文使用DALLE3^[8]来生成古诗配图数据集，以《唐诗三百首》为例，生成图文一一对应的320张图片作为进行微调使用的数据集。图1展示了数据集中的部分图片示例。

图1.png 图1 古诗生成图像数据集图片示例

现有的大语言模型在古诗文配图自动生成方面会出现不少问题。以文心一言生成古诗配图为例，会出现以下的问题：

（1）由于大部分大语言模型的中文训练集是白话文形式，如果直接输入古诗作为提示词（prompt），模型会将输入的文本作为现代文理解。即便在提示词中写明“请为以下输入的古诗生成配图”，也不能生成符合古诗内容的正确配图，这也引出了第二个问题。

（2）当古诗中存在古今异义现象，比如“床前明月光”中的“床”字应该解释为井栏而非现代意思的床，模型不能正确理解“床”的真正解释。

（3）为了解决以上问题，本文尝试将古文翻译为现代文作为提示词输入图像生成模型。然而，模型还存在不认识古诗中某些特定词的现象，例如输入“屏风”，生成一扇房门，输入“缝补”，生成一台现代的缝纫机，输入“饮酒”，生成一瓶红酒和高脚杯等不符合时代、地域或诗意的图片。

（4）受限于图像生成模型自身能力，即便是目前最佳的扩散模型^[9]仍然无法生成完全符合给定提示词语义的图片。当输入提示词比较复杂、包含多个主体时，模型可能选择性地只生成其中一个或部分主体而忽略其他主体。另外，模型可能会将一个主体的属性错误地绑定到另一个主体上。^[10]

（5）几乎所有图像生成模型都可能存在弊病，比如多余的手指、模糊的五官、超过四条腿的马、错误的空间位置等。此外，还可能出现一些不符合逻辑、物理规律的现象，例如人在水上行走、灯笼漂在水面上、床在海边等。

为了减少以上问题的出现，需要构建古诗配图专用数据集。在数据集构建完成之后，本文提出了结合大语言模型和图像生成模型（Stable Diffusion）^[11]的范式，用于古诗生成图像任务。具体来说，本文采用预训练好的模型在古诗配图数据集上进行微调，建立该任务的基线标准。在训练中使用低秩适配模型（LoRA）^[12]，它能够在相比于整个扩散模型少得多的权重上进行训练和更新，对于小型数据集微调效果起着重要作用。最后，本文使用CLIP Score和FID的评价指标进行评估，该指标能够有效评估输入提示词和所生成图片两者之间的匹配度。本文的主要贡献总结如下：

（1）以《唐诗三百首》为例，首次构建了古诗生成图像任务的数据集。该数据集由DALLE3生成，人工进行评估和挑选，总计为320首唐诗生成对应的320张配图。实际使用中，本文按照8∶2的比例分为训练集256张和测试集64张。

（2）创建了大语言模型与图像生成模型相结合的范式完成古诗生成图像任务。

（3）使用大语言模型生成符合古诗诗意和意境的提示词，然后将提示词输入Stable Diffusion模型生成图片。训练中加入LoRA模型进行微调，使模型更好地学习到数据集图片的特征和画风。

一、国内外相关工作

（一）大语言模型

大语言模型在自然语言处理任务中展现了令人印象深刻的能力。^[13]这些大模型参数量基本都突破百亿量级，甚至达到千亿、万亿的级别，庞大的参数量加上海量的训练数据，使得这些大语言模型拥有极强的文本理解和推理能力。在当今的数字人文研究中，大语言模型具备的文本摘要生成、情感分析、相似度计算等能力，都可以直接服务于学者进行相关研究。另外，如图像描述、图像生成等各类多模态交互也能拓展人文学科的研究领域和视角，发现新的研究课题。

现有的国内外大语言模型呈现“百模大战”之势。国外有OpenAI公司的GPT3.5^[14]和GPT4^[15]、Anthropic的Claude^[16]、谷歌的Bard^[17]和微软的Bing，国内有百度的文心一言3.5和4.0、科大讯飞的讯飞星火、腾讯的腾讯混元和阿里的通义千问等。

针对大语言模型的评价指标往往包含不同能力的测评。例如，文本生成能力指对于常识的运用以及对抗人类恶意误导提示词的抵抗能力；长距离捕获能力是在文本长度较长的时候，前后文是否仍能建立一定的关联性；多语种的泛化能力，指语言模型在处理不同语言时的表现。由于模型通过将输入的提示词进行词嵌入（embedding）转化为向量来理解文本，因此这里的泛化能力实质上反映了模型对于语言的理解能力，即模型的鲁棒性；推理能力，即对需要逻辑推理的问题的回答正确率；知识调用准确性，思维链（Chain of Thought），即提问内容不直接出现在训练语料中而需要通过加工处理现有的语料才能得到结论。

基于此类指标，GPT4在各项综合能力上仍然占据较大优势。国内大语言模型中，文心一言4.0表现突出，尤其是在推理能力、知识调用准确性、文本生成能力方面相较于其他国内模型更为优异。Claude和Bard拥有很强的多语种泛化能力。Bing的长距离捕捉能力突出，但是逻辑推理能力一般。国内其他的大语言模型中，通义千问作为免费开源模型，具有最好的综合性能，尤其是在多语种泛化能力和文本生成能力上表现突出。讯飞星火和腾讯混元则各有优劣。

（二）图像生成模型

文本生成图像既属于自然语言处理领域任务，^[18]又是计算机视觉中的一个极其新颖的应用。^[19]早期图像生成模型主要是基于生成对抗网络。^[20]生成器生成的图片受鉴别器监督，鉴别器根据误差，通过损失函数惩罚生成器来训练生成器，而随着生成器生成的图片逐渐逼真的同时，也在训练鉴别器的分类能力，两者交替训练，从而更新整个生成对抗网络。不少工作基于生成对抗网络的基本原理完成图像生成任务，^[21]但是由于生成对抗网络的收敛条件苛刻、模型训练过程不稳定等原因，在图像生成领域中，基于生成对抗网络的方法已被基于扩散模型的方法所取代。

扩散模型^[22]的前向过程即加噪和去噪的过程。加噪过程总共n次，在n次加噪步骤之后得到一幅高斯分布的噪声图片。去噪过程中训练一个噪声预测网络，分别将n次所施加的噪声作为标签，训练噪声预测网络来预测每一步骤的噪声，去噪之后即可得到待生成的图片。

Glide^[23]是基于扩散模型的第一个文本生成图像的工作，采用了无分类器引导方式，直接用文本替换原始的类标签完成图像生成。Imagen^[24]采用预训练好的、冻结参数的大语言模型作为文本编码器，该文本编码器的预训练语料可以是图文对形式（如CLIP^[25]模型），也可以是纯文本形式（如BERT^[26]、GPT^[27]、T5^[28]）。Stable Diffusion是一个典型的、在潜在空间中训练扩散模型的框架，与直接在待生成图片上加噪去噪不同，模型在经过编码器之后的特征图上进行扩散步骤，该方式相比于原先取得了显著的进步。CLIP模型开创性地学习多模态特征表达，这种结构被广泛运用在许多图像生成模型中。例如DALLE2^[29]同样使用文本和图像编码器建立不同模态之间的关联，然后提出一个先验网络将文本特征转化为图像特征，最后生成图片。

图2.png 图2 数据集部分图片展示

二、数据集和图像生成新范式

（一）古诗配图数据集

古诗配图的来源多种多样，可以节选自明清两代版画形式的唐诗选本，可以请画家根据诗意自行创作，甚至可以是互联网上输入古诗搜索而来的图片。然而这些来源各有缺点，例如，明清画册的配画艺术成分较高但往往不够写实，如绘画中运笔的疾徐轻重、点线的疏密粗细之于图像生成任务来说是冗余信息，因为本文的研究目的并非如何用最佳的艺术形式展现古诗意境，而是用具象的而非写意的风格切实刻画出诗中所包含的主体。画家自行创作的随意性较大，无法保证内容的准确性而且成本较高。互联网图片不够全面且质量参差不齐。如果只是选择部分图片混入本文数据集作为补充，则可能引起数据集数据分布不均匀的问题，使得训练难以收敛，效果变差。因此统一使用AI绘画模型生成古诗配图作为本文的数据集成为了一种可行的且成本较低的解决方案。

图3.png 图3 Stable Diﬀusion模型原理

本文构建的古诗生成图像数据集由DALLE3生成。数据集中的古诗以《唐诗三百首》为主要内容，总计320首唐诗和对应的320张配图，以图文配对的形式呈现。在后续的图像生成任务中，将320个图文配对按照8∶2的比例划分训练集和测试集，即训练集中包含256个图文配对，测试集中包含64个图文配对。考虑到唐诗自身的特点，本文构建的数据集图片主要由中国古代风格构成且具有写实而非写意的特点。图片内容不仅能够正确反映诗中所包含的主要内容，也能体现出作者一定的情感倾向和诗歌意境。

本文数据集的构建采用多种方式。DALLE3的输入可以是古诗原文、古诗译文，或者将古诗译文翻译为英文作为输入。通常情况下，一首古诗需要通过多种方式配图，并采用多次生成与交叉比对方式，人工来选取最能准确反映古诗含义的图片。如遇到上述方式都无法生成满意图片的情况，本文将手动设计输入文本，直至生成令人满意的高质量图片。

图2展示了本数据集中部分古诗及其配图的示例。如《宿业师山房待丁大不至》中，描绘了一个宁静而又祥和的夜晚，诗人独自于山径之上等待友人的到来。“群壑倏已暝”描写了山谷迅速被暮色覆盖的场景，“松月生夜凉”和“风泉满清听”包含了松树、月亮、风和泉水的意象，增添了夜晚凉爽幽静的氛围。“樵人归欲尽”和“烟鸟栖初定”描绘归家的樵夫和寻找栖息地的鸟儿，通过景物、人物的描写点出时间已晚，描写了夜晚的宁静。“孤琴候萝径”转为描写诗人的内心世界，表达了诗人期盼知音到来的心情。配图中不仅准确地刻画了如松、月、烟、鸟以及人物等意象，也将诗中幽静的夜晚场景、诗人等待友人的意思都刻画到位。《滁州西涧》中，描绘了诗人春游西涧赏景和郊野渡口所见，图片中准确刻画出了小溪边上的幽幽野草、树上的黄鹂、湍急的水流以及一艘悠闲漂浮着的小舟。《下终南山过斛斯山人宿置酒》中，描绘一幅宁静美好的生活景象，碧绿青翠的山间小路、上前迎接的孩童、欢声笑语共同举杯的场景都在图片中体现出来。

总体而言，在使用DALLE3制作数据集时，对于模型生成图片的选择有如下的考量。首先，所生成的图片经过严格的人工检查和筛选，保证制作的数据集图片质量高，人体和动物的解剖结构准确，删除含有畸形或者错误的样本，保证在后续使用数据集微调阶段能够尽量减少不符合常识、逻辑、物理规律的现象。其次，生成的图片在内容上应当与古诗尽可能贴切，即古诗中描绘的自然景观、人物特征或物品种类等应尽量准确而全面。当然，如果诗歌过长或者包含大量不同种类的物体，受限于大模型自身的生成能力，也无法生成一幅包含所有要素的图片。最后，图片应当能反映作者的情感，比如通过整体画面色调、背景刻画等反映出整首古诗的情感基调。另外，仍然存在一些问题是目前难以解决的，例如“一词多义”现象、“古今异义”现象。由于大语言模型的预训练数据集是基于现代文甚至外语的，而如果对于少部分特定诗句中存在的“一词多义”或“古今异义”现象单独作微调工作去修改，则过于烦琐且成本较高，而且容易造成过拟合、语言漂移（Language Drift）^[30]和灾难性遗忘（Catastrophic Forgetting）^[31]等严重问题。总结来说，对于所选择图片的考量应当是准确性大于艺术性，在保证古诗中蕴含的元素能够尽量展现出来的前提下，尽可能地反映出古诗的隐喻、象征、典故等深层语义。

（二）Stable Diffusion模型

Stable Diffusion模型^[32]是一种以潜在扩散（Latent Diffusion）为基础的文本到图像扩散模型，能够在给定任何文本输入的情况下生成逼真的图像。扩散模型是在原图上进行图片的加噪去噪处理，而潜在扩散是对经过一个编码器提取特征之后的特征图空间进行扩散处理，之后经过解码器对特征图还原为所需生成的图像，大大减少了计算量。Stable Diffusion具有良好的可控性、稳定性和适用性，且满足加载大规模预训练权重进行下游自定义任务微调的条件。

如图3所示，Stable Diffusion模型主要由三个模块组成，分别是CLIP的文本编码器、生成模型和解码器。首先，将文本输入CLIP文本编码器，对输入token进行embedding表征，转化为维度是768的向量。随后，将向量化后的文本信息以及噪声输入生成模型。生成模型包含图像编码器，将原图编码为特征图的形式，然后在特征图上进行扩散过程，生成能够与向量化后的文本信息内容相符合的特征图。最后，将该特征图输入解码器还原为需要生成的图片。

（三）LoRA模型

对于大模型来说，相比于预训练数据集，为特定下游任务构建的微调数据集规模显然要小得多，本文的古诗生成图像数据集也不例外。使用相对来说极小规模的数据集继续训练一个大规模预训练的模型或者直接进行微调可能会导致过拟合、语言漂移和灾难性遗忘。语言漂移和灾难性遗忘实际上是训练过拟合所导致的两个现象。例如在文字生成图片模型中，语言漂移指当使用小规模数据集微调时，模型只能画出小数据中某些文字指代的特定含义却忽略了在大规模预训练数据集上学习到的先验知识。灾难性遗忘指模型过度适应小规模数据集中内容，模型中大量与下游任务其实并不相关的权重也因为微调过程而更新，导致模型遗忘大量信息。

通常微调过程是更新预训练模型中的全部参数。而LoRA模型，即大语言模型的低秩适应，冻结预训练模型的权重并训练一个低秩分解矩阵插入Transformer模型中的每一层，无需在训练过程中对预训练模型中的所有参数进行优化。通过LoRA策略微调后的模型将能减少10,000倍参数量，减少3倍的GPU内存。

（四）大语言模型与图像生成模型

针对古诗生成图像任务的特点，本文提出了使用大语言模型加图像生成模型的新范式。具体来说，如图4所示，将古诗输入大语言模型中，要求模型生成对应的适用于图像生成模型的提示词，且该提示词需要正确反映输入古诗的主要内容和意境。此时，将所生成的提示词和训练集中的图片作为图文配对的形式输入图像生成模型，加载预训练权重并加入LoRA模型进行微调。

图4.png 图4 大语言模型加图像生成模型新范式

在这个新范式中，在图像生成模型之前使用大语言模型是必要的。在Stable Diffusion中，它的文本编码器是CLIP模型的文本编码器，如前文所述，该文本编码器是在大量的、简短的现代文数据集上进行训练的，其语义理解能力相比于大语言模型显然弱得多，对于古诗文的内容、意境甚至蕴含的感情色彩是完全无法理解的。因此，大语言模型对于文本语义理解和情感分析的优势就能充分发挥出来。

本文在使用大语言模型时，是要求大语言模型给出适用于图像生成模型的提示词，而不是直接将古诗翻译为白话文，甚至是英文，其中原因有二。其一，当古诗篇幅过长，例如白居易的《长恨歌》，整篇篇幅近一千字，直译过来包含的主体和意象过多，如果将其直接输入图像生成模型，显然模型无法完全理解。而大语言模型即便对于长文本，仍然能够正确理解文本的语义关系和情感基调，在生成提示词时能够在理解古诗本身含义的情况下，提取到构成一幅图像的最重要的部分，即人物、环境、空间位置等核心组成部分，可以排除在图像生成任务中并不重要的冗余信息。通过这样的方式极大地精简了图像生成模型的输入提示词，从而减少输入提示词过长导致的生成主体缺失以及属性的错误绑定问题。其二，即便短篇幅的古诗直译过来，翻译后的文字也只能表达出古诗中的字面意思，在诗歌作品中诗人往往通过借景抒情、托物言志、引经据典等方式隐晦地传达出自己的情感倾向，使用译文显然无法生成一张能体现古诗情感和意境的配图，而使用大语言模型生成的提示词往往能准确地写出所要求生成图片中的风格和氛围。

三、实验部分

（一）实验细节

本文中的微调工作以及后续所有实验都是在一台英特尔i9处理器、英伟达GTX 3090 GPU电脑上完成的，其运行内存大小为24GB。本文的微调工作也是在构建的新数据集上完成的。

微调过程加载了Stable Diffusion预训练权重，外挂VAE模型，采用了LoRA训练策略，采样方式为DPM++3M SDE Exponential，数据集图片的尺寸为1024×1024。CLIP终止层数设置为3，Batch Size为1，提示词引导系数为7，原始模型与LoRA比例设置为1∶1。本实验整体采用的学习率大小设置为0.000005，采用余弦衰减；文本编码器在本实验中不参与训练，学习率大小为0；扩散模型中采用U-Net，学习率大小设置为0.0000005。模型训练总轮数为20个epoch。

在本文的实验部分采用了CLIP Score和FID两个指标来评价图像生成模型的效果。CLIP Score是一种用于评估文生图或图生图模型的评价指标，可用以评价生成图片与原文本或原图关联度大小。在本文中将所生成的图片通过CLIP模型的图像编码器转化为嵌入向量，并使用CLIP模型的文本编码器将输入文本转化为嵌入向量，对上述两个嵌入向量计算余弦相似度。余弦相似度值越高代表生成图像与文本描述之间的匹配度越高。FID可用于评估生成图片与Ground Truth之间差距。在本文中使用预训练的InceptionV3模型分别提取数据集图像和生成图像的特征，将两者特征分别表示为两个多维高斯分布，即每个分布用均值向量和协方差矩阵表示，然后计算两个高斯分布之间的弗雷歇距离。FID值越小代表生成的图像和Ground Truth间的统计特性越相似，即生成图像的质量越高。

图5.png 图5 本文数据集与其他模型古诗生成图片对比

（二）对比实验

1.必要性实验

本小节进行的对比实验目的是证明构建本文数据集的必要性，即针对古诗生成图像任务仍需采用预训练加微调的方式，单独使用大语言模型或图像生成模型仍然存在一定的不足。图5展示了对比实验的结果，以5首古诗为例，对每一首古诗分别在Stable Diffusion、腾讯混元、通义千问、文心一言、科大讯飞等图像生成模型以及大语言模型和本文数据集中包含的图片进行横向对比。值得注意的是，据我们所知目前没有针对古诗或文言文的垂直领域图像生成模型，比较接近的是Poetry2Image模型。^[33]该模型旨在提升古诗生成图像的质量，使用大语言模型修正关键要素缺失或语义混淆等问题，但是其存在着不符合地域、时代等问题，故在此不考虑加入本文的对比试验。

《寻陆鸿渐不遇》描绘了一幅静谧的乡间小径和草屋画面，草屋主人归家时已经接近黄昏时分。在这首诗的对比中，Stable Diffusion和腾讯混元的图文匹配度较差，生成的图片与诗意本身并不吻合。其他三个模型生成的图片都存在一定错误，例如，通义千问生成的是一座宫殿，而非乡间小屋，文心一言并没有画出一条通向桑麻的小路，科大讯飞没有刻画出黄昏时的夕阳。《题破山寺后禅院》中Stable Diffusion的图文匹配度仍然不高，腾讯混元和通义千问没有传达出“曲径通幽处，禅房花木深”的意境，诗中应当描绘的是一条僻静幽深的小道，而禅房掩映在繁茂的花草丛中。文心一言所描绘的场景则更像一座宏伟的宫殿而非禅房。《金缕衣》劝诫人们珍惜青春少年时，而除了本文数据集图片能够传达出此含义之外，其他模型的理解都停留于字面意思，或者错误理解了古诗的主旨。

总体而言，本文构建的数据集图片往往能够在同一首古诗中包含更多诗中存在的元素，在环境、时间、人物、情感主旨等方面相比于直接使用现有的大模型所生成的图片更加准确且内容更为饱满。

2.实用性实验

本小节进行的实用性实验的目的是证明本文提出的大语言模型加微调图像生成模型的新范式是有效的。本文选定Stable Diffusion模型作为实验对象，对比微调前后的图片，计算FID和CLIP Score两个评价指标作为客观评价来证明该范式的实用性，然后设计主观测评来辅助验证微调的有效性并验证FID和CLIP Score指标的科学性。

图6展示了Stable Diffusion模型微调前后的对比结果图。微调前的Stable Diffusion仅加载预训练权重，生成的图片内容单调且并不符合古诗主旨含义，图片风格或人物形象经常出现西式甚至是日漫风格，经过微调后生成的图片往往能够较好地捕获古诗表达的含义和意境，并且能够较好地学习到数据集中包含的整体构图风格，同时也能反映出正确的时代背景和中式风格。

图6.png 图6 Stable Diﬀusion模型微调前后对比图

图7.png 表1 Stable Diﬀusion模型微调前后的CLIP Score和FID指标

表1中展示了使用Stable Diffusion模型微调前后在CLIP Score和FID指标上的对比结果。相比于微调前，CLIP Score指标提高了0.87，说明微调之后生成图片内容与输入古诗的语义信息之间的关联度更高，更能传达古诗本身的含义；FID指标下降19.55，说明微调后生成图片内容更接近Ground Truth，风格上也与之更为接近。

由于客观指标和计算公式无法衡量古诗意境的深层表达，如情感一致性和文化适配性等，故本文还设计了主观性测评以辅助验证所提出新范式的有效性，并证明了所使用的FID和CLIP Score指标的科学性。本测评环节邀请了来自数字人文、汉语言文学、信息管理、计算机等专业共42位硕博研究生参与。本测评采取问卷的形式，分为两个问题，这两个问题分别对应FID和CLIP Score指标的含义。

具体来说，第一个问题对应FID指标的含义，给定Ground Truth和微调前后共三张图片，询问微调前后的两张图片中哪一张与Ground Truth在内容上、风格上总体更为类似。第二个问题对应CLIP Score指标的含义，给定一首古诗和所对应的微调前后的两张图片，回答微调前后的两张图片中哪一张与该古诗在内容、地域、时代以及情感上更为接近。

第一个问题的目标是通过人工评估，验证使用新范式进行微调训练后生成的图片是否比微调前更能学习到Ground Truth的风格和内容。第二个问题的目的是通过人工评测，验证生成的图片是否在内容、地域、时代背景以及情感上更符合古诗本身。为了防止同一位测评者在连续回答两个问题时可能产生倾向性，本实验将测评者平均分为两组，每一组共21位测评者，每人只需回答其中一个问题即可。据测评结果显示，问题1中有17位选择了微调后的图片，占全组80.95%，问题2中有19位选择了微调后的图片，占全组90.48%。结果证明了本文提出的大语言模型加微调图像生成模型的新范式是有效的，所生成的图片不仅能够学习到Ground Truth的内容和风格，也能较为准确地生成与古诗内容和情感更密切的图片。

（三）剥离实验

1.图像生成模型的输入

图像生成模型的输入对于生成图像的质量起着至关重要的作用。对于本文古诗生成图像这类较为复杂的任务场景，如何设计输入文本使得文本能够传达古诗的现代文含义，并且包含诗中的情感氛围就显得尤为重要。人工标注此类文本似乎是最佳的解决方案，但目前既精通古代文学、又掌握计算机技术的跨学科专家十分稀缺，且每一首古诗都进行精心标注的工作量极为繁重，而使用大语言模型可以模拟跨学科专家，在能够理解古诗语义、情感等方面因素外，同时输出适合图像生成模型的提示词。为证明这种方式的有效性，本节将输入文本替换为古诗的中文白话文译文以及英文译文分别输入模型生成配图，如图7所示。

图8.png 图7 不同类型的输入文本生成图像对比

图9.png 表2 不同类型的输入文本生成图像FID指标

表2展示了图中三首示例古诗在不同输入文本类型情况下的FID指标。使用大语言模型作为输入文本的FID指标相比于中英文译文都要更小，证明了使用大语言模型作为输入文本的生成结果与本文数据集中的图片更为接近。产生这种差异的原因是从古诗本身直译过来的白话文往往过于洋洋洒洒且重点不突出，当译文中出现多个主体的时候，图像生成模型往往会忽略其中几个重要的主体，这导致生成的图片内容看似与古诗本身出现了不相符合的情况。另外，译文中往往不带有情感因素，而通过大语言模型生成的输入文本能够在理解诗中情感的基础之上，写明以什么样的风格或以什么样的氛围生成包含什么内容的图片，这在提示词工程的相关研究中已被证明是一种非常适用于图像生成模型提示词的表达方式，能够更高效地生成想要的图片。^[34]

2.LoRA比例及训练轮数

由于本文构建的古诗生成图像数据集规模较小，直接对Stable Diffusion模型进行微调容易导致语言漂移和灾难性遗忘，在实际操作中导致梯度爆炸、损失值无法计算的问题，故在针对如本文的小规模数据集微调时往往使用LoRA模型。

图8展示了一首古诗生成的配图随着LoRA模型的比例以及训练轮数增加的变化情况。图片沿纵轴向下，LoRA模型的比重增加；沿横轴向右，训练轮数增加。可以从图中观察到，随着训练轮数的增加，模型的细节也逐渐增加，人物或物体的空间位置关系逐渐合理；而随着LoRA模型比例的增加，图片风格更趋近于本文数据集的风格，且人物和背景从西式风格改为中式风格。但当LoRA模型所占比例过大时，生成的图片会与数据集中图像的数据分布过于拟合，大幅降低了图像生成模型本身一定的随机性和创新性，导致图像失真。在本文实验中，将LoRA模型所占比例参数设置为1。

图10.png 图8 LoRA模型比例及训练轮数对图片质量的影响

结语

本文探索了古诗生成图像这一新的研究领域。基于现有的通用大语言模型或图像生成模型仍然不能很好地完成古诗生成图像这一任务的难题，提出了预训练加微调的解决方案，而为了能够解决这一特定领域的下游任务，本文以《唐诗三百首》为例，构建了新的数据集，为日后该领域的研究工作开创了条件。随后，本文构建了大语言模型和图像生成模型相结合的基本研究范式，使用大语言模型理解诗意并输出适用于图像生成模型的提示词，然后再对图像生成模型进行微调，微调过程中加入LoRA模型，解决语言漂移和灾难性遗忘等问题。

尽管如此，本文作为在古诗生成图像领域内的一项探索性工作仍然存在着一些问题亟待解决。从数据的角度出发，本文是以《唐诗三百首》为例构建的数据集，并在此基础之上进行图像生成研究的，所以覆盖范围有限，未涉及宋词、元曲等其他文本类型，未来可以考虑在唐诗的基础之上扩充数据集，将不同朝代、风格的诗作差异考虑在内，并增强模型的泛化性能。从技术的角度出发，古诗生成的图像中一词多义和古今异义的问题仍然难以解决，仍存在少量与实际文字含义并不完全符合的情况，未来可尝试与知识图谱相结合或加强关键词上下文理解以及加入RAG技术等方式来解决此类问题。从AI生成导致的伦理问题以及社会问题的角度出发，AI生成古诗配图也会产生一系列问题。例如即便目前最强大的AI模型也可能在理解古诗上产生错误，曲解古诗原意，这可能就会带来文化误导的风险，针对此类问题，除了在算法和技术上不断创新，在投入使用时也需注明“内容由AI生成，可能产生错误，请使用者仔细甄别”等字样。

在当今数字人文和AIGC的浪潮下催生了许多文理结合的交叉学科，本文期望为后续的研究工作提供一定的参考价值，更好地利用数字工具为人文学科的进步起到促进作用。

Construction of a Classical Chinese Poetry-to-Image Datasetand Research Paradigm

Zhang Zhengxiao, Yuan Feiniu, Xiang Biao

Abstract: Generating images from Chinese ancient poetry is an interdisciplinary task that spans the fields of humanities, Natural Language Processing(NLP), and Computer Vision (CV). The core challenge lies in understanding the various main features and their interrelationships embedded in classical poetry, uncovering the emotional tone conveyed, and expressing these elements through painting. With the rapid development of Artificial Intelligence Generated Content (AIGC), AIGC is increasingly influencing and even leading digital humanities research, and there is an increasing demand for research on vertical domain large models in the field of humanities. Typically, vertical domain large models are trained using a pre-training plus fine-tuning paradigm, where fine-tuning requires specifically annotated training datasets for vertical domain tasks. Taking Three HundredTang Poems as an example, we first address the task of generating images from Chinese poetry by constructing a training dataset of images paired with poems from the Tang Dynasty, thereby laying the groundwork for generative AI research in this fi eld. Secondly, we propose a basic paradigm for completing the task of generating images from classical poetry using a structure that combines a large language model and an image diffusion generation model (Stable Diﬀusion). In this paradigm, the large language model generates prompt words describing the illustrations of the classical poems, which are then input into the diffusion generation model. The generation model is fine-tuned using a Low-Rank Adaptation (LoRA) model to obtain the final illustrations. In the experimental section, we evaluate the necessity of the dataset, the feasibility of the new research paradigm, and the practicality of the new dataset within the new research paradigm through a combination of subjective evaluation and objective metrics. The results demonstrate that the proposed methods are scientific and reasonable.

Keywords: Generating Images from Chinese Ancient Poetry; Vertical Domain Large Models; New Datasets; Basic Paradigm; LoRA

编辑 | 许可

向上滑动查看注释

[1]刘炜、叶鹰：《数字人文的技术体系与理论结构探讨》，《中国图书馆学报》2017年第5期。

[2]Roberto Busa, “The Annals of Humanities Computing: the Index Thomisticus,” Computers and theHumanities, vol.14, 1980, pp. 83-90.

[3]毕文韬：《唐诗的图像生成》，硕士学位论文，东南大学，2022年。

[4]A. Radford, J. W. Alec et al., “Learning Transferable Visual Models from Natural Language Supervision,” International Conference on Machine Learning, PMLR, 2021, pp. 8748-8763; Aditya Ramesh, Prafulla Dhariwal et al., “Hierarchical Text-Conditional Image Generation with CLIP Latents,” arxiv preprint, arxiv: 2204.06125, 2022.

[5]Nataniel Ruiz et al., “Dreambooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation,” Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2023, pp. 22500-22510; Hertz Amir et al., “Prompt-to-Prompt Image Editing with Cross Attention Control,”arxiv preprint, arxiv: 2208.01626, 2022; Avrahami Omri et al., “Spatext: Spatio-Textual Representation for Controllable Image Generation,” Proceedings of the IEEE/CVF Conference on Computer Vision and PatternRecognition, 2023, pp. 18370-18380.

[6]Kumari Nupur et al., “Multi-Concept Customization of Text-to-Image Diffusion,” Proceedings of theIEEE/CVF Conference on Computer Vision and Pattern Recognition, 2023, pp.1931-1941.

[7]Lvmin Zhang, Anyi Rao, and Maneesh Agrawala, “Adding Conditional Control to Text-to-Image Diffusion Models,” Proceedings of the IEEE/CVF International Conference on Computer Vision, 2023, pp. 3836-3847; Yufan Zhou et al., “Shifted Diffusion for Text-to-Image Generation,” Proceedings of the IEEE/CVFConference on Computer Vision and Pattern Recognition, 2023, pp. 10157-10166; Zhengyuan Yang etal., “Reco: Region-Controlled Text-to-Image Generation,” Proceedings of the IEEE/CVF Conference onComputer Vision and Pattern Recognition, 2023, pp. 14246-14255.

[8]James Betker et al., “Improving Image Generation with Better Captions,” 2023, https://cdn.openai.com/papers/dall-e-3.pdf, accessed on May 12, 2025.

[9]Preechakul Konpat et al., “Diffusion Autoencoders: Toward a Meaningful and Decodable Representation,” Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2022, pp. 10619-10629.

[10]Hila Chefer et al., “Attend-and-Excite: Attention-Based Semantic Guidance for Text-to-Image Diffusion Models,” ACM Transactions on Graphics, vol.42, 2023, pp. 1-10.

[11]R. Rombach, A. Blattmann, D. Lorenz, P. Esser, and B. Ommer, “High-Resolution Image Synthesis with Latent Diffusion Models,” in Proceedings of the IEEE/CVF Conference on Computer Vision and PatternRecognition, 2022, pp. 10684-10695.

[12]Edward J. Hu et al., “Lora: Low-Rank Adaptation of Large Language Models,” arxiv preprint, arxiv: 2106.09685, 2021.

[13]Haiyan Zhao et al., “Explainability for Large Language Models: A Survey,” ACM Transactions onIntelligent Systems and Technology, vol. 15, 2024, pp. 1-38.

[14]Long Ouyang et al., “Training Language Models to Follow Instructions with Human Feedback,” Advances in Neural Information Processing Systems, vol. 35, 2022, pp. 27730-27744.

[15]参考 OpenAI, “GPT-4 Technical Report,” arxiv preprint, arxiv: 2303.08774, 2023。

[16]https://www.anthropic.com/index/introducing-claude, accessed on May 12, 2025.

[17]“Palm 2 Technical Report,” arxiv preprint, arxiv: 2305.10403, 2023.

[18]E. Mansimov, E. Parisotto, J. L. Ba, and R. Salakhutdinov, “Generating Images from Captions with Attention,” ICLR, 2016; S. Reed, Z. Akata, X. Yan, L. Logeswaran, B. Schiele, and H. Lee, “Generative Adversarial Text to Image Synthesis,” International Conference on Machine Learning, PMLR, 2016, pp. 1060–1069; H. Zhang, T. Xu, H. Li, S. Zhang, X. Wang, X. Huang, and D. N. Metaxas, “Stackgan: Text to Photo-Realistic Image Synthesis with Stacked Generative Adversarial Networks,” Proceedings of the IEEEInternational Conference on Computer Vision, 2017, pp. 5907–5915.

[19]T. Xu, P. Zhang, Q. Huang, H. Zhang, Z. Gan, X. Huang, and X. He, “Attngan: Fine-Grained Text to Image Generation with Attentional Generative Adversarial Networks,” Proceedings of the IEEE Conference onComputer Vision and Pattern Recognition, 2018, pp. 1316–1324; A. Ramesh, M. Pavlov, G. Goh, S. Gray, C. Voss, A. Radford, M. Chen, and I. Sutskever, “Zero-Shot Text-to-Image Generation,” International Conference on Machine Learning, 2021, pp. 8821-8831; M. Ding, Z. Yang, W. Hong, W. Zheng, C. Zhou, D. Yin, J. Lin, X. Zou, Z. Shao, H. Yang et al., “Cogview: Mastering Text-to-Image Generation via Transformers,” Advances in Neural Information Processing Systems, vol. 34, 2021, pp. 19822–19835.

[20]Ian Goodfellow et al., “Generative Adversarial Nets,” Advances in Neural Information ProcessingSystems, vol. 27, 2014.

[21]H. Cao, C. Tan et al., “A Survey on Generative Diffusion Model,” arXiv preprint, arXiv: 2209.02646, 2022;S. Frolov, T. Hinz, F. Raue, J. Hees, and A. Dengel, “Adversarial Text-to-Image Synthesis: A Review,” NeuralNetworks, vol. 144, 2021, pp. 187–209; R. Zhou, C. Jiang, and Q. Xu, “A Survey on Generative Adversarial Network-Based Text-to-Image Synthesis,” Neuro computing, vol. 451, 2021, pp. 316–336.

[22]Jonathan Ho, Ajay Jain, and Pieter Abbeel, “Denoising Diffusion Probabilistic Models,” Advances inNeural Information Processing Systems, vol.33, 2020, pp.6840-6851.

[23]A. Nichol, P. Dhariwal, A. Ramesh, P. Shyam, P. Mishkin, B. McGrew, I. Sutskever, and M. Chen, “Glide: Towards Photorealistic Image Generation and Editing with Text-Guided Diffusion Models,” ICML, 2022.

[24]C. Saharia, W. Chan, S. Saxena et al., “Photorealistic Text-to-Image Diffusion Models with Deep Language Understanding,” arXiv preprint, arXiv: 2205.11487, 2022.

[25]A. Radford, J. W. Kim et al., “Learning Transferable Visual Models from Natural Language Supervision,” ICML, 2021.

[26]A. Abuzayed, H. Al-Khalifa, “BERT for Arabic Topic Modeling: An Experimental Study on BERTopic Technique,” Procedia Computer Science, vol. 189, 2021, pp. 191-194.

[27]T. Brown, B. Mann et al., “Language Models are Few-Shot Learners,” Advances in Neural InformationProcessing Systems, 2020.

[28]C. Raffel, N. Shazeer et al., “Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer,” Journal of Machine Learning Research, vol. 21, 2020, pp. 1–67.

[29]A. Ramesh, P. Dhariwal, A. Nichol, C. Chu, and M. Chen, “Hierarchical Text-Conditional Image Generation with CLIP Latents,” arXiv preprint, arXiv: 2204.06125, 2022.

[30]Jason Lee, Kyun ghyun Cho, and Douwe Kiela, “Countering Language Drift via Visual Grounding,”EMNLP, 2019; Yuchen Lu, Soumye Singhal, Florian Strub, Aaron Courville, and Olivier Pietquin, “Countering Language Drift with Seeded Iterated Learning,” International Conference on Machine Learning (ICML),2020.

[31]James Kirkpatrick, Razvan Pascanu et al., “Overcoming Catastrophic Forgetting in Neural Networks,” Proceedings of the National Academy of Sciences, vol. 114, 2017, pp.3521-3526; Dingcheng Li, Zheng Chen, Eunah Cho, Jie Hao, Xiaohu Liu, Fan Xing, Chenlei Guo, and Yang Liu, “Overcoming Catastrophic Forgetting During Domain Adaptation of Seq2seq Language Generation,” NAACL, 2022; Joan Serra, Didac Suris, Marius Miron, and Alexandros Karatzoglou, “Overcoming Catastrophic Forgetting with Hard Attention to the Task,” International Conference on Machine Learning, 2018, pp. 4548–4557.

[32]Robin Rombach et al., “High-Resolution Image Synthesis with Latent Diffusion Models,” Proceedings ofthe IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2022, pp. 10684-10695.

[33]Jing Jiang, Yiran Ling et al., “Poetry2Image: An Iterative Correction Framework for Images Generated from Chinese Classical Poetry,” arXiv preprint, arXiv: 2407.06196, 2024.

[34]Vivian Liu, Lydia B. Chilton, “Design Guidelines for Prompt Engineering Text-to-Image Generative Models,” Proceedings of the 2022 CHI Conference on Human Factors in Computing Systems, 2022, pp. 1-23.

点击下方链接，下载原文

古诗生成图像数据集的构建及研究范式.pdf

如需购买《数字人文》期刊，请扫描下方二维码

封面.jpg

校对 | 肖爽

美编 | 王秀梅

数字使人文更新

数字人文门户网站：www.dhcn.cn

往期回顾

“九歌·推敲”小程序初版发布

2026年3月4日 15:22

2026-03-04 15:22 北京

清华大学中华传统文化智能实验室和清华大学数字人文研究中心“九歌”系统下的“推敲”小程序借助人工智能技术，将“推敲”功夫落地为一套可操控、可解释、可回退的智能化写作流程，让每位诗词爱好者都能拥有自己的“韩愈”。

唐代诗人贾岛因作诗时在“推”“敲”二字间犹豫不决，冲撞韩愈仪仗，后经韩愈点拨恍然大悟，两人遂“并辔论诗”，传为诗坛佳话。尽管该典故的真实性有待商榷，然职是之故，“推敲”一词渐被赋予“反复斟酌”之义广为人知。今人作诗，自然也离不开“推敲”的功夫。

九歌·推敲.jpg

小程序界面

【演示视频】

小程序实现功能

一

自定义创作参数：体裁、韵部、句式、题目、意境

二

智能锁定机制

字级锁定：点击字右上角的锁定标志，可锁定作者满意的字，
行级锁定：点击句末锁定标志，一键锁定整句。
锁定后：系统不予修改，只校验格律，给出建议。

三

实时字词推敲：点击空格时，系统自动推荐候选字，并给出推荐理由

四

推荐理由查看：点击字后下角的小灯泡标志，可查看推荐依据

高频搭配：诗词句内高频搭配，给出搭配频次。
名句引用：基于PPL加权评分的名句推荐。
古籍推荐：《海录碎事》《白孔六帖》等类书线索。
系统创作：结合题目和意境的智能建议。
友情链接：可跳转搜韵网查看相关诗句。

五

格律实时校验：边写边提示，格律问题一目了然

绿色：格律正确
红色：平仄错误
黄色：多音字
紫色：押韵错误

六

一键编辑功能

导出：一键保存分享作品。
撤销/重做：一键回退和重做。
历史记录：每行句末有历史记录标记，点击可查看修改记录。
清空：一键清空整首诗。

小程序创作流程

流程图.png

第一步：设置创作参数

（必选）选择体裁
（可选）韵部、句式、题目和意境

第二步：边写边推敲：

点击空格查看推荐

点击已有字查看理由

锁定满意的部分

第三步：格律校验：

关注颜色标记
调整不符合格律的字
完成作品

温馨提示：还可点击小程序右上角图标.png 图标，查看详细帮助文档或点击下方链接查看详细使用说明。

“九歌·推敲”小程序使用说明.pdf

当前AI作诗的痛点在于一键生成全诗，削弱了用户的创作自主权。九歌·推敲小程序使AI退居幕后，成为用户手中的“琢玉刀”——你推敲一字，它便回应一理；你锁定满意之处，它便退后静观——真正做到以技术之力助灵思之驰骋，实现AI与人文的智慧互动。

图3.png

欢迎扫描二维码或微信搜索“九歌推敲”试用~

指导老师：孙茂松

研发团队：韩玉凤、邓力凡、李文浩、从鑫、孔存良、白钰卓

END

公号二维码-1.jpg

数字使人文更新

数字人文门户网站：www.dhcn.cn

【清华育人故事】计算机系孙茂松：师者如松，薪火相传

2026年3月3日 11:44

2026-03-03 11:44 北京

他是人工智能领域的前行者，用代码书写诗的韵律；他是学生心中的“慈父”，用包容与坚守托举学子们成长；他更是一位怀揣赤子之心的师者，在科技与人文的交汇处，默默耕耘，静待花开。

Ta对学生的期待：人工智能时代已经来临，能够遇上这样一个科技大航海时代并弄潮其中，极其幸运，也非常幸福。让我们共同努力，以大志趣成就大事业，攻坚克难，不负时代。

他是人工智能领域的前行者，用代码书写诗的韵律；他是学生心中的“慈父”，用包容与坚守托举学子们成长；他更是一位怀揣赤子之心的师者，在科技与人文的交汇处，默默耕耘，静待花开。清华大学计算机系教授孙茂松，以数十载的坚守，在科研攻关与教书育人之间走出一条“融合之路”，他像常青树一般，用智慧与热爱滋润着脚下每一寸教育的土壤。

站在科技创新最前沿

孙茂松将科研报国作为初心与使命，身体力行奋战在科研最前线，他的热情与执着也深深影响着学生们。

2015年，孙茂松带领课题组研发了“九歌”——人工智能古典诗词创作系统。“九歌”取名自屈原的《九歌》，寄托着团队对技术与人文交融的深切期许。然而在项目推进过程中，团队成员付出了大量时间和精力，却无法见到迅速的成果产出，这使得很多学生萌生出焦虑与沮丧。孙茂松始终坚定地鼓励他们：“只要是好东西，就一定不会被埋没”。

经过两年多的开发迭代，当“九歌”登上央视节目与三位诗人同台竞技时，现场评委在四首诗中竟难以辨认哪首出自机器之手。这一刻，团队的学生们终于如释重负，此前的焦虑与沮丧被满满的成就感代替。更重要的是，学生们在这一过程中提升了综合能力，并相继发表多篇相关论文，展示了研究的成果与思考。目前，“九歌”已为来自140余个国家和地区的用户创作了3800万余首诗词。

“九歌”系统主页

“九歌”之外，孙茂松还带领课题组研发中国第一个中文大规模开放在线课程平台“学堂在线”，开创了中文慕课的先河，让优质教育资源跨越山海，惠及千万学子。

“技术真正的价值，在于它能如何改变人们的生活，如何推动文明的进步。”孙茂松坚定地相信这一点，更是带领学生深刻地践行这一点。

站在人才培养第一线

近年来，交叉学科、新兴学科迅猛发展，孙茂松设计并开设了“人文与社会科学计算导论”“人工智能大讲堂”等课程，在学生们心中播下学科交叉的种子。

电子系2018级本科生王芃翰在选修这门课后，对自然语言处理产生浓厚兴趣，随后与计算机系、社科学院的同学合作，申请了自然语言处理与经济学交叉的大学生研究训练项目（SRT项目），并由孙茂松指导。“老师不仅支持我们的想法，还经常指导我们，让我真正理解了什么是学科融合的创新。”王芃翰说道。

孙茂松参加“星火计划”活动

在人工智能教育热潮中，孙茂松保持着一份难得的清醒，他建议学生本科阶段不要急于“专注”于人工智能专业，而应该“将自身的‘底蕴’修炼得更加深厚”。

除了科研与教学，孙茂松始终心系学校创新人才的培养。作为“星火计划”名誉班主任、致理书院导师，孙茂松多次在清华大学科创日、全国青少年高校科学营、星火计划年会等活动中进行学术分享，鼓励同学们在探索学术问题的过程中要敢为天下先，勇于开拓，形成学术思维的碰撞；希望同学们立志做科技之大者，致广大而尽精微，解决有意义、有难度的真实问题。

在孙茂松的鼓励和支持下，不少学生投身到人工智能的创业中，更涌现出幂律智能、极睿科技、深言科技、面壁智能等人工智能创新企业。

站在学生身后

孙茂松不仅是学生们学术上的引路人，更是他们人生中的领路人。无论何时，他都坚定地站在学生身后，做他们最坚强的依靠。

在课题组学生陈慧敏眼中，孙茂松像一位“倔强”的“慈父”：他的“倔强”来自对学术的坚守——不是别人做了我们就要跟着做，要做对国家社会有意义的研究；他的“慈父”之心则体现在对学生无微不至的包容与关怀。“孙老师从不严厉苛责，总是以近乎玩笑的语气表达建议，学生们与他相处‘很舒服’。”陈慧敏说。而孙茂松课题组也成功入选了清华大学首批导学思政示范课题组。

学生们为孙茂松庆祝生日

在“九歌”研发过程中，学生们的疲惫和焦虑，孙茂松看在眼里，疼在心里，他一直尽全力与大家共渡难关。学生回忆，有一次孙茂松从国外出差回来，坐了十几个小时的飞机，却顾不上吃饭，揣着几袋小零食就风尘仆仆直奔组会，与大家一起细致探讨。2015年本科生特等奖学金获得者矣晓沅回忆说，“2015年的冬天，那时作为本科毕设内容，我做出了‘九歌’作诗系统的一个早期雏形。12月31日，跨年夜11点左右，忽然收到了孙老师的邮件，说他在测试时发现了demo系统的很多问题，并在邮件里一一详细列出问题及可能的原因。看到老师这么认真，我也顾不上休息，赶快修复相关bug并回复邮件汇报。零点的钟声就在邮件一来一去中悄然度过了。当时并不觉得累，只是感觉这是自己人生中很有意义的、难忘的一次跨年。”

日常生活中，孙茂松保持着朴素的本色。他出行工具是一辆自行车，环保健康。然而，在支持课题组发展上，孙茂松却从不吝啬。

和学生轻松融洽的相处氛围让孙茂松收获了难得的师生情谊。学生们曾经做过一本写满祝福的纪念册，还曾收集历届的学生们对他的祝福制作成生日短片。孙茂松也会给课题组学生送礼物，而且是根据学生的特点送上不一样的礼物。学生矣晓沅就曾收到他所赠的书籍，不仅有专业书，还有《诗词韵律合编》《怎样写古诗词》。

孙茂松给学生赠送书籍

2018年，孙茂松获得清华大学第十六届“良师益友”荣誉，颁奖晚会上，他在掌声中快步上台，对着场下抱拳行礼。当看到课题组学生拉起的横幅、晃动的灯牌时，孙茂松深受感动。晚会结束后，热闹散尽，在工作人员收拾舞台时，已经忙碌了一天的孙茂松还在场下和他的学生讨论实验结果。

三尺讲台见证了孙茂松教学科研的兢兢业业，青丝变银发，他在科技的理性与人文的浪漫间自如行走，以诗意情怀、赤子之心，在育人的道路上默默耕耘，也成为无数学生心中照亮前路的光。

供稿：研工部

编辑：刘芳芳

审核：刘蔚如郭玲

历史文本何以建构：以蒋廷黻《中国近代史》为例.pdf

历史文本何以建构：以蒋廷黻《中国近代史》为例

2026年3月1日 10:03

原创文祥微方树益 2026-03-01 10:03 北京

当下的计量史学或数字史学面临的一大质疑即源于低资源特点突出的历史数据与宏大分析需求之间的矛盾。面对一个特定的历史问题，研究者往往被迫使用有限且建构色彩显著的材料，削弱了研究结果的可靠性。

数字史学

文祥微 / 中国社会科学院大学历史学院

方树益 / 清华大学人文学院（通讯作者）

摘要：当下的计量史学或数字史学面临的一大质疑即源于低资源特点突出的历史数据与宏大分析需求之间的矛盾。面对一个特定的历史问题，研究者往往被迫使用有限且建构色彩显著的材料，削弱了研究结果的可靠性。针对这一现状，文章以蒋廷黻《中国近代史》人物关系的网络分析为例，提出数字史学未来发展值得探究的一条对策路径，即在材料不足的前提之下，可以围绕历史文本的建构性本身展开研究，探讨所谓的建构性在历史文本中如何体现。文章通过对该书中的人物关系进行量化分析、可视化呈现和结果阐释等工作，发掘出文本背后蕴含的蒋廷黻本人史学观念及政治观念，尤其关心其“近代化史观”的渗透分布，站在数字视角下重新验证、丰富学界关于该书性质、立场的认知，同时开拓数字史学未来发展的新思路。

关键词：数字史学网络分析建构性蒋廷黻《中国近代史》

引言

自计量史学诞生以来，其对计量方法的使用便常常遭到传统历史学者的驳斥，这些核心分歧来源于历史学的实践与方法上的分歧。在二十世纪六七十年代，阿瑟·施莱辛格（Arthur Schlesinger）和劳伦斯·斯通（Lawrence Stone）等历史学家，都曾对此发表过激烈的质疑。^[1]历史学对于计量方法的质疑，更多地集中在对数据集是否完备与可靠的质疑上。因为自兰克学派以来，历史学都遵循着穷尽现有的史料，以获取最科学、正确与真实的历史真相这一宗旨，尽管自后现代主义与叙事主义兴起之后，传统历史学是否能够找寻到绝对的历史真相这一点已经备受质疑。在新的叙事主义之下，我们更注重去分析史学作品由作者的主观意志、情感所建构起来的部分。就非量化的历史研究而言，这种叙事主义的思想早已普遍扎根在历史学界的共识之中，但是对从事计量史学的研究者而言，出于某种宏大的追求目标，他们总是希望能够探讨一些结构性的社会问题，所分析的对象也往往是整体的客观现实。与之相对的是，研究通常无法搜集到足够多的、令人信服的数据，因而被迫使用一些不甚可靠的记录，这些记录往往不免带有较强的建构色彩。最典型者如尚闻一和桑梓洲在研究东晋贵族网络时，仅采用了《世说新语》作为数据集，^[2]而带有强建构性的《世说新语》文本所反映的社会关系显然会与当时的社会现实存在较大的差异。这种通过有限的史料建构出来的数据集，无法真正得出一个客观可靠的结果。这种方法论上的根本缺陷是不容忽视的，也因此直接导致计量史学研究自诞生以来始终无法真正为正统史学所悦纳，徘徊于历史研究的边缘。

数字史学（Digital History）的概念最早由美国维吉尼亚大学（University of Virginia）成立的“维吉尼亚数字史学中心”（Virginia Center for Digital History）于1997年提出。^[3]“数字史学”与目前学界较常使用的“数字人文”（Digital Humanities）概念具有含摄关系，亦即数字史学包含在数字人文概念范畴中。之所以要特别标举数字史学概念，其主要作用是希望通过聚焦概念，来强化和推进数字技术在史学研究中的运用。^[4]一如数字人文同人文计算之间紧密且微妙的继承关系，可以认为，数字史学也是计量史学在互联网技术得以普及之后发展出来的新阶段，它在计量史学的基础上极大拓宽了研究范围，但其核心阵地仍然归属于原先计量史学所关心的那一部分。因此，无论是数字史学，抑或计量史学，其所面临的发展阻碍至少存在很大一部分重合之处。互联网的发展并未给我们带来完美无缺的历史数据集，计量史学一度面临的重大质疑，仍是数字史学未来建设亟待解决的基本难题之一。那么，就计量史学或数字史学未来的发展而言，应当如何打破这一局面？我们认为，一条值得探索的路径在于，任何量化的历史研究本质上都必须克服低资源的阻碍，在材料十分有限的前提之下，不妨将研究目标收敛到对于有限材料本身的讨论之中。在这一目标的驱动下，材料的建构性问题本身会成为一个值得探讨的方向。^[5]数字史学如能通过对于那些带有强建构性的材料本身加以分析，探讨其建构性的来源，无疑能够借此规避来自传统史学的诸多质疑。本文即以蒋廷黻《中国近代史》一书呈现的人物关系网络分析为例，探讨蒋廷黻个人的史学观念在其历史书写中如何得以体现。

蒋廷黻是中国近代史学史中无法绕开的史学大家。他既是中国少数几位近代史研究的开创者之一，同时也是近代史书写两大范式之一的“近代化范式”的开创者，为近代史研究建构了一个合理的分析框架与通史体系。多年以来，学界围绕着近代化范式以及蒋廷黻本人的争议不断，但是毋庸置疑的是，蒋廷黻与他的著作《中国近代史》是中国近代史学史研究中无法绕过去的里程碑。《中国近代史》一书是蒋廷黻在1938年战时状态中依据自己的旧有知识写就的一部著作，虽然全书仅5万字，但是因其独特的近代化史观和独到的见解，在国内的影响甚广。学界以往对蒋廷黻的研究，多集中在研究其政治生平、政治思想与史学思想的交互与实践、其作品的特征与影响等方面。如张玉龙先生所著《蒋廷黻社会政治思想研究》，梳理了蒋廷黻的人生经历与政治思想，认为其一生都在追求民族主义与现代化。^[6]蔡乐苏先生则在《蒋廷黻史学理念释要》中指出蒋廷黻所提出的史学理念具有时代意义，可归纳为史学是科学、识世知彼、国际平等、开放通商、整体现代化等五方面的思想。^[7]李勇、侯洪颖的《蒋廷黻与鲁宾逊的新史学派》指出蒋廷黻与鲁滨逊新史学派之间有着密切的联系。他在哥伦比亚大学期间，师从海斯，从而深受鲁滨逊一派的史学思想影响。这种学术传承使得蒋廷黻在历史学领域形成了独特的学术视角和研究方法。^[8]还有一些研究是探讨蒋廷黻对清华大学历史系建设重要的积极意义。如蔡乐苏先生的《蒋廷黻与清华大学历史学系课程新模式的建立》^[9]、刘超《中国近代史研究的早期开展：以清华学人为中心》^[10]等。也有集中于阐发蒋廷黻的学术思想与史学实践的研究，尤为关注蒋在近代史书写方面的贡献与影响，如尹媛萍的《蒋廷黻与中国近代史书写》^[11]、纪宁的《蒋廷黻的史学思想及学术实践》^[12]等文。应该如何理清、客观地认识蒋廷黻的史学观念，以往学界已给我们提供了诸多的实践成果。而在此基础上，我们将利用社会网络分析（Social Network Analysis，简称SNA）的方法对《中国近代史》一书中的人物关系进行一次初步的分析实践。社会网络最初来源于网络科学，是网络科学在社科领域的运用。目前，在历史学研究中逐渐被投入使用的社会网络分析方法，主要是从网络视角去挖掘人文领域的人物亲属、社会关系等。SNA一般通过数据提取、分析和输出图像几个步骤，逐步得出关于网络的中心性、直径、平均度、聚类系数、平均路径长度等指标，继而把握网络的整体特征，找出网络中的关键性节点和结构组件。^[13]

历史过程是唯一的且客观真实的，但不同史学家笔下的历史书写方式却多种多样。站在不同立场和角度的书写者，出于不同的主观意愿或目的，往往对历史材料进行选择性地编排和加工。^[14]在此过程中，历史学家主观的意志与情感渗透于文本之中。正如海登·怀特所言：“史学家和历史哲学家将自由地对历史进行概念化、理解其内容，以及用和他们自己的道德和审美愿望最相符合的任何意识模式来构成阐述历史过程的叙事。”^[15]而《中国近代史》是蒋廷黻在当时特定的历史背景之下基于自身的主观意志、史学观念所书写出来的主观文本。通过对这类主观文本的统计，有望展示出作者在建构这本书时的思想偏向。本文试图通过对该书的社会网络分析，解析该书的宏观布局，依次分析网络整体特征、网络中重要人物的各个中心性、网络聚类分析等部分，解答该网络的建构性体现在何处，进而得出该书作者蒋廷黻在其历史书写过程中所体现的史学观念。

一、数据处理与数据抽取

本文所使用的数据来源于中华书局2016年出版的《中国近代史》正文，书中所有序、标题、附注、参考文献等无关内容均作删除处理。在所得文本的基础上，我们基于哈尔滨工业大学社会计算与信息检索研究中心主持开发的语言技术平台（Language Technology Platform，LTP）分词、标注一体化工具包，标注出书中出现的所有人名，利用正则表达式删去其余文本。由于计算机的识别、标注往往是基于规则，因此难免会出现将“曾左李”认定为一个人名，或是将地名“尼布楚”视作人名等情况，另外，针对同一人物的不同称呼也无法实现自动消歧。对此，我们采用人工标注的方式对表格中存在的错漏之处予以修正。在史书的叙述之中，多按事件分段，一个段落一般会叙述同一件史事，而一件史事之中涉及的多个人物大概率共同参与了这个事件，据此可以建立人物之间的联系。由于LTP可以保留原文中的段落信息，我们以段落为单位，从中抽取所有人物的共现关系，凡得1,510条关系数据，其中涉及393位不同的历史人物。基于这些关系数据，我们建构起蒋廷黻《中国近代史》中所有人物的社会关系网络。我们将有关数据导入Gephi软件中，作进一步的分析。图1是该网络在胡一凡（Yifan Hu）布局下的整体可视化示意。

图1.png

图1 胡一凡布局下的《中国近代史》人物关系网络示意

二、网络整体特征及重要人物分析

经统计，《中国近代史》人物关系网络的平均度（average degree）为7.684，该网络所有节点的实际度分布（degree distribution）情况如图2所示。

图2.png 图2网络节点度分布散点图

度分布所反映的是网络中节点度数的概率分布情况，以此可以分析《中国近代史》人物网络中不同节点度数的分布情况。其中，大部分节点的度都在10以内，而高度数的节点数量总体较少，表现出类幂律分布的特征。由此我们可以推断，少部分度数较高的人物在网络中占据了较为核心的位置，与更多的人物产生更多的关联。蒋廷黻在书中明显地将视线聚焦于少数精英人物，而对大多数小人物的描绘则相对简略，仅用几笔轻轻勾勒，并未在这些小人物身上投入过多的文字，这也是传统历史书写的普遍特征。在此基础上，我们可以挑选其中度数最高的20个节点所对应的人物进行进一步的分析，如表1所示。

图3.png 表1《中国近代史》人物关系网络节点度数排名（前20名）

节点度数是在网络分析中判断节点重要性的指标，一个节点的度数越大，意味着这个节点与其他节点的联系程度也更高，该节点在网络中就占据更为重要的地位，而对一部历史著作而言，角色的度数中心性排名越高，就说明这些角色处于叙述的核心位置，是作者展开叙述的重要角色。我们观察表1的具体数据可以发现，排名前五的人物分别为李鸿章、林则徐、琦善、袁世凯和张之洞，其度数分别为91、84、72、62、46。这正是本书叙述中的关键人物，同时也是主导局面的精英人物。李鸿章的重要性，不仅源于他在近代史中的卓越贡献，更在于他在近代史叙述中占据的关键地位。他深度参与了从鸦片战争至甲午中日战争这一系列重大历史事件，并始终位于历史叙述的主要位置。他如一根主要线索将这些历史事件串联起来，因此自然占据度数中心性最高的位置。蒋廷黻特地为其写文章《李鸿章——三十年后的评论》，对李氏的评价颇高，“在当时，他还有一个政策，别人则袖手无策。他还有半知，别人则全不知。”^[16]他认为李氏的失败在于掣肘者颇多，受限于时代，但李氏为自强运动和外交事务付出的贡献则不可忽略。

林则徐的度数排在第二，是因蒋廷黻在书中尤为在意林则徐，并提出“两个林则徐论”。他在书中直言：近代史中有两个林则徐，“一个是士大夫心目中的林则徐，一个是真正的林则徐。前一个林则徐是主剿的，他是百战百胜的……真的林则徐是慢慢的觉悟了的”，并批评林则徐“知而不言”，认为“他让主持清议的士大夫睡在梦中，他让国家日趋衰弱，而不肯牺牲自己的名誉去与时人奋斗”。^[17]在他的观点中，中国之所以在鸦片战争后未能走上改革之路，很大程度上是因为当时社会对林则徐的迷信心理，这种迷信导致了一种难以摆脱的保守心态，从而阻碍了改革的步伐。尹媛萍认为蒋氏此说难免有牵强之处，这种判断的偏差出自他对知识分子一贯的不满与期待。^[18]但他对林则徐的重视确实毋庸置疑。

而在主流论述中并不占主要地位的琦善之所以排到第三的位置，也和蒋廷黻对琦善的重视有关。与后代常批评琦善是“卖国贼”“奸臣”等负面评价不同，蒋廷黻在书中赞扬琦善“可说是中国近九十年大变局中的第一任外交总长”。^[19]他非常认可琦善在外交方面的才能，认为琦善是那个时代真正清醒的人物，并写作《琦善与雅片战争》一文以赞扬琦善审察中外强弱的形势和权衡利害轻重的外交意识远在时人之上，并借琦善来宣扬自己“知己知彼办外交”和“忍气吞声近代化”的主张。而近代史研究上，破除神化林则徐、丑化琦善的书写传统，正是自蒋廷黻始。以今天的鸦片战争研究成果看，他在重新研究琦善这一点上的成就或许并不突出，但是在他那个时代却开风气之先，真正做到了他所追求的“历史化中国外交史、学术化中国外交史”。^[20]而他研究琦善，目的是研究近代中国应采取怎样的政策对付帝国主义的侵略，也同时含有对现实的影射。蔡乐苏先生的研究认为，蒋廷黻之所以在意琦善，目的在于为中国抵抗帝国主义侵略找一条切实可行的道路，即运用外交手段求得和平，以现代化的方法来与帝国主义相抗衡，从这个角度而言，琦善的主张对中国近代史而言有着至关重要的意义，对琦善的研究也促进了蒋廷黻另一个主张的提出，即中国必须实现现代化。站在蒋廷黻的角度，重视琦善似乎是一个必然的选择。总之，度分布数据的结果或许无法验证学界中蒋廷黻是否在其书中“抑林扬琦”这样的主观判断的观点，^[21]但是林则徐与琦善排到这么高的位置，也可以说明蒋廷黻在书中对他们极为重视这一客观事实。我们似乎可以通过这样对主观文本的数据分析，探究出作者本人建构这本书时的部分主观意愿。

而后，我们再来观察该网络的中介中心性（betweenness centrality）的情况。中介中心性主要反映一个点与其他点之间建立连接的能力与强度，它关注的是某点“介于”其他二者之间、获取两点间信息的“能力”，也即该点的“中间人”程度。这些节点在网络中发挥着至关重要的桥梁作用。我们提取出该网络中中介中心性排名前10的节点所对应的人物加以观察，如表2所示。

图4.png 表2《中国近代史》人物关系网络节点中介中心性排名（前10名）

基于表2，我们发现李鸿章、林则徐、康熙、袁世凯、琦善、孙中山等人发挥着重要的沟通角色。在大多数文本中，这些度数中心性最高的人物因描写上的绝对优势，也往往会成为最高中介中心性的角色。但同时我们也不能忽略其他情况，比如孙中山和洪秀全。我们可以观察到，孙中山的排名有所上升，从度数中心性排名17上升到了中介中心性的第6位，纵观整个中国近代史，孙中山确实在其中扮演着重要的桥梁作用，他沟通起了诸多不同的势力，并由此推动了革命的发展进程。而对比表1的度数中心性排名情况，也可发现洪秀全作为一个自身度数并不高的节点，却在中介中心性的排名中取得了较为靠前的位次。

回到原文考察，发现正文部分仅第二章“洪秀全与曾国藩”较多记述了洪秀全及太平天国运动相关的事迹，从整体上讲，有关叙述较为集中。不难发现，与洪秀全发生关系的其他太平天国起义人员皆是底层民众，如平民出身的杨秀清、韦昌辉等人物。这些人物即使通过起义也未曾真正与当时掌握权力的上层统治者有过多的联系，只有作为领袖的洪秀全既与太平天国统治集团这一群体内部保持紧密联系，又能同其他重要人物构成关系，于是导致洪秀全频繁充当太平天国集团内外交流的关键“桥梁”。实际上，这也是中国旧式农民起义的特征，即只有起义群体内部联系紧密，但是与原有的统治者阶层接触并不多，只有洪秀全这样的起义集团的领袖可以频繁接触到统治者阶层。这就将我们引向了另一个问题，即蒋廷黻为何要花如此大的篇幅去描述太平天国运动。

从书中的行文可以看出，蒋氏对于太平天国运动的态度是贬大于褒的，他在书中直言：“洪秀全想打倒满清，恢复汉族的自由，这当然是我们应该佩服的。……但是他的人格上及才能上的缺点很多，而且很大。倘若他成了功，他也不能为我民族造幸福。总而言之，太平天国的失败，证明我国旧式的民间运动是不能救国救民族的。”^[22]在蒋廷黻看来，旧式农民起义的特点就是单个或几个主导人物来领导整个起义，而这显然并非科学的方式。他花费如此篇幅去描写，是想表明旧式的农民起义并非解决中国问题的良策。在他的近代化史观之下，给予旧式农民起义的评价是偏负面的。这种对于农民起义的态度问题也正是近代化史观与革命史观的冲突点之一，在革命史观的论述下，对于旧式农民起义的评价是正面居多。以革命史观为主的近代史书写，由于根源上对阶级斗争的肯定，所以对太平天国运动的评价都较为正面，关键词都离不开“农民革命”“资产阶级民主革命”“空想农业社会主义”“进步阶级”“进步政党”等。如革命史观的代表大家范文澜先生指出，太平天国革命运动的最大意义“就在于它是中国历史上第一次提出政治、经济、民族、男女四大平等的革命号召，……揭开了中国旧民主主义革命的序幕，……太平革命是中国历史划时代的大事件，与五四运动同为一百年来历史上两大转变时代的标帜，它的光荣成就永不会磨灭，它的伟大精神也永远在继续和发展”。^[23]二者的区别导致了其历史书写中关注侧重之差异。由上可知，通过网络分析方法，似乎可以帮助我们找出些许作者书写时显性与隐性的思想观念。

三、网络聚类分析

目前一般认为Louvain算法是最好的非重叠社区检测算法。^[24]该算法是一种基于模块度（modularity）的社区检测算法。本研究即借助Louvain算法对网络节点进行模块化处理，以解析度为1、随机的方式计算得到结果的模块度为0.594，可证聚类效果较好，网络应具备明显的社群结构，共包含27个大小不一的模块。每一模块的详细规模可以参见图3。

图5.png 图3 《中国近代史》人物网络不同模块所含节点个数的散点示意图

由于分出的模块较多，且各模块规模差异显著。经计算，单一模块平均包含的节点个数约为11.93。本文仅保留节点数量在20以上的模块予以进一步的分析，它们分别是模块0、模块2、模块3、模块5、模块8、模块23、模块25。根据社群中的度数中心性，遴选出各社群内部节点度数最高的8个重要人物，如表3所示。

图6.png 表3 《中国近代史》网络重要模块一览

我们首先利用F-R（Fruchterman Reingold）布局算法对模块2所包含的节点及其关系给予可视化示意，如图4所示。模块2中排名较高的人物，主要与洋务运动与维新变法有关，该聚类包含节点在整个网络中的占比为18.3%。洋务运动与维新变法等革新性的运动，无不与蒋廷黻在全书中所倡导的“近代化”史观息息相关。蒋廷黻称叹洋务运动为中国近代化开始的自强运动，“是我国近代史上第一个应付大变局的救国救民族的方案”^[25]。然而洋务运动的失败，从世界近代化进程的角度来说，实则是近代文明与中古文明冲突的必然结果。他同时认为维新变法是我国近代史上救国救民族的第二个方案。这个方案的主旨是要变更政治制度，其最后目的是要改君主立宪，以期民族精神及维新事业得在立宪政体之下充分发挥和推进。^[26]他认为“变法运动无疑的是比自强运动更加西洋化近代化”^[27]。蒋廷黻依托这两部分史事，较为集中地表达了自己的近代化理念。

模块3、模块23与模块25则同为中俄外交关系相关的主题，我们将三个聚类放在一块观察，如图5所示。这三个聚类中，尤以聚类23的规模最大，占比为18.6%，为全书占比最高的模块。这表明在《中国近代史》一书的叙述之中，中俄关系占据极其重要的位置。蒋廷黻十分重视中俄关系史的研究，在他主持清华历史系之时也极力提倡日本史和俄国史的研究，这是基于他对“地缘政治”的考虑。在他作为一位外交家的视野中，俄国与中国地缘上紧密联系，且俄国的外交目的并没有表面那么和善，对中国的危害程度较日本更大。在当时民众大多尚未对俄国抱有警惕之心的时候，蒋廷黻认真地审时度势，精准地指出了外患所在。

图7.png 图4 F-R布局算法下的模块2

图8.png 图5 F-R布局算法下的模块3、模块23与模块25

而后，模块0的规模大小仅次于模块2和模块23。如图6所示，模块0主要是中英外交史相关的人物，特别是与鸦片战争密切相关。林则徐与琦善在其中扮演了重要角色，余下的耆英、懿律、叶名琛、黄爵滋、关天培等人也是这段历史中不可或缺的关键人物。纵观整个聚类分布，该模块占比为14.6％，排名在第三位，这反映出蒋廷黻对于近代史叙述的关注尤为凸显地集中在中英关系相关的问题上。而之所以在意相关问题，是因为蒋廷黻一直在反思，鸦片战争之后，中国为何没有走上近代化的道路这一问题，认为对鸦片战争等历史事件的叙述有助于民众理解中国近代化的进程与中国在国际舞台上的地位和角色，试图借其唤醒国人对近代化的认识。^[28]

图9.png 图6 F-R布局算法下的模块0

此外，模块5则与辛亥革命到孙中山逝世这段历史叙事有密切关系。如图7所示，在这一模块之中，排名靠前的是孙中山、徐锡麟、汪精卫、蒋介石等人。其中，孙中山占据第一位次，不仅是因为孙中山确实是这段历史叙述之中的重要人物，也是因为蒋廷黻在该书中花了很大的篇幅叙述孙中山的生平与政治理念，尤为宣扬三民主义，此为宣扬自己的政治理念而作。他认为应该“贯彻总理的遗教”^[29]，认为“目前的困难是一切民族在建国的过程中所不能避免的。只要我们……谨守中山先生的遗教，我们必能找到光明的出路”^[30]。而且他尤为重视孙中山的观点。蒋廷黻指出，孙中山先生对西方状况和现代文明的理解，明显超越了李鸿章、康有为等人物。这种超越源于其思想经过了长期的科学培养，因此他所制定的救国策略不仅具体明确，并且全面考虑了各种因素。^[31]而更重要的是，孙中山所提出的“军政—训政—宪政”的治国策略，与蒋廷黻的政治主张几乎一致。^[32]由此，我们不免可以看出蒋廷黻在进行历史叙述之时，常常将自己的现实政治理念渗透在文字之中。究其原因，可深究到蒋廷黻在哥伦比亚大学学习之时，当时的“新史学”中心哥伦比亚大学对他的学术理念有着初步定型的作用。当时鲁滨逊（James H. Robinson）虽已离开哥大，但因其在该校任教25年之久，极大地影响了哥大的史学研究路径与风格。蒋廷黻也因此继承了鲁滨逊所强调的史学“应为现实政治服务”这一主张。^[33]所以，他常常将自己对中国出路的思考寄托在历史叙述之中。

最后，模块8中的人物则主要与中、日、朝三国外交事件有关，尤其聚焦朝鲜为脱离清政府控制所发动的甲申政变。在甲申政变中，洪英植、金玉均和朴泳孝同属开化党人，是为亲日派，其背后的靠山是竹添进一郎。金允植与闵泳翊、尹泰骏等人同为事上党的领袖，是为亲华一派，其后盾是袁世凯。^[34]开化党人趁中法战争之际发动叛乱，最终被袁世凯镇压。这一事件是甲午中日战争中的开端之一，本在原书叙述中未着太多笔墨，却在模块化结果时凸显。正如此例，通过网络分析去研究史学作品，或许能够帮助我们注意到一些原本未能注意到的内容。

以上，不难看出，每一模块内部都能归纳出相对明确且彼此独立的主题，这些主题主要根据作者的叙述重点划分。模块0、模块2、模块5、模块8分别对应着蒋廷黻对于中英外交、变法运动、辛亥革命、中日朝关系等不同史事的关注侧重。而模块3、模块23与模块25则对应着蒋对中俄关系的注重。从聚类分析中，我们可以观察到蒋廷黻此书的论述重点何在，他的目光一直都聚焦于外交关系上，不仅是因为他自己是外交官，同时他也一直希望通过外交的胜利推动国家的胜利，推动国家近代化的进程。在《中国近代史》一书之中，处处贯穿着他对外交事业的热情，对中国外交状况的重视、对近代史上因外交失败导致国力衰退的惋惜和对国家未来外交转好的期望。正如蔡乐苏先生所言：“蒋廷黻是政论家，他的政论大多携带着历史；蒋廷黻又是史学家，他的史论史著从更深层的角度看，实际上大多也是政论。史学与政论在蒋廷黻的著作中只是形式的区别，并无实质的不同。这即是说，他的史论史著寄藏着强烈的现实关怀。”[35]蒋氏的外交理念和对现实的关怀，也处处体现在网络结构之中。

图10.png 图7 F-R布局算法下的模块5

图11.png 图8 F-R布局算法下的模块8

小结

为洞察《中国近代史》一书的内部结构，本文基于该书人物关系建构社会网络，通过一系列针对基本拓扑性的度量分析，从而发掘或验证蒋廷黻蕴含在历史书写之中的史学观念。纵观蒋廷黻对李鸿章、林则徐和琦善等人的重视并深究原因，会发现这些都体现着他所推崇的近代化史观。他总是着眼于时代与变革，并深切关注着国内外形势发展，急迫地为国家找到新的出路，所以目光总聚集在这些与时代动向和创新变革密切相关的重要人物身上，并通过这些历史人物的叙述表达自己的史观与对现实的观点。通过对中心性的研究，我们实证了一些以往研究中的部分观点，如蒋廷黻对琦善、林则徐的重视，也发现了个别人物在书中的地位与以往认知的出入，如洪秀全虽在叙述中不占主要地位，却发挥着重要的桥梁作用。并且我们通过聚类分析发现，全书的模块内容大多与外交事件关联密切，体现出蒋廷黻对外交的重视和以外交救国的观念。

从整体上看，研究结果展现出蒋廷黻三方面的史观：一是对近代化的重视，在他的研究中，他一直都希望唤起国家和民族对近代化的认识和重视。二是对外交史的偏重，这寄托着蒋氏对在国际生活之中寻找出路的希冀。三是以史为用，史著寄藏着他强烈的现实关怀。在以史为用的纲领下，他的历史叙述之中才一直贯穿着对近代化与外交史的侧重，而这三点无疑都共同指向其对现实政治、家国危亡的担忧。纵观全书与整个网络，他的历史叙述始终致力于消除当时民众所持有的狭隘民族主义思想和对国际形势的无知，并致力于刺激国民对时代挑战、全球视角和近代化进程的紧迫感，明确强调中国的未来在于开放和改革。

前文中提到，数字史学常见的诟病，主要来源于对数据集的诟病。传统史学多认为数字史学所使用的数据集过于单一，而无法涵盖其他的史料，但是在数字人文的计量观念中，一个封闭且纯净的数据集才能够支撑更为科学的结论，而无需在其中塞入太多史料。同时，数据集的建构性也常受到传统史学的质疑，认为其建构性过强，难以得出更为科学可靠的结论。针对这一矛盾，本文试图从数据集的建构性出发，探究其建构成分。蒋廷黻的史学思想反映在整本《中国近代史》之中，同时也反映在基于该书所提取的数据集与于此建构的社会网络之中。我们似乎能够通过这样的尝试，将材料本身主观建构的部分直接纳为研究的分析对象，反而规避数字史学研究可能引发的部分争议。尽管我们并不认为未来数字史学的发展仅仅会被框定在这样局限的研究视角以内，但在各种探索尚未成熟的当下，这种回归到文本建构性本身的讨论无疑有助于我们在开展进一步深化的研究之前，预先对我们使用的材料取得更为深刻、全面的认知，也能在提高分析严谨性之余丰富研究的维度。

Constructiveness in Historical Texts: Take Chinese ModernHistory by Jiang Tingfu for Example

Wen Xiangwei, Fang Shuyi

Abstract: The current quantitative history or digital history stems from the contradiction between the prominent low-resource characteristics of historical data and the grand analytical demands. Faced with a specific historical issue, researchers are often forced to use limited and constructed materials, which undermine the reliability of research results. In response to this question, this study takes the network of personal relationships in Jiang Tingfu’s ChineseModern History as an example. It proposes a strategic path worth exploring for the future development of digital history. That is, under the premise of insufficient materials, research can be conducted around the constructiveness of historical texts themselves, exploring how the constructiveness is reflected in historical texts. The article quantitatively analyzes, visualizes, and interprets the network of personal relationships in the book, uncovering the historical and political views of Jiang Tingfu himself, especially focusing on the penetration and distribution of his “modernization historical perspective”. From a digital perspective, it revalidates and enriches the academic understanding of the nature and position of the book, while also opening up a new path for the future development of digital history.

Keywords: Digital History; Network Analysis; Constructiveness; Jiang Tingfu; ChineseModern History

编辑 | 许可

向上滑动查看注释

[1]William G. Thomas, “Computing and the Historical Imagination,” Susan Schreibman, Ray Siemens, and John Unsworth, eds., A Companion to Digital Humanities, Oxford, Blackwell Publishing, 2004, p.79.

[2]Wenyi Shang, Zizhou Sang, “Solidity in a Turbulent Flow: The Social Network of Aristocratic Families in the Eastern Jin Dynasty,” Journal of Historical Network Research, Vol. 5, no.1, 2021, pp.1–32.

[3]王涛：《挑战与机遇：“数字史学”与历史研究》，《全球史评论》2015年第1期。

[4]邱伟云：《验证、修正、创新：数字史学方法的三重功能》，《南京大学学报（哲学·人文科学·社会科学）》2019年第2期。

[5]方树益：《从中国传统文献学学科建设反思数字人文发展的逻辑进路》，《图书馆》2024年第5期。

[6]张玉龙：《蒋廷黻社会政治思想研究》，北京：中国社会科学出版社，2008年，第365—368页。

[7]蔡乐苏、尹媛萍：《蒋廷黻史学理念释要》，《清华大学学报（哲学社会科学版）》2008年第3期。

[8]李勇、侯洪颖：《蒋廷黻与鲁宾逊的新史学派》，《学术月刊》2002年第12期。

[9]蔡乐苏：《蒋廷黻与清华大学历史学系课程新模式的建立》，《北京社会科学》2004年第4期。

[10]刘超：《中国近代史研究的早期开展：以清华学人为中心——兼论新史学的权势网络及治史形态》，《清华大学学报（哲学社会科学版）》2014年第3期。

[11]尹媛萍：《蒋廷黻与中国近代史书写》，《史学史研究》2016年第1期。

[12]纪宁：《蒋廷黻的史学思想及学术实践》，《青海师范大学学报（哲学社会科学版）》2015年第1期。

[13]赵薇：《社会网络分析与“〈大波〉三部曲”的人物功能》，《山东社会科学》2018年第9期。

[14]张文涛：《区分历史书写的三种范式：认知性的历史、认同性的历史与承认性的历史》，《甘肃社会科学》2014年第4期。

[15]海登·怀特：《元史学：十九世纪欧洲的历史想像》，陈新译，南京：译林出版社，2004年，第594页。

[16]蒋廷黻：《中国近代史》，北京：中华书局，2016年，第263页。

[17]蒋廷黻：《中国近代史》，第16—17页。

[18]尹媛萍：《蒋廷黻为何“抑林扬琦”》，《博览群书》2013年第1期。

[19]蒋廷黻：《中国近代史》，第227页。

[20]蔡乐苏、尹媛萍：《反抗帝国主义的另一条道路——论蒋廷黻的琦善研究》，《湖南大学学报（社会科学版）》2008年第6期。

[21]关于此观点可参见尹媛萍：《蒋廷黻为何“抑林扬琦”》，《博览群书》2013年第1期。

[22]蒋廷黻：《中国近代史》，第49页。

[23]范文澜：《中国近代史》上册，北京：人民出版社，1955年，第151页。

[24]Mianmian Shi, Huaping Cao, “Association Visualization Analysis for the Application Service Layer and Network Control Layer,” Communications in Computer and Information Science, 2018, pp.153-164.

[25]蒋廷黻：《中国近代史》，第107页。

[26]刘文沛：《从〈中国近代史〉看蒋廷黻的史学思想》，《忻州师范学院学报》2006年第1期。

[27]蒋廷黻：《中国近代史》，第108页。

[28]尹媛萍：《国际秩序中的自处之道：论蒋廷黻的中国近代史研究》，博士学位论文，清华大学，2011年，第81页。

[29]兰梁斌：《20世纪三四十年代历史书写中的康有为——以陈恭禄、蒋廷黻、范文澜为中心》，《杭州师范大学学报（社会科学版）》2018年第5期。

[30]蒋廷黻：《中国近代史》，第126页。

[31]蔡乐苏、尹媛萍：《蒋廷黻史学理念释要》，《清华大学学报（哲学社会科学版）》2008年第3期。

[32]尹媛萍：《蒋廷黻与中国近代史书写》，《史学史研究》2016年第1期。

[33]刘超：《中国近代史研究的早期开展：以清华学人为中心——兼论新史学的权势网络及治史形态》，《清华大学学报（哲学社会科学版）》2014年第3期。

[34]蒋廷黻：《中国近代史》，第84页。

[35]蔡乐苏、尹媛萍：《蒋廷黻史学理念释要》，《清华大学学报（哲学社会科学版）》2008年第3期。

点击下方链接，下载原文

如需购买《数字人文》期刊，请扫描下方二维码

封面.jpg

校对 | 肖爽

美编 | 王秀梅

数字使人文更新

数字人文门户网站：www.dhcn.cn

往期回顾

https://j.map.baidu.com/e8/6aI

征稿通知|第五届东亚古籍数字人文国际论坛（DHEAC 2026）

2026年3月1日 10:03

2026-03-01 10:03 北京

会议旨在促进古籍资源在数字化、智能化信息环境下的整理、开发与应用，搭建古籍研究者与信息技术工作者沟通与协作的平台，并加强全球范围内古籍相关机构、团体与个人的合作，为东亚古典学的研究提供全新的视角和更广阔的研究空间。

第五届东亚古籍数字人文国际论坛
(2026)

征稿通知

DHEAC: Annua l International Conference on Dig ita l Humanities for East Asia Classics

宗旨

Objectives

历经千载流传至今的古代典籍是人类文明最重要的载体。在漫长的历史时期中，包括中国、日本、韩国等国家在内的东亚地区，以汉字文化为基础，形成了数量巨大的古籍文献并保留至今。这些古籍文献是学术界认识、理解、诠释、研究东方文明的依据，也是东西方文化交流最重要的媒介。东亚古籍也是欧洲及北美学术界研究的重要材料，尤其是国际汉学界。西方对东亚古籍的研究对东亚本土学术也产生了巨大影响。随着时代的进步，数字技术，尤其是OCR、深度学习、知识图谱等智能技术深刻改变了古籍的整理、阅读、研究及传播的模式和方法，同时，网络环境将全球的古籍研究者和爱好者更加紧密地连接在一起，使得古籍学有关人文成为一个特定的研究领域。

日期 Date

一

时间：2026.7.22 —2026.7.28

注：日程表暂定

工作坊为选择性参加（需另付注册费）。有意参与者请于在线报名期间（2026年4月20日 - 4月30日）选择以下三项工作坊之一。

报名学员不足十人的工作坊将予以取消。

工作坊（一）：吾与点工作坊（北京大学数字人文研究中心主持）
工作坊（二）：DocuSky 工作坊（台湾大学数字人文中心、台湾数字人文学会主持）
工作坊（三）：古籍整理与智能化实践（中华书局古联公司主持）

地点 Venue

二

韩国首尔
成均馆大学（Sungkyunkwan University，SKKU）

会议组织Organizer

三

01 主办单位

成均馆大学中国文化研究所

02 联合主办单位

成均馆大学校中国文化研究所

成均馆大学校中语中文学科

东亚知识文化教育研究所

翰林大学翰林科学院

03 协办单位

北京大学数字人文研究中心
南京农业大学人文与社会计算研究中心南
京师范大学文学院语言大数据与计算人文研究中心
辽宁大学东北数字人文研究中心
鲁东大学区域国别学院
高丽大学汉字汉文研究所
清华大学-同方知网数字人文联合研究中心
香港浸会大学中国传统文化研究中心
香港城市大学中文及历史学系
中国台湾法鼓文理学院
中国台湾数位人文学会
浙江大学文学院数字人文研究中心
中华书局•古联（北京）数字传媒科技有限公司
中山大学数字人文联合研究院

名单持续更新中 ......

04 赞助

韩国研究财团

大会主题 Conference Theme

四

数智赋能

未来东亚古典研究的新范式与新趋势

Digital-Intelligence Empowerment: New Paradigms and Trends in Future East Asian Classical Studies

Proposed Tracks

征稿主题

五

语料库及语义资源构建 (Corpus and Semantic Resource Development)
大模型与生成式人工智能在古典学中的应用 (LLMs and Generative AI for Ancient Classics)
语义技术与知识工程 (Semantic Technologies and Knowledge Engineering)
文化分析及数据运算 (Cultural Analysis and Computation)
数字平台及资源开发 (Platform and Resource Development)
医学・农业古书研究 (Specialized Domains in Classics)
各类文化遗产的数字保护及活化利用 (Digitization and Revitalization of Cultural Heritage)
智慧图书馆及出版融合 (Smart Libraries and Integrated Publishing)
教育及课程开发 (Curriculum and Discipline Development)
空间人文学与数字地图 (Spatial Humanities and Digital Mapping)
多模态融合与沉浸式体验 (Multimodal Data Fusion and Immersive Experiences)
众包、数字传播与公共人文 (Crowdsourcing, Digital Communication, and Public Humanities)
其他古典文献的智能化开发及活化利用相关主题 (Other Related Topics)

Important Dates

主要日程

六

摘要提交开始日： 2026 年 2 月 20 日 23:59
https://forms.cloud.microsoft/r/TADbKPhTcn
摘要提交截止日： 2026 年 3 月 30 日 23:59
录取结果通知： 2026 年 4 月 20 日 (通过第一作者电子邮件)
在线报名： 2026 年 4 月 20 日 - 4 月 30 日
https://forms.cloud.microsoft/r/07kCABGZxw
邀请函发送： 2026 年 5 月 20 日 - 5 月 30 日 (发送至每位参与者的电子邮件)
论文全文提交截止： 2026 年 7 月 1 日

【注意事项】

为提高质量，录取篇数限制在 80 篇以下，其中包括研究生论坛 20 篇。
摘要可使用英语与汉语或英语与韩语，亦可用英语与母语撰写。在线提交摘要链接：https://forms.cloud.microsoft/r/TADbKPhTcn
在线报名链接：https://forms.cloud.microsoft/r/07kCABGZxw（4 月 20 日开放）
论文全文可使用发表者所选语言撰写。摘要被录取者，请于 7 月 1 日前按论文格式提交全文。
摘要将印刷于会议手册，全文将存放于 U 盘，报到时发放。

住宿 Accommodation

七

参与者可自行安排住宿。

会务组将提供优惠酒店信息，如需代为预订，请在线上报名时提交预订信息。预订优惠酒店需支付定金，请注意支付定金后取消将产生30%的违约金。线上报名截止后如需变更信息，请参与者直接联系酒店。

酒店名：宜必思首尔仁寺洞大使酒店（双人间、大床房每晚价格相同，以下为入住日价格）
7月21日~23日：含早餐（韩币）146,300元，不含早餐 132,000元。
7月24日~26日：含早餐（韩币）179,300元，不含早餐 165,000元。

https://maps.app.goo.gl/HibLjaMJbh4ewP4F6

Conference Fee

会议费用

八

（1）住宿费、交通费自理。

（2）工作坊、论坛注册费如下表：

【备注】

缴纳方式将于线上报名时另行通知；
工作坊注册费包含茶点、材料费（不含午餐）；
论坛注册费包含午餐、茶点、材料费及晚宴；
学生请在线上报名时提交学生证扫描件。

Presentation Language

汇报语言

九

推荐使用汉语、英语、韩语之一，亦可使用母语。
汇报当天，为便于与听众沟通，发表者务必准备英语或汉语PPT。

咨询 Inquiry

十

联系人

許喆博士

联系方式

邮箱：heochul@gmail.com

微信: chulheo

Call for Sponsors and Co-organizers

赞助与合办单位征集

十一

欢迎相关研究机构、高校、企业成为大会合办单位或提供赞助。对于赞助单位，大会期间将安排独立展位，展示赞助企业产品。并提供在大会网站、会议手册和背景板上显示企业LOGO、在会议资料包中发放企业介绍资料、安排大会报告或分会报告、分会场独家冠名等权益。

详情请咨询許喆博士。

数字人文视阈下清代学政群体的任职原则、时空分布与社会网络分析.pdf

数字人文视阈下清代学政群体的任职原则、时空分布与社会网络分析

2026年2月27日 10:11

原创王依艺 2026-02-27 10:11 北京

本文在数字人文视阈下，运用正则表达式对清人笔记《清秘述闻》及其续书中的学政类文本进行数据挖掘，完成字号、籍贯、入仕、官职、任职时间等多维度数据的结构化整理，构建清代学政的基础信息库。

数字史学

王依艺 / 浙江大学文学院

摘要：本文在数字人文视阈下，运用正则表达式对清人笔记《清秘述闻》及其续书中的学政类文本进行数据挖掘，完成字号、籍贯、入仕、官职、任职时间等多维度数据的结构化整理，构建清代学政的基础信息库。在此基础上，利用量化统计、地理信息系统（GIS）等探析清代学政的任职原则与时空分布，并借助社会网络分析方法（SNA）绘制清代学政群体社会

关系网络图谱，揭示不同时期的社群结构。本文尝试以数字技术赋能传统史料的“远读”，拓展文史研究的视野与方法路径，为清代学政制度与士人群体研究提供新的材料基础与分析范式。

关键词：《清秘述闻》清代学政文史数据挖掘社会网络分析

清代学政总理一省之学务，负责主持岁科两试、学校巡视、督察教官等教育事务。已有诸多研究围绕学政的制度沿革、权责分工等方面展开探讨，然其官员群体的结构特征、选任机制及其群体之间的社会关系网络，仍有赖更大规模、系统性的资料发掘与定量分析。

《清秘述闻》及其续作为清代文人系统性记载科名故实的史料笔记，分乡会考官、学政、同考官三类，分年编载，叙述方式规整系统，具备文本规律性与结构化特征，适宜引入数字人文方法。^[1]本研究以《清秘述闻三种》为数据源，借助正则表达式与文本挖掘技术，抽取学政官员的核心信息字段，构建清代学政数据库，并在此基础上进行统计分析与可视化呈现。

本文旨在通过对清代学政相关数据的结构化整理、量化分析与可视化展示，探讨两个核心问题：（1）作为总理一省学务的官员，清廷在差遣学政时主要考量哪些因素？其出身、籍贯、年龄、履职经验、派遣频次等变量是否揭示出制度化的选任偏好？（2）清代学政群体间的社会关系网络如何？在不同时期里又呈现出什么样的社群结构？围绕上述问题，本文尝试展示数字人文方法在“远读”志书史料等文史文本中的潜力，并以《清秘述闻》中的学政类记载为案例，进行数据挖掘、分析与可视化，为未来大规模、自动化文史数据处理提供方法论与实践参考。

一、从文本到数据的结构化转换流程

（一）文本选择与数据来源

本研究的基础数据取自中华书局1982年整理出版的清代史料笔记《清秘述闻三种》，即法式善撰《清秘述闻》、王家相等撰《清秘述闻续》、徐沅等撰《清秘述闻再续》的合集。法式善创其体例，事以类从，乡、会考官类和同考官类记载了清初顺治至嘉庆初年历科考官、试题及解元、会元、殿元的姓名、籍贯等，学政类记叙清代各省学政一职的演变及其姓名、字号、籍贯、出身、任职时间等，是清代科举与文教制度研究的重要材料。法式善《清秘述闻》记载时间截至嘉庆四年（1799），后有王家相、徐沅等人续作，完整覆盖了清代科举存续的时段。为了提升数据处理的系统性与规范性，本文基于OCR识别与人工校正后的《清秘述闻三种》纯文本格式，以便后续信息提取。

（二）信息挖掘流程与正则表达式构建

为高效处理结构规整的清人史料笔记《清秘述闻三种》，本文主要采用正则表达式（Regular Expression）进行自动化数据抽取。通过构建专属的学政数据抽取方案，并设计正则表达式规则，批量提取官员姓名、任职时间、派遣省份、官衔、籍贯、入仕方式等核心字段。在抽取过程中，辅以人工校对、版本比对、重名识别与数据去重等环节，确保结构化结果的准确性与历史可信度。采用该方法主要基于《清秘述闻三种》记载学政信息的表述具有高度范式化特征，具体表现为：

■人名识别（常以“××字××”格式出现）

■籍贯识别（如“浙江仁和人”“满洲正白旗人”等）

■入仕途径（常见格式为“年号+干支年份+功名”，如“顺治辛卯举人”“康熙戊戌进士”等）

■任职年份与时任官职（“××年任”“××年以××任”等“时间+职务”组合，如“顺治八年任”“雍正七年以内阁学士任”等）

在对文本规律进行观察和归纳的基础上，本文设计了多阶段正则匹配策略，通过“匹配→标记→标签辅助定位→再标记”的步骤逐层提取与规整信息，确保数据的结构化系统性与语义识别的准确性。所有提取结果整理后导入Excel表格进行字段整理与人工校验，共计获得1,771条数据。以下为部分字段与正则表达式构造示例：

图1.png

表1 《清秘述闻三种》学政数据正则表达式构建示例

正则表达式进行数据抽取的方式适用于格式高度统一、边界清晰的文本，在熟悉掌握文本规律的前提下，正则表达式基于规则的手动设计，能够针对特定模式进行精确匹配，适合处理结构化或半结构化的文史数据。在AI迅猛发展的现今，正则表达式在文史数据挖掘中仍存在明显优势。正则表达式的规则是显式的，易于理解、修改和调试，如果匹配结果出错，人文学者可以直接调整规则，而如DeepSeek、ChatGPT等AI模型往往是“黑箱”，难以追溯错误原因。同时，AI可能缺乏在古籍经典相关领域足够的训练数据，泛化能力受限，正则表达式则无需依赖训练数据，只要设计合适的规则，就能有效挖掘特定领域的数据。对于文史学者而言，学习正则表达式的门槛远低于掌握AI技术，只需了解基本语法即可上手，但处理语义复杂、上下文依赖强的文史数据，譬如情感分析、主题挖掘，AI的自然语言处理能力更强，文本适应度更广。因此，人文学者可以根据文本的特性灵活选择数据挖掘的方法。

本文以《清秘述闻三种》为例，展示了一种基于正则表达式的数据挖掘模式。该模式通过设计有针对性的规则，高效提取文本中的关键信息，如人物籍贯、入仕信息、任职时间等。这种方法具有较强的可迁移性，可广泛应用于地方志、史志、族谱等结构化或半结构化文本的挖掘工作，为文史研究者提供了一种高效工具，助力他们在浩如烟海的古籍文献中深入探索，拓展研究的深度与广度。

二、清代学政任职原则与时空分布探析

清初学政制度多沿用明制，在顺天与江南以都察院御史提督学政，简称“学院”；其余各省则主要以按察使司佥事提调学政，简称“提学道”。经顺治、康熙、雍正三朝屡次调整，至雍正四年（1726），结束原先提学御史与提学道并行的格局，各省所设学官一律俱称提督学政。^[2]为行文统一，下文概以“学政”称之。

鉴于《清秘述闻三种》学政类文本记载存在诸多错讹之处，文本数据经结构化转换之后，仍需辅以钱实甫《清代职官年表》、黄政《〈清代职官年表·学政年表〉补正》与魏秀梅《清季职官表》等进行综合校正，^[3]最终得到1,852条学政履职数据（包含同一人多次任职学政与已任命未就任的情况，在职超过一任但未变更任职地点者按一任计），共计1,405人，涵盖顺治元年（1644）至光绪三十二年（1906）历任学政的主要信息，^[4]作为本文后续分析的基本样本。

将所得1,405位学政数据通过关联匹配“中国历代人物传记资料库”（CBDB）人物ID、“人名权威—人物传记资料库”权威号，结合江庆柏编著《清朝进士题名录》^[5]进行人物匹配与消歧，以获取生卒年、科甲名次等未被《清秘述闻三种》所记载的信息，并通过“中国历史地理信息系统”（CHGIS）获取人物籍贯地及其清代所属行政区划、经纬度等数据。在完成数据结构化与清洗之后，围绕清代学政的出身、籍贯、职衔、年龄及履职经验五个维度进行统计分析，以期揭示该制度下官员选拔背后的空间分布模式、人才标准偏好与制度运行逻辑。

（一）科甲名次

清代学政一职属于文官，其入仕资格即所谓“出身”在仕途中尤为重要。统计1,405名学政的入仕途径，除去7人入仕途径不明以外，进士1,375人、举人10人、举博学鸿词科6人、荫生3人、贡士2人、贡生1人、官学生1人，其中进士出身者比例高达97.87%，这表明清代学政官员群体的入仕途径主要是通过科举考试，特别是进士科。

科举制度在清代是选拔官员的主要途径，尤其是在学政官员的铨选中，进士出身几乎是必要条件。非进士出身者出任学政的官员人数极少，主要集中在顺、康两朝。清初，各地随着政局的稳定陆续开科取士，在人才储备还不够充分的情况下，简放学政并不专门用进士出身人员，但自雍正朝始，除王河以荫生出身任奉天府丞兼学政的个例以外，所有学政官员皆进士出身。

结合《清朝进士题名录》中的科甲名次，清代入仕的学政科甲名次可考者有1,336人，其中第一甲为149人，第二甲为838人，第三甲为349人。若考察学政科甲名次在整个清代进士中的占比，则第一甲中，大约有39.52%担任过学政一职。譬如金德瑛系乾隆元年（1736）状元，被认为“于衡文当可胜任”^[6]，于是有山东学政之命。钱棨三元及第，先后曾担任顺天府乡试同考官、广东乡试副考官、云南乡试正考官、提督云南学政等。第二甲中，大约有9.28%的进士充任过学政。而第三甲之中，这个比例低至1.99%。显而易见，清廷对学政的选拔标准非常高，派遣学臣时，相比第三甲出身的进士，科第名次位于前二甲的进士更受青睐。原因或可想见，前二甲进士在科举考试之中表现更为优异，举业文章更为娴熟，也更有能力胜任衡文之职，尤其在雍正三年（1725）以考差铨选学政后，前二甲进士具有更加明显的优势。当然，这并不意味着中式第三甲的进士完全被摒弃在学政一职的选派之外。清代文官迁转制度、庶吉士制度等实则为第三甲出身的进士保留了一定跻身更高品级的可能性。

清代学政的选拔高度依赖科举制度，尤其是进士科，体现了清廷对学识与能力的重视。同时，科第名次高的进士在学政选拔中更具优势。“学政及考官、同考官，皆进士出身”^[7]的硬性规定，也直接影响了学政籍贯的地理分布。

（二）籍贯分布

经过对《清秘述闻三种》所载学政籍贯信息的系统梳理，并辅以CBDB及“人名权威—人物传记资料库”的补充考证，现存2位学政的籍贯信息仍未能确考。此部分数据的缺失对整体研究的完整性与可靠性影响甚微，故在后续分析中予以排除。在省份区划上，为便于统计且与后续行文保持统一，并结合清代学政辖区分合的情况，现主要划分为：直隶（包含顺天）、江南、浙江、山东、江西、河南、福建、山西、湖广、广东、陕甘、云南、四川、广西、贵州15个地区，^[8]并且将来自满洲、蒙古、汉军八旗的学政统一划为“八旗”，统计结果如表2所示。^[9]

图2.png

表2 清代学政籍贯分布（单位：任）

清代作为少数民族政权，旗人参与国家权力运作是其与其他朝代相比最显著的特征之一。学政一职亦有旗人当选，有清一代，学政为旗籍者共有92任，73人，其中满洲旗人数最多，共有43人，约占总数58.9%，其次分别为汉军旗25人和蒙古旗5人，分别占总数的34.25%和6.85%。清代旗籍学政占清代学政总任数的4.97%，这个比例低于其他如督、抚、布、按等一些官职，盖因学政专主文衡，以定去取，其学识眼力均需称职，非科甲出身者难堪其任。

图3.png 图1 清代历朝旗籍学政数量变化

据图1，清代各个时期委派旗籍学政的数量并不均衡。顺治帝当政时期，旗籍学政的数量为0。主要原因是，清朝入关之初，虽已沿袭明代科举与学政制度，但大部分旗人还未经受儒家典籍的浸润，不熟悉科场运作与衡文标准，难以堪当其任。康熙时期所委任的17位旗籍学政当中有14位属汉军旗，占比高达82%。直至康熙五十二年（1713）起，满洲镶白旗人海宝以检讨任云南提督学院，始有满洲旗学政被陆续派出，侧面反映出清代前期在科举金字塔结构中最低一层以及面对对象最广的院试当中，主要还是依赖于熟读四书五经与科场运作的汉人。

清朝初期，在帝王推崇汉文化的影响下，旗人通过科举入仕的人数逐渐增多，相应旗籍学政的任职数量也随之增加，并在乾隆时期达到顶峰。在清朝末年，光绪皇帝在位期间，旗籍学政的委派数量再次形成了一个小高峰，这一时期的旗籍学政主要以满洲旗人为主，其中不乏皇室宗亲子弟。这一现象可能与晚清社会动荡不安的局面息息相关。清廷或许是希望通过任用旗人担任学政这一关键职务，加强对社会思想的钳制，并进一步巩固对知识分子的控制，以应对日益严峻的统治危机。

图4.png

图2 清代学政籍贯地理分布

从地理分布上来看，对比数量统计与图2，非旗籍清代学政籍贯分布有以下特点：一、地域之间的显著不平衡性。省份间的学政人数差距极为悬殊。位居前列的江南与浙江，各自出产学政人数均超过300任，而排名末尾的广西、贵州，学政任数均不足20。表现在空间分布上，东南地区学政分布密集且数量众多，北方地区广泛分布但数量较少，而西北、西南地区分布稀疏。二、学政籍贯分布与进士籍贯分布高度吻合，这是由学政须进士出身的选拔标准所决定的。

从历时性的角度来看，为更加直观地观察各籍学政在不同统治时期的数量呈现，兹以不同时期派遣各籍学政的年均值来辅助分析，如图3所示。^[10]

图5.png

图3 清代任命学政籍贯年均人数趋势

从历代帝王所派遣学政籍贯的年均值来看：

（1）江南籍和浙江籍官员在学政选拔中占据着绝对优势地位，占清代总任职数的44.2%。历朝派遣江南与浙江籍学政的年均数量始终高于其他省份，在顺治至雍正时期呈现出快速上升的趋势，与其他省份间的差距也在扩大。江、浙籍学政年均派遣人数在雍正朝到达高峰之后有所下降，但对比他省，仍具有显著优势。盖江浙文风之盛远轶他省，进士中额者多，被铨选为学政者亦多。而雍正以后下降的原因，并非江浙文风转向薄弱，而是学政派遣的频率与数量通常比较固定，他省籍贯学政派遣人数的提升在一定程度上削弱了江浙籍的优势。

（2）在清前期，尤其是顺治朝，直隶、河南、山东、山西等北方地区的学政年均派遣人数相对较高。这主要是由于清初官僚体系尚未完善，清廷在遴选学政时，多从主动投诚的官员与士人中择选。相较于南方士人，北方士人因地缘优势，更早地选择了归顺，因此清初学政中北方官员占比较高。

（3）产出学政数量较少的边远地区，如广东、广西、贵州、云南等地，其学政年均任命人数呈现出前期低、后期高的增长趋势，如图4所示。清初这些省份出产学政数量较低，源于地区文教基础薄弱与开科取士时间晚的双重影响。进入清中后期，随着政局稳定、文教发展，加之分省取士制保障了边远省份的会试中额，这些地区的进士数量随之增多，^[11]学政数量亦有所增长。尽管这一增长幅度难与文教发达地区匹敌，仍显示出清代中后期边远地区文风的显著振兴。

图6.png

图4 广东、广西、贵州、云南籍学政年均任命人数趋势

学政作为士子师表，肩负着重要的教化职责，其铨选至关重要，能够被简命为学政者，其品行与学识皆属上乘。清代学政的籍贯分布不仅反映了各地文教水平与人才储备的差异，也揭示了清代科举制度与文教政策的演变。旗籍学政的逐步增多，反映了旗人在科举体系中的逐步融入与清廷对文教控制的加强。江浙地区作为文教重镇，始终在学政选拔中占据主导地位，而边远地区的学政人数则相对稀少，凸显了清代文教资源分布的不均衡性。对学政籍贯分布的量化分析，不仅有助于更直观地呈现清代文教的区域差异，也从考官选任的维度进一步揭示了科举制度与文教政策对地方文教发展的深远影响。

（三）职衔品级

学政与乡试考官类似，系中央派往地方之差官，也称“学差”。学政有任期，有职衔，但无品级。据《清史稿》，提督学政“以侍郎、京堂、翰、詹、科、道、部属等官进士出身人员内简用，各带原衔品级”^[12]，则学政一职没有固定的品级之说，而是由他们原属的官职品级决定的。

有清一代一共简放1,852任学政，其中官衔可考者共计1,729任，基本可以反映清代学政迁入来源的全貌。^[13]

图7.png

图5 清代学政迁入来源变化趋势^[14]

清初沿袭明制，顺天与江南以御史提督学政，各省提学道“内而部郎，外而府道，皆序俸荐升”，顺治四年（1647）改为“专以部属考选”，顺治十四年吏部尚书孙廷铨疏请复旧制，“于进士出身之部郎、府道，按俸举荐”^[15]，因而清初部属官员成为学政迁入的主要来源。顺治十年，在左都御史金之俊的建议下，清廷简用词臣提督直隶、江南、江北学政，后因江南销奏案又改江南学院为提学道，故仅直隶地区学政持续以翰林差遣。翰林简放学政者在清初的占比较低。康熙朝屡次议论各省学政官制的改革，试图将直隶提督学院的形式推广到其他省，以彰显统治者崇文教的目的。先用之江南、浙江这样的大省，后陆续差遣翰林官前往其余外省，翰林官员比例开始增加。至雍正帝于四年（1726）结束了提督御史与提学道并行的旧制，一体俱称学院，并且谕令“凡部内郎中等官膺督学之任，则加以编修、检讨之衔，使其名实相称”^[16]，则此自雍正朝起，以翰林简放学政者一直占据较高的比例。清代以翰林院职衔简放学政者共计647任，占据官衔可考者的37.4%。简放最多者为正七品的翰林院编修，多达370任，其次为正四品的翰林院侍讲学士，共计70任，外放学政成为翰林官员迁转的主要途径之一。

再看清代学政官员具体的品级在各个省份的分布。为便于比较各省份之间的学政品级差异，采用量化评分方法将官员品级从正一品（18分）至从九品（1分）依次赋分，构建连续的品级分值，并计算不同行省学政官职品级的平均值，以此反映清廷派遣学政时官衔品级的整体态势。具体计算结果如表3所示。

图8.png

表3 清代各地区派遣学政平均品级[17]

其计算结果大体符合魏秀梅通过列举嘉、道、咸、同、光五朝的学政所带官衔得出的“大致派往大省者官阶高，派往小省者官阶低”的结论。^[18]清廷对不同地区派遣的官员体现出鲜明的等级制度，正如清人黄与坚所言：“曩者任官之法，惟畿辅地方督学以侍御，其后以宫僚，他省则例遣部员。”^[19]因此，顺天学政平均品级分值最高，浙江、江南学政的平均品级次之。江、浙素为人文炳蔚之地，所派遣学政多为较高品秩，以示朝廷对江、浙士林的重视。湖广的结果稍显意外，其时以湖广为大省，而遣往学政的平均品级反而不如山东、广东等中省，其具体原因尚待进一步考察。

清代学政派遣官员的演变是一个动态的过程。从清初沿袭明制以部属官员为主，到康熙、雍正两朝逐渐将翰林官员作为学政的主要来源，最终形成了以翰林简放学政为主体的格局。这种转变不仅体现了清廷对文教的日益重视，也使得外放学政成为翰林官员晋升的重要途径。清代学政虽无固定品级，其官阶由原职衔决定，但在派遣实践中却形成了鲜明的等级格局——大省学政官阶普遍较高，小省则相对偏低。

（四）年龄统计

官员年龄与官阶晋升、官职委派息息相关。结合CBDB与“人名权威—人物传记资料库”的人物生年数据，^[20]其中有明确生年的学政共计703位。清代官员屡典文衡、数任督学的情况不在少数，而先后任职时的年龄数据都是有意义的样本，因此该处统计将个体每次被任命为学政时的年龄均作为独立有效数据纳入统计，以充分体现数据的全面性和完整性。清代学政的年龄分布情况如图6所示。

图9.png

图6 清代学政群体年龄分布

从图中可以看出，清代学政官员的年龄分布较为广泛，涵盖了从20岁到75岁的各个年龄段。其中，40岁至50岁之间的官员数量最多，形成了一个明显的年龄高峰，表明这一年龄段的学政官员在整体中占据主导地位。相比之下，30岁以下的年轻官员和60岁以上的年长官员数量相对较少。这说明，30岁以下的年轻人成为学政官员的比例较低，而60岁以上仍继续任职的官员也不多见。这一分布反映了朝廷在选拔委派学政官员时在年龄上的偏好与考量。

对比清代学政、乡试考官、会试考官的平均年龄、最小年龄与最大年龄，兹列表如下：

图10.png

表4 清代乡、会试考官与学政年龄比较

统计可知，清代学政任职时的平均年龄大约为45.46岁，与乡试考官平均年龄的44岁相差无几。40至45岁之间，正是中国古代官员最为年富力强的时候。而会试考官的平均年龄则远远年长于学政与乡试考官，大约为58.3岁。究其原因，主要是由于会试考官一般简用阁、部大员，年纪轻轻而身在高位者甚罕，大多数年轻官员是达不到会试考官的任职资格的。

就最大年龄而言，清代学政与乡、会试考官的数据非常接近，分别为75、76、78岁，实际上已经非常接近中国古代官员在职寿命的极限。若以耄耋之年就任会试考官，或许还能收获德高望重之称颂，而若年逾七十就任京畿地区以外的学政或乡试考官，其路途之艰辛、车马之劳累、抡才之任重、阅卷之疲乏，对于年迈者的身体素质和思维能力都是极大的挑战。清初，左都御史金之俊曾上疏弹劾河南提学道佥事黄日祚，指出其“年逾七十，昏聩异常，关防全疏，蠧弊百出，以致生童不服”，认为其已难担提学重任，疏言：“仰见皇上崇儒重道，培养教化之盛心，岂容以昏耄不堪、劣状昭著之人久肩提学重任也？”^[21]实因提学一职关系綦重，反对因年老而头脑迟钝、思维不敏者久任提学的声音颇为激烈。结合清代学政年龄段的分布，年在七十以上者屈指可数，譬如康熙三十六年（1697）陆鸣珂第一次充任山东提学道时年已七十二，这样的例子实不多见。

就最小年龄而言，学政与乡试考官分别为22岁和21岁，皆已年满弱冠。康熙二十三年（1684）冬，山西道御史张集题奏：“学臣文运攸关，必得年富力强，才华俊杰之员，方能考拔得才，不宜专用资俸深满部郎道守升补。”^[22]他提议选派督学当以青年才俊为先，实不必以资历论。因而学政官员群体中年纪在三十以下者不在少数。但太过年轻的官员，即使品行学识俱佳，也并不一定能被简放为学政。道光十七年（1837），罗惇衍本已被简命为四川学政，经道光帝召见，“人品学问，均属去得，惟年纪过轻，恐一切事宜未能周悉老到，着仍留京供职”^[23]，至道光二十六年，罗惇衍才再次被委以学政一职。

清代学政官员的年龄结构反映了清廷在选拔学政时的多重考量：既要求官员具备丰富的学识与经验，又需确保其体力和精力足以应对繁重的职责。

（五）履职经验

自顺治元年（1644）起，至光绪三十二年（1906）撤裁学政，有清一代学政至少有1,405人。其中，仅出任一次学政者有1,088人，两任者有222人，三任者66人，四任者24人，拥有五任学政经历的人有4人，而浙江山阴人童凤三履任次数最多，共计六任。^[24]清代官员屡次任职学政的情况不在少数，故常有“屡掌文衡”“屡掌文柄”之类的表述，这种说法体现了对清代文官的高度褒扬。但总体而言，大部分学政官员仅有一次督学的经历，三次以上者较为稀见。下图所统计的是清代历朝学政履职次数的情况。

图11.png

图7 清代历朝学政任职次数情况统计^[25]

据图7可知，在清代前期，尤其是顺、康两朝，极少有学政多次履任的情况。自雍正朝始，派遣具有任职两次及以上履职经验的学政官员占比22.37%，较顺、康两朝有明显增长，这个占比在乾隆、嘉庆朝达到峰值，分别大约为37.63%和36.30%，之后道、咸、同、光朝大约都维持在27%—30%，说明雍正以后派遣学政，较为重视其经验属性，有履职经验的学政能更好地发挥衡文校士的职能。

将学政与同样出使地方、执掌文柄的乡试考官进行对比，可为学政一职的经验属性提供另一维度的参考。根据《清秘述闻三种》所提供的清代乡试考官数据，与学政数据进行消歧之后，得以计算这两类考官之间的人员重合度，得到结果如下：有清一代共计学政1,405人，乡试考官2,487人；既出使过学政，又出任过乡试考官者共计848人；所有乡试考官中，担任过学政一职的官员占比为34.10%，而所有学政中，担任过乡试考官一职的占比高达60.36%。

再统计学政与乡试考官之间的转换频次，分别计算所重合人员第一次担任乡试考官的年份和第一次担任学政的年份，比较二者年份之先后，统计结果为，在所重合的848人中，有615人第一次担任乡试考官的年份早于他们第一次担任学政的年份，108人第一次担任学政的年份早于他们第一次担任乡试考官的年份，还有125人在同一年中既担任了乡试考官又担任了学政，即清人姚元之所谓“试差未回即授学政”^[26]的情况。上述统计结果可以推导出以下结论：

1.学政与乡试考官之间存在较高的人员重合度，尤其是在学政群体中，担任过乡试考官的比例非常高。其原因在于，学政主持岁、科两试，管理地方学务，乡试考官则负责在国家抡才大典中扮演校士选士的重要角色，在职掌上高度贴合。

2.学政与乡试考官的选拔标准可能存在一定程度的重叠，且学政的选拔标准更高。乡试考官仅凭文去取，而学政还兼负造士育士、督察学校教官、振兴地方文教的重任，得失远在衡文之外，因而对官员的资历与能力要求更高。从清人对学政与乡试考官的讨论中，不难看出，时人普遍认为担任学政者需具备更为全面的综合能力。如清人黎士弘指出，乡、会考官“于文字皆非专掌”，锁院校勘不过二十昼夜，时间有限，又“分经别席”，阅卷数量也少，而学政“领专敕，历三年久，通都下邑，士自羁丱壮老，占一经以上者，皆得而论定之”^[27]，学政有更长的任期和更广泛的权力，能够全面考察各地读书人，其评判标准必须精准恰当，才能真正选拔出有才华的人才。清人王步青也强调，主考官在乡试中的评判时间短暂，选拔结果往往具有偶然性，而学政则“月有课，岁有试”，能够深入了解各地文风，“每试一郡，文甫出而他郡从风”^[28]，在任期内树立榜样，引领文化风气，因此，学政在文风传承和文化影响方面的作用比主考官更为重要，自然也对学政的资历和能力有更高的要求，也就造成了学政官员中有三分之二左右都曾担任过乡试考官，而乡试考官中仅三分之一出使学政的数据差异。

3.统治者颇为青睐简命有乡试考官履职经验者出使学政，乡试考官成为统治者拔举学政的主要渠道之一。据以上统计，共计740人在他们第一次出使学政以前都曾充任过乡试考官，占清代学政总人数的52.67%。若依重合人员第一次出使学政的年份统计这740人历朝派遣人数的情况，则年均值趋势如图8所示。

图12.png

图8 历朝先试差后学政官员派遣人数年均值（单位：人/年）

据图8，顺治朝学政具有试差经历者数量较少，先试差后学政的情形自康熙朝始有显著提升，且在雍正朝之后稳定在一个较高的数值。顺治朝学政具有试差经历者数量较少，主要与清初政局未稳、科举制度与明制的衔接尚在调整有关。此时中央与地方的科举与学政派遣机制尚未完全定型，学政一职的派遣沿袭明代成例，以御史和按察使司佥事、副使督学，具有乡试考官履历者比例较低。顺治、康熙朝对学政官制屡次调整，大幅提升了以翰林任学政的比例，这些出身翰林院的官员往往是科举制度里的佼佼者，亦是充任乡试考官的主要人选。雍正朝以后，考差制度的创立与完善，成为评定考官学问的重要手段，或亦促使考验学问合格且具有衡文选才经验的乡试考官成为皇帝拔擢学政的主要来源之一。^[29]

综上所述，清代学政官员的履职经验呈现出明显的阶段性特征，顺、康两朝多次任职者较少，自雍正朝起，多次任职学政的比例大幅上升，显示出统治者对学政经验属性的重视。学政与乡试考官之间存在显著的人员重合度，但学政职责更加全面且复杂，因此选拔标准更高。统治者倾向于选拔有乡试考官经验的官员出任学政，乡试考官成为学政选拔的重要渠道之一。这一现象与学政官制的改革及考差制度的创设都密切相关，突显了清代学政官员选拔中对经验与能力的双重考量。

以上，通过对清代学政的量化分析，主要从科甲出身、籍贯分布、职衔品级、年龄统计和履职经验五个方面进行了详细探讨。总体而言，清代学政的选拔机制高度依赖科举制度，注重官员的学识、能力和经验，尤其是进士出身和科甲名次较高的官员更受青睐。通过对学政的量化分析，可以更深入地理解清代科举制度与文官选拔之间的紧密联系，以及清廷在文教领域对人才选拔的严谨态度。

三、清代学政群体社会关系网络研究

（一）清代学政群体社会关系图谱与核心人物分析

将去重后的清代学政人物ID导入到CBDB中查询社会关系，距离限制为1，循环数限制为10，时间限制为明朝至民国，再将其导入到Gephi中，绘制清代学政社会关系图谱（见图9），共计得到2,160个节点，1,770条边。该社会网络图呈现出“核心—边缘”结构，中间核心部分节点高度密集且紧密相连，呈现出复杂交织的社会关系，且存在多个活跃的子群，而边缘存在大量孤立节点，且节点之间连线稀疏，这些成员与核心群体连接较少，大多处于网络中的孤立位置。图10利用Gephi软件的过滤功能过滤度中心性小于2的节点，即没有或有且只有一个节点与之相连的节点，以展现清代学政社会关系图谱中存在关联的核心区域。

图13.png

图9 清代学政社会关系图谱

图14.png

图10 清代学政社会关系图谱（过滤度中心性<2）

图15.png

表5 清代学政群体社会关系网络度中心性排序表

按度中心性（Degree Centrality）排序，表5列举了度中心性在14以上的排名前26位的人物。其中，纪昀以124的度中心性排名第一。纪昀曾多次担任乡试、会试主考官，并于乾隆二十八年（1763）任福建学政，曾任《四库全书》总纂官。其主要社会关系类型有友人、师生、诗文往来等。而乾嘉学派代表人物钱大昕、阮元分列第二、第三，钱大昕曾任广东学政，而阮元曾任鲁、浙学政，两典会试，皆在清代学术史上有深远影响。度中心性在25以上的人物中，翁方纲、朱珪、朱筠、洪亮吉、施闰章皆出任过地方学政，为地方文教做出了突出贡献，且在清代学术史、文学史上声名显赫。而如王昶、戴震、孙星衍、段玉裁、章学诚等清代知名学者，虽不曾就任学政，但与出任学政的清代官员交往频繁，联系密切，因而在清代学政群体社会关系中排名居前，反映了清代学政群体与学术精英之间的广泛互动。

值得注意的是，CBDB还揭示了一些度中心性较高但名气相对较低的人物，如度中心性为16的刘廷榆。进一步分析其社会关系数据发现，刘廷榆的社会关系数据源自朱卷，其受知师包括李振祜、潘世恩、汤金钊、毛式郇、季芝昌、罗文俊等，这些人物均曾担任学政职务。这一特殊的师承背景，为其在社会网络分析中呈现出的高中心性特征提供了合理解释，凸显了师生关系在清代学政社会网络中的重要作用。

在数字人文视角下，度中心性作为一种量化指标，能够直观反映清代学政社会关系网络中人物的重要程度。通过结合CBDB与Gephi的可视化分析，不仅可以揭示学政群体的核心人物及其社会联系，还能挖掘出边缘人物的潜在影响力。这种方法为研究清代学术网络与社会结构提供了新的视角，同时也为理解学政群体在清代文教与学术发展中的角色提供了数据支撑。

（二）不同时期的清代学政社群结构分析

为了更好地探究清代学政社会关系网络中的核心人物以及所形成的社群，根据学政群体的任职时间，将其划分为三个时期：顺治至雍正时期（1644—1735）、乾隆至嘉庆时期（1736—1820）和道光至光绪时期（1821—1908）。这一分期策略能够有效避免社会网络模块化分析中因时间跨度因素导致的个体自然集聚现象，从而更精准地聚焦于同期活跃学政群体的社会互动模式与社群结构特征。

分别将三个时期中所涉学政人物ID导入到CBDB中查询社会关系，设定距离限制为1，循环数限制为10，并且利用时代（明朝至民国）进行时段上的限定，将其结果导入Gephi进行可视化呈现，引入纽曼（M.E.J.Newman）和吉尔韦安（M.Girvan）等人提出的模块化算法（modularity）来测量网络社群聚类程度，^[30]以探究三个时期中学政的社群关系网络。模块度的取值范围是[-1,1]，通常认为，当模块度值大于0.3时，其网络具有显著的社群结构，值越接近1，网络的社群结构越发明显。

1.顺治至雍正时期

顺治至雍正时期清代学政的社会关系网络共计节点654个，边211条，存在大量孤立的节点，节点之间的关联并不紧密。利用Gephi软件的过滤功能过滤度中心性小于2的节点，即没有或有且只有一个节点与之相连的节点。将过滤后的节点进行模块化处理，如图11所示，该社会关系网络被划分为11个社群，模块度值为0.631，说明存在比较显著的社群结构。

图16.png

图11 顺治至雍正时期学政社会关系网络模块化图

该网络呈现出，在顺治至雍正时期，施闰章、李光地是最具有影响力的中心人物。在施闰章为核心的社群中，地缘关系或许是成员之间的重要黏合剂。沈寿民、施闰章、梅文鼎皆是安徽宣城人，施璜、吴曰慎、闵麟嗣则为徽州籍，同乡、同门等地缘、学缘关系是成员之间互动与联系的基础。而施闰章于文学、理学成就上皆有声望，又曾出任山东提学道、江西布政司参议等官职，颇有政声，成为该网络中连接各方的超级节点。

以李光地、何焯为中心的社群，学缘是其相互之间产生联系的关键因素。李光地官至文渊阁大学士，曾任太子太傅，负责教导胤礽，是康熙帝最倚重的汉臣之一。李光地主持修纂《性理精义》《朱子全书》，多次担任会试考官，并提督顺天学政，兼具学术权威与政治权力，其门生、故吏、受荐者依附其获取政治资本与学术资源，形成紧密团体。何焯乃李光地最著名的门生，李光地赏识其才学，以荐入直南书房，其学术地位与仕途皆赖李光地提携。陈汝楫随何氏谒见李光地，一见器之，遂得入室，并受举荐分修李光地主事的《周易折中》。

以惠士奇为中心人物所形成的社群，则颇为典型地展现了因学政督学所产生的师生关系网络。惠士奇视学广东，大力提倡通经学古，并选拔了何梦瑶、苏珥、劳孝舆、罗天尺等人，同属“惠门八子”^[31]，他们不仅是惠士奇的学生，也因同里而有地缘之谊。由此例可见，学政督学选士的行为有可能促使同里士子之间产生关联。

而以乾嘉学派代表学者钱大昕、纪昀、戴震等为中心人物的社群，其活跃时段实际要晚于所限定的顺治至雍正时期。纪昀与钱大昕为同年，皆是乾隆十九年（1754）进士，其主要的仕宦经历与学术成就皆发生在乾隆朝，戴震名扬京城，亦在乾隆十九年入京避难之后。时间上的差异表明该社会关系网络实际上延伸至清代中期，官员士人的关系网络并非静态的，而是动态演进的。早期的关联为后来的学术和官僚网络奠定了基础，实现学术思想的传承与人际关系的延续。

2.乾隆至嘉庆时期

乾隆至嘉庆时期清代学政的社会关系网络共计节点833个，边1,045条，相比顺治至雍正时期，该关系网络较为复杂，节点之间的关联相对紧密。同样经过过滤和模块化处理，如图12所示，该社会关系网络被划分为15个社群，模块度值为0.519。

图17.png

图12 乾隆至嘉庆时期学政社会关系网络模块化图

在顺治至雍正时期被归为同一社群的钱大昕、纪昀、戴震，在乾隆至嘉庆时期各自成了不同社群的核心人物，这表明即使同为乾嘉学者，学派内部也存在不同学术主张与社交群体的分化。这种变化，正是通过对不同时期社会关系网络的模块化分析才得以清晰呈现。

戴震治学广博，在音韵、文字、训诂等方面均有成就，乃考据学集大成者。他所创立的皖派，因其安徽休宁籍的身份而得名，是一个极具地域特色的汉学研究学派。皖派的学术渊源可追溯至徽州婺源的学者江永，而戴震、金榜、程瑶田等人正是其学说的杰出继承者，他们也是皖派中徽州本土学者的代表人物。此外，段玉裁、王念孙等外省杰出学者，也都是戴震的得意门生。

在以钱大昕为中心的社会关系网络中，钱氏与王鸣盛、王昶、曹仁虎、赵文哲同肄业于苏州紫阳书院，以书院同学形成学术团体。钱氏与王鸣盛同出江苏嘉定，娶王妹为妻，还以姻亲联结加强二者之间的关联。钱大昕与朱筠等是同科进士，在京为官期间通过学友之间的学术交往，其学术成就也得到传扬。

以纪昀为中心人物、围绕《四库全书》纂修工作形成的馆臣社群，也具有较强的影响力。纪昀学识广博，曾任《四库全书》总纂官，并删定总目提要。朱珪与其兄长朱筠都曾直接参与《四库全书》的纂修，朱珪主持了山西采进书籍的工作，后来又在四库馆担任总阅官。刘纶、曹锡宝等都曾参与编修《四库全书》。该社群反映出朝廷主导的大型文化工程在推动官员之间学术网络与社会关系结构中的作用。

以阮元为核心，代表乾嘉汉学发展的又一高峰，尤以金石学造诣最为突出。阮元出任山东、浙江学政期间，吸引众多学者慕名追随，影响深远。以阮元为首，焦循、王引之等扬州士人构成的扬州学派，在训诂、考据、天文、历算等多个领域开展深入研究，阮元于其中贡献尤为显著。

这些社群主要由汉学领域的学术大师构成，他们中的许多人曾多次担任乡试和会试的考官或学政。他们凭借着座主和宗师的崇高威望，极大地推动了乾嘉学术的广泛传播。乾嘉时期汉学的兴盛，离不开这些身兼官员与学者的重要人物的积极倡导与推广。

3.道光至光绪时期

道光至光绪时期清代学政的社会关系网络共计节点768个，边583条，节点之间的关联较为疏阔。同样经过过滤和模块化处理，如图13所示，该社会关系网络被划分为18个社群，模块度值为0.715。

图18.png

图13 道光至光绪时期学政社会关系网络模块化图

在道光至光绪时期的学政社会网络中，有两个以文学流派为核心形成的社群。以梅曾亮、龙启瑞、陈用光为中心的社群，突出反映了晚清桐城派古文学家在学政士人网络中的重要地位。该社群其他成员未在图13中标记出来的还有王振、朱琦、吕璜，与龙启瑞皆为广西籍，皆工古文，为桐城一脉，民国间黄蓟辑《岭西五家诗文集》收录其中。桐城后辈如陈用光、龙启瑞等人，出使督学之时也借机传扬桐城文脉，进一步扩大其学术影响力，例如陈用光就在担任浙江学政期间重梓姚鼐《四书文选》，引导士子潜心经籍。^[32]另一社群则以程恩泽、何绍基、祁寯藻为核心，展现了道光、咸丰年间推崇宋诗的文人群体。何绍基不仅是程恩泽的弟子，也常与祁寯藻一同切磋唱和，共同钻研宋诗。他们不仅是倡导宋诗的核心人物，在当时的诗坛享有盛誉，还都曾执掌一方学政，利用自身影响力在地方上推广宋诗。

俞樾作为清代学术集大成者、乾嘉学派的殿军，以其为中心形成了晚清学政社会关系网络中的最大社群（共计35位成员）。俞樾仅简放过一任河南学政，被劾奏“试题割裂经义”而罢官，遂潜心学术四十余载，曾执教苏州紫阳书院、杭州诂经精舍与江阴南菁书院，其关联的产生来源于治学期间与友人、门生的交游。吴庆坻也曾入杭州诂经精舍，问学于俞樾，入仕后出任四川学政、湖南提学使等，官职颇高。俞樾门下戴望、刘恭冕、黄以周等亦是晚清学术代表人物。

较为突出的政治群体则有以曾国藩、李鸿章依托地缘与幕府形成的晚清官僚网络，与以康有为、梁启超等人在当时湖广总督张之洞支持下依托学会形成的维新派政治团体。

胡家玉、刘廷榆、蔡念慈同为道光二十一年（1841）辛丑恩科进士，其朱卷数据的收录使得活跃在道光科场中的考生与考官之间产生了直接或间接的关联，主流史料记载里寂寂无闻的士子成为构成网络的关键节点。

通过对清代顺治至雍正、乾隆至嘉庆、道光至光绪三个时期学政社会关系网络的社群结构分析，可以清晰观察其动态演变与核心特征。整体而言，三个时期的学政社会关系网络都呈现出较为明显的社群结构，道光至光绪时期模块化数值最高，顺治至雍正时期次之，而乾隆至嘉庆时期最低，说明相比之下道光至光绪时期学政社会关系网络中社群边界最清晰、社群结构最稳定。深入分析发现，地缘（同乡）与学缘（师生、同门、同年）始终是构成社群、维系成员间关联最为基础和主要的机制。典型案例包括施闰章社群的地缘纽带、李光地社群的学缘依附、惠士奇督学催生的师生网络以及桐城派学者基于地域学术传统形成的紧密联结。另外，文学主张与政治观念的趋同性也是促生和维系社群的重要因素。而乾隆至嘉庆时期学政社会关系网络模块化数值相对较低，社群之间的边界相对模糊，社群结构的稳定性相对较低。最大节点数与最大边数所构成的复杂且紧密的社会关系网络，反映了此时期学政群体内部互动的高度活跃性及社会关系的繁复交织。钱大昕、纪昀、阮元、翁方纲等社群中心人物的中介中心性（Betweenness Centrality）数值最高，扮演着连接不同社群的“桥梁”角色，而分属不同社群的成员之间也存在较为频繁的交往与互动。这种现象或许与乾嘉考据学风的兴盛密切相关，跨地域、跨师承的学术交流可能在一定程度上弱化了传统地缘、学缘的区隔作用，促使学术共同体向更开放、更活跃的网络形态演进。

网络中具有高度中心性的人物，如施闰章、李光地、钱大昕、纪昀、戴震、阮元、俞樾、曾国藩、康有为等，几乎都是各自时代学术思想或政治领域的关键代表。他们的社会网络并非静态，而是呈现显著的动态演进特征。同一学者群体在不同时期会分化形成各自独立的社群核心，反映了学派内部的学术分野与社交圈层的变化。这些核心人物在担任学政期间，凭借其学术威望与政治地位，通过督学选士、主持书院、编纂典籍等活动，有力地引导了学术风尚，扩大了学派影响，实现了学术思想的代际传衍与人际网络的持续构建。

然而，基于CBDB构建的社会关系网络存在其固有的局限性。数据库主要依赖传统史料，如正史、传记、方志、朱卷等中明确记载的亲属、师承、荐举、同僚、同年等关联，难以全面捕捉清代士人之间更为复杂、微妙且丰富的日常交游、思想交流、书信往来、经济互助等多种关系形态。因此，模块度算法所勾勒出的社群结构与核心脉络，虽能有效揭示主要趋势和显著群体，但其精细度和完整性必然受到底层数据特性的制约，算法的划分结果也需结合具体史实谨慎解读。

综上所述，本文结合CBDB中的人物关系数据，运用社会网络分析方法，并借助Gephi软件进行图形化可视化处理，实现了对清代学政群体的“远读”式整体分析。研究表明，将社会网络分析方法引入清代学政的研究，不仅为传统人文研究提供了可量化、可视化的工具与视角，也促进了从问题驱动向数据驱动的研究范式转变。数字技术作为辅助工具，使得原本零散的史料数据在结构化与图谱化之后呈现出新的解释力与洞察力，拓展了文史研究的深度与广度。技术是通往更深入理解人文现象的路径，数据与算法服务于问题意识与历史思维，两者互相结合，共同推动传统人文学科在方法论上的创新与突破。

四、余论与展望

本文以清代笔记体史料《清秘述闻三种》中学政类文本为研究对象，运用正则表达式进行数据挖掘，结合现有数据库与学术著述进行综合校正，建立了结构化的清代学政人物信息数据库。在此基础上，利用量化统计、地理信息系统（GIS）等探析清代学政的任职原则与时空分布，并借助社会网络分析方法（SNA）绘制清代学政群体社会关系网络图谱。这是借助数字人文手段完成从文本到数据的结构化转换流程，并对清代学政群体进行量化分析与可视化研究的有益尝试。

根据《清秘述闻三种》格式高度统一、边界清晰的文本特点，本研究通过设计正则表达式规则，批量提取学政官员姓名、任职时间、派遣省份、官衔、籍贯、入仕方式等核心字段。该方法具有精确可控、轻量高效、易于修改调试、无训练数据依赖、人文研究者上手门槛低等优势，可广泛应用于地方志、史志、族谱等结构化或半结构化文本的挖掘工作。

在数据库构建完成的基础上，本文采用量化统计与GIS可视化手段，从科甲出身、籍贯分布、职衔品级、年龄结构与履职经验五个维度系统探讨清代学政的任职特征及其时空演变规律。进一步地，本文引入CBDB中的人物关系数据，并借助Gephi软件进行网络计算与图形可视化，通过社会网络分析识别出网络中的关键人物与核心群体，实现了数据驱动与史料解读的深度融合，揭示出清代学政在地缘、学术与政务活动中的多重社会联系网络。

然而，研究结论的可靠性亦受限于数据基础的完整性。相较于人物基本信息的提取，历史人物之间社会关系的系统化挖掘与结构化处理仍面临更高难度与更广覆盖的挑战。目前，CBDB在社会关系数据领域尚存在显著的补充空间。数据的局限性可能影响网络结构分析的准确性与代表性，尤其是在“边缘节点”识别方面的偏误。例如，当前位于网络边缘的若干人物，未来若伴随CBDB数据的不断更新，可能会摆脱“孤立”状态而跃升为重要节点。以刘廷榆为例，其社会关系数据主要来自朱卷文献，经“人名权威—人物传记资料库”整合后收录至CBDB，特殊的师承背景使其在网络中表现出较高的度中心性，说明数据来源的差异直接影响节点的网络位置与影响力评估。未来研究可考虑进一步整合朱卷、登科录、试牍集等多源史料，系统补充CBDB中关于学政人物的社会关系数据，尤其应加强对师生关系、同年关系、荐举关系等关键社会联系的整理，以提升分析结果的全面性与精确度。同时，这一工作也将为后续深入探讨科举士子师承网络与其仕途发展之间的关联性问题提供坚实的数据基础与方法支撑，拓展清代士人研究的深度与维度。

Appointment Principles, Spatiotemporal Distribution,and Social Network Analysis of Qing Dynasty ProvincialEducation Commissioners from the Perspective of DigitalHumanities

Wang Yiyi

Abstract: From a digital humanities perspective, this study uses regular expressions to mine data from records of xuezheng 学政 (provincial examination commissioners) in the Qing dynasty note style text Qingmi Shuwen 清秘述闻 (“Anecdotes from the Qing Imperial Archives”) and its sequels. It extracts and structures multidimensional data—including courtesy names, places of origin, entry into officialdom, official positions, and dates of appointment—to build a foundational database on Qing provincial examination commissioners. Based on this database, the study utilizes quantitative analysis and Geographic Information Systems (GIS) to explore the appointment principles and spatiotemporal distribution of provincial examination commissioners during the Qing dynasty. Additionally, Social Network Analysis (SNA) is applied to map the social networks of these officials and reveal the community structures during different periods. This research exemplifies the use of digital technologies to enable “distant reading” of traditional historical sources, broadening methodological horizons for historical and literary studies and oﬀering new data foundations and analytical paradigms for research on Qing provincial examination commissioners and scholarly elites.

Keywords:Qingmi Shuwen; Provincial Examination Commissioners of Qing Dynasty; Literary and Historical Data Mining; Social Network Analysis

编辑 | 许可

本研究受到国家社会科学基金重大项目“基于大数据技术的古代文学经典文本分析与研究”（18ZDA238）、国家自然科学基金面上项目“医疗文本大数据分析中的统计学模型和方法”（11771242）和北京智源人工智能研究院研究员专项基金（BAAI2019ZD0103）的资助。邓柯、包弼德（Peter K. Bol）和刘军（Jun S. Liu）共同指导了本研究，是本文的共同通讯作者，特此致谢。

向上滑动查看注释

[1]关于清代学政群体的研究，现有成果已取得一定进展，但仍存在若干可拓展的空间。冯建民运用量化分析方法对清代乡试、会试考官的地域分布进行了系统考察，但其研究对象未涵盖学政群体；魏秀梅则运用多源史料，对学政人事嬗变进行了深入细致的量化分析，然其研究时段仅限于嘉庆以降，未能全面展现清代前中期学政制度的演变轨迹。在研究方法上，既有研究多采用传统统计图表呈现数据，若能引入文本挖掘、地理信息可视化、社会网络分析等数字人文方法，或可为清代学政群体研究开辟新的学术路径。参见冯建民：《清代乡、会试考官的地域分布状况研究——基于〈清秘述闻〉的统计》，《教育学术月刊》2011年第11期；魏秀梅：《从量的观察探讨清季布政使之人事嬗递现象》，《“中央研究院”近代史研究所集刊》1971年第2期。

[2]清代学政官制的变化，参阅王庆成：《清代学政官制之变化》，《清史研究》2008年第1期；安东强：《清代学政规制与皇权体制》，北京：社会科学文献出版社，2017年，第26—37页。

[3]钱实甫：《清代职官年表》第4册，北京：中华书局，2019年；黄政：《〈清代职官年表·学政年表〉补正》，《长安学术》2017年第2期；魏秀梅：《清季职官表》，北京：中华书局，2013年。“清季职官表查询系统”由台湾“中研院”近代史研究所与台湾大学数位人文中心共同建置。网址：http://ssop.digital.ntu.edu.tw。

[4]在晚清科举废止、新式学堂兴办的背景下，学政一职成为闲差，难以适应新式学务的需求。光绪三十二年四月初二日（1906年4月25日），清廷决定裁撤各省学政，改设提学使司。与旧制不同，提学使不再是主持岁科考试的京官差使，而是地方实缺官员，归督抚管辖，其职责是统管全省学务，包括考核学官、管理学堂学生、核查教学大纲等，职能已发生显著变化。因此，本文对学政的统计与讨论将截止于光绪三十二年（1906）裁撤之时，不涉及提学使司及提学使。

[5]江庆柏编著：《清朝进士题名录》，北京：中华书局，2007年。

[6]《清高宗实录》卷412，北京：中华书局，1985年，第394页。

[7]昆冈等修，吴树梅等纂：《钦定大清会典》，《续修四库全书》史部第794册，上海：上海古籍出版社，1995年，第80页。

[8]来自奉天府的学政数量极少，仅4例，即李如桂康熙三年（1664）任浙江学政，白尚登康熙三年任奉天府丞兼学政，何起鹏康熙三年任云南学政，边声廷康熙二十一年（1682）任奉天府丞兼学政，故不在统计中专列。

[9]江南籍学政自王家相撰《清秘述闻续》始记载为江苏、安徽，湖广籍记载为湖南、湖北，为便于统计，仍统划为江南、湖广。

[10]由于学政一职于光绪三十二年裁撤，不再派遣，因此计算年均值时，光绪总年数以32年计。

[11]分省取士对边远省份进士中额人数的影响，参阅于爱华：《论清朝科举取士对西南边远省份的政策倾斜——基于会试中额与登科进士人数的统计和分析》，《清史论丛》2019年第1期。

[12]赵尔巽等撰，中华书局编辑部点校：《清史稿》卷116《职官三》，北京：中华书局，1977年，第3345页。

[13]《清秘述闻三种》对学政官衔的记载有所缺失，顺、康两朝缺失尤多。现根据《清代职官年表》、《清季职官表》、《清实录》、“人名权威—人物传记资料库”综合校正补缺。

[14]奉天府府丞兼学政所带原衔超过半数未有记载，故暂不纳入统计。

[15]王钟翰点校：《清史列传》卷5，北京：中华书局，1987年，第325页。

[16]《清宣宗实录》卷51，北京：中华书局，1985年，第750页。

[17]清代学政辖区屡有分合，例如湖广地区，顺治初分设湖南、湖北提学道，后以通省按察使二员分别提调湖南、湖北学政，康熙元年（1662）湖南、湖北归并湖广，雍正四年（1726）于湖南、湖北各设提督学政一员。为便于统计，并参考清廷“依文风之高下、人口之多寡、丁赋之轻重”，以直隶、江南、江西、福建、浙江、湖广为大省，山东、山西、河南、陕西、四川、广东为中省，广西、云南、贵州为小省的划分，将所统计的省份划分为15个，奉天地区以府丞兼任学政，亦列表中。其中，顺天学政所辖范围实际包括顺天府与直隶，江南包括江苏、安徽，湖广包括湖南、湖北，陕甘包括陕西、甘肃。参见昆冈等修，刘启瑞等纂：《钦定大清会典事例》卷337，《续修四库全书》史部第803册，上海：上海古籍出版社，1995年，第348页。

[18]魏秀梅：《从量的观察探讨清季布政使之人事嬗递现象》，《“中央研究院”近代史研究所集刊》1971年第2期。

[19]黄与坚：《送蒋莘田参藩督河南学政序》，《愿学斋文集》卷23，《清代诗文集汇编》第74册，上海：上海古籍出版社，2010年，第230页。

[20]CBDB中清代人物生年数据主要来自江庆柏编著的《清代人物生卒年表》和部分“人名权威—人物传记资料库”数据，其中生年（Year of birth）为有明确文献记载或具体生年可考证者，推算出的生年（Index year）则是在一定规则上推算得出的相对数据。“人名权威—人物传记资料库”则以符号“[]”表示无法明确考证之数据，含猜测、著录者之注记及引用自其他参考来源的资料。为确保数据的精确性，此处仅将CBDB和“人名权威—人物传记资料库”中有明确生年者的数据纳入统计。

[21]金之俊：《直纠昏耄学臣疏》，《金文通公集》卷3，《清代诗文集汇编》第8册，上海：上海古籍出版社，2010年，第635页。

[22]叶梦珠撰，来新夏点校：《阅世编》卷3，北京：中华书局，2007年，第90页。

[23]《清宣宗实录》卷300，第658页。

[24]以“某某任某地学政”记为一次，留任者未改变任职地，则不重复计入。学政通常三年一任，但留任者不在少数，此种情况不再另计，譬如翁方纲于乾隆二十九年（1764）任广东学政，至乾隆三十六年任满，持续在任时间长达八年，本文作一任统计，而非三任。

[25]统计旨在说明学政官员履职经验的情况，同一官员在同一年号下，将其任职次数最高值纳入统计；若同一官员存在跨两朝乃至三朝的情况，则将其在各个年号下的累计最高履职次数纳入统计。例如，孙允骥分别在顺治十八年（1661）任湖南按察使司佥事提调学政、康熙元年（1662）任江南按察使司佥事提调学政，则在顺治朝的统计中，孙允骥是第一次出任学政一职，记为“任职一次”，而孙氏在康熙朝已是累计二次出任学政，则记为“任职二次”。

[26]姚元之：《竹叶亭杂记》卷2，《续修四库全书》子部第1139册，上海：上海古籍出版社，1995年，第385页。学政的主要职责之一即选拔士子参与乡试，因此学政一般在每届乡试结束后卸任，等候朝廷挑选新的学政人选。故同年担任乡试考官与学政者，一般可以视作先试差后学政的情况。

[27]黎士弘：《全闽试牍序》，《托素斋文集》卷3，《清代诗文集汇编》第68册，上海：上海古籍出版社，2010年，第619页。

[28]王步青：《直省考卷所见集序》，《巳山先生别集》卷4，《清代诗文集汇编》第228册，上海：上海古籍出版社，2010年，第556页。

[29]李世愉在考差研究中指出，“试差未回即授学政”的情况在实行考差制度以前是罕见的，而实行考差后，“每科间有之”，乡试考官留任学政例的频繁出现，正是考差制度实施后的显著现象。然而，据统计，康熙朝同一年里既担任乡试考官又担任学政的情况也并非少数，时学政差遣仍由皇帝钦定。考差之法固然促使学政考选、简放制度趋于稳定，但考差制度与乡试考官留任学政现象之间是否存在必然联系尚需进一步论证。参见李世愉：《试论清代科举中的考差制度》，《湖南大学学报（社会科学版）》2007年第4期。

[30]M. E. J. Newman, M. Girvan, “Finding and Evaluating Community Structure in Networks,” PhysicalReview. E, Statistical, Nonlinear, and Soft Matter Physics, vol. 69, no. 2, 2004, pp. 1-15.

[31]赵尔巽等撰，中华书局编辑部点校：《清史稿》卷485，第13375页。其余四人分别为吴世忠、陈世和、陈海六、吴秋，该四人在CBDB中未被标记为惠士奇之学生，以致未能一同呈现在上述社会关系网络之中，亦说明CBDB在呈现某些社会关系网络时可能存在数据不完整的现象。

[32]陈用光：《重订姚先生四书文选》，《太乙舟文集》卷6，《清代诗文集汇编》第489册，上海：上海古籍出版社，2010年，第644页。

点击下方链接，下载原文

如需购买《数字人文》期刊，请扫描下方二维码

封面.jpg

校对 | 肖爽

美编 | 王秀梅

数字使人文更新

数字人文门户网站：www.dhcn.cn

往期回顾

大规模历史人物亲属关系网络的智能优化

2026年2月25日 10:03

原创周墨钦王宏苏 2026-02-25 10:03 北京

亲属关系网络在历史研究中具有重要作用，但大规模历史人物亲属关系网络的智能优化面临诸多挑战：关键信息分散于海量文献及专业数据库中，需整合碎片化且含噪声的信息；传统依赖领域专家人工处理的方法效率低下。

数字史学

周墨钦 / 清华大学统计与数据科学系

王宏苏 / 哈佛大学东亚语言文明系

刘军 / 哈佛大学统计系（通讯作者）

包弼德 / 哈佛大学东亚语言文明系（通讯作者）

邓柯 / 清华大学统计与数据科学系（通讯作者）

摘要：亲属关系网络在历史研究中具有重要作用，但大规模历史人物亲属关系网络的智能优化面临诸多挑战：关键信息分散于海量文献及专业数据库中，需整合碎片化且含噪声的信息；传统依赖领域专家人工处理的方法效率低下。本研究提出一种基于知识表示与融合框架的高效算法策略，核心贡献包括：（1）建立亲属关系代数，支持复杂亲属关系的表示与操作；（2）设计迭代式优化—整合（Optimization-Integration）算法，通过节点合并与边重组优化网络结构；（3）引入安全检查机制，检测推理与融合过程中潜在矛盾信息，避免网络优化遭受污染。将该方法应用于“中国历代人物传记资料库”（CBDB）的早期版本，实验表明其能有效优化网络结构，并识别人工难以发现的隐藏矛盾，为大规模亲属关系网络的智能优化提供了可行方案。

关键词：中国历代人物传记资料库（CBDB）历史人物消歧亲属关系推理知识图谱

引言

亲属关系网络在历史研究中起着重要作用，可以帮助研究人员更好地理解社会如何组织和随时间演变。^[1]现有的历史研究都集中在分析小规模的亲属关系网络，并往往假设网络本身是精确已知的。^[2]然而，当研究规模扩大时，亲属关系知识通常散布在许多信息源中（包含不同的专业数据库和各种历史文献，如传记、墓志铭、族谱等），每个信息源只涵盖全局网络的一小部分碎片信息，因此需要借助知识融合技术，将分散的知识整合，从而构建一个完整的亲属关系网络。与传统知识融合问题不同的是，这里的每个亲属碎片网络规模通常较小，网络内连通性较低，同时碎片之间连通信号较弱，这使得对于网络连通性有要求的网络对齐方法受限。另一方面，历史文献之间记载的信息可能存在矛盾。例如，同一个历史人物的父亲在不同文献中名字不同，这便产生了亲属信息矛盾。但是在中国古代传记领域，经过考究可能这两部分信息都是正确的，不存在“冲突”，这使得常规的矛盾检测和处理机制失效。换言之，我们需要因地制宜地设计针对该领域的矛盾探测和处理机制。此外，亲属关系信息通常存在信息不完整和关系缺失问题。例如，传记文本中只记录了王安石的父亲王益和弟弟王安国，并未明确说明王益和王安国的父子关系。所以，我们需要通过推理获取隐含关系，从而提升网络连通性，这将有利于实现知识融合。但是考虑到信息之间可能存在矛盾，实现带有矛盾冲突信息的亲属知识推理也面临挑战。同时，领域专家对数据库的数据质量有极高要求，每条数据需要可溯源，这要求算法具有较好的可解释性，使得基于深度学习的方法受限。

传统的解决方案是依赖于领域专家知识，进行人工操作，实现知识融合。图1a展示了CBDB项目在分析多个亲属关系碎片并将它们整合、优化成亲属关系网络过程中的关键步骤。在这个过程中，领域专家识别并建立了历史人物之间各种复杂的亲属关系，形成一个统一的亲属关系网络。为了优化网络结构，需要完成对网络中边的重新组织和节点的消歧与合并。重新组织网络中边的目的是尽可能多地使用直接亲属关系（如父子关系），而减少使用间接亲属关系（如兄弟关系）。因为能由直接亲属关系等价替换的间接亲属关系，可以看作是网络中的冗余信息。而减少冗余信息可以降低网络的复杂度，从而实现网络结构的优化。网络中节点消歧与合并的目的是将多个节点（如同名的王安石的两个节点）合并为一个节点，但可进行该操作的前提是有充分的证据支持它们实际上是同一历史人物。如果两个节点可能对应同一人，但证据不足，将生成一个合并建议反馈给项目经理，提示可能的节点合并操作。此外，一旦领域专家检测到存在逻辑矛盾的亲属关系，将生成矛盾警告，提醒项目经理进行修复操作。

图1.png

图1 CBDB主要工作流程

尽管上述工作流程比较完善，并且在CBDB项目框架下能成功地不断扩展历史人物的社交网络，但这个流程是通过领域专家人工完成的，存在效率低下、信息处理过程中的人为错误、数据中难以识别的矛盾等局限性。随着越来越多的数字化历史文献变得可用，开发可靠的算法以自动化此工作流程并加速CBDB以及其他类似数据库的增长具有巨大的吸引力。

我们提出了一个系统的解决方案，用于在知识表示和融合框架下基于亲属关系碎片构建和优化大规模亲属关系网络。该方案是一种高效的基于算法的策略，具体包括：（1）亲属关系代数，用于亲属知识表示和复杂亲属关系的操作运算；（2）优化—整合（Optimization-Integration）算法，用于优化亲属关系网络的结构，包括边的重组和节点的合并；（3）安全检查机制，用于在进行知识推理和融合时，检测目标网络中可能存在的矛盾，以防止网络建立和优化过程被矛盾信息干扰，影响网络中亲属信息的准确性。将提出的方案应用于CBDB的2020年版本，研究结果验证了该策略在优化网络结构和识别难以由人力发现的隐藏矛盾方面的有效性。

一、亲属关系的表示和优化

1.1亲属关系网络

在涉及大规模历史人物亲属关系网络的研究中，如何表示和优化复杂的亲属关系是一个关键问题。理想的解决方案是以最有效的方式构建一个亲属关系网络，该网络中尽可能多的包含直接亲属关系（如父子关系）。在本文中，我们将“亲属关系网络”定义为一个双向图图2.png ，其中，节点集合图3.png ,代表所有个体，边的集合图4.png 代表𝑉中个体之间的亲属关系连接。每个节点v_i∈𝑉都对应唯一的个人ID_i，以及该人物的背景信息X_i，包括姓名、别名、性别、出生日期、死亡日期、出生地和其他有用的特征信息。每个有向边e_ij∈𝐸都与节点v_i到节点v_j的特定亲属关系K_ij相关联。

在实践中，一个大的亲属关系网络通常由一组不相交的“局部连通区域”（locally connected regions）图5.png 组成，满足图6.png ，对于∀t≠s，图7.png ，。其中，每个图8.png 代表亲属关系网络中一个历史家族的亲属关系网络。

图1c描述了一个包含三个局部连通区域的亲属关系网络示例。注意，网络中的每个节点都与一个唯一的人物编号相关联。此外，网络是双向的，意味着如果有一个从v_i到v_j的有向边e_ij∈𝐸与亲属关系k_ij相关联，那么总是有一个从v_j到v_i的反向边e_ji与亲属关系k_ji相关联。下文将讨论，保持中的双向边而不是单向边，将更为方便地实现知识融合和矛盾检测。

对于中的每个个体𝑖，定义图9.png 为包含节点𝑖和所有从𝑖出发边的𝛥的子图。我们将图10.png 中的节点和边分别称为和。将个体𝑖视为中心人物，并展示其所有直接相连的邻居节点。

1.2亲属关系碎片

在实践中，构建涉及数十万个历史人物的大规模亲属关系网络是非常具有挑战性的，因为这样一个巨大网络来源于数万个“亲属关系碎片”。如图1a所示，每个亲属关系碎片记录了从中心人物（实线框内）的相关历史文献中提取的亲属关系信息。如碎片A中展示了中心人物“王安石”的祖父、兄弟和儿子等亲属关系信息。

亲属关系碎片的最重要特征是其中的所有边都与中心人物相连接。这与亲属关系网络的子图非常相似。然而，它们之间的一个关键区别是，亲属关系碎片中涉及的人物没有人物编号，这使得在不同的亲属关系碎片中识别同一历史人物成为一个关键挑战。此外，不同于优化后的网络中大多数是直接亲属关系，亲属关系碎片中包含更多间接亲属关系。这使得网络的结构有很大的优化空间。

1.3从亲属关系碎片建立亲属关系网络

利用大量的亲属关系碎片构建亲属关系网络是CBDB的一个关键任务，该任务通过迭代两个主要步骤来实现：（1）“边的重组”，其目标是通过用直接的亲属关系边等价地替换间接的亲属关系边，以更有效的方式表示相同的亲属关系信息；（2）“节点合并”，其目标是在不同的亲属关系碎片中识别同一历史人物，并将对应同一人物的不同节点合并为最终亲属关系网络中的一个单一节点。

我们以图1a中的四个亲属关系碎片为例介绍如何实现边的重组。在亲属关系碎片B中，给定三个人物（节点）王雱、王益和王安石，可以将王雱到王益的间接亲属关系“祖父”（FF）替换为王安石到王益的直接亲属关系“父亲”（F）。这样的操作会简化亲属关系的表示，而不改变其实际含义。又如亲属关系碎C中的王安国、王曾佑和王曾禄，将王安国到王曾佑更间接的亲属关系“伯父”（FB）替换为王曾禄到王曾佑的间接亲属关系“兄弟”（B）。

此外，亲属关系碎片A和B中同名的“王安石”显然都对应于宋朝的著名政治家和文人王安石（1021—1086），因为这两个“王安石”的生活时期和亲属关系都与公开已知的王安石信息匹配。相似地，我们可以认为王安石的儿子王雱同时出现在亲属关系碎片A和B中。对于亲属关系碎片C和D中同名同姓的三个人，我们也怀疑可以对应着合并。然而，亲属关系碎片B和C中同名的“王安国”对应的是不同的历史人物，因为他们生活的时间相差600年。因此，基于上述分析，我们得到以下合并规则：（1）亲属关系碎片A中的王安石=亲属关系碎片B中的王安石，（2）亲属关系碎片A中的王雱=亲属关系碎片B中的王雱，（3）亲属关系碎片C中的王安国=亲属关系碎片D中的王安国，（4）亲属关系碎片C中的王曾禄=亲属关系碎片D中的王曾禄，以及（5）亲属关系碎片C中的王曾佑=亲属关系碎片D中的王曾佑。

一旦我们合并这些节点，我们就会分别将亲属关系碎片A与亲属关系碎片B两个区域连通起来，亲属关系碎片C与亲属关系碎片D连通起来。在每个组合亲属关系碎片中，可以通过重组涉及的边来进一步优化亲属关系。因此，我们完成了一次“边的重组”和“节点合并”的迭代。继续迭代这两个步骤直到收敛，我们将得到一个优化的亲属关系网络，其中有两个局部连通区域，一个来自亲属关系碎片A和B，另一个来自亲属关系碎片C和D。

然而，不幸的是，如果我们对亲属关系碎片C和D合并后的网络内的亲属关系信息进行一致性检查，我们会发现王曾禄和王曾佑之间存在两种不同的亲属关系，即“兄弟”（B）和“表兄弟”（FBS），这表明在合并后的亲属关系碎片中存在矛盾信息。在这种情况下，出于安全考虑，我们会撤销（undo）亲属关系碎片C和D的合并操作，输出关于王曾禄和王曾佑之间多重关系的矛盾警告，如图1c中的矛盾报告所示，并提出节点合并的建议，如图1c中的推荐报告所示。因此，我们最终得到了如图1c所示优化后的亲属关系网络。

1.4文献中的相关研究

中国的亲属称谓系统非常复杂，每种亲属关系都可以准确描述，如直系和旁系、父系和母系、长辈和晚辈。在文献中，已经有许多努力致力于中国亲属关系的推理，包括基于逻辑的和基于本体的方法。^[3]尽管这些方法在亲属关系推理方面做得相当好，但当用于推理的信息间存在矛盾时，其推理容易产生不准确的结果。本研究中的节点合并任务与网络对齐任务有关，因为这两个任务都寻求找到节点对应关系。网络对齐任务的目标是在两个或更多具有相似结构的大规模知识图谱中进行节点对齐。^[4]然而，两个任务之间的关键区别在于网络内部连通性以及网络之间的连通信号强度，本研究中的节点合并任务关注的是在一个低连通性的亲属关系网络中找到各亲属关系碎片之间的节点对应关系，而不是具有密集连接的多个平行知识图谱之间的节点对齐。边的重组任务与知识图谱补全中的链路预测（link prediction）任务有一些相似性，其目标是为一个不完整的知识图谱推断未观察到的或缺失的链接。近年来，已经提出了许多基于规则和基于嵌入的方法来解决这个重要问题。^[5]一些最近的研究开始考虑联合网络对齐任务和链路预测任务，理由是这两个任务可以从交替执行中受益。^[6]然而，这些方法都没有考虑亲属关系网络的特殊性，也不能像本研究所设计的那样构建大规模的亲属关系网络。据我们所知，本研究是首次基于从历史文献中抽取的亲属关系信息构建大规模亲属关系网络，进行节点合并和边重组的联合分析。我们的方法不仅优化了网络结构，还对潜在的矛盾信息进行了可靠的安全控制。

二、亲属关系代码和复杂亲属关系的操作运算

图1中的示例展示了从多个亲属关系碎片构建优化亲属关系网络的核心思想。尽管这个过程对于人类来说看起来相当直接，但由于以下挑战，用计算机程序自动化它并非易事：（1）实际中的亲属关系比示例中的更复杂，需要用亲属关系代码对亲属知识进行表示和运算操作；（2）需要定义明确的规则来检测亲属关系的匹配和矛盾。我们提出了“亲属关系代数”，即亲属关系代码集合及定义在集合上的一系列亲属算子，以帮助我们操作复杂的亲属关系运算。

2.1基本亲属关系代码和复合亲属关系代码

在提出的亲属关系代数中，有两种类型的亲属关系代码：基本亲属关系代码（primary kinship codes）用于表示直接的简单亲属关系，而复合亲属关系代码（complex kinship codes）用于表示间接的复杂亲属关系。

一个基本亲属关系代码图11.png 是一个基本亲属关系类型（kinship type）和一个长幼代码（seniority suffix）的连接。其中，基本亲属关系类型编码了亲属关系的类型，而长幼代码作为亲属关系代码中的辅助元素，表示通过亲属关系连接的两个个体的相对长幼顺序，其中符号“∘”代表连接操作。如“B”表示兄弟，而“B+”表示兄，“B-”表示弟。表1a总结了9种基本的亲属关系类型，包括7种直接亲属关系（图14.png =1）和2种间接亲属关系（>1）。表1b给出了两种长幼代码，以及对应可以适用的亲属关系类型。给定一系列的基本亲属关系代码图15.png ，可以通过按顺序连接它们来生成一个复合亲属关系代码图16.png 。有了各种复合亲属关系代码，我们可以方便地表示所有类型的亲属关系。表1c展示了一些典型的例子。我们使用图17.png 来表示所有合格的（qualified）基本亲属关系代码和复合亲属关系代码的集合空间。中的元素作为亲属关系代数系统的基本元素。

图18.png

a9 种基本元素对应运算符

图19.png

b 可选择的长幼代码

图20.png

c 典型复合亲属关系代码及对应运算符

表1 亲属关系代数中的基本元素

2.2亲属关系运算

在提出对于从个体v_i到个体v_j的基本亲属关系代码图21.png 后，可以从各种角度提取其特征。我们定义如下5个一元运算：

1.代际差异运算：根据k计算v_i和v_j之间的代际差异；

2.亲属关系距离运算：测量k的亲属关系距离。对于7种直接亲属关系（F、M、S、D、H、W、C），该距离等于1；对于2种间接亲属关系（B和Z），该距离等于2。因为“B”可以等价表示成“FS”，“Z”可以等价表示成“FD”；

3.性别提取运算图24.png ：提取由k连接的两个个体v_i和v_j的性别对；

4.逆运算图33.png ：当v_i的性别为男时，返回k的逆亲属关系代码；

5.逆运算图26.png ：当v_i的性别为女时，返回k的逆亲属关系代码。

对于复合亲属关系代码图27.png ，可以通过聚合图28.png 的相应运算符来定义类似的运算：图29.png ，其中图30.png 和图32.png [2]分别表示图31.png 的第一个元素和的第二个元素；图33.png 和图34.png 可以通过从KT回溯到K1的所有步骤，并连接相应的逆亲属关系代码来获得。

在实践中，两个不同的亲属关系代码可能包含兼容的亲属关系信息。例如，K₁=“B+”和K₂=“FS”都告诉我们两个个体之间存在兄弟关系，尽管K₁比K₂更详细地解释了他们的长幼辈分。又例如，K1=“B+”和K3=“FF”是不兼容的，因为一个人的哥哥不可能是其祖父。我们定义亲属关系的兼容性。

定义1(亲属关系兼容性)：定义K~K'表示两个亲属关系代码K和K'是兼容的，如果同时满足：

1. 图37.png ；

2. 图38.png ；

3.在性别和长幼信息上没有矛盾。

图39.png

图2 优化亲属网络结构的演化过程

三、优化—整合算法

我们建立优化—整合（Optimization-Integration）算法来自动化图1中所示的CBDB工作流程。图2展示了示例在优化—整合算法上的详细过程。

为了防止网络优化过程受到矛盾信息干扰，我们进一步定义节点状态𝑆(𝑣)∈{激活状态,冗余状态}和边的状态𝑆(e_ij)∈{激活状态,冗余状态,矛盾状态}。所有潜在个体的集合𝑉可以表示为激活状态（active）集合和冗余状态（redundant）集合的并集，即𝑉=𝑉_a∪𝑉_r，其中𝑉_a={v_i∈𝑉 ∶ 𝑆(v_i)=激活状态}和𝑉_r=𝑉⧵V_a；所有观察到的亲属关系边的集合可以根据边的状态表示为三个子集的并集，即𝐸=𝐸_a∪𝐸_r∪𝐸_c，其中=激活状态}，=冗余状态}，=矛盾状态}。

3.1算法初始化

首先，将输入亲属关系碎片中每个涉及的名字都视为一个潜在的个体，并利用亲属关系逆运算符，将亲属关系碎片转变成双向图。图2a描述了亲属关系网络𝛥的初始化，其中包含|𝑉|=14个潜在个体，这些个体在4个不相交的局部连通区域中。注意，每个历史人物可能在亲属关系网络的不同碎片中对应多个潜在个体。

3.2优化步骤（O-步）中边的重新组织

我们定义亲属关系网络中亲属距离的总和图42.png 。该指标刻画了网络复杂度，越大，网络复杂度越高，反之，越小，网络复杂度越低。O-步（记为图45.png ）的目标是完成边的重新组织，包括3个过程：推理、操作和剪裁，以降低亲属关系网络中亲属距离的总和，从而降低网络复杂度。

图2b显示了优化后的网络图46.png 。包含图47.png 与初始图48.png 完全相同的信息，但由于减少了间接亲属关系，的网络结构更为直接，复杂度也更小。

图50.png

图3 亲属关系推理中的典型模式

扫描。作为O-步的开始，这个过程是通过扫描每个局部连通区域中的每个子图来找到所有可能模式。给定图51.png ，图3显示了当存在一条边图52.png 满足图53.png 时的一些典型模式。例如，亲属关系碎片B中的3个潜在个体王雱(5)、王益(6)和王安石(7)间的亲属关系存在以下事实：王益图54.png 王雱图55.png 王安石，其中符号“ 图56.png ”和“ 图57.png ”表示两个个体之间的双向亲属关系。

特殊亲属关系F起着关键作用：如果图58.png ，那么我们认为个体图59.png 和图60.png 必须指向同一个人，因为每个人都有独一无二的父亲。我们用图61.png 表示特殊亲属关系的集合。考虑到信息的可靠性，我们这里限制图62.png 。

推理。推理过程旨在发现潜在亲属关系。基于扫描的模式，给定从v_i出发的边图63.png ，我们可以从图64.png 和图65.png 推测出关系图66.png （或图67.png ）。具体来说，如果存在图68.png 满足：图69.png ,其中图70.png ，我们可以推理出图71.png 。图3展示了在扫描特殊亲属关系F时，不同典型模式下的推理结果。

操作。O-步骤的核心思想是通过直接亲属关系（图72.png 或图73.png ）来描述原始的间接亲属关系图74.png 或图75.png 。我们首先在每个局部连通区域中进行扫描和推理，得到一个预测列表L_p。然而，预测列表L_p中可能存在不一致的亲属关系信息。从L_p中过滤出非矛盾的数据，创建一个操作列表L_o。将这个操作列表和L_o中的预测知识一起添加到原始网络中，形成一个过完备的网络。注意，存在矛盾的边的状态将从“激活状态”更新为“矛盾状态”，并记录在矛盾报告中。所有状态为“矛盾状态”的边，不参与后续的网络优化后操作。

剪裁。这个过程旨在将过完备网络中的冗余亲属关系所在边的状态，从激活状态切换到冗余状态，以获得优化的网络。根据定义2，我们有e_ij=FF是冗余亲属关系，如果存在e_ik=F和e_kj=F，且e_ik，e_kj∈E_a。剪裁过程首先找到所有复合亲属关系代码中的最大亲属距离，记为D_max。这里D_max是一个超参数。然后判断一个具有亲属距离图76.png 的边e_ij_∈E_a是不是冗余亲属关系的边。我们对所有冗余状态边进行操作，将这些边的状态从“激活状态”切换到“冗余状态”。

定义2(冗余亲属关系)：我们将e_ij视为一条冗余的边，如果存在一条路径图77.png ，路径长度T≥2，且满足：

1.；

2. 图78.png ，其中图79.png ；

3. 图80.png 。

3.3整合步骤（I-步）中节点的合并

I-步旨在识别共享同一姓名的个体，并将对应同一个体的不同节点合并成一个统一的记录，以连接原本不连通的局部连通区域，从而提升网络连通性。I-步包括3个过程：匹配与评分、生成合并规则列表、合并与冻结。图2c展示了从图81.png 到图82.png 的演变过程，其中图83.png 中两个不连通的局部连通区域被连接起来，形成了一个更大的局部连通区域。

匹配与评分。这个过程衡量两个潜在个体指向同一个历史人物的可能性，为后续生成合并规则提供材料。为此，我们首先定义亲属邻域（kinship neighborhood）：

定义3（亲属邻域）：我们定义图84.png 为潜在个体𝑖的亲属邻域，其中的亲属与𝑖的亲属距离小于给定阈值𝑑。

我们扫描网络的所有节点名称并生成一个字典，记为name2PIDs，其中键（key）为“名字”，值（value）为“人物编号（PID）”。对于name2PIDs中的每一个名字，如果存在多个“人物编号”，则依次两两组合，并计算两个个体的亲属邻域图85.png 和图86.png 的重叠度来评估这两个个体的匹配强度。两个亲属邻域图87.png 和图88.png 的重叠部分可以分为四组：

1.共有特殊亲属：图89.png ，满足图90.png ，

2.共有一般亲属：图91.png ，满足图92.png ，

3.同名特殊亲属：图93.png ，满足图94.png

4.同名一般亲属：图95.png ，满足图96.png

我们使用得分函数（score function）量化节点v_i和节点v_j之间的匹配强度：图97.png

其中，W表示权重，图98.png 为示性函数。通常，图99.png 。

生成合并规则列表。这个过程的目标是生成网络中可合并节点的候选集。首先，考虑到两个具有相同姓名的潜在个体v_i和v_j之间的匹配分数S_i_,_j，我们使用（v_i，v_j，S_i_,_j）来表示合并规则。然后，对于name2PIDs中的每一个名字，我们可以得到合并规则列表，该列表中所有元素满足图100.png 。这里，较大的图101.png 意味着我们在合并潜在个体时更为保守，图102.png 意味着只要当两个个体的亲属邻域的重叠不是空集时，它们就能被合并。假设，那么图2b中的合并规则列表为：。尽管和共享同一个人名，但是由于和，合并规则和被过滤掉。

合并与冻结。这个过程将合并规则列表中建议的记录进行合并。合并操作可能连通最初不连通的两个局部连通区域，从而形成更大的局部连通区域。注意，这个操作可能会引起潜在的信息矛盾，比如合并后的两个节点在亲属关系的整合上产生“多重关系”的矛盾（更多矛盾类型参见章节四）。为此，我们提出安全检查机制：如果合并过程产生了矛盾的信号，涉及v_i、v_j、v_k的区域将被冻结（freezing），随后过程将回退到合并之前的阶段。如果合并过程没有产生矛盾信号，则自动后续的优化过程。继续图2c中的例子，我们通过合并王雱（4）和王雱（5），以及王安石（1）和王安石（7），创建了两个节点图103.png 和图104.png ，其中Name()=王雱和Name()=王安石。然而，合并规则,由于王曾佑和王曾禄之间的不兼容的多重关系而未通过安全检查，合并后的新的局部连通区域将被冻结，并返回到其合并前的状态。

在一次I-步操作后，我们得到了一个新的图107.png ，其中潜在个体更少。由于网络中节点的合并，许多之前无法改变的间接亲属关系现在可以被直接亲属关系替代，或者被移动到冗余状态。换句话说，我们可以再进行一轮O-步操作。图2d给出了图108.png 。我们可以不断地交替执行O-步和I-步，当不再有新的合并规则生成时，整个迭代过程结束并生成最终优化的网络。

四、矛盾信息的识别及处理

建立的亲属关系网络中包含相互矛盾的亲属信息是常见的，这是由于历史文献之间记载的信息可能存在矛盾，或者在信息搜集和处理过程中存在操作错误。图4总结了三种主要的矛盾类型（contradiction style）。在实践中，开始优化操作之前，我们可以扫描整个知识图谱以探测直接矛盾和间接矛盾。与直接矛盾相反，间接矛盾需要在扫描之前进行额外的亲属关系代码解析过程（如性别对、逆向亲属关系计算）。而隐藏矛盾常在优化过程中的推理阶段出现。例如，我们可以从兄弟和父亲的模式k_i,j=B和k_j,k=F推断出图110.png ，这将与知识图谱中已经存在的数据k_j,k=FB是矛盾的，因为。

所有检测到的潜在矛盾将汇总在矛盾报告中，然后由领域专家人工检查、确认和更新。事实上，探测到的矛盾信息为发现新的历史问题提供了潜在的线索。

图111.png

图4 亲属关系网络中矛盾种类及示意

图112.png 图5 优化—整合算法的关键结果汇总与分析

五、基于CBDB的实际数据分析

我们根据2020年CBDB的早期版本收集数据，得到一个初始的，其中包含471,844个历史人物，涵盖了33,942个不同的名字。其中，大约有227,432个人物是孤立的节点，即没有亲属关系信息记录。这些节点不在我们研究范围内。

此外，经过一些异常数据处理与清洗，最终，我们的目标是为194,582个具有亲属关系的历史人物建立经过结构优化的亲属关系网络。实际数据分析时，我们主要回答并验证以下问题：（1）提出的算法如何能够以最优的网络结构从亲属关系碎片建立亲属关系网络；（2）在潜在矛盾信息的干扰下，它如何有效地实现知识推理；（3）输出结果如何能够用于为新的历史问题提供洞察。

5.1评价指标

我们使用网络复杂度和网络连通度两个维度来评估亲属关系网络结构。网络复杂度由网络中亲属距离总和和平均亲属距离图114.png 来衡量。网络连通度用于度量信息整合能力，是一种直接而有效的度量方式。基于网络连通区域的分析，我们同时能找到古代中国政治人物的家谱。具体而言，我们关注三个指标：局部连通区域个数、每个局部连通区域内平均节点数，以及最大连通区域中的节点数。

5.2实验结果

我们首先展示了使用CBDB进行知识融合和推理的结果。通过设置超参数图115.png ，优化—整合算法在进行五轮迭代后，得到一个完全优化的亲属关系网络。这个过程的关键结果汇总在图5a中。总的来说，在I-步过程中生成了4,319个合并规则（节点中的“增加”列），在O-步过程中发现了大约192,801个潜在的亲属关系（边中的“增加”列）。

图5a中的结果显示，亲属距离总和与平均亲属距离大大减少，这表明优化后的网络复杂度明显降低，同时更少的冗余信息使得网络结构更直观清晰。在前两次迭代之后，局部连通区域的数量明显下降，这表明许多局部连通区域形成了更大的连通区域。此外，我们观察到，在一次迭代之后，最大连通区域中的节点数先增加，然后下降，直到收敛。该变化展示了合并两个连通区域内部或之间的复杂操作，解释了网络演化过程的复杂性。然而，当连通区域的总数保持不变时，最大连通区域的节点数将继续下降，这表明内部的节点存在合并，提升了网络的连通性。

为了说明提出的迭代优化—整合算法能有效指导亲属关系网络的演化，我们展示了在CBDB中发现的一个真实案例。图6展示了关于明代王家四个不同的传记来源形成的四个不连通的亲属关系碎片。每个节点都是一个历史人物，包括他的名字和人物编号。为了方便地显示信息，我们只显示处于活动状态的单向边，而不是双向方式，并且不显示冗余状态边。红色人物编号表示合并操作创建的新节点，红色箭头表示边重组操作发现的新亲属关系。结果表明，分散在不同信息源的亲属关系碎片成功地融合成一个完整的具有最优结构的更大的亲属关系网络。具体而言，O-步扫描并优化了“祖父和父亲”“父亲和叔叔”模式。在观察到name2PIDs中存在多个相同的人物姓名{王信,王聪,王福荣,王纪,王绅}之后，建议合并以下节点：(𝑣₃₁₈₇₀₇,𝑣₂₈₅₆₅₆,2),(𝑣₂₈₅₁₀₃,𝑣₃₁₈₇₅₁,2),(𝑣₂₈₅₆₅₅,𝑣₃₁₈₆₉₆,1),(𝑣₂₈₅₆₆₄,𝑣₁₉₉₆₀₇,1),和(𝑣₂₄₇₂₀₅,𝑣₂₀₂₂₅₆,1)。

图116.png 图6 亲属关系网络演变的案例分析

然而，在合并过程后，出现了王绅和王纪之间存在“多个父亲”的矛盾，矛盾的区域被冻结并记录在矛盾报告中。经过进一步调查，由于籍贯和户籍不同，两对王绅和王纪是不同的历史人物。在这种情况下，算法最终输出包括两个具有最优结构的不连通的局部连通区域。

5.3结果验证

在我们的研究中，我们将CBDB中存在的矛盾信息归纳为两类：历史资料矛盾和数据操作错误。历史资料矛盾是历史文献中的模糊或误导性描述导致的文献间记载信息冲突，而数据操作错误则是数据库录入和更新阶段的人为操作导致的信息冲突。

我们的算法成功地生成了涵盖所有矛盾种类的报告，标记了超过10,000条矛盾信息记录。这些矛盾信息被领域专家进一步调查，以验证和理解其产生原因。考虑到CBDB中源的可验证性和历史材料的可用性，我们将检查范围限制在七个主要的信息源。^[7]

图5b给出了经过领域专家详细验证的统计分析结果。值得注意的是，“信息缺失”类别意味着CBDB的数据源没有提供与条目相关的亲属关系信息。整体而言，历史资料矛盾占有较高的比例，如“多个父亲”矛盾类型中，历史资料矛盾占比50.81%。图5c展示了“多个父亲”矛盾类型的真实案例。经过领域专家验证，其中组1和组2的记录都是正确的，这意味着隐藏在其背后的历史问题值得重新理解和进一步调查。关于隐藏矛盾这种人工难以直接发现的矛盾种类，图5d展示了一个真实案例，即存储在CBDB的信息（k_i,j）和基于算法推理的信息（）之间存在矛盾。例如，在组2中，CBDB记录显示张叔建有一个姐夫（Z+H）名叫张叔逊，而基于优化—整合算法，我们推理发现张叔建和张叔逊应该有兄弟关系（B）。经过验证，张叔建和张叔逊之间的兄弟关系被证实是真实正确的，而姐夫关系被证明是错误的。

总结

本文提出了一种系统性的解决方案，以基于从广泛历史文献中提取的关系信息构建大规模历史人物亲属关系网络。我们的方法主要包含以下几个关键要素：（1）亲属关系知识的表示和运算操作；（2）网络中边的优化，用于找到潜在的亲属关系并以最优结构重新组织亲属关系网络；（3）网络中节点的优化，用于执行节点合并，识别唯一个体的多个记录，区分同名的不同个体；（4）安全检查机制，用于探测系统中存在的矛盾信息。

通过将存储在亲属关系碎片中的信息重新组织成双向亲属关系网络，并通过优化步骤（O-步）和整合步骤（I-步）迭代优化网络结构，我们开发了一种在计算上高效的方法来解决这个具有挑战性的知识整合问题。这一创新性的研究方法为历史人物社交网络的构建提供了新的视角和工具，有力地推动了历史数据处理和分析的进步，可以成为历史学家提取、管理和呈现社会结构信息的有效工具。

Intelligent Optimization of a Large-Scale Kinship Network of Historical Figures

Zhou Moqin, Wang Hongsu, Jun S. Liu, Peter K. Bol, Deng Ke

Abstract: Social networks, especially kinship networks, play an important role in historical studies. However, the intelligent optimization of large-scale kinship networks of historical figures faces significant challenges, because related knowledge is often scattered in a large number of historical documents and professional databases, and we have to integrate this fragmented information, usually with various noises, to obtain a unified network. Traditional approaches relying on domain experts for information extraction, integration, and optimization suffer from slow progress due to the low efficiency of manpower. In this study, we propose a more efficient algorithm-based strategy to optimize large-scale kinship networks under the framework of knowledge representation and fusion. Our major contributions are threefold: (1) a kinship algebra is established to represent and operate complex kin relations, (2) an iterative optimization-integration algorithm is developed to optimize the network structure in terms of node merging and edge reorganization, (3) a security check mechanism is implemented to detect potential contradictions in the target network and protect it from being polluted by problematic information during knowledge reasoning and fusion. Applying the proposed approach to an early version of the China Biographical Database, we found that it is particularly eﬀective at optimizing the network structure and identifying hidden contradictions that are diﬃcult to discover by manpower, thereby oﬀering a feasible solution for the intelligent optimization of large-scale kinship networks.

Keywords: China Biographical Database (CBDB);Disambiguation of Historical Figures; Inference of Kinship Relations; Knowledge Graph

编辑 | 李惠

向上滑动查看注释

[1]Duncan J. Watts, Steven H. Strogatz, “Collective Dynamics of ‘Small-World’ Networks,” Nature, vol.393, 1998, pp, 440-442; David Johnson, The Medieval Chinese Oligarchy: A Study of the Great Families in Their Social, Political, and Institutional Setting, Berkeley: University of California, 1970.

[2]Douglas R. White, Vladimir Batagelj, and Andrej Mrvar, “Anthropology: Analyzing Large Kinship and Marriage Networks with Pgraph and Pajek,” Social Science Computer Review, vol. 17, no. 3, 1999, pp. 245-274; P. J. Carrington, J. Scott, S. Wasserman, Models and Methods in Social Network Analysis, Cambridge: Cambridge University Press, 2005.

[3]陈振宇等：《亲属关系的逻辑意义及其自动推理》，《计算机工程与应用》2009年第16期；陈振宇、袁毓林：《汉语亲属关系的语义表示和自动推理》，《中国语文》2010年第1期；R. Chen, G. Liu, and Y. Zhu et al.,“A Scheme for Kinship Reasoning Based on Ontology,” 2021 IEEE International Conference on Big Knowledge (ICBK), IEEE, 2021, pp.222-229.

[4]Huynh Thanh Trung, Nguyen Thanh Toan et al.,“A Comparative Study on Network Alignment Techniques,” Expert Systems with Applications, vol. 140, no. 2, 2020, pp. 1-17.

[5]Shaoxiong Ji, Shirui Pan et al., “A Survey on Knowledge Graphs: Representation, Acquisition and Applications,” IEEE Transactions on Neural Networks and Learning Systems, vol. 33, no. 2, 2022, pp.494-514; 刘知远、林衍凯、孙茂松：《自然语言处理的表征学习》（Representation Learning for Natural Language Processing），《中文信息学报》2021年第3期。

[6]Yuxiao Dong, Jie Tang, Sen Wu et al., “Link Prediction and Recommendation across Heterogeneous Social Networks,” IEEE 12th International Conference on Data Mining, Belgium, 2012, pp.181-190; Jiawei Zhang, Philip S. Yu, Zhihua Zhou, “Meta-Path Based Multi-Network Collective Link Prediction,” Proceedings of the 20th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2014, pp. 1286-1295; Xingbo Du, Junchi Yan et al., “Joint Link Prediction and Network Alignment via Cross-graph Embedding,” International Joint Conference on Artificial Intelligence, 2019, pp. 225 -227; Amina Amara et al., “Cross-network Representation Learning for Anchor Users on Multiplex Heterogeneous Social Network,” Applied Soft Computing, vol. 118, 2022.

[7]周绍良主编：《唐代墓志汇编》，上海：上海古籍出版社，1992年；周绍良、赵超主编：《唐代墓志汇编续集》，上海：上海古籍出版社，2001年；傅璇琮等编：《唐五代人物传记资料综合索引》，北京：中华书局，1982年；昌彼得等编，王德毅增订：《宋人传记资料索引》，北京：中华书局，1988年；脱脱等撰：《宋史》，北京：中华书局，1985年；王德毅编：《元人传记资料索引》，台北：新文丰出版公司，1979—1982年；明清妇女著作数据库，https://digital.library.mcgill.ca/mingqing/search/index_ch.php，2025年9月15日。

点击下方链接，下载原文

大规模历史人物亲属关系网络的智能优化.pdf

如需购买《数字人文》期刊，请扫描下方二维码

封面.jpg

校对 | 肖爽

美编 | 王秀梅

数字使人文更新

数字人文门户网站：www.dhcn.cn

往期回顾

丙午2026马年大吉

2026年2月16日 10:06

2026-02-16 10:06 辽宁

微信图片_20260214232047_1396_632.png

清华大学“典津”系统正式发布，全球汉籍资源聚合利用进入崭新阶段

2026年2月14日 10:12

2026-02-14 10:12 辽宁

该系统如同一个强大的“数字中枢”，不仅高效聚合了来自全球数百个数据库的逾70万条中文古籍数字资源元数据

近日，由清华大学数字人文团队历经数年研发的公益性基础设施平台——“典津：全球汉籍影像开放集成系统”https://guji.cckb.cn 正式上线发布。该系统如同一个强大的“数字中枢”，不仅高效聚合了来自全球数百个数据库的逾70万条中文古籍数字资源元数据，更首次利用GLM、Deepseek等AI大模型智能体实现了海量古籍资源与《中国古籍总目》等权威目录的智能化、大规模对齐。“这一突破，不仅破解了长期困扰中国人文学界的‘资源孤岛’难题，更构建起一座连接传统文献学与前沿数字智能技术的桥梁，为学界进一步活化利用中华优秀传统文化遗产提供了坚实而便捷的基础设施。”项目负责人、清华大学人文学院教授李飞跃如是说。

图片1.png

“典津”系统界面截图

从“望洋兴叹”到“一览无余”：破解全球汉籍资源孤岛困境

中文古籍是中华文明的核心载体，其存世数量浩如烟海，学术价值无与伦比。近数十年来，随着数字化技术的普及，全球众多图书馆、博物馆及学术机构投入巨大力量，将馆藏珍贵古籍进行数字化扫描，形成了海量的古籍影像资源。然而，这些资源如同珍珠散落于世界各地的数字仓库中：它们分布在数百个不同的数据库平台，著录标准千差万别，检索接口各异，访问策略不一。一位研究者若想穷尽获取某一典籍的数字化版本，往往需要辗转于中国国家图书馆、哈佛燕京图书馆、日本国立国会图书馆、法国国家图书馆等数十甚至上百个网站之间，重复进行检索、比对、记录。这个过程不仅耗时费力、效率低下，且极易因不熟悉某些数据库的收录范围或检索规则而产生遗漏。

“对于大多数不专精于数字资源检索的人文学者，能熟练使用三五个主流中文古籍数据库已属不易，更遑论全面掌握全球资源。”项目经理、清华大学人文学院副教授唐宸表示，“这意味着，互联网本应带来的信息聚合优势，在古籍研究领域并未得到充分发挥。大量高质量的数字化资源因缺乏一个统一的总目式导览平台而处于沉睡或半沉睡状态，这无疑是对学术资源的巨大浪费，也不符合文献学自身‘辨章学术、考镜源流’的学术理念追求。”

典津系统正是针对这一核心痛点，旨在构建一个覆盖全球、标准统一、开放获取的古籍数字影像资源“一站式”集成服务平台。2023年10月发布的初代版本已初具规模，月访问量逾70万人次，访客遍及全球150多个国家和地区，展现了广泛的学术影响力。此次利用人工智能技术进行智能化升级，则是在规模、技术和理念上的一次全面提升。

图片2.png

“典津”系统的部分海内外用户

AI智能体全程驱动：实现中国古典知识数据的“对齐”与“归一”

“典津”系统此次升级最核心的突破，在于将人工智能深度融入数据处理的每一个环节，构建了一个全流程AI大模型驱动的智能聚合框架。面对来源庞杂、格式不一、质量参差的海量原始元数据，传统的人工处理或简单规则转换方式已难以为继。团队创新性地设计了由“原始数据层、标准数据层、关系数据层、应用数据层”组成的四层架构，每一层都由特定的AI智能体集群负责，形成了一条聚合中国古典知识的智能流水线。

在原始数据层，分布式监控程序动态监测全球古籍数据库的数据更新，通过规范化接口，将新增或变化的元数据实时传回中心平台。进入标准数据层，便是AI智能体大显身手的舞台。这里如同一个高度自动化的“数据整理车间”。古籍元数据著录情况复杂：有的著录规范清晰；有的则存在简繁体混杂、拼音著录（如威妥玛拼音、法国远东学院拼音）、甚至英日韩等多语言著录的情况；更有甚者，关键的版本信息可能隐匿在一段冗长的“提要”文字描述中。为此，团队训练和配置了多种具有专项能力、可按需自动调用的AI智能体。它们能够自动识别文本语言，完成简繁转换、多语翻译、拼音转写；更能深入文本语义，从非结构化的描述中精准抽取核心实体信息，并将其填入统一的标准字段中。这个过程，本质上是让机器模拟文献学专家的认知，理解并规范化那些原本为人类阅读而设计的多样化著录。

图片3.png

“典津”系统版本循证智能体工作流界面

如果说标准数据层解决了“单体归一”的问题，那么关系数据层则致力于解决更为复杂的“群体关联”问题，这也是本次升级学术价值最突出的部分。清华数字人文团队通过与中华书局合作，将结构化的《中国古籍总目》这一权威目录作为系统的目录基座。对于每一条已标准化的元数据，AI会自动启动“版本循证”工作流，确认该数据对应《总目》中的哪一个具体版本条目。一旦对齐成功，将留下AI撰写的按语以供复核、化解黑箱疑虑，而该数字资源便自动继承了《总目》的有关信息。项目经理唐宸表示：“这一创新性设计，相当于为散落各地的数字中文古籍建立了一个智能化的分类管理体系，同时也让我国牢牢掌握了对全球古典数字资源的话语权。”

图片4.png

版本循证智能体撰写的按语

经过前三个层次的智慧处理，数据在应用数据层已完全活化，具备高度的可用性。系统提供强大的智能子集建库功能和开放的API服务。研究者可以上传一份自己关心的书目清单或特定主题词表，系统便能利用其双重检索与AI筛选能力，快速生成一个量身定制的、格式规范的专题古籍资源子数据集。这为后续深度数字人文分析提供了“即取即用”的高质量原料。

从“检索平台”到“基础设施”：赋能人文学术创新的范式变革

典津系统的意义，远不止于提供一个更强大的古籍资源检索工具。清华大学数字人文团队将其定位为“文献学+数字人文”的核心公共基础设施，其目标是赋能学术研究范式的创新。该系统极大提升了文献研究的效率与精度。过去需要数月手工调查才能勉强摸清的资源分布情况，现在几分钟内即可一览无余。学者可以轻松比对同一典籍在全球收藏的不同版本影像，从纸张、墨色、印章、批校等细节进行远程“目验”，为版本鉴定、文本校勘提供前所未有的便利，弥补了无法亲见原书的遗憾。

不仅如此，由于提供了开放、灵活的API接口和子集建库功能，该系统实现了从“数据内容平台”向“知识生产平台”的进化，成为一个重要的上游“数据港口”。清华大学副教授严程便在该系统基础上，利用众包整理平台进行OCR文本化、标点校对，最终高效构建起“女子艺文数据库”。她表示：“下游的研究者或项目团队可以通过典津系统便捷地获取高度定制化的数据，直接输入到各种数字人文工具链中，进行文本挖掘、社会网络分析、地理信息系统呈现、知识图谱构建等深度研究。”据悉，其他清华团队成员正在将这种模式复制到诸多专门领域，如诗学文献、词学文献、戏曲文献、乐舞文献、尺牍文献、红学文献等，从而构建一系列基于高质量数据源的专题数据库与知识库。

展望“文献学+人工智能”的未来：通向中国古典知识工程的智能引擎

典津系统的智能化实践，是中国古典文献学积极拥抱人工智能时代的先行示范。它清晰地表明，AI对于人文学科的价值，并非替代学者的专业判断，而是作为强大的辅助智能，将学者从信息搜集、整理的重复性劳动中解放出来，同时提供人类大脑难以企及的数据关联与模式发现能力。

这一基础设施的成功构建，为更宏大的学术愿景铺平了道路。清华大学数字人文团队负责人、人文学院院长刘石教授曾提出构建“中国古典知识库”的倡议，旨在以存世古籍文献为基础，突破其原有物理和文本结构，构建富含实体、属性与关系的宏大知识网络，实现古典知识的深度组织与智能管理。“本次典津系统的升级发布，正是迈向这一宏伟目标的关键一步。它解决了海量底层数字资源的智能聚合、标准化与关联化问题，为上层知识抽取、语义关联奠定了坚实的数据基础。”刘石教授说。

图片5.png

清华数字人文团队的部分基础设施成果

近年来，教育部清华大学中华传统文化智能实验室和清华大学数字人文研究中心先后研发了一批辅助人文研究的系统平台。“九歌”系统下的“推敲”程序正是另一代表性成果。唐代诗人贾岛因一字之差“推”“敲”不定，冲撞韩愈仪仗，后经韩愈点拨恍然大悟，两人遂“并辔论诗”，传为诗坛佳话。今人作诗，当然也绕不开“推敲”的功夫。该程序借助AI技术，将“推敲”功夫落地为一套可操控、可解释、可回退的智能化写作流程，让每位诗词爱好者都能拥有自己的“韩愈”。“推敲”还可实现自定义创作参数，如体裁、韵部、句式、题目、意境等。采取智能锁定机制，如字级可锁定作者满意的字，行级可一键锁定整句，推荐候选字词并给出推荐理由。此外，该程序还可基于PPL加权评分的名句推荐，提供《海录碎事》《白孔六帖》等类书线索。辅助创作可选取韵部、句式、题目和意境等，格律实时校验，随时调整不符合格律的字。当前AI作诗的痛点在于一键生成全诗，剥夺了诗人对诗歌的创作所有权。该程序让AI退居幕后，将作诗的主动权交还给诗人——你推敲一字，AI便回应一理；你锁定满意之处，AI便退后静观。AI不再是捉刀人，而是你手中的“琢玉刀”。

微信图片_20260214095229_3473_471.png “九歌·推敲”程序实现流程图与操作页面

据悉，“典津”系统和“九歌”系统还将持续更新迭代，下一步计划集成更先进的决策辅助与可视分析模块，并探索与更多国际标准与技术框架的互操作，进一步发挥其作为全球性中文古籍数字人文研究核心基础设施的重要作用。随着此类智能化核心基础设施的不断完善，中国古典学术研究将迎来一场深刻的范式变革。跨文献、长时段、宏观量化的研究将成为常态；文献学、历史学、文学、哲学等学科的壁垒将在数据驱动下进一步消融；中华优秀传统文化资源的活化利用与创新阐释将获得前所未有的技术支撑。随着“典津”系统的发布，AI驱动的“古籍数字引擎”正轰鸣启动，它不仅致力于让散落世界的中华典籍在数字空间“团圆回家”，更致力于让其中蕴含的古老智慧，在未来文明的星空中，绽放出更加璀璨夺目的光彩。

文/清华大学中华传统文化智能实验室曲一迪、韩玉凤

媒体聚焦丨与清华孙茂松教授深聊：关于大模型和AI应用落地，一些重要的非共识结论

2026年2月1日 10:01

2026-02-01 10:01 北京

转自腾讯科技

“大家对人工智能，讨论得已经很充分了。”

和孙茂松教授打招呼的时候，这是他说的第一句有关人工智能的话。

孙茂松教授是CAAI多语种智能信息处理专委会主任、清华大学计算机系教授、人工智能研究院的常务副院长、欧洲科学院外籍院士，以及自然语言处理与社会人文计算实验室（THUNLP）的学术带头人。他牵头制定了语言资源管理的ISO国际标准，并打造了全球最大的慕课平台之一“学堂在线”和早期AIGC探索的代表“九歌”诗词生成系统。

他的学生们也已经成为了当下中国大模型浪潮的中坚力量，比如面壁智能的刘知远、深言科技的岂凡超、幂律智能的涂存超。

在这个处于绝对焦点的行业里，“局内人”孙茂松教授始终保持着一种敏锐的“旁观者”视角。他甚至会通过外部媒体来捕捉行业关心的最新动向，并感慨：“有时媒体的思考比我们这些专注于技术研究的学者还要快。”

然而，在看似被讨论得“透彻”的共识之下，还有几个更重要的非共识结论。

在高山书院 10 周年年会的现场，我们没有和孙茂松教授聊过于具体的技术路线，而是把当下人工智能行业最受关注的经典命题，重新认真讨论了一遍。

比如，Scaling Law到底是不是大模型的第一性原理，行业至今其实并未达成真正的共识。

但孙茂松教授同时指出，所谓的Scaling law“边际效应递减”或许只是暂时的平台期，随着计算资源的超常持续投入，复杂巨系统存在在某个临界点再次触发能力“非线性突变”的可能性。

但是未来有两条关键的路径，一条路径是硅谷巨头在 Scaling Law 上进行一场巨大的豪赌，将算力资源再翻 10 倍甚至 100 倍，试图针对新的困难挑战（如空间智能）去撞击下一个“智能涌现”的临界点。

一旦撞击开下一个临界点，就又拉开了竞争差距，这也给国内基座模型公司也带来了巨大的压力：如何继续跟进这场军备竞赛？这不仅是技术层面的活儿，也是关于意志、资源、国力的较量。

另外一条路径，是实践与效率。大模型发展到今天，几乎成为了一种实验科学，基于各个领域或环节的架构创新，都可能带来能力和效率的提升。这条路径更适合大部分的企业，中国在过去一年的实践中，也在这个方向贡献了很多的开源成果。

当下大模型的能力已经能够支撑产业的发展，是不是到了所有企业都必须用AI重构业务的关键时刻？

孙茂松的回答是“不一定”，但是到了必须要把企业的业务逻辑彻底“过遍脑子”的关键时刻，真正和懂AI的人一起认真研究一下用AI重构业务的可能性，而不是在焦虑中盲目跟风，或者干脆完全放弃。

这种在技术“狂热”中保持“诊脉”式的审慎及基于其上的积极进取，正是当下大模型走向工业级生产力时，需要把握的定力。

Q：当前，从媒体到学术圈，对人工智能的讨论已经非常广泛。在您看来，还有哪些可能被忽略了的重要议题？

孙茂松：我认为目前大家对人工智能的关注是全方位的，从政府到民间，从学界到产业界，都给予了高度重视。几乎所有重要的话题都得到了充分的讨论，甚至有时媒体的思考比我们这些专注于具体技术研究的学者还要快。

我常常从媒体的报道中来了解当前大家关心的新问题。所以，我感觉应该没有太重要的东西被遗漏。

Q：一个老生常谈的问题是，关于大模型的“涌现”现象，它是否必须依赖于更大规模的参数才能实现？学术界是否已经研究出可能通过其他方式来催生这种能力的非线性突破的方式？

孙茂松：目前人工智能领域观察到的基本现象是，模型规模越大，参数越多，在训练方法得当、数据量充足的情况下，就越可能出现“涌现”。

这几乎是当前业界通过大量实践得出的一个经验性结论。

至于到底多大才合适，这没有一个明确的答案，需要靠实验来探索。虽然也有一些研究试图在小模型上针对特定任务复现类似的能力跃升，但从普遍意义上讲，规模依然是关键。

复杂系统的一个特点就是规模要大，小系统很难产生类似的效应。

Q：但是，是否如行业讨论的，scaling law的边际效应已经递减了？

孙茂松：边际效应递减是一般的经济学规律，但在互联网时代，某些典型现象已经不遵循这一定律。

在人工智能的“第一性原理”尚不清晰的当下，“Scaling Law”依然是有效的。

大模型有可能通过“涌现”击穿看似接近饱和的平台期，实现能力的非线性陡增。

这正是业界之所以愿意不计成本、持续扩大模型规模的驱动力所在：期待在某个临界点上，模型能力会发生质的飞跃。否则如果仅仅是能力的线性增长，那么投入的边际效应递减会渐次明显，驱动力自然就会停止。

Q：但如果持续押注 Scaling Law，数据会成为那个明显的瓶颈吗？特别是当 AI 从语言模型跨越到物理世界，数据短缺会不会是一个更致命的问题？

孙茂松： 所谓的“数据撞墙”论，可能并没有想象中那么悲观。在不同的细分领域，我们总能找到打破瓶颈的技术演进路径。

首先，合成数据正从“无奈之举”变为一种主动的“补充策略”。当真实语料在特定长尾场景（比如非常细腻的情感表达或专业领域的逻辑推理）出现稀缺时，利用高性能大模型生成高质量的合成数据，可以有效补齐训练数据的短板。这种“以模型训练模型”的方式，能显著拉升模型的整体性能表现。

其次，在具身智能等更为复杂的物理（现实）世界场景中，可以分“两步走”。第一步是在仿真空间中进行大规模预训练，利用机器算力快速生成海量的模拟数据；第二步是回到真实物理世界，用相对少量、高质的真实采样数据进行精调对齐。

虽然仿真环境与物理（现实）世界之间存在“鸿沟（Simulation-to-Real Gap）”，但这种策略极大地降低了数据获取的成本。核心逻辑在于：利用大量的合成数据构建认知底座，再用少量的真实数据完成最后的物理对齐。这种“仿真+真实”的组合策略，应该是目前通往物理世界智能最为高效的路径。

Q：既然“Scaling Law”依然可靠，这是否意味着只有少数头部企业能够参与这场竞赛？对于普通企业和应用开发者而言，应该如何看待和参与到这股浪潮中？

孙茂松：我认为“scaling Law”主要是那些致力于构建基础大模型的头部企业需要关注的核心问题。它们需要不断探索模型能力的上限，思考并谋划投入非凡的人力和物力资源，将模型的通用基础能力做到极致。

但对于绝大多数做应用的企业而言，完全不必过分担忧这个问题。因为基础大模型公司在模型做大做好之后，自然会通过技术手段将其“做小”，在能力损失不大的前提下，让模型变得可用且成本可控。

所以，应用型企业更应该关注的是，如何利用这些已经相当不错的“基座”模型，来赋能自身的业务。目前时机已经基本成熟，各行各业都应该开始认真思考和探索，大模型能为自己带来什么。当然，我反对不分青红皂白地一哄而上，而是应该经过审慎的讨论和判断。

Q：您认为 2026 到 2027 年最值得期待的临界点在哪里？是模型记忆的突破、多 Agent 的深度协同，还是 AI 真正的自我进化？

孙茂松：从应用落地的急迫性来看，当前最现实的挑战依然是“幻觉（Hallucination）”。如果大模型无法将一本正经胡说八道的问题抑制到应用可以承受的程度，那么用户就难以在严肃场景中交付信任。因此，未来一两年，如何从工程和理论上继续最大限度地控制“幻觉”，还是行业最核心的攻坚战。目前已经有一些技术手段，虽然能把模型的幻觉降低很多，但是还是不够。

这与大模型的记忆机制也有相关性。我们需要的不仅仅是更长的上下文（Long Context），而是更智能的“注意力分配”，让模型在多 Agent 协同的复杂任务中，既能精准捕捉瞬时的关键信息，又能学会像人类一样“选择性遗忘”。

“全量记忆”往往意味着冗余和干扰，真正的智能在于判断什么是必须留存的“金子”，什么是该被过滤的“沙砾”。

虽然此类研究带有某种“改良“色彩，不像从 0 到 1 的理论颠覆那样引人瞩目，但它却是大模型进化为“工业级生产力”的关键一步。。

Q：现在是不是已经到了比较紧迫的时刻，每个企业都必须要考虑如何把AI能力加到自己的业务上？

孙茂松：我认为，起码到了所有企业都该静下心来，把大模型对业务的价值彻底“过遍脑子”的时候了。

我并不认为大模型必然会带来巨大变化，但大多数企业都有可能会受益。现在的关键是，我们需要把业务版图认真梳理一遍：哪些环节有了 AI 之后能跑得更快、更远？哪些环节又是 AI 基本使不上劲的？

“过遍脑子”的意思是，这事儿不能简单拍脑袋就定了。企业需要请那些真正有实战经验的人工智能专家坐在一起，像“问诊”一样认真讨论：这个场景是不是适合？能不能干？怎么干？

对于真正懂行的人工智能专家来说，判断哪些会是“虚火”、哪些有可能取得“实效”并不太难。

Q：展望 2026 年，从学术前沿到产业深水区，您认为模型基座、企业级应用和 AI Native 创新这三个维度，哪些关键动作将决定胜负？中国大模型与世界顶尖水平的“时差”究竟还有多大？

孙茂松：首先，谈谈模型基座。到目前为止，我认为国内顶尖大模型与世界一流的差距已经不大。

真正的不确定性在于未来的“分叉路口”。 硅谷的一些巨头正准备在 Scaling Law 上进行一场巨大的豪赌，将算力资源再翻 10 倍甚至 100 倍，试图通过处理极限规模的多模态与物理世界数据，去撞击下一个“智能涌现”的临界点。因此不排除差距有可能突然明显拉大。

这种“大力出奇迹”的极致路线，给国内基座模型公司也带来了巨大的压力：是继续跟进这场军备竞赛，还是寻找差异化的突围路径？这不仅是技术活儿，也是关于意志、资源、国力的较量。

其次，在应用层，“AI+”已经从选答题变成了必答题。 正如我之前提到的，企业现在必须“过遍脑子”。不能盲目地为了 AI 而 AI，更不能无视AI，而是要结合业务核心痛点，精准测算投入产出比（ROI）。从基本面上来看，现在的 AI 不应该成为锦上添花的点缀，而有可能重塑专业领域生产力的基本面貌。

最后，关于 AI Native 的创业，我认为时机已经差不多了。 国内的基座模型能力已经足够好，足以支撑起各类创新应用。一个高水平的应用系统，如果能在海外基座模型上跑通，那么在国内成熟的基座模型上同样大有可为。

基座模型是“地基”，但决定房子好不好住、能不能卖出高价的，是创业者的产品想象力和工程落地能力。随着技术成本的临界点到来，我们有理由相信，2026 年有可能开启一个像移动互联网时代那样百花齐放的“大航海时代”。

Q：大模型的突破也带火了“具身智能”，但是语言模型的Next Token Prediction范式，真的也能够在“具身智能”上起作用吗？

孙茂松：我始终认同《控制论》作者维纳（Norbert Wiener）的观点：真正的 AGI 必然是具身智能。 智能不应只是屏幕上的符号，它必须能在一个开放的、非预设的物理环境中与世界实时交互、互动。

语言模型之所以能取得巨大的成功，本质上是因为语言句子是一串具有“离散无限性（Discrete infinity）”的线性序列。

以“Apple”为例，它的语义指向相对简明，要么是能吃的苹果，要么是那家特定的科技公司。它的词边界是清晰的，句子序列又是高度线性的，这使得 Next Token Prediction（下文预测）这种逻辑能发挥出极高的效能。

但到了图像领域，逻辑就变了。图像中并不存在明确的“Token”，我们只能强行将其切分成一个个“补丁（Patch）”。比如一个 3×3 的黑色色块，它可能是一件衣服的局部，可能是桌面的一角，也可能仅仅是屏幕上的一个图标。更复杂的是，这个黑块可能由一堆黑色蚂蚁组成，也可能只是某片补丁中的一小部分。这种语义指向的高度不确定性，导致它缺乏像语言那样的整体逻辑感。

到了视频，维度从二维跃升至三维；而具身智能则是四维——三维空间再加上连续的时间。面对大千世界如此无穷的变化与复杂的物理互动，单纯依靠 Next Token Prediction 这种预测逻辑到底能不能“大力出奇迹”，现在还要打个问号。

因此，我始终认为，指望人形机器人在未来五年内进入现实世界，自主完成复杂的开放式任务，是不现实的。比如构建一个能在家庭环境中无微不至地照顾老人的具身机器人，这实在是太难了。

必须承认，具身智能的工程难度被行业严重低估了。

要让机器人在从未见过的陌生环境中，做出如同人类般精准、丝滑的感知与反馈，五年之内基本看不到大规模商用的可能。

我对目前“通用人形机器人”的狂热持保留态度，资本的过度追捧确实催生了一定的泡沫。“通用人形机器人”现在仍然属于最前沿的研究课题。

我认为，未来几年内，具身智能的“破局点”不在于通用，而在于“受限场景下的深耕”。现有的环境感知和强化学习技术，只有在边界相对清晰、任务相对单一的环境中才能真正“跑通”。

机器人是不是“人形”其实并没那么重要，我们更应该思考：在哪些具体的、非预设的环节中，机器人的自主决策能力是不可替代的刚需？

不过，谨慎并不代表悲观。我最近关注到一家做“灵巧手”的企业，他们的切入点就很务实：例如，可以考虑解决社区快递点的自动分拣问题。这种条件下，快递件的随意摆放杂乱无章，是典型的的“非标场景”，需要极强的视觉识别和触觉灵活性去翻找、核对。如果能把这个细分痛点打透，且成本可控，那么全国不胜枚举的快递点就是一片巨大的、确定性的市场。

所以，关键还是要找到合适的具体应用场景，而不是盲目地追求通用。

Q：最后谈一个题外话，我们发现，近两年提到人工智能，有几本书会经常被提起。比如卡尼曼的《思考，快与慢》、维纳的《控制论》。除了这些书之外，还有哪些理论可以跨界启发我们走向下一代AI的核心？

孙茂松：这些经典著作对今天的 AI 研究来说，更多是体现在形而上的思想层面。

以卡尼曼的《思考，快与慢》为例，它其实是基于认知心理学。AI 研究者之所以借鉴这个说法，是因为能清晰地帮助我们对智能工作进行归类和比对，其实属于一种“隐喻”，是在为 AI 的进化寻找一个“形而上”的理论支点。

同样，维纳的《控制论》也并非我们通常在工程领域学习的“控制理论”，它更接近于一种探讨人与机器本质的技术哲学。在图灵测试似乎已接近实现的今天，人工智能要向具身智能等更广大、困难的领域发展，就需要诉诸这些深刻的思想。

维纳提出，真正的智能体需要能在一个开放环境中，自我感知环境，并自主决定行动目标、计划等，通过与环境的互动和反馈（尤其是负反馈）来不断调整自身能力。这与强化学习的思想不谋而合。当我们思考如何让AI更加深刻时，会发现维纳早已指明了方向，我们现在在计算手段上似乎具备了沿着这条路走下去的条件。

总的来说，无论是“快思考、慢思考”还是《控制论》，都是我们在AI发展到特定阶段，为了寻求更深层次突破时，从相关学科的智慧宝库中汲取的养分。

我认为重要的思想大体都包含在这些著作之中了。不过，至少还要加上系统论，特别是复杂系统理论。当我们面对大模型展现出的“涌现”等“奇妙”现象而感到困惑时，应该会求助于系统论和复杂系统理论，它们为我们探索大模型的复杂性提供了必要的理论武器。

当然，基础的数学知识，比如矩阵运算，虽然貌似简单，但作为当前大模型的基本计算手段，也需要我们回过头去把它学透、用好。

感谢高山书院对本文的贡献

文郭晓静

编辑徐青阳

【免责声明】转载出于非商业性的教育和科研目的，只为学术新闻信息的传播，版权归原作者所有，如有侵权请立即与我们联系，我们将及时删除。

王兆鹏：基于数据分析的唐诗分期：五期六段说

2026年1月30日 10:02

王兆鹏 2026-01-30 10:02 北京

王兆鹏：基于数据分析的唐诗分期：五期六段说

图层 1.png

官网地址：http://www.southacademic.com/

基于数据分析的唐诗分期：五期六段说

撰文丨王兆鹏

王兆鹏，四川大学中国俗文化研究所讲席教授、中南民族大学文学与新闻学院教授（四川成都，610207）。

[摘要] 唐诗的分期，历来存在多种划分方式，但大多着眼于社会政治环境和诗坛整体风貌的变化，而较少关注创作主体的代群更替。唐诗分期的难点不在于分几个时期，而在于如何合理确定分期的时间节点，以及将哪些诗人恰当地划归为同一时期，避免把一位诗人分割为两段的偏失。如果以创作主体为中心，以同一性和完整性为分期原则，依据诗人的生活年代和创作周期，可将唐代诗人分为五个代群，唐诗相应地分为五个时期。因晚唐又可分为前后两段，故概括为“五期六段说”。

[关键词] 唐诗分期数据分析数字人文

在大数据时代，数据化和可视化分析是学术研究的必然趋势。本文尝试借助数据分析和可视化方法，对唐诗分期研究中的若干疑难问题进行探讨和回应。唐诗的发展历程素为学界所关注，自宋代以来，学者便尝试对唐诗进行历史分期，其中，初盛中晚的四分法最为通行。此外，尚有二期、三期、五期、六期、七段、八段说。唐诗分期的困难，主要不在于分几个时期，而在于怎样确定各期之间的时间节点，以及如何合理地将诗人划归相应阶段。特别是跨代诗人，因年岁相近，其时代归属一直众说纷纭。以往分期研究多依赖学者个人的主观判断，常常缺乏明确的分期原则和客观依据，以致众说纷纭，难有定论。本文基于唐代诗人生活、创作年代和编年作品的数据分析，讨论已有分期各说存在的问题，并提出唐诗分期的原则、依据和具体的时间节点，希望为文学史的分期提供具有可操作性的范例。

一、唐代诗人生活年代和创作周期统计

为便于说明与直观观察，我们以“唐宋文学编年地图平台”所载80位生平可考的唐代著名诗人为数据基础，并增补初唐虞世南、李世民与上官仪3人，据此制成唐代著名诗人的生活年代和创作周期统计表（参见表1）。表中诗人生卒年不可确考者，悉依相关考订成果推定，为使表格简明，均省略表示不确定的问号。诗人享年由计算机按实岁自动计算，即卒年减去生年。每位诗人创作起始与终止年份，均按相关年谱与系年考订成果统计，部分诗人情况特殊，如虞世南、李世民、上官仪与张彻4人没有具体的创作编年，他们的开始创作时间依唐代诗人平均开始创作年龄（20岁）补入，终止创作时间依其卒年推定；周贺和雍陶卒年不可确考，表中的卒年实为其活动可考的最后一年。

表1：83 位唐代著名诗人的生活年代和创作周期统计表.jpg

这83位诗人均在文学史上具有重要地位，其中涵盖王绩、四杰、杜审言、沈、宋、陈子昂、王、孟、高、岑、李、杜、韦应物、刘长卿、韩、孟、元、白、刘、柳、张籍、王建、李贺、小李杜、皮、陆、贾岛、姚合等。这些诗人不仅在唐代文学发展中具有代表性，也均为袁行霈主编《中国文学史》隋唐五代文学卷中重点论述，并在章节目录中列出的对象。值得说明的是，在袁本文学史的章节目录中，另有10位诗人（张若虚、刘希夷、王翰、李颀、崔颢、祖咏、顾况、李益、卢仝、刘叉）同样被突显了其文学史地位，但由于其生平事迹所知有限，未能在上述83位诗人之列。

二、已有分期说法的检讨

要更合理地划分唐诗的发展阶段并确定分期的时间节点，有必要先审视已有分期观点的得失。而在评价旧说之前，首先应明确分期所依据的基本原则。唯有建立起具有共识性的原则，才能系统评判各类分期的优劣。我们认为，诗歌史与文学史的分期，需要遵循以下两条基本原则：一是同一性原则。划分在同一时期的诗人，应该生活和创作在同一时段，不宜把生活在完全不同时段的诗人划归同一时期，这样不利于观察探寻同一时期诗坛的共性和诗人的个性。二是完整性原则。这一原则包含两方面要求：一方面，应保持诗人创作生涯的完整，避免将同一诗人割裂至两个或三个时期；另一方面，应充分考虑创作主体的时代背景，尽量将代表某一时期主流创作方向、引领诗歌潮流的诗人群体划归在同一时期，避免分散归置。如果上述同一性和完整性原则能够成立，那我们下面便依据这两条原则来探讨已有分期说中存在的问题。

先看二期说。较早提出二期说的是胡适，其《白话文学史》以755年安史之乱爆发为临界点，将唐诗分为前后两个阶段。^{^[１]}与胡适的意见接近，闻一多从诗歌史的发展全局来审视唐诗的发展历程，把公元196—755年视为中国诗歌的黄金时代；将756—1276年看作是诗的不同类型的余势发展。^{^[２]}划分的时间长度虽与胡适不同，但切分的时间点完全一样。陆侃如、冯沅君的《中国诗史》则完全参照胡适的意见，以安史之乱为分界线，将四唐合并为两个时期，即把初唐与盛唐合为一期，中唐与晚唐合为一期。^{^[３]} 这种划分，视野宏阔，便于掌握唐诗发展的大趋势，但时段太长，前段历经138年，后段有152年。唐代诗人平均寿命66岁，每段包含了完全不同的两个世代的诗人。又以政治史的分期755年为界，未能顾及诗人的生活和创作年代的完整性。如此划分，盛唐时期的著名诗人高适、王维、李白、杜甫、岑参等都被割裂划归在两个时期。

次看三期说。近代宋育仁《三唐诗品》仿照钟嵘《诗品》的品第批评，将唐诗分为初、盛、晚三唐，把一部分中唐诗人与盛唐诗人合并称为“盛唐”，把一部分晚唐诗人也并入盛唐一列。这是用逻辑的分级代替历史的分期，是横向共时性的划分而非纵向历时性的划分。实际划分的不是三个时段而是三个等级，^{^[４]}属于价值判断而非事实判断。谭丕模《中国文学史纲》则是从历史角度将唐诗分为三个时期：一是初唐天宝间（618—755），二是天宝长庆间（756—824），三是晚唐五代间（825—959）。^{^[５]}这种三分法，明显受到1942年范文澜《中国通史简编》初版的影响。简编将唐代分为三个时段：初唐（618—741）124年，中唐（742—820）79年，晚唐（821—907）87年。^{^[６]}谭氏所分三个阶段与范氏的划分基本相同，只是第二段的起点，由天宝初年延后到天宝末年。倪其心《关于唐诗的分期》也是将唐诗分为三个时期：第一阶段（618—741），诗歌拨乱反正，走向繁荣；第二阶段（742—820），诗歌掀起高潮，趋向创新；第三阶段（821—907），诗歌走向新形式，创造道路。^{^[７]}谭、倪二人有关三段时间起讫的切分，大同而小异。陈伯海《唐诗学引论》提出三期九段说，将成长期（618—755）细分为贞观前后诗坛、武后时诗坛、开天诗坛三段，转变期（756—824）又划分为安史变乱时诗坛、大历诗坛、元和诗坛三段，衰蜕期（825—907）则切分为大中诗坛、咸通诗坛、唐末诗坛三段。^{^[８]}跟谭丕模的三分法相同，只是每段再细分为三而已。三期说较二期说更能揭示唐诗发展演变的过程和规律，但跟二期说类似，也是将时间上完全不同的两代诗人归并为同一时期，顾及到诗坛风会的变化，而未能顾及创作主体的生活时代归属，又将盛唐的李白、杜甫、高适、王维和中唐的韩愈、元稹、白居易、刘禹锡等大家分属前后两个不同的时期，略有削足适履之憾。

再看四期说。宋末元初的方回，已提出盛唐、中唐、晚唐的说法。^{^[９]}元代杨士弘《唐音》在方回的基础上又提出唐初、盛唐、中唐、晚唐的概念。^{^[１０]}明初，高棅《唐诗品汇》进一步明确了四分法，并系统阐述了“四唐六段说”，即初唐的“贞观、永徽之时”和“神龙以还”，盛唐的开元、天宝间，中唐的大历、贞元，晚唐的“元和之际”和“开成以后”。^{^[１１]}他将元和划入晚唐，与后来者有别。其后徐师曾《文体明辨序说》复承其说，并拟定了四唐说的起讫时间节点：“由高祖武德初至玄宗开元初为初唐，由开元至代宗大历初为盛唐，由大历至宪宗元和末为中唐，自文宗开成初至五季为晚唐。”^{^[１２]}徐师曾修正了高棅的看法，将元和划入中唐，五代包含在晚唐内。现当代论唐诗者，多沿四唐说。但时段的起讫，各家又略有不同。杨世明划分的时间节点是：初唐（618—711）94年，盛唐（712—755）45年，中唐（756—824）69年，晚唐（825—907）83年。^{^[１３]}又将初唐和中唐各分两段，初唐分前段（618—649）和后段（650—711），中唐分前段（756—794）和后段（795—824），晚唐又分两段，从敬宗到宣宗是前段，懿宗至唐亡为后段，形成四唐七段说。尚永亮和张娟《唐知名诗人之层级分布与代群发展的定量分析》，将四唐的时间分界线明确为初唐（618—713）、盛唐（713—765）、中唐（766—827）、晚唐（827—907）。^{^[１４]}这种划分的得失容后讨论。

复看五期说。五个时段的划分，始于南宋严羽《沧浪诗话·诗体》，他把唐诗分为唐初体、盛唐体、大历体、元和体和晚唐体。^{^[１５]}至现代，苏雪林《唐诗概论》明确将唐诗分为五个时期。^{^[１６]}五期实与四唐接近，只是把中唐分为两个时期。

又看六期说。许总《唐诗史》主张分六个时期：六朝遗绪的承袭期（618—660），唐音初建的自立期（661—711），气象高华的高峰期（712—755），激荡回旋的扭变期（756—804），众派争流的繁盛期（805—859），俗艳余波的衰微期（860—907）。^{^[１７]}这六期是把初唐分为两个时期，第三期基本上是盛唐，第四、第五、第六期则是把四唐说的中、晚唐分为三个时期。这样的分期，将盛唐的高、岑、李、杜和王维以及中唐的韩、孟、元、白、刘、柳等著名诗人切分为前后两个时段。一位诗人分处两个时期，难免产生割裂之感。

续看七期说。罗宗强虽然是就整个唐代文学思想而言提出七期说，但其核心是诗歌创作的思想，故可视为唐诗的分期。其所分七期，分别是初唐（618—710）、盛唐（711—742）、转折前期（743—773）、转折后期（774—794）、中唐（795—824）、晚唐前期（825—859）、晚唐后期（860—907）。^{^[１８]}这七期说有的三十年左右，有的二十年左右。唐代诗人平均寿命66岁，创作周期平均为45年。二三十年为一个时期，势必将众多的诗人截分为两个甚至三个时期。若每个时期都论述同一位诗人，势必造成重复，不论述又会缺失。显然，这种分期也不是很周全。

八期说是中国社会科学院文学研究所编《唐诗选》前言提出的。具体划分是：唐初三四十年，开元前的五六十年间，从开元之初到安禄山之乱前夕，从安史之乱前夕到大历初十几年间的诗坛，从大历初到贞元中二十余年，从贞元中到大和初约三十年间，从大和初到大中初约二十年间，从大中以后到唐末约六十年。^{^[１９]}这八个时期的划分，基本上是将四唐再各分为二。细分自有其好处，但也存在跟七期说一样的偏失。

纵观上述七种唐诗分期说，存在两个共同倾向。其一，多考虑社会政治环境和诗坛风貌的变化，而忽略了创作主体的代群更替。多数分期方式将盛唐与中唐的分界点定于755年的安史之乱或由盛转衰的天宝元年（742），都是基于社会政治环境变化的考量。在这一背景下，尚永亮的分期明确回归“诗人本位”，以诗人群体之更迭代兴为中心观察诗史的变化历程，在四期基础上进一步将唐代知名诗人分为七个代群，实现了诗史分期与诗人分代的结合，深化细化了唐诗分期问题的研究。然而，其代群划分的时间节点还有待完善，一方面只考虑代群登场的时间，而未充分考虑退场的时间。另一方面各代群之间存在断层现象，部分诗人难以被准确归入某一代际。其二，偏重主观判断而缺乏客观依据。现有分期观点大多建立于研究者个人对唐诗进程变化的主观体认，尚未形成具有共识的客观指标和划分标准。读者只看到分期结论，却难以追溯其逻辑与理据，无从判断各种分期的合理性和科学性。历史的发展周期是客观的，而对历史周期的认识又是主观的。因此，在唐诗分期这一问题上，理想的路径应是主观认识和客观实证相结合，应有客观的数据史料来佐证和验证。

无论是文学史还是诗歌史，都是由创作主体创造的。社会环境的变化是通过创作主体来影响文学创作而体现，创作风貌的变化更是直接由创作主体来完成的。文学史和诗歌史的分期，忽略创作主体的代群更替，将一群群、一代代引领创作潮流的作家、诗人“砍头”“剁脚”，强行划入不同的创作时期，难免显得割裂与牵强。所以，我们提出以诗人为中心的代群更迭分期法，借助客观的数据分析和验证，力图避免传统分期存在的偏失，尝试解决刘学锴所说因“年岁相近的诗人分属盛唐、中唐两个诗歌时期的扯不清的问题”，^{^[２０]}使文学史的分期不再是模糊处理与主观体认，而是具备明确原则、客观依据和可操作的方案。

三、按编年数据重拟唐诗分期的时间节点

唐代（618—907）历时290年（不计五代），诗人辈出，其生活年代和创作阶段先后各异。不同代群乃至同一代群内部，诗人的生年不同、寿命长短有别。我们怎样在零散无序的唐诗长河中找出每个时段共同生活和创作的诗人群体来？数据分析或可为此提供新的视角。我们的思路和做法是，首先统计唐代诗人的平均寿命，估算整个唐代可能出现几个世代的诗人群体，进而确定唐代诗人世代群体的时长。据尚永亮整理的数据，唐代诗人中有年寿可考的凡383人，平均寿命约66岁。由此可推知，在唐代290年间应该有五个世代的诗人群体。在确定世代数量后，下一步是厘清各代群的时间节点，亦即明确哪些诗人应归属于同一世代。不同的划分标准会导致不同的代群归属结果。每位诗人是属上个世代还是属下个世代，都有理由和依据。为此，我们在诗人自然生命指数的基础上，引入“创作周期”这一指标。

创作周期，指每位诗人从开始创作到终止创作的时长。如李白（701—762）享年61岁，据其年谱和别集编年考订，其诗歌创作自715年持续至762年，创作周期达48年；杜甫（712—770）享年58岁，他的创作起于736年止于770年，创作周期为35年。于是，我们将表1里收录的83位诗人的创作周期，用统计学的聚类分析方法，按其创作年代分布先后制作成可视化的鸟瞰图（参见图1）。该图以诗人的出生年横向排列，横条内诗人姓名前的数字指诗人所处的时期、姓名后的数字指诗人的创作时长，即创作周期；横条外诗人姓名左侧的数字指其创作的起始年份，右侧的数字指其创作的终止年份。从图1可以清晰识别出哪些诗人完全属于同一个时期，哪些则跨越了两个时期。据此，我们先将创作周期完全处在同一时段的诗人划为同一个时期，并确立该时期的起止范围；随后，再对跨代诗人进行个案分析，判断其更适宜归属于上个时期还是下个时期。分析结果与我们预估基本一致，唐代诗人先后出现了五个代群。

图1：唐代83 位著名诗人创作年代分布鸟瞰图.jpg

第一个代群在隋末唐初，主要成员有虞世南（558—638）、李渊（566—635），魏征（580—643）、王绩（589—644）、李世民（599—649）、上官仪（608—665），除虞世南外，其他五人的创作周期完全处在同一时段，即603—664年。因此，这一代群的创作周期可定在603—664年间。虞世南由隋入唐，创作起步较早，其在入唐前更早的创作，可作为个案另行处理，不影响整体分期的确立。第一代诗人群主要生活在隋末唐初的隋炀帝和唐高祖、太宗三朝，以隋文帝仁寿三年（603）王绩开始创作为起点，以麟德元年（664）上官仪被杀为终点，历时62年（首尾俱计）。这代诗人大多是宫廷诗人，历经改朝换代的战争与和平时代，诗风既有六朝印记，也有开国诗坛的新气象。

第二个代群主要生活在高宗、武后、中宗和睿宗四朝，时间跨度为665至714年，共50年。其时间起点定在上官仪去世后的665年，终点定在沈佺期终止创作的玄宗开元二年（714）。图1显示，这个代群的诗人，只有卢照邻和骆宾王的创作起点较早，分别始于652年和641年，与上一代略有所交叉，这也是正常现象，上下两个代群之间总会有人重合。其实，641年骆宾王还是一个6岁的孩子，偶然吟诗而已，他创作的真正起步，要到20岁以后。杜审言、苏味道、王勃、杨炯、崔融、沈佺期、宋之问、陈子昂等著名诗人，都是在上官仪离开诗坛后才开始创作，李峤、王勃则是在上官仪离世前一、二年开启创作生涯。到了714年，初唐的第二代群全部退出诗坛，第三代群陆续登场。这代诗人生活在唐王朝社会政治的上升期，无论是诗体形式还是审美理想都力图构建唐诗的新风貌，四杰拓展了诗歌的题材，沈、宋确立了近体诗的体制，陈子昂提倡风骨兴寄，为后来的诗人指出了向上一路。

第三代群主要生活和创作于盛唐时期。上个代群创作活动结束的714年，正与李白的创作生涯起点相衔接。我们可以把715年作为盛唐代群的起始年。终点可以确定为770年，以杜甫去世为标志，恰涵盖李白（762年卒）与杜甫两位双子星的完整创作周期。如此划分，盛唐时期从715年至770年，历时56年。高适、王维、李白、杜甫、岑参和萧颖士等诗人的生活和创作周期就完全处于这一区间。本代群中有若干诗人创作活动横跨初唐与盛唐，需结合其生平与创作实绩进行具体分析。先需讨论的是张说、苏颋和张九龄三位跨代诗人。张说（667—730）的创作虽起于689年，终于730年，创作周期凡42年，以714年为界，他在第二代群的时间为25年，在第三代群活动的时间为17年，以中位数而论，他应划入初唐第二代群。但张说作为开元宰相，政坛和文坛的影响主要是在玄宗开元年间。《旧唐书》载其“前后三秉大政，掌文学之任凡三十年”。 ^{^[２１]}所言“掌文学之任”，虽就文章而言，但也包含诗歌创作在内；“凡三十年”，指张说去世的前三十年。其715年后的诗歌创作数量有132首，占其可编年诗歌总数的六成多。故张说应划归第三代群，视为第三代诗人群的领袖。苏颋（670—727）比张说小3岁，又早去世3年，与张说并世。苏颋为官和文学创作活动也主要是在开元年间。^{^[２２]}他在715年后的可编年诗为47首，而714年前的诗歌只有46首，所以将他与张说都划入第三代群。张九龄（678—740）作为“一代辞宗”，^{^[２３]}创作始于701年，终于740年，与盛唐的第三代群交集时间更长。他在政坛和诗坛的影响力在开元后期为相之时达至顶峰，宜划属盛唐，并视为继张说之后的政坛领袖和诗坛领袖。其次应讨论的是王之涣（688—742）和孟浩然（689—740）。孟浩然的创作始于上个时期的708年，但他30年的创作生涯有24年是在盛唐，在盛唐写了140首诗，而在初唐只有4首。他属盛唐诗人群无疑。王之涣因存诗很少，可考的创作周期很短，他仅比孟浩然年长一岁，创作周期也主要在盛唐，故与孟浩然同属盛唐。

对于活跃于盛唐中后期、部分创作延续至中唐的诗人，依据其创作时间与文学史定位作如下判断：钱起（718—783）43年的创作周期，即738年至780年，有32年是在盛唐，作于盛唐时期的诗歌有29首，只有5首诗是在771年以后所作。胡应麟《诗薮》说：“诗至钱、刘，遂露中唐面目。钱才远不及刘，然其诗尚有盛唐遗响。刘即自成盛唐与中唐分道矣。”^{^[２４]}钱起为承前启后式的诗人，既承盛唐遗绪，又开中唐新声，属上属下，本是两可。然其创作多在盛唐，承接王维，正如《中兴间气集》所说，钱起“诗，体格新奇，理致清赡。越从登第，挺冠词林。文宗右丞，许以高格，右丞没后，员外（钱起）为雄”。^{^[２５]}故属盛唐为宜。刘长卿（718—790），与钱起同岁，其创作周期为49年（738—786），在盛唐32年，作诗25首；在中唐17年，作诗11首，也应划入盛唐。黄克缵《全唐风雅》即指出：“刘文房登第于开元，正当玄宗盛时，与钱、郎颉颃。诗格调清峭而词气深厚，‘五言长城’，语不虚也。不知者列之中唐，误矣。”^{^[２６]}黄克缵也是从生活年代和诗风两个角度说明刘长卿应属盛唐，今有数据支撑，其说可从。元结（719—772）的创作周期大部分与杜甫重合，而48首可编年诗都作于盛唐，故应划归盛唐。独孤及（725—777）离开诗坛的时间，晚于杜甫7年，早于钱起6年，他的22首可编年诗，18首是在盛唐时期所作，也应该划归盛唐。这些诗人归入盛唐，便于考察盛唐诗风的多样性与延续性。颜真卿（709—785）的创作周期共52年，在盛唐37年，却没有一首可编年诗；30首可编年诗，全部作于771年以后的中唐，故他应属中唐诗人群。韦应物（737—792）在安史之乱结束后的765年才开始创作，在盛唐的创作只有5年时间，诗作17首；而在771年后的中唐，创作延续22年，作诗45首，占全部可编年诗的七成，所以他应划入中唐。胡应麟《诗薮》也说：“苏州五言古优入盛唐，近体婉约有致，然自是大历声口，与王、孟稍有不同。”^{^[２７]}韦应物作为由盛唐而入中唐转折时期的诗人，对中唐白居易等诗人有直接的影响，将他放在中唐或许更便于考察诗风的演进变化。

综上，第三代盛唐诗人群包括张说、张九龄、王之涣、孟浩然、高适、王维、李白、杜甫、岑参、萧颖士、钱起、刘长卿、元结、独孤及等。他们亲历大唐的繁华盛世，除张九龄、孟浩然、王之涣3人之外，其他诗人都目睹了帝国的衰落，亲身体验了战争离乱给国家人民和自身家庭所造成的苦难。他们的诗歌具有多重的生命样态，有盛世的欢歌，也有乱世的悲吟，有激情与理想，也有痛苦与失落，他们从不同的角度把诗歌艺术推向了顶峰。值得补充的是，在盛唐主将李白、杜甫去世之后到中唐韩柳、元白登坛作将之前（约771—790年间），钱起、刘长卿、颜真卿、韦应物和大历十才子等正好展现了他们的风采，使盛唐和中唐两座诗歌高峰之间的过渡不至于寂寞。

第四代中唐诗人群，时间跨度以杜甫去世后的771年为起点，以元稹去世的831年为终点，历时61年。之所以选择831年为终点，是基于韩愈、柳宗元、张籍、王建等核心诗人都已先后离世，标志该阶段文学主潮告一段落。若以白居易去世的846年为界，则中唐时间历经77年，时间太长，相比前三个代群的创作周期，不太均衡。且白居易享年74岁，高出唐代诗人平均寿命，不宜作为断代依据。

如果中唐诗人群的时间段定在771—831年，那么，孟郊、武元衡、权德舆、张籍、王建、韩愈、吕温、柳宗元、张彻、元稹、李贺等都在这个时段内（参见图1）。只有令狐楚、刘禹锡、白居易、李绅、姚合、贾岛等跨入晚唐。令狐楚（766—837）创作周期47年，即791年至837年，其中41年在中唐，42首可编年诗，有35首作于中唐。他在中唐的诗作占八成多，所以他应属于中唐诗人群。刘禹锡（772—842），792年开始创作，他在中唐创作了40年，作诗434首，占全部编年诗629首的近七成，只有生命的最后12年延续到了晚唐，他也应归属中唐。白居易（772—846），与刘禹锡同年出生，但享寿要高，创作周期也长，从十六岁开始创作，在中唐创作了43年，作诗1282首，占全部编年诗1921首的66.73%。他在晚唐只生活和创作了16年，诗作639首，约占总数的三分之一。他跟刘禹锡一样，也应属中唐诗人群。李绅（772—846），跟白居易生死同岁，自然也属中唐。李翱（774—836）的创作周期止于833年，只在晚唐创作了2年，自当属于中唐。刘禹锡、白居易、李绅3人属中唐，历来无争议。然姚合、贾岛，前贤常以晚唐人目之。姚合（777—842）比元稹小2岁，跟刘禹锡同年离世。他的编年诗共79首，其中63首作于中唐，以属于中唐为宜。贾岛（779—843）跟元稹同年生，又比白居易早3年去世，他78首可编年诗，作于中唐的有59首，占总数的七成多，自当划归中唐。周贺（777—840）跟姚合同年生，比刘禹锡去世还早2年，也应同属中唐。牛僧孺（780—848）虽比刘禹锡晚6年离世，但他的创作周期却停止在刘禹锡去世的842年，生命的最后几年没有创作留存。所以，他也应归属中唐。李贺（790—816）虽然比许浑还小2岁，但英年早逝，创作和生命都终止于中唐的816年，无疑应属于中唐。皇甫湜（787—835）虽与李德裕同年，但创作止于835年，在晚唐创作的时间只有4年，以属中唐为宜。无可（785—847）创作周期起于820年，止于845年，在中唐12年，有可编年诗12首；在晚唐14年，可编年诗有14首。他在晚唐的创作时间和诗作数量略多于中唐，可归入晚唐。李德裕（787—849）创作始于中唐的813年，在中唐创作了18年，在晚唐也创作了18年，在中晚唐的时间正好对半。而他76首可编年诗，有47首作于晚唐，占六成多。无可早他2年去世，划属晚唐，那么，李德裕也应划入晚唐。许浑（788—861）806年开始写诗，在中唐16年作诗107首，在晚唐27年创作158首，应属晚唐。

综上所述，中唐诗人群，包括颜真卿、韦应物、孟郊、武元衡、权德舆、张籍、王建、韩愈、吕温、柳宗元、令狐楚、刘禹锡、白居易、姚合、李绅、李翱、张彻、贾岛、周贺、牛僧孺、李贺、皇甫湜等。他们在回望帝国的繁盛荣耀中度过，对当世的衰颓充满了深深的失落与无奈。他们有救世的理想，也有济世的才能，却在政治上备受打击迫害，都深切体验了生命沉沦挣扎的苦痛，他们的诗歌充满了个体生命备受压抑的悲怨、无法改变命运的忧伤，情调深沉而富有不屈的力量。

晚唐诗人群以831年（元稹卒年）为起始，此后开始创作的诗人均归入晚唐。尽管雍陶（796—860）、顾非熊（797—854）、温庭筠（801—866）、项斯（801—853）、令狐绹（802—879）、段成式（803—852）、刘得仁（807—859）、李商隐（812—858）等在831年前已有创作，但其早期创作时段较短，且成就与影响力多被中唐前辈诗人所遮盖。从创作周期分布来看，这些诗人在晚唐的创作时间远超中唐。中唐的创作时间与晚唐创作的时间之比，雍陶是12∶27，温庭筠是4∶34，项斯是11∶20，令狐绹是0∶16，段成式是11∶29，杜牧是8∶19，刘得仁是11∶24，李商隐是7∶25。雍陶、项斯、刘得仁在晚唐创作的时间都比前段长1倍，段成式和杜牧则是后段比前段长2倍多，李商隐后段比前段长3倍多，温庭筠前段仅是后段的零头，令狐绹在中唐没有创作可考，其作品全在晚唐。因此，这些诗人都应属晚唐。此外，方干、喻凫、薛能、陆龟蒙、贯休、罗隐、皮日休、韦庄、司空图、黄滔、韩偓、鱼玄机、吴融、郑谷、唐彦谦等诗人，均在832年后才开始步入诗坛，无疑都属晚唐这一时期。

若晚唐的下限定在907年，则晚唐跨度长达76年，超过诗人的平均寿命。故可考虑将晚唐诗人进一步划分为两个小代群。晚唐前段诗人出生在785—817年之间，包括无可、李德裕、许浑、雍陶、顾非熊、温庭筠、项斯、令狐绹、段成式、刘得仁、方干、喻凫、李商隐、薛能等人。晚唐后段诗人出生在818—860年之间，包括陆龟蒙（830—881）、贯休（832—912）、罗隐（833—909）、皮日休（834—902）、韦庄（836—910）、司空图（836—910）、黄滔（840—911）、韩偓（842—923）、鱼玄机（844—868）、郑谷（848—909）、唐彦谦（848—907）等诗人。其中贯休、罗隐、韦庄、黄滔、韩偓、郑谷等都目睹了唐帝国大厦的倾覆。晚唐诗人身处日落西山的时代。如果说中唐诗人有失望也还有希望，那么，晚唐诗人则更多为深深的绝望，纵有救世之心，也无济世之望，只好转向隐世和玩世，用精美的诗歌建构灵魂的避难所。他们的诗歌普遍充满了末世的哀歌和人生的悲凉。

四、结语

本文以诗人代群为中心，以同一性和完整性为分期原则，综合考量诗人的生活年代、创作周期和可编年作品数量，将唐代诗人划分为五个代群，唐诗亦相应地分为五个时期。考虑到初、盛、中、晚四唐说已成广泛共识，五个时期可分别称为隋末唐初、初唐、盛唐、中唐、晚唐。在传统四唐说的基础上增加一个隋末唐初。晚唐又可分为前后两段，故我们的唐诗分期可概括为“五期六段说”。尽管前辈学者已有五期六段类似的划分观点，但本文在分期原则、依据和具体的时间节点设定上都与前人的说法和做法不同。既有原则性、操作性，也考虑到了诗人代群所处的时代环境及诗坛风尚的变化。当然，本文的主要任务是提出分期的时间节点，将83位著名诗人划归相应的时期并说明理据。其余未列入上述名单的唐代诗人，亦可参照其生活和创作年代归入相应时期。至于各个时期诗坛的特点、诗风的转型变化，有待日后申论。我们深知，基于数据分析的分期方法，虽力求客观，仍难以圆满解决分期中所有的问题，难免顾此而失彼。本研究的意义，主要是在偏重主观的定性分析基础上，尝试提出一种比较客观的新思路，解决问题的新途径和新方案。

注释

向上滑动阅读注释

^{^[１]} 胡适：《白话文学史》，北京：中国和平出版社，2014年，第245-247页。

^{^[２]} 闻一多：《四千年文学大势鸟瞰》，《闻一多全集》第10卷，武汉：湖北人民出版社，1993年，第22-36页。

^{^[３]} 陆侃如、冯沅君：《中国诗史》，天津：百花文艺出版社，2008年，第228页。

^{^[４]} 宋育仁：《三唐诗品》，张寅彭：《清诗话三编》第10册，上海：上海古籍出版社，2014年，第6817-6840页。

^{^[５]} 谭丕模：《中国文学史纲》，上海：商务印书馆，1954年，第171、172、186、211页。

^{^[６]} 范文澜：《中国通史简编》，天津：天津人民出版社，2020年，第267、284、301页。

^{^[７]} 倪其心：《关于唐诗的分期》，《文学遗产》1986年第4期。按，起讫时间为笔者所加。

^{^[８]} 陈伯海：《唐诗学引论（增订本）》，上海：上海古籍出版社，2015年，第102页。

^{^[９]} [元]方回选评，李庆甲集评校点：《瀛奎律髓汇评》卷4，上海：上海古籍出版社，1986年，第338页。

^{^[１０]} [元]杨士弘编选：《唐音评注》，保定：河北大学出版社，2006年，第1-7页。

^{^[１１]} [明]高棅：《唐诗品汇》，上海：上海古籍出版社，1982年，第8-9页。

^{^[１２]} [明]徐师曾：《文体明辨序说》，北京：人民文学出版社，1962年，第107页。

^{^[１３]} 杨世明：《关于唐诗的繁荣与分期诸问题刍议》，《四川师范学院学报（哲学社会科学版）》1996年第2期。

^{^[１４]} 尚永亮、张娟：《唐知名诗人之层级分布与代群发展的定量分析》，《文学遗产》2003年第6期。

^{^[１５]} [宋]严羽著，郭绍虞校释：《沧浪诗话校释》，北京：人民文学出版社，1983年，第52-53页。

^{^[１６]} 苏雪林：《唐诗概论》，沈阳：辽宁教育出版社，1997年，第9-13页。

^{^[１７]} 许总：《唐诗史》目录，南京：江苏教育出版社，1994年。

^{^[１８]} 罗宗强：《隋唐五代文学思想史》目录，北京：中华书局，1999年，第1-3页。

^{^[１９]} 中国社会科学院文学研究所：《唐诗选·前言》，北京：人民文学出版社，1978年，第17-22页。

^{^[２０]} 刘学锴：《大历诗风与盛唐余响》，《学术界》2023年第9期。

^{^[２１]} [后晋]刘昫：《旧唐书》卷97《张说传》，北京：中华书局，1975年，第3057页。

^{^[２２]} 参见郁贤皓：《李白与唐代文史考论·苏颋年谱》，南京：南京师范大学出版社，2008年，第828-837页。

^{^[２３]} [后晋]刘昫：《旧唐书》卷92《韦陟传》，第2958页。

^{^[２４]} [明]胡应麟：《诗薮》内编卷5，上海：上海古籍出版社，1979年，第84页。

^{^[２５]} [唐]高仲武：《中兴间气集》，傅璇琮编撰：《唐人选唐诗新编》，西安：陕西人民出版社，1996年，第463页。

^{^[２６]} 引自陈伯海主编：《唐诗汇评》第2册，上海：上海古籍出版社，2015年，第720页。

^{^[２７]} [明]胡应麟：《诗薮》内编卷4，第69页。

以上文章原载于《学术研究》2025年第12期，文章不代表《学术研究》立场。篇幅原因有所删减，未经授权不得转载。

学术研究

全国各地邮局均可订阅《学术研究》，国内邮发代号：46-64，欢迎您订阅！您也可访问学术研究杂志社门户网站：中国（南方）学术网http://www.southacademic.com，免费获取往期pdf版本。

李桂奎 | 中国古代小说批评中的“体认”观念及相关术语通解

王兆鹏 | AI时代古代文学量化研究的目的、意义与发展方向

2026年1月30日 10:02

2026-01-30 10:02 北京

湖南师范大学社会科学学报

本文转自湖南师大社科学报

AI时代古代文学量化研究的目的、意义与发展方向

作者简介

王兆鹏

现任中南民族大学教授、博士生导师，四川大学文科讲席教授，历任湖北大学人文学院院长、武汉大学杰出学者特聘教授。兼任中国宋代文学学会会长、中国词学研究会会长、中国李清照辛弃疾研究会会长。主持完成2项国家社会科学基金重大招标项目，多次获教育部、湖北省社会科学优秀成果二等奖，出版学术专著20多部，发表论文300余篇。主持开发有《唐宋文学编年地图》。

王兆鹏.AI时代古代文学量化研究的目的、意义与发展方向[J].湖南师范大学社会科学学报,2025,54(06):1-10.

核心提示

在智能化的大数据时代，文学研究不能缺少量化分析。相较于定性分析而言，定量分析既具有独特的优势，也有难以克服的局限。所以，使用文学的定量分析方法，不是要取代传统的定性分析方法，而是补充和完善传统的定性分析和理论阐释。定量分析与定性分析的有机融合，才是文学研究最理想的方法。文学量化研究的意义在于提升文学研究方法的科学性和结论的确定性，强化文学研究的深细度，拓展文学研究的宽广度，从而推动文学研究的进步。今后古代文学的量化研究，可从两个方向拓展和深化：一是从外部考察转向内容分析，二是从数量统计转向质量测评。

内容精选

《中在智能化的大数据时代，文学研究存在的已经不是要不要数据化、能不能量化分析的问题，而是怎样数据化和量化分析的问题。那么，文学的量化研究有哪些独特优势？有什么学术意义？能否推动文学研究的进步？今后的文学量化研究应朝哪个方向发展？下文具体讨论。

一、量化、定量、计量概念辨析

在文学量化研究中，经常使用量化分析、定量分析和计量分析这三个概念。有必要先简略辨析这三个概念的异同和用法。

从统计学的角度看，量化分析、定量分析、计量分析有着层次和用法的区别。

量化分析，是一种方法论范式，贯穿从数据收集到模型结论的全过程。它通过数学、统计学和计算技术将研究对象量化为可测量的数值数据，并基于这些数据进行系统化建模、推断和预测。其核心目标是通过数据揭示客观规律，最大限度地减少主观判断的干扰。

定量分析，是量化分析的子集，特指利用定量数据进行统计描述、比较或推断的具体技术过程。其核心在于依据定量数据而不是定性资料（如文本、图像、录音等）作为分析的基础。它通过运用统计量（如均值、百分比、相关系数等）和可视化图表（如柱状图、折线图、散点图等）来揭示数据的分布特征、变化趋势及相关关系，从而验证假设、发现规律或预测未来。

计量分析，是定量分析在特定领域的深化应用。它最早系统化应用在经济学领域，侧重通过构建数学模型和运用统计推断方法，揭示经济变量之间的内在机制与因果关系，并发展为一门成熟独立的学科——计量经济学。随后，这一方法论逐渐扩展到社会学、历史学、语言学等诸多领域，催生了计量社会学、计量历史学、计量语言学等交叉研究方向。

如果在文学研究中使用这三个概念，笔者有如下建议：作为一种研究方法指称时，可说量化分析、量化研究或量化考察；在与定性分析对举时，可说定量分析；作为一种专业领域指称时，参照计量信息学、计量历史学、计量社会学、计量语言学等领域的名称，可以称计量文学史、计量学术史。

二、文学量化研究的优势与局限

相对定性分析而言，定量分析有其独特的不可替代的优势。

其一是客观性。定量分析是用数据说话，而数据是从众多的客观事实中提取出来的。较之定性分析的主观认识和判断，显得更客观。比如作家的影响力，传统的文学研究基本上是根据有限的例证做主观的推断。而量化分析则是用大量的跨时代数据来分析，结论更客观。当然，数据选择本身也隐含着一定的主观性。所谓客观和主观，都是相对的。定性分析的主观性，也不是纯主观的个人好恶，而是有一定的客观史实作为依据。

其二是实证性。定性分析主要是逻辑的演绎与推理，定量分析则是用具体数据来分析和验证，有时会更有说服力。如论及唐诗、宋词的繁荣，定性分析多是主观印象式描述，固然也有理有据，但用数据来实证，更具可验证性。从东汉到隋末近600年留存的诗歌，总共才5000多首，而唐诗传存下来的有50000多首。近300年唐代诗歌作品量，是近600年东汉至隋末诗歌作品量的10倍。唐五代的词人只有100多人，词作1962首，而宋代词人有1497家，词作21055首。相较之下，宋代词人词作数量是唐五代的10多倍。宋词用调900多种，在唐五代词的基础上增加了700余种。词调多，意味着词体的丰富。唐五代词人中唯温庭筠、冯延巳、李璟、李煜4家有词集传世，而宋代则有300家的词集传世。这些数据，充分彰显了唐诗宋词的繁荣程度。这些数据和结论，可以重复验证，具有更高的透明度和可信度。

其三是可比较性。比较，不是定量分析所独有，定性分析照样可以比较。但是，量化的比较更具体、更明确。比如，说到作家的影响力，定性分析研究常常描述为“影响很大”“影响较大”，但多大的量级是“很大”、多大的量级是“较大”，只能模糊把握。“很大”与“较大”的级差是多少，也无法说清楚。量化分析方法，用具体数据来呈现比较对象之间的量差或级差，往往一目了然。“李杜优劣论”，是千年以来争论不休的问题，见仁见智，难有定论。我们用二人创造的名篇数量来衡量其影响力，立马就可以分出高下，而且可以直观地显示二人的差别究竟有多大。虽然这不是全面的比较衡量，但至少从一个侧面的比较中可以看出李杜的差异。

其四是标准化。所谓标准化，是说定量分析总是用定义清晰的指标和统一的测量标准来衡量不同的研究对象。一旦确定了指标，就可以将不同时代、不同地域、不同风格的作家放在同一尺度下进行比较，而且研究过程更具程序性，结果表达更精确，如排名第几，或占百分之几等，增强了研究的实证性。定性分析比较不同作家的差异，有时不太注意用同一标准、同一尺度进行进比较论析，论此作家从题材的角度分析，说彼作家则从风格或体式的角度切入。所论不同作家的创作个性，有时看似区分度很大，实则说的不是一回事，采用的是不同的分析原则和标准。如果用量化分析方法比较唐诗宋词作品的影响力和词人的影响力，是用统一的数据指标来比较，标准是统一的、研究过程是程序化的，因此作品之间、词人之间更有可比性，也更能比较出高下。量化分析的这种优势，为跨时空、跨文化的比较提供了可能性，使得文学史的书写更具“通约性”。

其五是规模化。定量分析方法，可以轻松处理海量数据，特别是随着人工智能的发展，处理海量数据的软件工具越来越多，也越来越便捷，可以将大量作家、作品置于同一标准下进行共时性和历时性的比较，揭示其地位和影响力的差异，提供“鸟瞰式”的图景，揭示整体结构和分布规律。比如，如果用量化分析方法，可以轻松地把唐代三千多位诗人、宋代九千多位诗人的时段分布和地域分布情况一目了然地展示出来，并揭示出南北分布的不平衡以及诗坛中心逐步南移的过程。定性分析在面对如此大量的研究对象时往往力不从心。

其六是可视化。定量数据非常适合通过图表，诸如柱状图、折线图、饼型图、网络图、词云等进行可视化展现，让复杂的文学现象，如作家的关系网络、大量作品的主题演变、影响力分布等复杂情况变得一目了然，便于理解和传播。数据图表提供的直观、高效的呈现方式，有时比文字描述更让人印象深刻，更具冲击力。

但定量分析方法，也有天然的局限性。至少有三种功能性局限。

一是表层性。量化分析能说明现象和格局，但不能说明现象、格局形成的深层原因。定量分析擅长描述研究对象“是什么”和“有多少”，但难以解释“为什么”和“意味着什么”。它无法解释文本的深层意义、美学价值、历史语境、文化内涵、象征隐喻等。它能说明对象间的相关性，但无法说明事件、现象的因果性。

二是单一性。数据的单一性与文学作品文本的多义性无法对应。数据化能将复杂的文学作品简化为可计量的数据点，但也会丢失大量的语义、修辞、语调、反讽、多义性、上下文依赖等构成文学独特价值的元素。文学文本的语言是丰富的，是“厚数据”，量化过程使其变“薄”，数据会损失语义的多元性和丰富性。

三是孤立性。每篇文学作品产生于特定的历史语境，每篇作品的语句依存于特定的文本语境，从文本提取的数据，脱离了特定的历史语境和文本中的具体语境，丰富多元的语结构变成孤立的单一的数据，无法结合具体语境来理解不同数据的微妙含义、情感色彩或象征意义。文学数据适合于“远读”、宏观性观察，而不适合文本“细读”和微观考察。

此外，还有数据来源性的局限。特别是古代文学的量化研究，存在着数据的可获得性、代表性局限。很多历史数据无法获得，比如宋词，在宋代主要靠演唱传播，传唱的时间长度和空间广度是衡量宋词作品影响力的重要依据。但宋词每首作品传播的资料十分有限，有时无法从中提取有代表性的数据。又如诗人学习效仿前人作品的数据，目前只能提取到语词字面化用的数据，而无法提取到化用前人句式句法的数据。此外，数据指标是否有充分的代表性也是问题。

再就是“黑箱”效应与技术依赖。复杂的算法（如深度学习模型）可能成为“黑箱”，文学研究者难以理解其内部运作机制和分析结果的具体成因。特别是偏重计算机技术的研究者，注重模型建构的过程，而对文学研究者关注的结论及其推导过程往往一笔带过，也就是直接根据数据得出结论，而不显示具体的数据指标，不说明结论是根据哪些数据指标得出的，逻辑推衍过程常常被忽略，结论难以让人信服。有些数据挖掘和数据分析，高度依赖特定的软件工具、编程能力和数据清洗技术，对于一般文学研究者而言，也存在技术门槛。

文学的量化研究虽然有其独特的优势，但也有无法克服的局限性。因此，使用文学的定量分析方法，不是要取代传统的定性分析方法，而是补充和完善传统的定性分析和理论阐释。定量分析与定性分析的有机融合，才是文学研究最理想的方法。

三、文学量化研究的目的与意义

文学研究是一门科学。凡是科学的研究，都可以而且应该量化分析。马克思曾经说过：“一种科学只有在成功地运用数学时，才算达到了真正完善的地步。”文学研究也是如此。

（一）量化分析的目的

文学研究之所以要量化分析，是基于问题导向、创新驱动，也是时代需求。

先说问题导向。文学研究中有些问题，传统的方法无法解决，只能借助量化分析来解决。比如，文学经典研究，就必须借助量化分析。因为研究文学经典，首先要确定哪些是经典，而对于哪些是经典，见仁见智，难有定论。唐诗是公认的经典，宋词也是公认的经典，但传世的50000多首唐诗、20000多首宋词，并非篇篇是经典；成千上万的诗人词家，也不都是经典的诗人、词家。即使是像李白、杜甫和苏轼、辛弃疾这样的大诗人、大词人，其传世的作品也并非篇篇都是经典。那历史上哪些作品被视为经典？用定性分析的方法来确定哪几首诗、哪几十首诗是经典，尚有可行性，但要区分几万首唐诗宋词哪些是经典、哪些不是经典，哪些经典化程度更高、哪些经典化程度较低，就难以做到。而用量化分析的方法，就可以比较分析哪些唐诗宋词作品在历代传播过程中影响力较大、经典指数较高。确定哪些作品是经典之后，再用定性分析方法来探讨经典的特质、经典的生成和经典的意义，就有了前提和基础。定量分析可以弥补定性分析方法的不足，拓展文学研究的深度和广度。

定量分析，可以在纷繁复杂的资料数据中发现一些定性描述容易忽略的，或者被遮蔽的事实与真相。比如，在跨越上千年的数百种选本、诗话词话等著作和数万项现代研究成果中，定性分析根本无法通过全盘比较发现哪些唐诗宋词作品的影响力较大、哪些作品的影响力相对较小。而通过构建影响力指数就可以发现哪些作品的影响力较大，哪些作品的影响力较小，还能揭示每首作品影响力在不同时代涨落变化的过程。这是定性分析无能为力的。

又如，研究宋代的地域文学，先需了解哪些地域的文学比较发达、哪些地域相对落后。传统的印象是江西和四川的文学比较发达，唐宋八大家里，江西和四川各占三家。如果将宋代的作家籍贯按今天的省市区划分统计，结果显示宋代作家最多的省份是浙江和福建两省；如果按当今地市级行政区来统计，是哪个地市的作家最多？统计结果发现是柳永的故乡——福建南平市的作家最多，福建福州市的作家人数名列第二。结果出乎意料，也提出了新问题：为什么宋代福建南平和福州的文学特别发达？它们经历了怎样的发展过程？

再比如，研究宋代的文学家族，除了那些知名的文学家族，如眉山苏氏、绍兴陆氏、山东晁氏家族之外，并不了解还有哪些文学家族既延续时间长又人数众多。现在用定量分析法对宋代诗文词的作者姓名和籍贯进行了统计与分组，就发现了许多过去不为人熟知的文学大家族，仅浙江绍兴一地，宋代就有32个文学家族，除山阴陆游家族5代8人之外，还有会稽钱易家族4代11人、新昌吕蒙家族6代12人、上虞李光家族4代7人。这些家族代代相承，都有文学作品传世，但他们分散在《全宋文》《全宋诗》《全宋词》里，不统计根本无法发现。如果用最简单的数据统计方法，就能轻而易举地发现分散隐藏在断代总集中的文学家族。数据统计、量化分析是帮助发现问题的利器。

定量分析还可以验证固有认知和传统观点是否正确。比如，中国文化中心的三次南移，是中国文化史上普遍被接受的观点：中国文化中心原来在黄河流域的中原，西晋永嘉之乱后，中国文化中心逐步向南方移动；唐代的安史之乱，加剧了中国文化中心的第二次南移；到了宋代的靖康之难，文化中心的南移才宣告完成。用唐宋两代作家作品的数据统计发现，北宋初期南方的作家人数就超过了北方，文学中心在北宋中期已完全从北方移到了南方，并非靖康之乱后。而且，北宋以后南方的文学空间也不是均衡分布在传统意义上的长江以南，而是高度集中在东南的浙江、江苏、福建、江西、安徽五省。这五个省的诗人占了宋代诗人总数的近七成。这是统计数据验证和修正文化史、文学史传统观点的典例。

学术史上不少观点，有待数据的支撑和验证。如有学者说：

回顾20世纪的中国古典文学研究，比较辉煌的集中在两个时期：一是20世纪初期，另一个是20世纪末期。无论从研究的量和质上说，20世纪末期都超过了20世纪初期。这一时期以“文革”结束，中国内地实行改革开放（1978年）为标志，习惯上称之新时期。

这其实不是少数学者的看法，而是当下多数学者的共同观点。的确，20世纪初期出现了王国维、梁启超等大学者，他们的相关中国古典文学研究成果，已成为后世高山仰止的经典。如果说20世纪初期的古典文学研究很“繁荣”，似乎不无理据。可如果要追问“20世纪初期”究竟指什么时候，它起于何时，止于何年？这个时期中国古典文学研究的“量”和“质”是否真的都很“辉煌”？说“质”的繁荣，尚能列举一些名家名作来印证，可要说“量”的繁荣，恐怕难有数据作为支撑。就目前已搜集到的13万多条20世纪（1900—1999）中国古典文学研究论著目录来看，统计数据不支持“20世纪初期”中国古典文学研究或唐代文学研究繁荣的说法。如果把“20世纪初期”的时限定为1901—1930年，那么，这30年间国内中国古典文学研究成果为2947项，不及1994年一年的成果量（3006项）。跟不太起眼的20世纪50年代相比较，1950—1959年间中国古典文学研究成果量也有9 993项，是20世纪头30年的3倍多。再就唐代文学研究而言，1901—1930年的研究成果只有364项，而1950—1959年的成果量有1 463项，20世纪50年代10年的成果量比20世纪初30年的成果量多出3倍多。从客观的统计数据来看，“20世纪初期”的唐代文学研究和整个中国古典文学研究，肯定不能说是一个“繁荣”的时期。所以，有些印象式的定性判断，如果没有数据的支持和佐证，结论不一定成立。

定量分析，不是凭主观印象、凭个案推论，而是依据客观的事实和数据来做出判断，得出的结论更具客观性、精确性、可比较性和可验证性。定量分析，具有定性分析不可替代的优势。正如定量分析不能替代定性分析一样，定性分析也不能否定或替代定量分析。定量分析与定性分析具有互补性，把定量分析与定性分析结合起来，定量分析时结合文学文本细读、语境分析和理论阐释，揭示数据的文学价值和文化意义；定性分析时，也注意定量分析，用数据来支撑和验证定性分析的问题和观点，才是最优化最有效的研究方法，也是今后人文社会科学研究的必然趋势。

文学研究的量化分析，也是创新需求的内在驱动。学术研究的创新，需要挖掘新材料、提出新观点、运用新方法、开拓新领域。文学研究的量化分析，完全可以满足这“四新”的要求。历来的文学理论和文学史研究，数据意识薄弱，更少数据留存，需要从文献中去挖掘。挖掘的文学数据，都是前人未曾发现和运用过的全新数据。目的指向不同，挖掘转化的数据类型、数据指标也不相同，因而数据常挖常新。运用新数据，可以发现新问题，进而提出新观点，或修正已有的观点。数据挖掘和数据分析的多种软件工具、技术方法，如Python的NLTK、Gephi网络分析等，相对传统的定性分析方法而言，都是前代文学研究者闻所未闻的。文学的量化研究，可以开拓出新领域，即使旧领域也能拓展出新空间、开辟出新方向。

文学研究的量化分析，更是时代的需求、学科发展的需求。当下已进入大数据时代、人工智能时代，各行各业都需要运用大数据，文学研究当然也不例外。随着人工智能的发展，互联网每天都在产生和更新文学创作、传播、接受的大数据，这些需要文学研究者去面对和研究。就古代文学研究而言，虽然古代文学作品只有存量数据而没有增量数据，但传播和阐释古代文学作品的资料和数据却是增量的、不断更新和增加的。古代文学研究者既要挖掘存量的历史资料数据，也要充分利用当下古代文学传播、阅读、接受的资料和增量数据，回应大数据时代提出的新问题、新需求，不能仅仅满足于对历史资料数据的挖掘，却忽略了对当下新生资料数据的关注、整理和运用。

（二）量化分析的意义

讨论了量化分析的目的，说明了为什么要做量化分析之后，再讨论量化分析的意义，追问量化分析有什么作用、价值。文学研究的量化分析，至少有三点意义。

第一，提高文学研究方法的科学性和结论的确定性。传统定性分析方法，重主观阐释和逻辑推衍，结论的模糊性和不确定性常常受到质疑。文学研究引入量化分析方法之后，数据的客观性、研究流程的标准化、结论的可验证性（结论可被其他学者按相同标准复现验证），减少了主观偏差，会大大提升文学研究的科学性和结论的确定性。

文学研究的有些结论，通常用形容词或副词来描述程度、幅度、频度、密度、强度、深度，如“影响很大”“关系密切”“反响强烈”等，这些结论固然可以意会理解，但量化分析用数据表达的结论更具客观性和说服力。特别是要区分两个研究对象的差异时，数据结论更清晰和明确，更具可比性。借助笔者团队联合开发的古籍文献知识图谱平台中“最常在诗文中被提及”的人物数据，就可以从一个侧面具体了解每个朝代不同人物之间的关系。其关联的频次与紧密度，有数据来测度衡量，有社网图来直观呈现。谁与谁的关系最密切、谁是群体交往中的核心人物，数据和图表的展示一目了然。

总之，文学量化分析通过标准化流程、智能化软件工具和大规模数据分析，会推动文学研究从“经验猜想”向“实证探索”的转型。其科学性与确定性，不仅体现在方法的严谨性上，更在于为传统的文学问题提供了可检验的答案，成为数字人文时代重要的研究范式。

第二，强化文学研究的深细度。传统的文学研究重感悟、重整体性把握，这是优长，但也是短板。量化分析的数据求精细、求精确，可以推动文学研究的精细化、精确化。如过往作家生平事迹和作品创作的系地，就显得比较宽泛。作家的活动地、作品的创作地，无论是作品别集、选本的注释，还是年谱类著作和生平考订论文，包括阐释性的研究论著，一般都满足于确定在州县行政区的大范围内，很少进一步去考实、追问是在哪个具体的地点方位、其地形地貌如何。而文学地理的定位数据，则需要地点具体的经纬度。虽然古代文学作品中的历史地名，有些今天已难知其详，但也有些可以确定今日的具体方位和经纬度。由于受传统研究观念的制约，对好多地名没有一一去追踪探寻，只是按一般文献说明其所属行政区划、地理范围而已。如果按系地数据的要求，重新审视中国古代文学研究，那么大部分中国古代作家的年谱著作和作品注释都需要修订重写，以细化古代文学作品中的地名所涉地理方位和地形地貌。

对古代文学研究而言，量化分析一方面可深化对作家作品的编年系地研究，将原来的系地由州县行政区域细化到县级政区以下的具体点位；另一方面，又可深化对文学地理区域、交通路线的研究。有了作品的细化定位，就可以研究更小区域的文学，如某个山地文学、山地文明，或某片平原、某片河谷的文学，或某个有特点有影响力的地理区域的文学，从而突破传统的以省市级行政区域为研究对象的思维模式；也可以以某条交通路线为中心来研究文学作品，比如近几年唐诗之路研究颇受关注，成果也很丰硕。如果有了唐诗更细化的系地考订成果，就可以使唐诗之路的研究更系统更细致。而宋代的“赣浙线”“赣闽线”“赣粤线”，即从江西到浙江的路线、江西往福建的路线、江西去广东的路线，行走的作家非常多，但沿途作家所写作品的定位还缺乏系统考订。如果有完备的数据，文学与地理、文学与交通路线的研究，将会开创出全新的格局。

可深细化的层面还有很多。如词体研究层面的词调研究，目前只有词人用调情况的统计数据，而没有对各个词调的用韵、平仄、字句、情感基调、风格特征的数据进行系统的挖掘提取。如果有了完备的数据，词调的研究将会深入一大步。

第三，拓展文学研究的宽广度。量化分析，至少可从作家作品等维度拓展文学研究的广度。

作家维度，将覆盖每个时代所有的大小作家。传统的文学研究，主要关注的是大作家、名作家，绝大多数古代作家还没进入现代学术研究的视野。丰富多彩的古代文学舞台上，唯见若干主角、名角，少见配角，更看不到群众演员。众多“小”作家的创作情况不被熟悉、不被了解，文学史的全景、全过程就很难真正弄清。以宋代文学研究为例，截止到2021年的统计数据，20世纪以来宋代文学研究涉及的作家有1104人，拥有3项研究成果以上的关注度较高的宋代文学家为376人。这算是相当可观了。可相较宋代有诗、词、文作品传世的作者16772人而言，这些有研究成果的宋代作家只占宋代作家总人数的6.58%，也就是说，进入现当代学术研究视野的宋代作家，尚不足一成，还有九成多的作家无人研究。而量化分析，可将宋代的全部作家纳入研究视野，让每位宋代作家先以平等的身份进入文学史的研究序列。通过数据聚类分析，将他们归入不同的数量层级和文学区域。如将宋代的全部作家纳入空间分布的分析之后，发现宋代福建的作家人数特别多，尤其是南平市和福州市最多，从而引起对南平和福州两地文学的关注。那些“小”作家，随着区域性文学的展开，将逐步进入文学研究的视野，不至于完全被无视。

作品维度，采用分类词频的统计等手段，可以分析一代代作品的情感空间、生活空间、社会空间、地理空间如何一步步地延展、深化和细化。作家个案的研究，可以深入了解一位作家的审美空间，但无法统观一代作家情感空间的共性和差异性。只有将一个时代的全部作家作品按不同的历史时段进行整体透视和数据分析，才能看出不同世代作家群体情感空间的丰富性、多样性和变异性。用同样的数据分析方法，可以透视不同世代作家群体书写的生活空间、社会空间和地理空间如何从庙堂到江湖、从城市到乡村、从中心到边缘、从平原河谷到山地、从上流贵族到下层民众、从社会政治到人间烟火的突围与变化。

作品维度，还可以借助语言学的思路方法，挖掘提取诗词中的句型、句式、句法（不同于现代汉语所描述的句型、句式、句法）数据以及各种修辞手法的数据等。如果像建设语言学语料库那样，利用生成式大语言模型技术，将《全唐诗》《全宋诗》《全宋词》等中国古典诗词作品开发成系统的各种句型、句式、句法数据库，将大大拓展古典诗词句法、章法研究的思维空间。

通过作品物象数据的挖掘和提取，还可以进行跨学科的研究。如将各个时代的动物、植物、器物意象进行全方位的系统的分类提取，来研究每个朝代动物、植物、器物的种类、分布及其变化。如有古生物学者通过中国古典诗词里有关江豚的描写，研究了1 400余年长江江豚分布格局与演变，发现从唐朝到现代，长江江豚的种群分布范围大幅缩小了至少65%，论文发表在国际权威期刊《当代生物学》上。可见，艺术作品（如古诗）不仅承载着丰富的文化内涵，也提供了宝贵的数据资源，可帮助科学家追溯野生动物的历史分布动态变化。这些文化记录可成为未来生物多样性研究的重要补充，为濒危物种的保护与恢复提供新视角。文学与文化研究的结合，催生了文学文化学⑩。中国古代文学作品里描写的动物、植物、器物十分丰富，如果文学研究者与动物学、植物学、博物学的专家学者合作，说不定可以拓展出文学动物学、文学植物学、文学博物学之类的新兴领域。

四、今后文学量化研究的发展方向

基于对近些年已有的文学量化研究成果的观察，今后可从两个方向拓展深化：一是从外部考察转向内容分析，二是从数量统计转向质量测评。

（一）从外部考察到内容分析

今后文学史的量化研究，除考察文学的时空分布和影响力之外，还要注意量化分析作品的内容、艺术形式和创作方法。

首先，要加强作品的主题分析和情感分析。文学主题、作家心态、作品情感是传统文学研究的主要话题，但大多是个案的分析，要么是分析个体作家的写作主题、情感心态，要么是分析作家群体的主题取向、情感倾向，很少对一代文学主题进行全盘的分析。近些年数字人文兴起之后，运用文本数据建模，自动提取文本主题，进行主题分析和风格分析，并运用标签云，通过字体大小和颜色突出文本中的高频词汇，呈现主题聚焦点。比如，皮特·布劳德韦尔等人以《全唐诗》为远读材料，利用隐含狄利克雷分布（LDA）主题模型提取150个诗歌主题，又用散度度量的数学方法计算不同诗歌之间的主题差异，发现了不同类别的诗歌之间如咏史诗和仪轨诗的文本隐性关联。皮特·布劳德韦尔等人的研究方法新颖，结论亦有启发性。但这类主题是共时的研究，即把近300年的唐诗视为一个共时性的整体，进行横向的主题提取，这当然有学术意义，可以了解唐代诗歌总共表现了多少主题，知道唐代诗人关心哪些社会、历史、自然、个人的问题。但还需要进一步从历时性角度量化分析唐朝每个世代的诗人群体在各自的历史时段，表现了哪些主题、哪些心态情感，并结合每个时段发生的重大社会事件和事变，分析诗人是怎样面对这些社会变化的、有哪些态度和感受。定性分析可能更多关注共性的重大主题和主流的心态情感，而忽略了很多被遮蔽的幽微隐约的人生感受和主题倾向。因此，应尽可能用数据分析全景性，还原每个时代、每个时期、不同空间地域文学主题、情感的原生态，而不是选择性地突显某些主题和情感，有意无意地忽略、遮蔽某些主题和情感。总之，对一个时代或时期的主题、情感、风格，既要有全景性的静态分析，也要有历时性的动态分析。定性分析受视野、方法和成果容量的限制很难做到，而定量分析却不难做到。

通过主题词、情感词的分析，还可以分析深化文学流派的研究。传统的流派研究，主要是定性分析同一流派作家的创作主张和创作实践的趋同性，是主观的分析和列举式推断。而量化分析，可以对流派及其周边作家的文本进行主题词、情感词穷尽式提取，以分析流派成员在主题、情感表现和意象运用方面的共性特征。已有学者基于生成式大语言模型的文本属性测量方法，利用提示学习和评级算法，无监督地让人工智能测算数万首唐诗、宋词、元曲的题材、情感与风格，量化衡定了唐诗的边塞诗派、宋词的豪放派与婉约派等流派属性、特征。无论是结论和方法，都有一定的可信度，颇有借鉴意义。

其次，可加强文体的量化考察。近些年文体学已有长足的进步，吴承学等建构的中国古代文体学，被评为“中国哲学社会科学领域十大原创理论”之一。但文体学的量化考察，还有待深化。

如唐诗的各种诗体、宋词的各种词调，唐宋散文的各种文体，各有多少作品总量容易统计，但唐诗、宋词、宋文的各种体制形态、语言特征、表现方式及其风格特征、情思内涵，还没有细致的量化分析。因此，不仅需要共时态的分类统计，更需要历时态的量化考察细化分析并回答：每个年度、每个阶段唐代诗坛各使用了哪些新旧诗体，近体诗的格律是如何一步步地走向成熟，其演进变化的轨迹如何？每个时段、每个诗人对诗体的选择及其平仄、用韵情况有哪些特点和变化？近体诗格律体制定型以后，旧有的体制如永明体的规则是否还在被沿用？郝若辰和陆泉宇运用声律统计模型，逐年统计初盛唐宫廷集会场合的作品，发现初盛唐是新旧规则并存，永明律在初盛唐仍得到极高程度的遵守，合律度基本不低于新型的近体声律。声律实践在盛唐出现“倒退”，表明声律的发展不是线性的迭代，而是有回环反复的。文学创作中的“遵体”与“破体”，本来是文学史的常态，定性的描述成果较多，但还需要有数据的验证。

宋代词坛共有多少种词调，每种词调有多少首词作，已有数据统计。但以时间为序的量化考察还未见。每个年度、每个时段，宋代词人用了多少种词调？词调的使用有何规律？是由少到多、由短到长的演进变化，还是交错使用？词调的发展与词风的变化、词人的用调与创作个性有哪些关联？同一词调的平仄、用韵，除了遵守词调的基本规则之外还有什么特点和规律？每个词调的声情究竟有哪些特点，又有哪些变化？词调的声情是统一性大于差异性，还是个性多共性少？这些都有待量化考察与验证。

对唐宋时期的文章文体，也有必要进行历时性的动态分析。在对宋代作品编年的基础上，按年度或时段统计各种文体的使用情况，根据各种文体使用的变化曲线，分析什么时候、什么场景、哪种文体使用最频繁，考察文体使用的冷热变化体现出不同的文体观念和文坛习尚的变化。

再次，艺术手法的量化分析也是今后努力的方向。唐诗宋词中典故的运用、语词的化用情况，已有相应的数据平台资源可资统计分析，但诗词的句法、章法和修辞手法等，还需要借助语言大模型技术进行深度开发，既可以横向比较哪些诗人擅长或习惯使用哪些句型句法，比较诗人句法、章法的创造性、独特性、变化性，也可以纵向量化考察每个阶段句法、章法和修辞手法的运用情况和演进轨迹。这方面的研究有无限广阔的拓展空间。

学术史的量化研究，也需要对研究成果文本内部的概念、观念、主题、问题等进行量化分析。近些年，笔者依据研究论著目录对20世纪以来的唐宋文学研究进行了不同维度的量化分析，虽然部分成果也查阅了成果的文本，但毕竟没有全部阅读。有些学术观念、概念范畴、研究主题，在题目中没有涉及，而在研究成果文本中多有讨论。因此，根据成果目录进行量化分析，只能是外部观察、有限的统计。只有根据研究成果的全部文本进行分析，才能真正深入揭示学术史的演进历程，小至一个概念、词语的使用，大到一种学术热点的形成、演进，才可以有效地进行量化分析。

今后的学术史量化研究，要全面建设成既包含20世纪以来各种论文又涵盖各种学术著作的学术资源库，以全面系统地量化分析学术史上的各种观念、概念、主题、领域的研究状况和演进历程。

（二）从数量统计到质量测评

无论是文学史还是学术史的量化研究，目前都是对研究对象外在的数量层面的统计分析，还没有进入内在质量的评估衡定。比如有量化考察过唐宋诗词作品的影响力，但没有量化衡定唐代诗人、宋代词人的贡献和诗词作品的质量、价值。所有数据是“量化”而非“质化”的，只能衡量对象的有无、多少，而无法衡定其优劣、高下。“量化”的数据，是客观的、显性的，人力和计算机可直接识别挖掘；而“质化”的数据，往往是主观的、隐性的，需要建立评价指标体系、理论模型方可获得。

今后的计量文学史，要加强对作品的质量和价值、作家的贡献进行量化衡定测评。而要量化衡定测度作品质量的优劣、价值的大小，需要建立完善的文学评价指标体系和操作方案。

其一，测评指标的设定。以诗词为例，文本中的题材、情感、社会生活、自然山水、历史时空、超现实空间和形而上的哲理意义、思想价值等内容指标和体式、语言、技巧、结构、整体风格等艺术形式指标，都可以而且应该量化测评。

其二，测评指标的层级与权重。不同指标可按其新旧度、广狭度、深浅度、违合度、精粗度、难易度、巧拙度、丰薄度分成不同的层级，每个层级划定分值和分差，如A+为90~100分，A为80~89分，B+为70~79分，B为60~69分，C为60分以下。按钟嵘《诗品》的划分，A为上品，B为中品，C为下品。当然还可以细分。不同的指标，需要赋予不同的权重。

其三，测评的方案。可考虑由人工和机器相互测评。将测评指标和指标层级、权重形成标准化的指标体系。人工和机器分别按指标体系对作品进行打分测评。人工又可分历史测评和现实测评两种。历史测评，是收集整理古人的评价并进行分级赋分，历代评点中常有定性的评价，如绝唱、杰作等，将这些定性的评价转化成相应的分值，即得出古人对有关作品的评分。现实测评，又分两部分：一是搜集整理现代文学史著作和相关学术论著中的定性评价，将其转换为相应分值；二是请当代不同年龄、不同资历、不同学术背景身份的专家和读者依据标准进行打分测评。

如果说人工测评带有一定的主观性，那么机器测评就相对客观。人工智能特别是语言大模型技术，为机器测评提供了可能。笔者团队曾尝试采用生成式大语言模型的思维链技术，让大模型智能化评价唐诗的艺术价值，经与专家的评价对比检验，发现大模型的评价过程和评价结果有一定的可信度，证明让大模型来评价唐诗作品是可行的，但需要不断更新迭代和完善。如果将每种测评和每个测评指标都赋予不同的权重，同时将人力测评和机器测评的分值加权计算以后再得出综合分值进行排名，这样的测评既有历史性，也有现实性，有人的主观性也有机器的客观性，测评结果应有公信力。苏轼曾引欧阳修的话说：“文章如精金美玉，市有定价，非人所能以口舌定贵贱也。”人力和机器的综合测评，可以说是一种“定价”，因为这不是一个人几个人“定贵贱”，而是古今读者的共识性评价。机器的评价，其实也是人设定、参与的评价，不过是尽量减少人的主观性和先入为主之见而已。

不同的文体，审美要求、审美趣味不一样，评价指标体系应有所不同。文学评价指标体系可考虑总分结合，既有各种文体都适用的通用的指标，又有不同文体的分类指标。叙事文学不同于抒情文学的评价指标，诗词曲的评价指标不同于散文，供阅读用的小说与供表演用的戏曲剧本的评价指标也要有所差异。同为文章，由于各自的功能、应用场景、体式和篇幅差别较大，也要区别对待。

作家对文学贡献的大小,一方面根据其全部作品的综合得分来评价，另一方面也要考虑其他加分项，如：（1）作家对体式的开创，如沈约、谢灵运、王融之于永明体，杜甫之于新乐府，柳永之于慢词等；（2）对艺术规范的确立，如沈佺期和宋之问定型律诗、温庭筠定型词体等；（3）创作个性风格的突显，如李白的豪放、杜甫的沉郁、郊寒岛瘦等；（4）流派的领袖，如杜甫诗、元白的新乐府诗、韩柳的散文、欧阳修的古文、苏轼和辛弃疾的豪放词、周邦彦和姜夔的雅词、黄庭坚诗等；（5）精神力量的感召，如范仲淹的先忧后乐精神，岳飞、陆游、文天祥的爱国精神等。

今后的计量学术史对学术成果价值含量的测评，也需要建立评价指标体系。比如，可从选题意义的大小，资料的新旧丰薄，技术方法的新旧，观点的新颖度、可信度、完备度等层面来建构；对于核心概念的提出、新方法的开创、学科或专业领域体系的建构等应予加分；可参考国家社会科学基金有关项目、成果的评价指标体系。不过，国家社会科学基金的学术评价指标体系主要是针对人工的主观评价。面对大量的学术成果，如果能让人工评价和机器评价相结合，将会更准确和快捷。让机器来评价学术成果，既需要设计完善的评价指标体系，还需要有可行性的细化的操作方案。经过实验，有一定可信度后才能逐步完善推广。

学术成果的评价，同样也需要分类。一是从容量上看，一篇学术论文和一部著作要有区分。二是学术性研究成果与普及性成果要有区别，普及性成果的学术含量可能会低一些，但对于推广传统文化和文学仍有意义，也理应纳入评价范围。三是著述类型也要有所区分，资料汇编、总集编纂、别集整理点校和笺注、作品选注选评、理论阐释、实证考订等类型的著述，各自的要求和难度不同，学术评价指标也应有所区别。

文学史和学术史的量化研究，为作家和文学作品、学者和学术成果的质化衡定测评提供了新的路径。期待不久的将来，这种研究方法能成为学术研究的新增长点。

本文刊发于《湖南师范大学社会科学学报》2025年第6期国家社会科学基金重大项目成果推介栏目。参考文献从略。

欢迎投稿

《湖南师范大学社会科学学报》

http://hnss.cbpt.cnki.net

《湖南师范大学社会科学学报》

国家社会科学基金资助期刊

中文社会科学引文索引（CSSCl）来源期刊

国家期刊奖百种重点期刊

全国中文核心期刊

全国高校权威社科期刊

全国高校社科名刊

湖南省社科基金资助期刊

主编：李培超

副主编：尹金凤

本文责编：王蓉

编辑部电话：0731-88872471

相关文献

吕双伟 | 中国骈文的内涵、成因、功能和价值

吴光正 | 吴澄诗文序跋的文学史意义

蒋振华，朱敏洁 | 中国古代道教散文的艺术史进路

编辑：颜慧

一审：王蓉

二审：尹金凤

三审：李培超

刘京臣 | 数字人文视域中的陆游诗歌渊源再探

2026年1月29日 10:03

刘京臣 2026-01-29 10:03 北京

点击蓝字关注我们

2025年第11期

2025.11

作者简介

刘京臣，文学博士，中国社会科学院文学研究所研究员、硕士生导师，主要从事唐宋文学、数字人文等研究，出版专著2部，发表学术论文60余篇。

本文原载《山东社会科学》2025年第11期，参考文献及注释参见本刊原文。欢迎转发与授权转载。如需转载请联系0531—82866416，联系人：陈老师。转载请注明来源！配图均来自网络。

［摘要］关于陆游诗歌的渊源，学界已有深入探讨。其中，陆游对李白、杜甫、梅尧臣、曾几等前代诗人的取法几成共识，然其是否效法黄庭坚仍存争议。为此，通过计算方法对陆游与黄庭坚的诗歌进行用语与用韵的量化对比，可以发现：在诗歌用语层面，陆游非但未与黄庭坚的教导决裂，反而在句与句、句与联、联与联等角度极力师法黄庭坚；但在诗歌用韵层面，二者未表现出明显的承袭迹象。进一步对《陆游选集》所录名篇与唐宋诗歌关系进行考察会发现，这些名篇全力师法唐宋诗歌，呈现出全面而系统的学习特色。

［关键词］陆游；诗歌渊源；黄庭坚；用语；用韵

2025.11

阅读导引

一、用语学黄庭坚

二、用韵是否学黄庭坚

三、陆诗名篇是否转益多师

四、结语

学界对陆游诗歌的渊源，一直较为关注。早在20世纪40年代，钱锺书先生在《谈艺录》中就提出“剑南仿宛陵诗”之说，称陆游“于古今诗家，仿作称道最多者，偏为古质之梅宛陵”。尽管在1984年《谈艺录》（补订本）的目录中，钱先生将“剑南仿宛陵诗”调整为“剑南与宛陵”，但其核心观点仍延续了1948年提出的“剑南仿宛陵诗”。20世纪60年代，朱东润先生在其《陆游研究》中，不仅指出陆游有诸多师承，且明确梅尧臣对其影响最大。同时，他还进一步指出，陆游在炼字炼句方面多学曾几，而在思想面貌方面则更多地从梅尧臣身上得到启发。到了20世纪80年代初期，于北山先生《陆游诗歌的艺术渊源》一文从11个方面专门探讨了陆游诗歌的艺术渊源，认为陆游诗歌在纵向上主要“来源于诗、骚以降的现实主义文学传统”，在横向上则“来源于社会生活的实践”。1985年，钱仲联先生出版了煌煌八册的《剑南诗稿校注》。在“前言”中，他指出陆游曾受曾几、吕本中、黄庭坚等江西诗派诗人的影响，但又不为江西诗派所牢笼，还自陶渊明、王维、李白、杜甫、岑参、梅尧臣、苏轼、王安石、陈与义等诸家取法，“取精用宏，融铸百家，自出手眼”。钱先生还特意拈出《和陈鲁山十诗》等诗歌，指出这些诗篇“明显地是学习黄庭坚的”。1987年，袁行霈先生在《陆游诗歌艺术探源》一文中，也对陆游的诗歌渊源进行了探究，指出陶渊明、李白、杜甫、岑参、白居易、曾几、吕本中等人都是陆游师法的对象。1988年，胡明先生在《陆游的诗与诗评》一文中，也关注到陆游诗歌的师承渊源问题。他认为：“陆游师出江西派大家曾几，这点是无疑的。……陆游学诗拜的老师是曾几，但做出来的诗，气味上更近吕居仁。”与于北山、钱仲联先生的看法不同，胡明先生认为陆游“孜孜反对江西领袖黄庭坚传下来的‘无一字无来历’的看家本领——这一点标志着陆游与黄庭坚的教导公开决裂。同黄庭坚一样，他也是拿杜诗作证据，但矛头显然是针对黄庭坚的”。在胡明先生看来，或许正是因为这种“决裂”，四库馆臣在谈及《剑南诗稿》时才有了“实能自辟一宗、不袭黄陈之旧格”的判断。到了21世纪初，围绕陆游诗歌的渊源，邱鸣皋先生也有过论述：“陆诗之源盖多取于与其思想、性格、诗风相近者，约为三种类型：一为以忧国忧民为思想核心的爱国者，如屈原、杜甫、岑参乃至吕本中、曾几；二为个性奔放、诗笔浪漫的浪漫主义者，李白即为显例；三为志在隐逸或风格自然雅淡者，如庄子、陶渊明、王维乃至梅尧臣。”

从总体上看，学界普遍认为陆游诗歌的渊源极为丰富，既有纵向上对传统现实主义诗歌传统的继承，也有横向上对现实生活的深切体察和诗艺转化。钱锺书、朱东润、于北山、袁行霈、胡明、邱鸣皋等学者虽然各有侧重，但基本一致地肯定了陆游诗歌广泛取法、博采众长的特征，尤其强调了陆游对杜甫、梅尧臣、曾几等人的继承与超越。那么，前人这些颇具体系的研究，能为我们当下的研究带来哪些启示？我们还可以从哪些角度深入此项研究？

在当前大数据技术迅猛发展的背景下，学界的文本分析能力得到了前所未有的提升，这使得我们能够将陆游的诗歌作品与其他任何一位诗人的诗作进行系统、全面的比对，进而深入探究他在用语、用韵方面的师承关系与取法脉络。这种依托新技术所开展的研究路径，不仅是前代学者难以企及的，也为我们重新理解陆游诗歌的渊源提供了坚实的技术支撑与方法保障。在这一基础上，有两个重要问题尤其值得深入考察：第一，陆游与江西诗派领袖黄庭坚之间的关系历来存有争议，他是否真如胡明先生所言，“孜孜反对江西领袖黄庭坚传下来的‘无一字无来历’的看家本领”，并与黄庭坚的诗学主张“公开决裂”？四库馆臣所谓陆诗“实能自辟一宗、不袭黄陈之旧格”，是否也可以从实证角度加以印证？第二，在今人编选的《陆游选集》《陆游诗选》等选本中，那些陆游最为知名的诗歌作品是否皆为自出机杼，它们在创作过程中是否曾化用唐宋诗歌等前代文献？这些问题的提出，并非泛泛而论，而是以语言用法和用韵方式的相似性作为实证基础。通过大数据比对，我们不仅能够从字词组合、句式构造等语言层面入手，还能从韵部使用、韵脚组合等音律层面着眼，寻求更为客观、细致的判断依据。在这样的基础上重新探讨陆游的诗学渊源，无疑将为我们揭示其诗歌生成的深层结构开辟新的路径。

一、用语学黄庭坚

为考察陆游是否曾向黄庭坚学习诗歌创作及其学习程度，本文将从二者诗歌用语角度展开分析。研究方法为编写程序，运用三种相似度算法计算黄、陆二人诗歌用语的相似性。

在文本处理方面，本文所使用的黄庭坚与陆游诗歌文本均出自《全宋诗》。其中，《全宋诗》共收陆游诗9271首，含残句10句、存目3首，删残句、存目，得诗9258首；收黄庭坚诗2204首，含残句17句，删残句，得诗2187首。陆游诗9258首，共有37797联诗句；黄庭坚诗2187首，共有11197联诗句。若将二人诗歌的每联进行依次比对，总计需完成423213009次比对运算，这显然超出了人力可及的范围。因此，我们借助程序进行批量处理，将混合模式的相似度阈值限定为0.2后进行匹配，得到78672组结果。

对于这些匹配结果，同样无法单纯依靠人力完成分析。为确保算法的可靠性，我们进一步建立高频词汇过滤机制，以此区分套语式雷同与创造性师法。例如，需考察“白发”“江水”“日月”“尽日”“无人”“斜阳”等二人诗歌中常见的词语，分析它们是否与特定意境相关联、是否经常同时出现，并判断这些语言现象究竟属于固定表述、成句套语、偶然巧合，还是师法与因袭的体现。比如，黄、陆二人皆在诗歌中使用过“八万四千”这一表述。其中，黄庭坚在《观世音赞六首·其一》等9首诗歌中12次提及，如“八万四千清净眼，见尘劳中华藏海。八万四千母陀臂，接引有情到彼岸”（《观世音赞六首·其一》）便为一例；陆游亦有“八万四千颠倒想，与君同付醉眠中”（《醉歌》）、“人天八万四千塔，便合推为第一山”（《和曾待制游两山三首·题育王山明月堂》）等句。“八万四千”之语源自佛经，显然，此表述不能认定为陆游向黄庭坚师法，而应当视为黄、陆二人共同师法佛经。再有，黄、陆二人皆在诗歌中使用过“整整复斜斜”句。黄庭坚云：“忽书满窗纸，整整复斜斜。”（《次韵张仲谋过酺池寺斋》）“夜听疏疏还密密，晓看整整复斜斜。”（《咏雪奉呈广平公》）陆游曰：“整整复斜斜，翩如风际鸦。”（《作字》）实则“整整复斜斜”乃是杜牧《台城曲二首·其一》“整整复斜斜，随旗簇晚沙”成句。类似这种黄、陆二人共同向其他典籍取法的情况还有很多，要具体情况具体分析，不能一概而论。

通过分析，我们发现，在诗歌用语层面，陆游对黄庭坚存在明显的师法、因袭迹象。从形式上看，这种师法主要表现在句与句、句与联、联与联三个方面。

在“句与句”这一层面，具体表现为四种形式：一是陆游某联出句师法黄庭坚某联出句；二是陆游某联对句师法黄庭坚某联出句；三是陆游某联出句师法黄庭坚某联对句；四是陆游某联对句师法黄庭坚某联对句。上述四种形式可概括为出句—出句、出句—对句、对句—出句、对句—对句，表1将各举数例加以说明。

“句与句”之间的相似性，主要体现在黄庭坚、陆游二人的诗歌（或出句，或对句）中，当某句中的相似文本超出一定比例，达到某个阈值，这样的数据便会被提取出来。

第一例，陆游“身如病鹤短翅翎”与黄庭坚“身如病鹤翅翎短”七字完全相同，仅将“翅翎短”变换成“短翅翎”而已，这是陆游出句师法黄庭坚出句的典型例子之一。或云黄庭坚此句暗用白居易“同病病夫怜病鹤，精神不损翅翎伤”（《病中对病鹤》）、韩愈“路远翅翎短，不能持汝归”（《南山有高树行赠李宗闵》）诸诗，此说或不谬。但将“病身”“病鹤”“翅翎”三种意象融在一句之中，却是由黄庭坚完成的，故而我们更倾向于认为陆游此句是直接取法黄庭坚。

第二例，陆游“松枯宜倒壑”“长松倒涧壑”“倒壑枯楠忘岁月”等三句，均取法于黄庭坚“枯松倒涧壑”。其中前两句与黄庭坚诗句的相似度非常高，都涉及“枯（长）松”与“倒壑”这一表述。而第三句“倒壑枯楠忘岁月”，则是在沿用“倒壑”的基础上，将对象由“枯松”转化为“枯楠”。关于此条，钱仲联先生在《剑南诗稿校注》中已有所关注。

第三例，陆游对句“老木上寒藤”与黄庭坚出句“寒藤上老木”五字完全相同，与第一例的情况相类似，陆游在此也仅是颠倒词语次序而已。黄庭坚“寒藤上老木，龙蛇委筋骸”句描写寒藤缠绕着老树蜿蜒而上，如同龙蛇逶迤，显露出清晰的筋骨。《黄庭坚诗集注》引《礼记·礼运》来注释“筋骸”一词：“肌肤之会，筋骸之束。”黄庭坚此联中的“上”“委”两个动词极为传神，将四种意象连缀起来，描绘出一幅生动的画面。陆游“残芜衬落日，老木上寒藤”一联，写法与黄庭坚相同，也是靠两个动词连缀四种意象，对句颠倒黄庭坚出句的词语次序。此处陆游学黄，《剑南诗稿校注》惜未注出。

第四例，黄庭坚“肮脏得家法，伊优不能为”自赵壹“伊优北堂上，肮脏倚门边”化来，《黄庭坚诗集注》业已注出。赵、黄皆以高亢刚直的“肮脏”者与逢迎谄媚的“伊优”者相对，塑造出两种截然不同的性格以及由这些性格所决定的两种人生轨迹。陆游“时情竞脂韦，家法独肮脏”一联与赵、黄一样，也运用了对比的手法，只是陆游是将“时情”与“家法”、“脂韦”与“肮脏”进行对比。其对句“家法独肮脏”，显然是从黄庭坚出句“肮脏得家法”化来，《剑南诗稿校注》也注意到了这一点。陆游还有一句“肮脏得倚门”（《寒夜吟》），从用语与表述来判断，应是绕过黄庭坚，直接化用了赵壹的“肮脏倚门边”。

第五例，黄庭坚云“墙阴老春荠”，陆游曰“墙阴春荠老”，与第一例、第三例的情况相同，同样是陆游通过变换词语次序的方式来化用黄庭坚的诗歌。

第六例，黄庭坚对句云“落硙霏霏雪不如”，陆游《茅斋》出句曰“硙落霏霏雪”，《史院书怀》出句曰“石硙霏霏雪”，在将黄庭坚“落硙”分别变换为“硙落”“石硙”之后，陆游又将七言减字为五言。既然能减字，当然也能添字。如第八例，陆游便在黄庭坚五言对句的基础上，添“蛮遁”二字以成七言之对句。

还有一类，如第七例，陆游诗句完全袭用黄庭坚成句，不仅用语相同，词语次序也未作任何变动。

上举诸例中除第二例、第六例外，都是一句黄庭坚诗歌对应了一句陆游诗歌。但事实上，无论从数据分析结果，还是从陆游诗歌的师法实践来看，一句黄诗往往为多句陆诗所关注和取法。只是为了行文简洁，我们在上表中仅举了第二例、第六例两例而已。

“句与联”也有四种表现形式：一是陆游某联出句师法黄庭坚一联；二是陆游某联对句师法黄庭坚一联；三是陆游一联师法黄庭坚出句；四是陆游一联师法黄庭坚对句。表2各举数例加以说明。

之所以称“句与联”之间存在师法与因袭的可能，源于二者在用语及结构上的高度相关性。简言之，或将一联熔铸为一句，如第一例至第四例，陆游将黄庭坚一联浓缩为一句；或将一句敷衍为一联，如第五例至第八例，陆游将黄庭坚一句扩展为一联。

第一例，黄庭坚云“更作老夫船，樯竿插苍石”，陆游出句曰“老夫樯竿插苍石”，将黄诗出句中的“老夫”二字与对句“樯竿插苍石”相连，成为《醉歌》首联中的出句。《剑南诗稿校注》仅注此诗乃是陆游“乾道六年九月作于长江舟中”，惜未注出首联出句乃是熔铸黄庭坚诗句而成。

第二例，黄庭坚《乐寿县君吕氏挽词二首·其一》，乃为乐寿县君吕氏所作的挽词，前两联多用《诗经》《汉书》典故，以凸显吕氏之妇德。《黄庭坚诗集注》注尾联“骑省还秋直，霜侵鬓脚衰”用潘岳“寓直于散骑之省”之典，此说确然。而到了陆游笔下，他将“骑省还秋直，霜侵鬓脚衰”一联中的“骑省”与“霜侵鬓”拈出，添上“吟余”二字以成新句。这一化用，将挽词变成了登临之篇。《剑南诗稿校注》虽注意到了陆游此句与潘岳的渊源，却没有注意到陆游此句乃是熔铸黄庭坚诗句而成。

第三例，黄庭坚写龙团茶的“苍龙璧，官焙香”一联，被陆游揉成一句“苍璧碾成官焙香”。黄庭坚在诗歌中多次写到龙团茶，如“外家新赐苍龙璧，北焙风烟天上来”（《谢公择舅分赐茶三首·其一》）、“如今摸索苍龙璧，沈井铜瓶漫学雷”（《公择用前韵嘲戏双井》）等。此例陆游化用黄庭坚“苍龙璧，官焙香”一联，当属无疑。《剑南诗稿校注》引《铁围山丛谈》为陆游此句与《卜居二首·其二》“蒙顶茶如正焙香”作注，但其关注点在“官焙”“正焙”，未曾意识到陆游此句乃是从黄诗化来。

第四例，黄庭坚以“引镜照清骨，惊非曩时人”一联写疾病使人衰弱，无复昔日之风姿。陆游将“引镜”自照变换为临水自照，同样写今不如昔。这种引镜或临水自照，再感叹今不如昔的写法，二人如出一辙。《剑南诗稿校注》没有注意到陆游此句渊源有自。

再看陆游如何将一句诗歌敷衍为一联。

第五例，黄庭坚《戏和答禽语》一首，开篇以“南村北村雨一犁”写雨润南村北村，正是犁地耕种之际。这一句有“村”“雨”“犁”三个关键词，“村”（南村北村）明确了地域范围，“雨”是核心要素，正因为雨水的降临，才引出“犁”地之事。陆游的“架犁架犁，南村北村雨凄凄”一联完全涵盖了“村”“雨”“犁”三个要素，并且整首诗也写禽言禽语，在用语与主题上与黄诗形成二次呼应。《剑南诗稿校注》亦未注意到陆游此句与黄庭坚诗歌的关系。

第六例，黄庭坚“墨淡字疏行”或自杜甫“墨淡字欹倾”化来，黄诗在杜诗“字欹倾”的基础上生出“字疏行”的新意。陆游“字如老瘠竹，墨淡行疏疏”一联，将黄诗的“墨淡”“疏行”安置在对句，出句称“字如老瘠竹”，将黄诗一笔跳过的“字”的形象具象化，称其如瘠竹、瘦竹，凸显其瘦而有力的特点。

第七例，陆游将黄诗对句“意态忽如少年时”的“意态”变换为“意气”，引起出句；“忽如少年时”只字不移，变成对句。

第八例，黄庭坚云“烧烛饮至跋”，《黄庭坚诗集注》业已指出“烧烛至跋”一语当出自《礼记·曲礼》“烛不见跋”，孔颖达疏曰：“《小尔雅》云：‘跋，本也。’本，把处也。古者未有烛，唯呼火炬为烛也。火炬照夜易尽，尽则藏所然残本。所以尔者，若积聚残本，客见之则知夜深，虑主人厌倦，或欲辞退也。故不见残本，恒如然未尽也。”概言之，烧烛至跋、烛不见跋云云，皆为尽欢之意。黄庭坚在此基础上，将“饮”字加入其中，写饮酒尽欢，颇有几分陈遵投辖的意味。陆游远绍《礼记·曲礼》、近拟黄诗，出句写“一席饮”，对句写“烧烛将见跋”，正与黄诗意思相同。

“联与联”只有一种形式，即陆游诗歌的一联，师法黄庭坚诗歌的一联。这种形式中的“一联”，必须同时涵盖出句、对句。若不同时涵盖出句与对句，就会变成“句与句”或“句与联”的形式。表3各举数例加以说明。

与“句与句”“句与联”这两种情况不同，“联与联”之间要求出句、对句都要包含相同或相近要素，这使得两联的描述与表达，较之“句与句”“句与联”之间具有更为明显的相似性和相近性。

例如第一例，二人同写“江水”与“花”，区别只在于陆游将黄庭坚的“檐花”变成了更为具体的“梅花”，将“檐花”的“无赖红”变成了“梅花”的“无赖香”，由视觉变化为嗅觉。第二例，“紫葚知蚕老，黄云见麦秋”一联，乃是黄庭坚登临北都东楼所作，出句、对句各用一个动词“知”“见”连缀葚、蚕、云、麦四种意象，时值麦熟之际。陆游“桑间葚紫蚕齐老，水面秧青麦半黄”写残春时节，较之黄庭坚所写的时间略早，所以诗人看到的是“秧青麦半黄”而不是麦熟。陆诗此联将黄庭坚诗句中的“云”换成了“水”，其他三种意象未变，从中能够看出明显的模仿痕迹。惜《剑南诗稿校注》未能注意到这两联之间的关系。像这种描写相似风物、景象，并表达相似情感的“联”，在两人诗中还有很多，再如第三例以“缺月”对“鸣鸡”亦为此类。以上所举，基本上都是在相似的两联之中，陆游出句与黄庭坚出句意思相近，陆氏对句与黄氏对句意思相近，两联之间呈现出一种正向的对应关系。还有一种情况是意思相近的两联，陆游出句对应黄庭坚对句，陆氏对句对应黄氏出句，例如第四、五例。

在第六例中，黄陆二联虽然意思相近，但二人诗中所用的“九关虎豹”“地行仙”很明显分别自《招魂》“虎豹九关，啄害下人些”、《抱朴子》“中士游于名山，谓之地仙”化来。那么，有没有可能是陆游绕过黄庭坚，直接向《招魂》《抱朴子》取法？应当说，存在这种可能。第七、八例也是这种情况。

我们之所以在表3中将第六、七、八三例列出，是想说明两点：第一，从用典的角度看，认为黄、陆二人诗歌化用《招魂》《抱朴子》典故是没有问题的；第二，这是在用典基础之上的重构。黄庭坚将“九关虎豹”与“地行仙”并置在一联之内，以前代不同典故建构起新的逻辑关系——正因为世间“九关多虎豹”，所以才要“聊作地行仙”。在黄庭坚这里，完成了由因到果、由彼至此的转化。现在再看陆游“九关虎豹君休问，已向人间得地仙”一联，我们需要承认两点：一是陆游同样用典；二是陆游此联的表述、逻辑与黄庭坚完全一样。这也存在两种可能：一是陆游与黄庭坚英雄所见略同，不约而同地都将两个前代典故并置在诗歌的一联之中；二是陆游确实受到了黄庭坚诗歌的启发与影响。这种现象在诗歌间或诗词间的影响－接受关系中很常见，我们没有办法断言到底属于哪种情况，故而将其列出，以呈现一种现象。

以上我们从诗歌用语层面，围绕句与句、句与联、联与联三个方面，对陆游师法黄庭坚的情况展开了分析，从中可以清晰地看出陆游对黄庭坚存在明显的师法、因袭迹象。或云，这些从句、联角度的分析过于琐细，陆游有无全篇师法黄庭坚的诗歌？答案是肯定的。我们试举两组在整体风格上陆游与黄庭坚极为相似的诗作为例，先看黄庭坚《戏咏高节亭边山矾花二首·其一》与陆游《落花》：

北岭山矾取意开，轻风正用此时来。平生习气难料理，爱着幽香未拟回。（黄庭坚《戏咏高节亭边山矾花二首·其一》）

山杏溪桃次第开，狂风正用此时来。未妨老子凭栏兴，满地残红点绿苔。（陆游《落花》）

这两首都是七绝咏花诗，一为咏山矾花，一为咏杏花、桃花。两诗首联的构思与写法完全相同：出句先交代地点，一为北岭，一为山脚溪边；再交代花的品类，一为山矾花，一为杏花、桃花。接下来是对句，陆游将黄庭坚“轻风正用此时来”变换一字而成“狂风正用此时来”。虽是一字之别，陆游的改动却极为准确。盖因与下联统观，黄诗写闻香，故而需“轻风”；陆游写落花，故而需“狂风”，只有狂风大作，才能与下联“满地残红”之景形成呼应。黄诗下联所谓的“平生习气”，当指其爱花、赏花之习，正因香气氤氲，为其陶醉，故有此戏咏二首。陆游下联“未妨”云云，先反转上联对句，称虽有狂风，但不妨碍其凭栏之兴。何为“凭栏兴”？不就是黄庭坚所说的“平生习气”，亦即爱花赏花之习吗？这两首诗下联之对句，一写嗅觉，一写视觉。“幽香”呼应“轻风”，“残红”呼应“狂风”。如此看来，这两首诗的写法何其相似！

再看一组：

往往携家来托宿，裙襦参错佛衣巾。未嫌满院油头臭，蹋破苔钱最恼人。（黄庭坚《又戏题下岩》）

七月湖中风露新，临流闲照白纶巾。荷花折尽浑闲事，老却莼丝最恼人。（陆游《乙丑夏秋之交小舟早夜往来湖中戏成绝句十二首·其八》）

黄、陆二诗有几处相同。一是用韵相同，皆押十一真韵，且韵脚同为“巾”“人”。二是结构相同，首二句皆铺陈清幽之境（僧院借宿之景、湖舟临流之趣），第三句急转直折（油头之臭、折花之闲），结句则以“最恼人”点睛，将雅趣与俗恼融于一体。此种“先境后恼”的章法，非但句式相同，更在转折节奏中暗含对日常荒诞的敏锐体察。无怪钱锺书先生称陆游此诗“仿山谷此首而泄露文脉矣”，由此可见前贤已凿通幽径，后学履痕自难遁形。

黄、陆二人诗集中，还有不少风格相近的作品，不再一一枚举。下面我们切换视角，从诗歌用韵层面，继续探讨陆游与黄庭坚诗歌之关系。

二、用韵是否学黄庭坚

本次研究涵盖了黄庭坚的2187首诗歌和陆游的9258首诗歌，鉴于其数量庞大，依靠人工来标注押韵情况显然是不现实的。因此，我们借助程序分析来达成两个主要目标：一方面，分析黄、陆二人诗歌各自的押韵情况，通过程序深入探究两人诗歌在押韵方面的独特特点；另一方面，比较两人诗歌的押韵相似度，以此挖掘出两人诗歌在押韵上的共性与差异。具体操作时，先编写程序读取诗歌的题目、内容、“几言几韵”以及诗歌韵脚等关键信息，根据“几言几韵”分类整理诗歌。接着针对属于同一格律分类（即“几言几韵”相同）的黄、陆所有诗歌进行两两组合比对。比对的核心在于分析它们的“诗歌韵脚”字段：计算两组韵脚的重叠率，并以百分比量化其相似程度。对于韵脚完全一致（相似度为100%）的诗歌组，程序会额外检查其韵脚的顺序是否相同（“顺序”或“乱序”），并尝试提取关于声调（平仄）、韵部归类等信息。最终，提取出韵脚相似度在75%以上的诗歌对及其比较结果（包含相似度百分比、韵脚顺序、声调/韵部信息等）。

经过分析，陆游与黄庭坚二人诗歌韵脚相似度在75%以上的诗歌共有1390组。其中，相似度为100%的有1389组，相似度为75%的有1组（即黄庭坚《次韵子高即事》与陆游《千峰榭宴坐》，这两首诗歌的韵脚分别为“疏、书、余、车”与“余、疏、书、疏”）。在1389组诗歌中，还有1组诗歌（黄庭坚《春近四绝句·其二》与陆游《次韵周辅道中二首·其二》）虽然韵脚同为“佳、花”，但分别为九佳、六麻韵，并非同一韵部，亦排除在外。故而统计对象为韵脚完全相同且属同一韵部的诗歌共1388组，涉及七绝1346组、七律22组、五绝12组、五律6组、六言古体2组（皆为二韵）。

分析显示，陆游共有572首诗歌与黄庭坚的316首诗歌使用了完全相同的韵脚，共涉及213种韵脚组合，排在前10位的韵脚组合分别为“开，来”（107次）、“来，开”（105次）、“春，人”（74次）、“中，风”（48次）、“人，春”（40次）、“风，中”（36次）、“时，诗”（36次）、“人，尘”（33次）、“身，人”（30次）、“声，明”（28次）。这213种韵脚组合共分布在21个韵部中，排在前10位的韵部分别为：十灰（277次）、十一真（245次）、一东（185次）、四支（147次）、十五删（99次）、八庚（71次）、十一尤（67次）、六麻（55次）、一先（48次）、六鱼（40次）。

既然两人诗歌的韵脚相似度颇高，那么这是否意味着其诗歌之间存在明显的次韵、用韵或依韵关系？次韵，最为严格，二人所用之韵“先后无易”，亦步亦趋，不仅韵脚相同，次序亦应一致；用韵，“用彼韵不必次”，即使用相同韵脚，但次序不必一致；依韵，更为宽松，“同在一韵”，即诗歌所用之韵在同一韵部即可，不追求韵脚相同与次序一致。若以此为标准，我们筛选出的1388组诗歌，有726组符合“次韵”的标准，662组符合“用韵”的标准，这些诗歌存在“次韵”“用韵”的可能性，对此，我们尝试从三个角度进行分析。

首先，来看陆游诗歌题目中提及的次韵诗。本次分析所涉及的陆游572首诗歌中，只有3首诗歌题目中含有“韵”字，且与黄庭坚4首诗歌韵脚完全相同。第一组是陆游《观音院读壁间苏在廷少卿两小诗次韵二首·其一》与黄庭坚《夜闻邻舟崔家儿歌》，第二组是陆游《观音院读壁间苏在廷少卿两小诗次韵二首·其一》与黄庭坚《东禅长老梦偈》，这两组诗歌皆为七言绝句，韵脚皆为“声，明”，同押八庚韵。结合两组诗歌题目与内容来看，陆游之诗是次韵苏元老之诗而非次韵黄庭坚之诗。第三组是陆游《次韵范参政书怀十首·其九》与黄庭坚《自巴陵略平江临湘入通城无日不雨至黄龙奉谒清禅师继而晚晴邂逅禅客戴道纯款语作长句呈道纯》，此二诗都是七言律诗，韵脚皆为“晖，归，机，非”，且次序相同，同押五微韵。从体式上看，这一组完全符合次韵标准。但陆游之诗乃是次韵范成大《丙午新正书怀十首·其九》，显然也不是次黄庭坚诗韵而成。第四组是陆游《次朱元晦韵题严居厚溪庄图》与黄庭坚《戏答王子予送凌风菊二首·其一》，此二诗都是七言绝句，韵脚皆为“中，翁”，次序相同，同押一东韵。虽然从体式上看，这一组也完全符合次韵要求，但陆诗是次朱熹《题严居厚溪庄图》，亦非次黄庭坚诗歌而成。可见，在诗题中明确标明为次韵且与黄庭坚诗歌韵脚完全相同的陆游诗歌，皆与黄庭坚无关。换言之，在陆游主动次韵的诗歌对象中，黄庭坚是缺席的，而苏轼、范成大、朱熹等诗人是在场的。

其次，有无可能陆游虽然未在诗题中标明用黄庭坚诗韵，却暗次其韵？确实有这种可能性。一般来说，诗歌篇幅越长，次韵起来难度越大，越有可能是主动次韵。基于此，我们先选取几组律诗进行具体分析。在726组符合“次韵”标准的诗歌中，只有1组七律、1组五律。七律为黄庭坚《自巴陵略平江临湘入通城无日不雨至黄龙奉谒清禅师继而晚晴邂逅禅客戴道纯款语作长句呈道纯》与陆游《次韵范参政书怀十首·其九》，如前所述，非陆游暗中次韵。五律为黄庭坚《鄂州节推陈荣绪惠示沿檄崇阳道中六诗老懒不能追韵辄自取韵奉和·晚发咸宁行松径至芦子》与陆游《秋阴》：

咸宁走芦子，终日乔木阴。太丘心洒落，古松韵清深。聊持不俗耳，静听无弦琴。非今胡部律，而独可人心。（黄庭坚《鄂州节推陈荣绪惠示沿檄崇阳道中六诗老懒不能追韵辄自取韵奉和·晚发咸宁行松径至芦子》）

淡日披朝雾，轻云结暮阴。菰蒲溪路暗，松竹草堂深。妙墨双钩帖，奇声百衲琴。古人端未远，一笑会吾心。（陆游《秋阴》）

黄庭坚之诗当作于崇宁二年（1103），时鄂州节度推官陈荣绪先作六诗以示，黄庭坚则以“老懒”为由，“不能追韵辄自取韵奉和”以成六首，这首诗是第六首。首联交代自咸宁至芦子的经行背景。颔联出句将陈荣绪比作东汉太丘长陈寔，对句以“古松韵”呼应首联对句中的“乔木阴”，凸显松径行路。颈联“无弦琴”明用陶渊明之典，暗中却将行路中的松声、松韵比作“无弦琴”，复与“不俗耳”“可人心”相呼应。

《秋阴》一首作于庆元五年（1199）秋，陆游在山阴，时年75岁。此诗通过多重意象的叠加，如时间的由朝（朝雾）及暮（暮阴）、空间的由远（溪路）及近（草堂），以及感官享受的由视觉（双钩帖）到听觉（百衲琴）的变化，写出身在故乡、心慕古人的“孔颜之乐”。从这两首诗歌的写法来看，黄诗因事而发，主实；陆游因景而成，略虚。此二诗虽然韵脚相同，符合“次韵”的标准，但亦非陆游暗中次韵之作。

在662组符合“用韵”标准的诗歌中，共有21组七律、5组五律。这26组律诗虽然从体式上看符合“用韵”标准，但亦非陆游用黄庭坚诗韵而成。略举一例。黄庭坚有《光山道中》一诗，诗云：“客子空知行路难，中田耕者自高闲。柳条莺啭清阴里，楸树蝉嘶翠带间。梦幻百年随逝水，劳歌一曲对青山。出门捧檄羞闲友，归寿吾亲得解颜。”押十五删韵，韵脚分别为“闲，间，山，颜”。治平四年（1067），黄庭坚得官叶县，《光山道中》为其赴叶县所作，主旨由“捧檄”二字点出，即为亲出仕。

陆游《青城县会饮何氏池亭赠谭德称》《斋中杂兴二首·其二》《梅》《夏日感旧四首·其二》《东篱三首·其二》这5首诗的韵脚亦为“闲，间，山，颜”，虽韵脚次序与《光山道中》不同，但亦符合“用韵”的标准。陆游以上5诗，除第1首作于淳熙四年（1177）青城县外，其余4首分别为嘉泰元年（1201）、嘉泰三年（1203）以及开禧元年（1205）、开禧二年（1206）作于山阴。这5首诗主旨各不相同，无一首与黄诗相类。可以推断，陆游的这5首诗亦未有意用黄庭坚诗韵，它们与黄诗之间不存在“用韵”之关系。

再次，如上所见，黄庭坚、陆游二人之间符合“次韵”“用韵”标准的诗歌，若既非陆游主动次韵、用韵，亦非陆游暗中次韵、用韵，又当如何解释这一现象？我们认为，存在以下几种可能性：第一种可能是巧合，上举黄庭坚《光山道中》与陆游的5首诗便为此类。囿于篇幅，此类例子不再一一列举；第二种可能是相似或相仿的题材，使得诗人们选用了相同的韵部、韵脚；第三种可能是一些韵脚本身具有开放性，容易在多种场合出现，这也使得诗歌的韵脚容易出现相同或相近的情况。因绝句篇幅短、主题集中，后两种情况主要出现在绝句中。我们以黄庭坚《效王仲至少监咏姚花用其韵四首》的第二、三首与陆游诗歌为例，简单说明后两种情况。

黄庭坚诗题中所称的“王仲至少监”即王钦臣，字仲至。这组诗是黄庭坚效王钦臣“咏姚花用其韵”而成，《全芳备祖》卷二花部将这组诗列为题咏牡丹之作，胡仔则认为其二是咏桃花而非牡丹。《效王仲至少监咏姚花用其韵四首》是一组咏花之作，是毫无疑问的。其一的“黄袖”、其二的“萼绿华”、其三的“仙衣”、其四的“冰肌”皆与女性相关，被黄庭坚借以咏花，以人喻花，以花衬人，人花两得。

《效王仲至少监咏姚花用其韵四首·其二》云：“九疑山中萼绿华，黄云承袜到羊家。真筌虫蚀诗句断，犹托余情开此花。”韵脚为“家，花”。陆游有11首诗歌的韵脚为“家，花”（“花，家”），其中10首七绝、1首五绝。10首七绝，绝大部分是咏花或村居赏花、见花之作，符合“相似或相仿的题材，使得诗人们选用了相同的韵部、韵脚”这一情况。例如一为《太平花》，咏“花出剑南，似桃四出”的太平花。二为《花时遍游诸家园十首·其三》，诗题紧扣花时，诗歌亦写“寻春不到家”“高柳卧溪花”。三为《春晚村居杂赋绝句六首·其一》，写秋风初冷稻吹花的村居生活。四为《题三茆邵道士云隐二首·其二》，写道士云隐，先用刘禹锡“况种刘郎去后花”之典，再以“不知何处是君家”紧扣云隐的主题。五为《梦华山》，写梦中见到野老家前的碧桃花。六为《秋怀四首·其二》，写园丁摘黄瓜、村女采碧花的村居生活。七为《即事六首·其四》，“得屋施床即我家”写洒脱之姿，“元非看竹探梅花”写饭后散步只为“行饭”，原本不为看竹探花。八为《小艇》，写乘坐小艇至“武陵溪上看桃花”。九为《赠目眇者》：“达人所遇有生涯，高卧穷阎自一家。阅世正嫌岩下电，开樽且看雾中花。”这首诗当为陆游开禧三年（1207）秋作于山阴。诗中的这位目眇者，虽穷居陋巷，却能安然高卧。下联用王戎之“岩下电”对杜甫之“雾中花”，在陆游看来，与其目光如炬、洞察世事，未若醉眼朦胧、难得糊涂。最后一首《无题》：“碧玉当年未破瓜，学成歌舞入侯家。如今憔悴篷窗里，飞上青天妒落花。”很明显，这首诗与《赠目眇者》一样，并非咏花而是另有兴寄。周密《齐东野语》认为陆游在蜀日，“有所盼”，故赋此诗。《剑南诗稿校注》认为“此诗作于出蜀后已六年，周氏谰言不可信”。即使如钱仲联先生所言，此诗并非作于“在蜀日”，而是淳熙十年（1183）九月作于山阴，但诗中别有兴寄，却是不争的事实。可见10首之中，除却《赠目眇者》《无题》外，其余8首都与咏花、村居有着或多或少的联系，这些相同或相似的题材决定了陆游在诗歌创作时很有可能选用“家，花”（“花，家”）为韵脚。

《效王仲至少监咏姚花用其韵四首·其三》云：“仙衣襞积驾黄鹄，草木无光一笑开。人间风日不可奈，故待成阴叶下来。”韵脚为“开，来”，陆游有21首诗歌的韵脚为“开，来”（“来，开”）。这组韵脚的开放性远大于“家，花”（“花，家”）。“家，花”是实指的名词，它所能连接的对象往往是具象的，容易限定其前的定语范围，例如“一家”“到家”“君家”“老家”“碧花”“吹花”“落花”“桃花”等。相较之下，“开，来”（“来，开”）是动词，它所能连接的对象范围要大得多。例如它可以接名词“水仙开”“圣君来”，接动词“阖复开”“斫鲙来”，接副词“次第开”“最迟开”“日日来”“一再来”等。如前所论，“陆游共有572首诗歌与黄庭坚的316首诗歌使用了完全相同的韵脚，共涉及213种韵脚组合，排在前10位的韵脚组合分别为‘开，来’（107次）、‘来，开’（105次）”，这一数据也充分说明了“开，来”（“来，开”）这类韵脚的开放性。

在21首韵脚为“开，来”（“来，开”）的陆游诗歌中，诗题标明咏花或与花相关的有《东阳观酴醿》《缃梅三首·其二》《新菊二首·其二》《梅花绝句六首·其六》《花下小酌二首·其一》这5首，属于“相似或相仿的题材，使得诗人们选用了相同的韵部、韵脚”；还有一些诗歌并非咏花诗，而是分属不同的题材。例如《故袍》：“青衫犹是国工裁，破箧尘侵手自开。莫笑浑如霜叶暗，两朝曾见圣君来。”借故袍忆旧，诗中的“开，来”两个韵脚起笔稳，落笔新，颇见诗人构思之巧。再如《偶得双鲫二首·其二》：“酒兴森然不可回，重阳未到菊先开。一双剌明吾眼，催唤厨人斫鲙来。”主题又是一变，变成了菊开、鲙来。类似的例子还有很多，由此可见“开，来”（“来，开”）这一类韵脚组合的开放性。也正因为这种开放性，不同的诗人在面对多种多样的场景时，都可以选择这些韵脚组合。

通过分析可以发现，虽然陆游与黄庭坚二人诗歌韵脚相似度在75%以上的诗歌共有1390组，陆游共有572首诗歌与黄庭坚的316首诗歌使用了完全相同的韵脚，甚至二次筛选出来的1388组诗歌，有726组符合“次韵”、662组符合“用韵”标准，但是陆游既未主动亦未暗中次韵、用韵，他与黄庭坚之所以有相同韵脚比例如此之高的诗歌作品，或因巧合，或因相似或相仿的题材使得他们无意中选用了相同或相近的韵脚，或因所选的韵脚组合极富开放性。这一结论说明，在用韵层面，陆游未曾关注过黄庭坚，亦未曾向他取法。这也意味着，在这一层面，黄庭坚在陆游的视野中是“缺席”的，同样“缺席”的还有梅尧臣。

其实，即使“在场”，如果没有足够多的真正意义上的次韵、用韵，也无法证明二人在用韵层面有密切关系。先贤时彦多认为陆游深受曾几、吕本中诗歌的影响，但是从用韵的角度看，陆游仅有《和曾待制游两山三首》和曾几诗韵，仅有1首《席上有举吕居仁诗者因次其韵示坐客》次吕本中《送一书记杲公作天宁化士》诗韵。相较之下，苏轼反而是陆游主动次韵较多的诗人之一。这也说明，学界认为两位诗人诗歌之间存在师法、继承等渊源关系，更多是从用语、风格等层面着眼的。

三、陆诗名篇是否转益多师

就数据分析来看，陆游在诗歌用语层面师法黄庭坚之处颇多，呈现出“转益多师”的态势。或曰，以上所举的陆游诗歌，鲜见名篇，有无可能陆游名篇多是自出机杼、少有因袭的？我们选取陆游诗歌中的名篇，借助程序来分析这些名篇是否曾向他人取法。

20世纪60年代初期，朱东润先生编选陆游诗、词、文以成《陆游选集》，其中“诗选是按照《剑南诗稿》作出的，因此每篇作品都按年代编次” ，选录了从早年的《夜读兵书》至晚年的《示儿》共245题277首诗歌。陆游名篇的选定，本文暂以朱东润先生《陆游选集》诗选部分为例。与之相参的他人诗歌，取《全唐诗》以及《全宋诗》中陆游之前的所有诗歌。

我们仍采用程序来计算277首陆游名篇在诗歌用语层面与《全唐诗》《全宋诗》的关系。可以发现，陆游名篇与大量的唐宋诗歌在用语层面上存在相似性。囿于篇幅，唐宋诗中，仅各选10例。先看表4唐诗诸例：

上表诗例可以分为如下几类：

第一类是陆游直接化用唐人成句，如第一例“清秋宋玉悲”、第四例“中原消息断”、第五例“一步不相离”。

第二类是陆游与唐人之诗的出句与对句使用了相同的表述，如第一例“冯唐老”对“宋玉悲”，第三例“一朝去某地”对“十载客某地”。这一类中，像第二例“百年×○○”对“万事×○○”、第九例“年光×○○”对“(世）吾事×○○”，其中的“○○”皆为叠字，展现出相同的结构特征。

第三类是在出句、对句使用了相似表述的基础上，诗歌内容略有变化。如第七例，张谓与陆游分别（世）吾事是由夏及秋、由春及秋。张谓笔下的夏景有雨，有绿桑，秋景有秋风和麦黄。到了陆游笔下，变成了春雨与绿桑、秋风与稻香。变化之处一是夏与春，二是麦与稻，二人构思如出一辙。第八例代表了一种类型，即两位诗人对句或出句的表述几乎一致，只在另外一句进行腾挪。第八例中两个对句几乎相同，差异在出句体现出来。韩愈感慨“恨无一尺捶”，陆游则曰“请书一尺檄”，既同且异，既异亦同。第十例也代表了一种类型，即对原诗句式进行字数增减，此例将杜诗的五言增字为七言。同样，也有可能将七言减字为五言等。

第四类是陆诗使用谚语、俗语，如第六例“不痴不聋，不作阿家阿翁”，据《全唐诗》知“郭暧与升平公主琴瑟不调，父子仪拘暧待罪，代宗引谚慰之”，可见“不痴不聋，不作阿家阿翁”当是唐时的谚语、俗语。《剑南诗稿校注》引《宋书》卷五三《庾炳之传》“又云：不痴不聋，不成姑公”及《隋书》卷四六《长孙平传》“谚曰：不痴不聋，未堪作大家翁”之语以注“不痴不聋不作翁”句，可见钱仲联先生已注意到陆游此句用前人语。或曰第六例中陆诗“不痴不聋不作翁”句或许有更早的渊源，此说确然。但就数据分析来看，这一条数据是符合条件且应当被提取出来的。

再看表5宋诗诸例，陆游名篇诗句与宋人诗句相似的情况，除未见用前人谚语、俗语外，与表4几乎完全相同。为什么会出现这种情况？可能有如下几种原因：

第一，陆游确实曾向唐人、宋人师法，甚至袭用了成句。

第二，表述本身具有套语的性质，使得陆诗与他人诗句极为相似。特别是对我们所编写的程序来说，极容易将此类诗歌提取出来。表5中，陆游“人生贵适意，富贵安可苟”与苏颂“人生苟适意，富贵安所希”的相似度为72.73%。该句与孔平仲“人生适意耳，富贵亦何为”、史浩“人生贵适意，安佚固有以”、司马光“人生贵适意，何必慕华簪”等句的相似度都在40%以上。尽管这些诗句间具有如此高的相似度，但我们也很难据此判定陆游此句曾向前人取法。所以，在从用语层面判断影响－接受关系时，套语情况须审慎对待。

第三，诗词中一些常见的对偶、对仗，例如“一朝”对“十载”、“百年”对“万事”、“双鬓雪”对“寸心丹”等也要考虑在内。存在这些情况的诗句之间，也不见得必然是师法、因袭，有可能是因对偶、对仗所需。

第四，还有一类，是陆诗既与唐诗相似，又与宋诗相似。例如陆游“已惊白发冯唐老，又起清秋宋玉悲”与杜甫“垂白冯唐老，清秋宋玉悲”的相似度为66.77%，而与范纯仁“白首冯唐空已老，清秋宋玉不胜悲”的相似度为60%。冯唐、宋玉是诗文中的常见意象，但是将此二人对举，且以“老”形容冯唐，以“悲”形容宋玉，似是杜甫首创。如果从诗歌用语渊源的角度分析，第二例不能成立，包括范纯仁在内，他与陆游都是学杜甫的。但是从数据分析的角度，我们有必要将这类陆诗与唐宋诗同时存在相似性的现象单独列出，以全面反映文本比对中观察到的复杂情况。这一类实质上揭示的是陆游与其他宋人共同学习前人用语。

第五，再有一类，是既学用语，又学构思。较之单纯学习用语，这是更为高级的一类。例如第八例陆游“春将愁并至，秋与病相终”与张耒“秋色解将愁并至，年华偏与客相催”的构思就极为相似。从结构上看，出句是A将B并至，对句是C与D相连。从用语上看，张耒、陆游出句中的A，都是时节，一为秋、一为春；B完全相同，都是“愁”。二人出句都写时光流逝带来的愁闷之情，且他们不约而同选择了“解将”“将”字，给人一种将愁提携而来的感觉。对句中的C，张诗是年华，陆诗是秋，承接出句而来，续写时光流逝；到了D这里，略有变化，张耒说“客相催”，陆游说“病相终”，将张耒诗歌中的紧迫感变成了衰病感。内山精也先生在《长淮诗境——从〈诗经〉至北宋末之演变》一文中指出，张耒的淮河诗歌“总是披着一丝阴影”，“不时漂浮着悲哀或绝望”，内山先生所举的诗例，恰有张耒的这首《将至寿州初见淮山二首·其二》。《秋晚》当是陆游于嘉定二年（1209）秋作于山阴，他时年已85岁，故而首联“春将愁并至，秋与病相终”之后，以“过望犹赊死，扶衰又入冬”为颔联，仍写老迈与衰病。

可见，即使排除套语以及诗歌中常见的对偶、对仗所导致的用语相似性等情况，陆游的名篇也存在与唐诗、宋诗大量相似的情况。这说明，包括名篇在内的大部分诗歌，陆游都对前人有所学习，而且这种学习是全方位的。

四、结语

通过编写程序，我们实现了对陆游与一批诗人诗歌相似度的对比分析。从黄庭坚与陆游的诗歌对比分析来看，这些算法基本有效。未来可以增加更为先进的NLP相似度算法，引入诗歌结构特征以及允许自定义算法权重参数等。

用韵层面的代码虽然比较简单，但这种尝试能减少研究者手工查找、记录和计算押韵相似度的工作量，使研究者能够快速识别双方作品中韵脚高度相似的诗歌组合、筛选出具有潜在关联的案例进行分析，并客观量化押韵模式的重合度。输出的结构化数据（百分比、顺序、平仄韵部）能为进一步探讨两位诗人在押韵偏好等方面的异同提供数据基础和初步线索。

回到开篇提出的问题，通过数据分析可以得出以下结论：

第一，在诗歌用语层面，陆游非但没有“孜孜反对江西领袖黄庭坚传下来的‘无一字无来历’的看家本领”，反而在句与句、句与联、联与联等角度全面师法、学习黄庭坚的诗歌，遑论其与黄庭坚的诗歌主张“公开决裂”了。如此一来，四库馆臣所谓陆游“实能自辟一宗、不袭黄陈之旧格”的论断，至少在“不袭黄陈之旧格”这一层面要打个折扣。

第二，在诗歌用韵层面，陆游并未关注过黄庭坚等人，却对苏轼给予了极大的关注，有数首诗歌主动次韵苏轼。

第三，或有学者认为，陆游诗歌名篇多是自出机杼、不袭前人的。通过选取其名篇进行数据分析，我们发现，包括名篇在内的大部分诗歌，都存在向唐宋诗歌等前代文献取法的现象。

那么，最后一个问题自然随之而来：既然陆游转益多师、全方位取法，他是如何做到自出机杼、自成一家、“自辟一宗”的？我们将更新算法，另文讨论。

2025年第11期

山东社会科学

投

稿

邮

箱

SUBMISSION EMAIL ADDRESS