历史学家如何使用可视化表达知识?相关工作获EuroVis 2026最佳论文提名
原创 PKUVIS 2026-05-19 09:27 北京
![]()
近日,北京大学智能学院袁晓如课题组在可视化与历史领域的交叉合作工作被EuroVis 2026 正式接收并获最佳论文提名。
近日,北京大学智能学院袁晓如课题组在历史与智能交叉合作研究领域取得重要进展。课题组同张宇等研究者紧密合作,开展的面向历史研究中可视化图表使用情况的大规模混合方法分析工作:《How Historians Use Visualization: A Corpus-Backed Taxonomy and Analysis for Cross-Disciplinary Practice》已被可视化领域重要国际会议 EuroVis 2026 正式接收,并获最佳论文提名。相关论文将同时发表于计算机图形学重要期刊 Computer Graphics Forum (CGF)。
随着量化历史的兴起,可视化在历史研究中的应用正从孤立的尝试转变为系统性的实践。然而,关于历史学家在实际研究中如何有效采用可视化技术,依然缺乏系统的数据驱动层面的证据。如果没有基于语料库的系统性分析,就难以回答诸如“历史研究中常采用哪些可视化类型”、“背后的动机是什么”、“存在哪些阻碍或误用”等关键问题。为了填补这一空白,课题组提出了一种结合大规模语料构建、协作式分类法开发、人工智能辅助标注以及历史学家深度访谈的混合方法研究框架。
![]()
图1:混合研究方法的工作流程
构建语料库与边界对象
课题组从历史学顶级期刊中,检索并确认了 4,142 篇研究论文(包括一部分数字人文期刊中和历史研究有关的论文),从中提取了 14,021 张图表。为了对其进行科学分类,课题组可视化专家与历史学家紧密合作,基于建构主义扎根理论构建了包含 47 个最叶节点的领域可视化分类树和4,831 个可视化实例。
此外,课题组专门研发了 HiFigAtlas 系统作为跨学科协作的边界对象(Boundary Object)。通过这一系统,历史学家和可视化研究者可以在保持各自学科视角的同时,在统一的界面中浏览论文原文语境,进行多维度数据过滤以及查看相似图表,进而支持进一步的深度探讨与共识达成。基于HiFigAtlas系统,团队与11位不同细分领域的历史学家进行了半结构化访谈。
![]()
图2:HiFigAtlas系统界面,支持多维度过滤、文本上下文探究及相似图表分析
可视化的五种角色
结合语料库模式特征与历史学家的深度访谈,本工作提炼并定义了可视化在历史研究中扮演的五种核心功能角色。
包括(1)原始史料型可视化 (Primary-Source Visualization):如古地图或星图,直接作为历史证据或研究对象的一手材料。(2)数据整合型可视化 (Evidence-Synthesis Visualization):历史学者作为整理零散史料、梳理线索的“工作台”,通常发生在研究早期。(3)沟通型可视化 (Communicative Visualization):最常见的形式,用于在分析完成后向读者清晰、直观地传达结论,如利用折线图或条形图展示趋势和频率。(4)论证型可视化 (Confirmative Visualization):用于对历史知识的不确定性进行建模,评估假设或展现多重解释路径,如利用散点图和拟合曲线比较不同记录之间的可靠性。(5)探索性可视化 (Exploratory Visualization):通过仪表板或可视分析系统,支持研究者在“远读”与“近读”间切换与分析,实现历史知识生产与模式发现。
![]()
图3:历史研究中的各种可视化图表示例
使用动机、实践障碍与误用模式
历史研究中的各种可视化研究发现,地图、节点链接图以及折线图在历史学文献中占据主导地位,这与历史学家处理时空分布、人际网络和经济趋势的需求高度契合。历史学者使用可视化的核心动机在于应对大规模史料、外化复杂的关系结构、增强表达说服力,并借此提高研究方法的透明度与合法性图表示例。
然而,除了在图表中将时间作为轴外,历史研究中极少使用时间为中心的可视化(如时间线、甘特图)。这并非因为时间不重要,而是由于历史的演进往往呈现出循环、重叠等多尺度的复杂性,单一的线性时间轴对历史的解释力有限。强行使用线性时间线可能会营造出一种虚假的连贯感,扭曲底层历史证据。与此同时,历史学家对数据处理、降维以及复杂算法可能带来的“历史语境丧失”与“算法主观性隐蔽”保持着高度警惕。高昂的专业工具学习成本以及现有出版物的静态排版限制,也进一步阻碍了可视分析系统的普及。
此外,团队还归纳了历史文献中常见的可视化误用模式,包括:图表形式与数据类型的错配(例如用面积图展示离散分类数据)、历史类别的过度简化(如用现代二元性别柱状图掩盖复杂的历史身份),以及严重阻碍信息读取的视觉编码设计。这些误用可能会无意中扭曲读者的推论,这与历史学强调严谨与溯源的学科核心价值相悖。
总结
本研究展示了混合方法在探究跨学科交叉实践方面的巨大潜力。相关发现为未来设计符合历史学认知与论证逻辑的可视分析方法奠定了重要基础。
论文的第一作者是北京大学智能学院博士生陈昕悦同学。其他作者包括复旦大学的郑伟莉以及北京大学智能学院的马驰腾。论文通讯作者为智能学院袁晓如和牛津大学的张宇。本工作获得了国家自然科学基金项目(NSFC No. 62272012)的支持。论文写作中得到了多位历史学专家、学者的支持。
近年来,计算技术在传统人文学科研究中的应用日益广泛,不仅为人文学者提供了强大的分析工具,也改变了他们传统的研究范式。可视化通过将数据转化为可交互图形,有效支持数据的理解、推理与决策,在人文研究中扮演着愈发重要的角色。北京大学智能学院袁晓如课题组已在人文智能交叉研究中取得系列成果,包括大规模中外古代可视化数据集与研究(ACM CHI 2025,IEEE VIS 2023/TVCG,IEEE PacificVis 2025/TVCG)、古代书法字形对比(IEEE VIS 2025/TVCG)、汉籍流传时空可视分析(IEEE VIS 2023/TVCG)、彩陶花纹演变分析(IEEE PacificVis 2024/TVCG)、智能古籍目录标注研究(IEEE VIS 2024/TVCG/最佳论文提名奖)、大规模历史人物时间线研究(IEEE PacificVis 2026/TVCG)等工作。更多和历史研究、博物馆展览、考古等领域相关工作也在紧密进行中。欢迎有兴趣学者开展合作。