普通视图

Received before yesterday5 - 武汉大学数字人文公众号

会议征稿 | 第六届数字人文自然语言处理国际会议——NLP4DH2026

2026年1月30日 15:43

2026-01-30 15:43 湖北

第六届数字人文自然语言处理国际会议(NLP4DH 2026)将与ACL2026联合举办。本次会议的论文集将收录于 ACL Anthology

一、会议简介


NLP4DH(Natural Language Processing for Digital Humanities)是一系列专注于“数字人文 × 自然语言处理”深度交叉的国际学术会议/工作坊。其核心使命在于将自然语言处理(NLP)的前沿方法与数字人文的核心议题(如历史学、文学研究、文化遗产及档案学等)进行深度对等衔接。通过构建跨学科的对话空间,NLP4DH 旨在利用自然语言技术赋能历史与当代文本的深层解析,从而弥合计算技术与人文阐释之间的逻辑鸿沟。

在组织形态与学术声望上,NLP4DH 具有显著的“强联合”特征:它通常与 ACL、EMNLP、NAACL 等主流计算语言学顶会联合举办。这种模式不仅吸引了顶级 NLP 专家与资深人文学者的同场交流,更确保了研究成果能通过标准学术评审进入ACL Anthology 数据库。

    历届纪录显示其稳健的发展脉络:

  • 2021 年与 ICON 联合(线上);

  • 2022 年与 AACL 联办;

  • 2023 年在日本早稻田大学与 IWCLUL 联合举行;

  • 2024 年与 EMNLP 在迈阿密联办;

  • 2025 年则与 NAACL 在阿尔伯克基联办。

    稳定的出版渠道使其在计算语言学社群中具备极高的可见度与引证价值。

    在学术议题的深度上,NLP4DH 拒绝“工具的机械化套用”,而强调问题驱动的算法创新。其关注点涵盖了从底层技术到高层阐释的全栈路径:

  • 语料治理与加工:针对历史文献的 OCR 噪声修复、版面分析,以及历时性语料的词法解析与语义漂移建模。

  • 语义与结构挖掘:复杂实体识别(人物、地名、机构)与知识图谱构建;主题、体裁及风格的量化分析。

  • 叙事与交叉评估:计算叙事学视角下的叙事结构提取、长文本建模,以及低资源或多语言人文语料的特殊适配。会议特别鼓励那些既具备严谨方法论(可复现的数据、模型与评测),又能回应人文解释效度(Interpretative Validity)的研究——即探讨计算结果如何进入诠释学论证,并与传统细读法(Close Reading)形成互补。

评审与交流机制上,NLP4DH 遵循严格的同行评审准则,近年普遍采用 OpenReview 平台进行双盲评审。作为顶会的官方工作坊,它与主会议的注册体系无缝衔接,确保了参会者的跨学科多样性。相比于传统数字人文活动,其最大的学术优势在于方法与数据资源论文能被 NLP 主流社群检索并引用,极大提升了交叉学科成果的传播力。

从社群生态视角来看,NLP4DH 实质上扮演着“学科翻译者”的角色。它将人文学者关心的历史报刊、文学档案、口述史等异构材料转化为可操作的计算任务;同时,它又将计算产出的实体网络、风格表征与语义向量重新嵌入到人文学术写作的证据链中。对于数字人文研究者,这里是接触大语言模型等前沿技术在人文场景适配的最前线;对于NLP研究者,这里则提供了更具复杂性、真实性与理论挑战性的问题空间。

二、主会轨道


本会议聚焦于将自然语言处理技术应用于数字人文研究。征稿主题可涵盖任何数字人文相关议题,但需包含自然语言处理或自然语言生成的研究内容。

适合的议题包括但不限于以下方面:


  • 机制可解释性相关技术应用于数字人文研究

  • 利用大语言模型及其他自然语言处理系统生成或评估人类书写的叙事文本

  • 评估模型输出与行为中的文化偏见问题,尤其是在多语言环境下的表现。

  • 数据来源与数据谱系研究,包括对训练前与训练后数据集的分析。

  • 面向文化遗产馆藏的自然语言处理研究,以及与美术馆、图书馆、档案馆和博物馆相关的研究工作。

  • 光学字符识别相关研究,包括文本数据中自动化错误检测与清洗方法。

三、专题轨道:重新审视自然语言处理


本专题征集对大语言模型训练数据特征进行批判性分析的研究工作,鼓励将机制可解释性相关方法创造性地引入人文研究语境,并以人文学科的研究直觉反向强化自然语言处理技术的发展。该专题强调从数字人文出发服务自然语言处理,即以数字人文推动自然语言处理研究。

相关议题包括但不限于以下方面:


  • 用于解释大语言模型行为的关键方法。

  • 在不同社会语境中对自然语言处理技术(包括大语言模型)应用进行情境化分析的研究。

  • 受人文学科启发的预训练与后训练方法。

  • 从预训练大语言模型中挖掘并恢复具有研究价值的潜在结构

  • 对自然语言处理技术(包括大语言模型)的哲学层面思考

  • 其他相关研究方向。

四、论文投稿


NLP4DH2026征集与数字人文和自然语言处理(NLP4DH)相关的原创且未发表研究成果。

短论文篇幅不超过4页,长论文不超过8页;两种投稿类型的参考文献页数均不设上限。所有投稿须遵循 ACL 官方模板。

投稿论文必须为匿名稿件,并由程序委员会进行同行评审,评审方式为双盲评审。

论文须在投稿截止日期前通过 OpenReview系统提交。被接收论文的作者中至少有一位需出席会议并进行论文报告。会议注册费用由 ACL 2026 统一收取。

NLP4DH2026同样接受已通过ACL Rolling Review(ARR)评审、但尚未承诺投向其他会议或期刊的论文。已通过 ARR 获得评审意见的论文不得再通过 NLP4DH 的直接投稿通道进行评审,而须选择 ARR 投稿通道,并提供对应 ARR 投稿在 OpenReview 上的论坛链接:

https://openreview.net/forum?id=XXXXXXXXXXX

所有被接收的论文(短论文与长论文)将收录于会议论文集,并发表于 ACL Anthology。此外,作者将获得额外一页篇幅用于回应审稿意见。最终定稿版本中,短论文最多可为5页,长论文最多可为9页,参考文献页数仍不设上限。

被接收论文的作者还将受邀向 Journal of Data Mining & Digital Humanities 的专题专刊提交论文扩展版本。

五、时间信息


  • 直接投稿(长论文与短论文):2026年3月5日


  • ARR 承诺投稿截止日期:2026年3月24日


  • 录用结果通知:2026年4月28日


  • 最终定稿提交截止日期:2026年5月12日


  • 会议时间:2026年7月2日至3日

    所有时间均以AoE时间为准。

    有任何疑问可通过电子邮件联系Sil Hamilton:srh255@cornell.edu

六、特邀发言人


01

Sophie Hao 

Boston University

现任波士顿大学(Boston University)语言学与数据科学系 Moorman-Simon 助理教授。

(1)

教育与职业背景

Sophie Hao 于耶鲁大学(Yale University)获得语言学与计算机科学博士学位,导师为 Dana Angluin 与 Bob Frank;此前于芝加哥大学获得数学与语言学双学士学位。在加入波士顿大学前,她曾任纽约大学(NYU)数据科学中心助理教授/教职研究员(Faculty Fellow),并与 Tal Linzen 等知名学者开展博士后阶段的合作研究。此外,她曾拥有 Apple 自然语言机器学习实习及 Epic 软件开发等业界经验。

(2)

研究方向与领域贡献

她的核心研究聚焦于自然语言处理的可解释性(Interpretability for NLP),致力于构建一套跨学科的深度神经语言模型科学(Science of Deep Neural Language Models)。其研究兴趣广泛,涵盖了以下前沿领域:


  • 模型探测与分析:包括探测(Probing)、神经表征(Neural Representations)及特征归因(Feature Attribution)。

  • 计算语言学理论:计算理论、神经架构分析、形式语言识别与电路复杂度(Circuit Complexity)。

  • 生成语言学与数学语言学:涉及语法学、音系学及生成语法与大语言模型的交叉研究。

  • 评估与心理语言学:语言学评估、心理语言学建模及模型接受度判断的影响因子分析。

  • 数字人文与社会公正:偏见与公平性研究、数字人文、数字社会科学以及社区声音在在线安全中的表征。

(3)

代表性学术成果

Sophie Hao 在 TACL、EMNLP、NAACL 等 NLP 顶级会议与期刊上发表了多篇具有影响力的论文。其代表作探讨了 Transformer 模型在处理形式语言时的电路复杂度,以及 Transformer 如何通过线性编码确定动词屈折变化。她多次受邀在 ETH Zürich、Flatiron Institute 等顶尖科研机构及“语言数学”等国际会议上发表主题演讲。


02

Luca Soldaini

现任艾伦人工智能研究所(Ai2)首席研究科学家(Lead Research Scientist),隶属于 Olmo 团队。在加入 Ai2 之前,他曾担任亚马逊Alexa 部门的高级应用科学家。他于 2018 年在乔治城大学信息检索实验室获得计算机科学博士学位,师从Nazli Goharian。

(1)

研究方向与领域贡献

Luca 近期的研究核心在于提升大语言模型在构建、训练及评估全链路中的透明度。主要科研成就包括:

  • Olmo 项目联席主管:他与Kyle Lo共同领导 Ai2 旗舰开源语言模型项目Olmo的数据团队。Olmo 是目前顶尖的完全开源模型,旨在推动大模型科学研究。他主导发布了稠密(Dense)与混合专家(MoE)架构的多个版本,并公开了所有训练数据、代码、训练配方(Recipes)及模型权重(Checkpoints)。其最新发布的 Olmo 3 包含 7B 和 32B 规模的指令微调(Instruct)与推理(Thinking)模型,性能直面竞争对手 Qwen 3。

  • 模型对齐与适配:他与团队共同开发了多套语言模型适配方案。2024年推出了Tulu 3,这是一套支持高达405B参数规模的顶尖后训练(Post-training)流水线。此外,他还参与开发了开源多模态模型家族 Molmo,其性能足以媲美闭源视觉语言模型(VLMs)。近期,他发布了DR Tulu,这是一套用于构建深度研究系统的全开源配方,其实测性能超越了Gemini 3 Pro与GPT-5。

  • 数据治理工具链:他协作开发了多项预训练数据清洗工具。其中包括高性能PDF文本提取模型 olmOCR(其第二版本通过可验证单元测试的强化学习得到了显著增强),以及能够按主题和格式对大规模网页数据进行划分的 WebOrganizer。

七、组织者


01

Sil Hamilton 

Cornell University

康奈尔大学(Cornell University)信息科学系博士研究生,师从David Mimno与Matthew Wilkens教授,在“文化与计算实验室”开展研究。同时担任 Epiq AI Labs 的 AI 研究科学家,于2025 年获得加拿大自然科学与工程研究委员会(NSERC)为期三年的奖学金资助,专注于从神经网络中提取知识。

(1)

研究方向与领域贡献

Sil 的研究致力于界定人类与语言模型在认知与知识论(Epistemologically)上的差异。他结合叙事理论(Narrative Theory)与模型可解释性(Model Interpretability),深入调查大语言模型在法理学、新闻学及文学创作等领域中如何(以及为何无法)精准捕捉文化概念。

作为NLP4DH研讨会的核心组织者之一,他曾多次担任会议分论坛主席。在哈佛大学 CS50 课程中,他讲授 了GPT-4 的工作原理,并为全球数万名记者开发了“生成式人工智能应用”课程,涵盖英语、西班牙语和葡萄牙语多个版本。除了在 Epiq AI Labs 担任研究科学家,他还开发了 DocPlot(浏览器端私密语义搜索)和 feature-space-explorer(3D 句子嵌入可视化)等开源软件工具。

(2)

代表性学术成果

他在 NLP 与DH的交叉领域发表了多篇高质量论文,主要涵盖以下三个维度:

  • 叙事与基准测试:代表作 NarraBench(被 EACL 2026 接收)构建了评估大语言模型创意表现的综合框架。此外,他在 COLM 2025 上发表了关于大语言模型感官语言使用的探测研究(The Zero Body Problem)。

  • 可解释性与模型分析:研究涉及强化学习(RLHF)导致的模型叙事模式坍塌(Mode Collapse)、结构化输出对模型准确性的损害,以及利用情感分析识别小说章节边界。

  • 模拟与社会科学应用:利用 GPT 模拟最高法院判决(Agent-Based Modeling),以及利用反事实新闻(Counterfactual Journalism)评估模型对特定事件的先验概率。

02

Emily Öhman 

Waseda University

现任早稻田大学国际教养学部(SILS)副教授。同时,她还拥有赫尔辛基大学(University of Helsinki)语言技术与数字人文领域的“Docent”头衔(类似于北欧/德国体系的特许任教资格),并担任拉普兰塔-拉赫蒂理工大学(LUT University)计算媒体与传播研究方向的访问教授及兼职副教授。

(1)

教育与职业背景

于 2021 年在赫尔辛基大学获得数字人文-语言技术博士学位,其博士论文题目为《情感语言:构建并应用英语及其他语言情感检测的计算资源》。此前,她于林奈大学获得英语语言学硕士学位。

(2)

研究方向与领域贡献

Ohman 教授的研究处于自然语言处理NLP与人文社会科学的交叉地带,主要研究方向包括:

  • 情感分析与检测:特别是跨语言环境下的情感建模,以及文学作品中的情感曲线分析。

  • 数字人文:致力于数字人文研究基地的创建、计算文学研究及数字研究伦理。

  • 计算社会科学:涵盖宣传检测、仇恨言论检测以及社交媒体分析。

  • 语言技术应用:利用机器学习、词嵌入和 OCR 技术处理文化遗产收藏及多语言数据集。

(3)

代表性学术成果

  • 重要出版物:在TACL、ICWSM、Language and Cognition 等国际期刊和会议上发表了多篇论文。2024年由Sage出版了专著《文本分析》(Text Analytics)。

  • 开源贡献:开发了多项重要学术资源,包括芬兰语情感强度词典(FEIL)、多语言情感标注数据集(XED)以及Docker化的情感标注工具 Sentimentator。

  • 研究课题:目前主持或参与多项由日本学术振兴会(JSPS)及芬兰研究理事会资助的项目,如“语义空间中的情感地图(EmoMap)”和“文学作品中的负面情感计算研究”。

  • 会议组织:担任NLP4DH的程序委员会主席。

  • 学术审稿:担任 IEEE Transactions on Affective Computing、Digital Humanities Quarterly 等顶级学术期刊的审稿人。

  • 教学获奖:因在大型在线编程课程中实施“个体化最近发展区”教学法,荣获第12届早稻田大学 e-Teaching 个人奖。

03

Rebecca M. M. Hicke 

Cornell University

康奈尔大学计算机科学系四年级博士候选人,在 C2L 实验室(Culture and Computation Lab)从事研究,导师为 David Mimno。她于 2022 年以优等成绩毕业于卡尔顿学院(Carleton College),获得计算机科学与英语双学士学位,并辅修数字艺术与人文。

研究领域涵盖计算人文、自然语言处理及文化分析。曾在CHR 2025(计算人文研究会议)发表了关于大规模视角分析及基督教小说自动叙事分析的研究。在 NLP4DH 2025上发布了一个包含约7万个文学社交网络的大型语料库,其关于大语言模型感官语言使用的研究被COLM 2025接收,关于计算识别隐喻的研究曾入围CHR 2024最佳短论文奖提名。



04

Yuri Bizzoni 

Aarhus University


现任奥胡斯大学文化与社会学院高级研究员,供职于人文计算中心(Center for Humanities Computing)。

(1)

研究方向与领域贡献

他的研究高度跨学科,主要利用深度学习和定量方法解决人文领域的复杂问题。

  • 计算叙事学与文学分析:重点研究文学文本的动态演变,包括情感曲线建模、叙事结构自动评估,以及文学作品中“质感”与“风格”的量化。

  • 情感分析:致力于开发适用于文学和多语言语料库的持续性情感评分系统。

  • 数字人文下的大语言模型应用:探索大语言模型在人文研究中的局限与潜力,例如他在 2025 年参与了关于 GPT 助手研究平台的开发项目。

  • 性别与偏见分析:曾通过大规模观测研究,分析书籍评论评价中的系统性性别不对称。

(2)

代表性学术成果

  • Fabula-NET 项目:这是一项利用深度神经网络对文学虚构作品和叙事进行多维度自动评估的重大项目(2021-2024)。

  • 跨领域合作:他的学术产出非常丰富,在 LREC-COLING、ACL、CHR(计算人文研究会议)等顶尖学术场合频繁发表论文。

  • NLP4DH 深度参与者:不仅是NLP4DH 2025的论文作者之一,还主编过多本关于数字人文自然语言处理的会议论文集。

05

Axel Bax

Cornell University

现为康奈尔大学信息科学系博士研究生。他同样效力于 C2L 实验室(Culture and Computation Lab),由 David Mimno 与 Matthew Wilkens 两位教授共同指导。

(1)

研究方向与领域贡献

Axel 的研究专注于利用计算方法探索文学趋势及文学接受史(Literary Reception)。其研究特色在于:

  • 地理空间分析:特别关注文学中的地理因素。通过地图可视化与计算地理模型,研究文学作品如何呈现空间感,以及读者的接收习惯如何受地理位置影响。

  • 文化计算:通常涉及大规模书目数据分析,利用 NLP 技术提取文学文本中的时空线索。

06

Jacob A. Matthews

Cornell University

现为康奈尔大学罗曼语研究(Romance Studies)博士候选人,辅修认知科学。于2019 年在哥伦比亚大学获得法语与法语区研究学士学位。

(1)

研究方向与领域贡献

Jacob 的研究高度融合了实验心理学、计算语言学与人文理论。他致力于将计算与实验方法应用于人文领域,特别是文学与区域研究。其核心研究领域包括:

  • 语言模型表征分析:深入探讨语言模型与嵌入模型的内在表征机制。

  • 人类与机器语言处理差异:对比人工智能与人类在大脑认知层面的语言处理异同。

  • 文学理论与认知:利用 Gilles Deleuze(德勒兹)和 Michel Serres(塞雷斯)等思想家的理论探讨认知科学问题。

(3)

代表性学术成果

他活跃于康奈尔大学的多个顶尖实验室,包括 C.Psyd(计算心理语言学实验室)、Humanities Lab 以及 Cornell NLP 组。

  • 顶会论文:在 ACL 2024 (Findings) 上发表关于正字法噪声(Orthographic Noise)如何影响上下文词嵌入的研究。

  • 网络嵌入:在 PEER 2024 及 Text as Data (TADA) 2023 上提出了利用属性网络嵌入增强语言模型表征的简易高效方法。

  • 心理语言学实验:在第 36 届人类句子处理年会上展示了关于“Wug Vectors”理解机制的研究,探索模型在处理虚构词汇时的泛化能力。

07

Mika Hämäläinen Metropolia

University of Applied Sciences

博士毕业于赫尔辛基大学(University of Helsinki),是 NLP 领域的资深研究员和开发者。他是一位典型的“代码与人文”实践者,研究范围从尖端的深度学习技术一直延伸到濒危语言的保护。

(1)

研究方向与领域贡献

Mika的科研工作具有极强的原创性和工具性,主要集中在以下方向:

  • 计算创意:探索如何利用 AI 进行文学创作、隐喻生成以及非标准语言的处理。

  • 乌拉尔语自然语言处理(Uralic NLP):他是该领域的权威专家,致力于为芬兰语及其他少数/濒危乌拉尔语种构建计算资源。他开发的 UralicNLP Python 库是该领域的标准工具。

  • 非规范化数据处理:研究如何处理历史文献、方言及社交媒体等不符合标准语法规范的数据。

  • 开源科学倡导者:他强调科学研究的透明度,主张公开所有的研究代码和数据集(Kaggle/UralicNLP),并在学术界积极推广开放研究数据。

八、项目委员会


  • Hale Sirin, Johns Hopkins University

  • Thibault Clérice, INRIA Paris - Almanach

  • Noémi Ligeti-Nagy, Hungarian Research Centre for Linguistics

  • Anna Dmitrieva, University of Helsinki

  • Frederik Arnold, Humboldt Universität Berlin

  • Dongqi Liu, Universität des Saarlandes

  • Won Ik Cho, Samsung Advanced Institute of Technology

  • Konstantin Schulz, Humboldt Universität Berlin

  • Aynat Rubinstein, Hebrew University of Jerusalem

  • Alejandro Sierra Múnera, Hasso Plattner Institute

  • Tim Fischer, University of Hamburg

  • Shu Okabe, Technische Universität München

  • Ronja Laarmann-Quante, Ruhr-Universtät Bochum

  • Yoshifumi Kawasaki, The University of Tokyo

  • Klara Venglarova, Universität Graz

  • Youngsook Song, Sionic AI

  • Joshua Wilbur, University of Tartu

  • Keito Inoshita, Shiga University

  • Kenichi Iwatsuki, Mirai Translate

  • Piper Vasicek, Brigham Young University

  • Mohammed Attia, Google

  • Laura Manrique-Gómez, Universidad de Los Andes

  • Craig Messner, Johns Hopkins University

  • Abhai Pratap Singh, Carnegie Mellon University

  • Balázs Indig, Eötvös Lorand University

  • Anton Eklund, Umeå University

  • Jouni Tuominen, University of Helsinki

  • Jesse Roberts, Tennessee Technological University

  • Nikita Neveditsin, St. Mary's University

  • William Thorne, University of Sheffield

  • Lev Kharlashkin, Metropolia University of Applied Sciences

  • Jonne Sälevä, Brandeis University

  • Gleb Schmidt, Radboud University

  • Erik Henriksson, University of Turku

  • Amanda Myntti, University of Turku

  • Erkki Mervaala, University of Helsinki

  • Jay Park, Nanyang Technological University

  • Lama Alqazlan, University of Warwick

  • Pascale Moreira, Aarhus University

  • Enrique Manjavacas, Arevalo University of Leiden

  • Chahan Vidal-Gorène, École Nationale des Chartes

  • Lucija Krusic, Karl-Franzens-Universität Graz

  • Lidia Pivovarova, University of Helsinki

  • Iana Atanassova, University of Franche-Comté

  • Sebastian Oliver Eck, University of Oxford

  • Shuo Zhang, Bose Corporation

  • Tomasz Walkowiak, Wroclaw University of Science and Technology

  • Elissa Nakajima, Wickham Waseda University

  • Nicolas Gutehrlé, University Bourgogne Franche-Comté

  • Hanna-Mari Kupari, University of Turku

  • Sourav Das, Indian Institute of Information Technology Kalyani

  • Antti Kanner, University of Helsinki

  • Julie-Anne Meaney, University of Edinburgh

  • Eetu Mäkelä, University of Helsinki

  • Fotini Koidaki, University of Crete

  • Yuzuki Tsukagoshi, University of Tokyo

  • Quanqi Du, Ghent University

  • Hugo Gonçalo Oliveira, Universidade de Coimbra

  • Maciej Kurzynski, Lingnan University

  • Xinmeng Hou, Columbia University

  • Sijia Ge, University of Colorado at Boulder

  • Mary Ogbuka Kenneth, Imperial College London

  • Mina Rajaei Moghadam, Northern Illinois University

  • Quan Duong, University of Helsinki

  • Mohamed Hannani, Universität Siegen

  • Pascale Feldkamp, Aarhus University

  • Eiaki Morooka, Metropolia University of Applied Sciences

  • Jahnavi Anilkumar Kachhia, Facebook

  • Rynaa Grover, Google

  • Milavkumar Sha, IEEE

  • Pratik Aher, Meta

  • Kunal Chhabaria, Walmart Connect

  • Elena Klyachko, HSE University

  • Yulia Badryzlova, Higher School of Economics

  • Mariia Fedorova, University of Oslo


以上内容来自会议官方网站:

https://www.nlp4dh.com/nlp4dh-2026

经数字人文资讯小编翻译整理而成

如需转载,请后台私信联系

编译 丨魏翔

校对 丨洪冰凤

排版 丨罗斯鹏


阅读原文

跳转微信打开

专业资讯丨欧洲时光机项目(Time Machine)最新介绍

2026年1月23日 15:40

2026-01-23 15:40 湖北

迄今为止使用“历史大数据”进行研究的项目中意义最深远、规模最宏大的一个。

项目简介

时光机项目(Time Machine)是迄今为止使用“历史大数据”进行研究的项目中意义最深远、规模最宏大的一个。该项目致力于将欧洲丰富的过往与前沿数字技术及基础设施相结合,构建一个庞大的分布式数字信息系统,以描绘欧洲经济、社会、文化与地理的时空演进历程。在该构想中,数字化仅是漫长提取过程的第一步,后续步骤包括通过增强现实/虚拟现实(AR/VR)应用强化的文档分割与理解,最终实现假设性时空四维重建的模拟。

图:“时光机”项目官网

时光机项目通过推动信息通信技术(ICT)与社会科学及人文科学(SSH)的前沿交叉研究,将深度赋能欧洲经济的关键领域:驱动ICT软件(尤其是AR/VR应用)的创新,助力创意产业与旅游业的转型升级。此外,该项目还将为城市规划、土地管理及智慧城市建设提供全新的维度与视角。

图:构建历史大数据(A)现状。(B)基于新资源数字化与处理的扩展。(C)基于模拟的扩展。


图:时光机数字内容处理器与三大模拟引擎

时间机器组织

时光机组织(Time Machine Organization, TMO)是致力于技术、科学与文化遗产合作的重要国际组织,也是确保“时光机”项目可持续性与经济独立性的机构治理框架。

该组织依据奥地利法律成立的国际性协会,总部设在维也纳。因此,协会向任何从事科学、技术及文化遗产相关工作的法律实体开放。此外,个人也可以通过成为“时光机支持者”加入时光机网络。

时光机组织的目标与愿景

•提供一个平台,支持与不同联盟在不同的资助计划中执行各类项目(在资助工具咨询、寻找合适伙伴、项目管理等方面提供支持)。

•开发技术,以进一步推动文化遗产的数字利用与再利用。

•建设一套基础设施,以实现时光机的目标与活动(服务器、数据库、平台等),同时增强时光机组织及其成员的实际能力。

•创造一个持续交流知识、最佳实践和专业技能的环境,以促进当前及未来的发展(在线知识库、时光机活动,如2019年时光机大会、研讨会、国家利益相关者会议、专题社交活动等)。

•提供开源工具与技术。

•在不同领域提供支持(技术与基础设施的使用、项目构建等)。


团队成员与合作伙伴

时光机团队由时光机组织(Time Machine Organization,简称TMO)执行董事会、运营团队以及时光机形象大使共同组成,总部于维也纳(奥地利),并在洛桑(瑞士)、布达佩斯(匈牙利)、耶拿(德国)和赫尔辛基(芬兰)设有办事处。

执行董事会

弗雷德里克·卡普兰(Frédéric Kaplan)

时光机组织主席

弗雷德里克·卡普兰教授是时光机组织主席,同时担任瑞士洛桑联邦理工学院(École Polytechnique Fédérale de Lausanne,EPFL)人文学院院长。他著有十余本被翻译成多种语言的书籍,并发表了超过一百篇科学出版物。他的工作成果还在多个重要博物馆展出,包括威尼斯建筑双年展、巴黎大皇宫、蓬皮杜中心以及纽约现代艺术博物馆。

伊莎贝拉·迪·莱纳尔多(Isabella di Lenardo)

地方时光机项目负责人

伊莎贝拉·迪·莱纳尔多博士是威尼斯时光机项目经理。自威尼斯时光机项目启动以来,她主导了该城市的所有城市建模模拟工作,并担任所有相关展览(威尼斯双年展、大皇宫、数据广场-艺术实验室等)的内容策展人。她还负责“复制品(Replica)”项目,该项目旨在数字化威尼斯乔治·奇尼基金会(Fondazione Giorgio Cini)的100万件艺术品照片,并通过一个视觉相似性搜索引擎提取其图案特征。

伊莎贝拉·迪·莱纳尔多学习考古学和城市研究,拥有艺术史博士学位。她发表了大量关于威尼斯艺术和城市史的论文和文章,并参与了欧洲多家博物馆的多次艺术展览。她定期协调关于艺术史和城市史数字工具的暑期学校和研讨会,并在威尼斯国际大学及洛桑联邦理工学院(EPFL)建筑、土木与环境工程学院等多所大学授课。


马丁娜·博洛姆-科塔里(Martina Bolom-Kotari)

时光机组织副秘书长

马丁娜·博洛姆-科塔里是一位档案管理员和历史学家,目前工作于赫拉德茨-克拉洛韦大学哲学院辅助历史科学与档案学系。她的主要研究领域是印章学,同时也涉及教会史、古文书学和近代早期历史。

罗伯特·萨布拉特尼格(Robert Sablatnig)

时光机组织财务主管

罗伯特·萨布拉特尼格教授博士领导着维也纳工业大学(TU Wien)的计算机视觉实验室。他的研究兴趣包括3D计算机视觉(涵盖测距仪、立体视觉、从X恢复形状、配准、标定)、机器人视觉、用于计算机视觉的机器学习和深度学习、视频数据分析(运动与跟踪)、自动化文档分析、多光谱成像、虚拟现实与增强现实,以及在工业和文化遗产保护中的应用。

他编辑了17部会议论文集,并在期刊、多个国际会议和研讨会上发表或合著了300多篇经同行评审的科学出版物。他是国际模式识别协会(IAPR)文化遗产应用计算机视觉技术委员会(第19技术委员会)的创始主席,奥地利模式识别协会(AAPR/ÖAGM,IAPR奥地利分会)的财务主管,并在IAPR理事会担任职务。


桑德·明斯特(Sander Münster)

项目探索服务首席战略师兼时光机组织秘书长

桑德·明斯特博士是德国耶拿弗里德里希·席勒大学(Friedrich Schiller Universität Jena)的数字人文(图像/对象)领域青年教授。他于德国德累斯顿工业大学(Technische Universität Dresden)获得教育技术学博士学位,并在该校学习了历史、教育和商业。截至2019年,他领导了德累斯顿工业大学媒体中心的媒体设计部门以及城市历史4D(UrbanHistory4D)青年研究小组,并曾是德累斯顿工业大学教育学院的青年研究员。

他的研究领域包括移动3D界面、数字人文与文化遗产领域的科学计量学和研究方法。他在研究传播和创新支持领域有丰富的工作经验。他曾担任的相关职务包括:德国数字遗产协会数字重建工作组联合召集人、德国“建筑史3D重建方法”网络发言人,以及欧盟虚拟多模态博物馆网络“与国际组织合作”工作组负责人。


托马斯·艾格纳(Thomas Aigner)

时光机组织副主席

托马斯·艾格纳博士(MAS)是历史学家和档案管理员。他曾担任与文化遗产和数字化相关的高级管理职务:2008年至2023年任国际档案研究中心(ICARUS)主席,现任秘书长,是其国际活动(包括支持数字化活动和数字内容开放获取的跨境及欧盟资助项目)的主要推动者。自2023年起,他成为文化遗产战略和数字化转型各方面的独立顾问。


瓦莱丽·古埃-布鲁内(Valérie Gouet-Brunet)

时光机组织副财务主管

瓦莱丽·古埃-布鲁内博士是法国生态部的研究主任,在法国国家地理研究所(IGN)和古斯塔夫·埃菲尔大学(University Gustave Eiffel)的LaSTIG实验室进行研究工作。她负责领导关于大规模、长期多媒体馆藏内容描述、匹配与索引的研究,重点在于图像及其结构化、探索和空间化,并应用于文化和自然遗产领域。她曾领导一个关于计算机视觉、摄影测量和遥感技术用于地面与航空影像(MATIS)的研究小组,并在18个欧盟和国家研究项目中担任领导角色,其中大多数项目致力于推广地理图像遗产、智慧城市和土地利用,合作伙伴包括国家博物馆、中小企业以及信息和通信技术与航空航天领域的大型集团。

目前,她正协调ALEGORIA项目(法国国家研究机构ANR,2018-2021),并担任法国模式识别与解释协会(AFRIF)指导委员会成员以及巴黎圣母院修复科学基地“数字数据”工作组成员。

运营团队成员

阿格内什·泰莱克 (Ágnes Telek)

社交媒体专员


安东尼娅·博比克 (Antonia Bobik)

传播专员


阿蒂尔·布于克布尔克 (Atil Büyükburc)

项目经理


贝亚特丽切·瓦伊恩特 (Beatrice Vaient)

地方时光机项目经理

卡罗琳·马克西莫夫 (Caroline Maximoff)

行政专员 / 传播专员


丹尼尔·耶勒 (Daniel Jeller)

首席技术官


尤哈·亨里克松 (Juha Henriksson)

合作伙伴关系经理


克尔斯廷·穆夫 (Kerstin Muff)

首席传播官


凯文·鲍默 (Kevin Baumer)

项目经理


曼努埃尔·埃伦费尔德 (Manuel Ehrenfeld)

软件工程师


理查德·约斯 (Richard Joos)

项目经理

合作团队

“时光机”的项目合作者为该项目提供了最精尖的专业知识、技术和创新思维。该项目得到了来自50多个国家、超过700家机构的支持,其中不乏顶尖的学术研究机构、文化遗产机构、民间社会组织、GLAM机构(美术馆、图书馆、档案馆、博物馆)以及私营企业等。他们共同应对项目实施中的挑战,提供文化、历史和地理方面的素材和专业知识,同时也推动“时光机”的架构和服务等方面的发展。


最新项目与资源

1

文化遗产数据空间的3D大数据——“3DBigDataSpace”

  • 运行时间:2025年2月1日 – 2026年7月31日

  • 征集计划:DIGITAL-2023-CLOUD-DATA-AI-05

  • 行动类型:DIGITAL Simple Grants

  • 项目编号:101173385

多年来,高质量3D内容的稀缺一直是文化遗产领域扩展现实与3D应用发展的瓶颈。尽管大规模数据集变得更容易获取,但由于质量参差不齐、元数据碎片化以及互操作性不足,其可用性仍然受限。

3DBigDataSpace项目旨在通过显著增加欧洲共同文化遗产数据空间中高质量3D模型的可用性,彻底改变3D文化遗产的格局。 通过整合来自多个提供方和聚合机构的数据集,该项目将为3D模型及其相关数据(如原始模型、传感器原始数据和3D查看器衍生文件)建立稳定、长期的存储解决方案。

为了最大限度地提升这些海量3D资源的可用性,项目将采用人工智能驱动的数据增强技术,以提升内容的可检索性、情境化和可复用性。这些增强后的数据集将成为3D虚拟与增强现实查看器以及4D世界应用的基础,为沉浸式遗产体验开辟新的可能性。

2

3D-4CH:文化遗产3D在线能力中心

  • 项目运行时间:2025年2月1日 – 2028年1月31日

  • 征集计划:DIGITAL-2024-CLOUD-DATA-AI-06

  • 行动类型:DIGITAL-DATA

  • 项目编号:101195149

“文化遗产3D在线能力中心”项目由欧盟资助,是一项雄心勃勃且具有前瞻性的倡议,旨在彻底改变文化遗产的保存、数字化和共享方式,以造福教育与社会。这一开创性项目将欧盟和乌克兰丰富的历史文化多样性与尖端技术相结合,为数字遗产创新树立了新标杆。该项目以众多有影响力的项目为基础,如先前的欧盟资助项目4CH、欧洲共同文化遗产数据空间项目,以及5Dculture项目,目标在于提升3D数字化和先进技术在文化遗产保护中的作用,并着眼于未来的合作,确保工具、服务和专业知识的生态系统持续发展。

3D在线能力中心不仅仅是一个资源库——它旨在成为一个充满活力的创新、协作与学习枢纽。作为一个完全在线的平台,它将汇聚领先的文化遗产机构、研究人员和实践者,共同释放3D技术的全部潜力。通过利用遗产科学欧洲研究基础设施的广泛网络及4CH项目建立的国家节点,该中心将在四个关键支柱领域产生变革性影响:


  • 培训与能力建设:通过一系列互动在线课程、线下研讨会和沉浸式季节学校,赋能文化遗产专业人士。这些与大学和培训中心合作开发的课程将提供认证,确保参与者既能获得知识,又能得到对其专业能力的正式认可。

  • 服务与工具:提供一系列精心策划的尖端资源,包括3D数字化、人工智能和扩展现实领域的指南、最佳实践和最先进工具。这些资源将支持从教育、研究到旅游和公众参与等广泛的应用,确保广泛的社会影响。

  • 3D部署:倡导创建新的高质量3D文化资产,并提升现有资产的质量。通过整合元数据、衍生数据标准和可持续归档标准,该中心将为构建统一、可访问的欧洲文化数据空间做出贡献。

  • 研究与开发:通过与领先的研究计划合作,并持续探索和采用下一代技术,中心将确保新的方法论能够无缝应用于解决现实世界中的文化遗产挑战。

3

作为网络构建、能力建设和区域间投资创新方法的元宇宙与遗产路线——“MetaHeritage”

  • 运行时间:2025年1月1日 – 2026年12月31日

  • 征集计划:区域间创新投资工具

  • 项目编号:101180388

MetaHeritage项目以虚拟和智慧遗产旅游为主要框架,探索“突破常规”的方法和区域间网络构建的创新可能。从而提升欠发达地区区域创新生态系统的能力,并协调和互联区域间的投资吸引策略与战术。这项由欧盟资助的元遗产项目,将元宇宙等尖端技术与文化遗产相结合,旨在创造新的商业模式、强化区域创新生态系统并促进可持续旅游业发展。

该项目的关键目标包括:

  • 促进可持续增长:将数字创新与遗产旅游及创业相结合。

  • 加强区域协作:连接企业、学术界、政府机构和民间社会,以促进区域间和跨部门的合作。

  • 应对区域差异:为代表性不足的地区提供工具和资源,帮助其接入欧盟创新网络和获得资助机会。

4

ARCHE——欧洲文化遗产研究联盟

  • 项目运行时间:2022年9月1日 – 2025年8月30日

  • 征集计划:Horizon-CL2-2021-HERITAGE-02

  • 行动类型:HORIZON-CSA(协调与支持行动)

  • 项目编号:101060054

ARCHE项目旨在创建一个欧洲范围内的整体性文化遗产研究与创新框架,具体方式是建立“欧洲文化遗产研究联盟”。该联盟将是一个由研究人员、创新者、遗产专业人士、机构组织和公民组成的先锋协调网络。

项目将首先对下一个十年的研究与创新差距和需求进行详细评估,并以此为基础,设计一份“战略研究与创新议程”,旨在提高公众对遗产的认知和欧洲的归属感。同时,将提出一个全新的、量身定制的治理结构,以有效吸纳来自相关科学学科和行业的现有网络与新伙伴。

5

遗产监测器Heritage Monitor

Heritage Monitor 是一个基于科学计量分析的情报平台,旨在通过数据可视化和分析,描绘并推动欧洲文化遗产研究的发展。该平台汇聚了来自 CORDIS、OpenAIRE、ArXiv 和 CORE 等数据源的庞大数据,涵盖超过 17.6 万家机构、9.1 万个研究项目以及 85.6 万项研究成果,以解决文化遗产研究领域长期存在的数据碎片化问题。

网址:https://heritagemonitor.org/

核心目标与功能

其核心目标是将这些数据转化为可操作的战略情报,帮助政策制定者、研究者和机构做出数据驱动的决策,从而塑造文化遗产的未来。

平台围绕5个分析场景构建其功能,以满足不同需求:

  • 资助追踪 :分析欧盟资助的分配模式、地理分布和随时间变化的趋势。这是目前唯一可公开探索的功能。

  • 合作网络 :可视化机构间的合作伙伴关系与差距。

  • 专家发现 :根据可衡量的影响力识别特定文化遗产领域的领先机构。

  • 少数群体研究 :监测与少数群体文化遗产相关的研究代表性。

  • 主题情报 :监测趋势并预测新兴研究领域。


学习资源——时光机学院

时光机学院是旨在促进时光机社群里发展的知识与专业技能交流的学习活动。学院为参与者提供理论及实践培训,指导他们如何将特定工具或流程应用于自身项目数据,学院提供的培训可能涵盖以下内容:

  • 指导制定精准高效档案文献数字化策略的方法;

  • 演示如何运用VR软件解决方案提升博物馆藏品的参观体验;

  • 介绍用于数据提取、分析与存储的前沿工具及代码。

学院结构

每个学院课程包含两到三节独立课节,让参与者能够使用自身项目数据集对工具或软件进行测试,从而实现从理论到实践的过渡。课程安排充足的答疑时间,学员可获得讲师的针对性指导。学院开放给时光机组织成员及本地时光机项目合作伙伴参加。

往期课程

  • 构建你的4D时光机地图集——历史地图数字化

  • 时光机学院:利洛1640——虚拟重建的方法与工作流程

  • Recogito:实现协作式文献标注的在线开源工具

  • IIIF:数字资产库中实现互操作功能的开放标准

  • dhSegment:面向文献分割的通用深度学习方法

最新活动

1.MetaHeritage系列网络研讨会(第三场)

  • 主题:企业欧洲网络(EEN)——通过个性化支持服务实现业务增长

  • 日期: 2026年1月29日,中欧时间10:00 – 11:00

  • 地点: 线上

  • 语言: 英语

该会议将向与会者介绍企业欧洲网络(EEN)——一个帮助各类组织及中小企业实现创新、寻找合作伙伴、获取融资机会并在国际舞台上发展壮大的重要支持平台。通过实际案例和专家见解,重点阐述EEN的服务如何使文化遗产机构及相关企业受益。

2.ECSA 2026:第六届欧洲公民科学社群盛会

  • 主题:中心与边缘之间的公民科学

  • 日期:2026年3月3日至6日

  • 地点:芬兰奥卢,奥卢大学

  • 网址:https://www.ecsa2026.ngo/

  • 语言:英语   

第六届欧洲公民科学协会(ECSA)会议是欧洲最具启发性的公民科学研究者、从业者及倡导者盛会之一。2026年恰逢奥卢市荣膺“欧洲文化之都”称号,由奥卢大学主办的ECSA 2026将汇聚公民科学领域的多元视角,共同探讨科学如何连接跨区域、跨学科、跨传统的社群。

ECSA 2026的核心主题是“中心与边缘之间的公民科学”。该议题彰显了公民科学在不同语境下的丰富多样性——从人口密集的大都市中心到偏远地区及乡村景观。讨论将审视公民科学如何与可持续性、文化、历史、公共卫生、政策、法律体系等领域相交融。

会议详情

  • 会前日(3月2日):ECSA工作组专题会议

  • 学术议程(3月3–6日):通过专题讨论、工作坊及圆桌会议探讨公民科学最新趋势与研究

  • 闭幕式暨主旨演讲(3月6日下午):公开主旨演讲及会议总结

  • 公民科学节(3月6日晚):免费开放的全民庆典,通过互动展览、活动及鼓舞人心的项目展示来庆祝公民科学

  • 考察活动(3月7日):为希望在正式议程结束后探索奥卢及周边地区的参会者提供的自选活动

更多项目介绍请查看往期内容:

以上信息来自时光机项目官方网站:

https://timemachine.eu/

经数字人文资讯小编翻译整理而成

未经许可请勿转载

编译 | 罗斯鹏

校对 | 魏翔

排版 | 洪冰凤


阅读原文

跳转微信打开

专业资讯 | Odeuropa嗅觉遗产项目

2026年1月16日 08:03

2026-01-16 08:03 湖北

Odeuropa项目运用前沿人工智能技术,对横跨四个世纪的欧洲文化遗产文本与图像数据集进行分析,旨在厘清“嗅觉”这一概念在不同语言中的表达形式、与之相关的地域空间、其所表征的各类事件与习俗,以及其所联结的情感内涵。


认知不仅仅是大脑的过程,而是由身体的感官和运动系统共同参与的一种整体性体验。在数字人文研究领域,这一观点更是为研究提供了全新的方法和视角,可用于揭示人类认知与文本、图像、声音等数据体之间的复杂互动。现今时代,数字人文研究已不再局限于文本中心主义,而是向具身认知方向进行探索。

感官是我们通往过往的门户。而所有感官中,嗅觉与人类的情感和记忆有着最为直接的关联。尽管博物馆正逐步意识到多感官展示模式的独特优势,但目前我们仍缺乏相应的科学标准、工具及数据,无法有效界定、整合并阐释嗅觉在人类文化遗产中所扮演的多元角色。正因如此,无论是在物质文化遗产还是非物质文化遗产的范畴内,嗅觉遗产作为一种宝贵资源,其价值都远未得到充分发掘。

所幸,解决这一问题的部分关键先决条件已初步具备。近年来,欧洲文化遗产机构在大规模数字化领域投入了大量资源,如今我们已拥有海量的器物、文本及图像数据,这些数据均可借助先进的计算机科学技术展开分析。目前亟待弥补的短板,是进一步发掘这些数据中蕴藏的丰富历史嗅觉描述、体验与记忆。这既是一项挑战,更是一次机遇。


01 项目简介

Odeuropa项目运用前沿人工智能技术,对横跨四个世纪的欧洲文化遗产文本与图像数据集进行分析,旨在厘清“嗅觉”这一概念在不同语言中的表达形式、与之相关的地域空间、其所表征的各类事件与习俗,以及其所联结的情感内涵。项目团队将依据语义网标准,对这些多模态信息进行整理,并存入“欧洲嗅觉知识图谱(EOKG)”,再结合文化史研究成果,构建全新的“叙事脉络”。

这些叙事资源将针对不同受众,以多样化形式呈现:包括线上版《欧洲嗅觉遗产百科全书》、交互式实验手册演示版本,以及介绍嗅觉博物馆学最佳实践的工具包与培训资料。Odeuropa还将研发全新的、基于实证的方法论,用以量化多感官访客体验的影响,并依托相关数据,推动制定关于嗅觉遗产的认定、推广、展示与保护的政策建议。

Odeuropa项目的核心目标在于证明:深度唤醒嗅觉感知、发掘嗅觉遗产的价值,是串联并推广欧洲物质与非物质文化遗产的重要且可行的途径。

具体目标:

1.  开发研究方法,用于识别并追踪17世纪至20世纪初欧洲多地区、多语言的大规模数字图像与文本资料中有关嗅觉的记载。

2.  创建数字化多感官资源,使不同利益相关方和受众能够自由访问并与项目数据及叙事线索进行互动。

3.  确立并推广可衡量的嗅觉遗产科学标准与最佳实践方案。

4.  为文化遗产专业人员提供嗅觉遗产策略运用的教育与培训。

5.  制定面向文化遗产机构、非政府组织及决策者的政策建议,以助力保护和传承历史与未来的嗅觉遗产。

02 团队成员

项目成员

KNAW人文集群–荷兰,阿姆斯特丹


弗里德里希-亚历山大大学埃尔朗根-纽伦堡(FAU)–德国

布鲁诺·凯斯勒基金会(FBK)–意大利,特伦托

EURECOM–法国,索菲亚安提波利斯

约克大学 – 英国,约克

约瑟夫·斯特凡研究所(JIS)–斯洛文尼亚,卢布尔雅那

伦敦大学学院 – 英国,伦敦

数据标注团队

顾问委员会

Nancy Bell,英国国家档案馆

Rowan Boyson,伦敦国王学院(英国)

Peter de Cupere,哈塞尔特大学(比利时)

Holly Dugan,乔治华盛顿大学(美国)

Alison Heritage,国际文化遗产保护与修复研究中心

Mark Jenner,约克大学近代早期历史(英国)

Asifa Majid,牛津大学(英国)

Karina Rodriguez,英国布莱顿大学

John Shawe Taylor,伦敦大学学院 & 联合国教科文组织(英国)


03 项目介绍

1. Odeuropa Smell Explorer

Odeuropa气味探索器

Odeuropa气味探索器是一款全新的网络工具,专为将气味作为文化现象进行探索而开发。这个可检索的网站能让用户探寻往昔的气味,理解它们如何塑造了欧洲的历史与文化。该气味探索器是由计算机科学家、人工智能专家和人文学者组成的国际团队历时三年深入研发而成。其目标受众包括学者、调香师、遗产保护从业者、艺术家,以及所有对气味世界、嗅觉语言与意象,以及气味在日常生活中所扮演的重要角色感兴趣的人。

(1)  获取方式

网址:https://explorer.odeuropa.eu

其背后的开放获取数据和开源软件可在Odeuropa的GitHub代码仓库中找到。


(2)开发内容

气味探索器中的数据包含来自43,679件绘画、版画、素描等作品的92,149个气味实例,同时还分析了167,029份六种语言(英语、意大利语、法语、荷兰语、德语和斯洛文尼亚语)的公开领域文本资源,总计收录240万个气味实例。

Odeuropa的计算机视觉团队研发了检测图像中气味相关物体的技术。在对5000张图像进行手动标注后,团队训练计算机识别类似的气味相关元素,并运用机器学习技术扩充数据库。由此,计算机能够捕捉“气味来源”(气味物质及带有气味的物体,如香水瓶)、芳香场所和气味相关动作(嗅闻、捏鼻子)。

为了给图像补充气味相关描述及气味体验的记载,Odeuropa的计算机科学团队手动标注了数千本历史书籍,包括小说、剧本、游记、植物学教科书、法庭记录、卫生报告、布道文和医学手册。借助这些示例,Odeuropa开发了一套自动化系统,能够模拟人工标注流程,从文本中识别气味相关信息(谁在何处闻到了什么,以及用哪些特征描述该气味),包括与气味相关的情绪。

Odeuropa的语义网专家利用这些成果开发了用户友好型界面,方便用户检索和浏览气味相关的文本与图像。为此,他们先设计了一套基于事件的本体论,并以知识图谱的形式构建该探索器,按照语义网标准对多模态信息进行整理和存储。


(3)可获取内容

Odeuropa作为首个可以嗅觉为切入点进行查询的数据库,可帮助用户了解有关气味的一系列问题:欧洲最具代表性的气味和气味景观是什么?历史文本中最常提及哪些气味,它们引发了怎样的反响?香丸或混合干花(香薰包)中会使用哪些气味物质?绘画和版画中最常呈现哪些气味相关物品和芳香场所?木质气味是否比果香或动物性气味更受欢迎?“气味见证者”如何描述他们的嗅觉体验?意大利语中的气味词汇与英语、法语、斯洛文尼亚语或荷兰语中的对应词汇是否具有可比性?18世纪在哪里能闻到灵猫香或硫磺的气味?薰香的气味能引发哪些情绪?气味是如何分类的?

大多数网站聚焦于高级香水,而该探索器则能带用户深入探寻各类具有重要意义的气味景观——无论是难闻的还是芬芳的。它能帮助调香师了解气味如何被归类为不同香调家族,以及各类香气承载着怎样的情感;能协助科学家绘制气味分布图;艺术史学家或许能从中发现新的嗅觉寓意与图像志;芳香疗法师可以探寻古老配方。该探索器还会生成关于气味价值的富有见地的引言。总的来说,它为人们汲取往昔的气味智慧提供了独一无二的机会。


(4)数据库浏览与检索

气味探索器提供两种主要的查询方式:

按气味来源和芳香场所浏览

探索器支持浏览550多种气味来源、115个芳香场所和35种嗅觉相关动作,每种类别均设有专门的检索入口页面。“气味来源”页面列出了所有被确认会散发气味的物体和物质,访客可按字母顺序或出现频次排序。点击某一气味来源,将进入该来源的专属页面,包含以下内容:

1.该来源的描述时间线;

2.提及该来源的地理分布图;

3.汇总描述该来源最常用特征的词云;

4.该来源所有文本和视觉呈现的概况。

使用精密搜索环境

在开放式搜索环境中,访客可选择检索文本、图像,或同时检索两者。用户可以搜索“incense(香)”一词(结果将以英语内容为主),也可以搜索“玫瑰”类别(结果将涵盖探索器收录的其他六种语言的相关内容)。搜索范围可进一步按语言、收藏机构、地点(气味被提及的场景)、时间(年份、时期或季节)或情绪等类别缩小。

探索器以卡片或文本片段形式展示搜索结果。每份“气味见证报告”(无论是文本还是图像形式)均会呈现其原始语境:引文出处的书籍,或呈现该气味来源的绘画。通过永久链接,用户可以跳转至收藏该资源的原始数字遗产收藏库。


(5)结果下载与复杂检索

可注册成会员,将搜索结果保存到个人气味图书馆并导出。此外,作为探索器“数据核心”的欧洲嗅觉知识图谱,可通过SPARQL查询端点进行查询。Odeuropa在知识图谱中纳入的词汇表和分类法概述,可为开展风味分析类查询提供切入点。通过运用这些数据集,用户可以提出诸如“在Flavornet数据库的‘气味’列或德拉夫涅克斯146种气味描述词中,能找到哪些与气味特质描述相符的内容?”“山羊的气味在林奈分类法中更常被描述为辛酸味,还是在德拉夫涅克斯描述词中更常被定义为酸败味?”等问题。


(6)数据计算

Odeuropa团队开发了交互式“气味笔记”(Nosebooks),让气味分析变得更加简便。例如,这些气味笔记可生成包含某一特定气味来源相关所有引文的电子表格,列有:气味词汇、气味来源、特质、地点、感知者、时间、影响、前一句、原句、后一句、年份。用户还可以查看这些词汇随时间变化的n元语法使用相对频次可视化图表。此外,用户也可以从个人文本或图像中提取气味信息。

网址:https://odeuropa.eu/nosebooks/ 


2.Encyclopedia of Smell History and Heritage

嗅觉历史与遗产百科全书

“嗅觉历史与遗产百科全书”是一款在线参考工具,汇集了关于嗅觉作为一种文化现象的学术与创意领域专业知识。该百科全书呈现了气味与嗅觉在人类文化遗产及历史中所扮演的广泛角色相关知识。其中精心编撰的关于气味、气味场景、嗅觉主体、嗅觉感受及相关实践的内容,可作为探索嗅觉世界及其文化表征的切入点。条目还链接至Odeuropa Smell Explorer平台,用户可通过与过往的“嗅觉见证者”互动,进一步探索气味轨迹。

(1)获取方式

(2)呈现内容

本百科全书旨在梳理、整合并推广关于气味与嗅觉在人类文化遗产及历史中广泛作用的相关知识。百科全书中的条目与主题脉络均基于“Odeuropa项目”(Odeuropa project)处理的历史文本与图像数据库。项目从这些资料中提取的气味描述可通过其“气味探索者”(Smell Explorer)应用程序查看。因此,百科全书的核心聚焦于1600年至1920年间的欧洲历史。然而,气味无国界之分,许多被视为“欧洲遗产气味”的气息源自世界其他地区,并已融入当地的历史实践之中。为此,百科全书的作者们力求以全球视野审视嗅觉历史。

图:百科全书设计草案

(3)知识组织

百科全书主要包含两类资源:

条目(Entries):由不同领域专家撰写的类似维基百科的描述性内容。每个条目均按核心类别(气味、场所、实践、感受、嗅觉主体)构建,包含可探索的文本、图像及关联数据。

主题脉络(Storylines):即“循嗅探索”式叙事,通过一系列相互关联的主题引领读者探索嗅觉历史。在阅读过程中,用户可切入新的主题,并借助全景地图在过往的气味场景中定位自身。


(4)面向人群

这两类资源均面向学生、教师、学术研究者、博物馆与遗产领域从业者、香水与风味领域专家,以及所有希望深入了解过往气味的人士。同时,它们也旨在成为推动进一步研究的动力,帮助人们思考嗅觉历史所揭示的人与场所、事物之间的隐秘关联。


(5)用户投稿

百科全书倡导关于过往气味及其当代意义的免费开放知识传播。它并非关于嗅觉历史与遗产的完备封闭定论,而是旨在成为支持并推动该领域进一步研究的基石。


3.Olfactory Storytelling Toolkit

嗅觉叙事工具包

图:《嗅觉叙事工具包:博物馆与文化遗产机构气味运用实操指南》封面

书名: Olfactory Storytelling Toolkit: A ‘How-To’ Guide for Working with Smells in GLAMs and Heritage Institutions(嗅觉叙事工具包:博物馆与文化遗产机构气味运用实操指南)

合著者:Sofia Collette Ehrich、Inger Leemans、Cecilia Bembibre、William Tullett、Caro Verbeek、Georgios Alexopoulos、Lizzie Marx、Victoria-Anne Michel

Odeuropa推出的《嗅觉叙事工具包:文博机构与文化遗产机构气味运用实操指南》,专为文物保护人员、策展人、教育工作者、导游、博物馆馆长、档案管理员、图书管理员,以及所有有意在文化遗产场景中运用气味元素的人士打造。该指南是一份实用资源,为从业者在策展实践中以气味为叙事手法提供理论基础,同时提供一套完整流程方法,助力从业者将馆藏实物中的嗅觉元素转化为可与访客互动的嗅觉叙事体验。

指南不仅分享了构建优质嗅觉叙事的技巧(以及发掘相关叙事线索的切入点),还详细阐述了嗅觉叙事的实操要点,包括:借助气味漫步活动与驻馆气味研究员发掘嗅觉相关展品及空间;在博物馆场景中呈现与散发气味的最佳实践;与调香师合作创制文化遗产主题气味;以及在文博机构环境中开展风险评估的具体方法。整份指南由Mijke Wondergem设计。

图:《嗅觉叙事工具包》实物图

嗅觉叙事工具包内容主要包括“嗅觉叙事策展/气味与馆藏的关联构建”“文化遗产主题气味创制”“嗅觉主题活动设计”与“风险评估”四大方面。这份可下载的实操指南配套11项实用资源,包括可填写的工作表单与操作准则,为文化遗产从业者提供了一套有力工具,帮助他们通过气味解读馆藏价值。

图:《嗅觉叙事工具包》内容概览


4.Odeuropa Heritage Smell Library

遗产气味图书馆

遗产气味图书馆是Odeuropa项目的一项倡议,旨在记录和保护具有历史意义的气味,助力具有重要文化价值的气味资源实现保存、记录与传播。馆内收藏着一系列被认定为对特定文化群体、社群及个人具有重要意义的气味。国际香水档案馆 Osmothèque负责实体气味样本的储存,并为日后研究提供样本查阅服务。遗产气味图书馆于2023年11月28日正式启用,旨在。Odeuropa并非唯一致力于遗产气味研究的项目:近年来,国际香水档案馆奥斯莫泰克、各大高校科研团队、文化遗产机构、调香师及嗅觉艺术家均已开始探索气味复原方法,尝试还原历史气味的风貌。相关案例包括“气味档案库”“寻觅消逝的芬芳”“遗产之味”等项目,以及海牙莫瑞泰斯皇家美术馆、马德里普拉多博物馆、巴黎卢浮宫等机构举办的嗅觉主题特展。

图书馆首期馆藏包含19种由Odeuropa项目研发并分析的气味。开馆后,将由专门成立的顾问委员会对新增气味藏品的申请进行审核评议。其中12款馆藏气味样本,还将纳入Odeuropa×国际香料香精公司(IFF)联名气味套装对外展出。

遗产气味图书馆不仅收藏历史气味的实体样本,还为每一款气味复原品提供详尽说明,阐释其背后的文化价值。国际香水档案馆Osmothèque会应申请,向访客开放气味样本体验服务;各类文化遗产机构也可将这些气味复原品用于展览展示。

(1)研究方法

Odeuropa项目的核心目标,是提升公众对(非物质)文化遗产的认知,并扩大其社会影响力。因此,馆内所有遗产气味藏品均需附带详细的文化历史价值说明文档。这一要求至关重要,原因如下:

  • 档案留存:Odeuropa致力于为未来的学术研究,留存具有文化意义的气味样本。

  • 资源复用:未来,美术馆、图书馆、档案馆与博物馆等文化机构(GLAMs)及其他相关方,均可合理利用这些保存完好的遗产气味资源。

  • 科普传播:帮助公众更系统地积累嗅觉知识,而非仅仅提供沉浸式的气味体验。

上述目标的实现,需要建立一套统一的气味研发标准。目前的挑战在于,遗产气味及其研发流程尚无公认的专业术语体系。为此,Odeuropa正牵头构建相关框架体系,国际香水档案馆奥斯莫泰克也同步开展气味命名规范的研究工作。


(2)遗产气味图书馆——首期馆藏(2023年)

  • Waterloo (滑铁卢)  

  • Beuning Room (伯宁房间)  

  • Canal (运河)  

  • Cheese (奶酪)  

  • Civet (灵猫香)  

  • Frankincense (乳香)  

  • Helene’s Gloves (海伦的手套)  

  • Hell (地狱)  

  • Liberty Smells (自由的气味)  

  • Linden Tree (椴树)  

  • Myrrh (没药)  

  • Odeuropa Olfactory Logo (欧德欧罗帕嗅觉标志)  

  • Orange/Blue (橙蓝调)  

  • Piège (陷阱)  

  • Pleasure Garden (乐游园)  

  • Pomander (香丸)  

  • Rosemary (迷迭香)  

  • Royal Car PB5 (皇家座驾PB5)  

  • Tanned Leather (鞣制皮革)

以上内容来自Odeuropa官方网站:

https://odeuropa.eu/

经数字人文资讯小编翻译整理而成

如需转载请后台私信联系

编译丨洪冰凤

校对丨罗斯鹏

排版丨魏翔


阅读原文

跳转微信打开

专业资讯| 法之善友(Dharmamitra):古亚洲语言翻译与数字文献学的开放工具

2026年1月9日 08:31

2026-01-09 08:31 湖北

法之善友(Dharmamitra)是一个元平台(meta-platform),整合了最先进的自然语言处理(NLP)、光学字符识别(OCR)、信息检索与互文性探索等模块,旨在为研究古代亚洲语言——包括梵语、巴利语、文言文与藏文——的学者与研究者提供开放支持。

01 项目简介

法之善友(Dharmamitra)是一个元平台(meta-platform),整合了最先进的自然语言处理(NLP)、光学字符识别(OCR)、信息检索与互文性探索等模块,旨在为研究古代亚洲语言——包括梵语、巴利语、文言文与藏文——的学者与研究者提供开放支持。本组织下的所有代码均以宽松的开源许可协议发布,并提供以公共领域或知识共享许可方式开放的大规模数据集。

02  法之善友(Dharmamitra)团队介绍

现任核心成员


Sebastian Nehrdich

联合创办人、项目主任与首席研究员


Kurt Keutzer
联合创办人、战略顾问


David Zorg Allport

人工智能模型开发、自然语言处理研究、数据收集与准备


Hubert Dworczyński
高级全栈工程师


Aminah Borg-Luck
网站开发

前任成员(Former Members)

Vladimir Angirov
梵文数据收集、项目基础设施建设


Shivam Dewan
产品设计师


Jivnesh Sandhan
梵文数据收集与梵文自然语言处理研究


Sujeet Jaiswal
梵文数据收集与梵文自然语言处理研究


现任学生志愿者

Kush Bhardwaj
Kayshav Bhardwaj
Devansh Ojha
Pragun Seth
Pranav Tandra
Vikrant Venkatesan


前任学生志愿者

Frances Belleza
Om Chandran
Aarnav Srivastava
Rohan Sarakinti
Varun Rao
Devika Gopakumar
Miranda Zhu
Siya Mehta
Sanjana Srinivasan
Sai Srinivasan
Rhea Mehta
Raj Mehta
Daksh Parikh
Laksh Patel


03 功能介绍

平台提供了一整套强大且完全免费的工具,专为从事佛典研究、翻译与教学的学者、译者与学生设计。这些工具基于最先进的人工智能(AI)与自然语言处理(NLP)模型,可实现高水平的翻译、语法分析、语义检索等多种研究功能。每项工具都兼具直观性与学术深度,既适合初学者,也能满足资深研究者的专业需求。用户可以浏览各个工具的页面,了解其主要特性与使用方法。

可用工具


a) MITRA Translate(翻译):适用于梵文、巴利语、藏语和古典汉语的神经机器翻译。

b) MITRA Sanskrit Grammar(梵语语法分析):对梵文文本的详细语法分析。

c) MITRA OCR(文字识别):从文献中高精度提取文本。

d) MITRA Search(语义搜索):跨多语言文本集合的语义搜索。

e) MITRA Deep Research(深度研究模式):一种融合上下文的先进翻译模式。

(一)

 法之善友(Dharmamitra)翻译


法之善友(Dharmamitra)平台上提供免费的机器翻译服务。目前,主模型结合了上下文学习与 Gemini API,以实现高质量的古典语言翻译。支持语言方向:

梵语 → 英语

巴利语 → 英语
藏语 → 英语
文言文 → 英语


法之善友(Dharmamitra)主要以英语为目标语言,但对其他语言的支持也在不断扩展。值得注意的是,由于拥有庞大的用户基数,韩语的支持力度也较强。用户可直接上传图片,系统将自动识别图中文字并进行翻译。

英语解释模式当目标语言设为English (Explained) 时,翻译结果会基于专用语法预处理模型,补充额外的语法解析内容。包括:

  • 分词

  • 词形还原(lemmatization)

  • 形态句法分析(morpho-syntactic analysis)

  • 结合上下文的词义注解

独立的多对一翻译模型已开放托管于 Hugging Face平台供研究与使用。

网址:https://huggingface.co/buddhist-nlp/gemma-2-mitra-it


(二)

 MITRA梵语语法分析

(MITRA Sanskrit Grammar)


在法之善友(Dharmamitra)平台上,用户可使用基于ByT5-Sanskrit模型的梵语高级语法分析工具,该功能支持连音分割(Sandhi segmentation)、词形还原(lemmatization)与详细的形态标注(morphological annotation)。

该模型代表了当今梵语自然语言处理(Sanskrit NLP)的最新水平,其错误率较以往模型降低约 50%,接近人类专家标注的准确度。


主要功能

• 连音分割(Sandhi Segmentation):自动识别并拆分复合词及连音结构。
• 词形还原(Lemmatization):确定每个词的基本词形与词典对应条目。
• 语法标注(Grammatical Tags):提供包括格(case)、性(gender)、数(number)、时态(tense)、语气(mood)与语态(voice)等详细形态分析。
• 词汇候选(Lexical Candidates):展示各词可能的多重语义与解释。
• 交互式界面(Interactive Interface):输入梵语文本后点击“grammar”按钮,即可查看完整语法标注结果。

使用方法

1.在法之善友(Dharmamitra)的翻译框中输入一条梵语句子。

2.点击出现的“grammar” 按钮。

3.系统会自动打开侧边菜单,显示包括连音分割、词形还原及语法标注在内的综合语法分析。

4.用户可进一步探索每个词的多义项及形态细节。

技术说明

ByT5-Sanskrit 模型基于Oliver Hellwig所构建的数字梵语语料库进行训练,是当前最先进的梵语语法标注模型之一。

(三)

MITRA 光学字符识别

(MITRA OCR)


在法之善友(Dharmamitra)平台上,用户可使用由Gemini引擎驱动的高速OCR工具,对梵文、藏文与中文印刷体文献进行高精度文字识别与提取。


主要功能

 支持上传最大 100MB 的 PDF 文件。
• 自动转换为 IAST 或 Wylie 转写格式(根据语言类型自动识别)。
• 可直接上传图片,实现截图到翻译的工作流程。
• 与 MITRA Translate 无缝集成,实现从 OCR 到翻译的自动化处理。

团队目前正在研发专为佛典文献优化的定制化 OCR 模型,以进一步提升识别精度与文献适应性。

(四)

  MITRA搜索 

( MITRA Search) 


MITRA Search 是一款专为佛典与古代亚洲文献研究设计的语义搜索引擎。它不同于对话式 AI(如 ChatGPT),更像是一位高度智能化的研究助理。它不仅匹配关键词,还能理解查询背后的语义与概念,从而在庞大的巴利语、梵语、藏语与中文文献库中定位相关段落与思想。

它旨在帮助研究者发现文本之间的关联,定位传统检索方式几乎无法触及的思想线索。


主要功能

  •  超越关键词匹配:基于意义与概念进行检索,而非单纯的文字比对。

  • 跨语言发现:可用英文查询找到梵文段落,或以藏文经句检索中文平行文。

  • 概念与思想导向:可检索抽象观念、隐喻、定义等。

  • 即时解释:快速生成每条结果的语义摘要与相关性说明。

  • 强大筛选功能:精准锁定特定语言、文献集或著作。

  • 与 DharmaNexus 集成:结果可直接跳转至 DharmaNexus 平台,进一步探索文本间的互文关系与上下文。

三步骤使用说明

  1. 提出问题或概念:以清晰的问题或概念描述开始,例如“cetanā 的定义”或“凡夫之苦如掌中毛的比喻”。

  2. 筛选搜索范围(可选但强烈推荐):通过“Show options”菜单限定搜索语言、文献集(如巴利三藏、瑜伽行派文献)或具体著作。这一步是获得高质量结果的关键。

  3. 探索结果:MITRA 将展示相关原文段落。点击每条结果下的“Explanation”按钮,可查看由 AI 生成的摘要、上下文与该段落和查询的关联。点击右上角“expand context”可展开更多上下文内容。

MITRA Search与传统搜索的区别

MITRA Search 并非取代数据库搜索或本地搜索工具(如 GREP),而是提供一种全新的研究体验。它最适合与传统方法结合使用,在语义层面上扩展研究视野。

多语种语义检索的强大能力:凭借广泛的跨语言训练语料,MITRA Search 能在不同语言间识别平行文本。例如,可用中文查询找到对应的藏文段落。通过梵文或藏文查询定位巴利语文本能快速定位巴利《经藏》与汉译《阿含经》中的对应引文——这在过去往往是极为耗时的工作。


获取最佳搜索结果的方式

✅ 效果良好的查询示例
• 定义类查询:如 “the definition of cetanā(意业的定义)”,可调出不同语种中对该术语的定义。
• 具体概念:如 “the 37 wings of awakening(菩提分法)”,可查到经典中有关三十七道品的阐述。若想专看世亲观点,可筛选“Vasubandhu”文献。
• 比喻与譬喻:如 “consciousness compared to a flowing river(识如流水)”,系统能找到语义上类似的段落,即使措辞不同。
• 平行段落:输入整句或整段梵文、巴利文、藏文或中文,系统会检索出意义相近的段落。

 不适用的查询类型与改进方法
• 宽泛的哲学性问题:如 “Summarize the sākāra/nirākara debate(概述有相与无相之争)”。
改进方式:聚焦具体概念,如“外境显现”并限定特定学派。

• 带历史分期的问题:如 “Early Buddhist view on ordination(早期佛教对出家的看法)”。
改进方式:筛选“早期文献集”(如巴利《经藏》或汉译《阿含经》)后再搜索“出家的功德”。

• 探讨思想演变的问题:如 “Development of ālayavijñāna in Yogācāra(瑜伽行派中藏识思想的发展)”。
改进方式:分多次搜索相关概念,如“种子与藏识”、“染污与藏识”,并限定“瑜伽行派”语料。

💡使用技巧
• 黄金法则:使用筛选器。若不设定筛选条件,系统会在全部语料中搜索,可能掩盖高相关内容。
• 精确匹配与语义匹配:如需查找原句,可打开“exact matches”;若要挖掘语义关联,保持关闭状态。
• 正确使用变音符号(Diacritics):如输入“cetanā”优于“cetana”,可提高匹配精度。
• 研究者的主动性:MITRA Search 提供可能性,而非确定答案。它为你捕捉思想关联,但真正的学术判断仍依赖你的专业理解。


MITRA Search的学术定位

MITRA Search 是数字人文学研究中面向佛典语料的一种跨语言语义发现工具,它不生成文本,而通过智能匹配帮助研究者在浩瀚语料中发现、比对与验证思想脉络,为经论间的互文关系、术语演化与观念传播研究提供新的方法论支持。

(五)

  MITRA 深度研究模式

(MITRA Deep Research)

MITRA Deep Research 是一种高级翻译模式,通过在全语料库中执行深度语义检索,为用户提供整合研究语境的翻译体验。它不仅仅是文本的直译,而是将 MITRA Search 与 DharmaNexus 的强大功能结合,为研究者提供更全面的语义分析与文本关联信息。

当在 MITRA Translate 中将目标语言设置为 Deep Research 时,系统将输出带有语义分析、平行语句与学术语境的综合翻译结果。

MITRA Deep Research 尤其适合较短的输入文本。建议每次输入控制在三至四句诗偈,或一段相对完整的散文段落之内。较短的输入通常能获得更高质量的结果。


主要功能

  • 综合翻译(Comprehensive Translation):在翻译过程中融合多语言语料库中的语义检索结果,提升文本理解深度。

  • 平行发现(Parallel Discovery):自动识别不同语言中的平行段落、对应译文与相关文本

  • 语境分析(Contextual Analysis):通过深层语义搜索,揭示概念在整个语料中的表达方式与语义分布。

  • DharmaNexus 集成(DharmaNexus Integration):提供直接跳转链接,探索跨语种的互文关系与思想对应。

  • 专题检索(Topical Queries):支持主题式查询,如“cetanā 的定义”,并提供系统化的文献证据。

  • 基于证据的结果(Evidence-Based Results):所有补充信息均源自 DharmaNexus 的大型数据库。

  • 学术引用整合(Integration of Relevant Secondary Literature):自动检索并引用相关二手文献段落,以强化研究证据。

此模式为研究者提供了远超传统翻译的体验。它结合了潜在相关文献、跨语种平行文本与深层语义上下文,特别适合于严肃的学术翻译、经论研究与跨文本比较工作。

04 MITRA浏览器扩展(MITRA Browser Extensions)

法之善友(Dharmamitra)语言工具浏览器扩展,让用户能够在任意网页上即时访问 Dharmamitra 的机器翻译、语法分析与 MITRA 深度研究(Deep Research) 功能,实现对梵语、巴利语、藏语及佛教汉语文本的无缝翻译与分析。


主要功能

  • 即时翻译(Instant Translation):可直接将网页中选定的梵语、巴利语、藏语或佛教汉语文本翻译为英文。

  • 语法分析(Grammatical Analysis):获取所选文本的详细形态与句法分析。

  • 跨平台支持(Cross-Platform Support):适用于 Chrome 与 Firefox 浏览器。

  • 隐私保护(Privacy-Focused):无任何数据收集与跟踪,所有处理均通过 Dharmamitra API 在本地完成。

  • 便捷集成(Easy Integration):支持任意网页文本选择,包括浏览器内 PDF 文件。

安装方式

Chrome扩展:可 Chrome Web Store下载。
Firefox扩展:可于Firefox Add-ons页面获取。

使用方法

  1. 为浏览器安装 Dharmamitra 扩展程序。

  2. 在任意网页上选择梵语、巴利语、藏语或佛教汉语文本。

  3. 右键点击并选择“Translate with Dharmamitra”,或使用扩展的菜单选项,即可即时查看翻译结果与语法分析信息。


  该扩展以GNU通用公共许可证第 3.0 版(GPL v3.0) 发布,确保其持续开放源代码并永久免费使用。


05 MITRA词典(MITRA Dictionaries)

  梵语-藏语词典(Sanskrit ↔ Tibetan)由60万对平行句(约400万词条)自动生成的梵语↔藏语双向词典,采用StarDict格式,可用于GoldenDict等兼容词典软件。词条来源于大规模平行语料对齐,旨在辅助梵藏对译研究。


可用词典

  • MITRA sa-bo:梵语 → 藏语词典
    下载地址:mitra-dictionary-skt-tib.zip


  • MITRA bo-sa:藏语 → 梵语词典
    下载地址:mitra-dictionary-tib-skt.zip

其他

格式:StarDict(兼容 GoldenDict、StarDict、SDCV 等)
解压后大小:每个方向约10GB
许可协议:CC BY-SA 4.0
下载位置:GitHub仓库dharmamitra-stardict-dictionaries

主要特征

• 从大规模平行语料中自动抽取的双语术语与短语翻译示例
• 采用通用 StarDict 格式,兼容多种词典应用程序
• 基于广泛语料的高覆盖率双语对应关系

使用限制

• 所有短语词条为自动生成,未经人工校订,不保证完全准确或覆盖全面。
• 词边界识别算法仍有局限,部分条目可能存在错误切分。
• 并非人工编辑词典,请谨慎使用。
• 词典体量巨大,总计约 170 万句对生成的数百万词条。

使用方法

  1. 从 GitHub 仓库下载所需词典文件。

  2. 解压至任意文件夹。

  3. 安装兼容 StarDict 格式的词典阅读器(如 GoldenDict、StarDict 或 SDCV)。

  4. 将词典文件所在文件夹添加至阅读器路径即可开始查词。

兼容软件

可与以下软件配合使用:
• GoldenDict
• StarDict
• SDCV(StarDict 控制台版)
• 其他兼容 StarDict 格式的词典程序

适配 Apple Dictionary 的版本正在开发中,即将发布。

梵语-中文词典(Sanskrit ↔ Chinese)梵汉双向词典目前正在编制中。

06  法之善友(Dharmamitra)Emacs 扩展工具

此扩展将法之善友(Dharmamitra)的翻译与语法分析功能直接集成进 Emacs 编辑环境,让用户在写作、研究与文本处理时即时调用梵语、藏语、巴利语与汉语的智能分析与翻译。

主要功能

• 梵语语法分析
• 梵语、汉语、藏语、巴利语文本的英文翻译
• 自动分词与词形还原
• 详细语法标注与词义解析

安装方法

使用方法

1. 选中要分析的文本。

2. 按下C-c g或自定义快捷键)。

3. 结果将显示在名为Dharmamitra Text Grammar的独立缓冲区中,内容包括:

• 原文
• 分词结果
• 词形还原形式
• 翻译(如已启用)
• 详细语法分析

系统要求

• Emacs 版本 26.1 或以上
• curl(用于 API 请求)
• 可访问 dharmamitra.org 的网络连接

MITRA Search for Emacs

dharmamitra-search.el 扩展允许用户在任何缓冲区中选中任意文本,按下一个快捷键,即可通过 Dharmamitra 语义搜索 API 查询跨语言结果(梵语 · 藏语 · 汉语 · 巴利语)。

此功能将 MITRA Search 的主要能力直接引入 Emacs,支持即时浏览 DharmaNexus 全语料库中的平行文本与语义结果。

安装说明

07 MITRA模型(MITRA Models)与API

ByT5-Sanskrit是一款专为梵语自然语言处理(Sanskrit NLP)任务设计的统一型字节级语言模型(byte-level model),在分词、词形还原、形态句法标注、依存句法分析等任务上均达到当前最先进水平。

该模型基于ByT5架构构建,能够直接处理字节序列,无需复杂的分词算法,因而在处理未见词汇或多样化输入时具有极高的鲁棒性。模型训练数据来自 Oliver Hellwig 构建的 Digital Corpus of Sanskrit (DCS),并严格遵循该语料库的注释标准。

论文出处:One Model is All You Need: ByT5-Sanskrit, a Unified Model for Sanskrit NLP Tasks(发表于 EMNLP 2024)

主要特征

• 字节级处理(Byte-level Processing):无需复杂分词,对未登录词表现稳定。
• 多任务学习(Multitask Capabilities):在同一模型中联合训练分词、词形还原与形态句法标注任务。
• 顶尖性能(State-of-the-Art Performance):在多项梵语 NLP 基准测试中超越既有方法。
• 多领域应用(Versatile Applications):可用于语言学标注、信息检索与机器翻译流程中。

模型版本

• 基础模型(Base Model):预训练的 ByT5-Sanskrit 模型已上线 Hugging Face。
• 多任务模型(Multitask Model):针对联合 NLP 任务微调后的模型版本,同样可在 Hugging Face 获取。

Python 软件包

完整推理脚本与应用示例可在 ByT5-Sanskrit Analyzers 仓库中获取,内含多种下游任务实现与使用。


08 DharmaNexus

DharmaNexus 是一个多语种的古典亚洲语言文本数据库,是法之善友(Dharmamitra)平台的基础。它收录并持续扩展巴利语、梵语、汉语与藏语的海量文献,与 MITRA Search 和 MITRA Deep Research 深度集成,提供高级的模糊检索、语义检索与跨语言检索能力。它也是少数能够对大规模梵文文本集合提供检索能力的数据库之一。

除数据库功能之外,DharmaNexus 还提供一个用于探索这些文本互文关系的网页平台,既支持单语环境,也支持多语环境。该功能及其技术基础延续并发展自 BuddhaNexus 项目,采用了现代化算法,将多语匹配与来自 Gemma 2 MITRA-E 的深度语义相似度相结合。


快速入门

DharmaNexus 提供一种简洁直观的方式来探索庞大的巴利语、梵语、汉语与藏语佛典文献集。


1. 选择语言:用户从主界面选择偏好的阅读语言。

2. 选择文本:通过可用的菜单快速定位目标文本。无论是明确知道要找的文献,还是仅进行探索式浏览,DharmaNexus 都提供便捷导航。用户可以按各文献集的类别层级浏览进入,也可以直接输入文本名称或目录编号快速跳转。对于全文与语义检索,用户也可以使用 MITRA Search,直接跳至感兴趣的具体段落。

3. 阅读与导航:平台会在一个清爽的阅读视图中打开用户选定的文本。用户可以通过滚动浏览内容;按标准编号系统跳转到具体章节(例如 SuttaCentral 编号、Taishō 大正编号,或德格版页码编号);通过“change text”选项再次打开主菜单并切换到其他文本。

4. 视图自定义:可在原文字体与罗马化转写之间切换阅读。


互文关系探索的工作方式

(How Intertextuality Exploration Works)

DharmaNexus 帮助用户在巴利语、梵语、汉语与藏语文本的内部及相互之间发现互文联系。


1. 查看匹配:阅读时,用户可以切换“Show Matches”开关来显示互文匹配。启用后,DharmaNexus 会在文本中高亮与数据库中其他文本相似的段落。

高亮采用颜色编码,形成“热度图”,用来展示文本任一点位的互文密度。从冷色到暖色表示匹配的密集程度递增;高亮内的数字显示该片段的匹配条数:数字“1”表示存在一处匹配,“2”表示两处,以此类推。它能让用户快速把握全篇互文的“厚度”。

Heat map themes in DharmaNexus(热度图主题示例)


点击一段高亮文字后,系统会在新的列中显示与之匹配的其他文本。将鼠标悬停在某条平行段上,会同步高亮源文本中的对应片段。点击某一条具体的平行段,将在第三列打开该文本,便于并排比读。


2. 过滤结果:可以通过以下筛选器收窄匹配范围。

• 相似度分数(Similarity Score):控制判定为匹配所需的相似程度。100 表示逐字一致的完美匹配;分数越低,差异越大,从而展示语义相似但并非逐字对应的段落。
• 匹配长度(Match Length):设定作为平行段的最小字符数。查找偈颂可设置较短阈值;检索散文可设置较长阈值,以确保匹配具有实质性。
• 限定或排除(Limit or Exclude):通过包含或排除特定文献集或文本来聚焦范围。例如,可以排除所有注疏,只查看正藏内部的平行关系。


3. 选择视图:DharmaNexus 提供多种结果呈现方式:

• 文本视图(Text View):默认模式,在原文中直接高亮显示匹配。
• 表格视图(Table View):将所有匹配以可排序表格展示,并可导出为电子表格。
• 图形视图(Graph View):以直方图可视化所选文本的匹配分布,展示哪些其他文本或文献集包含最多的平行段,帮助你一眼识别最相关的关联。
• 编号视图(Numbers View):使用标准编号系统来定位巴利与汉文文本中的匹配。

其他说明

• 在默认设置下,DharmaNexus 的匹配高亮是关闭的;需要手动打开相应开关才能看到匹配。
• DharmaNexus 采用更适合阅读的默认配色方案,与 BuddhaNexus 的配色不同。可以在侧边栏菜单将主题设置为“vivid”,以恢复 BuddhaNexus 的配色风格。
• 与 BuddhaNexus 不同,DharmaNexus 本身不再内置搜索引擎,而是依赖 MITRA Search,从而可以对整个 DharmaNexus 数据集进行精确与语义层面的检索。
• 目前 DharmaNexus 尚未包含CBETA大藏经中的X部分;此部分将于未来版本加入。
• 在藏文方面,未来数月内将陆续新增 rin chen gter mdzod、rNying ma rgyud ’bum、rNying ma bka’ ma 等诸多资料。


底层数据

巴利语(Pāli)
• 核心三藏文本(经、律、论)来自 SuttaCentral 的 bilara-data 分段文本,这使得与 SuttaCentral 的精确链接成为可能。
• 注疏文献(Aṭṭhakathā)、疏(Ṭīkā)与其他作品(Anya)采用 Vipassana Research Institute(VRI)发布的 Chaṭṭha Saṅgāyana 版本。
• 完整的巴利语数据可在GitHub获取。

梵语(Sanskrit)
• 语料来自多个学术项目:
– Göttingen Register of Electronic Texts in Indian Languages(GRETIL)
– Digital Sanskrit Buddhist Canon(DSBC)
–Muktabodha Indological Research Institute
– SuttaCentral

  法之善友项目内还开展了独立的数据收集工作,因此梵文语料正在持续增长。项目团队正集中开发一个元数据目录,将为每一部文本提供详细的来源标注。

汉语(Chinese)
• 汉文语料来自中华电子佛典协会(CBETA)。
• 完整的汉文数据可在 GitHub 获取。

藏语(Tibetan)
• 藏文语料来自多个来源,包括 Asian Classics Input Projects(ACIP)的藏传佛教大藏以及 Tsadra Foundation 的 Dharma Cloud。
• 我们与 Tsadra Foundation 紧密协作,将在后续逐步加入如 rin chen gter mdzod、rNying ma rgyud ’bum、rNying ma bka’ ma 等大型文献集。
• 完整的藏文数据可在 GitHub 获取。


技术背景

• 对于来自多个文本集合的梵语文本,DharmaNexus 使用 ByT5-Sanskrit 模型进行分词(详见梵语数据说明);这些文本随后被索引到MITRA Search,而后者能够访问DharmaNexus的所有数据。

• 对于藏语,团队采用一种基于替换规则的词干提取器,该方法以Paul Hackett的《Tibetan Verb Lexicon》为基础工作。
• 对于巴利语,我们使用略作改动的 ByT5-Sanskrit 模型来进行分词。
• 对于汉语,团队使用 Elasticsearch 提供的标准分析器。
• 除了基于词元的检索,DharmaNexus 还可通过 MITRA Search 在句子与段落层级使用深度语义嵌入进行检索。

有关DharmaNexus的常见问题,参见主FAQ文档中的 DharmaNexus专章。网址:https://dharmamitra.github.io/dharmamitra-guides/faq/#mitra-search-dharmanexus


09  数据集

法之善友(Dharmamitra)开发并托管了多个大规模数据集,这些数据集不仅是训练本平台模型的核心资源,也为其他研究者提供了可用于文献学研究、机器翻译与语义分析的开放数据基础。


MITRA-parallel

MITRA-parallel 是一个面向梵语、佛教汉语与藏语的大规模句对齐平行语料库。该数据集包含 174 万对平行句,专为机器翻译与语义检索研究设计。

出版信息(筹备中):MITRA: A Large-Scale Parallel Corpus and Multilingual Pretrained Language Model for Machine Translation and Semantic Retrieval for Pāli, Sanskrit, Buddhist Chinese, and Tibetan

许可协议:CC BY-SA 4.0

代码仓库:dharmamitra/mitra-parallel


SansTib

SansTib 是一个梵语—古典藏语平行语料库,通过自动化句级对齐构建。语料约含 31.7 万对平行句(317,000 sentence pairs),是开发双语句子嵌入模型的重要基础资源。

出版信息:SansTib,a Sanskrit–Tibetan Parallel Corpus and Bilingual Sentence Embedding Model(LREC 2022)

许可协议:CC BY-SA 4.0

代码仓库:sebastian-nehrdich/sanstib


10  相关出版

2025

· MITRAzheval: Using a Buddhist Chinese Language Evaluation Dataset to Assess Machine Translation and Evaluation Metrics. Sebastian Nehrdich, Avery Chen, Marcus Bingenheimer, Lu Huang, Rouying Tang, Xiang Wei, Leijie Zhu, Kurt Keutzer. Proc. 5th Intl. Conf. on NLP for Digital Humanities, Albuquerque, pp. 129–137. ACL Anthology · DOI: 10.18653/v1/2025.nlp4dh-1.12


2024

· Breakthroughs in Tibetan NLP & Digital Humanities. Marieke Meelen, Sebastian Nehrdich, Kurt Keutzer. Revue d’Études Tibétaines, No. 72 (July 2024, Proceedings of the IATS 2022 Panel), pp. 5–25.

· One Model is All You Need: ByT5-Sanskrit, a Unified Model for Sanskrit NLP Tasks. Sebastian Nehrdich, Oliver Hellwig, Kurt Keutzer. Findings of the Association for Computational Linguistics: EMNLP 2024, Miami, pp. 13742–13751. ACL Anthology


2023

· Observations on the Intertextuality of Selected Abhidharma Texts Preserved in Chinese Translation. Sebastian Nehrdich. Religions, Vol. 14, No. 7, Art. 911. DOI

· MITRAzh: An efficient, open machine translation solution for Buddhist Chinese. Sebastian Nehrdich, Marcus Bingenheimer, Justin Brody, Kurt Keutzer. Proceedings of the Joint 3rd Intl. Conf. on NLP for Digital Humanities & 8th IWCLUL, Tokyo, pp. 266–277. ACL Anthology


2022

· SansTib, a Sanskrit - Tibetan Parallel Corpus and Bilingual Sentence Embedding Model. Sebastian Nehrdich. Proceedings of the 13th Conference on Language Resources and Evaluation (LREC 2022), Marseille, pp. 6728–6734. ACL Anthology


2020

· A Method for the Calculation of Parallel Passages for Buddhist Chinese Sources Based on Million-scale Nearest Neighbor Search. Sebastian Nehrdich. Journal of the Japanese Association for Digital Humanities (Special Issue: Buddhism and Technology), Vol. 5, No. 2, pp. 132–153. J-STAGE


以上内容来自官方网站:

https://dharmamitra.org/

经数字人文资讯小编翻译整理而成

如需转载,请后台私信联系


编译丨魏翔

校对丨洪冰凤

排版丨罗斯鹏

阅读原文

跳转微信打开

年终总结 | 请查收2025年数字人文资讯年度报告

2025年12月31日 13:36

2025-12-31 13:36 湖北

“数字人文资讯”公众号2025年度总结报告

截至2025年12月31日,“数字人文资讯”公众号已经发布501篇推送(其中2025年发布52篇),拥有16890粉丝量,开设了学术前沿、专业资讯、会议通知、新书推荐以及专题荐读五个栏目。

学术前沿


学术前沿板块转载了《“模型落地”和“语境转换”——数字技术赋能下的历史研究》《古籍数字化与传统诗学的范式革新》《古籍数字版本:概念内涵与类型扩展》《大规模文化遗产图像数据化研究》《漫步长安:数字人文时代历史城市的复原与想象》《系统综述:关于文化遗产保护中数字技术应用的现状、趋势和挑战的科学计量分析(2019-2024)》等智慧数据与文化遗产活化利用专题系列文章。

《数字人文与文学批评的互文性表达及AI生成式诗学构建》《从数字人文到AI人文:人文研究范式的变革》《生成式人工智能驱动的哲学社会科学研究范式转型》《超越数字摇篮本:AI时代出版物创新的基本要求与技术逻辑》《超越文本中心主义:多模态技术驱动下的中文数字人文转型》等文章聚焦于AI驱动的范式革新与前沿探索,体现学科交叉特性的创新研究。

《转型与破局:建设面向哲学社会科学的数智学术基础设施》《专家知识数据化与文科智能》《21世纪的数字人文学科:以数字材料驱动》《数字技术赋能古典知识传播——访英国伦敦大学学院数字人文荣休教授西蒙·马奥尼》等文章重点关注了支撑人文社科研究的底层技术架构、数据资源建设和知识体系重构,进行了数字学术基础设施与数据化基础等全新探索。

《文化遗产中气味景观的信息揭示与数字营造:概念、框架与方法》《设计、数字人文与文化遗产的信息可视化》《数字出版叙事的量化方式及应用初探》则在多模态表达与可视化叙事方向有了新的发现。

与此同时,“数字人文资讯”进一步拓展了国际视野,聚焦领域内高质量国际期刊,选取了相关文章,并整理介绍研究主要内容。除《数字人文季刊(DHQ)》《数字人文学刊(DSH)》《文化遗产杂志(JCH)》等数字人文领域期刊以外,本年度新增了《数字研究(Digital Studies/Le champ numérique)》《国际数字人文期刊(IJDH)》系列文章的推介,体现出数字技术在文化遗产保护等跨学科领域,以及数字人文实践等相关议题中的深度应用,展示了数字人文的学科交叉特性。


图:前沿期刊logo、封面总览(部分)

专业资讯


专业资讯板块介绍了多个数字人文研究中心,本年度依旧关注国内外人文社会科学实验室建设。围绕实验室资源、核心成员、典型科研项目、学术出版物成果介绍了罗格斯大学数字人文中心(Rutgers DHI),从成立背景、团队成员、核心服务、突出项目与学术出版物的角度介绍了德国图宾根大学(University of Tübingen)数字人文中心,并结合最新活动内容,从现行团队、服务内容、重要项目的角度介绍了比利时根特大学数字人文中心(GhentCDH)的最新动态。此外,该板块还介绍了谢菲尔德大学数字人文研究所(DHI),内容涵盖研究所核心服务、成员简介、技术与基础设施、出版物以及各类数字人文项目等多个方面。

图:谢菲尔德大学数字人文研究所logo

数字人文协会在该板块也是不可忽视的重点。基于往年的内容,今年新增对欧洲数字人文协会(The European Association for Digital Humanities)的介绍,介绍内容从协会的目标、出版物拓展到协会的关联与合作组织,此外,还涉及协会的突出项目,展现了欧洲数字人文协会作为欧洲数字人文领域汇聚者和代表者的特点

图:欧洲数字人文协会(EADH)logo

该板块亦详细介绍了多个数字人文项目。如:

1


非营利组织CyArk通过数字化技术保护和传承世界文化遗产,通过构建基于地理位置的网络平台、移动应用和沉浸式体验,让更多人与文化遗产建立深度连接。

2


2024年数字人文奖数据可视化项二等奖(DH Awards 2024 DH data visualization)作品第二名——见树亦见林(To See the Tree and the Forest)项目运用数字人文技术,对安东尼奥·拉莫斯·罗萨(António Ramos Rosa,1924-2013)的全部作品实施文本计算分析与可视化呈现。

3


南洋华人宗教遗址GIS数据库项目系统地整合、保存并开放有关东南亚及相关地区华人宗教与社会文化史迹的空间信息数据(GIS),帮助研究者直观探索、分析华人宗教网络、庙宇分布及社群活动在“南洋”这一历史地理图景中的演变与现状。

4


用于文化遗产数据空间的3D大数据(3D Big Data for the Data Space for Cultural Heritage)项目则整合欧洲5万余件3D模型,利用人工智能为3D文化内容构建稳定、长期且可互操作的存储解决方案。

5


被CVPR2025收录的视觉骨干模型vHeat则利用“热传导”的物理原理来模拟图像中语义信息的扩散与关联,为古籍文献的自动识别、版面分析,与碑刻拓片、壁画、佛像、绘画、手稿等文化遗产的数字化研究提供了智能化支撑。


图:用于文化遗产数据空间的3D大数据(3D Big Data for the Data Space for Cultural Heritage)项目


与此同时,“数字人文资讯”紧跟数字人文国际动向,收集并宣介了数字人文国内外资讯,包括DH Awards 2024国际数字人文奖获奖情况,2025大学生 “AI × 国学” 创新实践大赛通知,武汉大学首席数据官(CDO)高级研修班招生简章等重磅通知,为公众了解数字人文领域资讯提供了重要窗口。

会议通知


在会议通知方面,转载分享了:

  • “数字摇篮本:当代电子书的功能、结构与形式景观”工作坊

  •  “2025第四届东亚古籍数字人文国际论坛”“2025年数字人文全球华人博士生论坛”的会议资讯

  • “DH2026:Engagement联结”的征稿通知

  • 在中国索引学会指导下,2025中国数字人文年会以“人文智变:数字人文的智慧奇点”为主题,于12月1日在中山大学举行并圆满落幕

新书推荐


新书推荐板块介绍了《多语言数字人文》(Multilingual Digital Humanities)、《数字文化遗产:挑战、解决方案与未来方向》(Digital Cultural Heritage:Challenges,Solutions and Future  Directions)、《数字时代的记忆研究:跨学科视角》(Memory Studies in the Digital Age: An Interdisciplinary Perspective)、《文化遗产领域的3D研究挑战 第五册——数字化中的副数据、元数据和数据》(3D Research Challenges in Cultural Heritage V——Paradata, Metadata and Data in Digitisation)、《副数据:记录数据创建、管理和使用》(Paradata:Documenting Data Creation, Curation and Use)、《算法史学:人工智能与历史研究的未来》 (History by Algorithms: AI and the Future of Historical Research)、《二十一世纪的数字化文本编辑与出版》(Digital Editing and Publishing in the Twenty-First Century)共7部书籍。

图:《算法史学:人工智能与历史研究的未来》封面


其中,由施普林格卡姆出版社(Springer Cham)于2024年12月出版的文化遗产领域的3D研究挑战——第五册数字化中的副数据、元数据和数据(3D Research Challenges in Cultural Heritage V——Paradata, Metadata and Data in Digitisation)一书,作为系列丛书《计算机科学讲义》(Lecture Notes in Computer Science)的一部分,收录了一系列聚焦于文化遗产领域3D数字化技术的论文,聚焦于数字化过程记录的各个方面,即与元数据(metadata)伴随的“副数据”(paradata),对数字遗产资源的科学严谨性、可重复性和可持续性至关重要,极大地帮助了保存与传播人类历史。

图:《文化遗产领域的3D研究挑战 第五册——数字化中的副数据、元数据和数据》书籍封面


《二十一世纪的数字化文本编辑与出版》(Digital Editing and Publishing in the Twenty-First Century)则针对超越纸本范式、技术整合与方法论革新、可及性与受众拓展、协作模型与新型编辑角色等数字化文本编辑与出版领域的核心议题与挑战,收录了二十篇论文,内容涵盖数字编辑实践中的具体设计流程、对“生于数字环境”(born-digital)材料的多种概念性编辑方法等不同方面,通过强调学术数字版本所蕴含的洞见与知识,以及它们在创新使用中所展现的可能性,进一步凸显了数字编辑成果如何在学术界之外的多种情境中被更广泛地使用、理解与赋予意义。

图:《二十一世纪的数字化文本编辑与出版》书籍封面

专题荐读


专题荐读板块包括“人工智能在古代文本、古典文学及古代文献处理中的应用”以及“手稿研究中的数据集及其研究用途”共2期内容。

其中,人工智能在古代文本、古典文学及古代文献处理中的应用专题收获了广泛关注,该专题选取了10篇代表性外文文章,从生成式神经网络为文本提供语境,到深度模型助力修复与归属判定,从迁移学习破解小众文字翻译难题,到合成数据与深度学习攻克字符识别瓶颈……聚焦人工智能在古代文本、古典文学及古代文献处理中的创新应用,旨在促进数字技术与文化遗产保护领域的交叉融合,激发跨领域合作的新思路与实践。“手稿研究中的数据集及其研究用途”专题同样备受瞩目,在此专题内,小编通过介绍六个手稿研究工具与数据集,为学者们分享了从手稿的物理形态分析到文字识别和信息标注的多层面研究工具,有利于促进跨学科的交流与进步,为数字人文研究所提供视野前瞻与创新思路。

在过去一年中,我们坚定脚步,专注于数字人文领域的前沿理论与实践,传播了丰富而生动的专业资讯。数字人文的兴起正在带来人文研究的范式变革,期待能够与各位同仁在新的一年里,秉承叙事精神,把握时代脉搏,延展文化图景,携手为数字人文研究注入新的活力!

「数字人文资讯」公众号

2025年12月31日

主编 | 王晓光

  

编辑 丨 罗斯鹏

校对 丨 魏翔

排版 丨 洪冰凤


阅读原文

跳转微信打开

专题荐读 | 手稿研究中的数据集及其研究用途

2025年12月26日 13:59

2025-12-26 13:59 湖北

本文介绍六个从手稿的物理形态分析到文字识别和信息标注的工具,以协助学者进行多层面的研究。

Working with Manuscripts: A Guide for Textual Scholars中,Liv Ingeborg Lied与Brent Nongbri将手稿研究的意义放在一个远超文本校勘或版本比较的理论框架中加以阐释,明确指出手稿之所以值得研究,并不是因为它们更接近某个理想化的原文,而是因为它们本身记录了文本在现实世界中被生产、被使用和被理解的具体方式。Lied与Nongbri反复强调,手稿是一种具有物质形态的历史对象,它的纸张、书写材料、版式结构、字形变化、修订痕迹、页边批注、磨损与残缺,都不是可以被轻易忽略的附属现象,而是文本生命史的重要组成部分。正是在这些物质细节中,研究者才能看到文本如何在不同时间、地点和社会环境中被不断重塑。在手稿文化中,文本的稳定性并非默认前提,变化、差异和不一致才是常态,这种状态反映的并不是书写者的失误或技术不足,而是文本在具体实践中被灵活使用的结果。手稿所呈现的文本往往并非封闭完成的成果,而是处于持续生成之中的过程性存在,它们可能因朗读、教学、仪式使用或个人修习的需要而被调整、删减或扩展。

研究手稿的意义在于理解知识是如何在实践中被构建的,而非简单地被复制或传递。通过手稿,研究者可以进入文本的使用史与阅读史,观察哪些段落被反复标注,哪些页面因频繁翻阅而磨损严重,哪些内容被突出强调或悄然忽略,这些现象都揭示了文本在特定群体中的功能与价值。

因此,手稿研究迫使学者重新审视“文本”“作者”和“作品”的概念,因为在手稿文化中,文本往往并非由单一作者在单一时刻完成,而是在多重抄写、修改与再使用的过程中逐渐形成,其边界本身就是开放且可变的。正因如此,两位作者认为手稿研究不仅提供了关于过去文本实践的经验性知识,更具有方法论上的意义,它挑战了以稳定文本为中心的研究模式,促使学者承认差异、噪声与不确定性本身也是历史证据的一部分。数字化与技术手段高度发达的当下,手稿研究的重要性并未减弱,反而更加凸显,因为数字图像与编辑工具虽然扩大了可访问性,却同时可能遮蔽手稿作为物质对象的复杂性。只有在充分理解手稿的物质性与历史处境的前提下,研究者才能避免将数字再现误认为文本本身。

故而,手稿研究视为一种能够不断提醒学者警惕抽象化与简化倾向的实践,其核心意义在于通过具体、脆弱且不稳定的物质对象,揭示文本与知识始终嵌入历史世界之中的事实。目前,多数人文学者在处理手稿时,仍然习惯于使用“一般”的OCR工具来进行初步的文字识别;如前所述,仅仅使用和依赖OCR的缺陷在于学者很容易将文本数字化误认为是再现文本,故而忽略了数字方法在手稿研究领域的深层体现。

基于这些考量,本文将介绍六个从手稿的物理形态分析到文字识别和信息标注的工具,以协助学者进行多层面的研究。

01


VisColl (VCEditor):手稿作为物理的对象

主页:https://viscoll.org/

VisColl (VisColl,Coplation Visualization)是一个用于构建手稿物理装订结构模型并以多种方式对其进行可视化的系统。VisColl 并不以文字识别为起点,而是从手稿的物理形态入手,对写本的装订结构、折页方式与页面关系进行建模与可视化。通过对书帖(quire)、双叶(bifolium)和页序的重构,研究者得以直观理解一部手稿在制作、传抄和后期重组过程中所经历的物理变化。这种以“物”为中心的视角,使文本差异不再只是抽象的校勘结果,而是被重新置于具体的书写与装订实践之中,从而为版本关系、文本流动以及抄写行为提供了更具历史深度的解释框架。VisColl的核心是其数据模型,该模型定义了单部手稿的结构特征,并可由不同工具进行构建与可视化呈现。

目前,VisColl数据模型的最新版本为2.0,于2021年秋季正式发布。VisColl 项目由宾夕法尼亚大学肖恩伯格手稿研究所(Schoenberg Institute for Manuscript Studies)的Dot Porter,以及比利时鲁汶天主教大学(Université catholique de Louvain)的Alberto Campagnolo共同主持,并与多伦多大学图书馆及Old Books New Science实验室合作开展。该项目的现任及前任合作者包括Lynn Ransom、Doug Emery、Patrick Perkins、Jeff Chiu、Gregor Middell和Conal Tuohy。VCEditor是一款基于VisColl数据模型2.0创建手稿结构模型及其可视化的应用软件。该软件免费向公众开放,任何人均可注册账户使用。VCEditor的源代码由宾夕法尼亚大学Kislak特藏中心托管,并发布于GitHub平台 。

VisColl并不是一个以“上传图像并立即得到结果”为目标的即用型平台,而是一套围绕手稿物理装订结构的数据建模与再利用框架,其核心在于将传统文献学中对装订、折页与页序的描述转化为结构化、可计算的数据形式。在实际使用中,研究者首先需要根据手稿的实物或数字影像,手动构建一份装订模型数据,该模型以JSON等机器可读格式记录写本的基本物理单元,如叶片、双叶、书帖及其相互关系。这一过程并不依赖文字内容本身,而是完全建立在对写本物理形态的观察与判断之上,从而确保模型能够忠实反映手稿的制作逻辑与历史状态。

在完成装订模型构建之后,VisColl要求研究者准备相应的图像清单,用以将模型中抽象定义的页码、叶片或折页,与实际的数字图像一一对应。这一“模型—图像”映射步骤在技术上看似简单,但在研究层面具有关键意义,因为它迫使研究者明确区分物理结构、编号系统与数字影像之间的关系,从而避免在分析过程中无意识地将现代编页方式等同于历史装订现实。通过这种方式导入材料,VisColl使图像不再只是被动的视觉证据,而是成为结构化数据的一部分,可被反复调用、对照和重组。

基于已导入的装订模型与图像数据,VisColl提供多种可视化生成方式,将原本只能通过文字描述或脑内想象理解的装订关系转化为可视图形。这些可视化结果本身并不被视为研究终点,而是作为中介工具,用于检验装订假设、发现潜在不一致之处,或比较不同手稿之间在物理结构上的异同。由于所有可视化均直接源自同一套数据模型,研究者可以在修改模型后快速生成新的结果,从而形成一种“假设—建模—验证—修订”的循环式研究流程。

更重要的是,VisColl所采用的数据模型具有高度的可复用性与可移植性。通过将装订信息以标准化数据形式保存,研究者不仅能够在不同项目或工具之间重复使用同一套材料,还可以将这些结构数据与其他数字人文工具或分析方法相结合,例如与版本校勘、书手分析或空间布局研究相衔接。这种以数据模型为中心的导入与使用方式,使VisColl超越了单一软件的范畴,成为一种将手稿物理形态系统性地纳入数字研究流程的方法论工具。

从研究意义上看,VisColl在数据与材料导入层面的设计,明确强调了手稿作为物质对象的优先性,并将这一优先性内嵌于数字工作流程之中。它要求研究者在进入文字识别、内容分析或语义标注之前,先对写本的物理结构做出清晰、可追溯的判断,从而为后续一切文本层面的分析奠定坚实的文献学基础。这种以结构数据为起点的研究路径,也为跨项目比较和长期数据保存提供了可能,使手稿研究不再局限于单次解读,而能够积累为可持续利用的数字知识资源。

02


Dataset Card for CATMuS Modern and Contemporary (McCATMuS)

主页:https://huggingface.co/CATMuS

CATMuS关注的不是单个字符或行文细节,而是文本在手稿中的整体组织方式。它允许研究者标注段落划分、标题、仪式性单元、功能性区块等结构层级,从而揭示文本如何被设计为可阅读、可诵读或可执行的整体。通过强调文本结构而非字词本身,CATMuS有助于将研究重心从“文本内容是什么”转向“文本如何被组织和使用”,这一点在仪式文本、规范性文献或宗教写本的研究中尤为重要。

CATMuS数据集旨在覆盖多种历史时期与书写传统的手稿类型,能够处理从中世纪到近现代的多样化写本材料。其中,medieval数据集主要面向中世纪手稿,涵盖拉丁文及其他历史语言的抄本,适用于研究复杂版面、多书手书写和高度异质的书写传统;modern数据集则聚焦近现代手稿与文书材料,包括行政文献、私人书信及其他近代书写形式,反映了较为稳定但在字体、书写技术和媒介上仍具差异性的文本实践。此外,medieval-segmentation数据集针对版面与行文本分割任务,适合处理多栏布局、边注、插写等中世纪写本中常见的复杂页面结构;medieval-samples则提供精选样本,用于方法验证、教学演示或小规模实验。

此外,该数据集基于多个秉持开放科学理念的机构与研究项目所提供的数据集构建,形成了一个具备良好互操作性的综合语料库,涵盖180余部手稿,涉及8种不同语言。数据集中包含超过118,000行文本、近400万个字符,时间跨度从16世纪早期一直延续至当代。所有数据集均经过自动处理,或在必要时进行人工校正,以确保其符合CATMuS标注规范,相关指南可参见:https://catmus-guidelines.github.io/

03


SOFER STAM / סופר סתם

主页:https://sofer.info/

SOFER STAM项目旨在通过基于文本复用检测的反馈,优化机器学习和再训练流程。主要利用eScriptorium,通过机器学习技术提供手写文档的数字识别功能。eScriptorium是一款基于网页的虚拟研究环境,旨在为手稿与印刷文献的转写工作提供一个整合式的操作空间,用以管理一项完整的转写流程。从图像导入、版面分割到文字转写,各个步骤既可以通过人工方式完成,也可以借助自动化模型加以辅助,并且同样适用于印刷文本与手写文献。该平台以 Kraken作为核心的版面分割与文字识别引擎,使研究者能够在保留书写与版面复杂性的前提下,对文献进行可控的半自动或自动处理。自2019年启动以来,eScriptorium由巴黎高等实践研究院(École Pratique des Hautes Études,隶属于巴黎文理研究大学Université Paris Sciences et Lettres)的AOROC实验室团队负责开发维护,其设计初衷即是服务于手稿文化研究中对方法透明性与学术可控性的需求。

围绕eScriptorium的使用与研究背景,已有学者对其作为手稿文化虚拟研究环境的理论与实践意义进行了系统阐述,例如Stokes、Kiessling、Stökl Ben Ezra、Tissot与Gargem在2021年发表于Classics@Journal的论文中,详细讨论了该平台在手稿研究中的定位及其方法论价值。与之配套的官方文档则旨在帮助不同阶段的使用者逐步掌握平台功能,从初学者到进阶研究者均可根据自身需求进行学习。文档首先通过“快速入门”部分引导新用户理解基本操作逻辑,作为进入更为详尽的功能讲解的入口;随后在“操作指南”中按模块系统介绍各项功能,例如数据导入、模型使用、版面预测与文字转写等关键步骤,以应对平台功能复杂、应用场景多样的实际情况。此外,文档还专设术语说明与常见问题板块,对手写文本识别相关概念及平台中特有的功能进行解释,从而为研究者在具体转写实践中建立清晰而一致的技术与方法认知。

eScriptorium提供了一套围绕转写项目的数据管理与导入机制,使研究者能够在同一工作环境中整合图像、转写文本与识别模型,从而系统性地推进手稿或印刷文献的数字化处理。在实际使用中,研究者可以将手稿或文献图像作为项目的基础材料导入平台,这些图像既可以是单页扫描,也可以是多页文献的批量文件;在此基础上,eScriptorium允许同时导入已有的转写文本(如 TEI、PAGE-XML或其他结构化格式),从而支持从“已有转写再利用”到“从零开始标注”的多种研究路径。此外,平台还支持导入已经训练好的版面分割或文字识别模型,使用户能够直接对新材料进行自动预测,并在结果基础上进行人工校正与迭代优化。

这种导入机制的核心特点在于其高度的灵活性与可追溯性。无论是图像、文本还是模型,所有数据都被明确关联到具体项目之中,使不同阶段的处理结果能够被保存、回溯和比较。在实践中,这意味着研究者可以在同一批材料上反复尝试不同的分割策略或识别模型,并清楚地区分哪些结果来自人工操作,哪些来自自动预测,从而保持方法上的透明度。更重要的是,eScriptorium 并不假设一种固定的工作流程,而是允许研究者根据材料类型(手写或印刷)、版面复杂度以及研究目标,自行决定在何处引入自动化、在何处保留人工判断。

从研究角度来看,这种以“导入—预测—修正—再利用”为核心的数据使用方式,使eScriptorium不仅是一个转写工具,更是一个支持实验性与反思性研究的平台。它鼓励研究者将转写视为一个可被拆解和分析的过程,而非单一结果,从而在处理不同类型手稿时,更清楚地意识到版面结构、书写习惯与技术模型之间的相互作用。这一点对于需要面对复杂书写传统、多书手文本或非标准版面的手稿研究尤为关键。

04


Transkribus

主页:https://www.transkribus.org/

Transkribus是一个用于历史文献数字化、AI赋能的文本识别、转录与检索的综合平台。该平台在两项欧盟资助的研究项目中开发而成,自2019年7月起,由READ-COOP SCE负责维护与持续开发。通过Transkribus可以:

•轻松转录文档(支持手动与自动两种方式);

•训练定制化AI模型;

•使用强大工具检索转录内容;

•为文档添加标签注释;

•开展协同工作;

•将文档导出为多种格式。

Transkribus的突出贡献在于将手稿转写转化为一种可训练、可复用的模型过程,使大规模手写文本的处理成为可能。通过构建针对特定书手或书写传统的识别模型,平台显著降低了长时段、同质性文献的转写成本,并为跨文本检索与统计分析提供了条件。然而,这种效率的提升也伴随着对书写差异与版面复杂性的压缩,因此Transkribus的价值不仅在于其技术能力本身,也在于它促使研究者反思从手稿到“可计算文本”的抽象过程所隐含的认识论前提。

在Transkribus的工作流程中,数据集与材料的导入是整个研究过程的起点,也是其方法论设计的关键所在。研究者首先需要将手稿或印刷文献的数字影像导入平台,这些影像通常以单页扫描或摄影文件的形式组织为文档集合(collections),从而构成一个可被系统管理与分析的材料单元。Transkribus并不将影像视为孤立的输入文件,而是将其明确纳入文档结构之中,使每一页图像都与后续生成的版面信息、文本行和转写内容保持稳定关联。这种导入方式为大规模文献的系统化处理提供了基础,也使材料在不同处理阶段之间保持可追溯性。

在影像导入之后,Transkribus允许研究者基于同一批材料逐步积累和完善转写数据,即所谓的ground truth。这些人工校正后的转写文本不仅作为研究成果的一部分存在,同时也被视为可再利用的数据资源,可直接用于训练新的手写文本识别模型。由此,材料导入不再是一次性的准备步骤,而是一个可以不断“反哺”系统的过程:同一数据集在反复使用中逐渐提高自动识别的准确度,使研究者能够在保持方法一致性的前提下扩展研究规模。

更重要的是,Transkribus在数据导入层面隐含了一种特定的抽象逻辑。通过将原始影像转化为标准化的文本行与字符序列,平台为跨文档检索、统计分析和量化研究创造了条件,但同时也不可避免地弱化了书写差异、版面复杂性和物理特征。这种取舍并非缺陷,而是一种明确的研究立场:Transkribus的数据导入机制本质上是为“可计算文本”服务的,它假定研究者已经接受将手稿材料暂时抽象为文本数据,以换取规模化处理和比较分析的可能性。

从研究意义上看,Transkribus通过其数据集与材料导入方式,使手稿研究第一次在技术层面真正实现了积累效应。文献不再只是被逐页阅读和个别转写的对象,而是可以在同一框架下不断扩展、复用和训练的研究数据。这一转变使历史文献研究得以进入一种介于传统细读与计算分析之间的中间状态,在保持学术可控性的同时,显著提升了处理大规模手稿材料的能力。


05


T-PEN

主页:http://www.t-pen.org/TPEN/

T-PEN并不追求高度自动化,而是强调以人为中心的转写与协作机制。通过行对齐的转写界面和在线协作功能,它为教学、工作坊以及集体标注项目提供了低门槛的实践环境。在这一平台中,转写被视为一种训练研究者阅读手稿、判断不确定性并进行学术协商的过程,而非单纯的技术步骤,从而在数字化流程中保留了传统文献学所重视的细读与讨论环节。

T-PEN的设计初衷是使研究者能够将手稿图像与转写文本数据直接建立明确对应关系,从而在浏览、校对与生成可用文本数据的过程中保持视觉与语义的连贯性。用户在平台中首先选择或创建一个项目,然后将手稿的数字影像作为基础材料调用或上传到系统中,这些图像可能来自与T-PEN联合的数字馆藏,也可以是研究者自行获得且有权使用的图像集合,通过这种方式研究者可以直接在浏览器界面中查看具体的页面图像并围绕每一行文本开展转写工作。T-PEN过自动解析页面版面结构(如自动识别列与行)来辅助用户初步划定文本行,同时也支持用户对这些版面分割进行手动校正,确保转写文本与图像行之间的准确映射,这种行级别的图像–文本结合方式是平台在数据导入阶段的核心机制。

在实际研究过程里,这种导入方式具有重要的学术意义。首先,它将高质量的原始图像与转写内容牢固绑定,使生成的文本不仅是抽象的字符序列,而是可回溯到具体视觉证据的研究数据,这对于古籍校勘、诠释性注释或版本比较具有基础性作用。其次,T-PEN在数据导入与解析阶段即允许对版面结构进行调整,体现了对手稿物理文本布局差异性的尊重,使得研究者在转写过程中能够处理倾斜、密集或不规则的手写文本而非被迫接受单一版式假设。最后,平台提供了多种转写数据导出格式(包括XML/纯文本、PDF、RTF等),使得标注好的文本数据能够被进一步导入到其他文本分析或发布系统中,避免了研究成果被“锁定”在某一工具之内,从而增强了数据的互操作性与长期可利用性。

总体而言,T-PEN的数据集与材料导入设计强调的是以图像为中心的转写路径,它要求研究者在生成文本之前始终保持对视觉源材料的关注,并在此基础上生成可验证、可复用的文本数据,这不仅提升了转写质量,也为后续的语义标注、版本分析或跨项目比较奠定了坚实的数据基础。

06


Recogito

主页:https://recogito.pelagios.org/

Recogito是由Pelagios Network推动开发的开放式语义标注在线平台,用于协作式文档注释,曾荣获2019年开放出版奖(Open Publishing Awards )“最佳开源软件(Awarded Best Open Source Software)”及2018年数字人文奖(Digital Humanities Awards)“最佳数字人文工具(Best DH Tool)”奖项。Recogito为用户提供了一个个人工作区,用户可以上传、收集并整理原始资料(包括文本、图像和表格数据),并协作进行注释与解读。此外,Recogito能帮助用户更轻松地在网络上提升工作的可见度,并以开放数据的形式分享研究成果。其核心目标并非生成新的文本内容,而是将既有的文本与图像材料转化为可链接、可复用的结构化研究数据。

Recogito的研究重点并不局限于文本本身,而是文本如何指向并构建其所处的历史世界。通过对地名、人名和事件的标注与关联,平台将文本内容嵌入到空间与语义网络之中,使研究者能够追踪地理想象、移动路径与知识传播的空间维度。尤其是在处理历史地名、模糊地点或多重指涉时,Recogito提供了一种将不确定性本身纳入分析的方式,从而推动文本研究向空间人文与历史网络分析的方向延展。

在使用流程上,Recogito将“材料导入”视为整个研究工作的起点:研究者首先在个人或项目工作区中创建文档集合,然后将原始研究材料导入平台,这些材料既可以是纯文本文件(如历史文献、旅行记、铭文转录等),也可以是图像文件(如历史地图、手稿页面或其他视觉文献)。导入后的材料会被完整保留其原始形态,并以可视化方式呈现在浏览器界面中,为后续的人工标注提供直接的语境支持。

在数据导入完成后,Recogito并不对文本或图像进行自动分析,而是强调由研究者主导的语义标注过程。对于文本材料,用户可以在原文中直接选取词语或段落,并将其标注为地点、人名、事件或其他自定义实体;对于图像材料,尤其是地图类文献,平台提供了点、矩形与多边形等标注工具,使研究者能够在图像中精确圈定具有语义意义的区域,并为其附加描述性信息。这种“导入即保留原貌”的设计,使 Recogito中的数据始终与其原始语境紧密相连,避免了在研究早期就对材料进行过度抽象或简化。

Recogito在材料导入层面的一个重要特征,是其对外部知识资源的开放连接能力。研究者在导入文本并进行地名标注时,可以将文本中的地点与多个权威地名词典(gazetteers)进行关联,从而将模糊、历史性或多义的地理指称映射到可识别的空间实体。这一过程并不强制消除不确定性,相反,平台允许研究者保留歧义、标注多个可能对应或记录判断过程,使导入的数据集能够真实反映历史文本中空间指涉的复杂性。由此,材料导入不仅是数据输入,更是语义判断与历史解释开始介入的关键环节。

从数据集构建的角度来看,Recogito将导入的材料逐步转化为一种“可扩展的数据层”。每一次标注都会生成结构化的注释数据,这些数据可以被导出为多种通用格式,如CSV、GeoJSON或RDF,用于后续的空间分析、网络分析或与其他数字人文工具的整合。由于这些结构化数据始终指向最初导入的文本或图像材料,研究者可以在不同分析阶段反复回到原始证据,对既有标注进行修订或补充,从而形成一种可持续演进的数据集,而非一次性生成的研究结果。

在研究意义层面,Recogito的数据与材料导入机制体现了一种以“关联”为核心的数字人文方法论。它并不试图取代传统的文本解读,而是通过对材料的结构化导入,使文本中的空间、人物与事件得以被显性标注和系统整理,从而为跨文本、跨媒介的比较研究创造条件。尤其是在涉及旅行、迁徙、宗教传播或知识流动的研究中,Recogito通过其导入与标注流程,使文本不再只是线性叙述,而成为可以被放置在更大空间与语义网络中的研究对象。这种从材料导入阶段就强调可链接性与可复用性的设计,使 Recogito成为连接文本研究与空间人文的重要枢纽。


以上内容由数字人文资讯小编翻译整理而成

部分内容系独立撰写

如需转载,请后台私信联系

编译 丨 魏翔

校对 丨 罗斯鹏

排版 丨 洪冰凤

阅读原文

跳转微信打开

学术前沿丨《数字人文学刊 (DSH)》2025年第4期论文荐读

2025年12月19日 13:58

2025-12-19 13:58 湖北

本期内容选取《数字人文学刊》2025年第4期(Volume 40, Issue 4, December 2025)中的10篇论文进行介绍。

《数字人文学刊》(Digital Scholarship in the Humanities,简称DSH)是一本国际性的、同行评审的期刊,发表关于人文学科中所有数字学术方面的原创研究,包括但不限于当前被称为数字人文学科的领域。该期刊主要发表长篇和短篇论文报告,理论、方法、实验和应用研究以及书评等。本期内容将选取《数字人文学刊》2025年第4期(Volume 40, Issue 4, December 2025)中的10篇论文进行介绍。

Research on the authorship identification of The Tale of Genji based on quantitative analysis Purchased

基于定量分析的《源氏物语》作者身份研究

Huimin Xu , Mingxu Zhu , Shoufeng Sun

01

Abstract: Numerous scholarly contributions have enriched our understanding of The Tale of Genji; however, the question of its authorship remains a subject of debate, with no definitive resolution to date. This study addresses this controversy by employing a rigorous quantitative statistical approach. We conducted a comprehensive analysis of various linguistic indicators within The Tale of Genji, encompassing aspects such as distribution of part-of-speech, function words, word length, N-Grams, and sentence-segments. These characteristic parameters were subsequently utilized to perform principal component analysis, perform non-parametric tests, calculate relative entropy, and assess relative distances. The findings of this analysis reveal a remarkable consistency in writing style between Chapters 43–54 and the preceding Chapters 1–42 of The Tale of Genji. Consequently, the quantitative statistical examination presented in this study provides robust evidence to support the conclusion that a single authorship underlies the entire text of The Tale of Genji, refuting the hypothesis of a second author.

摘要:尽管众多学术成果极大地增进了我们对《源氏物语》的理解,但其作者归属问题至今仍存争议,未有定论。本研究采用严谨的定量统计方法,旨在回应这一争议。我们对《源氏物语》中的多项语言学指标进行了全面分析,涵盖词性分布、功能词、词长、N元语法(N-Grams)和句子片段等方面。随后,利用这些特征参数进行主成分分析、非参数检验、计算相对熵,评估相对距离。分析结果揭示,《源氏物语》第43-54章与之前第1-42章在写作风格上表现出显著的一致性。因此,本研究呈现的定量统计分析为支持《源氏物语》全文为单一作者创作的结论提供了有力证据,驳斥了存在第二作者的假说。

Figure. Non-parametric test of part-of-speech distribution

图.词性分布的非参数检验


Can AI replace experts in the evaluation of cultural heritage? Based on the controlled experiments conducted on six architectural heritages Purchased

人工智能能否取代专家进行文化遗产评估?——基于对六处建筑遗产的对照实验

Yuchuan Wang , Yi Yang , Xueqing Tian , Tao Zhu

02

Abstract:This study investigates the potential of artificial intelligence (AI) to replace human experts in evaluating the conservation status of architectural heritage. Five mainstream AI models were employed to assess six architectural heritage sites in Kunming, Yunnan, China, using 18 evaluation indicators. The AI Evaluation Team (AET) and Expert Evaluation Team (EET) conducted comprehensive assessments, and the results were compared using the entropy weight method (EWM), independent sample t-tests, and kernel density estimations. The findings revealed no significant differences between the AET and EET outcomes, demonstrating that the AI’s assessment capability reached expert-level performance. Moreover, AI exhibits higher efficiency in information acquisition and work processes than human expertise. The objectivity of the AI-generated results was enhanced by the data-driven approach and the use of the EWM for indicator weighting. This study highlights the potential of AI in architectural heritage preservation, enabling the assessment of a larger number of heritage buildings within a shorter timeframe and overcoming the limitations of manual evaluation. The proposed method can be extended to assess various types of cultural heritage and predict future trends, providing a more efficient basis for heritage protection.

摘要:本研究探讨了人工智能(AI)在评估建筑遗产保护状况时取代人类专家的潜力。研究采用了五种主流AI模型,使用18项评估指标对中国云南昆明的六处建筑遗产进行评估。AI评估团队(AET)和专家评估团队(EET)进行了全面评估,并使用熵权法(EWM)、独立样本t检验和核密度估计对结果进行比较。研究结果显示,AET与EET的评估结果无显著差异,表明AI的评估能力达到了专家水平。此外,AI在信息获取和工作流程方面比人类专家效率更高。数据驱动的方法以及使用EWM进行指标权重分配,增强了AI生成结果的客观性。本研究凸显了AI在建筑遗产保护中的潜力,能够在更短时间内评估更多遗产建筑,突破人工评估的局限性。所提出的方法可扩展应用于评估各种类型的文化遗产并预测未来趋势,为遗产保护提供更高效的依据。

Figure. Research process

图.研究流程


Quantifying the faithfulness of poetry translations in four closely related Slavic languages Purchased

量化四种密切相关的斯拉夫语诗歌翻译的忠实度

Martina Rybová , Arthur M Jacobs , Stefan Blohm , Paul Widmer , Barbara Sonnenhauser

03

Abstract:Translating poetry is notoriously difficult—some would claim impossible—because it inherently requires making triage decisions what to preserve and what to sacrifice if necessary. Both form and meaning contribute to the esthetic effects of the original, but translations that faithfully preserve the metrical versification principles of the original might struggle to fully preserve lexically conveyed meanings and connotations, and vice versa. Other esthetically relevant sound-related features (e.g. phonemic patterns) are particularly challenging to preserve. This paper presents a pilot study to empirically test this intuition by assessing the faithfulness of translations to their original. Quantifying aspects of the beauty of sound and meaning, that is, the sonority and the esthetic affective potential, of selected poems and their translations in/from Russian, Polish, Czech, and Slovak, that is, a sample controlled for linguistic and cultural context, we measure the degree to which translations correspond to their originals along these dimensions. The results suggest that, for the poems and languages considered, the beauty of sound and meaning are preserved to varying degrees, which can be sensibly interpreted against specific features of the poems, linguistic distances, and cultural prestige. The study thus serves as a proof of concept that demonstrates the basic feasibility of the method applied and foreshadows its potential for advancing empirical studies in the field of comparative poetics.

摘要:诗歌翻译以困难著称——有人甚至声称不可能——因为它本质上需要进行取舍决策:在必要时保留什么、牺牲什么。形式和意义都对原作的美学效果有所贡献,但忠实保留原作格律的翻译可能难以完全保留词汇传达的意义和内涵,反之亦然。其他与声音相关的美学特征(如音位模式)尤其难以保留。本文通过评估翻译对其原作的忠实度,对这一普遍认知进行了实证检验的试点研究。我们选取了俄语、波兰语、捷克语和斯洛伐克语的诗歌及其互译文本作为受控于语言与文化背景的样本,量化了其声音之美(即音响性)与意义之美(即审美情感潜力),并测量了翻译在这些维度上与原作的契合程度。结果表明,就所考虑的诗歌和语言而言,声音之美与意义之美在不同程度上得到了保留,这可以结合诗歌的具体特征、语言距离和文化声望进行合理解释。因此,本研究作为概念验证(proof-of-concept),证明了所应用方法的基本可行性,并预示了其在推动比较诗学领域实证研究方面的潜力。

Figure. Jitter and violin plots of centered PCC values (y-axis) of modified translations obtained by inverting the order of two successive lines in each modified translation. Red diamonds indicate the mean.

图.通过颠倒每个修改译文中连续两行的顺序所获得的修改译文的中心化PCC值(y轴)的抖动图与小提琴图。红色菱形表示均值。


Application of deep learning for symbol detection on historical maps to explore spatiotemporal changes in the regional tea industry of early 20th-century Taiwan Open Access

深度学习在历史地图符号检测中的应用——探索20世纪初台湾地区茶产业的时空变化

Pi-Ling Pai , Chan-Yu Liu , Chiao-Ling Kuo , Ta-Chien Chan

04

Abstract:Focusing on the early history of the tea industry in Tamsui, Taiwan, this study uses land used data extracted from maps of the 1900s and 1920s to explore the regional characteristics and changes in the distribution of tea plantations. Map symbol detection modeling was performed using Artificial Intelligence deep learning techniques, which have been growing in the field of map research in recent years. Through the constructed symbol detection model, the land use annotation data of historical maps can be automatically retrieved for GIS-based spatiotemporal analysis. Thus, the study presents the impact of global economic panic and the failure of tea exportation in the 1920s on the local tea industry and reflects the tea plantation landscape in response strategies.

摘要:本研究聚焦台湾淡水早期茶产业历史,利用从1900年代和1920年代地图中提取的土地利用数据,探索茶园分布的区域特征与变化。采用近年来在地图研究领域日益增长的人工智能深度学习技术进行地图符号检测建模。通过构建的符号检测模型,可以自动检索历史地图的土地利用标注数据,用于基于GIS的时空分析。因此,本研究呈现了1920年代全球经济恐慌和茶叶出口受挫对当地茶产业的影响,并反映了茶园景观在应对策略中的变化。

Figure. (a) The eight land use symbols of the 1904 map and the 1921 map; (b) the tea plantation symbol detection results in the 1904 and 1921 maps for northern and southern Tamsui, respectively; (c) an error case of model detection symbols: tea plantation; (d) an error case of model detection symbols: cemetery.

图. (a) 1904年地图和1921年地图的八种土地利用符号;(b) 分别为1904年和1921年地图中淡水北部和南部的茶园符号检测结果;(c) 模型检测符号的错误案例:茶园;(d) 模型检测符号的错误案例:墓地。


Natural language processing as Digital Veda (डिजिटल वेद): a humanistic framework for language, ethics, and AI Open Access

自然语言处理作为数字吠陀(डिजिटलवेद):一个关于语言、伦理与人工智能的人文框架

Akshi Kumar , Saurabh Raj Sangwan

05

Abstract:This article conceptualizes Natural Language Processing (NLP) as the Digital Veda (डिजिटल वेद), framing it as a culturally rooted communicative infrastructure inspired by the Vedic tradition of structured knowledge preservation and ethical discourse. Drawing on India’s linguistic and philosophical heritage, it positions NLP not as a neutral tool, but as an evolving ecosystem shaped by human values, language ideologies, and socio-cultural narratives. By mapping the four Vedas to key NLP domains, Rigveda (language modelling), Yajurveda (syntax and pipelines), Samaveda (phonetics and speech), and Atharvaveda (applied AI), the study illustrates how contemporary language technologies mirror ancient systems of meaning-making. It offers a critical, decolonial lens on mainstream NLP, highlighting digital language hierarchies, the marginalization of low-resource Indian languages, and biases embedded in large language model (LLM) training data. The article further proposes a Vedic-inspired ethical AI framework, grounded in the principles of Dharma (righteous design), Ahimsa (non-harm), and Moksha (AI for truth and well-being). This interdisciplinary perspective contributes to a more inclusive, context-aware vision for language technologies, with practical applications in multilingual NLP, bias mitigation, and ethically aligned AI governance. It is particularly relevant for AI ethicists, digital humanists, NLP researchers, and policymakers committed to culturally informed, responsible innovation.

摘要:本文将自然语言处理(NLP)概念化为数字吠陀(डिजिटलवेद),将其构建为一个植根于文化的交流基础设施,其灵感源于吠陀传统中结构化知识保存和伦理话语的理念。借鉴印度的语言和哲学遗产,本文将NLP定位为一个非中性工具,而是一个由人类价值观、语言意识形态和社会文化叙事塑造的、不断发展的生态系统。通过将四部吠陀经映射到关键的NLP领域——梨俱吠陀(语言建模)、夜柔吠陀(语法与流程)、娑摩吠陀(语音学与语音)、阿闼婆吠陀(应用型AI)——本研究阐释了当代语言技术如何映照古老的意指系统(meaning-making systems)。它为主流NLP提供了一个批判性的、去殖民化的视角,揭示了数字语言等级制度、低资源印度语言的边缘化以及嵌入在大语言模型(LLM)训练数据中的偏见。文章进一步提出了一个受吠陀启发的伦理AI框架,其基础是正法(Dharma,合乎道义的设计)、不害(Ahimsa,非伤害)和解脱(Moksha,追求真理与福祉的AI)的原则。这种跨学科视角为语言技术贡献了一个更具包容性、更注重语境的愿景,在多语言NLP、偏见缓解和符合伦理的AI治理方面具有实际应用价值。它对于致力于文化知情、负责任创新的AI伦理学家、数字人文学者、NLP研究者和政策制定者尤为重要。

Figure 5.Hierarchical mapping of Vedic knowledge to NLP: a conceptual diagram showing how the four Vedas align with core NLP domains: speech (Rigveda → language modelling), structure (Yajurveda → syntax), sound (Samaveda → speech processing), and application (Atharvaveda → real-world AI systems).

图5. 吠陀知识到NLP的层级映射:一个概念图,展示四部吠陀如何与核心NLP领域对齐:语音(梨俱吠陀 → 语言建模)、结构(夜柔吠陀 → 语法)、声音(娑摩吠陀 → 语音处理)、应用(阿闼婆吠陀 → 现实世界AI系统)。


On audiences’ feelings and needs of Hero: a digital-intelligent humanities perspective Purchased

论观众对《英雄》的感受与需求:一个数字-智能人文视角

Yiyi Hu

06

Abstract:Audiences’ reviews are critical to the reception study of movies. This article takes the reviews of Hero as an example, and analyzes the reception effect from a digital-intelligent humanities perspective with transformer-based models, especially bidirectional encoder representations from transformers (BERT)-based sentiment analysis and BERTopic modeling, which are generally regarded as the state-of-the-art deep learning models. The results of sentiment analysis show that positive comments of Hero account for 74.42 per cent, while the proportion of negative comments is 25.58 per cent. Besides, the Maslow’s hierarchy of needs theory is employed to further reveal the actual feelings and needs of audiences, including physiological needs (visual and auditory needs), safety needs, social needs (discussion on plots and cultural sharing), esteem needs (themes and emotional expressions), and self-actualization needs (cultural participation, aesthetics, and knowledge extension).

摘要:观众评论对电影的接受研究至关重要。本文以《英雄》的评论为例,从数字-智能人文视角,采用基于Transformer的模型,特别是基于双向编码器表示来自Transformer(BERT)的情感分析和BERTopic主题建模(二者通常被视为最先进的深度学习模型),分析其接受效果。情感分析结果显示,《英雄》的正面评论占74.42%,负面评论比例为25.58%。此外,研究还运用马斯洛需求层次理论进一步揭示观众的实际感受与需求,包括生理需求(视听需求)、安全需求、社交需求(情节讨论与文化分享)、尊重需求(主题与情感表达)以及自我实现需求(文化参与、审美体验与知识拓展)。

Figure. Diagram of the research procedure

图. 研究流程图


Addressing TikTok’s multimodal complexity: a multi-level annotation scheme for the audio-visual design of short video content Open Access

应对TikTok的多模态复杂性:短视频内容视听设计的多级标注方案

Maciej Grzenkowicz , Janina Wildfeuer

07

Abstract:Recent years have seen a growing number of studies devoted to short video platforms, including TikTok. Due to their unprecedented popularity, the question of how meaning is produced in these videos is becoming increasingly important in terms of its social implications. However, systematic approaches to the analysis of these meanings are still scarce. In this article, we present a multi-level, multimodal annotation scheme for the genre of short videos that allows examining of both formal and functional meaning-making elements in these videos. To build this scheme on a firm theoretical and methodological basis, we first characterize the semiotic landscape of TikTok. We then proceed to explain how a combination of several approaches to the analysis of dynamic audio-visual artifacts and multimodal discourses can be useful for the study of short videos. The main part of this article presents a comprehensive annotation scheme for short videos on TikTok, focusing both on the analysis of formal audio-visual elements such as shots, visual objects, sound, and filters, as well as providing annotation categories for the description of content-based units such as events/eventualities and represented participants. We show the reliability of the scheme by testing and evaluating it on a corpus of twenty TikTok videos representing Ukrainian President Volodymyr Zelensky. We conclude the article by sketching possible future applications of the scheme in studies on larger corpora.

摘要:近年来,关于短视频平台(包括TikTok)的研究日益增多。由于其前所未有的流行度,这些视频中的意义如何产生,在社会影响层面变得愈发重要。然而,分析这些意义的系统性方法仍然稀缺。本文提出了一种针对短视频类型的多级、多模态标注方案,可用于考察这些视频中的形式和功能意义构建元素。为了将此方案建立在坚实的理论和方法基础上,我们首先描述了TikTok的符号景观。接着,我们解释了如何结合多种动态视听制品和多模态话语分析方法来研究短视频。本文的主要部分呈现了一个针对TikTok短视频的综合标注方案,既关注对镜头、视觉对象、声音和滤镜等形式视听元素的分析,也提供了对事件/事件性(events/eventualities)和被表征参与者(represented participants)等内容单元进行描述的标注类别。我们通过在一个包含代表乌克兰总统泽连斯基(Volodymyr Zelensky)的二十个TikTok视频的语料库上测试和评估该方案,展示了其可靠性。最后,我们勾勒了该方案在更大规模语料库研究中可能的未来应用。

Figure: Example screenshots for (a) natural adjustment (@therrmann_mom, 21 June 2023, https://www.tiktok.com/@therrmann_mom/video/7247148837897276699); (b) extended adjustment (@tldr360, 31 October 2023, https://www.tiktok.com/@tldr360/video/7295910644715392286); c) extended and cropped adjustment (@politifact, 10 September 2022, https://www.tiktok.com/@politifact/video/7141484403678678318).

示例截图:(a) 自然调整 (@therrmann_mom, 2023年6月21日, https://www.tiktok.com/@therrmann_mom/video/7247148837897276699);(b) 扩展调整 (@tldr360, 2023年10月31日, https://www.tiktok.com/@tldr360/video/7295910644715392286);© 扩展与裁剪调整 (@politifact, 2022年9月10日, 

https://www.tiktok.com/@politifact/video/7141484403678678318)。


A statistical reassessment of rongorongo texts I, Gv, and T: implications for genre and content Purchased

对朗格朗格(rongorongo)文本I、Gv和T的统计再评估:对体裁与内容的启示

Jonas Gregorio de Souza

08

Abstract:The content of rongorongo texts I (Santiago Staff), Gv (verso of the Small Santiago Tablet), and T (Honolulu Tablet) has been debated, with hypotheses ranging from name lists and genealogies to cosmogonic chants. This study analyses glyph collocations in these texts, focusing on their relationship with sign 76. Segmentation of text I reveals that it can be divided into at least two segments, with the second segment sharing glyphs with short inscriptions on personal adornments, indicating the presence of personal names. Additionally, structural and content similarities between Gv and the Atua-Mata-Riri creation chant suggest a need to reassess Steven Fischer’s hypothesis for this specific text. This reassessment implies that text I may similarly contain lists of parents and offspring but including personal names. Finally, it is emphasized that categorizing these inscriptions as genealogies or cosmogonies is not contradictory, as these genres often intermingle in Polynesia.

摘要:朗格朗格文本I(圣地亚哥杖)、Gv(小圣地亚哥板背面)和T(檀香山板)的内容一直存在争议,假说范围从姓名列表和家谱拓展到宇宙创世颂歌。本研究分析了这些文本中的字符搭配(glyph collocations),重点关注它们与字符76的关系。对文本I的分割显示,它至少可分为两个片段,其中第二个片段与个人饰品上的短铭文共享字符,表明其中包含人名。此外,Gv与《阿图阿-马塔-里里》(Atua-Mata-Riri)创世颂歌在结构和内容上的相似性,表明需要重新评估史蒂文·费舍尔(Steven Fischer)针对该特定文本的假说。这一再评估意味着文本I可能同样包含父母与后代的列表,且含有人名。最后,本文强调,将这些铭文归类为家谱或宇宙创世说并非矛盾,因为在波利尼西亚,这些体裁常常相互交融。

Figure. Rongorongo glyphs mentioned in the text and their respective codes (as per the encoding adopted here, adapted from Horley (2021). Drawings by Horley (2021).

图.文中提及的朗格朗格字符及其相应代码(依据此处采用的编码,改编自Horley (2021))。绘图:Horley (2021)。


AIGC empowers the sustainable development of traditional Chinese paper-cut Purchased

AIGC赋能中国传统剪纸的可持续发展

Daoling Chen , Pengpeng Cheng

09

Abstract:This research aims to explore the application of artificial intelligence-generated content (AIGC) technology in traditional Chinese paper-cut design and promote the protection and inheritance of traditional Chinese paper-cut culture. First, the paper-cut works of paper-cut artist are analyzed to extract the characteristic factors of her design styles. Second, based on the characteristics of the paper-cut style, a dedicated dataset for model training is constructed and passed into the fine-tuning network to train and generate a Low-Rank Adaptation (LoRA) fine-tuning model with the design style characteristics of the paper-cut artists. Finally, the paper-cut LoRA model is combined with the stable diffusion model to complete the intelligent design practice of traditional paper-cut. Through experimental verification, the paper-cut model trained in this research can effectively realize the migration design of traditional paper-cut artists’ design style and improve the efficiency of paper-cut design. This research proposes a paper-cut style generation method based on AIGC, which provides a new perspective for the protection and development of paper-cut culture. This method reduces the difficulty of paper-cut design, optimizes the design process, and improves design efficiency, providing technical support for the sustainable development of paper-cut art. At the same time, it also has important significance and value for the digital inheritance and innovation of other intangible cultural heritage.

摘要:本研究旨在探索人工智能生成内容(AIGC)技术在中国传统剪纸设计中的应用,促进中国传统剪纸文化的保护与传承。首先,分析剪纸艺术家的剪纸作品,提取其设计风格的特色因素。其次,基于剪纸风格特征,构建专用于模型训练的专用数据集,并输入微调网络进行训练,生成具有剪纸艺术家设计风格特征的低秩适应(LoRA)微调模型。最后,将剪纸LoRA模型与稳定扩散(Stable Diffusion)模型结合,完成传统剪纸的智能化设计实践。通过实验验证,本研究训练的剪纸模型能有效实现传统剪纸艺术家设计风格的迁移设计,提高剪纸设计效率。本研究提出了一种基于AIGC的剪纸风格生成方法,为剪纸文化的保护与发展提供了新视角。该方法降低了剪纸设计难度,优化了设计流程,提高了设计效率,为剪纸艺术的可持续发展提供了技术支持。同时,它对其他非物质文化遗产的数字化传承与创新也具有重要意义和价值。

Figure. The effect of stylized paper-cut LoRA model generating images under different weights.

图.不同权重下风格化剪纸LoRA模型生成图像的效果

Synergizing structure and semantics: a knowledge graph-transformer framework for narrator disambiguation in hadith networks Purchased

协同结构与语义:一个用于圣训网络中叙述者消歧的知识图谱-Transformer框架

Mohamed Atef Mosa

10

Abstract:Historical transmission chains (isnads) are fundamental to verifying authenticity in Hadith literature, yet narrator identity resolution is a persistent challenge due to onomastic ambiguity and complex naming conventions. While traditional methods lack scalability and modern language models overlook crucial network structures, this study bridges the gap by synergizing structural and semantic information. We introduce a novel hybrid framework that integrates a Knowledge Graph (KG) representing the narrator network topology with a Transformer-based model for deep contextual understanding. Our approach first leverages the KG to generate a high-probability set of candidate identities, then employs a hybrid scoring model to evaluate them based on both global network prominence and local semantic compatibility. Evaluated on the AR-Sanad 280K-v2 benchmark, our method establishes a new state-of-the-art, achieving 97.8% accuracy and significantly outperforming existing baselines. This work provides a scalable, high-fidelity solution for narrator disambiguation, advancing computational methods in Hadith studies and historical identity resolution.

摘要:历史传承链(isnads)是验证圣训(Hadith)文献真实性的基础,然而,由于命名歧义和复杂的命名惯例,叙述者身份解析一直是一个持续的挑战。传统方法缺乏可扩展性,而现代语言模型则忽略了关键的网络结构。本研究通过协同结构与语义信息弥合了这一差距。我们引入了一种新颖的混合框架,将代表叙述者网络拓扑的知识图谱(KG)与基于Transformer的深度上下文理解模型相结合。我们的方法首先利用KG生成一组高概率的候选身份,然后采用混合评分模型,基于全局网络显著性和局部语义兼容性对它们进行评估。在AR-Sanad 280K-v2基准测试上评估,我们的方法树立了新的最先进(state-of-the-art)水平,达到了97.8%的准确率,显著优于现有基线。这项工作为叙述者消歧提供了一个可扩展、高保真度的解决方案,推进了圣训研究和历史身份解析的计算方法。

Figure. System model of the proposed framework.

图. 所提出框架的系统模型


以上内容来自《数字人文学刊(DSH)》官方网站:

https://academic.oup.com/dsh/issue/40/4#2310456-8275996

经数字人文资讯小编翻译整理而成

如需转载,请后台私信联系

编译 丨 洪冰凤

校对 丨 罗斯鹏

排版 丨 魏翔

阅读原文

跳转微信打开

学术前沿 | 古籍数字版本:概念内涵与类型扩展

2025年12月12日 08:01

秦翠玉 等 2025-12-12 08:01 湖北

文章探讨了由载体介质、符号形式、复制技术驱动的古籍数字版本的概念内涵,作为出版物的古籍数字版本与作为数据资源的古籍数字版本的三个层次,体现出独特特征,包括古籍数字化后的版本与古籍原生数字版本类型。

◎ 秦翠玉  雷珏莹  翁梦娟 王晓光*

摘要:中华古籍版本因其载有中华文明印记,具有重要历史文化传承价值,是中华文明与历史的表征,成为透视各阶段文明发展的重要窗口。随着印刷文明逐渐步入数字文明,在古籍数字化工程的推动下,古籍版本在数智时代也经历了概念内涵与类型的扩展。文章探讨了由载体介质、符号形式、复制技术驱动的古籍数字版本的概念内涵,作为出版物的古籍数字版本与作为数据资源的古籍数字版本具有数据层、处理层、呈现层三个层次,体现出符号与载体非依附性、版本整理的开放性、版本数据的智慧化、版本阅读的交互性等特征,包括古籍数字化后的版本与古籍原生数字版本类型。进而探讨了古籍数字版本在支撑古籍版本智慧循证、促进古籍版本活化传播中的意义。

关键词:古籍 数字版本 概念扩展 古籍版本

中图分类号:G255.1

中华古籍版本因其载有中华文明印记,具有重要历史文化传承价值,是中华文明与历史的表征,成为透视各阶段文明发展的重要窗口。从农业文明、工业文明到数字文明,古籍版本也在文明的变换互动中不断发展。古人云“藏之名山,传之其人”,讲的是物质书籍形态古籍版本的收藏与流传。随着古籍数字化的推进,古籍的载体由竹简、纸张转向磁、光、电、芯片等介质,古籍的呈现由书籍印本转向窗口界面为媒介的数字版本,传统古籍版本的概念内涵、类型特征相应发生了扩展。随之也出现了“数字古籍”[1]“数字版本学”[2]“数字文献学”[3]“数字人文”[4]“E考据”[5-6]等新研究领域。以窗口界面呈现的古籍数字版本创新了古籍表达方式与研究范式,并随着数智技术的发展不断呈现新的特征。

一、古籍数字版本概念扩展的驱动

(一)载体介质的演变

古籍版本是载体介质与内容符号的结合体,体现了物质性与文本性的结合。在文明的传承中,物质性的载体与抽象性的内容符号同等重要,通过这些载体在组织化与制度化机制中的物性运作与互动,古籍所蕴含的历史与文化得以在当代社会中固定、传续与延展。从人类出版发展的整体脉络来看,出版载体介质从依赖自然材料的实物形态逐步演变为以数字编码为核心的技术载体,实现了信息记录与跨空间传播的提升。在人类早期的文明中,各类硬质介质如陶片、泥板、甲骨、青铜器、竹简、木牍等被广泛用于记录信息。[7]诸如《论语》《墨子》《老子》《孙子兵法》等春秋战国时期的典籍就是以竹简为载体流传于世。随着社会技术的发展,人类又探索出更便于书写、保存、传播的载体介质,如绢帛、兽皮、植物纤维纸等载体。公元105年,东汉蔡伦改进了造纸术,纸张的发明使得书籍文献能够被大规模复制,极大促进了知识的传播。20世纪80年代,计算机存储技术取得显著进展,只读光盘(Compact Disc Read-Only Memory,简称CD-ROM)等高容量存储媒介开始广泛应用,图书内容也逐渐以二进制代码形式存储于硬盘、光盘、软盘、闪存、云存储及其他计算机存储介质中,借助计算机或类似设备进行信息处理与传递,最终通过屏幕、显示器等数字界面呈现,存储介质与信息呈现界面之间的关系呈现出一种明显的分离特征。伴随着数字技术的不断演化,承载古籍版本的载体介质经历了从传统静态、固定物理实体转向具备“液态”化、动态性及“流质可塑性”[8-9]的数字介质,体现了古籍从“版”到“窗”的版本呈现界面的变革[10],古籍有了多样化的数字版本,如缩微胶卷版、光盘版、电子书、网页版等多种表现形式。

(二)符号形式的变化

版本研究不仅关注书籍的物质形态,更关注版本的内容构成,即文本。通常,一部作品往往存在多个版本,版本数量多于文本数量。在文本的出版传播过程中,经由不同的抄写者、编辑者或出版者可能形成多个版本。在西方校勘学中,“version”一词常指同一文本的几个变体,比如作者出于新的表达意图,对先前的作品进行细微修改,就形成一个新的“version”。由于“变本”(version)的出现[11-12],不同的版本可能已是不同的文本。

书目记录的功能需求(Functional Requirements of Bibliographic Records,简称FRBR)模型明确了作品(work)、内容表达(expression)、载体表现(manifestation)、单件(item)之间的关系,揭示了古籍如何在不同的媒介上以多样的形式呈现。[13-14]根据FRBR模型,作品是指某一部古籍的原始文本或思想,是内容表达的基础。内容表达则是任何形式或性质的符号的独特组合,用以传达古籍内容,并以此进行识别。FRBR模型中内容表达之间的关系分为同一作品内容表达之间的关系和不同作品内容表达之间的关系,前者包括节略、修订、翻译、乐曲改编等,后者包括了作品层面的书目关系类型。[15-16]当内容表达具有显著差异会产生新的作品,如将四大名著改编为影视作品,这种影视作品与古籍原典是一种衍生关系。载体表现则涉及古籍如何在具体的物理或数字媒介中进行呈现,同一著作的版本是在此层面表现,单件则指具体的实例。对于模态不同的同种古籍,一般出现在某种古籍实体的“载体表现”及“单件”层级。[17]依据FRBR模型,任意内容表达可以通过一个或多个载体表现来具体化,一个载体表现也可以具体化为一个或多个内容表达。古籍的数字化使得古籍具有数字版本形态,对于一部古籍,其不同版本的实体经过数字化后形成了不同的数字版本,同一版本的实体经过不同的数字化技术手段处理形成了不同的数字版本。在古籍数字化产生的诸多数字版本的基础上,经过进一步的数字化编辑加工、复制传播,又形成了具有多媒体、多格式、多粒度的多模态特征的原生数字版本。

(三)复制技术的发展

复制技术将表意符号与载体介质深度结合,古籍数字版本也在复制技术的更新迭代中呈现出新的形态。书籍的复制大致可划分为人工抄写、手工印刷、工业印刷和数字生产四个阶段。印刷术之前的书籍复制主要依靠手抄,出现了抄写员、佣书等职业抄书活动。雕版印刷是中国古代的传统印刷技术,人们用这种方法大量刻印佛经、诗集、日历和占卜书等。咸通九年(868年)的《金刚经》是存世最早的带有明确纪年的雕版印刷品,卷首有精美的扉画,技法已相当纯熟。[18-19]随着活字印刷术的发明和普及,尤其是近代西方铅印、石印、胶印等印刷技术的引入,书籍制作所依赖的印版类型不再局限于传统的木刻雕版这一种形式,出版形式更加多样,书籍的版本及其复本复制规模随之显著增长,这一变革标志着现代书籍形式的确立与发展。数字印刷技术的出现超越了物理印版的范畴,其制版工艺与活字印刷有着本质区别,印刷所使用的文字和印版实为展现在计算机屏幕上的数字文件,数字印本得以发展成为图书版本的新类型。[20]随着信息技术的崛起,人类从工业文明走向数字文明,书籍的复制也从传统印刷转向“录入—显示”模式,书籍实现由“版”到“窗”阅读界面的转变[21],数字版本得以直接以数字形态在互联网、终端设备上复制传播。相较于印刷实体的书籍版本,数字版本摆脱了实体的限制与束缚,灵活适应“屏幕”传播,具有磁盘或光盘、网络在线、移动App等表现形式。如《国学宝典》为满足不同读者的差异化需求,提供了光盘版、U盘版、单机版、网络版等表现形式。“识典古籍”针对某一古籍数字版本提供了手机竖屏与电脑横屏两种表现形式。从书写工具、印刷设备到数字编码系统,复制工具的物质性变化引起了书籍实践活动的变化。古籍版本不再仅仅是以印刷为基础的表现形态,更关注被数字媒介所塑造的实践,体现了数字复制技术的特殊性以及在可编程、可计算介质上书籍生产与传播的新方法。

二、古籍数字版本的概念内涵

(一)古籍数字版本的概念梳理

根据国家标准《古籍著录规则》,古籍主要是指“书写或印刷于1911年以前、反映中国古代文化、具有古典装订形式的书籍”。古籍版本,狭义上特指雕版印刷制作的刻本;广义上泛指通过手抄或印刷等复制方法制作而成的古代图书的各种本子,包括写本、抄本、印本等。[22]随着古籍数字化工作的开展,磁、光等介质成为古籍内容的载体材料,出现了“电子古籍”[23],“电子版”的出现拓宽了数字时代古籍版本学研究的视野。[24]构成古籍版本的符号系统、载体材料、复制工具在数字时代也出现了变动,原来以写本、刻本、抄本等形态存在的各式古籍版本,出现了数字版本,古籍版本的概念不再局限于有形之“书”,扩展到可读、可听、可计算的虚拟空间中。

古籍数字版本的概念内涵也逐渐得到学者们的探讨,广义上的古籍数字版本既包括缩微胶卷版、扫描图像版,也包括光盘版、电子版、网络版等文本字符版本,而狭义上的古籍数字版本仅指文本字符型的古籍版本,强调其可编辑性与可检索性。[25]古籍数字化后的版本类型可分为文本型、图像型、图文型三种。[26]可以看到,以上对古籍数字版本概念的理解多从数字版本的表现形式层面进行辨析,探讨古籍版本从书籍实物形态向数字介质的转变。中国国家版本馆指出,“古今中外一切载有文明印记的各类资源,都可以称为版本”[27]。从媒介性来看,版本馆所称的“版本”突破了印刷文明中“书籍印本”的边界,延展至数字文明中的“介质形态”,是以技术形式调节人类文明的重要接口,并最终将其定性为“文明资源”[28]

萨赫尔(Sahle)[29]将数字学术版本定义为“历史文献的批判性表征,无法在不损失信息的前提下被复制”,从这个定义中可得出数字学术版本需包含三个要素:一是历史文献;二是表征,涵盖表示和呈现;三是批判性,对历史文献没有经过批判性审视的复制行为不视为学术编辑。在此定义中,影印版不是数字学术版本。此外,皮拉佐(Pierazzo)[30]从两方面对“表征”进行了进一步的阐述,一是跨媒介化,通过数据实现表示;二是媒介化,通过媒介实现呈现。从以上定义可见,萨赫尔和皮拉佐区分了数字化版本和数字版本,前者只是对印刷版本的简单再现,不能称为真正意义上的数字版本,后者则超越了传统印刷范式的“页面”,是更具探索性的数字版本发展路径。本文参考数字学术版本的概念与FRBR模型的思想,探讨古籍数字版本的概念内涵。

(二)古籍数字版本的两种表现形态:出版物和数据资源

1.作为出版物的古籍数字版本

图书版本与图书之间存在着内在的统一性,因为图书版本就是表现为具体形式的图书[31],本质上是图书在特定表现形式中的再现。古籍的数字化使得古籍具有数字版本形态,表现为具体形式的古籍数字出版物。一部古籍的不同版本的实体,或同一版本的实体经过不同的数字化技术手段处理后形成的数字古籍可视为原始古籍版本的数字版本,而这种数字版本具体以出版物形式存在。在此基础上,经过进一步地编辑、加工、复制传播,又形成了该数字版本的多种表现形式,即原生数字版本。在古籍版本制作过程中,印刷材料依赖于物理实体印版,通常采用“刻”“铸”“抄”“印”等复制印刷技术,印版一旦制成,便无法更改,体现了传统印刷的固定化与稳定性。古籍数字版本的制作省略了传统制版的过程,不像传统手抄、印刷版本那样一经制作便最终定型,而是在其整个数字化制作和传播过程中保持动态性。在数字化编辑过程中,随着新发现的文献资料、修订的文字内容、专家学者的考证以及语义标注、语义关联等处理,古籍数字版本的内容会不断进行更新和调整,如一部古籍数字化初始制作时期,仅发布了图像扫描版本与转录文字版本,随着研究的深入,会在初始数字版本基础上添加注释、白话翻译、文本对比、文字修正等,这些新增的内容借由数字界面实时呈现,体现了数字时代古籍数字版本的整理。古籍数字版本作为出版物的特征超越了传统意义上固定的、静态的最终产品,体现出实时更新与多次发布的特征。

2.作为数据资源的古籍数字版本

我们正步入数字文明时代,数据成为数字文明时代的第一要素。[32-33]萨赫尔[34]将数字学术版本概念特性归纳为可以脱离其特定媒介而存在的能力,体现了从作为媒介产品的版本向作为数据资源的版本的转变,本质上是对知识的抽象建模与表征。作为数据资源的古籍数字版本,除了关注书籍印本的古籍版式、装帧、载体材料等物理特征,更关注如何抽象化表示古籍文本符号、编码文本结构和意义,即建模。从编辑复制过程来看,古籍数字版本的构成包括源文件、脚本、输出、样式文件等组件。源文件包含光学字符识别(Optical Character Recognition,OCR)转录的古籍文本。目前可扩展标记语言(Extensible Markup Language,XML)、文本编码倡议(Text Encoding Initiative,TEI)是古籍文本编码的最佳实践,TEI-XML可以捕捉古籍版本的细节,如版本的变化、脚注等情境信息,其结构化标注的古籍文本可以被各种数字工具分析与处理,最终以一种可下载的XML源代码、超文本标记语言(Hyper Text Markup Language,HTML)在线等形式呈现。脚本用来读取并转换源文件,生成特定“视图”的版本呈现形式。这些脚本通常使用扩展样式表转换语言(Extensible Stylesheet Language Transformations,XSLT)或XQuery,将文本中的标记转换为可展示的格式。输出即根据目标需求呈现数字版本,样式文件用于控制古籍文本内容的显示方式,比如古籍数字版本以HTML网页形式呈现,通常由层叠样式表(Cascading Style Sheets,CSS)和JavaScript组合来实现。这意味着需要区分数据模型与发布模型,前者表示古籍数字版本资源的存储,后者是古籍数字版本的呈现。古籍数字版本可以通过多种编码方式呈现同一原始来源的不同表现形式,即同一古籍数字版本表现为多元化的输出形式。

(三)古籍数字版本的三个层次

当古籍数字版本基于抽象数据构建并能够以不同形式重构时,面临一个问题:古籍数字版本是否仍可归类为传统意义上的出版物,抑或应视为承载这些出版物的底层数据?在数字时代,数据与出版物之间的界限日渐模糊。数字版本的特性在于其可以根据数据源随时重新生成并呈现,一部古籍通过数字化技术转化为电子文本后,能够在不同的媒介平台上以多种形式发布,如网页、应用程序,随着沉浸式技术的发展,虚拟现实(Virtual Reality,VR)、增强现实(Augmented Reality,AR)、混合现实(Mixed Reality,MR)也成为古籍数字版本呈现的新方式。此时所呈现的古籍数字版本是基于该数据的具象化表达,而这种表现形式会随着数字介质的不同而发生变化。从这一视角出发,可以划分古籍数字版本的层次。首先是数据层。在古籍登记领出后,对古籍进行文本的精准转录、古籍图像的扫描、重要的注释和脚本的编写等,这些基础数据不仅是古籍数字版本的核心内容,也为后续编辑工作提供了可靠的原材料。其次是中间处理层。主要对古籍数据进行组织、标注等结构化与语义化处理,包括版面与图像分割,标记古籍版本的标题、章节、段落、页码等元素,以便于古籍数字文本的检索和分析;制作双层图文格式,形成图文整体对照与单句图文对照等表现形式;添加古籍版本的作者、出版者、出版时间等元数据信息,以及利用TEI-XML进行文本格式化等操作。中间层次不仅关注古籍数字版本的数据化,还要确保在最终呈现层次中的信息准确性。最后是呈现层。其是将古籍数据转化为可交付的出版物,即古籍数字版本的具体表现形式,涉及古籍数字版本的结构布局、交互功能设置、展示方式等,旨在满足读者个性化需求与提升阅读体验。如“识典古籍”针对某一古籍数字版本提供了简体字、繁体字、底本原字等多种文字模式,并适用于手机竖屏与电脑横屏等不同数字界面,体现了古籍数字版本作为数据资源在多样化载体上的多元表达形式。数字技术的发展突破了传统“刻”“铸”“抄”“印”等复制技术知识生产的局限,磁、光、电、芯片等存储介质与屏幕显示技术的出现,使得古籍从书籍印本转向数字版本。古籍数字版本是指通过数字化技术将古籍转化为数字形式,并在此基础上进行标注、修订、注释等编辑加工,存储在数字介质中并通过数字界面呈现的各种表现形式。

三、古籍数字版本的特征与类型

从古籍数字版本的概念内涵来看,数字技术不仅是将传统书籍印本的古籍转化为电子格式,而是在内容呈现、数据编码、交互功能等方面开辟了全新的文本表现、学术研究与大众传播的可能性,具有符号与载体的非依附性、版本整理的开放性、版本数据的智慧化、版本阅读的交互性等特征,包括古籍数字化产生的版本类型与原生古籍数字版本类型。

(一)古籍数字版本的特征

1.符号与载体的非依附性

传统古籍版本依附于实体介质,其物理特性决定了内容符号与载体介质之间的强依附性关系,形式与内容高度依存。刻字在碑,便有碑文,碑文不可分;印图在纸,便成图书,图纸不可分。古籍版本的存储介质即为读者的阅读界面。古籍数字版本记录信息的存储介质与呈现内容符号的阅读界面具有非依附性,读者最终所见内容与计算机内存储的数据之间是有区别的。阿尔塞斯(Aarseth)[35]的文本中的字符串(textons)和读者所看到的字符串(scriptons)之间的区分对于理解古籍数字版本这一特征具有重要启发。与传统古籍“所见即所印”的特性不同,古籍数字版本的数据源与其呈现给读者的输出结果之间存在着区别。读者看到的是通过某种编辑加工方式处理过的古籍版本数据,并根据特定需求添加样式,形成最终符合读者需求的古籍数字版本。如国家古籍数字化工程专项经费资助项目《永乐大典》的数字版本在原书内容数字化的基础上,通过数字技术手段,提供了原本影像与数字化文本相互对照、繁简体文字随时切换等呈现形式,并支持智能标注、全文检索等功能。此外,符号与载体的非依附性使得古籍数字版本具有可触、可观、可感等特征[36],束之高阁的古籍开始走向大众。数字技术的发展使得古籍数字版本可以在多种载体介质中呈现,以电子书、数据库、知识图谱、VR/AR/MR图书等为表现形态,实现从图文符号到音视频、虚拟现实等复合多媒体符号,从细读到远读再到具身体验的跃迁。

2.版本整理的开放性

古籍数字版本打破了印刷时代以纸张为载体的出版模式,重新定义了古籍整理的参与者和过程。古籍数字版本的整理不再是单一的专业活动,而是一个集体协作的成果。不同于传统的古籍整理,专家学者、普通读者都可以成为古籍数字版本的贡献者与参与者,从而实现了知识生产和再生产的社会化。例如,中华书局的古籍整理众包平台通过开放式任务发布和协作机制,已成功发布了超过4万个任务,核校文字量高达14.84亿字。《中华大藏经续编》更是在全球900多位业余审校者的参与下,仅用两年时间便完成了两轮校对与审核工作,最终校对字数接近2亿字。这种以社会化和众包为核心的编辑方式,极大提高了古籍整理的效率和质量,赋予了古籍数字版本以开放性与互动性,确保了古籍数字版本的持续更新与扩展,为古籍数字版本研究、学术协作与知识共享提供了新路径。

3.版本数据的智慧化

作为数据资源的古籍数字版本,能够被机器识别、处理与计算,形成数字化、数据化等多种数据形态,并可进一步发展为具有可操作性、语义关联性、情境化的、可信性的版本智慧数据。[37-38]以数据为基础的古籍数字版本不仅能够统一建模,还支持不同模态数据之间进行转换与活化。随着古籍数字版本从单纯的数字化向更加复杂的数据化与智慧化转型,衍生出如古籍语义数据、关联数据、智能数据及智慧数据等层层递进的“数据增强”过程。古籍版本资源的智慧化能够更好地支持古籍数智循证研究,如上海图书馆中文古籍联合目录及循证平台是版本智慧数据的典型案例,体现了多版本并存的特征。借鉴FRBR模型构建“作品—版本—单件”+“注释”+“分类”古籍数据模型,能够聚集同一古籍的所有版本,并利用责任者、出版地点、时代、版式、文本内容等元数据,对版本进行聚类、比对、统计和分析。

4.版本阅读的交互性

作为数据资源的古籍数字版本与作为出版物的古籍数字版本体现出非依附性、开放性、智慧化特征,也带来读者版本阅读体验的交互性与个性化。首先,古籍数字文本具有超文本特性,为读者提供了多样性与动态性的阅读路径,打破了传统书籍印本的线性阅读结构。不同于书籍印本的隐性链接,基于超链接的数字版本明确标识了古籍文本间的关联,允许读者点击跳转到相关联的古籍文献,从而实现了跨文本的知识探索。其次,古籍数字版本支持全文搜索、跨设备阅读、文本对比等功能,并以白话文翻译、学术注释、可视化等形式展示古籍信息,丰富读者的阅读视角。如历代古籍目录可视化分析系统以史志目录的数字版本为数据源,对其进行细粒度统计分析,采用可视化手段呈现古籍目录分类演变轨迹与各类目的典籍源流,促进了阅读的直观化并为古籍研究提供了新方法。

更进一步,古籍数字版本能够以图文、音频,甚至3D虚拟景观等多媒体符号呈现,为读者提供阅读的沉浸式体验。如中国国家图书馆“阅见美好”小程序上线的《孟子》原文朗读版,使得读者可以随时随地收听。随着VR/AR/MR技术的发展,古籍数字版本的表现形式与阅读方式趋向沉浸式与具身化[39],如湖南岳麓书社推出的四大名著VR版本、杭州国家版本馆数字馆的版本数字展厅,以“数字版本+沉浸多媒体空间”的形式展现中华版本内涵。此外,古人在阅读古籍过程中进行圈点、批注、题跋等阅读行为,产生了注本、评本、批校本、圈点本等不同版本。古籍数字版本的阅读相应地也产生了数字阅读痕迹[40],读者基于古籍数字阅读平台进行划线、高亮等标注、添加和查看注释、分享书摘等信息行为,展现了数字时代古籍版本阅读的意义构建。

(二)古籍数字版本的类型

正如McCarty所言:“数字人文将实验精神带入了人文学科。”[41]这一观点同样也适用于古籍数字版本。它将实验性引入古籍文献学研究中,其本身亦作为一种实验性的产物,致力于探索新媒介中古籍文本呈现的多种可能。这种实验性超越了单纯的数字化转换,通过数字媒介的再构建与互动,开辟了文本解读的新路径,推动了学术研究方法的创新。古籍数字版本包括古籍数字化后的版本与古籍原生数字版本。古籍数字化后的版本类型指将古籍实物版本通过扫描、录入完成数字化,这类数字版本是随着文字处理器等早期数字技术的应用开始出现的,依旧是古籍书籍版本的搬运与模仿,体现为载体介质平移与符号再现。从存储介质来看,可分为离线和在线两种版本。前者也可以称为单机型版本,主要以封装型的软磁盘、移动磁盘和CD-ROM光盘等为载体介质;后者也可称为网络型版本,其载体介质通常是计算机硬盘,古籍内容通常制作为网页或直接以某种形式存储在互联网服务器上。

古籍原生数字版本则是在古籍数字化基础上,进一步编辑加工、复制传播形成的以数字界面或窗口呈现的版本类型。这类版本应作为古籍文献的“实验室”而存在,不仅仅是古籍的数字复制与呈现,而且为古籍研究提供了新路径,使得古籍文本能够以多种方式被探索、编辑与再创作,也体现了古籍数字版本的开放性,力求挖掘书籍印本所无法承载的新功能与体验,推动古籍利用与活化传播。

四、古籍数字版本的意义

(一)支撑古籍版本智慧循证

古籍数字版本具有数据层、处理层、呈现层三个层次,是同一版本资源的各种表现形式。将不同古籍版本及其数字版本汇聚融合,将为古籍版本学研究以及相关的书籍史、目录学、校勘学等研究提供更为多元、更具智慧的数据来源。古籍版本学的研究内容涉及古籍版本鉴定与古籍版本源流两个核心方面。[42]根据地域、时间将古籍数字版本进行聚类,对古籍数字版本进行时空、出版者、责任者等信息统计分析,可以发现古籍版本间的传承关系与演变模式,揭示不同版本的流传脉络和地域分布,促进古籍的版本鉴定与版本源流的研究与考证。如面向循证研究的古籍数据模型[43]、以“书目”“版本”“责任者”“地名”四种实体为基础构建的大规模古籍知识图谱[44]、将“分类”与“作品”“版本”和“单件”概念关联的《国家珍贵古籍名录》知识模型[45],均构成了古籍版本学研究中的智慧数据,助力古籍版本的智慧循证。在版本地域性研究方面,考察不同地区古籍刻印数量、类型、特色及其形成因素,亦是古籍版本学与书籍史研究的重要内容。“明代古籍版刻地理信息系统”[46]则借助地理信息系统(Geographic Information System,GIS)从时空两个维度深入分析了明代古籍版刻数据,通过可视化手段展现了明代刻书系统、刻书机构、刻书中心的地理分布与变迁,揭示了明代版刻活动的时空演进特征。

古籍数字版本的聚类可以促进古籍校勘工作,古籍数字版本的汇聚既有助于研究人员找到同一种古籍的不同版本进行多个版本之间的对校,又可以根据人、地、时、事、物等对古籍数字文本进行关联,通过文本分析与智能推理帮助研究人员发现不同古籍版本及同种古籍各版本之间的关联关系,实现他校与理校。同时,目前也出现了诸多古籍整理与标注工具与平台支持研究人员在线标注,通过同行审核认可后可以成为古籍循证的新证据。此外,古人在古籍研究整理过程中形成的批注校勘,利用语义标注与关联技术将这些注解、注释、注疏或不同古籍版本内容上的变化差异进行展示与关联,将为古籍研究提供丰富的参考与研究视角。[47]

(二)促进古籍版本活化传播

古籍传承性保护不仅包括古籍文本内容与知识的保存,也涵盖了古籍印刷工艺、材料和技术的学习、延续与传播。其本质在于将古籍中承载的思想、文化、故事传递到人们的头脑之中,实现文明的代际延续。[48-49]古籍数字版本的多样化形态促进了古籍的传承与弘扬,为古籍从“小众”走向“大众”提供了新的途径。在古籍数字化版本的基础上,结合展陈交互、可视化呈现以及VR/AR/MR等数智技术,可以将版本智慧数据资源映射到读者用户对古籍版本的体验,促进古籍版本的数字化阐释与艺术化表达。[50]如上海图书馆基于家谱智慧数据设计多个展示项目,以可视化的方式从地域、姓氏、个人、时间段等多个维度生动呈现了中华民族三千年来的迁徙演变历史,并创建了触屏交互版和大屏演示版两种呈现形式,以适应多终端环境与用户交互需求。故宫博物院数字文物库提供了珍贵古籍的数字化版本,读者可以在线浏览文物图片,并获得详细的说明信息,部分项目还支持3D模型查看,增强了读者体验。除此之外,古籍数字版本也促进了“多感官体验”式的书籍装帧设计,古籍版本的装帧、制版、版式等形式特征,借由VR/AR/MR等数智技术给读者带来虚实融合的亲身体验,诸多图书馆也尝试提供版本工艺流程VR虚实融合体验、古籍修复虚拟展示等服务,促进公众对古籍物理形态与传统工艺的理解与认知,推动古籍版本在数字时代的活化利用与传承。

五、结语

数字版本作为古籍的一种新型表现形式,具有符号与载体的非依附性、版本整理的开放性、版本数据的智慧化、版本阅读的交互性等特征,并支持传统古籍版本学、书籍史、目录学、校勘学等文献研究的智慧循证,以及古籍版本的大众传播与文化传承。但同时也应意识到,古籍版本向数字版本转化的过程是一个知识增强、真实减弱的抽象过程,这个过程会损失一些信息。[51]当不同古籍数字版本的差异被缩减为数据格式上的差异,需要思考古籍数字版本是否真实完整地捕获了原始古籍版本的全部特征,那些数字版本所无法捕获的物理特征是否会影响读者对古籍内容的认知与理解,是否导致古籍珍贵文物与文献价值被忽略。古籍数字版本的多样性还易出现格式转换、版本兼容等问题。同时,由于软件过时、存储数字文本的介质故障、无意或恶意更改数字文本内容、数字版本传输不可靠等风险,古籍数字版本也存在易消逝性、不易长期保存等问题,这些成为当下古籍数字版本面临的挑战。当前,我们仍处于数字摇篮本时期[52],古籍数字版本的编辑、制作、生产尚处于不确定、不规范、不成熟的阶段。而随着数智技术的发展,尤其是通用大模型的突破,古籍数字版本的类型与功能有望得到进一步扩展,创造出超越书籍印本的全新形式,不仅为古籍研究提供新方法,也为古籍活化传播提供新路径。

(作者信息:秦翠玉,武汉大学信息管理学院出版发行学博士生;雷珏莹,河南大学新闻与传播学院讲师;翁梦娟,武汉大学新闻与传播学院博士后;王晓光,武汉大学信息管理学院院长,教授、博士生导师,文化遗产智能计算教育部哲学社会科学实验室主任,武汉大学数字人文研究中心主任)

本文系国家社会科学基金重大项目“文化遗产智慧数据资源建设与服务研究”(项目编号:21&ZD334)的阶段性研究成果。

* 通讯作者:王晓光。

参考文献 

参考文献与注释

[1][26]刘冰,李广龙.数字古籍“版本”商榷[J].河北科技图苑,2012,25(5):91-93,92.

[2]鞠明库.古籍数字化与传统文献学[J].清华大学学报(哲学社会科学版),2011,26(5):154-158,161.

[3]杨清虎.数字文献学的概念与问题[J].黑龙江史志,2013(13):203.

[4]刘炜,叶鹰.数字人文的技术体系与理论结构探讨[J].中国图书馆学报,2017,43(5):32-41.

[5]黄一农.对清代端慧皇太子永琏讳例的e考据[J].数字人文研究,2023,3(1):61-78.

[6]张治.“e考据”与近代中西文学交流研究[J].山东社会科学,2022(5):45-54.

[7]万安伦,王剑飞,李宜飞.出版载体视角下中外出版史分期新论[J].中国出版,2018(4):42.

[8]BOLTER J D. Writing space:Computers,hypertext,and the remediation of print[M].London:Routledge,2001.

[9]梁旭艳.流动性:屏读时代书籍的新特征[J].出版发行研究,2016(5):46.

[10][21]胡易容,周野.从“版”到“窗”:数字出版阅读界面形象嬗变的符号学分析[J].编辑之友,2024(6):23,29.

[11]金宏宇.新文学研究的版本意识[J].文艺研究,2005(12):57-62,167.

[12]金宏宇,杭泰斌.中国现代文学版本研究的新路径[J].华中师范大学学报(人文社会科学版),2017,56(3):87.

[13]金华.认知计算视角下文献资源书目著录研究[J].图书馆杂志,2022,41(9):47.

[14]许磊.CNMARC数据中作品的识别与建模[J].图书馆杂志,2022,41(1):69.

[15]金正贤,董桂存.“四书五经”书目关系的FRBR应用研究[J].古籍保护研究,2023(1):42.

[16]高红.书目关系的综合研究[J].图书情报工作,2006(9):111.

[17]刘沛鹞,罗卓然,魏家泽,等.多模态内容资源编目及知识表示研究[J].数字图书馆论坛,2022(11):28.

[18]张懋学,万安伦.从早期印品遗存看雕版印刷术的起源[J].现代出版,2023(1):109.

[19]何朝晖.以全球视角重估雕版印刷[J].文史哲,2025(3):54.

[20]郑晓霞.中国图书版本的新类型:数字印本[J].出版与印刷,2012(3):19.

[22]严佐之.古籍版本学概论[M].上海:华东师范大学出版社,1989:1.

[23]毛建军.电子古籍的版本生成及其应用研究[J].图书馆学研究,2014(6):94.

[24]杜泽逊.文献学概要[M].北京:中华书局,2001:131.

[25]常娥,李慧芳.古籍数字版本的权威定本问题探究:以《老子·道德经》为例[J].图书馆,2021(12):108.

[27]中国国家版本馆.努力建成赓续中华文明的“种子库”[EB/OL].(2023-09-07)[2025-07-08].http://www.zgjx.cn/2023-09/07/c_1310740338.htm.

[28]周海晏.发掘通往数字文明的媒介性:“版本馆”中“版本”的媒介学研究[J].现代出版,2022(6):99.

[29]SAHLE P. What is a scholarly digital edition?[M]// PIERAZZO E. Digital scholarly editing:Theories and practices.Cambridge:Open Book Publishers,2016:23.

[30]PIERAZZO E. Digital scholarly editing:Theories,models and methods[M].London:Routledge,2016:212.

[31]姚伯岳.中国图书版本学[M].北京:北京大学出版社,2004:10.

[32]戎珂,黄成.掌握数字文明时代第一要素 迈向社会主义现代化强国[EB/OL].(2023-08-01)[2025-07-08].https://www.tioe.tsinghua.edu.cn/info/1111/2375.htm.

[33]金佳丽,潘晶,张紫徽,等.AI驱动的未来图书馆范式重构与创新路径[J].中国图书馆学报,2025,51(5):67-78.

[34]SAHLE P. Digitale Editionsformen[D].Köln:Universität zu Köln,2013:270.

[35]AARSETH E. Cybertext:perspectives on ergodic literature[M].Norway:University of Bergen,1995:62.

[36]李莎莎.古籍活化的现状、问题与对策初探[J].出版发行研究,2022(12):37.

[37]曾蕾,王晓光,范炜.图档博领域的智慧数据及其在数字人文研究中的角色[J].中国图书馆学报,2018,44(1):20.

[38]雷珏莹,王晓光.智慧数据视角下古籍数字出版的创新路径研究[J].出版发行研究,2023(8):22.

[39]张建,于爽.具身认知理论视域下VR/AR图书阅读方式的变革[J].出版发行研究,2017(7):83.

[40]袁桐.数字书评:概念及变迁[J].出版发行研究,2024(11):74-80.

[41]McCARTY W. Collaborative research in the digital humanities[M]//Collaborative Research in the Digital Humanities. London:Routledge,2016:1-10.

[42]黄永年.古籍整理概论[M].上海:上海书店出版社,2001.

[43]夏翠娟,林海青,刘炜.面向循证实践的中文古籍数据模型研究与设计[J].中国图书馆学报,2017,43(6):16-34.

[44]欧阳剑,梁珠芳,任树怀.大规模中国历代存世典籍知识图谱构建研究[J].图书情报工作,2021,65(5):131.

[45]王林旭,王军,史睿,等.紬理群籍:《国家珍贵古籍名录》数字平台构建[J].中国图书馆学报,2025,51(1):10.

[46]李明杰,杨璐嘉.基于GIS的明代古籍版刻地理信息系统的设计与实现[J].信息资源管理学报,2020,10(3):128.

[47]王晓光,翁梦娟,侯西龙,等.古籍注疏的知识表示与语义化建模研究[J].中国图书馆学报,2023,49(3):88.

[48]姚伯岳,周余姣,王鸷嘉.古籍传承性保护再认识[J].中国图书馆学报,2023,49(1):58-67.

[49]周飞亚.让中华古籍真正“活起来”[N].人民日报,2022-04-30(8).

[50]王晓光,侯西龙.面向活化利用的文化遗产智慧数据建设论纲[J].信息资源管理学报,2023,13(5):9.

[51]夏翠娟.数字人文的理论沿革和范式转向:从“人文研究的数字方法”到“后数字时代的人文研究”[J].中国图书馆学报,2024,50(5):89.

[52]王晓光,简华.超越数字摇篮本:AI时代出版物创新的基本要求与技术逻辑[J].出版发行研究,2025(1):29.



阅读原文

跳转微信打开

新书推荐 |《二十一世纪的数字化文本编辑与出版》

2025年12月5日 14:00

2025-12-05 14:00 湖北

《二十一世纪的数字化文本编辑与出版》收录了二十篇论文,内容涵盖数字编辑实践中的具体设计流程,以及对“生于数字环境”(born-digital)材料的多种概念性编辑方法。

一、内容简介


尽管近年来学界不断呼吁应充分发掘数字文本的潜能,但数字学术编辑与出版仍深受纸本文化与结构逻辑的限制。本书汇聚了多种视角,以呈现该领域在当前与未来的发展状况,期望推动这一讨论更进一步,并鼓励持续探索在数字时代中知识与意义的生产与传播方式。

《二十一世纪的数字化文本编辑与出版》(Digital Editing and Publishing in the Twenty-First Century)收录了二十篇论文,内容涵盖数字编辑实践中的具体设计流程,以及对“生于数字环境”(born-digital)材料的多种概念性编辑方法。论文集同时讨论了一系列及时而重要、但常被忽视的议题,包括可访问性(accessibility)、人工智能以及“数据版本”(data edition)等。

通过强调学术数字版本所蕴含的洞见与知识,以及它们在创新使用中所展现的可能性,本书进一步凸显了数字编辑成果如何在学术界之外的多种情境中被更广泛地使用、理解与赋予意义。

核心议题与挑战

(1) 超越纸本范式

当前许多数字出版物仍延续纸本逻辑(如 PDF 电子书)。该领域强调应充分发挥数字技术的潜能,包括超文本结构、多媒体呈现、交互式界面与计算分析,以构建更开放、动态、可探索的数字学术版本。

(2) 技术整合与方法论革新

数字编辑与出版正在逐步吸纳多种关键技术和标准,包括:

  • TEI(Text Encoding Initiative):数字人文最广泛使用的 XML 文本标记框架,是构建数字学术版本的核心标准。

  • 人工智能与机器学习:用于辅助文本校勘、语义分析、自动分类与版本比较等任务。

  • IIIF(International Image Interoperability Framework):实现跨机构图像的比对、共享与注释,促进数字收藏的互操作性。


(3) 可及性与受众拓展

数字版本的目标不仅是开放获取,还包括提升可用性,让学者、学生乃至公众都能更便捷地接触与理解文本及其数据结构。

(4) 协作模型与新型编辑角色

当前许多项目依赖共享平台与合作机制,为学者主导的小型计划提供更可持续的出版路径。在这一过程中,编辑的角色发生扩展,包括数据管护、算法与技术的选择,以及透明度与可复现性的维护。


二、编者简介



James O'Sullivan(主编)

詹姆斯・奥沙利文(James O’Sullivan)任教于科克大学学院(University College Cork)数字人文学系,现任该校英语与数字人文学院研究主任,同时担任艺术、凯尔特研究与社会科学学院研究与创新委员会成员。他担任未来人文研究所(Future Humanities Institute)董事会成员,并主持该研究所数字文化、新媒体与文化分析研究小组的工作。著有《走向数字诗学》(Towards a Digital Poetics,帕尔格雷夫・麦克米伦出版社 2019 年版),主编多部学术论文集,包括《布卢姆斯伯里数字人文学手册》(The Bloomsbury Handbook to the Digital Humanities,布卢姆斯伯里出版社 2023 年版)与《爱尔兰文学与文化中的技术》(Technology in Irish Literature and Culture,剑桥大学出版社 2023 年版)。他是 “21 世纪文献:数字时代的编辑与出版”(C21 Editions: Editing and Publishing in the Digital Age)项目的爱尔兰方首席研究员,该项目由英爱数字人文合作计划资助。

可访问网址: https://jamesosullivan.org/


Michael Pidd

迈克尔・皮德(Michael Pidd)现任谢菲尔德大学(University of Sheffield)数字人文研究所(Digital Humanities Institute, DHI)所长。他在人文与遗产领域开展、管理和实施大型合作研究项目及技术研发工作,拥有近 30 年经验。期间,该研究所已作为技术合作方参与 120 余个国内外项目,合作客户超 100 家。他是 “21 世纪文献:数字时代的编辑与出版”(C21 Editions: Editing and Publishing in the Digital Age)项目的英国方首席研究员,该项目由英爱数字人文合作计划(UK-Ireland Collaboration in the Digital Humanities)资助。

迈克尔曾担任以下项目的首席研究员:“联结莎士比亚”(Connecting Shakespeare,HEIF 资助)、“露珠计划”(Dewdrop,Jisc 资助)、“重塑地方公共图书馆”(Reinventing Local Public Libraries,HEIF 资助)及 “在线手稿库”(Manuscripts Online,Jisc 资助);同时担任 “麻醉品与早期现代性”(Intoxicants and Early Modernity,ESRC/AHRC 资助)、“语言基因”(Linguistic DNA,AHRC 资助)、“超越多元影院”(Beyond the Multiplex,AHRC 资助)及 “数字时代的生存方式”(Ways of Being in the Digital Age,ESRC 资助)等项目的联合首席研究员。他还曾担任多个项目的技术负责人,例如 “数字圆形监狱”(Digital Panopticon,AHRC 资助)。


Sophie Whittle

索菲・惠特尔(Sophie Whittle)是“21 世纪文献:数字时代的编辑与出版”(C21 Editions: Editing and Publishing in the Digital Age)项目的研究员,负责采用机器辅助方法开发杰弗雷・乔叟(Geoffrey Chaucer)《赎罪券贩子的开场白与故事》(Pardoner’s Prologue and Tale)的在线教学版原型。

索菲曾讲授英语史、历史语用学、研究方法及句法学等课程模块,协调组织过多场以 “语言学课程体系中反种族主义研究为核心” 的跨学科研讨会,邀请全球学者分享其在后殖民社群语用学、语言与文化共享及人权领域的研究成果。此后,她加入英国语言学会(Linguistic Association of Great Britain)种族正义小组委员会。此外,她还担任谢菲尔德女权主义档案馆(Sheffield Feminist Archive)组织者,近期参与创建了数字档案 “封锁时期的女性”(Women in Lockdown)—— 该项目通过口述史、亲历陈述、日记条目及艺术作品投稿等形式,收录女性在新冠疫情期间的故事与经历。


Bridgette Wessels

布里奇特・韦塞尔(Bridgette Wessels)现任英国格拉斯哥大学(University of Glasgow)社会学与社会不平等领域教授。其研究聚焦数字技术与服务在社会文化生活中的发展与应用,具体包括公共领域、日常生活及公民生活中的数字服务与沟通实践、社会与数字不平等问题,以及远程医疗、移动通信、数字通信隐私保护等特定研究方向。

她担任英国经济与社会研究理事会(ESRC)生产力研究所苏格兰论坛联合负责人,同时是欧洲大学联盟 CIVIS 网络 “数字技术与社会变革” 研究中心创始成员。韦塞尔教授在科研经费申请方面成果显著,曾获英国研究与创新署(UKRI)、欧盟及其他研究基金会的资助。此外,她还是 “21 世纪文献:数字时代的编辑与出版”(C21 Editions: Editing and Publishing in the Digital Age)项目的联合首席研究员,该项目由英爱数字人文合作计划(UK-Ireland Collaboration in the Digital Humanities)资助。


Michael Kurzmeier

迈克尔・库茨迈尔(Michael Kurzmeier)是“21 世纪文献:数字时代的编辑与出版(C21 Editions: Editing and Publishing in the Digital Age)项目的博士后研究员。其研究聚焦于技术与社会的交叉领域,由爱尔兰研究委员会(IRC)资助的博士论文《网站篡改中的政治表达》(Political Expression in Web Defacements),探究了通过黑客行为进行的政治表达,并针对这类特殊归档网络资源的检索与分析提出了新颖方法。

库茨迈尔博士担任由奥胡斯大学牵头的 “网络档案研究网络”(Web ARChive studies network, WARCnet)研究方法工作组主席,同时是 “网络档案应用”(Engaging with Web Archives, EWA)会议的创始人之一,该会议是爱尔兰首个专门的网络档案领域会议。


Órla Murphy

奥拉・墨菲(Órla Murphy)现任科克大学学院(University College Cork)英语与数字人文学院院长。其在欧盟层面的国际领导及服务职务包括:人文艺术数字研究基础设施(Digital Research Infrastructure for the Arts and Humanities)国家协调员、欧盟科学技术合作组织(Cooperation in Science and Technology, CoST-EU)科学委员会国家代表兼副主席,以及欧洲研究基础设施战略论坛(European Strategy Forum on Research Infrastructures, ESFRI)社会科学与人文战略工作组国家代表。

在爱尔兰国内,她担任爱尔兰数字知识库(Digital Repository of Ireland)董事会成员、艺术与文化教育研究知识库(The Arts and Culture in Education Research Repository)联合主席。此外,墨菲还是 “21 世纪文献:数字时代的编辑与出版”(C21 Editions: Editing and Publishing in the Digital Age)项目的联合首席研究员,该项目由英爱数字人文合作计划(UK-Ireland Collaboration in the Digital Humanities)资助。


三、引言


这本书关注的是一种“超越传统书籍”的未来。更确切地说,它探讨的是数字学术版本(digital scholarly editions)的未来,以及它们如何在当代被出版与阅读。

学术版本(scholarly editions)指由专家精心整理的手稿或文献材料,通过提供批注体系(critical apparatus)——如导言、背景说明等辅助性内容——帮助读者理解作品的内容与其社会脉络。换句话说,学术版本就是文本或文献的批判性呈现(critical representation)。数字学术版本(digital scholarly editions)则是利用数字技术(如今通常指网页技术)制作与发布的学术版本。

如果读者需要更全面的数字版本定义,这一领域已有丰富的理论与实践(Shillingsburg 1996; Price 2008; Gabler 2010; Earhart 2012; Schreibman 2013; Driscoll and Pierazzo 2016; Pierazzo 2016; Apollon, Bélisle and Régnier 2017; Boot et al. 2017; Kelly 2017; Ohge 2021)。其中最具代表性的是 Patrick Sahle 的定义:“数字学术版本是那些在理论、方法与实践上受数字范式(digital paradigm)引导的学术版本”(2016)。所谓“受数字范式引导”,意味着数字生成物和被动数字化的材料之间存在明显差别:例如,一份纸本版本的 PDF 复制品并不受数字范式引导,它只是遵循纸本范式的版本在数字形式上的替身。

因此,本书讨论的是那些真正“数字化”的未来版本——它们是文本或文献的批判性呈现,并受数字范式引导(或者,在某些论者看来,是刻意不受数字范式引导)。

在学术版本语境中,“critical”(批判性)一词有时含义模糊,也常伴随争议。传统上,“critical”指的是以文本真实性为核心目标的历史性版本(如古代或中古文本),试图确定文本最“正确”、最接近作者原意的形态。这类版本通常成为学界和读者的标准参照,因为它们可靠,由专家投入大量时间解决文本在传抄、翻译或各种干预过程中出现的差异。

但如今,“critical”一词的使用范围正在扩大,它也可以指任何具备补充性材料、能够帮助读者更好理解文本的版本。为避免混淆,Frederike Neuber 建议使用“enriched”(增益版)来表达这一更广泛意义,将“critical”保留给其传统含义(Neuber 2014)。本书不会进一步进入这一术语争论。

如前所述,本书旨在探讨数字学术版本与出版的未来,并从更宽广的视角理解学术版本——即对各种文化材料,无论时代,都进行批判性呈现的方式。学术版本、批判性版本,不论名称如何,都是已经经过专家审慎处理与诠释的可靠第一手资料,服务于研究者、学生与公众。

如果想知道数字版本是什么样子,只需检索 The Catalogue of Digital Editions 这一优秀资源(Franzini, Terras and Mahony 2016)。撰写本书时,该目录中已收录 323 个数字版本。在资讯错乱的时代,它们的重要性前所未有。

然而,数字版本有时似乎并未真正带来“新的东西”。尽管计算机技术具备各种潜能,许多数字版本的制作仍像是一种“工业手艺(industrial craft)”,往往“手工且定制化(manual and bespoke)”(Whittle, O’Sullivan and Pidd 2023),更像是纸本资源的“再现”(re-creations)而非“重生”(reincarnations)。数字出现之前的学术版本与近年来的数字学术版本,看似拥有几乎一致的呈现方式,深受传统书籍形式的逻辑所牵引。

但或许本该如此——编辑本质上是精读(close reading)的实践,而优秀的编辑始终是一项精密的活动。尽管书籍(codex)形式有限,却自中世纪以来一直是高效阅读与引用的有力媒介。考虑到数字编辑与其前身之间的“真实延续性(real continuity)”(Robinson 2002),数字版本的形式如此稳定也就不足为奇了。

然而,这种稳定至少值得被重新思考。正如 Peter Robinson 所指出,数字媒介“完全适合于将版本展现为编辑、读者、文献、文本与作品之间持续协商的过程”(2013, 127)。这种协商仍有许多课题尚待处理:原生数字版本(born-digital editions)、作为文化分析(cultural analytics)形态的数字版本、人工智能(AI)在文本编辑中的应用、阅读与注意力方式的变化、“critical”一词性质的变化,以及数字版本的出版方式等。

用于数字编辑的方法论似乎未能跟上表达方式的变化,也未能回应当下文化中占主导地位的原生数字形式(如社交媒体与电子游戏)所急需的批判性版本。

编辑实践同样未能跟上自然语言处理(natural language processing)与机器学习(machine learning)所提供的可能性。Katherine Bode 批评数字人文中存在“分工文化”,即收集材料、整理版本的人与进行统计或分析的人相互分离(2019)。编辑的细致工艺被视为与文化分析的机械、科学部分截然不同。然而,如果我们认为数字学术版本须“受数字范式引导”,那么真正的数字版本而非被动数字化的版本,就理应吸收机器阅读(machine reading)与计算式认识方式(computational ways of knowing)。

此外,我们该如何出版这些全新的、基于数据驱动、原生数字化、实验性的成果?这些成果本质上“反基础设施”(anti-infrastructure),而现行出版体系又高度倚赖规范化。书名中特意包含“and publishing”,正是因为“编辑工作从根本上植根于出版”(Ohge 2021, 16)。

这一切的关涉的重要性(stakes)远比许多人想象得高。批判性版本仍然是人文研究的核心,是我们理解过去与现在的重要方式。如果这个领域无法“实现一种能够真正呈现文本流动性(textual fluidity)与文本关系(text relations),并在学术层面可行、在计算上可处理(computationally tractable)的超文本”,那么如 Joris van Zundert 所言,我们将“几乎无法超越书籍”,并“将数字学术版本的存在意义降格为媒介形式的简单转换”(2016, 106)。这本书,正是面向“超越书籍”的未来。

本书的内容分为五个部分:“Contexts”(语境与背景)、“Platforms and pragmatics”(平台与实践方法)、“Automation and analytics”(自动化与分析)、“Possibilities”(可能性探索)与“Projects”(项目与案例)。这些主题分类只是大致的指引,因为许多章节完全可以归入多个类别。作为跨学科的论文集,其中一些论文扎根于数字学术编辑传统,而另一些则来自其他学科视角;有些论文极为务实,源于实际编辑工作的经验,而另一些则更具前瞻性,探讨真实或想象中的可能技术。

当然,任何书籍都存在局限。例如,本书对于编辑与版本中的数据伦理(data ethics)讨论略显不足;若能纳入更多来自全球南方(Global South)及边缘社群的声音,亦会更为丰富。

贯穿全书的,是作者们对于数字版本与其前身之间延续性的深刻理解,以及这样的认识:关于数字版本的讨论“必须根植于过去数十年来的学术编辑(scholarly editing)论争”(Robinson 2013, 107)。这样的讨论,是数字编辑与出版在未来继续服务学术界与公众的前提。


This book is a book that looks to a future beyond the book. To be slightly more specific, this is a book about the future of digital scholarly editions and how they are published and consumed. Scholarly editions are expert-curated versions of a manuscript or set of documentary materials which, through the provision of critical apparatus – helpful aids such as introductions or contextual notes – allow readers to engage with and better understand a work’s content and social contexts. Scholarly editions are, quite simply, the critical representation of a text or documents. Digital scholarly editions, then, are scholarly editions which have been developed and published using digital (which these days, typically means web) technologies.

Readers hoping for a more expansive definition of digital editions are fortunate, for this is a field that has been well served by excel- lent theory and practice (Shillingsburg 1996; Price 2008; Gabler 2010; Earhart 2012; Schreibman 2013; Driscoll and Pierazzo 2016; Pierazzo 2016; Apollon, Bélisle and Régnier 2017; Boot et al. 2017; Kelly 2017; Ohge 2021). But there is perhaps no better starting point than Patrick Sahle’s definition, which reads: ‘Scholarly digital editions are scholarly editions that are guided by a digital paradigm in their theory, method and practice’ (2016). To be ‘guided by a digital paradigm’ means that there is a marked difference between that which is digital and that which has merely been digitised: a PDF-copy of a print edition, for example, is not guided by a digital paradigm, it is a digital surrogate of an edition guided by a print paradigm. This book is about the future of editions which are digital, editions which are the critical representation of a text or documents and have been guided by a digital paradigm (or, as some may argue, have intentionally not been guided by a digital paradigm).

The term ‘critical’ in the context of scholarly editions can sometimes be ambiguous, and it is often contentious. Traditionally, ‘critical’ denotes historical – say, ancient or premodern – editions curated with a focus on textual authenticity, on determining ‘correct’ version of a text, the version most aligned with the author’s ‘intent’. Such editions usually become the standard reference for scholars and readers because they are reliable, compiled by experts who have dedicated considerable time and effort to resolving the many alter- ations that appear as texts pass through time and are repeatedly transcribed or translated or interfered with in some fashion. But the term ‘critical’ is increasingly being used in a broader sense to refer to any edition which offers supplementary materials designed to make its content more intellectually accessible. To avoid confusion, Frederike Neuber suggests that the term ‘enriched’ should be used to evoke this broader meaning, with ‘critical’ being reserved for its traditional meaning, but adding further to this particular debate is not the purpose of this book (Neuber 2014).

This book is intended, as noted, to explore the future of digital scholarly editions and publishing, and it does so from that broader perspective that scholarly editions are critical representations of cultural materials, really any kind of cultural material from any period (but of course, much of the emphasis will be on text, because so much of our documentary disciplines and cultures are concerned with text). Scholarly editions, critical editions – whatever you want to call them – are trustworthy primary sources that have been finessed and interpreted by experts for the benefit of researchers, students and readers. If one wants an example of what a digital edition looks like, a quick web search for the wonderful digital resource called The Catalogue of Digital Editions will provide just that (Franzini, Terras and Mahony 2016). There were 323 editions listed in The Catalogue at the time of writing. And in this age of misinformation, they have never been more important.

But it sometimes feels as though the digital edition has given us nothing new. Despite all the affordances of computers, the making of digital editions remains a largely ‘industrial craft’, often ‘manual and bespoke’ (Whittle, O’Sullivan and Pidd 2023), often web-based re- creations, rather than reincarnations, of print resources. Scholarly editions as they existed before the digital and digital scholarly editions, even those developed in recent years, often seem like almost identical modes of representation, intrinsically connected to logic of the codex. But maybe this is the way it should be, a recognition that digital schol- arly editing is, in essence, an exercise in close reading. Editing, done well, should be an intimate endeavour. And the codex format, for all its limitations, has served efficient reading and referencing since the early Middle Ages. Considering the ‘real continuity’ between digital editing and its antecedents (Robinson 2002), it is perhaps unsurprising that we have seen such stability in the forms that editions take.

But at the very least that stability warrants problematisation, and as Peter Robinson contends, the digital ‘is perfectly adapted to enactment of editions as an ever-continuing negotiation between editors, readers, documents, texts and work’ (2013, 127). That nego- tiation still has much to reckon with: born-digital editions, digital editions as cultural analytics, the use of AI and editing, the changing nature of reading and attention, the changing nature of the word ‘critical’, the ways in which we publish the digital editions we craft.

The methodologies with which we approach digital editing do not seem to have kept pace with the changing nature of expression, with the desperate need for critical editions of born-digital forms which dominate the contemporary cultural conversation – for example, social media and video games.

Editorial practice has not kept pace with the affordances of Natural Language Processing and Machine Learning. Katherine Bode criticises the digital humanities for a culture of separating those who gather and edit from those who do statistics and analyse (2019). The thoughtful craft of editing is seen as something other to the mechan- ical, scientific work of cultural analytics. But if we are to view digital scholarly editions as being ‘guided by a digital paradigm’, then it stands to reason that truly digital editions, rather than digitised editions, would make use of machine reading, of computational ways of knowing.

And how do we publish any of these new, data-driven, born-digital, experimental things that are inherently anti-infrastructure and poorly served by a publishing industry that insists on standardisation? The ‘and publishing’ part of this book’s title is quite intentional, because ‘editing is fundamentally grounded in publishing’ (Ohge 2021, 16).

In all these matters, the stakes are higher than some might think. Critical editions remain central to arts and humanities research, to authoritative explorations and analysis of our past and present. If the field fails to ‘implement a form of hypertext that truly represents textual fluidity and text relations in a scholarly viable and compu- tational [sic] tractable manner’, then we will get, as Joris van Zundert puts it, ‘barely beyond the book’; we will ‘relegate the raison d’être for the digital scholarly edition to that of a mere medium shift’ (2016, 106), leaving us with digitised, rather than digital, editions. This book is a book that looks to a future beyond the book.

Its contributions have been divided across five sections: ‘Contexts’, ‘Platforms and pragmatics’, ‘Automation and analytics’, ‘Possibilities’ and ‘Projects’. These thematic divisions are only intended to serve as the faintest of guides through the collection, as many of the chapters could easily have been situated under a few if not all these categories. It is an inherently interdisciplinary collection of essays, some of which are firmly rooted in digital scholarly editing as a discipline and existing body of knowledge, while some essays offer alternative disciplinary perspectives. Some essays are wholly prag- matic, born of the functional experience that one only gets from getting the exhausting but rewarding work of real edition making, while some are speculative, exploring the possibilities of practices both real and imagined. There are, as with any book, certain limita- tions. Data ethics in the context of editing and editions, for example, might warrant greater discussion in this collection, while a greater number of perspectives from the Global South and marginalised communities would have been welcome.

Across all chapters, readers will find a deep appreciation and respect for the aforementioned continuity between digital editions and their predecessors, an acknowledgement that debates around digital editions ‘must be rooted in the debates about scholarly editing which have unrolled over the last decades’ (Robinson 2013, 107). Such debate is a precondition for a future in which digital editing and publishing continue to serve both scholarly and general publics.


四、章节目录


 第一部分:语境 

 Section I. Contexts 


第1章

“过去朝那边走了”:后视镜中的编辑?

 'The past went that-a-way': editing in the rearview mirror?

Andrew Prescott

本章以 McLuhan 的“后视镜效应(rearview effect)”为隐喻,讨论编辑实践如何在面对数字技术时习惯性地以旧媒介为参照。作者通过印刷初期模仿手稿、摄影借鉴绘画等例子,说明文本技术史上“以旧塑新”的倾向同样影响数字版——许多在线版本仍只是纸本版的网页翻版或影像替身。文章呼吁编辑者正视这种“开车只看后视镜”的危险,重新思考数字环境中版本应如何突破 codex 逻辑,真正利用网络的连通性、动态性与多视角展示能力。

第2章

我们为谁而编辑?数字出版如何改变学术版本的作用 

Who are we editing for? How digital publication changes the role of the scholarly edition

Cathy Moran Hajo

本章从“读者是谁?”这一问题出发,反思数字出版如何重塑学术版本的功能与责任。作者以 Jane Addams 及其他文献项目为例,指出数字环境打破“只为学者服务”的传统定位,使编辑必须同时考虑学生、公众、家族后代、社群组织等多元受众。章节讨论开放获取、教学使用、社群参与与说明性写作之间的平衡,并强调编辑者在数字时代不再只是“文本校勘者”,而是需要主动设计界面、解释语境与策划阅读路径的公共人文中介者。

第3章

数字学术编辑与知识技术危机 

Digital scholarly editing and the crisis of knowledge technology

作者:Helen Abbott, Michelle Doran, Jennifer Edmond, Rebecca Mitchell, Aengus Ward 

本章把数字学术编辑置于更大的“知识技术危机”之中考察:当科研评价、开放科学、商业平台与数据资本主义重塑知识生产,数字版本究竟扮演什么角色。作者们从多学科视角出发,分析数字基础设施的集中化如何影响项目可持续性、学术自主性与数据主权,并探讨开放数据、协作网络与公共基础设施对版本未来的重要性。章节主张以批判的技术意识重新设计编辑工作流程,使数字版本既能服务研究,又能抵抗对知识的过度商品化,提出了“激进迭代编辑”(Radical Iterative Editing)的概念。

第4章:反基础设施:数字学术编辑的全球方法 Against infrastructure: global approaches to digital scholarly editing

Raffaele Viglianti, Gimena del Rio Riande

本章以“反基础设施(against infrastructure)”为题,批判当前数字人文界对大型、昂贵、欧美中心化基础设施的迷恋 。作者通过拉美与全球南方案例,展示在不稳定网络、有限经费与多语种环境下,学术社群如何发展轻量、分散、在地化的编辑实践。他们主张,与其追求单一、统一的平台,不如承认多中心、多标准、多语种的生态,以开放协议、小工具组合与社区维护的方式推动数字学术版本的全球合作。


 第二部分:平台与实用主义 

 Section II. Platforms and Pragmatics 

第5章

构建可访问性:开发数字版本与项目的平台和方法 

Building accessibility: platforms and methods for the development of digital editions and projects

Erica F. Cavanaugh, Jennifer E. Stertzer

本章聚焦“可访问性(accessibility)”,从 Washington Papers 与 Center for Digital Editing 的实践出发,讨论如何在平台与工作流设计初期就纳入无障碍原则。内容涵盖对屏幕阅读器友好的标记、可感知的导航结构、语义化 HTML/TEI、色彩与对比度规范以及移动端适配等。作者强调,可访问性并非后期“加一个插件”的问题,而是关乎编辑伦理与公共责任,决定数字版本能否真正服务有障碍的读者与更广泛的社会公众。

第6章

浏览、搜索与偶遇:构建可获取的数字版本 

Browse, search and serendipity: building approachable digital editions

Alison Chapman et al.

本章以 Digital Victorian Periodical Poetry Project (DVPP) 为核心案例,本章探讨如何在界面设计中平衡浏览(browse)、检索(search)与偶得(serendipity)。作者分析用户如何通过策展子集、标签系统、可视化入口与多层检索逐步深入诗歌语料,并展示 DVPP 首页与诗歌记录页的设计理念。章节强调,“可亲近的版本(approachable editions)”不仅要提供复杂学术功能,还要让初次进入的学生与非专业读者也能通过探索与偶然发现建立兴趣与理解。

第7章

在FAIR数据原则语境下预测数字学术版本的未来 Predicting the future of digital scholarly editions in the context of FAIR data principles

Bartłomiej Szleszyński, Agnieszka Szulińska, Marta Błaszczyńska

本章将数字学术版本置于 FAIR 数据原则(Findable, Accessible, Interoperable, Reusable)的框架下,讨论如何使版本数据真正“可发现、可获取、可互操作、可重用”。作者结合波兰数字项目(如TEI PANORAMA)经验,分析元数据规范、开放许可、持续标识符(如 DOI)、开放 API 与长期保存策略等环节,并借此“预测”未来版本若要融入开放科学生态,必须在结构与政策上同时满足 FAIR 要求,使数据能够被人类学者与机器双重使用。

第8章

版本数据的再利用 

Re-using data from editions

Elena Spadini, José Luis Losada Palenzuela

本章专门探讨“二次利用(re-use)”问题:数字版本中的文本、标注与元数据如何在其他研究中被重新组合。作者通过 DEAF 词典与 Topostext 等案例,展示如何利用对外开放的 TEI、RDF 或特定 API 进行跨版本比对、地理可视化与语义网联结,同时也指出技术碎片化、许可不清与缺乏文档常常阻碍数据再利用。章节最后呼吁编辑者把“可复用性”作为设计目标之一,在建库初期就考虑格式、标注粒度与开放策略。

第9章

基于领域特定语言制作数字学术版本 

Making digital scholarly editions based on Domain Specific Languages

Simone Zenzaro, Federico Boschetti, Angelo Mario Del Grosso

本章提出利用领域专用语言(Domain Specific Languages, DSL)构建数字学术版本的思路。作者以古典文本与铭文项目为例,说明如何将文本模型、编辑规则与用户界面抽象为 DSL,再自动生成 TEI/EpiDoc 文档与工具,从而减少手工编码,提高一致性与可维护性。该章试图打通形式化建模与人文学科实践,主张通过 DSL 让编辑者更清晰地表达版本的结构与解释假设,并为协作开发与长远扩展打下基础。

第10章

作为小版本合作社的21世纪数字编辑与出版 Digital editing and publishing in the twenty-first century as a cooperative for small-scale editions

Juniper Johnson, Serenity Sutherland, Neal Millikan, Ondine Le Blanc

本章基于 NHPRC 与 Mellon 资助的三大数字出版合作体,提出把数字编辑视为一种合作社式(cooperative)出版模式。作者以 Primary Source Cooperative 等项目为例,说明小型或中型文献项目如何通过共享技术平台、编辑经验与运营架构,获得以前只有大型项目才能享有的基础设施与可见度。章节强调合作模式的三大优势:资源共享、跨主题的内容协作与社群支持,并指出这种自下而上的出版生态有助于降低门槛、扩大学者主导项目的多样性与包容性。


 第三部分:自动化与分析 

 Section III. Automation and Analytics 

第11章

学术数据版本:21世纪的大数据出版 

The scholarly data edition: publishing big data in the twenty-first century

Gábor Mihály Tóth

本章提出“学术数据版本(scholarly data edition)”概念,将数字版本从单一文本扩展到大型数据集,特别是口述证词与历史记录等“巨量档案”。作者借其 Holocaust 证词项目经验,讨论如何在结构化数据库、可视化接口与叙事文档之间取得平衡,使研究者既能进行宏观数据分析,又能回到具体个案。章节强调,数据版本需要在建模、标注与界面层面保持透明与可解释,以免“大数据”抹平个体经历的复杂性。

第12章

探索性版本中的精读与远读:分布式认知与交互式可视化 

Close and distant reading in explorative editions: distributed cognition and interactive visualisations

Peter Boot

本章将“精读(close reading)”与“远读(distant reading)”视为同一探索性版本中的两极,通过交互式可视化与网络图等工具,在读者与界面之间形成“分布式认知(distributed cognition)”。作者结合多种数字版项目,展示如何用时间轴、网络、地理与主题聚类等视图引导读者发现模式,再回到文本细节进行解释。章节主张,真正的“探索式版本(explorative editions)”不是给出唯一的权威阅读,而是提供一个认知环境,鼓励读者在可视化与文本之间来回穿梭。

第13章

共乐性与标准:人工智能之后的开放获取出版

Conviviality and standards: open access publishing after AI

Will Luers

本章从“共乐性(conviviality)”与开放标准的角度思考 AI 时代的开放获取出版。作者关注的是,当生成式 AI 与自动化工具大量介入文本生产后,小型实验性期刊与数字版如何在不被平台逻辑吞噬的前提下,维持社区感与手工策展。章节探讨以轻量标准、可互操作格式与去中心化协议构建友好而可持续的开放出版生态,让编辑、作者与读者之间保持人际互动与批判空间,而不仅仅是算法驱动的内容分发。


 第四部分:可能性 

 Section IV. Possibilities 


第14章

超越再现:关于创造性批判数字编辑的思考

Beyond representation: some thoughts on creative-critical digital editing

Christopher Ohge

本章以 Melville Electronic Library 等项目为例,本章思考数字编辑如何超越“再现文本”的传统目标,转向更具创造性的“创意—批评(creative-critical)”实践。作者讨论版本中的修订叙事、可视化重排、跨版本对读以及实验性界面如何参与到解释工作中,而非只是中性的展示工具。章节认为,数字版可以成为一种批评写作的形式,通过对文本物质性与传承过程的可视化,激发新的诠释与读者体验。

第15章

重编码支配:TEI标记的酷儿方法 

Re-encoding dominance: queer approaches to TEI markup

Filipa Calado

本章从酷儿理论出发,批判 TEI 标注规范背后隐含的权力与规范性假设,例如二元性别、异性恋中心与作者/文本的单一身份建模。作者通过具体编码例子,展示如何在标记层面“重新编码支配结构(re-encoding dominance)”,为非二元与边缘主体留下空间。章节强调,标注并非中性技术选择,而是一种底层代码的实践;酷儿式编辑要求我们在 schema、标签命名与层级结构中反思何种经验被记录、何种经验被抹除。

第16章

游戏化版本:数字学术编辑的游戏化未来 

The ludic edition: playful futures for digital scholarly editing

Jason Boyd

本章提出“游戏式版本(ludic edition)”概念,探讨如何将游戏机制、互动叙事与玩家角色引入数字学术版 。作者回顾了其在 queer digital humanities 与互动小说方面的实践,设想版本可以通过任务、成就、分支路径与角色扮演等方式,让读者以“玩家”的身份参与到文本探索与诠释中。章节认为,这种玩法并非浅薄娱乐,而是一种新的学习与批评模式,尤其适合在教学与公众人文项目中吸引多元受众。

第17章

无缝版本:用于学习和公众参与的数字版本的未来构想 

Seamless editions: a future imaginary of digital editions for learning and public engagement

Aodhán Kelly

本章描绘了“无缝版本(seamless editions)”的未来想象:版本不再被局限于学术网站,而是嵌入课堂教学、博物馆展览与公共讨论的多种场景。作者结合教育科技与高等教育数字转型的经验,讨论如何通过响应式设计、学习分析、协作标注与多语种界面,使数字版在学生、教师与公众之间流动。章节强调,无缝的关键不在于“隐形技术”,而在于把版本当作社会—教育基础设施来规划。


 第五部分:项目 

 Section V. Projects 

第18章

早期现代课程中的数字学术编辑 

Digital scholarly editing in the early modern curriculum

Lindsay Ann Reid, Justin Tonra

本章介绍作者在 University of Galway 以早期现代戏剧数字版为核心设计课程的经验。学生分组负责转录、标注、版本比较与界面策划,在一个学期内共同完成一部戏剧的在线学术版本。作者详细分析了项目如何培养学生的研究能力、项目管理、团队协作与批判性决策能力,并回顾了近年数字学术编辑教学的国际趋势,主张将数字版本制作纳入早期现代文学课程的常规教学工具。

第19章

调解与连接:爱迪生论文集中的多功能数字出版

Mediating and connecting: versatile digital publishing in the Edison Papers

Caterina Agostini, Paul Israel

本章以 Thomas A. Edison Papers 为例,展示一个长期文献项目如何在多种数字出版形式之间“居中调解(mediating)”并建立连接。作者说明项目如何从传统文献集扩展到影像版、全文检索数据库、教学资源与专题展览,并利用标准化元数据与互操作协议,使不同平台之间可以互相链接 。章节强调,“多用途出版(versatile publishing)”能让同一批档案服务于学术研究、教育与公众历史记忆,是大型文献工程在数字时代的重要策略。

第20章

“现在似乎不可能,未来最不确定”:通过夏洛特·伦诺克斯的《女士博物馆》超越学术界

‘The present therefore seems improbable, the future most uncertain’: transcending academia through Charlotte Lennox's Lady's Museum

Kelly J. Plante, Karenza Sutton-Bennett

本章围绕《Lady’s Museum》数字版,探讨如何通过开放、女性主义与公共人文导向的编辑实践 “超越学院”(transcending academia) 。作者回顾这一18世纪女性刊物的历史与性别政治,并说明数字项目如何在注释、教学资源与公众线上活动中凸显女性知识生产。章节特别关注编辑团队与当代读者、课堂、社群之间的互动,将数字版视为重新激活被忽视文本、连接过去与现在女性经验的平台。

结语

数字编辑与出版的未来 

Conclusion: The future of digital editing and publishing

James O’Sullivan, Sophie Whittle 

结语综述了全书各章节的贡献,强调数字学术编辑在形式上虽与传统纸本编辑存在“真实延续性”,但若停留在媒介转换层面,就无法实现数字范式所承诺的文本流动性与关系可视化。作者重申:未来版本需要同时回应数据伦理、全球南方与边缘社群的需求,以及AI与自动化带来的新机遇与风险 。只有在继承数十年学术编辑争论成果的基础上,继续反思基础设施、受众与出版模式,数字编辑与出版才能在未来真正服务学术共同体与更广泛公众。


参考文献

[1]. Apollon, Daniel, Claire Bélisle, and Philippe Régnier, eds. Digital Critical Editions. University of Illinois Press, 2017.

[2]. Bode, Katherine. “Computational Literary Studies: Participant Forum Responses, Day 2.” In the Moment (blog). https://critinq.wordpress.com/2019/04/02/computational-literary-studies-participant-forum-responses-day-2-3/. 2019.

[3]. Boot, Peter, Angelo Cappellotto, Wout Dillen, Frank Fischer, Alan Kelly, Annemieke Mertgens, Anna-Maria Sichani, Elena Spadini, and Dirk van Hulle, eds. Advances in Digital Scholarly Editing: Papers Presented at the DiXiT Conferences in The Hague, Cologne, and Antwerp. Sidestone Press. https://www.sidestone.com/books/advances-in-digital-scholarly-editing. 2017.

[4]. Driscoll, Matthew J., and Elena Pierazzo, eds. Digital Scholarly Editing: Theories and Practices. Open Book Publishers. https://doi.org/10.11647/OBP.0095. 2016.

[5]. Earhart, Amy E. “The Digital Edition and the Digital Humanities.” Textual Cultures 7, no. 1: 18–28. https://doi.org/10.2979/textcult.7.1.18. 2012.

[6]. Franzini, Greta, Melissa Terras, and Simon Mahony. “A Catalogue of Digital Editions.” In Digital Scholarly Editing: Theories and Practices, edited by Matthew J. Driscoll and Elena Pierazzo. Open Book Publishers. 2016.

[7]. Gabler, Hans Walter. “Theorizing the Digital Scholarly Edition.” Literature Compass 7, no. 2: 43–56. https://doi.org/10.1111/j.1741-4113.2009.00675.x. 2010.

[8]. Kelly, Alan. “Disseminating Digital Scholarly Editions of Textual Cultural Heritage.” PhD diss., University of Antwerp. https://hdl.handle.net/10067/1558180151162165141. 2017.

[9]. Neuber, Frederike. “Defining Scholarly Editions, Pt. 1: Critical vs. Enriched.” Billet. DiXiT (blog). https://dixit.hypotheses.org/356. 2014.

[10]. Ohge, Christopher. Publishing Scholarly Editions: Archives, Computing, and Experience. Cambridge University Press. https://doi.org/10.1017/9781108766739. 2021.

[11]. Pierazzo, Elena. Digital Scholarly Editing: Theories, Models and Methods. Routledge. 2016.

[12].  Price, Kenneth M. “Electronic Scholarly Editions.” In A Companion to Digital Literary Studies, edited by Ray Siemens and Susan Schreibman. Oxford: Blackwell. https://companions.digitalhumanities.org/DLS/?chapter=content/9781405148641_chapter_24.html. 2008.

[13]. Robinson, Peter. “What Is a Critical Digital Edition?” Variants: The Journal of the European Society for Textual Scholarship 1: 43–62. https://doi.org/10.5281/zenodo.6533168. 2002.

[14]. “Towards a Theory of Digital Editions.” Variants: The Journal of the European Society for Textual Scholarship 10: 105–31. https://doi.org/10.1163/9789401209021_009. 2013.

[15]. Sahle, Patrick. “What Is a Scholarly Digital Edition?” In Digital Scholarly Editing: Theories and Practices, edited by Matthew J. Driscoll and Elena Pierazzo. Open Book Publishers. https://doi.org/10.11647/OBP.0095.02. 2016.

[16]. Schreibman, Susan. “Digital Scholarly Editing.” In Literary Studies in the Digital Age: An Evolving Anthology. Modern Language Association. https://doi.org/10.1632/lsda.2013.4. 2013.

[17].  Shillingsburg, Peter L. Scholarly Editing in the Computer Age: Theory and Practice. University of Michigan Press. 1996.

[18]. van Zundert, Joris J. “Barely Beyond the Book?” In Digital Scholarly Editing: Theories and Practices, edited by Matthew J. Driscoll and Elena Pierazzo. Open Book Publishers. 2016.

[19].  Whittle, Sophie, James O’Sullivan, and Michael Pidd. “AI and the Editor.” The Future of Text 4: 106–9. 2023.



注:本文对各章节的介绍与摘要系编辑独立撰写,版权归原作者所有,未经书面许可,严禁转载或用于商业用途


以上部分内容来自书籍发布官网:

https://books.sup.ac.uk/sup/catalog/book/sup-9781917341073

经数字人文资讯小编翻译整理而成

如需转载,请后台私信联系

编译 丨魏翔

校对 丨洪冰凤

排版 丨罗斯鹏


阅读原文

跳转微信打开

会议回顾|“人文智变:数字人文的智慧奇点”学术研讨会暨2025年中国数字人文年会在中山大学召开

2025年12月4日 15:03

2025-12-04 15:03 湖北



2025年11月28日至12月1日,“人文智变:数字人文的智慧奇点”学术研讨会暨2025年中国数字人文年会在中山大学召开。本次年会由中国索引学会指导,中山大学数字人文联合研究院和中国索引学会数字人文专业委员会主办,中山大学数字人文实验室、图书馆、岭南学院、信息管理学院等承办,来自高校、科研机构和文化机构的专家学者400余人齐聚中山大学广州南校园,聚焦数字人文领域前沿议题,开展深入的学术研讨。



11月29日上午开幕式,中山大学党委书记刘承功,中央党史和文献研究院副院长、中国索引学会理事长王全春,中国人民大学原常务副校长、数字人文研究院院长冯惠玲,华中师范大学党委常委、副校长吴丹等单位相关领导与嘉宾出席并致辞。

      刘承功表示,国家重大战略为数字人文发展注入动力,数字人文正以独特的跨学科优势,成为引领未来学术发展的重要力量。中山大学将持续推进“文理交叉、产学研用协同”的数字人文建设格局,努力在新一轮科技革命和人文融合创新中作出中大贡献、展现中大担当。

      冯惠玲认为,党的二十届四中全会强调推进文化和科技深度融合,中国数字人文进入了明显的升温期。数字人文是以新思想、新方法对数字计算和人文研究的破坏性创新,需要以不寻常规的大智慧向传统发问,以全新思维探索并开辟新航道。

      吴丹认为,数字人文需要从消解不确定性转向经营不确定性,智能工具不能仅满足于快速给出判断,更应展现判断背后的依据与逻辑。应当重新理解人文与技术的关系,将对批判性思维的坚守、多元视角的尊重内化为下一代智能工具的设计哲学与演化方向。

      王全春强调,数字人文作为跨学科融合的新兴领域,肩负着特殊的时代使命。中国索引学会将始终为数字人文发展提供坚实的学术支撑。面对新形势新任务,要以巩固文化主体性、服务国家战略、坚持创新驱动、深化开放合作为重点,奋力开创中国数字人文发展新局面。

山大学党委书记刘承功致辞

中国人民大学原常务副校长、国家一级教授、数字人文研究院院长、人文北京研究中心主任冯惠玲致辞

华中师范大学党委常委、副校长吴丹致辞

中央党史和文献研究院副院长、中国索引学会理事长王全春致辞

中山大学副校长、数字人文联合研究院院长谢湜主持开幕式


会上,中山大学发布了由中山大学图书馆、中山大学数字人文实验室研发的特色资源数字人文平台、民间历史文献领域大模型以及民间历史文献智能体等三项最新的重要研究成果。特色资源数字人文平台汇聚多类型资源与数据,借助IIIF、知识图谱与GIS等技术,实现资源的立体呈现与活化利用;民间历史文献领域大模型具备多轮对话与精准语境理解能力,为学者提供专业可靠的知识服务;民间历史文献智能体实现了深度内容挖掘,具有词频统计、知识图谱推理、村名归户预测等功能,助力研究者从庞杂文献中洞察规律。三项成果为人文社会科学研究范式的革新提供了坚实支撑与无限可能。

年会主旨报告环节,香港大学院士叶嘉安、武汉大学信息管理学院院长王晓光、广东美术馆馆长王绍强、中国人民大学历史学院院长胡恒、中山大学副校长谢湜、中山大学原党委书记陈春声、上海社会科学院信息研究所所长刘炜、北京大学数字人文研究中心主任王军、中山大学数字人文实验室主任王蕾、数字人文技术专家周冬波等结合自身研究领域,分享了数字人文与文化遗产保护传承,数字人文在基础理论、学科建设、人才培养、技术创新、基础设施建设、实践应用,以及服务区域与国家战略等领域的新思想、新观点与新探索。主旨报告由中山大学数字人文联合研究院副院长于薇和中山大学人文社科处处长张伟主持。

中山大学数字人文联合研究院副院长、中山大学历史学系(珠海)副系主任于薇主持开幕式主旨报告

中国科学院院士、第三世界科学院院士、香港科学院院士,香港大学讲座教授叶嘉安作主旨报告《数智化年代的文化遗产保育与传承》

武汉大学信息管理学院院长、文化遗产智能计算教育部哲学社会科学实验室主任王晓光作主旨报告《文化遗产信息的具身性及其对数字人文研究的意义》

广东美术馆馆长、中国艺术研究院教授、广东省美术馆协会会长、广东省美术家协会副主席王绍强作主旨报告《面向未来的美术馆:数字化时代的藏品活化、修复管理与AI路径》

中国人民大学历史学院院长、清史研究所所长、数字人文研究院副院长胡恒作主旨报告《清史地理信息系统建设的理念与实践》

中山大学副校长、数字人文联合研究院院长谢湜作主旨报告《学科交叉融通致远 数字人文拓界新程》

中山大学原党委书记、中山大学乡村振兴联合研究院院长、历史学系教授陈春声作主旨报告《数字人文时代的民间历史文献研究——以徽州文书为例》

上海社会科学院信息研究所所长、中国索引学会副理事长兼数字人文专委会主任刘炜作主旨报告《从碳基人文到硅基人文:当智慧挣脱大脑的束缚》

北京大学数字人文研究中心主任、人工智能研究院副院长王军作主旨报告《让典籍重生:从数字化到智能对话》

中山大学数字人文实验室主任、图书馆副馆长、国家文化遗产与文化发展研究院副院长王蕾作主旨报告《微观叙事与宏观史境:基于民间历史文献的中山大学数字人文新探索》

数字人文技术专家周冬波作主旨报告《民间文书人文研究智能体的设计与实践》

中山大学人文社科处处长、人文社科研究院院长、哲学系主任张伟主持闭幕式主旨报告

中山大学数字人文联合研究院执行院长、地理科学与规划学院教授林耿主持闭幕式分论坛总结


本次会议共设10个主题论坛,与会代表通过学术报告、专题论坛、案例分享、圆桌讨论、入选征文报告等形式,围绕数字人文的哲学基础与认识论重构、数字人文基础设施的智慧演进、AGI技术应用、学科建设与人才培养等核心议题展开深入的学术交流。值得关注的是,会议首次创设“探界者论坛”和“数字集市”。“探界者论坛”通过深化跨领域对话,探索数字人文发展面临的热点和焦点;“数字集市”通过项目征集和邀请,展示来自全国数十家研究机构的数字人文研究与项目成果,深入推动中国数字人文理论突破、方法创新与实践应用。

左右滑动查看数字集市现场


作为中国数字人文领域年度规模最大、影响力最广的学术盛会,中国数字人文年会自2019年起已连续7年成功举办,为数字人文相关领域的专家、学者、学生以及从业人员搭建了重要的学术交流和成果展示平台。

2024年,中山大学成立校级新型研究平台“中山大学数字人文联合研究院”。中山大学将集中学术资源和科研力量,加快推进数字人文前沿理论研究、学科建设、人才培养与产学研融合,为粤港澳大湾区建设和国家重大战略作出新的贡献。


来源 | 中山大学数字人文联合研究院


阅读原文

跳转微信打开

会议通知 | “人文智变:数字人文的智慧奇点”学术研讨会暨2025年中国数字人文年会(CDH2025) 会议通知(第四号)

2025年11月28日 14:13

2025-11-28 14:13 湖北

—CDH2025— “人文智变:数字人文的智慧奇点”学术研讨会暨2025年中国数字人文年会2025

—CDH2025—

 “人文智变:数字人文的智慧奇点”

学术研讨会暨2025年中国数字人文年会

2025年11月28日-12月1日,中山大学

会议通知(第四号)

      为贯彻落实教育强国、国家文化数字化、“人工智能+”行动等国家战略,进一步促进中国数字人文发展,在中国索引学会指导下,中国索引学会数字人文专业委员会和中山大学数字人文联合研究院拟于2025年11月28日至12月1日在广州举办“人文智变:数字人文的智慧奇点”学术研讨会暨2025年中国数字人文年会(CDH2025)。会议将围绕数字人文及相关领域的前沿问题,开展主旨发言、会议报告、专题讨论、案例分享、探界者论坛、数字人文成果展示、海报展示等多种形式的学术交流活动。现诚邀国内数字人文领域专家、学者与学生积极参会,共绘数字人文的“智慧奇点”图谱。

      开放注册以来,本届数字人文年会受到了来自各个领域的专家、学者和同学们的关注,在此衷心感谢各位对本届会议的关注与支持!

01

日程安排

02

会议议程

开幕式


数字集市


主旨报告(一)


论坛一:数字人文的哲学基础与认识论重构


论坛二:数字人文基础设施的智慧演进


论坛三:AGI与数字人文工具链、方法论突破 


论坛四:数字人文学科建设与人才培养


论坛五:文化遗产的数字孪生与机构智慧化转型


论坛六:次元文化与交互叙事创新


论坛七:数字人文教育生态及全球建构


论坛八:数字人文的政产学研用协同发展 


论坛九:中华典籍智慧化与多模态研究


论坛十:数字人文研究国际前沿与学术传播


主旨报告(二)



闭幕式



03

探界者论坛


04

数字集市

      为集中展现近年来中国数字人文领域的最新研究进展与应用成果,本届年会于善思堂特别设立“数字集市”展区。该展区秉承数字人文“打破学科壁垒、促进技术与人文学科深度对话”的核心理念,旨在通过多元展示形式推动学术思路的碰撞与融合。数字集市荟萃了本届年会征集入选的优秀海报与项目,并呈现各参会单位在数字人文方面的前沿探索与创新实践。

      展区依内容特色划分为三个主题区域:“万象同席·广场”“星瀚集萃·廊坊”与“南风有韵·宝阁”。所展示的项目类型丰富多元,涵盖数据库、软件工具、数字平台、可视化作品、XR交互设计作品、大模型及智能体等多个研究方向,集中体现了数字人文的方法创新与学科活力。

数字集市导览图:

05

酒店信息

1. 中大凯丰酒店(广州中大学人馆店)

(1)广州市海珠区滨江东路中山大学北门科技文化交流中心

(2)酒店联系人:吴经理,18923099438;酒店前台,020-89222888

2. 亚朵酒店(广州滨江东路店)

(1)广州市海珠区滨江东路795号

(2)酒店联系人:阿则,15920305265

3. 全季酒店(广州中大地铁站店)

(1)酒店地址:广州海珠区怡乐路76号

(2)酒店联系人:符经理,19124840669

4. 广州珀丽酒店

(1)酒店地址:广州市海珠区江南大道中路348号

(2)酒店联系人:罗经理,13902294843


附:住宿酒店地图

本次会议不安排大巴接送,请参会人员自行前往会场。

06

报到注册

      入住会议协议酒店的参会代表,请于 2025 年 11 月 28 日 14:00-20:30 在入住酒店大堂办理注册报到。

      11 月 28 日未办理注册报到的代表,以及不入住会议协议酒店的参会代表,请于 2025 年 11 月 29 日 8:00-9:00 在会议开幕式会场(中山大学善思堂国际会议厅)现场办理注册报到。

      报到注册后领取会议证件和材料,凭证参会,请妥善保管。

07

会务联系

会议邮箱:dhlab@mail.sysu.edu.cn

会务咨询:会议期间,请联系会议手册上相应事项工作人员

会议网站:https://sztc.sysu.edu.cn/2025/index.html

08

组织机构

指导单位

中国索引学会

主办单位

中国索引学会数字人文专业委员会

中山大学数字人文联合研究院

承办单位

中山大学数字人文实验室

中山大学图书馆

中山大学岭南学院

中山大学信息管理学院

中国索引学会广东中心

协办单位(按笔画顺序排列)

上海大学数字人文研究与发展中心

上海外国语大学中国国际舆情研究中心

上海师范大学数字人文研究中心

上海图书馆历史人文大数据中心

上海理工大学图书馆

山东省高等学校齐文化传承创新与数字人文实验室

山西大学图书馆山西数字人文研究院

云南大学历史与档案学院“数字人文”工作室

中国人民大学数字人文研究院

中国社会科学院大学数字史学研究中心

中国社会科学院文学研究所数字信息研究室,数字人文与计算批评实验室

中国音乐学院图书馆

天津师范大学古文献学与数字人文研究中心

内蒙古自治区科技文化遗产认知智能重点实验室

北京大学数字人文研究中心

北京师范大学珠海校区图书馆数字人文中心

华中科技大学人文学院汉籍数字化实验室

华东师范大学调查与数据中心

西南大学中希文明互鉴中心

传统地方戏曲资源数字化保护与智能共享四川省文化和旅游厅重点实验室

齐鲁工业大学(山东省科学院)数字人文研究中心

武汉大学文化遗产智能计算实验室

武汉大学数字人文研究中心

重庆大学科幻文学与科技人文研究中心

南京大学中华文明数智创新实验室

南京大学高研院数字人文创研中心

南京师范大学数字与人文研究中心

南京师范大学语言大数据与计算人文研究中心

南京农业大学数字人文研究中心

复旦大学大数据研究院人文社科数据研究所

清华大学中国古典文献研究中心

媒体支持(按笔画顺序排列)

《古籍数字人文研究》

《农业图书情报学报》

全国报刊索引

《数字人文》

《数字人文研究》

「DH数字人文动态」公众号

「DSLL数字语言文学研究」公众号

「SHNU数字人文」公众号

「中山大学InformationWorld」公众号

「中山大学图书馆」公众号

「中山大学数字人文联合研究院」公众号

「中希文明互鉴中心」公众号

「文化遗产智能计算文科实验室」公众号

「文学审美客观研究」公众号

「比特人文」公众号

「四十二史」公众号

「古代汉语信息处理」公众号

「汲古求新」公众号

「西安地图出版社」公众号

「弘雅书房」公众号

「社科大数字史学实验室」公众号

「空间人文与场所计算」公众号

「图情会」公众号

「京狮人文DH」公众号

「南京大学中华文明数智创新实验室」公众号

「科技文化遗产认知智能重点实验室」公众号

「数字人文」公众号

「数字人文开放实验室」公众号

「数字人文研究」公众号

「数字人文资讯」公众号

「数据大狮」公众号

 上海师范大学数字人文网



阅读原文

跳转微信打开

学术前沿 | 超越文本中心主义:多模态技术驱动下的中文数字人文转型

2025年11月21日 14:21

刘炜 单蓉蓉 等 2025-11-21 14:21 湖北

多模态技术的兴起为中文数字人文开辟了转型路径。本研究首先剖析了文本中心主义的局限,继而探讨多模态融合技术的关键突破,以DeepSeek的Janus Pro模型为例,论证统一多模态大模型在古籍数据化、智能体构建与文化遗产保护等方面的应用潜力。

图源 | Internet

刘 炜1 单蓉蓉2 金家琴2,3

1.上海社会科学院信息研究所,上海,200235; 

2.上海大学文化遗产与信息管理学院,上海,200444;

3.上海图书馆,上海,200031

 摘要 


数字人文研究长期以文本分析为核心,但“文本中心主义”范式在中文语境下暴露出字符集覆盖不足、OCR识别率不高、非文本文化信息流失等问题,限制了对中国物质与非物质文化遗产的系统研究。多模态技术的兴起为中文数字人文开辟了转型路径。本研究首先剖析了文本中心主义的局限,继而探讨多模态融合技术的关键突破,以DeepSeek的Janus Pro模型为例,论证统一多模态大模型在古籍数据化、智能体构建与文化遗产保护等方面的应用潜力。研究表明,多模态技术通过跨模态协同重构文化记忆、强化文化认同,为中文数字人文的转型发展提供了技术支持与方法论重构的双重支撑。

关键词

数字人文 文本中心 统一多模态大模型 DeepSeek 多模态技术

引用格式

刘炜,单蓉蓉,金家琴.超越文本中心主义:多模态技术驱动下的中文数字人文转型[J].信息资源管理学报,2025,15(5):14-20.

01

引言

早期以文本为中心的基础设施建设虽对数字人文的发展起到了推动作用,但同时也形成了“文本中心主义”,局限了中文数字人文的研究视野,多模态大模型技术的兴起则为突破这一局限提供了新的可能。以DeepSeek为代表的统一大模型通过整合图像、音频、视频、3D模型等多源异构数据,不仅提升了文化遗产保存的全面性,也支持历史语境的多维重建和社会记忆的沉浸式再现,进一步赋能中文数字人文平台建设与跨学科融合。

02

中文数字人文的困境:文本中心主义的茧房

文本长期被视为文化遗产的核心载体,其数字化处理构成了数字人文研究的基石。但过度依赖文本分析导致研究视野受限,正如Meeks[1]所言,数字人文“过于偏重文本”(too text heavy),Champion[2] 、Manovich[3]、Paul[4]等学者也批评了这种单一的文本分析范式,呼吁关注图像、音频、视频、3D模型等非文本媒介,以捕捉文本难以承载的情感维度、行为特征和社会动态。在中文语境下,文本中心主义的局限性表现更为明显。

2.1 中文文本处理的结构性局限

(1)字符集覆盖不足,阻碍古籍数据化。尽管Unicode、GBK、UTF-8等字符集不断扩容,但难以覆盖古籍中的异体字、俗写字和合文符号。首先,俗写字、合文字符需要人工标注或自定义编码,处理速度慢;其次,甲骨文、金文等象形文字难以纳入通用字符集,需拓片或手绘复原保存;最后,受经济成本制约,开发专用字库成本高且有一定的滞后性,中小型研究机构难以承担。

  (2)光学字符识别(OCR)准确率受限于复杂的文献形态。印刷文本的OCR识别率可达94%,但古籍因纸张脆化、墨迹晕染和排版等问题,识别率仅在70%至80%左右。现有OCR识别障碍主要包括:保存不当造成字形变异、缺失;竖排无标点、批注穿插的排版格式造成机器识别困难;手写体与印刷体混合,以及藏书印章等特殊符号会被误判为乱码或噪声;商业OCR工具对古籍适配性不足,需要定制开发。

  (3)标准化处理造成文化意涵流失。汉字兼具视觉与文化意义,其数字化处理不仅是符号转译,更是文化语境的抽象。然而在文本转码过程中,甲骨文的象形特征、青铜器铭文的铸造痕迹、金石碑帖的题跋印章等非文本信息常被简化或剥离忽略,这些要素对学术考据与艺术鉴赏至关重要,标准化处理会大幅压缩文化信息的维度。

2.2 物质文化研究的多维需求挑战:从单一文本到多维全息的研究范式转型

物质文化研究融合人类学、考古学、历史学等多学科,关注物理的空间形态、材质、工艺及感官特征。传统文本记录虽能部分描述物质特征,却无法呈现其动态性与交互性。尤其是传统戏曲、杂技美术、民俗活动等非物质文化遗产,亟需多模态技术实现全息数字化保存。随着当代物质文化研究范式转向“回归到物”[5],激光雷达、摄影测绘、3D模型等现代技术已应用于文物遗址的数字化重建,其中高精度扫描可有效揭示微观工艺特征。考古遗址的空间特征、民宿活动的音像动态、传统艺术的技艺与情感表达等非文本信息,均亟待全息多维的记录与分析。

2.3 文本中心主义的系统性缺陷

首先,囿于文本中心主义的认知框架,传统技术方法过度依赖文本分析,忽略了其他信息。例如,古籍研究中的纸张纤维结构特征、墨迹氧化程度等信息对鉴定文献年代至关重要,但这些微观信息需要显微成像和材料分析技术才能获取解析。其次,传统自然语言处理工具对非结构化数据的处理能力不足,如词频统计和主题建模难以解析音律模式、动作编码等多模态数据。这种局限性使得多模态表达被简化为线性文本描述,造成信息维度的扁平化[6],进一步强化现有的文本中心主义,导致非物质文化遗产在数字化进程中面临二次边缘化风险。

  突破文本中心的桎梏需要构建多模态融合的研究范式,这既是技术层面的创新,也是方法论上的重构。在技术层面,3S技术(GIS、RS、GPS)、三维激光扫描仪(3D Li-DAR)、扩展现实技术(XR)、3D打印技术以及人工智能等技术集群的协同应用,可实现空间数据、影像数据等多源信息的采集和处理,为物质文化的数字孪生构建、文化遗产保存修复提供技术支撑。在方法论层面,跨模态分析成为变革性方法,利用元数据、知识图谱、关联数据构建多模态资源组织框架,通过微调、检索增强生成(RAG)、预训练等范式提高模型的理解能力,实现跨模态信息交互和融合。

  多模态研究促进人文研究从文本解析转向物质性关注,增强文化表达的多样性。沉浸式数字、虚实融合的阐释方式不仅能更生动地传递文化内涵,还能重塑历史认知、文化保存与文化认同建构的路径——通过技术赋能让物质文化成为可感知、可交互的知识载体。

03

多模态融合的解决方案:从多模态大模型到统一多模态大模型的技术突破

3.1 多模态大模型的发展历程

随着人工智能技术的发展,多模态大模型从单模态的文本大模型(Large Language Model,LLM)发展到跨模态协同的多模态大模型(Multimodal Large Language Model,MLLM),再到统一架构和参数的统一大模型(Unified Multimodal Large Models或Large Multimodal Models),其核心突破是解决了模态割裂、任务冲突和计算效率等问题,为多模态数据处理提供了新方案。

  早期多模态研究主要聚焦于“图像-文本”两个模态的对齐,通过对比学习实现跨模态的特征映射,如CLIP(Contrastive Language-Image Pretraining)模型,图像编码器和文本编码器共享一个向量空间,实现跨模态信息交互与融合。随后,ViLBERT、DALL·E和Stable Diffusion等模型进一步探索“视觉-语言”任务,采用“预训练+微调”的范式,在图像生成、视觉问答等任务的性能显著提升。但这些模型仍面临三大瓶颈:一是模态割裂,即图像与文本各自独立编码,简单拼接后输入下游任务模块,这种浅层融合的策略难以捕捉模态间的深层语义关联,信息利用效率低下;二是计算冗余,即不同模态独立编码导致参数臃肿、计算推理效率低;三是泛化能力有限,即受限于训练数据的分布,在面对新的模态组合或任务时,表现欠佳,如Stable Diffusion在生成少数群体图像时存在偏差。

  这些问题的根源在于早期多模态模型缺乏统一的表示框架和跨模态推理机制。随着计算能力和数据规模的提升,研究者转向统一多模态大模型的研究,谷歌的Gemini率先采用Transformer架构统一处理文本、图像、音频等多模态数据。目前,统一多模态大模型主要有Flamingo、Liquid、Chameleon、ILLUME、PaliGemma 、OFA、Uni-MoE、GPT-4o、ImageBind、悟道系列以及文心一言(ERNIE-ViLG)。这类模型通过共享底层参数或模块,将不同模态的数据映射到统一特征空间,从而提升任务效率、降低计算成本,并增强跨模态语义关联能力。

3.2 统一多模态大模型的概念与技术特征

多模态模型是指能够处理多种模态信息的模型,统一多模态大模型则进一步强调在同一模型内部,实现多种模态数据高效协同。其关键创新在于“模态共享-表示统一-任务融合”三个层面,具有如下技术特征:

  (1)统一表示空间。图像、文本、音频等多模态数据嵌入在同一语义空间,模型能够无缝处理任意模态组合,避免传统模型中独立编码造成的信息割裂问题。

  (2)跨模态迁移能力强。多模态信息共享参数使得模型在一个模态上获得的知识可以迁移至其他模态。例如,模型在理解图片的过程中也能提升视频场景理解能力。

  (3)泛化性优异。通过零样本(zero-shot)和少样本(few-shot)学习机制,模型可以快速适应新任务和新模态的组合。模型在文化遗产、古文献、“冷门绝学”等数据稀缺的“低资源场景”下依然保持良好性能。

  (4)计算效率更高效。采用动态计算、混合专家模型(Mixture of Experts,MoE)与条件激活机制,解决了传统模型参数冗余问题,在保持高性能的同时显著降低计算成本。

  (5)模态间动态融合机制。区别于“拼接式”融合策略(如GPT-4、CLIP模型都是简单将图文连接输入),统一模型根据任务语境智能调整模态间的权重或注意力分配,从而实现更精细的协同推理。

  这一系列特性使得统一多模态大模型具备通用智能的雏形,尤其适合用于需要多维感知与解释的文化遗产、艺术表达与历史重构领域。

3.3 DeepSeek的Janus Pro模型:突破与实践

DeepSeek开发的Janus Pro模型在众多基准测试中领先其他统一大模型,其设计理念可概括为类脑功能的分化和整合:在理解路径(左脑)中,模型通过SigLIP编码器提取图像语义特征;在生成路径(右脑)中,则依托VQ Tokenizer图像生成编码器实现图像重构;在中枢融合(胼胝体)中,通过共享Transformer架构实现深度协同。

  这种设计不仅提升了模态间的联动性,也显著减少了模型参数和训练成本,在实际应用层面还具备以下显著优势:一是开源和可调适性强,模型全面开放权重与接口,支持二次开发,降低了技术壁垒,推动创新生态的形成;二是轻量化部署能力突出,适配边缘计算设备运行,尤其适用于博物馆、图书馆等需要本地化处理的终端展示场景,增强用户体验和数据安全性;三是中文语境友好,在大规模中文语料预训练基础上,针对中文古籍、碑帖、手写体等特有特点做了结构优化。在文本还原、风格识别、内容生成等关键任务中表现出色,特别适合中文数字人文的研究场景。

  Janus Pro模型凭借“轻量开发-高效融合-性能卓越”的特性,已成为连接人工智能技术与人文研究的重要桥梁,为实现多模态数字人文研究提供了坚实的技术基础与工具支持。

04

应用展望:统一多模态模型赋能中文数字人文平台建设

以Janus Pro为代表的统一多模态模型,为中文数字人文构建跨模态协同的新型基础设施提供了技术支持,也为文化遗产的数字化保护与传播打开了新的可能。以下从古籍数字资源建设、数字人文研究的智能体、数字人文互动体验、文化遗产保护传承以及跨学科研究方法革新五个方面,展望统一多模态模型在中文数字人文平台建设中的应用。

4.1 提升中文古籍数字资源建设能力

统一多模态大模型的多模态处理和深度理解能力,有助于提高古籍资源建设效率。

  (1)图文识别协同处理。针对古籍中的手写体、异体字、简化俗写字等非标准字体,模型可实现图像识别与文字补全的协同处理,弥补传统OCR在准确率方面的不足。GLAM机构通过预训练《四库全书》《中国方志库》等大型古籍语料库,并嵌入甲骨文、变体字异体字等专业字库后,模型在古文字识别领域表现优异。

  (2)文本整理和校勘辅助。Janus Pro支持批注层、正文图像以及印章图像的并行解析,能够同时处理刻本文本和手写批注。模型可智能识别校勘讹误,提供版本比对参考,并生成符合文献学规范的断句和修订建议,从而提升古籍的整理效率与准确性。研究机构可根据需求定制开发功能,进一步优化模型在文献整理中的表现,满足多样化的学术需求。

  (3)白话文翻译与注释生成。通过嵌入式语义建模与历史语境重建,模型不仅能够为古籍内容添加标点,还能生成通俗易懂的白话文翻译和注释,增强文本的可读性与教育传播价值。这一功能特别适合古籍普及,使晦涩的历史文献更易为大众理解与欣赏。

  (4)知识图谱构建和文化资源整合。Janus Pro还可从古籍、档案、口述史等多源文本中自动提取人物关系、历史事件、文化现象间的关联信息,构建结构化的知识图谱。这种多维度的文化资源关联分析为研究者提供了超越传统线性阅读的知识探索路径。

4.2 构建智能体助力数字人文研究

在科研应用层面,基于Janus Pro开发的智能体可作为“数字人文研究助手”参与研究流程。

  (1)数据分析助手。多模态智能体可以高效处理大规模文本、图像和其他异构异源数据,执行关键词提取、文风识别、情感分析、主题演变等任务,为文学、历史、语言研究提供定量依据。例如,在唐宋诗词研究中,模型能精准分析用韵规律、情感表达特征与主题演变轨迹,为文学史研究提供可靠的定量分析支持。

  (2)历史情境重构工具。通过挖掘历史图像、壁画、地图、实物模型中的时空要素与社会符号,协助支持研究者模拟构建历史场景。这种基于证据的虚拟环境重建,为传统文化研究提供了沉浸式的研究范式,使抽象的历史概念获得具象表达。例如,在分析古代城市布局时,作为工具的智能体可结合文献记载与考古图像,生成三维时空模型,助力研究者探索城市变迁与社会结构的互动关系。

  (3)创作辅助系统。Janus Pro基于对传统文化的深度理解与文本生成能力,不仅能生成符合特定历史风格的文学作品草稿、绘画创意构思、文献综述框架,还能模拟不同学术流派的思考路径,提供多元化的研究视角与方法论建议,激发研究者的创新思维,辅助生成文学作品、绘画草图、文献综述等内容。

  例如字节跳动研发的“识典古籍”平台,利用大模型搭建的古籍智能助手,帮助用户检索、阅读、挖掘古籍知识,提升查阅古籍效率。这些智能研究助手的出现,使研究者能够突破信息处理能力的限制,更加专注于创造性的理论构建与人文洞察,从而推动数字人文研究进入更加高效、精准且富有创造力的新阶段。

4.3 推动数字人文互动体验的具身化升级

Janus Pro模型通过多模态技术与个性化交互设计,可推动数字人文从传统的“静态呈现”向“动态沉浸”的体验转型,构造沉浸式、交互式的虚拟环境,提高用户参与和文化具身化感知,为文化传播与知识普及注入新的活力。

  (1)具象知识图谱生成。将抽象的学术概念或复杂的历史事件转化为可视化、情境化与动作化的形式,显著提升知识的直观性与理解效率。例如,在文字演变研究中,模型生成还原甲骨文、金文至小篆的字形演变过程,并以动画形式展示其形态变化与文化意涵。

  (2)自适应学习平台。根据用户的知识背景、学习历程与兴趣偏好,实时调整内容的深度与呈现形式。智能适配机制同时满足专业研究者的研究需求和普通大众的理解能力,提升数字人文资源的可及性与教育价值。在学习体验设计中,系统会根据用户的学习进度自动构建具身化学习路径,并提供及时的反馈与指导,通过语音讲解、虚拟场景模拟、游戏化互动等方式构建沉浸式学习环境,将传统的文化学习转变为具有高度参与感的沉浸式体验。

  (3)沉浸式导览系统。结合语音识别、空间定位、用户建模和虚拟现实技术,构建沉浸式导览系统与交互平台,为观众提供个性化实时互动体验。例如,在博物馆场景中,系统根据参观者注视焦点和提问内容,调整解说角度和深度,实现“对话式”文化体验。例如,甘肃简牍博物馆导览AI机器人“小简”“小牍”、湖南地质博物馆的“芙妹”智慧导览系统、甘肃省博物馆的“翼讲解”系统都接入了DeepSeek大模型,为观众提供智慧化服务。

  具身化的数字人文互动体验正在重塑公众与文化遗产的关系,使传统文化资源突破时空限制,以更加生动、个性化的方式展示,提升观众的参与感和文化共鸣,提高文化传播的广度与深度。

4.4 创新文化遗产保存和传承

在文化遗产数字化保存、修复和传播中,统一多模态模型发挥着“感知-生成-增强”的全链条作用,为保护与活化文化资源提供了创新路径。

  (1)数字修复辅助系统。结合图像重建技术和文物数据库,模型通过分析断裂碑文、剥蚀壁画或模糊拓片的图像特征,生成修复建议并模拟修复方案。例如,云纺博物馆的“重修玉皇宫”的石碑项目,Janus Pro为碑文内容的修复工作提供了关键依据。这种智能辅助技术不仅提高了修复效率,还最大程度保留了文物的历史真实性。

  (2)数字孪生和虚拟文化空间重建。多模态大模型结合3D建模、光谱分析、语义标签和虚拟现实技术,为建筑遗产、手工艺品、雕塑等构建数字孪生模型。数字重建不仅包括物理形态的精确复现,还融入了文物的历史脉络、使用场景与文化意义等多维度信息,形成“有形+无形”的全息数字档案。这种保存方式特别适用于面临自然风化、环境污染或战争冲突威胁的珍贵文化遗产,可为其提供永久性的数字保存解决方案。

  (3)非遗文化教学和传承。针对非物质文化遗产的保护难题,模型通过对音乐、舞蹈、戏曲、口述历史、武术表演等文化形式进行深度学习与模式分析,能够将抽象的技艺流程、表演规范与文化语境转化为结构化数据,并生成交互式教学模块。这种数字化传承方式尤其适合那些传承人数量锐减、面临失传风险的传统工艺与表演艺术,可为其提供超越时空限制的传承通道。

  这些创新机制正在重塑文化遗产保护的技术路径,使保护工作从“静态保存”走向“动态活化”,既确保了文化遗产的物理安全与信息完整,又拓展了其社会价值与教育功能,实现了保护与传承的有机统一。

4.5 推动跨学科方法融合与理论创新

统一多模态大模型可以桥接不同知识领域,正在促进人文学科与自然科学、社会科学的深度融合,为数字人文研究开辟新的方法论路径。

  (1)跨学科方法集成平台。模型强大的跨领域知识表示能力,不仅整合多源异构的数据,还有效整合文献学、艺术史、计算机视觉、自然语言处理等多学科研究方法,打破传统学科壁垒,为跨学科提供灵活的技术工具箱,构建更为系统化、多维度的研究框架,有助于研究者突破单一学科的方法局限,形成更为全面的认知体系和研究视角。

  (2)认知建模和历史模拟。多模态模型基于多模态历史数据,模拟不同历史主体的语言逻辑、知识结构和决策过程,为历史场景重建和文化想象提供动态仿真系统。基于证据的历史模拟为传统史学研究提供了新的探索工具,使研究者能在虚拟仿真环境中验证历史假设。

  (3)数据驱动的假设验证系统。统一多模态模型从大规模跨学科数据中提取规律,帮助研究和构建理论假设,并通过数据回溯验证其合理性。这种“假设-验证”循环极大提升了传统人文研究的科学性与可靠性,可为经典理论提供新的实证基础。

  这些跨学科方法的融合正在催生数字人文研究的方法论变革,通过提供更加多元的研究工具与分析框架,推动人文知识体系的更新与理论创新。这种“技术赋能+人文引导”的良性互动模式,正成为推动数字人文多模态转型的重要驱动力。

05

风险与挑战:多模态技术的应用边界反思

尽管统一多模态模型在中文数字人文领域展现出巨大潜能,但技术应用过程中仍面临以下挑战与潜在风险:

  (1)文化语义歧义问题。传统文化背景和历史语境仍然是当前AI认知的盲区,图像中的象征意涵、建筑模型中隐含的社会结构、艺术作品中的文化隐喻等复杂符号,AI模型难以正确解读,可能导致语义简化或误读风险。

  (2)训练数据偏误与不透明性。幻觉可以说是大模型的“基因”,多模态模型效果依赖训练数据,而中文历史文化数据分布极不均衡,且训练过程缺乏透明度,可能导致模型“南辕北辙”。对此,需要搭建事实性、权威性的训练数据集或导入专业语料库,并部署RAG技术。

  (3)多模态数据标准缺失。目前图像、音频、视频的元数据体系与语义标注规范尚未统一,研究机构与数据库项目各自为政,影响了跨模态数据的互操作性与知识共享。标准化缺位不仅影响模型训练质量,也限制了研究成果的可复制性与可验证性。

  (4)伦理与再现问题。首先AI依赖海量数据,可能包括个人隐私或机构数据库,若滥用或泄露,可能带来隐私风险。其次数字再现伦理问题,利用AI进行数字重建历史图像、文化仪式或社会场景时,可能偏离历史真实,产生“虚构现实”。因此数字人文实践需要平衡技术创新与“尊重原真性”,需要更完善的人文伦理框架与监督机制。

  (5)小型机构的算力问题。虽然Janus Pro较为轻量,但大模型的部署、维护与微调仍需要较高的算力和技术支持。对于资金、资源有限的中小机构而言,若缺乏有效的技术支持或联合共建机制,可能加剧“马太效应”,加大数据鸿沟。

  因此,在应用推广多模态大模型的过程中,应结合人文学科的价值判断与社会审慎,保持对技术工具的批判性使用,推动形成“技术可控-文化可信-伦理可守”的多模态人文实践路径。

06

结语

多模态技术的引入不仅突破了文本中心主义的桎梏,也为中文数字人文研究开辟了全新的可能性。以DeepSeek为代表的统一多模态大模型,通过技术创新与开源生态的协同,助力研究者从单一文本维度走向“物质-文本-空间”的多维全息认知体系,深化了文化遗产数字化保护,通过沉浸式体验与跨学科协作,重塑了公众与历史文化的连接方式。

  未来,随着统一多模态模型的不断优化与应用机制的成熟,中文数字人文有望在全球数字人文体系中展现独特优势。在这一过程中,亟须强化“技术-人文-伦理”的协同机制,确保技术创新真正服务于文化传承、公共记忆与人文精神的延续。

参考文献

[1] Meeks E.Is digital humanities too text-heavy[EB/OL].[2024-12-25].https://dhs.stanford.edu/spatial-humanities/is-digital-humanities-too-text-heavy.

[2] Champion E M.Digital humanities is text heavy,visualization light,and simulation poor[J].Digital Scholarship in the Humanities,2017,32(S1):25-32.

[3] Manovich L.Cultural analytics[M].Cambridge:The MIT Press,2020.

[4] Paul G.Das visuelle Zeitalter:Punkt und Pixel[M].Göttingen:Wallstein Verlag,2016.

[5] 王垚.物质文化研究方法论[D].兰州:兰州大学,2017.(Wang Y.The methodology of material culture studies[D].Lanzhou:Lanzhou University,2017.)

[6] Hodder I.Entangled:An archaeology of the relationships between humans and things[M].Chichester:Wiley-Blackwell,2012.


作者简介

刘炜,研究员,研究方向为知识组织、数字人文;

单蓉蓉(通讯作者),博士研究生,研究方向为数字人文,Email:shan_rongrong@163.com;

金家琴,博士研究生,馆员,研究方向为数字人文,人工智能应用。

原文载于《信息资源管理学报》2025年第5期

已获转载授权

阅读原文

跳转微信打开

专业资讯 | 谢菲尔德大学数字人文研究所介绍

2025年11月14日 14:05

2025-11-14 14:05 湖北

谢菲尔德大学数字人文研究所是英国顶尖的数字人文中心之一,提供人文艺术领域的研究及开发服务。该研究所成立于1994年,致力于将技术与计算创造性地运用于人文艺术领域的研究方法和传播方式中。

谢菲尔德大学数字人文研究所介绍

一、谢菲尔德大学数字人文研究所简介

谢菲尔德大学数字人文研究所(Digital Humanities Institute,DHI)是英国顶尖的数字人文中心之一,提供人文艺术领域的研究及开发服务。该研究所成立于1994年,致力于将技术与计算创造性地运用于人文艺术领域的研究方法和传播方式中。

1、校内及校外合作

DHI与众多学术及文化机构合作开展人文艺术领域的资助项目,这些项目均包含计算相关内容或数字化成果。DHI约50%的项目由谢菲尔德大学以外的学术或文化机构牵头。作为合作方,DHI能够提供以下服务:

  • 协助构思项目、撰写立项申请以获取资助;

  • 规划并日常管理项目的数据开发流程;

  • 为研究人员提供必要的技术及数据开发技能培训;

  • 研发适用于数据处理与分析的计算流程;

  • 负责数字化成果的开发工作,从原型设计到最终交付品落地;

  • 将最终交付品以公开可访问的网站或数据资源形式进行长期托管。

研究所采用经英国研究与创新署(UKRI)认可的日薪制核算成本,通常通过“服务提供协议”的方式开展合作,若项目涉及重大技术研究(如开发新的研究方法),DHI也可作为联合研究员参与其中。

2、在线出版服务

自21世纪初以来,DHI便开始从事网站的发布与维护工作。在此之前,DHI主要通过光盘进行内容出版。DHI历史最悠久的项目是“哈特利布文献集(Hartlib Papers)”,该项目早在研究所1989年成立前就已启动;DHI运营时间最长的网站是“詹姆斯・麦迪逊・卡彭特在线目录(James Madison Carpenter Online Catalogue)”,于2003年正式上线。尽管网站设计的美学风格会随时间推移不断变化,但凭借对行业标准的恪守以及持续的维护工作,DHI确保所有托管内容始终保持可访问性与功能性。

DHI代表项目牵头机构为项目的数字化成果提供长期托管服务,托管期限至少为七年,而在实际运营中,DHI的网站均采用无限期托管模式。所有网站均通过谷歌分析工具(Google Analytics)进行数据追踪,其中最受欢迎的“老贝利在线(Old Bailey Online)”网站每年的访问量达700万人次。该服务在多数情况下不收取费用,DHI将与您及您所在的机构拟定一份托管协议,明确托管合作的条款与双方职责。

二、成员介绍

  1. Panggah Ardiyansyah博士

职位:研究员(数字殖民与帝国研究方向)

邮箱:p.ardiyansyah@sheffield.ac.uk

  1. James Chetwood博士

职位:历史学与数字人文讲师

邮箱:j.a.chetwood@sheffield.ac.uk

  1. Maria Jimena Flores

职位:英国研究与创新署博士研究员

邮箱:m.flores.alejo@sheffield.ac.uk

  1. Matthew Groves

职位:高级研究软件工程师

邮箱:m.i.groves@sheffield.ac.uk

  1. haron Howard博士

职位:荣誉研究员

邮箱:sharon.howard@sheffield.ac.uk

  1.  JuEunhae Knox博士

职位:荣誉研究员

邮箱:j.knox@sheffield.ac.uk

  1. Mervyn Levin

职位:荣誉研究员

邮箱:mervyn.levin@gmail.com

  1.  Isabella Magni博士

职位:数字人文讲师

邮箱:i.magni@sheffield.ac.uk

  1.  Jamie McLaughlin

职位:高级研究软件工程师

邮箱:j.mclaughlin@sheffield.ac.uk

  1. Seth Mehl博士

职位:数字人文高级讲师

邮箱:s.mehl@sheffield.ac.uk


(全体研究人员可进入官网了解)

三、技术与基础设施

DHI采用开放标准和高可靠性基础设施,以提升工作的长期可持续性。

1、标准规范

DHI的所有工作均尽可能采用开放、非专有的数据标准和文件格式,助力提升工作的长期可持续性,确保产出成果不受技术变革的影响。同时,DHI倾向于通过网络应用程序接口(Web API)和数据下载链接,向第三方开放数据供其二次利用。

2、系统架构

DHI的系统架构通常以PHP语言为基础,也会根据实际需求采用Python语言,运行在Apache服务器上,并从可扩展标记语言(XML)文件、MySQL数据库和Lucene索引中提取数据。

网站前端采用React框架、PHP(Symfony框架)、Java、Bootstrap、XHTML和CSS构建,并在适当时融入Ajax风格的功能。在图形建模、数据可视化和地图绘制方面,DHI使用JavaScript库(如3D.js、node.js和leaflet.js);针对三维建模(例如:http://www.markmybird.org),则采用WebGL技术。

对于需要分布式计算能力的大规模计算任务,DHI除了使用亚马逊云服务(AWS)外,还会借助学校自有并搭载Apache Hive的数据处理工具Hadoop集群。

DHI会根据项目需求,为项目团队提供专门设计的内容管理系统(CMS),以此创建研究资源。通过该系统,研究人员可不受地理位置限制,集中创建和管理数据,并通过不断完善的终端用户界面进行实时预览。即便在项目资助期结束后,研究人员仍可借助该系统继续开展数据的创建与管理工作。目前,DHI采用PHP Sonata Admin构建这类内容管理系统。

3.基础设施

DHI的服务器为运行Ubuntu操作系统的专用虚拟机(VM),由学校计算服务部门负责托管和维护。服务器组包括:用于在线资源内部开发与测试的开发服务器、长期托管可公开访问资源的生产服务器,以及为生产服务器上的资源提供支撑的数据库服务器。目前,DHI共运行2台开发服务器、6台生产服务器和2台数据库服务器。所有数据资产(如原始数据源)均存储在专用存储区域网络(SAN)中,该网络兼具数据仓库(用于数据的长期管理)和数据服务器(为数据库服务器和生产服务器提供数据支持)的功能。所有服务器均部署在专用数据中心内。

四、出版物

DHI图书提供人文艺术领域(含文化与媒体方向)的免费开放获取在线研究出版物。这些出版物由英国谢菲尔德大学数字人文研究所负责托管与维护。请注意,DHI仅出版与其自身项目及活动相关的书籍。

  • 《数字编辑与出版的未来:会议论文集》(2025年)

  • 《2024年数字人文大会论文集》(2025年)

  • 《学术编辑人工智能实用手册》(2025年)

  • 《2022年数字人文大会论文集》(2023年)

  • 《参与》:受众与接受研究期刊(半年刊)

  • 《电影受众的形成》(2022年)

  • 《人文社科数据本体应用实用指南》(2021年)

  • 《2018年数字人文大会论文集》(2018年)

  • 《数字人文设计导论》(2015年)

  • 《2015年ICMEM会议论文集》(2015年)

  • 《2014年数字人文大会论文集》(2014年)

  • 《2012年数字人文大会论文集》(2012年)

  • 《具象化谢菲尔德:地方、文化与身份认同》(2006年)


五、项目介绍:

1、什么是数字人文项目?

数字人文项目是将数字方法与计算技术纳入其研究方法、传播计划和/或公众参与环节的项目。

典型的数字人文项目会在研究设计中同时采用数字与非数字方法。由于原始资料的体量或复杂性,数字方法能让学者提出非数字方法难以解答的问题,也能让公众以更易接触的方式参与到研究中。

数字方法并非总是量化的。例如,学术数字版本会借助数字方法,为人工编撰可供阅读的文本提供支持。

典型的数字人文项目通常会在研究方法和传播计划中均运用数字方法,具体方式是在项目结束时,将研究成果(数据、工具、网络应用程序等)向公众开放获取。《晚期古代神职人员流亡研究》(Clerical Exile in Late Antiquity)就是典型案例:

  • 设计数据库供团队录入流亡案例相关信息。团队完全掌控数据库设计,因其需贴合原始资料特点,并能捕捉与研究问题相关的信息。

  • 开发高级搜索和数据可视化工具(如历史地图绘制、社会网络图谱),方便研究团队分析数据并解答研究问题。

  • 项目结束时,研究团队补充用户指南和背景信息,使该数据库、高级搜索工具及数据可视化工具能供同行及更广泛受众使用。这一在线资源是该项目的核心研究产出之一。

部分项目将数字方法用于影响力拓展与公众参与计划,而非作为研究辅助工具。《电影记忆:意大利电影观众》(Cine Ricordi:Italian Cinema Audiences)便是如此。DHI与项目团队合作开发了意大利地图,用户可通过地理位置获取人们回忆20世纪50年代观影经历的访谈内容,地图还设有公众上传观影记忆与相关纪念品的功能。

数字人文项目的产出:

  • 在线资源或移动应用程序,作为研究产出或公众参与载体,供学者与公众使用;

  • 依据开放获取许可协议共享的高质量数据;

  • 将在线资源和/或数据提交至英国研究卓越框架(REF),作为研究产出或影响力案例研究。数字人文研究所(DHI)的多个在线资源已参与过往的研究卓越框架(REF)和研究评估活动(RAEs)。

大多数成功的数字人文项目,其首席研究员(Principle Investigators)最初都有某个想法或研究问题,但不确定是否适合采用数字方法推进。

数字人文的方法、流程与活动示例:

  • 通常从档案中提取原始资料并录入数据库;

  • 档案数字化与保存;

  • 开展访谈和民族志研究,通常会进行编码以用于主题分析和话语分析;

  • 转录手稿、信件等文献,用于数字学术版本编撰(包括汇校本与稿本研究版);

  • 为质性研究方法和远读方法进行数据编码,包括编制编码手册和领域本体;

  • 分析大型档案(如报纸、期刊和图片库);

  • 汇编和分析社交媒体内容;

  • 编制和注释音视频数据库(音频、图像和视频);

  • 沉浸式技术应用(如三维虚拟重建、增强现实和虚拟世界);

  • 众包(有时称为公民科学);

  • 网络应用程序、移动应用程序、网站、虚拟展览、在线研究资源、用户生成内容;

  • 基于地图的研究方法(如历史地理信息系统和徒步导览应用程序);

  • 语料库语言学、方言学、文体计量学、翻译研究及其他语言研究方法(书面或口头语言);

  • 人文内容的数据可视化(如社会网络图谱和聚类图)。


2、具体项目介绍

项目一:100首民谣(100 Ballads):17世纪英格兰的热门歌曲及其意义

单页歌谣(broadside ballad)是17世纪在集市等公共场所售卖的歌曲,印刷在单张纸上,售价仅为一便士或更低。这类民谣通常包含12节以上歌词、多幅木刻版画插图,并标注推荐曲调名称。它们堪称当时的“流行歌曲”,有充分证据表明,如今商业化驱动、以城市为主导的现代音乐产业,其源头可追溯至17世纪伦敦的单页歌谣出版商。民谣主题丰富多样,爱情题材最为盛行,此外还涵盖宗教、政治、轰动事件、英雄历险与骇人罪行等内容。

该项目由贝尔法斯特女王大学的Chris Marsh教授(首席研究员)、维多利亚与阿尔伯特博物馆(V&A)的Angela McShane博士(联合研究员)与狂欢乐队(The Carnival Band)合作开展。项目将筛选17世纪英格兰最知名的民谣权威样本,梳理其背景脉络并在线发布。同时,将委托知名的狂欢乐队录制全新音乐版本。除核心的100首歌曲外,项目还将收录民谣的数字图像,并通过追溯其出版与表演历史,呈现这些民谣的发展历程。

谢菲尔德大学数字人文研究所(DHI)正与项目研究团队合作,开发用于记录民谣相关信息的在线数据录入系统,并搭建最终的在线研究资源平台,该平台将免费向公众开放

项目二:面向艺术与手工艺的3D打印技术研究(3D Printing for Arts and Crafts)

该项目聚焦3D打印制品的创作过程,重点关注其混合材料特性,并与传统手工工艺进行对比分析。

项目将识别、描述并分析3D打印工作流程中所需的手工技能,以及这些技能如何可能被数字组件所掩盖。研究将探讨:当前3D打印在多大程度上被视为一种将危及并取代手工乃至艺术技艺的事物;而与此同时,在实际操作中,3D打印需要大量的手工劳动,并正日益广泛应用于创意领域。项目将基于技术史领域的既有研究成果,以及关于数字与计算机辅助创意产出认知的最新文献展开。围绕3D打印技术(尤其在创意产业与文化遗产领域)的相关叙事,本项目将通过以下方式开展调研:

对3D打印从业者、手工艺人、终端用户及创意与遗产产业其他相关方进行访谈,并组织焦点小组讨论;

分析当前与3D打印技术及3D打印制品相关的传播内容与媒体报道。

项目将重点探究公众认知中,手工制作(通常被赋予独特性与真实性内涵)与数字或机器辅助制作(通常被认为具有可替代性、易生产性且价值不高)的界限,了解3D打印目前在这一连续谱系中处于何种位置。

项目三:波德莱尔歌曲项目(Baudelaire Song Project)

该项目将首次调研并汇集波德莱尔诗歌的所有歌曲改编版本,涵盖古典音乐与流行音乐改编、法语原版与译本改编,同时收录乐谱与音频格式资料。

项目将运用数字分析工具对完整的歌曲数据集进行深度处理,以实现诗歌与音乐之间的对比研究,以及对同一诗歌不同谱曲版本的比较分析。项目团队将开发一种新的“诗歌+歌曲”分析方法,结合数字分析工具,同时对源自文本与音乐理论、翻译理论及改编研究的现有方法进行批判反思。项目末期发布的在线资源将为用户提供一个全面可检索的波德莱尔诗歌及歌曲改编版本数据库,包含带标签的原创诗歌与带标签的乐谱语料库,以及能对语料库中所有歌曲改编版本与演绎进行分析的可视化工具。这一资源将助力人们重新理解文本与音乐在歌曲中的互动关系(避免诸如歌曲与诗歌"完美契合"或对其造成"扭曲"等简单化假设)。项目的一个关键侧重点在于同时关注作曲家/歌曲作者和表演者;通过网站数据库提供的许多标注诗歌将配有歌曲录音,尤其针对那些未被学术界及歌手/表演者关注的稀有改编版本,让更多公众得以接触这些新资料。此外,项目还将联合牛津艺术歌曲音乐节(Oxford Lieder)、图卢兹法国艺术歌曲节(Toulouse Mélodie-Française)及谢菲尔德歌唱活动(Sheffield Sing!)举办研讨会与音乐会,面向公众开放。

项目最终形成的波德莱尔歌曲数据库及搜索、可视化功能,在项目结束后通过公共网站向公众开放。

项目四:哈德威克的贝丝的书信集(Bess of Hardwick’s Letters)

本项目旨在建立伊丽莎白・塔尔博特(Elizabeth Talbot),什鲁斯伯里伯爵夫人(又称“哈德威克的贝丝”)书信的可全文检索在线版本。

该项目开创性地将这一重要却几乎未被编辑过的文艺复兴时期书信语料库上线公开,填补了相关领域空白。基于此在线版本的研究成果已通过多篇论文、会议报告、两篇博士论文、播客及项目团队撰写的两部专著呈现,同时还在伦敦英国国家档案馆、德比郡英国国家信托基金会旗下的新哈德威克庄园举办了专题展览与研讨会。该项目由此极大深化了人们对这些文献、书信往来者的理解,进而推动了对整个文艺复兴时期书信的全面认知。

这位不屈不挠的伊丽莎白时代女家长与家族开拓者——伊丽莎白・塔尔博特,什鲁斯伯里伯爵夫人(约1527-1608年,世称“哈德威克的贝丝”)的书信,是一份一份无可比拟的历史资源。她的书信集包含近250件书信作品(其中70余件出自她本人手臂),涉及60余位通信对象,时间跨度近60年。16世纪没有其他非王室女性留下如此数量庞大的书信。这批文献不仅规模空前,其涉及范围之广、社会联系之宽、所述活动之丰、采用书信体裁之多样亦无出其右。内容涵盖对仆役的指令与对工匠的要求;夫妻间的浓情蜜意与激烈的婚姻争执;宫廷流言;新闻与情报;对女王及其枢密院官的恳求;法律诉状与干预;给予子女的忠告与策略性的婚约谈判。它们微观而生动地展现了16世纪书信写作的全景图及其所承载的多元功能。更重要的是,这些书信表明文艺复兴时期的书信写作并非专属男性或精英阶层——伊丽莎白的通信者中有许多低于贵族与士绅阶层,且四分之一为女性。

都铎王朝时期的传记作家与历史学家已从这些书信中挖掘出大量关于政治、社会与家庭生活的信息,以及与哈德威克庄园和查茨沃思庄园建造相关的细节。但在本项目开展前,这些书信从未作为文本实物或语言资料被系统研究。而这类分析的基础正是书信的编辑整理——尽管伊丽莎白・塔尔博特的生平与书信的重要性已广受认可,且书信本身具有内在研究价值,但此前从未有人尝试编辑完整的书信集,这一空白令人瞩目。这些书信的笔迹与字体各异,清晰度与破译难度参差不齐,且分散于英美两国多家档案馆。这两个因素——笔迹问题与收藏分散——使得大多数该领域的学生与学者难以接触到这些书信。

该项目完成了所有书信的在线转录工作,转录文本遵循现代编辑标准,提供可检索、可下载、便于打印的版本,并附有关于手稿特征与呈现形式的学术注释与评述。在编辑与开发该版本的同时,项目团队还对书信进行了分析,探究其如何将人际关系文本化、如何构建语气与人格形象,以及如何运用视觉与物质特征传递意义。这些分析成果已通过一系列产出形式呈现并传播。该书信集的编辑与研究首次让人们得以直接聆听伊丽莎白・塔尔博特的“原声”。书信的编辑与分析工作由格拉斯哥大学英语系的项目团队完成。

项目五:C21数字版本项目(C21 Editions):数字时代的学术编辑与出版

C21数字版本项目(C21 Editions)旨在通过研究和建立适应数字原生内容(如社交媒体)的数据标准,同时探索如何将计算机辅助分析方法融入学术编纂,从而进一步整合数字人文的策展与统计维度,以深入探索并推动学术数字编辑实践的发展。为此,本项目将产出系列宝贵的学术与公共资源,具体包括两部具有高度影响力的数字学术编校本及其所依托的可复现框架。

当学者提及“学术版(scholarly editions)”时,通常指的是经过专家精心编纂的文本资源或文献合集,其目的是为特定材料赋予秩序感与意义。学术编辑及其向公众呈现成果的出版实践,对文化与社会意义重大——它们为理解我们自身以及周遭世界的过去、现在与未来提供了必要的文献资料和深刻见解。

数字人文领域的重大成就之一,便是其学界将学术版推向数字与网络平台,通过更广泛的传播与更便捷的获取,提升了这些版本的研究价值、教学价值与社会价值。然而,尽管数字人文兴起至今约三十年间已取得诸多成果,在日益数字化的世界中,数字学术版正面临过时的风险。现有大多数数字版与出版平台仍模仿书籍的结构,以分页形式呈现静态内容。即便存在部分交互功能,也通常以指向其他资源的基础超链接形式存在。用不了多久,许多数字学术版本很可能沦为早期网络时代的“curios”(奇物遗存)。

审视当前的数字学术编辑实践,DHI发现:一方面,缺乏专门支持文化材料策展与分析的机器学习技术;另一方面,对于如何更好地保存和共享对理解21世纪文化与社会至关重要的原生数字材料,尚未形成共识,也缺乏相关技术指导。例如,未来的历史学家与公众理应需要一套经过批判性策展的前总统唐纳德・特朗普(Donald Trump)推文版本,且该版本需结合其推文所回应或引发的海量网络政治、媒体及社会言论进行语境还原。但目前,尚无现成的框架或平台可用于创建、呈现与维护此类版本。

这正是C21数字版本项目旨在解决的问题:通过联合专家与相关方群体,项目将确立未来数字学术版本的开发方法与核心原则。

图:“巴勃罗・毕加索的《读书的女人头像》(Tete d’une Femme Lisant)是立体主义风格的代表作。立体主义将不同视角融入同一画面,在20世纪初催生出一批与观众以往认知截然不同的艺术作品

项目六:1790-1820年英国陆军军官——以1790-1830年间服役的4万名英国陆军军官为案例研究

凯文・林奇博士(Dr Kevin Linch)获得了英国艺术与人文研究理事会(AHRC)为期18个月的研究资助,用于开展其项目“个体档案重构:1790-1820年英国陆军军官”(Re-archiving the Individual: British Army Officers,1790-1820)。

该项目通过创建并探索“人生档案”(life archive),作为理解历史人物的工具。不同于现有档案记录数字化仅转录姓名(如近期公布的1921年人口普查或教区记录),这份人生档案会将相关记录关联起来,成为数字人文技术的一项突破性进展。

项目于2022年8月启动,以18世纪末至19世纪初的英国陆军军官为案例研究对象,聚焦1790-1830年间服役的4万名军官——这类群体常被阿瑟・韦尔斯利(威灵顿公爵)等著名但非典型人物的刻板印象所定义。

以第33步兵团(西约克郡第1团)的詹姆斯・戈登・奥格尔(James Gordon Ogle)中尉为例,他于1811年从西约克郡民兵部队加入陆军,并参与了滑铁卢战役,项目将通过探究此类军官的职业生涯,展示研究的实施方式。

这种记录关联流程,能让研究者以传统历史研究方法无法实现的规模,探索作为历史参与者的个体及其社会网络。借助这项资助,凯文・林奇博士将与谢菲尔德大学数字人文研究所及英国国家档案馆合作,开展“档案重构”工作。该项目将基于杰米・麦克劳克林为“数字圆形监狱”(Digital Panopticon)项目所做的记录关联研究进一步推进。

这份面向公众开放的人生档案,将为研究英国陆军的学者、学生,以及寻找军官祖先信息的家族史研究者,提供一套灵活且权威的研究与参考工具。通过项目探究军官职业生涯的典型特征、缺席群体及其原因,以及他们在关键历史时刻的服役情况。此次资助也体现了凯文・林奇博士在拿破仑战争时期英国武装力量史领域的专业积淀,以及他与档案管理员和档案馆的合作经验。

图:WO27系列检阅报告(英国国家档案馆)及威廉・庞森比肖像




以上内容来自数字人文研究所(DHI)官方网站:

https://www.dhi.ac.uk/

经数字人文资讯小编翻译整理而成

如需转载,请后台私信联系


编译 丨 洪冰凤

校对 丨 罗斯鹏

排版 丨 魏翔


阅读原文

跳转微信打开

专业资讯 | 武汉大学首席数据官(CDO)高级研修班招生简章

2025年11月13日 14:05

2025-11-13 14:05 湖北

武汉大学特开设首席数据官(CDO)高级研修班,旨在培养具备战略思维、实战能力与行业洞察力的复合型数据领导人才,助力企业数字化转型与高质量发展。

一、课程背景

在数字经济成为全球发展核心引擎的当下,数据已成为企业核心生产要素。首席数据官(CDO)作为驱动数据价值转化、引领数字化战略落地的关键角色,需求缺口持续扩大。依托学校信息资源管理国家重点、“双一流”、A+学科实力,整合校内外数据科学、管理科学、信息技术等多领域优质资源,武汉大学特开设首席数据官(CDO)高级研修班,旨在培养具备战略思维、实战能力与行业洞察力的复合型数据领导人才,助力企业数字化转型与高质量发展。

二、项目优势

(一)顶尖师资阵容:汇聚武汉大学知名教授(见附件),联合国内头部企业CDO、行业专家及政策研究学者,理论结合实战,确保课程内容兼具深度与落地性。

(二)实战导向课程:课程体系围绕企业数据战略规划、数据治理与合规、数据资产运营、数据驱动业务创新等核心模块设计,融入真实企业案例拆解、模拟决策演练,提升学员解决实际问题的能力。

(三)优质资源平台:依托武汉大学产学研合作网络,组织学员走进标杆企业参访交流,对接行业资源;搭建CDO校友终身学习和分享社群,以学会友、拓展人脉,共享高端资源平台,促进跨行业经验分享与合作对接。

三、培训对象

企业董事长、总经理、董事、控股股东、现任CDO、CDO候选人、分管数据业务的总裁、总监等企业高层管理人员。

四、课程体系

五、教学安排

(一)学习周期:在职学习,共计100学时,总时长3个月,每月授课2次,每次课2天(周六、周日)。

(二)授课形式:采用“线下集中授课+核心课程+案例研讨+实战项目”相结合的模式,兼顾学习效率与灵活性。

(三)授课地点:武汉大学

(四)结业认证:完成全部课程学习和考核,颁发“武汉大学首席数据官(CDO)高级研修班”结业证书。

六、报名流程

提交报名资料(含报名表、身份证复印件、证件照1张)。

资格审核完成,3个工作日内发放学习通知书。

学员收到通知书后,缴纳培训费到达指定账户,学校开具发票(报销凭证),开班时学员凭缴费凭证领取学员证。

班主任进行学员沟通及详细需求调研。

汇款信息如下:

收款人全称:武汉大学

收款人账号:576857528447

开户银行:中国银行股份有限公司武汉珞珈山支行

纳税人识别号:12100000707137123P

【请转、汇款时在“备注”栏中注明“首席数据官(CDO)高级研修班”XXX(姓名)培训费】

七、培训费用

培训费用人民币39,800元/人,含课程设计费用、讲师课酬、教学场地、设备使用费、教务管理费用、学习资料费用等。不含学员食宿行费用。

八、联系方式

联系人:傅玲老师、马畅老师

电话:027-68752653、18627959283、13986277814

官网:https://sim.whu.edu.cn/

地址:武汉大学信息管理学院225办公室

武汉大学首席数据官(CDO)

高级研修班部分师资介绍


陆老师   武汉大学二级教授,博士生导师。现任武汉大学党委常委、副校长。入选国家级人才计划,教育部首批哲学社会科学科创团队负责人。先后主持国家新一代人工智能重大项目、国家社科基金重大项目、国家自然基金重点项目、教育部基地重大项目、国家重点研发计划课题等重大重点项目多项。

王老师   武汉大学信息管理学院院长、教授、博导,文化遗产智能计算教育部哲学社会科学实验室主任,武汉大学数字人文研究中心主任。入选国家级人才计划,武汉大学文科杰青,国家自科基金创新群体骨干成员,湖北省自科基金创新群体项目负责人。

吴老师   武汉大学信息管理学院二级教授、武汉大学出版社社长,电子商务研究与发展中心主任。入选国家级人才计划、武汉大学文科杰青。兼任湖北省电子商务学会秘书长、中国科技情报学会健康信息学专委会副主任委员。

安老师   武汉大学信息管理学院教授,博士生导师。入选国家级人才项目,国际知识组织学会(ISKO)理事,中国科学技术情报学会情报理论方法与教育培训专业委员会副主任兼理事,国家自然科学基金创新研究群体核心成员。

邓老师   武汉大学信息管理学院教授,博士研究生导师。入选国家级人才计划,武汉大学人文社会科学优秀青年学者,武汉大学珞珈青年学者,大数据管理与保密系原主任,信息政策与大数据治理中心主任。

冉老师   武汉大学信息管理学院教授、博士生导师,入选国家级人才计划。兼任中国图书馆学会教育委员会秘书长、湖北省知识产权研究会常务理事等职务。被评为国家专利信息师资人才、武汉市黄鹤英才,武汉大学珞珈青年学者,武汉大学文科优青等。

赵老师   武汉大学苏州研究院院长,信息管理学院博士生导师,入选国家级人才计划,教育部人文社科重点研究基地-武汉大学信息资源研究中心数据分析与信息资源规划研究室主任,中国科技情报学会信息行为研究专委会、情报研究与咨询专委会委员,湖北省一流课程“大数据与信息社会”负责人。

李老师   武汉大学信息管理学院教授,博士生导师。教育部高等学校轻工类专业教学指导委员会印刷工程专业指导工作组委员,中文核心期刊《数字印刷》编委、《计算机与网络》编委、《包装工程》专家委员会委员。印刷高等教育联盟理事,珞珈一号01星地面系统副总师,高分辨率对地观测系统湖北数据与应用中心副主任。

赵老师   武汉大学信息管理学院教授,博士生导师。担任国家留学基金委评审专家、省级智库专家。曾获全国电子商务大赛金奖,被授予“全国技术能手”称号。先后获得国家教育部社会科学优秀成果奖、湖北省科技进步二等奖、湖北省高校教师教学创新大赛大奖、武汉大学青年教师教学竞赛一等奖等荣誉。

张老师   武汉大学信息管理学院教授,博士生导师,数字经济与智能商务系原主任。第八届“武汉大学杰出青年奖”获得者以及首届“马克昌优秀青年教师奖”获得者。先后主持和参与科技部重大研究课题、国家自然科学基金项目、教育部人文社会科学基金项目等。



来源 | 武汉大学信息管理学院

阅读原文

跳转微信打开

学术前沿 | 数字技术赋能古典知识传播——访英国伦敦大学学院数字人文荣休教授西蒙·马奥尼

2025年11月7日 14:06

刘雨微 2025-11-07 14:06 湖北

古典文本、手稿、文物和遗迹不仅见证了人类文明的动态发展,更在数字化浪潮的推动下焕发“时代新机”。在中国,古籍数字化的丰硕成果为古典学的当代发展奠定了坚实基础。越来越多的古典文献和图像通过数字平台走进大众视野,智能赋能下的古典文化主题展览和衍生作品更是“层出不穷”,以古典韵味点亮现代心灵。

中国社会科学报记者采访了英国伦敦大学学院数字人文荣休教授、北京师范大学数字出版与数字人文研究中心教授西蒙·马奥尼(Simon Mahony)。马奥尼长期致力于将古典学与数字技术深度融合,推动古典知识的广泛传播与共享。在他看来,数字古典学(Digital Classics)打破了传统上局限于“象牙塔”与“精英圈”的格局,让古典智慧“触手可及”,激发下一代对古典哲学思想、人文精神和道德理念的浓厚兴趣。更重要的是,数字古典学照亮了人类文明的前行之路,推动古典文化“古为今用”,在不同的文明交流互鉴中催生新的文明形态。


01

古典智慧照亮人类文明轨迹


《中国社会科学报》:您如何看待古典学在当代社会中的意义?


马奥尼:古典学的当代意义在于它能够将我们与过去的历史时期紧密相连,而正是这些时期深刻塑造了我们今天所生活的社会。无论是研究古代中国,还是探索欧洲文明的起源,祖先的故事都为我们提供了宝贵的视角,帮助我们理解人类如何走到今天,以及我们是谁。在首届世界古典学大会上,众多学者阐述了孔子、亚里士多德和苏格拉底等思想家的持久影响力。他们的思想仍在启发着我们,是永恒的智慧源泉。


此外,古典学还能以独特的方式激发大众的想象力。一旦深入古典世界,人们很容易被祖先的故事所吸引。这些故事往往带有神话色彩,它们不仅是过去的旧事,更是跨越时空的经典。例如,孩子们通过《奥德赛》或像《哪吒2》这样描绘古代世界的动画电影,能够从小对古典世界产生兴趣。而对于那些深入阅读经典文学作品(比如希腊戏剧、中国古代四大名著)的人来说,这种体验是深刻且具有变革性的。阅读经典就像踏上一场令人振奋的旅程,虽然可能充满挑战,但它为我们打开了一扇通往深刻人生体验和智慧的大门,为思考当下问题提供了灵感。


《中国社会科学报》:古典学者如何能更有效地向公众展现古典学的魅力与重要性?


马奥尼:古典学常常被误解为与普通人无关的学问。要打破这种偏见,我们需要强有力的公共古典教育计划。在这方面,英国学者玛丽·比尔德(Mary Beard)和贝坦尼·休斯(Bettany Hughes)表现突出。他们通过一系列纪录片,以通俗易懂、贴近生活的方式,向公众呈现了古希腊和罗马的故事。这种做法不仅让古典知识变得易于理解,还让人们看到古典学对当代生活的深远影响。


《中国社会科学报》:能否请您举一个例子,说明古典知识如何影响了人类文明的发展轨迹?


马奥尼:当然可以。一个典型的例子是亚里士多德哲学对现代社会治理的深远影响。亚里士多德认为,公民身份与美德伦理是不可分割的。理想的公民是完全具备美德的人,体现着统治和被统治所需的相同美德。这反映了他的一种核心理念:国家的福祉源于人民的道德品质。类似的理念不仅被其他哲学家广泛倡导,还被许多国家的政府所借鉴采纳。亚里士多德的教导与中国儒家思想之间存在着惊人的相似之处,两者都强调了创建良好社会以培养优秀公民的重要性。这种共通的智慧,凸显了古典思想在塑造现代世界的宝贵价值。


02

古典知识对所有人免费开放


《中国社会科学报》:能否请您介绍一下您在数字古典学领域的经历?数字古典学具有哪些独特的学术特点和发展价值?


马奥尼:数字古典学是一个结合古典学与数字技术的跨学科领域,致力于通过数字化手段研究、保存和传播古典文化遗产。我的学术生涯始于英国伦敦国王学院,当时我在人文计算中心工作,如今那里已发展为数字人文学系。我很快发现,从事古籍数字化项目的人大多接受过古典学或中世纪研究的严格学术训练,这让我意识到,这两个领域是人文学科数字化研究的早期开拓者。我参与创建了“数字古典学家”(Digital Classicist)和“数字中世纪学家”(Digital Medievalist)这两个国际学术网络组织。与当代的文学领域相比,古典学和中世纪研究的原始资料相对有限,但是更易于管理。此外,我的古典学研究涵盖了对古代世界的探索,包括古希腊和罗马的文学文本、语言学、历史、哲学、艺术和考古学。正如你所看到的,数字古典学项目需要整合多种技能并开展跨学科合作,因为没有一个人能够掌握所有必要的专业知识。


此外,我参与的数字古典学项目成果总是免费在线发布,任何有网络连接的人都可以使用。我们的教学材料也托管在开放服务器上,方便公众获取。一些数字古典学的模块导师(module tutors)还习惯于编写自己的教学材料,并链接外部资源,以避免版权问题。这种开放内容的创建和共享方式,与我后来在伦敦大学学院遇到的情况截然不同。在那里,教学材料被限制在虚拟学习环境中,只有拥有登录权限的人才能访问。


《中国社会科学报》:数字古典学中原始资料如何能够具有更广泛的可及性?


马奥尼:如前所述,数字古典学作为数字人文学科的重要分支,其核心在于保持研究成果、数据以及各类出版物的开放性。通过使这些资料广泛可用并便于重复利用,数字古典学者加速了古典思想及其研究成果的传播。这种开放性对于那些在资金不足的机构工作、没有机构支持的独立学者、初级员工以及早期职业研究人员尤为重要。尽管数字鸿沟依然是部分群体面临的现实挑战,但开放知识传播无疑是促进知识共享、推动文化包容与平等的重要一步。


《中国社会科学报》:您认为“开放议程”(开放数据、开放获取、开放许可、开源软件、开放论坛)对数字古典学意味着什么?


马奥尼:开放议程涵盖了多个维度,但从根本上说是一种心态。接受开放议程的人很难理解,为何有人会将自己的研究成果隐藏或封闭起来,而那些倾向于限制访问的人,往往看不到分享劳动成果的价值。在古典学领域,将研究成果公开且免费提供,能够突破学术圈的限制,实现更广泛的可及性。它让任何有兴趣的人都能参与其中,激发人们的更多兴趣,从而培养更具包容性的学术社区。


无论是东方还是西方,都在20世纪80年代启动了大规模的数字化项目,最初都聚焦于经典文本的数字化。这些努力为如今的数字人文学科奠定了基础。我认为,为了让这些在线资源充分发挥潜力,它们必须对所有人免费开放。强大的编目和元数据支持至关重要,这能确保这些文本跨越文化差异,被更多人发现、研究和传播,最终增强所有人对文化多样性和不同文明形态的认识。


03

首届世界古典学大会

彰显中国古典学使命


《中国社会科学报》:请您分别介绍一下中国和英国的古典学研究具有哪些特色,重点研究领域是什么等?


马奥尼:在英国,古典学常常被视作精英的学科。这是因为学习古典语言通常是进入该领域的起点,而这种教育多集中在私立学校。古典文本中所呈现的大多是受过高等教育的西方精英群体的声音,忽略了普通人和少数族裔的视角。相比之下,数字古典学的使命是打破这种局限,让知识免费开放,并鼓励不同群体参与其中。无论是学术研究还是大众普及,我们都致力于推动广泛的参与,而数字古典学的研讨会也始终对公众开放。


在中国,古典学的研究范围更为广泛,涵盖了古典文学、历史、哲学和艺术等多领域。这与英国的古典学有诸多相似之处,但又独具特色。中英两国的古典学都聚焦于古典文本、手稿和文物,展现文化的演变与文明的发展,并不断刷新人们对历史与文明的传统认知。古典学者们积极证明经典文本在为当代社会提供启示以及连接人类过去与未来方面的持久价值。古典作品在当代的接受和比较文学研究,对缩小东西方思想差异产生了重要影响。这一点在首届世界古典学大会上表现得尤为突出,我很荣幸能参与其中。这样的学术盛会不仅促进了不同文明之间的相互理解,也让我们在深入了解他者的同时,更好地认识自己。通过构建全球古典文明知识体系和学术网络,主办方和与会者都为古典思想、观点和学术成果的共享搭建了桥梁,也为未来的合作与伙伴关系奠定了坚实基础。


《中国社会科学报》:您对首届世界古典学大会的印象如何?


马奥尼:首届世界古典学大会不仅是一个展示中西方古典学研究前沿成果的卓越平台,更是促进全球学术交流与合作的重要契机。此次大会汇聚了来自世界各地的专家学者,彰显了国际学界对古典学研究的共同热情和对跨文化合作的坚定承诺。它不仅让我们深入了解不同文化的精髓,也促使我们反观自身文化的独特价值。


能与世界各地的古典学专家在“古典智慧与数智时代”分论坛交流,我深感荣幸。我的观点主要是从西方的角度出发,但在中国的工作经历以及和中国同事们的长期合作,让我对古典学的看法更加丰富、更有特色。通过这样的交流,我们跨越了文化隔阂,实现了知识共享,激发了学界与大众对古典学和数字人文领域的关注与研究热情,为不同文明间的对话与和谐发展奠定了坚实基础。


此次大会还见证了中国古典文明研究院在雅典的成立。这是中西方学术交流的里程碑,也象征着古典学研究在全球范围内的深度融合。我深感振奋,期待在2025年看到更多类似的活动与交流。我相信,中国在古典学领域的不懈努力,将为人类文明的共同繁荣注入新的活力。


本文转载自公众号“中国社会科学报”

已获转载授权

阅读原文

跳转微信打开

会议通知 | “人文智变:数字人文的智慧奇点”学术研讨会暨2025年中国数字人文年会(CDH2025) 会议通知(第三号)

2025年11月1日 17:58

2025-11-01 17:58 湖北

—CDH2025—

“人文智变:数字人文的智慧奇点”

学术研讨会暨2025年中国数字人文年会

2025年11月28日-12月1日,中山大学


      为贯彻落实教育强国、国家文化数字化、“人工智能+”行动等国家战略,进一步促进中国数字人文发展,在中国索引学会指导下,中国索引学会数字人文专业委员会和中山大学数字人文联合研究院拟于2025年11月28日至12月1日在广州举办“人文智变:数字人文的智慧奇点”学术研讨会暨2025年中国数字人文年会(CDH2025)。会议将围绕数字人文及相关领域的前沿问题,开展主旨发言、会议报告、专题讨论、案例分享、探界者论坛、数字人文成果展示、海报展示等多种形式的学术交流活动。现诚邀国内数字人文领域专家、学者与学生积极参会,共绘数字人文的“智慧奇点”图谱。

会议注册仍在进行中热烈欢迎来自不同学科领域、不同行业的数字人文领域专家、学者、学生踊跃报名,与我们共赴这场学术盛宴。

注册截止日期:2025年11月11日。

衷心感谢各位专家学者和同学们对本届会议的关注与支持。

01



会议信息

1.时间

      2025年11月28日至2025年12月1日

2.地点 

      中山大学

      广州市新港西路135号

3.日程安排

11月28日

下午

注册报到

晚上

探界者论坛

11月29日

上午

开幕式

下午

分论坛一:

数字人文的哲学基础与认识论重构

分论坛二:

数字人文基础设施的智慧演进 

分论坛三:

AGI与数字人文工具链、方法论突破  

分论坛四:

数字人文学科建设与人才培养

晚上

探界者论坛

11月30日

上午

分论坛五:

文化遗产的数字孪生与机构智慧化转型

分论坛六:

次元文化与交互叙事创新  

分论坛七:

数字人文教育生态及全球建构   

分论坛八:

数字人文的政产学研用协同发展  

分论坛九:

中华典籍智慧化与多模态研究 

分论坛十:

数字人文国际前沿与学术传播

下午

闭幕式

12月1日

离会

备注:选择入住会议协议酒店,可于11月28日在酒店大堂办理会议报到;如不入住会议协议酒店,可于11月29日在会议开幕式前办理报到,具体地点待后续通知。


02


报名注册

1 注册时间

(1)截止日期:2025年11月11日。请务必于限期前完成会议注册及缴费。

2 注册费用及政策

(1)参会代表均需注册交费,注册费:1500元,学生800元。

(2)获会议邀请宣讲论文以及获会议邀请展示海报、项目的作者,可免其中1人的注册费。退费将于会议结束后统一处理,退回注册缴费时原缴费银行账户。

(3)参会代表差旅往返交通、住宿费自理。

(4)会期期间,酒店到会场交通请自行安排。

3 注册流程

(直接访问以下网址或扫描二维码)

第一步:会议缴费

缴费链接:缴费链接:https://pay.sysu.edu.cn/app/#/qrcode-pay?range=9571&project=2981

付款注意事项:

①缴费金额:请参会人员选择对应身份与金额进行缴费。如一篇论文有多名作者参会,请每位代表分别注册缴费。

②公务卡报销:如需使用公务卡报销,缴费前请务必先通过微信(目前只支持微信支付)绑定公务卡后再进行缴费。

③收费备注:为方便财务人员对账,缴费时请务必在“收费备注”处填写:单位(全称)+姓名。

④缴费凭证:支付成功后,请务必将支付结果截图或者拍照。在第二步注册时,需要上传支付结果作为缴费凭证。

⑤电子发票下载:缴费成功24小时后,系统会自动电子开票。并通过邮箱发送下载链接,缴费人可自行下载(发票信息及备注信息请务必正确填写,系统自动生成发票后无法修改)。

注意:如发票抬头是机构的,请在“开票信息”栏点击“机构”键,然后点击该栏右下方的“新增”键,填写新增单位信息。

第二步:会议注册

      会务组为参会人员联系了协议酒店,将根据注册表单协调酒店提前预留。住宿费用由参会人员自理,由酒店开具住宿费发票。由于房型数量有限,请于11月11日前登记相关住宿信息,先到先得。11月11日之后将不再接收酒店预订信息,参会人员可自行联系。

注册链接:https://wj.sysu.edu.cn/q/ZAr5Bsae

03


酒店信息

1. 中大凯丰酒店(广州中大学人馆店)

(1)广州市海珠区滨江东路中山大学北门科技文化交流中心

(2)酒店联系人:

吴经理,18923099438;酒店前台,020-89222888

(3)房型及协议价格:

单人入住,550元/晚,含单早;双人入住,600元/晚,含双早

2. 亚朵酒店(广州滨江东路店)

(1)广州市海珠区滨江东路795号

(2)酒店联系人:

阿则,15920305265

(3)房型及协议价格:

大床房(550元/晚,含单早)、双床房(550元/晚,含双早)

3. 全季酒店(广州中大地铁站店)

(1)酒店地址:广州海珠区怡乐路76号

(2)酒店联系人:

符经理,19124840669

(3)房型及协议价格:

大床房(450元/晚,含单早)

4. 广州珀丽酒店

(1)酒店地址:广州市海珠区江南大道中路348号

(2)酒店联系人:

罗经理,13902294843

(3)房型及协议价格:

大床房(320元/晚,含单早)、双床房(320元/晚,含双早)

附:住宿酒店地图

04



会务联系

会议邮箱:dhlab@mail.sysu.edu.cn

会务咨询:夏老师  020-84111992

会议网站:https://sztc.sysu.edu.cn/2025/index.html

05


组织机构

指导单位

中国索引学会

主办单位

中国索引学会数字人文专业委员会

中山大学数字人文联合研究院

承办单位

中山大学数字人文实验室

中山大学图书馆

中山大学岭南学院

中国索引学会广东中

协办单位(按笔画顺序排列)

上海大学数字人文研究与发展中心

上海外国语大学中国国际舆情研究中心

上海师范大学数字人文研究中心

上海图书馆历史人文大数据中心

上海理工大学图书馆

山东省高等学校齐文化传承创新与数字人文实验室

山西大学图书馆山西数字人文研究院

云南大学历史与档案学院“数字人文”工作室

中山大学信息管理学院

中国人民大学数字人文研究院

中国社会科学院大学数字史学研究中心

中国社会科学院文学研究所数字信息研究室,数字人文与计算批评实验室

中国音乐学院图书馆

天津师范大学古文献学与数字人文研究中心

内蒙古自治区科技文化遗产认知智能重点实验室

北京大学数字人文研究中心

北京师范大学珠海校区图书馆数字人文中心

华中科技大学人文学院汉籍数字化实验室

华东师范大学调查与数据中心

西南大学中希文明互鉴中心

传统地方戏曲资源数字化保护与智能共享四川省文化和旅游厅重点实验室

齐鲁工业大学(山东省科学院)数字人文研究中心

武汉大学文化遗产智能计算实验室

武汉大学数字人文研究中心

重庆大学科幻文学与科技人文研究中心

南京大学中华文明数智创新实验室

南京大学高研院数字人文创研中心

南京师范大学数字与人文研究中心

南京师范大学语言大数据与计算人文研究中心

南京农业大学数字人文研究中心

复旦大学大数据研究院人文社科数据研究所

清华大学中国古典文献研究中心

(持续更新中)

媒体支持(按笔画顺序排列)

《古籍数字人文研究》

《农业图书情报学报》

《全国报刊索引》

《数字人文》

《数字人文研究》

「DH数字人文动态」公众号

「DSLL数字语言文学研究」公众号

「SHNU数字人文」公众号

「中山大学InformationWorld」公众号

「中山大学图书馆」公众号

「中山大学数字人文联合研究院」公众号

「中希文明互鉴中心」公众号

「文化遗产智能计算文科实验室」公众号

「文学审美客观研究」公众号

「比特人文」公众号

「四十二史」公众号

「古代汉语信息处理」公众号

「汲古求新」公众号

「西安地图出版社」公众号

「弘雅书房」公众号

「社科大数字史学实验室」公众号

「空间人文与场所计算」公众号

「图情会」公众号

「京狮人文DH」公众号

「南京大学中华文明数智创新实验室」公众号

「科技文化遗产认知智能重点实验室」公众号

「数字人文」公众号

「数字人文开放实验室」公众号

「数字人文研究」公众号

「数字人文资讯」公众号

「数据大狮」公众号

 上海师范大学数字人文网

(持续更新中)

转载来源:中山大学数字人文联合研究院


阅读原文

跳转微信打开

专业资讯| 欧洲数字人文协会(EADH)介绍

2025年10月24日 15:13

2025-10-24 15:13 湖北

欧洲数字人文协会(EADH)是欧洲数字人文领域的汇聚者和代表者,涵盖了所有研究、开发和应用数字人文方法与技术的学科。EADH还支持在欧洲组建数字人文兴趣小组由地区、语言、方法学重点或其他标准定义的利益集团。

欧洲数字人文协会(EADH)

一、简介

欧洲数字人文协会(The European Association for Digital Humanities)是欧洲数字人文领域的汇聚者和代表者,涵盖了所有研究、开发和应用数字人文方法与技术的学科。EADH还支持在欧洲组建数字人文兴趣小组由地区、语言、方法学重点或其他标准定义的利益集团。

欧洲数字人文协会(EADH)成立于1973年,最初名为“文学与语言计算协会(ALLC)”,其初衷是支持计算机技术在语言和文学研究中的应用。

随着人文领域可用且相关的计算技术日益丰富,该协会成员的研究兴趣已大幅拓展,不仅涵盖文本分析与语言语料库,更延伸至历史、艺术史、音乐、手稿研究、图像处理及电子版本等领域。2012年启用的新名称正体现了这一显著的范围扩展。如今,EADH的使命是代表欧洲所有学科领域的数字人文研究。


图:欧洲数字人文协会(EADH)logo


1.目标

欧洲数字人文协会的核心目标是为个人会员提供支持,具体包括:

  • 代表欧洲及其他地区数字人文社群的利益

  • 收集并传播数字人文相关信息

  • 组织学术会议与专题研讨会

  • 在欧洲范围内搭建网络,组建区域性或基于特定兴趣的组织

  • 为小型研究项目或活动提供补助金,并为青年学者提供助学金


2.出版物

  • DSH: The Journal of Digital Scholarship in the Humanities(数字人文研究期刊)

  • Digital Humanities Quarterly(数字人文季刊)

  • Digital Studies / Le champ numérique(数字研究/数字领域)

  • Humanist(人文主义者)

  • Defining Digital Humanities - A Reader(界定数字人文——读本)

  • “What is ‘Digital Humanities,’ and Why Are They Saying Such Terrible Things about It?”(“什么是‘数字人文’?为何人们对它评价如此糟糕?”)

  • Digital Research in the Arts and Humanities(艺术与人文领域的数字研究)

  • Mind Map of the Digital Humanities(数字人文思维导图)

  • Lexicon Philosophicum: International Journal for the History of Texts and Ideas(哲学术语集:国际文本与思想史期刊)

  • "Humanities 2.0": NY Times Series on Digital Humanities(“人文 2.0”:〈纽约时报〉数字人文系列报道)

  • Book Series: Topics in the Digital Humanities(丛书:《数字人文专题》)

  • What is "Digital Humanities"?(什么是 “数字人文”?)

  • Language Resources and Evaluation (previously Computers and The Humanities)(语言资源与评估(前身为计算机与人文))

  • Blackwell's Companion to Digital Humanities(布莱克韦尔数字人文指南)

  • Text Technology(文本技术)

  • Blackwell's Companion to Digital Literary Studies(布莱克韦尔数字文学研究指南)

  • CHWP: Computing in the Humanities Working Papers(人文计算工作论文集)

  • Rough Intellectual Map for Humanities Computing(人文计算大致知识图谱)

  • Institutional models for humanities computing(人文计算的机构模式)

  • Book Series: Office for Humanities Computing (OHC)(丛书:《人文计算办公室丛书》)

  • Book Series: Topics in the Digital Humanities(丛书:《数字人文专题》)

  • Book Series: Digital Resources in the Arts and Humanities(丛书:《艺术与人文领域的数字资源》)

  • Scholarly Editing: The Annual of the Association for Documentary Editing(《学术编辑:文献编辑协会年刊》)

  • Changing Publication Cultures in the Humanities(人文领域出版文化的变革)

  • The Journal of Data Mining & Digital Humanities(数据挖掘与数字人文期刊)

  • Mapping the field(领域图谱绘制)

  • International Journal for Digital Art History(国际数字艺术史期刊)


二、关联组织与合作组织

1.关联组织

关联组织是与EADH建立正式联络关系的机构。此类地区性组织的个人成员可自动获得EADH正式成员资格,享有所有相应福利,包括会议折扣、投票权等。截至2024年9月,EADH 的关联组织包括:

  • 意大利人文信息与数字文化协会(AIUCD)

  • 捷克数字人文协会(CzADH)

  • 德语区数字人文协会(DHd)

  • 北欧和波罗的海国家数字人文协会(DHNB)


2.合作组织

合作组织是与EADH建立非正式联络关系的机构。协会鼓励合作组织的成员以个人身份加入EADH,但这些机构本身不与EADH建立正式关联。EADH与合作组织通过各自的网站和新闻更新交流,为双方成员提供彼此的实用信息。


3.数字人文组织联盟

欧洲数字人文协会是国际伞式组织——数字人文组织联盟(ADHO)的创始成员(或称“组成机构”)。目前,ADHO的成员包括:澳大利亚数字人文协会(aaDH)、欧洲数字人文协会(EADH)、计算机与人文协会(ACH)、加拿大数字人文协会(CSDH/SCHN)、国际数字人文中心网络(centerNet)、法语区数字人文协会(Humanistica)以及日本数字人文协会(JADH)。

ADHO将EADH旗下由牛津大学出版社出版的期刊《数字人文研究(DSH)》定为其主要印刷出版物。此外,ADHO还主管两份开放获取期刊,分别是《数字人文季刊(DHQ)》和《数字研究(Digital Studies / Le champ numérique)》。


三、项目介绍

1.希腊铭文集成(Inscriptiones Graecae)

图:希腊铭文集成网站主页

《希腊铭文集成》是柏林-勃兰登堡科学院人文研究院历史最悠久的项目,为1815年创立的《希腊铭文总集》的后续项目。该项目的出版系列按以下体例编辑欧洲的希腊铭文:IG I–III雅典与阿提卡地区;IG IV–VI伯罗奔尼撒半岛;IG VII–IX希腊中部;IG X希腊北部、色雷斯、斯基泰地区;IG XI–XII爱琴海诸岛;IG XIII克里特岛;IG XIV意大利与西西里岛;IG XV塞浦路斯岛。

当前的数字学术版已开放《希腊铭文集成》11卷的文本、译文(德语和英语)及TEI(Epidoc)编码源文献的访问权限,首卷为2001年出版的纸质版IG IX 1², 4。更多卷次将持续增补。

项目团队:

  • Prof. Dr. Klaus Hallof (IG)

  • Alexander Czmiel (TELOTA, Digital Humanities)

  • Nora Götze (TELOTA, Digital Humanities)

资助方:

  • 柏林-勃兰登堡科学院人文研究院


2. COURAGE

图:COURAGE项目logo

COURAGE项目将建立欧洲首个线上线下公私收藏数字数据库,这些收藏见证了前社会主义国家各类文化反抗形式的存续;收藏时间跨度从该地区共产主义政权兴起至铁幕落下。COURAGE项目将进一步深化对以下问题的细致理解:这些收藏如何运作、在各自社会中发挥何种功能,以及如何向国内外公众展示其馆藏与研究成果。

合作机构:

  • 匈牙利科学院人文研究中心(协调方)

  • 波兰科学院哲学与社会学研究所

  • 都柏林三一学院

  • 雷根斯堡大学

  • 东欧与东南欧研究所

  • 匈牙利科学院社会科学中心

  • 立陶宛历史研究所布

  • 拉格查理大学

  • 布加勒斯特大学

  • 布拉迪斯拉发夸美纽斯大学克罗地亚历史研究所

  • 牛津大学

  • 匈牙利计算机科学与控制研究所

项目团队:

该国际合作项目由主要协调联络人Sándor Horváth和协调联络人Péter Apor负责管理。两位学者均隶属于人文研究中心历史研究所当代史部门。

资助机构:

本项目获得欧盟“地平线2020”研究与创新计划资助,资助协议编号692919。


3. 解读手写图文档案(Making Sense of Illustrated Handwritten Archives)

图:解读手写图文档案项目

许多带插图的手写档案蕴含丰富信息,但由于其复杂性高且难以被计算机解读,大多未得到充分研究。该项目旨在开发一个数字环境,以解决这一难题,并将异构档案内容与其他数字资源相连接。


合作机构:

  • 莱顿数据科学中心(LCDS)

  • 莱顿大学高级计算机科学研究所(LIACS)

  • 布里尔出版社荷兰自然生物多样性中心(NBC)

  • 格罗宁根大学人工智能与认知工程实验室

  • 特温特大学科学技术与政策研究中心

项目团队:

  • Lambert Schomaker,格罗宁根大学

  • Andreas Weber,特温特大学

  • Mahya Ameryan,格罗宁根大学

  • Lise Stork,莱顿大学

  • M. Eulàlia Gassó Miracle,荷兰自然生物多样性中心

  • Michiel Thijssen,布里尔出版社

  • Maarten Heerlien,荷兰自然生物多样性中心

  • Katherine Wolstencroft,莱顿大学

  • Aske Plaat,莱顿大学

  • Michael Lew,莱顿大学

  • Siegfried Nijssen,莱顿大学

  • Marco Wiering,格罗宁根大学

  • Ernest Suyver,布里尔出版社

  • Fons Verbeek,莱顿大学

  • Bart Verheij,格罗宁根大学

  • Rene Dekker,荷兰自然生物多样性中心

  • Joost Kok,莱顿大学

  • Lissa L. Roberts,特温特大学

  • Jaap van den Herik,莱顿大学

资助方:

  • 荷兰科学研究组织,资助编号:652.001.001

  • 布里尔出版社(荷兰莱顿)


4. ARIADNE

图:ARIADNE项目主页

ARIADNE项目整合现有考古研究数据基础设施,使研究人员能够将各类分布式数据集及新型强大技术作为考古研究方法的有机组成部分。目前,涵盖不同时期、领域和地区的考古数字数据集数量庞大,且随着信息技术应用的日益广泛,新的数据集仍在不断涌现。这些数据集是个人、团队和机构研究成果的积累,但构成了一个庞大而分散的集合体,其潜力因获取困难和视角异构而受到限制。

ARIADNE将为研究人员提供跨国界访问数据中心、工具和指导的机会,并基于数据存储库的通用接口、参考数据集的可获取性以及创新技术的应用,开发新的网络服务。该项目将依托对过往及正在进行的田野调查和实验室活动成果的对比、复用与整合,为考古学领域开辟新的研究路径。此类数据分散于各类馆藏、数据集、未出版的田野工作报告(灰色文献)及出版物中,其中出版物仍是知识共享的主要来源。ARIADNE将助力打造一个新的研究社群,使研究人员能够充分利用信息技术的优势,并将其纳入成熟的考古研究方法体系。

为实现这一目标,该项目将采用多项整合技术(基于现有数据集的共同特征)和整合行动(旨在构建活跃的用户社群)。

合作伙伴:

  • PIN——佛罗伦萨大学 PIN 教育与科学服务有限责任公司(协调方)

  • UoY-ADS——约克大学(副协调方)

  • KNAW-DANS——数据归档与网络服务中心

  • DAI——德国考古研究所

  • ATHENA RC——雅典娜研究与创新中心

  • CNR——意大利国家研究委员会

  • SRFG——萨尔茨堡研究中心

资助方:

欧盟委员会,依托欧盟第七框架计划,合同编号:FP7-INFRASTRUCTURES-2012-1-313193


5. 圣洗池索引(Baptisteria Sacra Index)

图:洗礼池图像

圣洗池索引(Baptisteria Sacra Index, 简称 BSI)是一个国际性的洗礼池图像索引数据库,收录了从早期基督教时期至17世纪的洗礼池图像装饰及场景照片,专供学术研究使用。该项目隶属于加拿大多伦多大学数字人文网络。

该是一项永久性的持续推进项目,主要致力于单个洗礼池及其宗教仪式场景的信息研究、收集与编目,旨在为每个录入BSI的洗礼池完善以下信息:建造年代(年份、世纪、风格或时期)、地理位置、所属教堂(地理信息系统定位)、材质、尺寸、制作工坊或艺术家、关联洗礼池、图像主题与装饰纹样、纹样 / 主题的位置编码、铭文(语言、位置、文本内容、来源)、排水系统、池盖(池盖年代、装置结构、材质)以及相关学术出版物。

截至2021年7月,BSI数据库已记录以下内容:

  • 洗礼池记录:23000余条

  • 数字图像:100000余张(涵盖洗礼池、场景环境、教堂外观及内部)

  • 铭文:1400余条(涉及阿拉伯语、丹麦语、荷兰语、英语、古英语、佛兰德语、法语与诺曼法语、希腊语、古德语、意大利语、拉丁语、如尼字母、西班牙语、瑞典语)

  • 洗礼池相关文献引用:3300余条

项目团队:

  • Harriet Sonne de Torrens: harriet.sonne@utoronto.ca

  • Miguel A. Torrens: miguel.torrens@utoronto.ca


6. DASI

图:DASI主页

前伊斯兰时期阿拉伯铭文研究数字档案馆(DASI)是一项欧洲研究理事会(ERC)资助项目(2011-2016年),由意大利比萨大学的阿万齐尼教授(Prof. Avanzini)主导。该项目旨在对所有前伊斯兰时期阿拉伯铭文藏品进行编目与数字化处理,以丰富古代阿拉伯的历史文化认知,并深化铭文文本的语言学研究。

约9000件古南阿拉伯语、古北阿拉伯语(由牛津大学提供)及阿拉米语铭文(由法国国家科学研究中心-巴黎第8167联合研究单位提供)已通过一套混合数据库 /XML系统完成数字化。该系统由比萨高等师范学院开发,包含三个核心组件:关系型数据库、数据录入模块和前端界面。

数据库不仅存储元数据,还按照碑铭文献标准(EpiDoc standard)以XML格式存储铭文文本;数据录入模块配备了专门为前伊斯兰时期阿拉伯铭文编码设计的编辑工具。DASI前端界面向公众免费开放近7700件铭文资源。用户可通过多种索引(藏品总目、收藏机构、碑铭、器物及遗址)浏览内容,并可根据元数据进行筛选。此外,借助文本特征的XML标记功能,用户可通过文本检索和按字母顺序排列的词汇列表(含普通词汇与专有名词)对铭文文本进行复杂检索操作。DASI数据支持批量获取功能。其OAI-PMH数据仓储允许服务提供商获取DASI 的记录,这些记录已映射至多种标准与数据模型,包括都柏林核心元数据(DC)、欧洲数字博物馆数据模型(EDM)及碑铭文献标准(EpiDoc)。目前,古南阿拉伯语数字词典仍在编制中。

合作伙伴:

意大利比萨大学、意大利比萨高等师范学院

项目团队:

  • Prof. Alessandra Avanzini:首席研究员

  • Alessia Prioletta

  • Khaldon Noman

  • Costanza Odierna

  • Giulia Buono

  • Clara Mancarella

  • Cristina Pappalardo

  • Fabio Betti

  •  Alexia Pavan等

资助方:

欧盟委员会,第七框架计划 “思想” 专项,“欧洲研究理事会高级资助” 项目


7.eHeritage

图:eHeritage项目logo

eHeritage项目是一项协调与支持类项目,旨在应对欧盟工作计划中“H2020-TWINN-2015”主题所提出的“结对合作”挑战。该项目的协调机构为布拉索夫特兰西瓦尼亚大学(UTBv),该校将通过与另外两家研究中心建立结对合作关系,致力于在虚拟遗产领域打造卓越研究实力。

鉴于布拉索夫地区(Brașov)巨大的旅游潜力,布拉索夫特兰西瓦尼亚大学的这一举措与区域经济增长和繁荣创新战略高度契合。eHeritage项目参与方将与地方当局合作,推动虚拟现实技术在文化遗产保护中的应用与传播。项目规划的各项措施将以倍增效应影响区域层面的社会、经济和文化环境,为与其他研究机构或商业机构建立战略合作伙伴关系创造空间。

eHeritage项目的总体目标是:通过在紧密的学术与社会互动基础上,与合作伙伴建立稳固且可持续的研究合作机制,从而提升布拉索夫特兰西瓦尼亚大学研究人员的专业能力、研究质量与研究范围。

通过开发文化遗产地相关虚拟现实应用,eHeritage项目将助力历史与艺术领域的知识传播;而在罗马尼亚建立一个专攻此类技术的部门,将是巩固东欧地区这一研究领域的关键第一步。

合作伙伴:

  • 斯洛文尼亚卢布尔雅那约瑟夫・斯蒂凡研究所(Jožef Stefan Institute, JSI)

  • 意大利比萨圣安娜高等研究院(Scuola Superiore Sant’Anna)

项目团队:

  • Duguleană Mihai

  • Marcello Carrozzino

  • Matjaž Gams

  • Cristian Lorenzini

  • Raffaello Brondi

  • Chiara Evanghelista

  • Franco Tecchia

  • Aleš Tavčar

  • Silviu Butnariu

  • Gheorghe Mogan等

资助方:

欧盟地平线2020研究与创新计划(European Union’s Horizon 2020 research and innovation programme)


8. DigiPal

图:DigiPal主页

数字古文字学、手稿研究与文书学资源数据库(DigiPal)旨在通过整合数字目录、手写体描述、文献图像及其组成字母形态,将数字人文领域的新方法应用于中世纪手写体的研究,重点结合其文书学与手稿语境开展探索。

该项目致力于以创新方式将数字技术融入学术研讨,整合了中世纪手写体的数字照片、详细的书写特征描述、书写所承载的文本内容,以及手稿或文献的整体结构与核心信息。项目同时整合了多种信息探索与处理方式,包括带注释的图像资源,以及更为传统的文本浏览与检索功能。这使得学者能够应用那些在理论层面已得到探讨,但在实践中难以或无法实施的古文字学方法新成果。

为实现上述目标,项目主要包含三个核心部分:

  • 用于在线呈现古文字学内容的通用网络框架;

  • 针对11世纪英语方言小写体的专属内容数据库;

  • 一系列印刷出版物,旨在将这些内容应用于具体研究——既助力深入理解英语方言小写体,也为古文字学研究方法提供实践参考。

合作伙伴:

伦敦国王学院

项目团队:

  • Peter A. Stokes

  • Stewart J. Brookes

  • Geoffroy Noël

  • Giancarlo Buomprisco

  • Matilda Watson

  • Debora Marques de Matos等

资助方:

欧盟第七框架计划


9. DIOPTRA

图:DIOPTRA项目logo

作为塞浦路斯研究所(The Cyprus Institute,CyI)助力塞浦路斯丰富文化遗产保护工作的核心举措,DIOPTRA数字图书馆的建立提供了必要的先进技术框架,用以支持一系列项目、合作计划及倡议的管理与国际传播。该图书馆的命名灵感源自古代天文测量仪器“ Dioptra”,同时旨在向塞浦路斯研究所受托人埃德梅・莱文蒂斯夫人(Mrs Edmée Leventis)致敬,以感谢她对该研究所在考古学、艺术及文化遗产领域研究工作的宝贵支持。

DIOPTRA的框架致力于促进与该地区主要文化遗产相关机构的合作,构建一个独特且广泛的研究网络,为未来的活动注入强劲动力。该数字图书馆基于模块化开发的数字平台,各模块专注于塞浦路斯文化遗产不同方面的研究。其中,“塞浦路斯古代文献数字化项目”已完成并成为首个上线模块,后续还将推出多个模块,包括“塞浦路斯中世纪钱币历史与文化项目”“海外博物馆藏塞浦路斯文物:皮塔斯登记册项目”“塞浦路斯古代文献数字化项目”“西奥多・阿普塞夫迪斯在塞浦路斯的艺术研究项目”“尼科西亚帕福斯门可视化:教育虚拟环境项目”“塞浦路斯服饰历史与文化项目”以及“萨拉米斯陶俑藏品整合:GRAVITATE项目”。

合作伙伴:

塞浦路斯研究所(The Cyprus Institute)

项目团队:

  • Dr. Nikolas Bakirtzis

  • Avgoustinos Avgousti

  • Ropertos Georgiou

  • Andriana Nikolaidou


10.eCodicology

图:Codicology项目

由德国联邦教育与研究部(BMBF)资助的联合项目“电子手稿学(eCodicology)”,其核心目标是开发、测试并优化新算法,以自动识别手稿页面的宏观和微观结构元素,并将这些元素嵌入图像元数据中。这些结构元素包括页面尺寸、印刷区域、页边距、副文本、图像元素的类型与位置信息,以及图文比例等数据。项目将对收集到的数据进行统计与定性分析,进而为解答与作者语料库、抄写室、手稿引用、文献来源、散佚手稿的关联性等相关问题提供支撑。

2013年至2016年,该研究项目采用了约500部中世纪抄本的元数据与扫描件,这些资源由圣马提亚虚拟抄写室项目(Virtuelles Skriptorium St. Matthias)按照文本编码倡议(TEI)标准整理并规范化。基于这些数据,项目设计了一套元数据方案,旨在尽可能自动采集抄本的外部描述元素,同时为手稿的每一页详细记录这些信息。与此同时,新提取的数据将以XML标签的形式与相关元数据一同存储,以便灵活用于统计分析和数据可视化。通过整合计算科学与文献学方法,该项目致力于为电子人文科学的方法论发展做出实质性贡献。

合作伙伴:

项目牵头方:达姆施塔特工业大学语言文学研究所(安德里亚・拉普教授博士,Prof. Dr. Andrea Rapp)

联合合作方:

  • 特里尔大学特里尔数字人文中心(Prof. Dr. Claudine Moulin)

  • 卡尔斯鲁厄理工学院数据处理与电子研究所(Dr. Rainer Stotzka)

关联合作方:特里尔市立图书馆/市立档案馆(Prof. Dr. Michael Embach)

项目团队:

  • 特里尔团队:汉娜・布施(Hannah Busch,2013-2016 年)、菲利普・万沙伊德特(Philipp Vanscheidt,2013-2015 年)

  • 达姆施塔特团队:西莉亚・克劳斯(Celia Krause,2013-2015 年)、奥利弗・施密德博士(Dr. Oliver Schmid,2015-2016 年)

  • 卡尔斯鲁厄团队:斯瓦蒂・钱德娜(Swati Chandna,2013-2016 年)

资助方:

德国联邦教育与研究部(German Federal Ministry of Education and Research, BMBF)

 以上内容来自欧洲数字人文协会(EADH)官方网站:

https://eadh.org/

经数字人文资讯小编翻译整理而成

如需转载,请后台私信联系

编译 丨 洪冰凤

校对 丨 罗斯鹏

排版 丨 魏翔


阅读原文

跳转微信打开

专业资讯 | vHeat:基于热传导机制的自适应视觉模型介绍

2025年10月18日 08:01

2025-10-18 08:01 湖北

vHeat是一种全新的视觉骨干模型,被CVPR2025收录。它的核心创新在于以“热传导”的物理原理来模拟图像中语义信息的扩散与关联,将图像块视为热源,通过热量扩散来捕捉全局关系,从而在保持全局感受野的同时实现极高的计算效率。

01 模型介绍

vHeat是一种全新的视觉骨干模型,由中国科学院大学与鹏城实验室联合提出,并被CVPR2025收录。它的核心创新在于以“热传导”的物理原理来模拟图像中语义信息的扩散与关联,将图像块视为热源,通过热量扩散来捕捉全局关系,从而在保持全局感受野的同时实现极高的计算效率。与传统的自注意力机制不同,vHeat的计算复杂度仅为O(N¹·⁵),显著低于Transformer的O(N²),但依然具备强大的全局建模能力。实验证明,vHeat在图像分类、目标检测和语义分割等多项任务上全面超越Swin Transformer,并在推理速度、显存占用和能效方面表现更优。它为视觉模型提供了一种融合物理启发与深度学习的新范式,被认为是后Transformer时代最具潜力的高效视觉架构之一。

vHeat模型在人文领域具有广阔的应用潜力。作为一种基于热传导机制的自适应视觉模型,vHeat能够在保持全局感受野的同时高效捕捉图像中的语义关联,非常适合处理人文学科中常见的高分辨率、复杂结构与历史性退化图像。它不仅能用于古籍文献的自动识别与版面分析,还可应用于碑刻拓片、壁画、佛像、绘画、手稿等文化遗产的数字化研究。例如,在古代写本与佛教文献研究中,vHeat可用于检测页面结构、识别正文与注释、分割破损区域、评估纸张磨损程度,甚至辅助文字修复与可读性增强。在艺术史与考古学中,它能对图像风格、线条特征和笔触模式进行聚类与分析,从而揭示不同地区或时期艺术风格的演变。由于vHeat在语义分割与目标检测方面的高精度和全局建模能力,它还能被用于建立大型视觉语义数据库,为跨文本与图像的文化分析提供智能化支撑。


图:GitHub中vHeat介绍界面

02 主要研发者介绍

Zhaozhi Wang*

中国科学院大学电子、电气与通信工程学院博士研究生

Yue Liu*

中国科学院大学电子博士研究生

Yunfan Liu

中国科学院大学电子、电气与通信工程学院博士后研究员

Hongtian Yu

中国科学院大学博士研究生

Yaowei Wang

中国鹏城实验室与哈尔滨工业大学(深圳)研究员

Qixiang Ye

中国科学院大学特聘教授

Yunjie Tian

中国科学院大学

* 表示共同一作

03 论文摘要

在学习稳健且具有高表达力的视觉表征时,一个核心问题在于如何高效地估计整幅图像中视觉语义的空间关系。为此,我们提出了一种全新的视觉骨干模型——vHeat,它在实现高计算效率的同时,也具备全局感受野。该模型的核心思想源自物理学中的热传导原理:将图像块视为热源,并将它们之间相关性的计算过程建模为热能的扩散过程。我们通过新提出的模块——热传导算子(Heat Conduction Operator, HCO),将这一机制融入深度网络中。该算子具有明确的物理可解释性,并可通过离散余弦变换(DCT)与逆离散余弦变换(IDCT)高效实现,其计算复杂度为O(N¹·⁵)。大量实验证明,vHeat 在多种视觉任务上均优于Vision Transformer(ViTs)。同时,针对高分辨率图像,vHeat还具备更快的推理速度、更少的浮点运算次数(FLOPs)以及更低的GPU内存占用。


A fundamental problem in learning robust and expressive visual representations lies in efficiently estimating the spatial relationships of visual semantics throughout the entire image. In this study, we propose vHeat, a novel vision backbone model that simultaneously achieves both high computational efficiency and global receptive field. The essential idea, inspired by the physical principle of heat conduction, is to conceptualize image patches as heat sources and model the calculation of their correlations as the diffusion of thermal energy. This mechanism is incorporated into deep models through the newly proposed module, the Heat Conduction Operator (HCO), which is physically plausible and can be efficiently implemented using DCT and IDCT operations with a complexity of O(N1.5). Extensive experiments demonstrate that vHeat surpasses Vision Transformers (ViTs) across various vision tasks, while also providing higher inference speeds, reduced FLOPs, and lower GPU memory usage for high-resolution images.


04 模型原理与实验结果

(一)模型原理


传统的自注意力机制(self-attention)虽然能捕捉全局依赖,但其计算复杂度为 ,在高分辨率图像上成本极高。vHeat的核心创新在于以物理学中的热扩散(thermal diffusion)过程取代自注意力传播,通过热传导算子(Heat Conduction Operator, HCO)实现特征信息的全局扩散。

经典二维热传导方程可表示为:

其中u(x,y,t)为温度分布,为热扩散系数。vHeat将图像特征映射U(x,y,c,t)类比为温度场,令像素块为“热源”,通过热扩散在空间与通道间传播特征信息。

图a直观对比了自注意力与热传导机制:自注意力需计算所有patch间两两相似度(O(N2)),而HCO通过DCT/IDCT的频域扩散仅需O(N¹·⁵)。因此,HCO 在获得全局依赖的同时显著降低计算成本。

图a

图b展示了vHeat的总体网络架构:模型包含四个阶段(Stage1-4),每个阶段由多层HCO与下采样层组成,分辨率逐级减半、通道数逐级增加。输入图像经stem层划分为patch,再由HCO模块进行热扩散式特征传播。

图b


图c展示了HCO模块内部结构。在频域中,HCO 的离散形式可写为:

其中,

为热扩散滤波项,控制不同频率的能量传播。模块内部包括:

  • FVEs(Frequency Value Embeddings):可学习的频率嵌入,用于预测热扩散系数,使扩散过程具备自适应性;

  • LN、DWConv、FFN:层归一化、深度卷积与前馈网络,用于增强表达;

  • 典型流程为 “Linear → DCT2D →(FVEs预测k)→ IDCT2D → Linear → SiLU”。

  • 该设计在频率域完成全局特征混合,同时在空间域保留局部几何结构。

图c

在物理热传导中,热扩散系数k反映介质的导热能力。vHeat令k为可学习参数,由FVEs依据内容自适应预测,从而按区域动态调整特征传播范围。图d显示了不同k值下的“温度”(特征)分布:固定k会均匀扩散、难以聚焦;可学习k则在语义显著区域(如物体边界)集中扩散,强化有效特征并抑制干扰。该机制使模型在空间上形成自适应热流动模式(adaptive visual heat conduction)。

图d

(二)实验结果


实验在ImageNet-1K、COCO 2017与 ADE20K数据集上进行;训练细节遵循Swin Transformer的标准设定,采用AdamW、余弦退火与常规数据增强。除常规任务外,作者还开展低层视觉与鲁棒性实验,以验证模型的广泛适用性。

1. ImageNet-1K 分类结果(见表a、图e)


表a

vHeat 在相似参数量下取得更高精度且推理更快。图e进一步给出了吞吐率、显存与FLOPs 随输入尺寸变化的曲线:当输入由256×768增至768×768,vHeat-B的吞吐率保持约3×优势、显存降低约80%、FLOPs降低约35%,验证了O(N¹·⁵)的高效性与可扩展性。

图e

2. COCO 目标检测与实例分割

表b(GitHub 实验表)给出了Mask R-CNN框架下的结果:
在1×训练设置(12 epoch)下,vHeat-T/S/B 的box mAP分别为45.1/46.8/47.7,均高于Swin(42.7/44.8/46.9);在3×多尺度训练(36 epoch)下,vHeat-S达到box mAP 48.8、mask mAP 43.7,继续保持领先。总体上,vHeat在检测与分割中取得+0.8~+2.4mAP的提升,并伴随40%–50%的推理速度优势。

表b

3. ADE20K 语义分割结果

表c(GitHub 实验表)总结了在UperNet框架上的分割表现:vHeat-T/S/B的mIoU(SS)分别为47.0/49.0/49.6,相较Swin模型提升+1.5~+2.0。这源于HCO的平滑全局扩散特性,能增强区域一致性与边界清晰度,适合复杂场景分割。


表c


05  模型调用与实验环境(Model Deployment and Execution)

本章介绍vHeat模型的调用方法、实验环境配置、依赖安装、训练与推理流程,以及在分类、检测和分割任务中的具体运行方式。相关步骤参考论文附录与官方仓库(https://github.com/MzeroMiko/vHeat),在Ubuntu22.04+CUDA12.1+PyTorch2.2环境下验证通过。


1. 安装与环境配置(Installation and Environment Setup)

2. 模型训练与推理(Model Training and Inference)

vHeat模型支持在多 GPU 环境下的分布式训练(Distributed Data Parallel, DDP),并提供从分类到下游任务的完整命令。

图b


3. 配置文件与日志管理(Configuration and Logging)

  • 配置文件路径:configs/
    包含Tiny、Small、Base三种规模的模型设定,可根据任务选择相应配置。


  • 日志与权重输出路径:logs/ 与 ckpts/
    默认保存训练过程的loss、精度曲线、TensorBoard 记录及最终模型权重。


  • 模型说明文件:modelcard.sh
    用于展示模型参数量、FLOPs与训练配置说明。


4. 环境与硬件要求(Runtime Environment)


论文中所有性能指标(Throughput, FLOPs, Memory)均基于以上硬件配置所得。

5. 引用信息

若在研究中使用vHeat,请引用以下论文:

6. 模型调用建议


  • 作为预训练骨干网络:
    通过修改OpenMMLab配置文件的backbone字段即可将vHeat替换为主干网络,广泛适用于检测、分割、OCR等任务。


  • 迁移至自定义数据集:

    将数据路径与类别数修改至config/*.yaml中的data-path与num_classes;执行interpolate4downstream.py以转换预训练权重;重新训练或仅微调最后若干层以适应新任务。

  • 在数字人文场景中的潜在应用:

    vHeat 可高效处理高分辨率图像,在文化遗产场景(如古籍、碑刻、壁画等)中具备以下应用潜力。

       ---结构区域分割(正文、边注、损坏区)

       ---文字检测与修复

       ---图像去噪与材质还原

       ---风格与笔迹分析

研究者可在已有权重基础上进行小规模微调,实现跨领域迁移学习。

以上内容来自官方网站:

https://github.com/MzeroMiko/vHeat与

https://arxiv.org/abs/2405.16555

经数字人文资讯小编翻译整理而成

如需转载,请后台私信联系


编译丨魏翔

校对丨洪冰凤

排版丨罗斯鹏

阅读原文

跳转微信打开

会议征稿|DH2026:Engagement联结

2025年10月10日 08:01

2025-10-10 08:01 湖北

数字人文组织联盟(ADHO)诚邀各界提交论文,参加其年度会议DH2026。该会议将于2026年7月27日至31日在韩国大田市举行。

一、会议主题:联结


DH2026的主题是“联结”(engagement),强调了数字人文组织联盟 (ADHO)致力于培养有意义的连接——既包括多元社群之间的联结,也包括人类与新兴技术之间的互动。该主题凸显了社群交流的活力,对“人工智能”等技术以及它们的合宜应用方式的反思。生成式人工智能技术(包括大型语言模型、多模态系统和计算机视觉模型)的日益突出,正在为数字人文的各类实践——从数据分析与建模到文化遗产研究乃至更多领域——带来新的视角与再思考。

本次会议既拥抱数字人文的既有成熟领域,也欢迎新兴的方法,鼓励进行各类讨论,以批判性且实践性的方式审视这些技术发展,并思考它们在所塑造的社群和语境中所带来的影响。

以下概述的三个分议题意在作为引导提案的说明性示例,而非对投稿范围的严格限制:

01

翻译 | AI时代的跨语际性

基于人工智能的机器翻译正日臻完善。这些发展不仅加速了跨语言的翻译与文化交流(且常无需再以英语为中介),也拓展了人与机器的接触地带。与此同时,多语种功能日益融入人工智能系统,反映出更广泛的转向,即在各类平台、界面与交流方式中日益重视语言多样性。另一方面,文化翻译研究也在演变——从强调忠实度和文本原创性,转向对翻译的情境性及语言等级政治的关注。那么,人工智能驱动的翻译技术将如何重塑“跨语言实践?作为一个试验场,在DH2026这样的国际学术活动中应用人工智能翻译,又会带来哪些机遇与挑战?

02

标注 | 超越模式:以小数据进行阐释

数字人文主要依托于大数据探索人文学科中的变迁模式。然而,数据是否一定要“庞大”?此类分析的结果是否总应以揭示某种模式为目的吗?我们应如何应对数据收集和分析中固有的算法偏见和歧视?如果我们承认数据本身就是历史与社会的产物,那么我们或许能更有意识地去审视研究的生产过程。小规模数据集能够支持更细致入微的阐释,而这样的视角亦可反哺人工智能模型的训练,尤其是在为资源匮乏的语言或特定领域塑造实践方法层面。我们该如何在小规模条件下生成高质量的数据?又该如何利用这些数据开展保持开放性的研究与解读?这种对数据的理解是否可能影响人工智能模型的训练方式与结构设计?

03

记忆 | 数字人文与世界记忆

联合国教科文组织的“世界记忆名录”不仅旨在保存对全人类具有历史及文化价值的珍贵档案文献,更在于提升公众对此的兴趣与理解。这些文献并非仅仅是被封存于偏僻档案馆中的静态文物,而是当今人文学科研究中持续发挥作用的一手文献。此分议题引发对于所有权、策展权与保存目的等问题的反思,并将“原住民数据主权”纳入考量中:谁的记忆被保存?又是为了谁的利益?此分议题亦鼓励学界对新兴数字工具(包括那些可被称为“记忆机器”的大型人工智能系统)进行批判性审视,探讨这些技术如何与文化记忆互动,并重新对其进行阐释。通过聚焦来自不同国家的贡献、探索植根于数字人文的创新方法论,此分议题致力于深化对这些无价资源的解读、获取与联结。

二、征稿范围


DH2026欢迎数字人文领域内广泛主题的投稿,范围不限于上述主题。

01

征稿语言

为确保同行评审的质量,大会要求所有提案以英文提交。作者在提交时可注明其偏好的展示语言。尽管在多语言并存的国际会议中实现全面兼顾具有一定挑战,地方组委会与学术项目委员会将尽力尊重这些偏好,并据此妥善安排会议。

为呼应大会“联结”的主题,韩国数字人文协会(KADH)计划在报告环节引入智能翻译工具,以促进语言多样性的包容,并回应当下技术发展的新课题。若报告人选择不使用该翻译服务,则可直接以英文进行展示。

02

技术专场

作者可将其投稿指定为技术专场的一部分。该专场的投稿,遵循数字人文技术特别兴趣小组(DHTech SIG)的任务,强调数字人文软件和基础设施的开发、可持续性及再利用。此类提案将由 DHTech SIG 的成员进行评审。

DH2026会议正与DHTech特别兴趣小组协商,以将此评审流程正式化。归入此类的稿件将受益于该小组在技术工作评估方面的专业能力。

03

提交类型

提案可按以下形式提交:

▪长论文(摘要1250-1500字):适用于完成度高、尚未发表的重要研究;对新方法或数字资源的重大进展报告;以及严格的理论性、推测性或批判性探讨。报告时间通常为20分钟。

▪短论文(摘要750-1000字):适用于报告实验性工作、进行中的工作以及处于早期开发阶段的新构思工具或软件。报告时间通常为10分钟。

▪海报(摘要500-750字):可展示任何相关主题的研究,或对项目、工具、艺术作品、创意可视化和不同阶段的软件进行展示。

▪会前工作坊或小型会议
请注意:ADHO已不再接受专题小组(panel)提案

04

会前活动

▪工作坊(Workshops):面向特定技术、软件工具或理论方法的深入介绍。时长为半天,可线下或线上举行。提案需包含议程(重点说明学习成果、目标受众以及讲师的专业背景)。摘要长度约1000字。

▪小型会议(Mini-conferences):为期一天的会议,形式不同于工作坊。例如,可以是THATCamp、黑客马拉松(hackathon)、创客展(maker faire),或在本地场馆举行的一系列活动。摘要长度约1000字。

三、提交信息


▪投稿入口:https://www.conftool.pro/dh2026/(提案必须通过ConfTool提交)

▪投稿开始:2025年10月8日 00:00(韩国标准时间)

▪投稿截止:2025年12月8日 23:59(韩国标准时间)

▪录用通知:2026年2月中旬(具体日期待公布)

▪注册开放:2026年2月中旬(具体日期待公布)

*DH2026计划以混合会议的形式举行。被录取的作者将在日程安排阶段被询问其选择线下参会或线上参会的意向。

四、评审流程与标准


所有提交的稿件都将经过双盲评审流程。因此,作者与评审者的身份信息将互不公开。这也意味着,提交的稿件中不应包含任何可能泄露作者身份的信息。

评审者将根据ADHO的既定标准评估提案,如下所示:

▪[1, 20%] 投稿是否充分描述了与工作相关领域内当前的知识水平和最佳实践,并且该描述是否有效的参考文献支持?

▪[2a, 20%] 投稿所呈现的研究是否在相关领域的现有知识与最佳实践之上有所突破?此类突破可体现在方法、路径、应用领域或研究发现等方面。

▪[2b, 20%,仅限于工作坊] 投稿是否足够详细地描述了工作坊的内容(主题、议题、方法、工具),以便读者理解将要讲授的内容?

▪[3a, 20%] 在摘要格式的篇幅限制内,稿件是否足够详细地描述了其研究路径或方法,以使读者能够理解研究的具体内容(做了什么)及其原因(为什么这么做)?

▪[3b, 20%,仅限工作坊] 投稿是否足够详细地描述了其讲授方法、将使用的材料以及工作坊期间主题的进展,以便读者理解将如何进行教学?

▪[4, 15%] 投稿是否体现了对多样性的支持?例如:是否拓展了 DH 会议所涵盖的主题、方法或视角的范围;以及是否对广泛的相关学术成果给予了充分认可,其中包括弱势群体或代表性不足群体成员的研究?(请参阅 ADHO 博客中关于评审标准的说明,特别是其中对 ADHO 所理解的“多样性”的讨论。)

▪[5, 15%] 投稿结构是否良好、表述是否清晰,是否便于读者理解?


五、联系方式


如有疑问,可访问会议网站 (https://dh2026.adho.org/) 或发送邮件至 kadh2026@gmail.com。

以上会议征稿内容来自DH2026官方网站:

https://adho.org/2025/09/30/cfp-dh2026/

由数字人文资讯编辑小组整理而成

内容因篇幅限制有所删减,更多征稿详情请在官网查询

编译|罗斯鹏

校对|魏翔

排版|洪冰凤

阅读原文

跳转微信打开

❌