《数字人文专业委员会简报》2026年第4期
数字人文专委会 2026-05-05 15:08 山西
以下文章来源于:全国报刊索引
全国报刊索引创立于1955年,是上海图书馆主管主办并倾力打造的专业信息服务品牌。六十余年来,《全国报刊索引》已发展成为汇聚两百年历史文献成果,集成近现代报纸、期刊、图书、会议论文为一体,并进行内容深度挖掘和组织的综合性知识服务体系。
编者按:本期简报设有前沿透视、数据资源建设、会议培训与学术观察四个栏目,持续追踪数字人文领域的资讯动态、资源建设进展与学术前沿。前沿透视栏目报道了2026年世界互联网大会文化遗产数字化案例征集、ADHO罗伯托·布萨奖提名征集、教育部与国家语委新发布两项语言文字术语规范、《信息与文献都柏林核心元数据元素集》国家标准即将实施,以及韩国“DEEP INTO SEOUL”数字文学平台等动态;数据资源建设栏目介绍了法国巴黎圣母院中世纪档案数字化项目、《史记》开源古籍知识工程项目Shiji-kb,以及欧洲文化遗产数据空间网站;会议培训栏目预告了第四届粤港澳大湾区跨学科学术博士论坛、NLPCC 2026国际自然语言处理与中文计算会议及“遗产4.0的数字生态系统”研讨会;学术观察栏目精选五篇近期研究成果,反映数字人文方法与应用层面的持续创新与探索。
本期目录
前沿透视
2026年世界互联网大会文化遗产数字化案例征集
ADHO 2026年度罗伯托·布萨奖提名征集
教育部、国家语委发布《机器合成普通话水平测评等级标准及测评大纲》、《人工智能语料库基础术语》语言文字规范
《信息与文献都柏林核心元数据元素集 第1部分:核心元素》《信息与文献都柏林核心元数据元素集 第2部分:DCMI属性和类》国家标准将实施
韩国“DEEP INTO SEOUL”数字文学平台上线
数据资源建设
巴黎圣母院中世纪档案数字化项目
Shiji-kb:AI 驱动《史记》开源古籍知识工程项目
欧洲文化遗产数据空间网站
会议培训
会议预告
第四届粤港澳大湾区跨学科学术博士论坛
第十五届CCF国际自然语言处理与中文计算会议(NLPCC 2026)
“遗产 4.0 的数字生态系统”研讨会
学术观察
批判性再谈“数字人文”
数字叙事驱动的档案文献遗产传播路径研究
《盛宣怀档案》智能分析系统的构建与史学应用——从检索增强到智能体推理
文化遗产的“游戏化生存”——兼论数字人文研究中的可玩性
从分类主题到语义空间:人工智能驱动下图书馆知识组织体系的转型与发展
前沿透视
2026年世界互联网大会文化遗产数字化案例征集
世界互联网大会发起的2026年文化遗产数字化案例征集活动已正式启动,面向全球征集优秀实践案例。征集设置“文化遗产保护”“考古”“展示利用”三大方向,申报主体涵盖政府部门、国际组织、文博单位、科研机构、高等院校及企业等各类机构。
世界互联网大会自2025年大会首次面向全球启动文化遗产数字化案例征集,最终遴选出40项案例,汇编成《世界互联网大会文化遗产数字化案例集(2025)》。2026年大会将继续开展文化遗产数字化案例的征集活动,入选案例将收录于《世界互联网大会文化遗产数字化案例集(2026)》,案例报送单位及团队还将获邀参与世界互联网大会乌镇峰会等重点活动。申报要求方面,项目须于2023年后启动实施,申报截止时间为2026年4月20日18:00。同一单位可申报多个方向,但同一案例不可重复申报不同方向。申报材料建议同时提供中英文版本,以便国际评审。
评选将邀请世界文化遗产数字化领域的权威专家对申报材料进行多轮评审,最终确定入选案例。
(申报地址:https://awards.wicinternet.org)
(https://mp.weixin.qq.com/s/e1giAeNhLaWq1GBlAh19mQ)
ADHO 2026年度罗伯托·布萨奖提名征集
国际数字人文联盟(ADHO)征集2026年度罗伯托·布萨奖(Roberto Busa Prize)提名。该奖项以数字人文先驱罗伯托·布萨神父(Father Roberto Busa)命名,旨在表彰将信息与通信技术应用于人文研究方面取得杰出终身成就的个人。布萨神父于1949年在IBM支持下开创人文计算实验,历时三十年完成56卷《托马斯·阿奎那著作索引》( Index Thomisticus),被誉为数字人文领域的奠基人。
罗伯托·布萨奖每三年评选一次,与赞波利奖(Zampolli award)等其他ADHO奖项交替颁发。自1998年布萨神父本人获首届奖项以来,已有约翰·伯罗斯、苏珊·霍基、威拉德·麦卡蒂等知名学者获此殊荣,2023年获奖者为苏珊·布朗。
本届提名要求提交详细说明被提名人终身成就及其领域贡献的推荐信,附个人著作书目更佳。提名无需ADHO成员资格,截止日期为2026年6月15日,材料请发送至ADHO主席Lauren Tilton邮箱(LTilton@richmond.edu)。
获奖者将获得1500欧元奖金,并受邀在2027年爱尔兰戈尔韦数字人文大会(DH2027)发表主题演讲。
(https://adho.org/2026/04/09/call-for-nominations-adho-roberto-busa-prize-2026)
教育部、国家语委发布《机器合成普通话水平测评等级标准及测评大纲》、《人工智能语料库基础术语》语言文字规范
教育部、国家语言文字工作委员会正式发布《机器合成普通话水平测评等级标准及测评大纲》及《人工智能语料库基础术语》两项语言文字规范。规范由教育部语言文字应用研究所(国家语委普通话与文字应用培训测试中心)组织研制,经国家语委语言文字规范(标准)审定委员会审定通过。
《机器合成普通话水平测评等级标准及测评大纲》确立了机器合成语音的普通话水平等级标准及测评框架,适用于技术研发、产品优化及应用评价。《人工智能语料库基础术语》界定了语料库在属性、建设及应用三方面的核心术语,涵盖语料、语料库、词元、元数据、自然语料、合成语料、预训练语料、微调语料、评测语料、通用语料库、领域语料库、多模态语料库等40余项术语定义,适用于人工智能领域语料库的建设、使用、管理、测评及研究工作。
两项语言文字规范的发布系落实《中华人民共和国国家通用语言文字法》关于“推进国家通用语言文字信息化、数字化、智能化建设”之规定,以及《关于加强数字中文建设推进语言文字信息化发展的意见》等相关部署,是中国语言文字标准体系建设向数字化、智能化方向推进的重要参考。
(http://www.moe.gov.cn/jyb_xwfb/gzdt_gzdt/s5987/202603/t20260326_1432152.html)
《信息与文献都柏林核心元数据元素集第1部分:核心元素》(GB/T 25100.1-2025)《信息与文献都柏林核心元数据元素集第2部分:DCMI属性和类》(GB/T 25100.2-2025)国家标准将实施
由全国信息与文献标准化技术委员会(TC4)归口、国家标准化管理委员会主管的国家推荐性标准《信息与文献都柏林核心元数据元素集》已正式发布,将于2026年分阶段实施。标准将替代2010年发布的GB/T 25100-2010。
第1部分“核心元素”,建立了一个适用于跨域资源描述的核心元数据元素集,已于2025年10月31日发布,将于2026年5月1日正式实施。第2部分“DCMI属性和类”于2025年12月2日发布,2026年7月1日实施。目的在于建立一个完整的跨域资源描述词汇表,定义了DCMI元数据术语主要命名空间中的所有属性和类,分别对类和属性的定义、使用注释和示例进行说明,定义了属性的定义域、值域。
都柏林核心元数据元素集最初由OCLC和NCSA于1995年提出,2003年成为ISO标准。中国于2010年首次采纳为国标。此次修订修改采用ISO 15836-1:2017和ISO 15836-2:2019,将原标准15个核心元素扩展为包含DCMI全部属性和类的完整术语表,增加了元素名、标签、统一资源标识符等定义,并调整了contributor等元素的释义。
该标准适用于信息资源组织场景下各类资源的描述,为数字资源系统间的数据交换提供语义基础。
韩国“DEEP INTO SEOUL”数字文学平台上线
韩国庆城数字文学地图联合研究团队推出“DEEP INTO SEOUL”数字文学平台。该团队长期致力于从韩国近代文学文本中系统提取空间信息,并通过数字人文方法提升文学研究的客观性与可重复性,向公众开放共享学术成果。
“DEEP INTO SEOUL”数字文学平台将20世纪30年代“大京城府”历史精确地图叠加于现代谷歌地图之上,整合超过2900部现代韩国小说的空间信息。通过该平台,用户可以在地图上查看160余个洞级地名、250 余处文学地标等。点击互动式地图上的地标,用户即可直接阅读该地点出现的作品及具体场景,并可比较李光洙、廉想涉、朴泰远等200余位近代作家以不同视角描绘的城市图景。
平台通过网络可视化模块,清晰直观地呈现作家、地点与作品的关系,250余个主要地点与7,000余个文学场景进行连接。该平台也利用了人工智能进行文本分析。通过谷歌Gemini自动分析小说中人物的移动路径,并通过地图将其进行可视化呈现。同时,以网络图呈现作品中人物之间的关系及情感变化,帮助用户更立体地理解叙事结构。
平台还收录了近代小说、报刊刊载的插图,使用户能够直观地了解近代韩国服饰、居住、交通及日常生活。通过同时欣赏小说文本与插画,提供更具沉浸感的文学体验。
(https://www.kadh.org/deep-into-seoul-project-%ED%94%8C%EB%9E%AB%ED%8F%BC/)
数据资源建设
巴黎圣母院中世纪档案数字化项目
e-NDP(NotreDame de Paris et son cloître, 1326-1504)是由法国国家科研署(ANR)资助、法国国立文献学院(École nationale des chartes–PSL)Centre Jean Mabillon 研究中心主导的档案数字化项目。项目以法国国家档案馆所藏巴黎圣母院教会分会26卷登记簿为对象,涵盖1326至1504年间共14,605页手写文献,完整记录圣母院51名参事每周三次例会的议决内容,涉及大教堂治理、行政管理、权利与财产经营及回廊社群活动,是研究中世纪制度史、外交史、经济史与城市史的核心原始史料。
e-NDP自立项之初,便确立四大核心原则:面向多元公众开放获取、原始数据开放共享、支持文本与数据挖掘、完整留存数据处理全流程。项目团队认为,原始数据的长期保存可依托专业仓储平台加以保障,但应用系统的持续维护则有赖于规范清晰的API接口与良好的开发实践。
在资源加工层面,项目依托手写文本识别(HTR)技术完成全文转录,建立从TIFF图像采集、PDF转录规范指南、XML/ALTO训练基准数据标注、MLModel模型训练,到XML/ALTO结构化输出的完整技术流程,并以Python Notebooks形式保存后处理脚本,语料 Vertical格式导出供语料库检索使用。
在平台架构层面,项目以Nakala(Huma-Num为核心后端,兼顾原始数据归档与应用服务支撑双重功能:图像(TIFF)与转写文本(XML/ALTO)分别在 Nakala 独立存储,再通过IIIF图像API与展示API实现前端的图文联动呈现。平台前端提供登记簿影像浏览、HTR全文检索、人物档案(含任职经历、家族关系、相关事件)与地点索引(含建筑平面图及今古名称对照)等功能,并已实现与法国国家档案馆虚拟阅览室及CNRS/MAP “数字数据”信息系统的跨平台互联。Zenodo等平台则作为补充仓储保障数据长期存续。
(https://endp.chartes.psl.eu/endp/)
Shiji-kb:AI 驱动《史记》开源古籍知识工程项目
Shiji-kb 是基于《史记》的中文古籍知识工程开源项目,项目依托人工智能,完成了对《史记》130篇、57.7万字全文的结构化数据处理,并沉淀了26份可复用的知识库构造方法论Skill文档,为古籍数字化整理提供完整技术管线。
项目通过 AI 辅助完成18类实体标注,涵盖人名、地名、官职、时间、器物、制度等,累计标注实体 99214次,构建实体词条12380个,完成别名映射与语义消歧,形成规范统一的实体资源库;精准抽取历史事件3185个,覆盖11类事件类型,98.7%完成公元纪年标注,建立事件关系7652条,包含跨章关联1876 条,形成完整的事件知识资源;整合434项事实知识与241项历史技能知识,构建675个知识单元,关联实体7497个,形成层次清晰、关联紧密的结构化知识资源。此外,项目还对裴骃《集解》、司马贞《索隐》、张守节《正义》三家注进行处理,将评注与原文句子精准对齐,鼠标悬停即可弹窗查看。该项目的深层价值在于其将数字资源建设流程沉淀为可复用方法论,形成26个Skills文档,覆盖校勘、结构分析、实体构建、事件抽取、关系建模、知识推理等9大阶段,形成标准化、自动化的古籍知识库构建管线,可直接迁移应用于其他典籍的数字资源建设。项目所有数据、代码、工具与方法论以开源形式发布,支持研究者、开发者、教育者免费使用与迭代优化。
访问地址:https://baojie.github.io/shiji-kb/
(https://mp.weixin.qq.com/s/kPEyL3NDPAQYp7sFl5eE4w)
欧洲文化遗产数据空间网站
欧洲文化遗产数据空间(Common European Data Space for Cultural Heritage)是欧盟“数字欧洲计划”(DIGITAL Europe Programme)资助的14个共同数据空间中首个面向文化领域的核心基础设施。项目由Europeana Initiative主导,依托欧盟“数字欧洲计划”资金支持,联合来自九个欧盟成员国的19家机构组成联合体共同实施,旨在持续推进文化遗产资源的开放共享与普惠可及,优化数据流通体系,助力欧洲价值创造、创新发展与竞争力提升,加速欧洲文化遗产领域的整体数字化转型。
欧洲文化遗产数据空间的核心定位是:在既有Europeana平台数字服务基础设施之上,构建一个更广泛的开放数据生态系统。相较于Europeana.eu作为面向公众的发现平台,数据空间着眼于更底层的基础设施建设与制度性框架搭建,覆盖数据生产、共享、互操作、再利用的完整链条,并着重纳入3D 数据、科学研究数据等Europeana现有体系尚未充分承载的新型遗产数据类型。
该项目《2025—2030战略》为数据空间合作主体划定三大核心发展方向:搭建稳健互通的基础设施、优化文化遗产资源品质;推动藏品跨领域开放共享与复用;依托能力建设、社群协作与创新应用,助力行业数字化升级。在此基础上,文化遗产数据空间将人工智能、三维及扩展现实、多语言服务列为全域协同的关键技术领域。
访问地址:https://www.dataspace-culturalheritage.eu/
会议培训
会议预告
第四届粤港澳大湾区跨学科学术博士论坛
第四届粤港澳大湾区跨学科学术博士论坛由澳门大学人文社科高等研究院主办,本届论坛以“数字驱动的社会公平:技术、身份与人文的研究”为主题,延续前三届推动跨学科对话的宗旨,旨在回应当代数字化快速发展带来的全球性挑战。论坛面向人文、社会科学、自然科学及技术科学等领域的在读及即将毕业的博士生,设置中英文双语分论坛。涵盖八大分议题:数字素养、数字公平与政府治理、数字身份与公民权利、数字正义与平台劳动、数字福祉与社会、算法偏见与排斥、公平机器学习实践以及量子计算与法律等前沿方向。论坛对所有参与者免费开放,优秀论文作者将获邀于8月26日至27日在澳门大学现场汇报,组委会承担受邀者的在澳住宿及餐饮费用。
主办单位:澳门大学人文社科高等研究院
会议时间:2026年8月26日—8月27日
论文投稿截止日期:2026年5月31日
会议地点:澳门大学
(https://mp.weixin.qq.com/s/e90yuLI9P5v3XiyFMNhpTA)
第十五届CCF国际自然语言处理与中文计算会议(NLPCC 2026)
第十五届CCF国际自然语言处理与中文计算会议(NLPCC 2026)将于2026年11月3日至5日在澳门举行。NLPCC是自然语言处理和中文计算领域的领先国际会议,被列入CCF推荐国际学术会议和期刊目录,并入选CCF高质量国际学术会议推广计划。会议将涵盖自然语言处理与中文计算的广泛核心议题,包括语言学与计算基础、机器学习与大语言模型、多模态与交互系统、信息抽取与理解,以及应用伦理与评测等,以期全面推动相关研究与技术创新。NLPCC 2026仅接受英文投稿,录用论文将由Springer LNAI系列出版(EI & ISTP检索)。
主办单位:中国计算机学会自然语言处理专委会(CCF-NLP)
会议时间:2026年11月3日—11月5日
论文提交截止日期:2026年5月26日
会议地点:澳门银河国际会议中心
( http://tcci.ccf.org.cn/conference/2026/)
“遗产 4.0 的数字生态系统”研讨会
第四届GEORES与第十届Arquelogica 2.0联合研讨会以"遗产4.0的数字生态系统"为主题,将于2026年8月26日至28日在意大利佛罗伦萨举行。本次会议聚焦人工智能、数字孪生、数据生态系统及文化遗产风险评估等前沿领域,录用论文将收录于Springer Nature CCIS丛书。研讨会设置五大分论坛,涵盖AI治理与文化遗产信任问题、数字孪生技术超越3D建模的潜力、遗产风险监测与韧性策略、数字化博物馆的可及性与混合体验,以及遗产4.0时代的人才培养与知识传承。此外,会议特别设立两个专题:纪念1966年阿诺河大洪水60周年的数字记忆与风险意识研讨,以及阿拉伯与地中海地区的数字遗产创新实践。
主办单位:CHEDAR项目组
会议时间:2026年8月26日—8月28日
论文摘要提交截止日期:2026年5月15日
会议地点:意大利佛罗伦萨
(https://digitalecosystems4h.org/call-for-papers/)
学术观察
批判性再谈“数字人文”
来源:许喆.批判性再谈“数字人文”[J].数字人文研究,2026,6(01):3-13.
摘要:数字人文作为人文研究中的新兴领域,其学科属性迄今仍较为模糊,并伴随持续争议。文章从方法论视角出发,综合分析各国学者关于数字人文在克服传统人文研究局限方面的论述,并批判性地指出当前数字人文研究中“重数据建设、轻实质研究”的倾向。文章主张,数字人文本质上应被理解为人文研究的方法论,而非独立学科,并强调数据准确性、研究的科学性和论证逻辑的严密性。与此同时,文章批判了当前数字人文教育过分关注技术工具的使用,而忽视人文问题意识以及发现问题和解决问题能力的培养,因而有必要从“技术中心”转向“问题中心”和“批判思维”导向。
数字叙事驱动的档案文献遗产传播路径研究
来源:董文弢.数字叙事驱动的档案文献遗产传播路径研究[J].中国档案,2026,(02):61-62.
摘要:“近现代中国苏州丝绸档案”作为2017年入选联合国教科文组织《世界记忆国际名录》的重要遗产,其价值不仅在于记录苏州丝绸产业百年来的技术演进与历史变迁,更在于其承载的工匠精神、美学理念与经济智慧。苏州中国丝绸档案馆(以下简称“中丝馆”)在数字化转型过程中积极探索以数字叙事为核心的文化传播模式,通过技术赋能、多模态内容转化与参与式传播机制,推动丝绸档案从静态史料向动态文化资源转化。笔者探索叙事学与多模态资源的密切关联与支撑作用,基于数字叙事理论,选取丝绸档案的传播路径为案例,为档案文献遗产传播与推广提供借鉴和参考。
《盛宣怀档案》智能分析系统的构建与史学应用——从检索增强到智能体推理
来源:张光伟.《盛宣怀档案》智能分析系统的构建与史学应用——从检索增强到智能体推理[J].数字人文研究,2026,6(01):43-52.
摘要:面对浩如烟海且高度非结构化的历史档案,传统的数字化处理与关键词检索模式已难以满足日益复杂的史学研究需求,特别是在处理如《盛宣怀档案》这类涉及晚清政治、经济、外交等多维网络的复杂史料时,研究者常陷入查不全、理不清、关联难的困境。研究在回顾数字人文从数字化、结构化向智能化转型的技术背景的基础上,引入大语言模型前沿的思维链技术与推理一行动框架,构建了一个基于AgenlicRAG的“盛宣怀档案智能分析系统”,该系统突破了传统知识图谱预定义的局限,通过“意图理解、资料检索、资料总结、评估决策、内容撰写”五个智能体的协同工作,实现了对全量档案文本的语义向量化与动态推理。系统具备主动规划检索路径、多步逻辑推演、跨文档证据互证以及自我纠错的能力,能够模拟历史学家“提出假设一史料搜集一考证辨析一形成结论”的认知过程。文章通过微观、中观和宏观三个层面的典型案例展示了该系统的应用潜力。研究实践证明,AI时代这种“人机回环”(Human-in-the-loop)的协作模式,不仅能将历史学家从繁琐的信息搜寻中解放出来,更开启了以数字文献考古与全息逻辑增强为特征的历史研究新探索的可能性。
文化遗产的“游戏化生存”——兼论数字人文研究中的可玩性
来源:王一楠.文化遗产的“游戏化生存”——兼论数字人文研究中的可玩性[J].数字人文研究,2026,6(01):62-74.
摘要:文章以“游戏化生存”为理论命题,系统探讨文化遗产在数字原生范式中的存在方式及其认识路径。将电子游戏界定为兼具拟真系统、具身界面、可能时空与情动媒介四重属性的程序化建模/模拟系统,并揭示出其在强化联觉体验、激活身体图式、延展想象空间及引导公共行动等方面的机制潜能。基于此,进一步提炼出“可玩性”作为数字人文研究中的关键概念,将其界定为操作可能性与生成开放性的统一,并阐发其在融合表示、具身认知、动态推演与能量汇聚四个维度的方法论价值。研究指出,可玩性不仅是数字文化遗产的存续机制,更是推动人文知识生产方式从文本阐释转向模拟与体验的关键路径。
从分类主题到语义空间:人工智能驱动下图书馆知识组织体系的转型与发展
来源:刘炜,金家琴,张宁,等.从分类主题到语义空间:人工智能驱动下图书馆知识组织体系的转型与发展[J/OL].中国图书馆学报,1-20[2026-04-14].https://link.cnki.net/urlid/11.2746.g2.20260409.1750.002.
摘要:生成式人工智能的快速发展正在从底层逻辑上重塑图书馆知识组织的技术基础与价值定位。通过采用文献综述与多案例比较分析方法,系统梳理近年来国内外知识组织领域的理论进展与技术实践,从知识表示与处理方式的演进视角出发,分析符号操作、统计学习与语义计算等不同方法路径在知识组织中的作用与变化。研究发现:第一,传统知识组织的根本困境并非只是效率问题,而是符号体系与知识本体之间存在不可消除的语义鸿沟,表现为标引成本的指数增长、受控词表的语义僵化以及人工标注的系统性偏差;第二,AI技术并未使知识组织变得不必要,而是推动其核心功能从“文献揭示”转向“知识标注”,从服务人类检索转向同时服务机器理解;第三,传统知识组织资产对AI的支撑价值在当前数据稀缺阶段具有不可替代性,但随着合成数据与自监督学习的成熟,该价值将逐步递减。图书馆知识组织正经历从符号逻辑向向量语义的范式转换。图书馆界应在制度设计、人机回环技术工作流以及领域知识工程师的能力重塑等三个维度推进战略转型,适应未来人工智能环境中的方向性变革。
供稿:卢钰、秋慧婷、沈立力 责编:韩春磊、张宏玲
编辑部:中国索引学会数字人文专业委员会秘书处
电话:64455555-68360
邮箱:DH2020@libnet.sh.cn
-END-
本微信公众平台音频、视频及活动图文信息报道系上海图书馆「全国报刊索引」制作,并享有版权。如需转载或其他合作,请联系公众号获取授权,并标明作者及出处。