普通视图

Received before yesterday0 - 数字人文专业发展联盟

东南大学人文学院:数字人文微专业建设案例

2026年5月17日 12:01

2026-05-17 12:01 北京

数字人文微专业建设案例集

系列专栏

为贯彻落实教育部关于高校学生就业能力提升“双千”计划战略部署(建设1000个微专业和1000个职业能力培训课程),切实发挥优秀案例的示范引领效能,本公众号开设【数字人文微专业建设案例集】系列专栏,面向全国高等院校公开征集已落地实施的数字人文微专业建设案例。诚邀各院校积极参与,协力构建具有行业参考价值的数字人文教育资源共享机制。

征集说明

征集对象:开设数字人文方向微专业的院校;

内容要求:需呈现专业定位、课程体系、实施成效等核心要素;

参与方式:

微信公众号后台留言【数字人文微专业案例+院校名称+联系人方式】;

联系项目组:miaoqing@ancientbooks.cn。

专栏推荐阅读:

“清华数字人文丛书”系列的第一本教材

《数字人文引论》

点击封面购买阅读

中国数字人文“百科全书”

《中国数字人文发展报告》

点击封面购买阅读

东南大学人文学院

数字人文微专业招生简章

1.专业定位

数字人文,或称数字人文科学,是计算科学和人文科学深度融合所衍生的新专业。数字人文不仅为人文学科的研究提供了新工具、新方法,也为人文学科与自然科学的交流合作搭建了桥梁,结合数字技术与人文学科的研究方法,开发数字人文产品,通过数字技术、数据分析和数字资源管理等手段,推动人文科学研究。

2.培养目标

数字人文微专业培养既掌握数字技术,同时又具有扎实的文字功底和宽广的人文学科知识,能借助计算机和数据科学等方法和手段进行人文研究,具有文化资源开发与传播、数字时代新媒体运用与创新实践能力,能胜任党政军机关、企事业单位的信息管理和数据分析岗位,图档文博机构的数字化或IT部门,文化创意产业、文博产业等职位要求的复合型创新领军人才。

3.培养对象

大学本科生,限文科专业。

4.培养内容

  • 掌握系统的数字人文理论,了解数字技术在人文学科领域的综合运用。

  • 掌握常用数字技术如Python编程、数据可视化、GIS应用等实用技术。

  • 掌握文学、史学、哲学、语言学、艺术等人文学科的基础知识、研究对象和研究方法;培养学生的口头与书面表达能力。

  • 掌握将数字技术应用于人文领域进行学术研究、产业转化等方面的理论、方法与实践应用等。

5.培养方法

通过“跨学科融合+技术赋能”的课程体系,采用案例式、项目式教学方法,培养学生运用数字技术解决人文领域问题的能力。

6.评价体系

多维课程考核与综合能力认证。课程考核包括理论基础、技术实操、场景应用、成果产出等,综合评价学生的学习目标达成度。

招生对象和计划

1.招生对象

(1)在籍在校2024级、2025级本科学生,在主修专业学制内学有余力,平均学分绩点3.0及以上(4.0制)

(2)本科生限文科专业

2.招生计划

30人,录取人数达20人及以上方可开班。

课程设置

1.修读年限

2年(2026年9月—2028年6月)

2.总学分要求

14学分

3.课程目录

4.结业要求

修完所有课程且成绩合格

课程介绍

数字人文微专业课程强调数字与人文的融合,兼具前沿性和实用性。

数字人文导论

系统介绍数字人文的基本概念、专业内涵和研究方法。通过理论和实践的介绍,使学生掌握如何运用数字技术进行人文研究的路径和方法。

Python的编程和应用

通过具体实例讲解Python程序的编写方法,使学生具备Python基础编程能力,具备应用Python解决实际人文社科应用问题的能力。

社会网络分析

通过学习使学生掌握社会网络分析基本概念、熟练运用相关专业软件,并进行数字人文相关的研究探索。

数据可视化与GIS应用

让学生掌握数据可视化与GIS领域的核心理论与技术,并深入了解VOSviewer、Python及ArcGIS等软件在多样化数据可视化分析中的实际应用。

数字文化产业:IP运营与前沿实践

聚焦数字文化产业的核心环节——IP运营与前沿实践,系统讲解IP价值评估、跨媒介改编、粉丝社群运营、海外本土化发行及AIGC赋能等产业实务。

数字时代的中国传统文化

使学生熟悉中国传统文化的基本面貌、历史阶段及民族特色,了解在数字时代中应该如何利用现代信息技术创造性转化、创新性发展中国优秀传统文化。

数字创意写作

介绍数字化技术介入下的创意写作具体创作方法,介绍从传统文学写作中的“作者”到多模态作者身份的转变,分析传统写作和算法时代写作的差异性。

语料库语言学

研究自然语言文本的计算机存储、检索、分析与统计。使学生了解语料库语言学的研究方法与理论,培养学生设计和构建语料库的能力。

师资力量

数字人文微专业的授课团队由人文学院汉语言文学专业、社会学专业、旅游管理专业以及图书馆图书管理信息系统相关老师组成。教师专业背景、研究专长及曾授课程,均与微专业拟授课程密切相关。

1

乔光辉

讲授“数字人文导论”

东南大学人文学院教授,博士生导师。先后担任人文学院中文系副主任、系主任及人文学院副院长等。主要研究元明清文学与艺术,发表学术论文百余篇,出版专著3部,是国家社科基金重大招标项目“明清小说戏曲图像学”(批准号19ZDA256)首席专家。兼任江苏省明清小说研究会、江苏省红学会、江苏省地域文化研究会、江苏省写作学会等学会的副会长。2020年入选江苏省社科文化英才,2021年获东南大学特聘教授荣誉称号。

2

何  平

讲授“数字人文导论”

文学博士,东南大学人文学院副教授,硕导。专著1部,论文20余篇,论文被《新华文摘》全文转载。获江苏省哲学社会科学优秀成果三等奖、江苏省哲学社会科学界学术大论文一等奖等。兼职江苏省写作学会大学语文研究分会秘书长。主要研究领域:中国古代文艺理论、跨门类文艺比较。

3

李  峰

讲授“Python的编程和应用”

副研究员,人文学院,研究方向为定量研究,自杀预防和犯罪研究。过往/目前担任课程:人口学;定量研究方法;社会工作理论;越轨、犯罪和社会控制。

4

赵政原

讲授“数据可视化与GIS应用”

东南大学人文学院副教授,广域科学博士。博士毕业于东京大学人文地理学专业,熟悉ArcGIS等数字人文软件的使用。

5

杨  青

讲授“数据可视化与GIS应用”

助理馆员,所在单位:图书馆,研究方向情报分析、信息咨询,曾授课程:“信息检索”(医学院)、“写作规范与文献检索”(仪科学院)。

6

何菊香

讲授“数据可视化与GIS应用”

助理馆员,所在单位:图书馆,主要从事数字图书馆、知识图谱可视化等方面的研究,曾参与或主持“基于JALIS联盟的数字资源长期保存路径研究”等项目。

7

程  诚

讲授“社会网络分析”

东南大学社会学系教授、副系主任,博士生导师,青年至善学者。研究领域:社会网络与社会资本、社会分层与流动、数字社会学、青年发展。主持 2 项国家社会科学基金,主持江苏省社会科学基金重点项目等 6 项省部级课题。在《社会学研究》、Chinese Sociological Review 等中英文期刊发表论文 40 余篇,学术专著 1 部,相关成果被《中国社会科学文摘》等刊物转载,先后 5 次荣获省部级优秀成果奖。

8

李灵灵

讲授“数字文化产业:IP运营与前沿实践”

中山大学-西澳大利亚大学联合培养文学博士,现为东南大学人文学院中文系副教授、硕士生导师,SSCI期刊审稿人,文艺理论学会会员。主要从事新媒介文艺理论、网络文学与文化产业、城市文化与传统文化研究。在International Journal of China Studies、《文艺理论研究》《民族艺术》《当代文坛》《文化遗产》等学术期刊发表中英文论文二十余篇,出版学术专著《新媒体与中国网络文学》《打工作家:珠三角都市新移民的文化身份建构》等,主持国家社科基金项目1项、教育部项目1项、省厅级项目若干。

9

陈  志

讲授“数字时代的中国传统文化”

东南大学人文学院中文系讲师,主要研究中国古代文学及文学批评,主编《中国戏曲理论批评简史》等著作。曾讲授“中国文化史”“现代语言教育技术”等课程。

10

张  娟

讲授“数字创意写作”

东南大学人文学院教授,博士生导师。东南大学中文系主任。江苏省鲁迅研究会副会长,中国鲁迅研究会理事,中国小说学会理事,江苏省现代文学学会理事,江苏省作协委员会委员,世界华文创意写作协会理事等。

主要研究方向:中国现当代文学与创意写作等。现主持国社科基金一项,教育部后期重大项目一项,主持和参与国家与省部级项目多项,出版专著三部,参著多部,在《文学评论》等核心与省部级刊物发表论文七十余篇。曾获东南大学教学奖励金一等奖,东南大学“吾爱吾师”十大最受学生欢迎老师称号、院系最受欢迎研究生导师称号等。

11

刘艳梅

讲授“语料库语言学”

东南大学人文学院中文系副教授,主要教授“现代汉语”“语言学概论”(双语)、“汉语作为第二语言教学法”等语言类课程。

教学安排

1.开课校区

东南大学九龙湖校区

2.上课时间

周末

3.教学方式

线上线下混合式教学

4.班主任配备

各班独立配备班主任,班主任由专职教师担任。

联系方式

招生联系人:张老师

办公地点:新文科楼1314

END

招生简章信息来源于东南大学人文学院公众号“东南文苑”

点击封面购买阅读

阅读原文

跳转微信打开

新继教面授56学时 | 古籍整理出版与数字化专题培训班

2026年5月15日 12:00

古联数字 2026-05-15 12:00 北京

以下文章来源于:籍合学院

籍合学院

中华书局旗下古籍整理与传统文化学习平台

籍合学院2026年第1期出版专业技术人员继续教育培训将于5月24日-30日在中华书局举行。

各有关单位:

为贯彻落实《2021-2035年国家古籍工作规划》战略部署,加强古籍人才队伍建设,提升从业人员在古籍整理出版领域的理论修养与实务水平,增强数字时代古籍资源开发利用及融合出版创新能力,经中宣部干部局批准,中华书局古联公司计划举办“古籍整理出版与数字化专题培训班”。

参培学员可获得出版专业技术人员继续教育证书(新继教面授56学时)。

01

培训形式及时间地点

形式:线下面授

时间:2026年5月24日至5月30日(共7天)

地点:北京市丰台区太平桥西里38号中华书局二楼多功能厅

02

培训对象

本次培训主要面向全国各出版单位从事古籍类图书出版及相关融合出版项目的骨干编辑、产品经理等一线从业人员。

从事古籍整理出版学习研究需求的高校师生、文博馆员等科研业者及有其他学习需求的人员,亦欢迎报名。

03

培训内容

本次培训设置“思政引领”“古籍整理理论与方法”“出版实务”“数字化前沿”四大教学模块。各模块均经前期调研论证,严选该领域权威专家担纲授课。共计14门课程,56学时。(以下为简图,详情见文末)

04

考核方式

学员培训期间参加由组织方安排的签到考核,成绩合格者颁发出版专业技术人员继续教育证书。

05

培训费用

费用:2380元/人

培训期间提供午餐(无需额外缴费),其他食宿费用自理。

06

报名方式

扫描二维码缴费报名。集体报名或对公转账请咨询联系人。

07

联系方式

联系人:杨老师

电话:18519325994(可加微)

邮箱:training@ancientbooks.cn

授课安排

上午:9:00~12:00,下午:13:30~16:30

具体安排请以实际授课情况为准:

01

5月24日上午

授课主题:马克思主义基本原理同中华优秀传统文化相结合的理论与实践

授课教师:王向明,中国人民大学马克思主义学院教授,博士生导师;中央马克思主义理论研究与建设工程课题组主要成员;教育部全国高校政治理论课“精彩一课”教学示范专家;北京市干部理论教育讲师团专家团成员;全国自强模范,全国高校百名政治理论课优秀教师,全国“三育人”先进个人,北京市优秀教师,北京市师德标兵,中国人民大学“十大教学标兵”,全国高校思想政治理论课度影响力人物标兵。

02

5月24日下午

授课主题:数智时代的古籍整理与阅读  

授课教师:苏芃,南京师范大学文学院中国古典文献学专业教授,博士生导师。教育部青年长江学者。主要从事先秦两汉经典及相关文献研究,在《文史》《中国语文》《文学遗产》《中国史研究》《文史哲》《中华文史论丛》《文献》《数字人文》等刊物发表论文、札记七十余篇,其中多篇文章涉及古籍数字化应用问题。曾参与中华书局点校本《史记》修订工作,为修订组主要成员。

03

5月25日上午

授课主题:“十五五”出版规划解读与数字出版产业发展态势

授课教师:王飚,现任中国新闻出版研究院数字出版研究所所长,三级研究员、编审。国家社科基金项目评审专家,中宣部“原动力”原创动漫出版扶持计划评审专家、网络出版物质量审核专家,原国家新闻出版广电总局新闻出版改革发展项目库评审专家、数字化转型升级评估工作组专家,国家动漫精品工程暨中国文化艺术政府奖评审专家,“王选新闻科学技术奖”评审专家,中国电视金鹰奖终评评委,北京市宣传文化引导基金评审专家,北京市新闻出版高级职称评审专家、动漫游戏项目评审专家,入选文化部动漫高端人才库、北京市出版“百人工程”。

04

5月25日下午

授课主题:当下古籍整理与出版的困境、机遇与人才培养

授课教师:漆永祥,北京大学博雅特聘教授,北京大学中国语言文学系教授,曾任教育部中文学科教学指导委员会委员,北京大学中文系副系主任,主管本科生与留学生的教学工作,为北京市语文高考阅卷组副组长。先后为新加坡东方文化学院、韩国外国语大学、韩国高丽大学专任教授。主要从事中国古文献学史、清代考据学、宋诗整理与研究、《燕行录》研究、东亚学术与文化研究以及中学语文教学与高考等的教学与科研工作。

05

5月26日上午

授课主题:古籍从文献调研到出版成书全流程——以《儒藏》精华编、《大仓文库萃编》为例

授课教师:马辛民,北京大学出版社学科副总编辑,编审。参与并主持编辑出版了一系列国家级出版项目,包括《全宋诗》《十三经注疏》(整理本)、《中国儒学史》《大仓文库萃编》《日本足利学校藏国宝及珍稀汉籍十四种》《国家图书馆藏汲古阁钞本丛书》等。作为编辑总负责人,主持完成《儒藏》“精华编”(中国部分)的编辑出版工作。五次获得国家图书奖、中国出版政府奖。在古籍整理出版方面有丰富的经验。

06

5月26日下午

授课主题:碑刻文献的整理出版工作

授课教师:党斌,陕西省社会科学院古籍整理研究所所长、研究员,兼任西安国家版本馆专家委员会委员、陕西省社会科学信息学会会长等。主要从事中古碑志文献、中韩文献交流等研究。主编合作编制有《陕西出土宋代墓志辑释》《陕西碑刻总目提要初编》《陕西碑刻文献集成》《三原碑刻》《白水碑刻》等,多项成果获国家文化遗产优秀图书、全国古籍出版社百佳图书一等奖、陕西省哲学社会科学优秀成果奖等国家级、省部级奖项。  

07

5月27日上午

授课主题:古籍出版选题策划经验谈

授课教师:石玉,中华书局哲学室编辑副主任,副编审。长期从事古籍编辑工作,编辑有《长沙马王堆汉墓简帛集成》(第四届中国出版政府奖)、《五礼通考》(第五届中国出版政府奖)、《历算全书》、《尚书注疏汇校》等,在经部、子部文献的整理出版方面拥有丰富经验。第四届宋云彬古籍整理奖·编辑奖获得者。

08

5月27日下午

授课主题:大变局下的中华文化数字产业:趋势与案例   

授课教师:王建,中华书局数字编审。中华书局传统文化教育研究中心主任,中华书局古联数字产业研究院院长。中国教育发展战略学会人文与数智专委会学术委员。主要研究领域为中华优秀传统文化教育、文化科技融合创新、文化数字产业等。曾获国务院颁发的国家科技进步二等奖、国家新闻出版署颁发的出版业科技与标准创新示范项目等奖项,责编的出版物多次获评新闻出版署向全国青少年推荐百种优秀图书。在《中国出版》《数字人文》《科技管理研究》《光明日报》等报刊发表论文多篇,并出版有《诚孝仁义公——中华美德新五常》等。

09

5月28日上午

授课主题:叩问碎片:史料的搜集、整合与叙事策略

授课教师:苗子兮历史作家,毕业于北京大学历史学系。曾担任中央电视台纪录片《航拍中国》第三季、《中国国家地理》《中华遗产》等撰稿人,出版有《观我生——壁画上的中国史》(国家图书馆第18届文津图书奖推荐图书)《观无量——壁画上的中国史》《大明最后的使臣》《另一个悟空的西游记》等著作。

100

5月28日下午

授课主题:古籍及传统文化类图书市场分析

授课教师:蒋艳平北京开卷信息技术有限公司联席董事长,未来出版研究院院长。华东师范大学出版学院兼职教授,中国—东盟文化产业研究院(广西未来出版研究院)首批特聘专家,人卫研究院特聘专家。长期从事图书市场研究分析和出版发行企业服务工作,对图书市场有深入的研究和独到见解。

113

5月29日上午

授课主题:版权案例精讲与法律实务

授课教师:任海涛现任中华书局法务与资产中心主任,北京大学法律硕士(知识产权方向),高级知识产权师,企业法律顾问。执业近三十年,代理、审理千余起案件,擅长合同及著作权、商标法律领域,特别是古籍点校观点已为北京市高级人民法院《侵害著作权案件审理指南》采纳。

12

5月29日下午

授课主题:AI技术在出版业务场景中的应用实践

授课教师:窦林卿北京常景科技有限公司总经理,AI技术与出版融合领域的实战派专家,目前担任多家出版社的AI项目技术顾问与AI技术培训讲师。长期专注人工智能技术在出版业务场景中的落地应用,对AI技术在选题策划、内容生成、审读校对、营销策划等出版核心业务场景的应用具有丰富经验。已为国内100多家出版社提供了出版技术服务和编辑培训服务,技术服务项目多次入选出版业新一代信息技术创新应用案例集、出版业科技与标准创新项目、数字出版精品遴选计划、国家出版基金音像电子项目、北京典籍与经典老唱片数字化出版项目等。

13

5月30日上午

授课主题:数字人文背景下的古籍整理与古籍数字化——新技术新工具新应用

授课教师:唐宸,清华大学人文学院副教授,教育部哲学社会科学实验室"中华传统文化智能实验室"核心成员,兼任《数字人文》编辑,主要从事中国古典文献学、数字人文研究,研发"典津-全球汉籍影像开放集成系统""奎章阁-中国古典文献资源导航系统"等多项国内古籍数字化领域基础设施平台。

14

5月30日下午

授课主题:认真学习践行习近平文化思想   

授课教师:龙倩,马克思主义学院副教授,南京大学“新时代中华传统美德”研究基地研究员,研究方向为易学、中国传统文化、文化建设,主持国家课题“《周易》德福观研究”一项、北京市课题“《周易》核心理念中的中华文明精神标识提炼展示研究”一项,发表学术论文30余篇,参编多部著作。“习近平文化思想”获评2025年北京市干部教育好课程。

附:本次培训班为本年度出版专业技术人员继续教育培训班的第一期,第二期(古籍编校能力提升与智能工具应用实战班)计划于6月底举行,3天24学时,敬请关注。

古联(北京)数字传媒科技有限公司

2026年5月11日

阅读原文

跳转微信打开

教材上新丨《数字人文引论》:全面呈现数字人文“新理念、新领域、新方法、新设施”

2026年5月14日 17:30

2026-05-14 17:30 北京

数字人文,人工智能

上架建议

《数字人文引论》

作者:李飞跃、桑海  主编

出版社:中华书局

书号:978-7-101-17674-2

出版时间:2026年4月

字数:454千字

定价:92.00

/ 内容简介 /

《数字人文引论》以“新理念、新领域、新方法、新设施”为总体框架,系统阐释数字时代人文研究的范式跃迁。全书围绕大模型与人文研究、数字史学、数字文献学等领域核心议题展开,深入探讨自然语言处理、主题模型、网络文本分析等技术方法,并对数字基础设施建设、数字媒介发展、知识范式变革及海外数字人文前沿动态进行全面论述,为理解数字时代人文研究的转型路径与未来发展提供系统而清晰的指引。

/ 作者介绍 /

主编

李飞跃,清华大学人文学院长聘教授、博士生导师,北京大学文学博士。兼任清华大学和中华书局《数字人文》、中国人民大学《数字人文研究》编委,中国索引学会数字人文专业委员会委员、中国古籍保护协会古籍整理与开发专业委员会委员等。主要从事诗歌文献、音乐文学与数字人文研究,开设“数字人文”“诗词曲经典研读”等本科课程、“诗歌文献的跨学科研究”等研究生课程。在《中国社会科学》、EMNLP等发表论文60多篇,主持国家社科基金重点项目等数项,曾获教育部高等学校科学研究优秀成果奖、清华大学教学成果奖一等奖等。

桑海,清华大学文学博士,《澳门理工学报》编辑、《数字人文》副主编。主要从事文艺理论、新媒体、数字传播研究,在《文史哲》《南京大学学报》《清华大学学报》《人民日报》等报刊发表多篇论文或评论。

作者团队

作者团队由清华大学、北京大学等十余所国内知名高校及科研机构的19位数字人文专家组成。他们在数字人文领域深耕多年,兼具理论深度与技术应用,并且长期从事一线的科研与教学工作。

(按章节先后顺序排列)

刘  石/ 清华大学人文学院

李飞跃/ 清华大学人文学院

孙茂松/ 清华大学计算机科学与技术系

孔存良/ 清华大学计算机科学与技术系

梁  晨/ 南京大学历史学院

李林芳/ 北京大学中国语言文学系

许  可/ 华东师范大学中国语言文学系

邱伟云/ 南京大学历史学院暨学衡研究院

左家莉/ 江西师范大学人工智能学院

张辰麟/ 昆明学院人文学院、教育部语言文字应用研究所

胡韧奋/ 北京师范大学国际中文教育学院数字人文系

苏  祺/ 北京大学外国语学院、北京大学人工智能研究院

赵  薇/ 中国社会科学院文学研究所

唐  宸/ 清华大学人文学院

姜文涛/浙江大学国际联合学院

饶高琦/ 北京语言大学国际中文教育研究院

李  斌/ 南京师范大学文学院语言大数据与计算人文研究中心、澳门大学人文学院

桑  海/ 澳门理工大学《澳门理工学报》编辑部

肖  爽/ 清华大学人文学院

/ 编辑推荐语 /

“清华数字人文丛书”中的第一本教材,以“四新”为框架,理论与研究成果相结合,全面阐述数字人文领域的主要研究方向。

目  录

《数字人文引论》

试  读

《数字人文引论》

立 即 购 买,继 续 阅 读 

《数字人文引论》

点击上方书封即可购买

END

阅读原文

跳转微信打开

一号通知丨第十六届汉字与汉文教育国际研讨会

2026年5月10日 18:01

2026-05-10 18:01 北京

第十六届汉字与汉文教育国际研讨会

论文摘要征稿 / 一号通知

汉字作为跨越千年的文明载体,在东亚文化圈呈现出丰富的地域形态:从中国的简体规范与繁体传承,到日本假名混用的和制汉字、韩国谚文并用的汉源汉字,再到越南喃字体系的越语汉字,多元变奏间承载着共通的文化基因与各自的历史轨迹。这种“同源分流、异流同归”的汉字生态,既形塑了各语系的书写传统,也沉淀为理解东亚文明互动的重要锁钥。本届研讨会立足这一多元格局,邀请各国学者、教师及研究者共聚一堂,就汉字本体研究、跨语系比较及教学实践展开深度对话,探寻汉字教育在数字时代的新可能。

自首届会议以来,汉字与汉文教育国际研讨会已走过十五届历程,逐步发展为汉字研究领域最具代表性的国际学术平台之一。第十六届会议由厦门大学承办,中国人民大学协办,标志着这一学术传统在更广阔语境中的延续与拓展。

厦门大学深耕国际中文教育领域已有七十年历史,积淀深厚、影响深远,培养了遍布全球五大洲的汉字与汉文教育人才。近年来更是瞄准学科交叉前沿,从人才培养到文科实验室建设多方位不断推出新举措、新尝试。中国人民大学作为中国人文社会科学研究的重镇,在语言文字学、国学研究与跨文化比较领域享有盛誉。两校强强联合,将充分发挥学科互补优势与全球学术网络,联动日本、韩国、越南、东南亚及欧美汉字研究资源,为全球学者打造高水平的学术交流平台,共同推动汉字文明在数字时代的传承与创新。

会议日期

2027年1月7日(星期四)至9日(星期六)

会议地点

厦门大学(翔安校区)

国际中文教育学院/海外教育学院

会议主题

汉字与汉文教育的

跨时代传承与跨地域发展

 会议讨论议题

会议包含但不限于以下子题:

(1) 汉字教育/汉文教育:包括教育理念、教学材料、教学方法、评估、教授汉字/汉文作为母语或外语等。

(2) 汉字研究:包括汉字史、汉字学史、汉字基础理论、汉字考释与整理等。

(3) 汉字与语言学研究:包括汉字与汉语独特性、汉字与思维、字本位语言理论研究、字本位与国际汉语教学等。

(4) 文言文(包括韩国汉文)教育:包括教育理念、教学材料、教学方法、评估等。

(5) 其他相关主题。

会议日程

重要日期及与会手续

2026年4月25日

论文摘要开始日期(网上提交)

2026年5月31日

论文摘要截止日期

摘要(含题目及关键字)须以中文或英文撰写, 若以其他语文撰写,请同时提供中文或英文版, 论文题目和作者姓名与所属单位需同时提供中英文。字数限600字以内。

摘要须概述研究目的、方法、结果,并辅以证据、示例。请于截止日期前提交至投稿系统

2026年7月1日

摘要审查结果公布日期

以报名时所输入的邮箱地址向个人发送通知并于官网公布

2026年7月15日

开放注册报名

2026年7月25日

截止注册报名

2026年8月1日

正式邀请函

2026年10月31日

论文全文缴交截止日期(参加“研究生论文奖”及“青年学者论文奖”的参与者,必须提交全文)

学生同时提交学生证扫描电子版

发表形式

通过大会的学术筹备委员会审议,将提交的摘要分配到口头发表或研究生论坛。

01

口头发表

每次发表20—25分钟

02

研究生论坛

每次发表20—25分钟

·发表论文时,建议采用汉语或英语。

·大会不提供翻译,如有需要请自行安排。发表含翻译时间请控制在规定时间内。

· 以英语、韩语、日语、越语发表论文者, PowerPoint (PPT)展示应有中文对照;以汉语发表者,PPT展示应有英文对照。

会议注册费

(详情稍后公布)

联系方式

厦门大学 国际中文教育学院/海外教育学院许老师 (xujiaojiao@xmu.edu.cn)

香港大学 中文教育研究中心 

周老师  (cacler@hku.hk)

东亚知识文化教育研究所

许喆博士  (heochul@gmail.com)

北京师范大学 

刘丽群博士  (liulq1101@163.com)

高雄师范大学 

郑琇仁博士 (hsiujen@gmail.com)

研讨会官网

(稍后发布)

主办单位

厦门大学

国际中文教育学院/海外教育学院

协办单位

中国人民大学

合办机构

(按照笔画顺序)

文藻外语大学 应用华语文系暨华语文教学研究所

北京师范大学 民俗典籍文字研究中心

青海师范大学 文学院

东亚知识文化教育研究所

河南师范大学

波兹南亚当密兹凯维奇大学

胡志明市师范大学

香港大学 中文教育研究中心

陕西师范大学 人文科学高等研究院

夏威夷大学  中文教育研究中心

釜山大学 韩国汉文学系BK教育研究团

高雄师范大学 华语文教学研究所

高雄师范大学 国文学系

高丽大学 汉字汉文研究所

鲁东大学区域国别学院

台湾师范大学 华语文教学系

台湾师范大学 华语文与科技研究中心

澳门科技大学 国际学院

檀国大学 汉文教育研究所

END

阅读原文

跳转微信打开

报名开启 | 第四届语料库与数字人文暑期学院(2号通知)

2026年5月7日 12:00

戴俊阳 徐惠 2026-05-07 12:00 北京

暑校报名5月5日开始,5月15日截止,线上线下免费学习!

第四届语料库与

数字人文暑期学院

— 2号通知 —

CDHSUMMER2026

随着大数据与人工智能技术的发展,语言、文学、历史等人文研究都越来越多地引入了计算技术。人文学科与计算技术的交叉研究,关键在于基于语料库的人文大数据构建、计量和大语言模型的应用。

为推动计算语言学与数字人文的学科建设与人才培养,南京师范大学联合北师港浸大、澳门大学、香港科技大学、南京农业大学五校,于2026年7月25日-8月4日(共11天),通过线上线下结合的形式举办语料库与数字人文暑期学院,包括讲习班实训和讲座论坛两大部分。

01

报名链接

扫描上方二维码即可进行报名

02

各班概况

01

A班:数据库编程讲习班

  • 以《全唐诗》为例,教习人文语料库构建技术与交互式检索网站开发方法,实现文史数据的结构化存储与动态展示。

  • 主讲:李斌(南京师范大学)

  • 设备要求:需准备16G内存以上的Windows 10/11笔记本电脑

  • 详细课程大纲:

第一讲:课程简介与软件安装

第二讲:数据表的构建

第三讲:数据库的查询

第四讲:PHP程序设计

第五讲:字符编码

第六讲:字符串处理

第七讲:交互式网站搭建

第八讲:本地小模型优化

02

B班:语言统计方法讲习班

  • 聚焦语料库计量分析,系统讲授基于SPSS的统计基础、参数检验、非参数检验、聚类分析、相关分析、卡方检验、多元线性回归及逻辑回归等核心方法,帮助学员掌握语言研究中的定量分析技能与统计报告生成能力。

  • 主讲:沈威(华中师范大学)

  • 设备要求:需准备安装有SPSS 27.0及以上版本的Windows/Mac笔记本电脑

  • 详细课程大纲:

第一讲:统计基础与SPSS安装实操

第二讲:常见的参数检验

第三讲:常见的非参数检验

第四讲:聚类分析

第五讲:相关分析

第六讲:卡方检验

第七讲:多元线性回归

第八讲:逻辑回归

03

C班:大模型编程讲习班

  • 掌握大语言模型基础原理与人文场景落地技术,能够独立开发面向文史研究的大模型应用。

  • 主讲:王东波、刘浏(南京农业大学)

  • 设备要求:需准备性能较好的Windows/Mac笔记本电脑(推荐16G以上内存)

  • 详细课程大纲:

第一讲 大语言模型基础

第二讲 基础模型和推理模型

第三讲 提示工程

第四讲 继续预训练和监督微调

第五讲 强化学习

第六讲 大模型的部署

第七讲 检索增强生成

第八讲 AI Agents

  • 招生要求:具备基础Python编程能力,对大语言模型有基础认知。

03

专家讲座与配套活动

01

系列讲座

邀请20位领域顶尖学者,开设20场讲座,覆盖理论前沿、技术方法与应用实践,每日上午线上线下同步直播。

 特邀讲座和论坛嘉宾 

新疆大学 冯志伟教授

澳门大学 袁毓林教授

香港理工大学 黄居仁教授

中国社科院民族所 龙从军研究员

中国社科院语言所 张永伟研究员

北京大学 苏祺研究员

北京大学 朱本军研究员

华中科技大学 唐旭日教授

同济大学 王昊奋教授

南京大学 黄书剑教授

南京农业大学 王东波教授

南京师范大学 李斌教授

北京师范大学 胡韧奋副教授

中国人民大学 卢达威副教授

北京语言大学 饶高琦副研究员

华中师范大学 沈威副教授

中国传媒大学 王璐璐副教授

江南大学 王萌副教授

(持续邀约中)

02

主题圆桌论坛

设置2场专题Panel,围绕「LLM时代人文学科的理论重构」「语言学与数字人文的未来」展开深度对话,开放学员提问与交流环节。

03

文化考察与学术研讨

每日下午安排南京及周边特色人文考察与分组学术研讨,线下学员可全程参与。

04

成果展示与颁奖

闭幕式设置优秀成果汇报环节,邀请专家现场点评,为优秀学员颁发证书。

04

招生与报名规则

01

招生规模 

本次暑期学院计划录取线下学员120人,线上学员80-100人,总计不超过240人。其中主办五校(南师大、北师港浸大、澳大、香港科技大学、南农大)学员录取不超过 60 人,其他单位学员录取不超过 180 人。

02

面向对象

全国高校及科研院所数字人文、计算语言学、语料库语言学、中国语言文学、历史学、文献学、考古学、新闻传播学等相关学科的本科生、研究生,以及青年教师、科研人员。

03

分班报名要求

学员仅可选择1个平行讲习班进行报名,不可兼报,各班报名要求如下:

  • 数据库编程讲习班:面向零基础或编程初学者,具备大学英语四级及以上水平即可报名,已具备计算机相关专业背景者请勿申请。

  • 语言统计方法讲习班:具备基础的文本分析认知,对语料库计量分析有学习需求,已具备统计学/计算机专业背景者请勿申请。

  • Python大模型编程讲习班:具备基础的Python编程能力,对大语言模型有基础认知,尚未掌握人文场景大模型开发与应用技术,已具备计算机相关专业背景者请勿申请。

04

报名方式

  • 报名时间:官方报名通道将于2026年5月5日正式开启,2026年5月15日截止报名,报名二维码及链接将在官方公众号同步发布。

  • 报名材料:申请人需填写报名表单,并上传个人简历、研究基础与学习目标说明,主办方将根据报名材料进行择优录取。

  • 录取通知:最终录取结果将于2026年6月1日前通过邮件及官方公众号推送,录取学员需签署上课承诺书,承诺全程参与课程学习、按时提交作业,报名成功后无特殊原因不得中途退课、不得更换报名班级。

05

结课与考核方式

本次暑期学院以独立完成的人文研究成果为核心考核目标,具体要求如下:

  • 数据库编程讲习班:独立构建专属人文数据库与交互式检索网站。

  • 语言统计方法讲习班:完成基于语料库的人文研究计量分析报告。

  • Python大模型编程讲习班:完成面向人文研究场景的大模型应用开发。

学员成果将在闭幕式进行集中汇报,邀请领域专家进行现场点评与指导;完成全部课程学习、通过成果考核的学员,将颁发暑期学院结业证书,优秀成果将授予优秀学员证书。

05

组织架构

(以下各项排名不分先后)

 主办单位 

南京师范大学文学院

 联合主办单位 

澳门大学人文学院

香港科技大学人文学部

北师香港浸会大学人文社科学院

南京农业大学信息管理学院

特约支持单位

中国社科院民族所民族语言文化行为实验室

 协办组织/单位 

中国民族语言学会语言资源与计算人文专委会

中国古籍保护协会古籍智能开发与利用专委会

中国人工智能学会语言智能专委会

江苏省人工智能学会自然语言处理专委会

江苏省修辞学会

数字人文专业发展联盟

浙江大学文学院

 出版与媒体支持 

科学出版社

高等教育出版社

中华书局古联公司

外语教学与研究出版社

南京大学出版社

南京师范大学出版社

汉语堂公众号

DH数字人文公众号

语言服务公众号

比特人文公众号

相关链接:

第四届语料库与数字人文暑期学院(1号通知)

阅读原文

跳转微信打开

数字人文时代的“新文献观”及其对文献学专业教育变革的启示 ——以中华书局“苏东坡数字人”为案例

2026年4月22日 18:00

郭琳 王建 2026-04-22 18:00 北京

以下文章来源于:DH数字人文

DH数字人文

清华大学、中华书局联合主办《数字人文》(Journal of Digital Humanities)季刊,旨在为方兴未艾的数字人文研究提供理论探讨和专题研究的平台。

在中国传统文化中“文献”既有典章资料的含义(“文”),又指掌握典章之人(“献”),但后世的文献学在某种程度上缺失了“人”的维度。

教育与教学

郭  / 北京大学社会科学部

王 建 / 中华书局

要:在中国传统文化中“文献”既有典章资料的含义(“文”),又指掌握典章之人(“献”),但后世的文献学在某种程度上缺失了“人”的维度。为了提供一个更贴合“文献”概念原初含义,同时也更适合当下数字人文时代的理解框架,本文尝试引入文化哲学、技术哲学的新视角,来提供一种新的“文献观”,试图将“文”与“献”纳入一个整体框架来进行理解。从文化哲学的视角,人是符号的动物;从技术哲学的视角,符号是人的外化与延伸。人可以创造符号并以此创造文化,而文献也正是一个符号系统,它依赖于对应时代的符号书写与媒介技术。在全新的数字人文时代,数字文献的应用越来越广泛,数字文献技术使得历史文化名人数字人成为可能与必然。与此同时,符号技术的变迁必会引起文化形态与学术范式的升级转型,当下大学的文献学专业研究与教学模式变革需要试图做好专业与通识的结合、基础与应用的融合、传承与创新的综合,才能塑造未来大学教育的新形态,创造出越来越多像“苏东坡数字人”这样的优秀案例并切实推进落实中华优秀传统文化的创造性转化和创新性发展。

关键词:文化哲学 技术哲学 文献观 数字人 文献学 数字人文

一、文化哲学、技术哲学视角下的“文献观”

(一)“文献”概念溯源与新视角的引入

我国是一个史籍浩瀚、史学发达的国家,文献的产生、流传和研究已有悠久的历史。随着时代的发展,“文献”一词的含义在不断变化。《辞海》将“文献”释义为“专指具有价值或与某学科相关的图书文物资料”,《现代汉语词典》将“文献”解释为“有历史价值或参考价值的图书资料”。所以,现在人们通常所理解的“文献”是指图书、期刊、典章等所记录知识的总和。

而如果我们将考察的视线拉得更长可以发现,最早将“文献”一词用作书名的著作是元代马端临的《文献通考》,而“文献”一词的最早出处则可以追溯到《论语》。在《论语·八佾》中,孔子曾说:“夏礼吾能言之,杞不足征也;殷礼吾能言之,宋不足征也。文献不足故也,足则吾能征之矣。”何晏《论语集解》中引东汉经学大师郑玄的注云:“献,犹贤也。我不以礼成之者,以此二国之君,文章贤才不足故也。”这里用“文章”解释“文”,用“贤才”解释“献”。宋代朱熹在《四书章句集注》中解释道:“文,典籍也。献,贤也。”[1]“文”是指历史典籍、档案等文字资料,“献”是指博学多才、熟悉掌故的贤才。清代刘宝楠在《论语正义》中也沿用了这一说法:“‘文’谓典策,‘献’谓秉礼之贤士大夫。”[2]后来杨伯峻在《论语译注》中的注释为:“《论语》的‘文献’包括历代的历史文件和当时的贤者两项。今日‘文献’一词只指历史文件而言。”[3]

鉴于上述梳理可以看出,今天我们常用的“文献观”对于“文献”概念的理解,如果较之“文献”一词的原初含义而言,其实是只得其半,而缺失了对于“人”本身的理解。因此,为了提供一个更加贴合“文献”概念原初含义的新的“文献观”解释框架,本文尝试引入文化哲学、技术哲学的新视角,来探索一种新的“文献观”表达,试图将“文”与“献”纳入一个整体框架来进行理解,并从中发现人类“文献”发展史的规律与趋势。

(二)文化哲学的新视角——人是符号的动物

恩斯特·卡西尔(Ernst Cassirer,1874—1945)是德国著名的文化哲学家,被誉为“当代哲学中最德高望重的人物之一”。卡西尔在其代表作《人论》中概括表达了他的符号论文化哲学体系,他认为人类文化形式都是符号形式。因此,我们应当把人定义为符号的动物(animal symbolicum)来取代把人定义为理性的动物。[4]也就是说,人是能用符号去创造文化的动物。从而可以理解,人是创造符号并以此创造文化的动物,符号是人区别于动物的一个显著特点。人类拥有其他一切动物不具有的符号系统,人可以在创造符号的过程中获得自由与解放,成为真正意义上的人。

“符号”是卡西尔文化哲学思想体系中的核心观念。在卡西尔这里,“符号”不是具体的单个符号,而是一个整体的概念,具有极其丰富的内容和意义,他将人类文化的各种形式包括语言、神话、寓言、宗教、艺术、科学、历史等都看作符号形式。人与符号紧密相连,符号是人类创造文化的媒介。人具有符号化的思维模式,并通过符号创造文化,即创造一个符号世界,进而认识自我、发展自我。符号化的思维和符号化的行为是人类生活中最富于代表性的特征,并且人类文化的全部发展都依赖于这些条件,这一点是无可争辩的。[5]可见,符号是人和文化的共同本质,人—符号—文化构成了三位一体的存在。首先,符号可以理解为作为文化现象的符号形式;其次,符号体现了主体(人)本质的符号活动;另外,符号展现了被赋予的符号意义。

在卡西尔看来,“符号”(symbol)是与“信号”(sign)相对的,“信号是物理的存在世界之一部分,符号则是人类的意义世界之一部分。信号是操作者(operator),而符号是指称者(designator)”。[6]文化符号和自然界的信号有严格区别,这二者体现了“人禽之别”的关键,即动物只能对信号做出条件反射,只有人才能掌握和运用信号,并将信号改造成有意义的符号,所以“信号”与“符号”的核心差别在于“意义”。如图1所示,人和动物与客观世界的互动方式是不同的,动物与世界直接互动,往返的是信号,信号不具有意义,它是物理性的、实体性的存在;人与世界则通过符号进行互动,符号是意义的表达。符号是人类的创造物,人具有符号构形能力,不存在无意义的符号,也不存在无符号的意义。

图1 人和动物与客观世界的互动方式差异

由此可以看出,基于“符号”这一视角,可以认为,主流“文献观”定义里的“价值”与“知识”等跟卡西尔最为强调的“意义”是内在相通的,因此,可以用“符号系统”这一概念来提炼与概括“文献”中“文”的内涵。符号系统成为连接人与文化的通道,构成整个人类文化世界。

从根本上说,人是符号的动物,符号揭示着人的本质,延伸着人的能力,人所创造的符号成为人与世界的中介,人所面对的世界也是符号世界。与此同时,卡西尔认为,符号具有二重性,即符号具有可感载体与普遍意义两个方面。人类可以像其他动物一样以各种感官与世界进行交往,依据物理信息与外界进行沟通,此时世界是可感知的。另一方面,人具有符号能力并进行符号活动,正是这种符号能力将自己与动物区别开来,当人类作为“符号”动物与世界交往时,人类是有意识的、有思想的、有理智的,此时“符号”成了载体与意义的统一。

需要指出的是,就历时性的角度而言,作为人与世界之中介的符号系统是具有历史性的,也就是说,一个个体所面对的符号世界从根本上说正是该个体之前全部的人类历史中所能留存下来的符号的整体。

(三)技术哲学的新视角——符号是人体感官的外化与延伸

从卡西尔把人定义为“符号的动物”来看,一方面,人是创造和发明符号的动物;另一方面,人是使用符号的动物。正是由于人的能动性与创造性,人能够制造和使用符号,人的意识、愿望、思维等精神能在具体实践活动中对象化到客观世界,实现客观世界的符号化,比如艺术是人类直觉或观照的客观化,语言和科学是人类概念的客观化,而这些符号可以将人体感官不断地外化和延伸。

其实在更早的德国技术哲学家恩斯特·卡普(Ernst Kapp,1808—1896)那里,曾更加明确地提出了工具和器物是人体“器官投影”(Organ Projection)的核心观点,在其被认为是技术哲学奠基性著作的《技术哲学纲要——从新观点看文化发生史》(1877)一书中,卡普试图用器官投影论的新观点,通过作为技术文化的工具发生历程来解释人类文化的演进历史,他认为,人体的外形和功能总是作为人类最理解的客观存在,当成创造技术的外形和功能的尺度,投影到外部环境;所有工具的源泉和本原的技术,都是建立在人的器官特别是手的基础之上的。因此,人是制造器物的尺度。[7]卡普的“器官投影”理论开创了一种分析技术的独特视角,某种程度上,我们可以说是他提出了技术生成文化理论,并从技术哲学范式内部对技术的本质进行思考。

作为卡普“器官投影”论在媒介时代延续的加拿大媒介理论家马歇尔·麦克卢汉(Marshall McLuhan,1911—1980)在他的名著《理解媒介:论人的延伸》一书中提出:媒介,即技术,可以是人的任何延伸。媒介带来一种新的技术尺度,人的延伸及其感知比率随之改变,就形成一定的后果。这就是“媒介即讯息”。[8]媒介是那些延伸人类器官的所有工具、技术和活动,一切技术都可以被看作是不同人体器官的延伸,比如,车轮是人类脚步的延伸,衣服是人类肌肤的延伸,报纸是人的言语和视觉的延伸,广播是听觉的延伸,等等。万物皆媒介,凡是能使人与人、人与事物或事物与事物之间产生关系的物质都是广义的媒介。半个世纪之后,美国学者凯文·凯利在《科技想要什么》一书中进一步认为“技术是思维的延伸”,将技术称为“第七王国”,并提出了“技术元素”(technium)的概念,这里的“技术元素”包括硬件、文化、艺术、社会制度以及各类思想。他认为科技是我们躯体的延伸,技术元素是生命的延伸,技术应该被理解为一种正在进化的生命。[9]

综上所述可以看出,就技术哲学的视角而言,作为人与世界的中介的符号及其能力也可以被视为“符号技术”,其本身就是人类感官与思维的外化与延伸。进一步的,再就符号的历史性而言,一个个体所面对的符号世界从根本上说正是该个体之前全部的人类历史中所能留存下来的前人们感官与思维外化与延伸的整体。因此,就其符号整体的所指而言,它指向的是前人们于四维时空、眼耳鼻舌身意全感官的所有真实而鲜活的生命经验,而就该符号整体的能指而言,它则是特定历史时代与对应的特定符号技术下对上述多维度、全感官生命经验的部分维度、部分感官的“投影”。

(四)双重视角下的新文献观

总体而论,从文化哲学的视角来看,人是创造符号并以此创造文化和进行文化实践的动物;从技术哲学的视角来看,符号是人体感官的外化与延伸,也可以理解为,人类的一切活动是借助于符号技术不断外化自身的过程。基于此,在文化和技术哲学的双重视角下,可以构建一种新的“文献观”表达,即“文献”是一个符号系统,是人类进行一切生命活动的符号化记录,其映射的对象其实是真实而鲜活的历史人物的生命体验所外化于四维时空形成的高维度、全感官的历史文化世界。

因此,作为总结,就作为人与世界的历史性的中介而言的符号世界对应着本文新文献观中“文”的内涵,而在客观世界的角度来看,人与历史性的符号世界构成的具有意义、价值、历史性的整体,则对应着本文新文献观中“献”的内涵,如图2所示。

2双重视角下的新文献观

可见,文献这一符号系统依赖于对应时代的符号书写与媒介技术,特定时代的符号书写与媒介技术的维度决定了文献的维度,它蕴含着人类活动、媒介技术(符号书写)、知识生成(符号世界)相互依存的关系。事实上,“文”与“献”本身就是一个整体的结构体系,遵循着人类历史文化发展的规律与趋势。

(五)人类符号技术发展趋势与数字人文的必然

如前所述,人类符号技术的发展史其实就是人类文化的发生史,是人类不断追求更有效、更丰富地去外化与延伸自身感官与思维的历史,因此,人类符号技术也在多维度与多感官两个角度呈现出了历史性的发展趋势。

在原始社会,人们通过结绳、绘画、雕刻等方式记载和传递信息,这些图形和符号逐步演变并形成最初的符号系统。当文字及印刷技术出现后,人类的视觉得到了延伸。其中,“文字”的产生打破了“口耳相传”的局限,成为人类用符号记录和表达信息的突破性进步,从最早的抽象图画,再到象形文字、指事文字、会意文字等。广播、电视等媒介技术的诞生,改变了人们的生活方式和文化体验。广播延伸了人的听觉,而电视结合着语言符号与非语言符号,更是综合了文字、声音、图像等多重符号,具有“声画合一”的特点,更全方位延伸了人们的视觉和听觉。21世纪以来,随着信息科技的迅猛发展,增强现实(AR)、虚拟现实(VR)以及混合现实(MR)等技术突飞猛进,让人类视觉的延伸逐渐从平面化的二维向立体化的三维拓展,如图3所示。与此同时,通过不断创新的数字技术的加持,人类的嗅觉、味觉、触觉等也得以被前所未有的数字化模拟,更进一步的,人工智能、脑机接口等颠覆性技术也逐渐显露了越来越多的曙光。

图3 符号技术发展简史与趋势

由此可见,作为与人类文化发生史相伴生的符号技术呈现出追求更高时空维度、更多感官意识维度的必然趋势,因此,数字文献技术这一作为人类思维与智能的外化与延伸的符号技术必然成为当今人类符号技术发展的大势所趋与时代主题。方兴未艾的数字化改变了传统文献的生产、存储、研究和使用方式,以印刷媒介为基础的传统文献生产体系正向以智能媒介为前提的数字文献生产体系转变。[10]数字化促进了知识形态的变革与演进。随着大数据技术的应用以及人工智能等数字技术的发展,古籍数字化、文献数字化已成为共同趋势,数字文献大量出现。数字人文数据以文本形式为主,兼有图片、音频、视频、3D等多元数据形式。文本资料有地方古典文本资料、图书、笔记、家谱资料等。图片有地图、画作、壁画等。3D数据有器皿、雕塑等。音频与视频数据包括访谈、纪录片等多媒体数据。[11]

与此同时,由于人类符号技术始终不断追求更高时空维度、更多感官意识维度的表达,因此,每当有一种新的、具有更高时空维度与更多感官意识维度的人类符号技术出现后,此前所记录下来的人类文化历史都将被这种新的符号技术“重新书写”,并被依托其更加丰富的维度与感官进行持续不断地“扩写”与“创写”。并且,这样的“重新书写”呈现出越来越多的高时空、跨学科、多模态、全场景等特点,为人类、文化、历史的全面延伸尤其是具有悠久历史文献传统的中华优秀传统文化的全面延伸提供了无限丰富的可能。

二、文献学的数字化应用——以中华书局“苏东坡数字人”为案例

习近平总书记曾强调,“要系统梳理传统文化资源,让收藏在禁宫里的文物、陈列在广阔大地上的遗产、书写在古籍里的文字都活起来”。让文物和文化遗产“活起来”……最终实现“让文物说话,让历史说话,让文化说话”。[12]为此,中华书局立足自身深厚的文化积淀与数字文献技术优势,首创研发了全国首位3D超写实历史文化名人——“苏东坡数字人”。

(一)从数字文献视角看古代历史文化名人数字人的研发特征

“数字人”是指通过计算机图形渲染、动画驱动、动作捕捉、语音合成、人工智能等技术打造的虚拟仿真人物,其产生本身就是文化与科技深度融合的产物。清华大学《2020—2021元宇宙发展研究报告》指出,2021年被产业界称为“元宇宙元年”。因此,作为未来元宇宙数字世界主体性存在的“数字人”,自2021年迎来了爆发式的发展。与此同时,随着我国经济社会的全面发展和国际地位的不断加强,中华优秀传统文化在作为互联网原住民的年轻人群中的认同度与影响力在不断提升。在这样的时代背景下,从2021年至今,各类国风数字人陆续发布,俨然已经成为中华优秀传统文化活化利用的标配。如2021年10月28日,中央戏剧学院与北京理工大学共同发布“梅兰芳”,2022年5月18日,中国文物交流中心发布“文夭夭”,2022年6月3日,新华网发布“筱竹”,同一天浙江卫视发布“谷小雨”,2022年6月15日,敦煌研究院发布“伽瑶”,2022年7月22日,国家博物馆发布“艾雯雯”,等等。

但纵观以上多位国风数字人,除了“梅兰芳”外,均属于“纯虚构型”数字人,即历史上并没有真实存在过这个人物,而对于古代的真实历史文化名人进行“复活”的超写实数字人,则一直是一个空白。究其原因,需要先从数字人的分类入手进行分析。

在中华书局“苏东坡数字人”之前,数字人行业内对于数字人的分类通常是采用两类方法。其一,是根据数字人的角色形象与建模技术进行分类,分为二次元数字人、2.5次元数字人、3D卡通数字人、3D写实数字人等。其二,是根据数字人的功能与应用场景进行分类,分为服务型数字人、身份型数字人等。其中,服务型数字人可用于替代真人服务,并作为多模态AI助手提供服务,如虚拟主播、虚拟教师、虚拟客服等;身份型数字人则可以实现虚拟IP、虚拟分身等功能。然而,这两种分类方法均无法解释和分析历史文化名人数字人的独有特征。为此,中华书局立足数字文献的全新视角,对数字人进行了全新的分类,并从文献不同特征的角度进行象限化分析,逐步探索出历史文化名人数字人研发的理论基础与方法论思路。

首先采用“有无文献依据”和“文献是否齐清定”两个指标来进行分析,可以得出如下的三个象限,如表1所示。第一类虚拟数字人对象是“在历史文化符号世界中曾经真实存在过的人”,这类数字人的研发是基于真实有效的文献资料,且文献具有“齐”(齐全)、“清”(清晰)、“定”(确定)等特点。第二类虚拟数字人对象是“正在活着的人”,他们虽然有文献资料记载,但其文献资料还处于不断创作和变化之中,所以具有不稳定性,还未成“定论”。第三类是纯虚拟数字人,这类数字人并无文献典籍的基础,在历史上未曾真实生活过。

1基于文献维度的全新数字人分类(一)

然后,可以采用“文献的维度”和“文献的感官”两个指标来对第一类数字人进行进一步分析,如表2所示,古代历史文化名人只有关于身体记录的抽象的文字文献(可视为一维文献),但现代历史文化名人具有三维立体身体数据(三维文献)和动态影像文献(四维文献)。另外,古代历史文化名人只有画像等“非完全真实”的视觉文献,无真实的听觉、嗅觉等文献,但现代历史文化名人具有真实的视觉、听觉文献,甚至可能留存有部分程度的嗅觉文献。他们留存有照片、音视频、使用过的器物等资料。

表2 基于文献维度的全新数字人分类(二)

最后,再通过“有无真实地理文献”这一指标,还可以将古代历史文化名人176分为两类,如表3所示。一类是以苏东坡、李白、李清照等中华先贤人物为代表的曾在历史上真实活过的人物,另一类是以苏小妹、林黛玉、孙悟空等为代表的在文学符号世界中存在的人物。

表3 基于文献维度的全新数字人分类(三)

(二)中华书局古代历史文化名人数字人研发的方法论心得

综上所述可以看出,对于超写实的古代历史文化名人数字人的研发而言,可谓是一项几乎前无古人的工作,一方面要求数字人的开发技术本身必须达到与超写实纯虚拟数字人同样的行业前沿水准,另一方面又不允许像纯虚拟数字人那样天马行空地随意发挥,但与此同时,又缺乏像邓丽君、梅兰芳数字人那样的真实照片与动态视听影像的文献支撑,因此需要独辟蹊径、守正创新。为此,中华书局始终牢牢扎根“文献”这一关键基础,逐步摸索出了一些古籍文献数字化应用的全新方法论。

其一,要将重写与创写有机结合。

如前所述,每当有一种新的、具有更高时空维度与更多感官意识维度的人类符号技术出现后,此前所记录下来的人类文化历史都将被这种新的符号技术“重新书写”,并被依托其更加丰富的维度与感官进行持续不断的“扩写”与“创写”。就超写实古代历史文化名人数字人的研发而言,首先,必须要求是“重写”,而且是严格遵从古籍文献学术共识的“重写”,这是与纯虚拟数字人研发方法的根本区别——也因此,古籍文献数据的学术共识对于超写实古代历史文化名人数字人的研发来说是应该具有“一票否决权”的,即明显不符合古籍文献记载的古代历史文化名人数字人是应该被限制准入的。

以苏东坡数字人的“塑形”为例,中华书局在总字数超70亿字的古籍大数据中心中进行了海量搜索,通过一系列精心设计的关键词精准抓取到了一批涉及苏东坡容貌形象的古籍文本数据,与此同时,又通过图像搜索技术,抓取了由宋至清各个不同时期所作的涉及苏东坡的画作100余幅,既包括苏东坡单人画像,也包括如《西园雅集》《赤壁》等主题群像以及若干石刻画像拓片等,从而初步形成了对于苏东坡容貌形象之“古籍真实”的把握,然后再结合权威专业的专家系统进行校验,最终确定下来超写实苏东坡数字人的每一个细节并确保与历史文献资料不相违背,实现严格科学的“重写”。

然而,由于古代历史文化名人只有来自古籍文字记载的一维文献和非完全真实的画像类二维文献,缺乏像邓丽君、梅兰芳等人的真实三维立体身体数据和动态影像数据这样的四维文献,所以对于古代历史文化名人数字人的“塑形”而言,科学规范的“重写”只能做到“不错”(即没有古籍文献的反例),但无法证明“全对”(即只有如此才是唯一正确的),因此,在“不错”与“全对”之间的部分,需要进行一定程度的“创写”——这也正是古代历史文化名人数字人与邓丽君、梅兰芳等数字人研发方法的根本区别。

以苏东坡数字人为例,中华书局在深入挖掘古籍文献中对于苏东坡容貌形象的记载数据的同时,还致力于深度提炼苏东坡的精神气质。为此,中华书局通过“苏东坡专题数据库”与“苏东坡主题知识图谱”的深度挖掘,侧重提取苏东坡本人、同时代人、后代历史人物以及现当代专家学者对于苏东坡精神气质的凝练与概括,并且还对当前各大主要社交媒体上有关苏东坡的内容中反映的东坡气质进行了搜集与提炼,最终实现在“塑形”基础上进一步的“凝神”,让苏东坡数字人不仅形似,更加神似。

图4 全国首位3D超写实数字人苏东坡

其二,重写与创写都具有当代性。

正如前文所言,任何一个符号,就其能指而言,都是特定历史时代与对应的特定符号技术下对多维度、全感官生命经验的部分维度、部分感官的“投影”,“苏东坡数字人”作为当下时代产生的一个数字文献符号作品,它的“重写”与“创写”也都具有典型的“当代史”特征,即它在将古籍文字一维文献、画像类二维文献以及精神气质等的文字表达综合起来最终予以3D超写实、可动态交互的数字人表达时,其实已经不可避免地带进了“当代人们的精神”,一如意大利历史哲学家贝奈戴托·克罗齐(Benedetto Croce,1866—1952)在其《历史学的理论和实际》一书中指出的:“一切历史都是当代史。”在克罗齐看来,当代性不是某一类历史的特征,而是一切历史的内在特征。[13]真正的历史属于当代生活,当我们在思考过去的历史时,会把过去纳入我们当前的思想和精神之中,体现我们当前的思想活动和精神生活,历史时刻此时便与人们的思想或精神紧密相连,成了“活生生的历史”,也反映了当下人们的思考,因而从这一意义上来说一切历史都是当代的。由于实践的需要以及人们对历史事件的认识不断深化,历史上发生的事件会以新的形式再次“复现”。

其三,既要塑形、凝神,更要赋魂。

为了让古籍里的历史文化名人真正地“活起来”,让他们以数字人的身份真正走出古籍书本、走进当今时代、当下生活,我们需要将平面化的文学文本转变为立体化的虚拟场景。这不仅能带来视觉上的直观冲击,同时还能提供互动式体验和全新理解。[14]因此,在数字人“塑形”“凝神”的基础上,我们需要进一步为其进行“赋魂”。

以苏东坡数字人为例,“赋魂”主要体现为古籍大数据与人工智能技术的深度融合。在这一方面,中华书局一直在持续进行古籍人工智能技术的自主研发,通过对70亿字古籍大数据的深度机器学习与人工智能训练,目前中华书局开发的古籍智能处理系统已经可以自动给古籍断句标点、自动标记人名地名、自动核对引文、自动识别古籍文字等。[15]下一步,中华书局将在上述工作的基础上,基于与主流大模型的深度合作,使用苏东坡专题数据库对大模型进行专项人工智能训练,从而让苏东坡数字人越来越像真正的苏东坡一样去认知、去思考、去表达、去行动,最终实现苏东坡在元宇宙数字世界真正的“复活”,让苏东坡成为“中国式美好生活的代言人”,让他“活”在我们这个时代。

以人工智能版苏东坡数字人的现场实时自然语言交流为例,至少涉及如下的技术环节:(1)提问者自然语言自动转换成文字;(2)文字自动输入大模型(外挂专题数据库)并自动生成回答文字(该回答至少符合3个维度的要求:自然语言之通畅,史实学术之正确,符合苏东坡的身份与气质);(3)回答文字自动生成数字人的语音;(4)根据语音自动驱动唇形;(5)根据语义自动匹配表情;(6)根据语言和表情自动匹配肢体动作;(7)服饰等跟随肢体动作实时自动解算。

可见,要想真正给数字人“赋魂”,不仅涉及人工智能、边缘计算、虚拟现实、实时动捕等技术,还需要专业的专题数据库、匹配应用场景的深度知识图谱等大量数据挖掘与知识服务能力的支持——例如对于历史文化名人的古籍数据进行挖掘、梳理、加工并实现数据可视化,实现文化资源数据与文化数字内容的标识解析、提炼转化、搜索查询、匹配链接、传播利用等。

(三)中华历史文化名人数字人与中华文化元宇宙展望

元宇宙是数字技术与文化内容的双向融合、联动共生。元宇宙将会给内容产业带来新的进化,在内容生产、内容形态、内容衍生、内容体验等层面赋予新的定义。[16]“数字人”被视为未来人们进入“元宇宙”的入口,将广泛应用在元宇宙新生态中,作为元宇宙中“人”与“人”、“人”与事物、事物与事物之间产生联系或发生孪生关系的新介质,起着举足轻重的作用。可见,传统的中华文化内容产业将会被持续赋能、创新发展。人类经验对象有可能实现全面数字孪生化,线下物理空间将可能全面混合现实化,线上线下场景将全面人工智能化。

在这样的背景下,中华书局将继续发挥古籍数字化专业优势,以主题出版工程“中华先贤人物故事汇”为底本,持续研发系列化的“中华历史文化名人数字人”,如李白、李清照、陶渊明、戚继光等,逐步形成数字人矩阵,深入挖掘历史文化名人的古籍数据,在数字科技加持下进行现代化表达,形成“中华先贤数字人”IP矩阵,真正让“书写在古籍里的文字活起来”“把优秀传统文化中具有当代价值、世界意义的文化精髓提炼出来、展示出来”,让中华优秀传统文化融入时代、融入生活,更好地满足数字时代人们对于中华传统文化持续高涨的热情和需求。

进而,在全新的数字经济时代,中华文化内容产业基于古籍大数据,借助元宇宙数字科技,将有可能彻底突破传统媒介格局,构建全新数字内容生态,“创造性复原”书写在古籍里的“人、货、场”,实现中华文化的人、场景、叙事的全面数字孪生到数字原生再到虚实共生,最终实现中华文化元宇宙的宏伟愿景。

三、“新文献观”对文献学专业研究与教学模式变革的启示

如前所述,正因为每当有一种新的具有更高时空维度与更多感官意识维度的人类符号技术出现后,此前所记录下来的人类文化历史都将被这种新的符号技术“重新书写”,并依托其更加丰富的维度与感官进行持续不断地“扩写”与“创写”,这也直接导致人类符号技术的每一次变迁都引起文化形态与学术范式的升级转型。落实到当下的大学教育而言,数字人文可以被视为数智化时代人文与科技融合发展的前沿学术阵地,或许正可以塑造未来大学教育的新形态。

(一)文献学作为一门学科在近代中国的诞生

中国传统学问虽然也有分科,但主要是从研究主体而非客体乃至方法的角度来划分,是学派而非专业。清中后期汉学发达,开始出现专门化的倾向,如龚自珍在为《阮元年谱》作序时概括出了训诂之学、校勘之学、目录之学、典章制度之学、史学、金石之学、九数之学、文章之学、性道之学、掌故之学十个方面,但总体而言这些所谓的“专门”还处于萌芽的阶段。[17]

直至19世纪末以后,“中华民族到了最危险的时刻”,这引发了国人关于中西古今之争的深刻反思,也激发了从制度到思想的全面扬弃与重建。在学术和教育领域,古典的经学、礼教在现代学制中毫无生存空间,文以载道的圣人之学被彻底革除,西学东渐的大潮席卷而下,从自然科学到社会科学乃至人文学科,无不是建立在西方现代学科分类、研究范式和教育体系的基础之上的。在此“三千年未有之大变局”中,中国历代传统之学在大学体制中被摒弃,经史子集被肢解为文献学、语言学、哲学、史学等。1920年,梁启超在《清代学术概论》中首次提出“文献学”的概念;随后《中国文献学概要》的出版开始从学科的角度阐述文献学的内涵;陈垣、王国维、顾颉刚、罗振玉等一大批学者推动了文献学学科体系的创建。

(二)分科而治导致的“人”与“学”之分

在更广阔的历史和地理空间上考量,工业革命后职业教育对传统大学教育的冲击,以及以洪堡思想为代表的研究与教学相结合的新型大学潮流,使得德国逐渐成为当时世界教育和学术的中心。但与之相对的,作为“牛津运动”代表人物的英国主教纽曼在其著名的《大学的理念》中重新阐释了知识的分类,并在此基础上提出大学的本质在于心智的培养,从而提醒人警惕知识之恶。

与之遥相呼应的,清末新政中出台的我国第一个真正实行的现代教育体系——“癸卯学制”,其所设定的教育宗旨即为“端正趋向,造就通才”,即使是对立足于专门教育的大学堂,仍贯彻着“通”的理念。一方面,专门之学是通经致用的工具;另一方面,治学的目的是立人,学问只是成为“通人”的工具。[18]

正如钱穆先生所言:“在中国传统知识界,不仅无从事专精自然科学上一事一物之理想,并亦无对人文界专门探求某一种知识与专门从事某一种事业之理想。因任何知识与事业,仍不过为达到整个人文理想之一工具,一途径。若专一努力于某一特殊局部,将是执偏不足以概全,举一隅不知三隅反,仍落于一技一艺。”[19]他以此批评西方近代的学科分立时说道:“即就西方近代传授知识之大学言,分科分系,门类庞杂,而又日加增添。如文学院有文学史学哲学诸科系,治文学可以不通史学,治史学亦可不通文学。治文史可以不通哲学,治哲学亦可不通史学文学,各自专门,分疆割席,互不相通。……要而言之,则可谓之不明大体,各趋小节。知识领域已乱,更何论于人事。”[20]在前后断裂的历史大潮中,知识层面的整理国故,以及西方导向的分科而治,目光指向的只能是专精而非博通、保存而非应用、批判而非创新。

(三)新时代提供了“文”与“献”合璧的可能性

时至今日,变局再现。这一次,工业文明经历了几十年的后工业过渡,终于开启了数字智能时代的大门。人类信息环境正在发生根本性的改变,人类文明记录和传播方式的大规模变革势必引发文明本体的重建和知识谱系的改写。以本文“新文献观”的视角来看,人与世界是一个具有历史性和当代性的整体,“文”正呈现出对“立人”的重视与回归,“献”则经历了知识生产方式的不断迭代,不论是对于文献学专业的研究和教学,乃至更广阔范围上的大学教育,都具有深刻的启发意义。为此,本文认为应该努力做好如下“三合”。

第一是专业与通识的结合。工业时代,专业教育的重要性毋庸置疑,大学为工业化的全面胜利贡献了最重要的人力基础和技术创新。同时,相伴而生的通识教育也一直在呼吁人本主义的回归,抵抗着过度专业化给人带来的异化和禁锢。但近年来,数字鸿沟、算法黑箱和信息孤岛似乎进一步强化了专业教育的卓越性,数字智能时代的技术主义与全球主义对通识教育带来了巨大的冲击和挑战。[21]因此,大学的通识教育更应与专业相结合,走出一条专业基础上的通识之路。这不仅是因为专业教育本身已经从工业文明的摇篮跃迁为智能社会的航母,更是源于通识教育开始卸下西方“普世价值”的面具,转而深入探讨数字智能时代的“人”的本质属性。

具体而言,通识教育模式的重心在于对经典文献的研读,这恰是对一个时代经典问题的凝练、思考和解答。数字化时代的文献学更强调对于文献的跨时空、跨学科理解,不仅是知识形态的改变,更激活了其内涵的文化精神,建构出“历史—当代”相连接的当代性意义世界。这就使今日的通识教育不再局限于一般的或者说以西方价值为内核的公民教育和批判精神,转而推动个体的社会化、本土化,高扬科技与人文的交叉,塑造一种具有超越性的共同体意识,最终培养出符合“君子不器”的、可以创造和驾驭“苏东坡数字人”这一类新型成果的复合式、高层次、战略性未来人才。

第二是基础与应用的融合。2023年2月,习近平总书记在主持中共中央政治局第三次集体学习时,着重阐述了强化基础研究的重要性,强调要有组织推进“战略导向的体系化基础研究、前沿导向的探索性基础研究、市场导向的应用性基础研究”[22]三种基础研究。尤其是“应用性基础研究”的提法更是直指“学”与“用”相分裂的痼疾——而这一点在传统的人文领域更是以“无用即大用”为由成了一种自傲。实际上,基础是源头,应用是牵引,从“文”到“献”的内化正是在应用转化的过程中实现的。尤其对于人才培养来说,如果没有(广义上的)就业前景,这个学科几乎就丧失了存在的合法性。以应用为导向的基础研究和人才培养,更加明确了目标指向和评价标准,倒逼综合改革的落地,打通了大学与社会的互动链条。

因此,一方面,数字文献学是应用数字技术来研究文献,另一方面,这也是数字技术为文献学开创了广阔的应用空间,促使其更好地服务于学术研究和社会大众,从而激活其生命力和生产力。从前述“苏东坡数字人”案例就可以看出,权威的古籍数据与专业的学术研究是基础、是源头,但如果没有数字科技的应用转化与产业赋能,这些数据就无法成为生产资料,最终也就无法形成生产力;与此同时,“苏东坡数字人”在媒体传播、城市IP发展、展览展示、文旅商融合以及人工智能驱动等方面面临的新场景、新机遇,也反过来对古籍数据的数据挖掘与知识服务、数字人人工智能的情感模型等新领域提出了更多更新、前所未有的技术与理论需求,这又引导和推动了对应学术研究的发展与创新,最终形成基础与应用融合的正反馈循环。

第三是传承与创新的综合。从推动中华优秀传统文化创造性转化、创新性发展,到把马克思主义基本原理同中国具体实际相结合、同中华优秀传统文化相结合,再到建设中华民族现代文明,习近平文化思想不断将文化传承与创新的理念推向新高度。《中庸》讲“父作之,子述之”,《论衡·对作》有“圣人作,贤者述”,“作”为创新,“述”为传承。创新需要积累,需要专业的、跨学科的、跨文明的视野,需要发现问题,更需要具有使命感。创新与传承互促共生,创新因传承而生机绵延,传承因创新而波澜壮阔。这不仅是历史与未来相逢于当下,更是作者与读者、师与生、数与文的相互成就。大学教育的本质即在于人类文明基因的复刻和进化,既追求永恒不变的“形而上者谓之道”(《易经》),又以求新求变的“圣之时者”为典范(《孟子》)。

于“苏东坡数字人”而言,它既是对历史文化名人苏东坡的“复原”,又要努力实现文化意义上的“复活”,前者是传承,后者是创新,二者缺一不可。所谓“复原”意味着“苏东坡数字人”拥有苏东坡的全部知识、记忆、史实、精神等,所谓“复活”意味着“苏东坡数字人”要融入当今的时代,用他独特的精神面貌、思想深度、批判视角和人文情怀去对当下时代、当今世界进行活生生的观察、判断、表达乃至行动、实践,进而用苏东坡的文化精神来产生现实的影响和改变。

四、结语

随着时代的发展,“文献”一词的含义在不断变化。本文立足于“文献”概念原初含义的理解框架,将“文”与“献”纳入一个整体框架来进行理解,通过引入文化哲学、技术哲学的新视角探索一种新的“文献观”表达,即“文献”是一个符号系统,是人类进行一切生命活动的符号化记录。从文化哲学的视角,人是符号的动物,符号是人区别于动物的一个显著特点;从技术哲学的视角,符号是人体感官的外化与延伸,作为人与世界的中介的符号及其能力也可以被视为“符号技术”。

人类符号技术的发展史其实就是人类文化的发生史,数字文献技术这一作为人类思维与智能的外化与延伸的符号技术已成为当今人类符号技术发展的大势所趋,并使得数字人文成为必然。中华书局立足自身深厚的文化积淀与数字文献技术优势,首创研发了全国首位3D超写实历史文化名人“苏东坡数字人”,并从中摸索出了一些古籍文献数字化应用的全新方法论——这也必然伴随着人才培养的探索与创新。

落实到当下的文献学专业研究与教学而言,为了避免近代以来分科而治所导致的“人”与“学”之分,培养出既具有文史知识积淀和传统淑世情怀、又具有现代科技视野和基本数字素养的新生代学人,就需要做好专业与通识的结合、基础与应用的融合、传承与创新的综合,最终,在数字人文时代的新视野下,抓住机遇、守正创新,塑造未来大学教育的新形态。

The “New Document Perspective” in the DigitalHumanities Era and Its Implications for the Reform ofDocumentary Studies Education: A Case Study of ZhonghuaBook Company’ s “Su Dongpo Digital Human”

Guo Lin, Wang Jian

Abstract: In traditional Chinese culture, the concept of “wenxian” encompasses both the meaning of ancient classics and records (“wen”) and the scholars who master these classics (“xian”). However, the later discipline of documentary studies has, to some extent, lost the “human” dimension. To provide an understanding framework that is more aligned with the original connotation of “wenxian” and better suited to the current era of digital humanities, this paper attempts to introduce new perspectives from cultural philosophy and technical philosophy to propose a new “view of wenxian”, striving to integrate “wen” and “xian” into a holistic framework for interpretation. From the perspective of cultural philosophy, humans are the animals of symbols; from the perspective of technical philosophy, symbols are the externalization and extension of humans. Humans can create symbols and thereby create culture, and “wenxian” is precisely a symbolic system that relies on the symbolic writing and media technologies of the corresponding era. In the new era of digital humanities, the application of digital documents has become increasingly widespread. Digital document technologies have made the creation of digital humans of historical and cultural celebrities not only possible but also inevitable. At the same time, changes in symbolic technologies will inevitably lead to the upgrading and transformation of cultural forms and academic paradigms. Currently, the reform of research and teaching models in university documentary studies programs needs to strive to integrate professionalism with general education, basic theory with practical application, and inheritance with innovation. Only in this way can we shape a new form of future university education, create more outstanding cases like the “Su Dongpo Digital Human,” and effectively promote the creative transformation and innovative development of China’s excellent traditional culture.

Keywords: Cultural Philosophy; Technical Philosophy; Document Perspective; Digital Human; Documentary Studies; Digital Humanities

编辑 | 耿弘明

向上滑动 查看注释

[1]朱熹:《四书章句集注》,北京:中华书局,1983年,第63页。

[2]刘宝楠:《论语正义》卷3,北京:中华书局,1990年,第92页。

[3]杨伯峻:《论语译注》,北京:中华书局,2017年,第27页。

[4]恩斯特·卡西尔:《人论》,甘阳译,上海:上海译文出版社,2004年,第37页。

[5]恩斯特·卡西尔:《人论》,第38页。

[6]恩斯特·卡西尔:《人论》,第44页。

[7]郭明哲:《恩斯特·卡普:技术哲学奠基者》,《理论界》2008年第7期。

[8]黄旦:《延伸:麦克卢汉的“身体”——重新理解媒介》,《新闻记者》2022年第2期。

[9]赖黎捷、李明海:《从“人体延伸”到“思维延伸”:麦克卢汉与凯文·凯利技术哲学述评》,《重庆师范大学学报(哲学社会科学版)》2014年第6期。

[10]刘石:《文献学的数字化转向》,《文学遗产》2022年第6期。

[11]王军、张力元:《国际数字人文进展研究》,《数字人文》2020年第1期。

[12]习近平:《加强文化遗产保护传承弘扬中华优秀传统文化》,《求是》2024年第8期。

[13]贝奈戴托·克罗齐:《历史学的理论和实际》,傅任敢译,北京:商务印书馆,1997年,第3页。

[14]刘石:《文献学的数字化转向》,《文学遗产》2022年第6期。

[15]俞国林、王建:《数字人:用科技激活传统文化之美》,《光明日报》2023年1月4日第13版。

[16]王建、付小艳、张建丽:《从数字出版到数据产业再到内容元宇宙——传统数字出版的新型破局之路》,《出版人》2022年第11期。

[17]张寿安:《龚自珍论乾嘉学术:专门之学——钩沉传统学术分化的一条线索》,《学海》2010年第2期。

[18]郭琳:《新教育下的宗经与存古——从〈劝学篇〉和“癸卯学制”看张之洞的经学教育变革》,博士学位论文,北京大学,2017年。

[19]钱穆:《中国知识分子》,《国史新论》,北京:生活·读书·新知三联书店,2018年,第139页。

[20]钱穆:《现代中国学术论衡》,北京:生活·读书·新知三联书店,2001年,第94—95页。

[21]强世功:《数字智能时代的大学通识教育》,《复旦教育论坛》2023年第2期。

[22]习近平:《加强基础研究实现高水平科技自立自强》,《求是》2023年第15期。

扫描下方二维码即可购买《数字人文》期刊

校对  |   肖爽

美编  |  王秀梅

数字使人文更新

投稿:https://szrw.cbpt.cnki.net

数字人文门户网站:www.dhcn.cn

阅读原文

跳转微信打开

第七届清华数字人文国际论坛“未来学者”专场报名通知

2026年4月22日 18:00

2026-04-22 18:00 北京

在人工智能技术迅猛发展的今天,数字人文领域正经历前所未有的变革。数据驱动的研究方法、跨学科的技术融合以及人工智能在文化遗产、文本分析和数据可视化等领域的应用,为学术研究带来了全新的可能性。

“未来学者”专场

人文学术的未来,寄托于未来的人文学者;也即是当下正致力于研究和探索的青年学子。为鼓励和支持本、研阶段学生投入数字人文研究,结合数字时代新方法、探索人文学术新方向,《数字人文》学术集刊持续举办第七届“未来学者”论坛,诚邀国内外的本科生、硕士生、博士生在读学生(不含博士后)投稿并参会。

期待来稿面向人文问题、结合数字方法,给出来自文学、历史、哲学、社科、艺术、教育、传播乃至政治学、图情档案等各个领域的回答和发现。

本届入围者将受邀参与第七届清华大学数字人文国际论坛“未来学者”专场,获得专家指导评议及进一步研究支持,并于本刊择优刊发。

投稿须知

摘要提交截止日期:2026年5月22日

全文提交截止日期:2026年6月12日

投稿地址:

https://szrw.cbpt.cnki.net 

入围名单及参会事宜请参见后续通知。

时间地点

2026年7月10日-13日    共4天

报到7月10日

会议 7月11日—12日

赋归7月13日

上海大学宝山校区(上海市上大路99号)

合作酒店

上海衡山北郊宾馆

:上海市宝山区沪太路4788号

总机: 021-56040088

(注:若实际报名人数超过酒店接待上限,会务组可能新增其他酒店安排接待)

我们期待您的参与,共同探讨数字人文的前沿议题,推动学术研究的创新与发展!

论文格式模板及要求-中文.pdf

论文格式模板及要求-中文.pdf

会议时间地点

2026年7月10日-13日    共4天

报到  7月10日

会议  7月11日—12日

赋归  7月13日

上海大学宝山校区(上海市上大路99号)

会议合作酒店

上海衡山北郊宾馆

地址:上海市宝山区沪太路4788号

总机: 021-56040088

(注:若实际报名人数超过酒店接待上限,会务组可能新增其他酒店安排接待)

论文格式模板及要求-中文.pdf

END

数字使人文更新

投稿:https://szrw.cbpt.cnki.net

数字人文门户网站:www.dhcn.cn

阅读原文

跳转微信打开

数字人文:文科在人工智能时代的定力与新出路

2026年4月9日 18:01

原创 联盟观察 2026-04-09 18:01 北京

从“文科消亡论”到“文科抢手潮”,舆论场在过去一年间经历了戏剧性的反转。2026年春招季,“大厂月薪3万疯抢文科生”“AI叙事设计师”“人机交互伦理顾问”等话题接连登上热搜。与此同时,“文科无用”“文科危机”的论调从未真正消失。

看似矛盾的现象背后,本质上并非文理之争,面对新技术革命,所有学科从业者都必须直面“如何应变”之问。

有研究者指出:“一个仅擅代码编写而不理解代码将服务于何种人群、产生何种社会影响的程序员,难以在人工智能时代保持核心竞争力。”同样,一位仅知埋首故纸堆而对数字工具一无所知的人文研究者,亦难在人工智能时代发出属于自己的声音。

技术从不“偏袒”任何一个学科,它只会鼎力相助那些善于驾驭它向善的人。那么,文科如何以技术之力激活人文之思?答案,藏在“数字人文”里。

从“文科价值”到“数字人文”

在技术浪潮中,文科真正不可替代的价值从未改变,只是表达方式需要更新。

技术擅长回答“怎么做”,而“做什么”“为什么做”需要文科进行价值判断。当AI在工具理性层面越走越远时,恰恰需要文科来回答“应该往哪走”。技术可以提供答案,但无法回答更关键的问题:这些答案意味着什么?它们将把我们带向何处?

“而这正是文科长期承担的任务。问题不在于文科“该不该存在”,而在于它能否以新的形态存在——不是被保留下来的旧文科,而是被重构出来的新文科。”郭英剑老师在《中国科学报》 (2026-03-24 第3版 大学观察)如是说。

数字人文,正是这一重构的重要路径。一名数字人文专业的毕业生,也许在文化遗产机构里从事数字档案的知识图谱构建,也许在科技企业中参与文化类大模型的内容策略与价值对齐。他们既保留人文研究的批判性思维与阐释传统,又掌握数据建模、文本挖掘、空间分析等数字方法,形成“问题导向、方法多元、实践驱动”的综合素养。

政策与专业布局

数字人文的发展,已从学术探索上升为国家战略与教育实践。

政策层面

《教育强国建设规划纲要(2024—2035年)》明确提出:深化新文科建设,强化科技教育和人文教育协同,让人工智能助力教育变革。这为数字人文的发展提供了顶层设计与制度保障。

专业建设层面

数字人文的发展格局已初步形成。2022年,教育部正式将数字人文纳入《普通高等学校本科专业目录》。目前,全国已有15所院校获批设立数字人文本科专业。

数字人文专业发展联盟成立与发展

2025年1月,数字人文专业发展联盟在北京成立,由中华书局古联公司联合25家高校共同组建。仅一年,联盟理事单位已从25家增至近50家。该联盟聚焦专业发展方向与路径、师资培训、课程设置、人才培养与就业、数字人文实验室建设等议题,为数字人文教育的标准化、国际化与可持续发展提供了平台支撑。

点击图片购买《中国数字人文发展报告》一览中国数字人文发展全貌,内含数字人文专业介绍、相关政策、就业前景与相关机构名录等。

课程与培养——复合型人才的锻造路径

数字人文要培养的是“兼具人文精神和科技素养的复合型人才”。从培养目标、课程体系、教学模式到评价管理体系,各高校正在展开系统性探索。

以内蒙古师范大学蒙古学学院为例,作为国内第一个开设数字人文本科专业的院校,其专业定位强调产学研融合——人才培养、学科研究和产业服务三位一体。在课程体系建设中,紧密结合社会需求,融合传统与新兴,兼顾学生背景多样性以促进文理交叉,并强化实践与实验教学环节。

从多所院校的课程设置来看,数字人文专业通常包含三大模块:人文基础课程(文史哲核心)、技术工具课程(编程、数据库、可视化等)、交叉应用课程(数字档案、文化遗产数字化、人文知识图谱等)。这种结构使学生既保有深厚的人文底蕴,又具备驾驭数字工具的能力。

中国数字人文官网:https://nav.dhcn.cn/

实践成果——数字人文的落地与突破

数字人文并非空中楼阁,已在文化遗产保护、学术研究、文化传播等领域取得实质性突破。

“数字敦煌”:通过三维扫描、VR技术,将莫高窟“搬”到全世界,实现文化遗产的永久保存与全球共享。

故宫博物院:数字化文物建档、智慧展览,让文物“活”起来,使公众得以突破时空限制亲近历史。

“九歌·推敲”小程序:由清华大学中华传统文化智能实验室和数字人文研究中心研发,借助人工智能技术,将“推敲”功夫落地为一套可操控、可解释、可回退的智能化写作流程,让诗词爱好者拥有自己的“韩愈”。

中华智慧阅读空间:古联公司依托中华书局古籍经典资源,深度融合智能交互投影与AIGC技术,研制了《天工开物》《本草纲目》等沉浸式智慧阅读空间,实现从“读书”到“入书”的认知升维。

这些案例表明,数字人文正在使人文研究从“解释世界”向“改变世界”延伸。

就业前景——复合型人才的广阔空间

数字人文人才就业方向多元,前景广阔:

  • 文化机构:

    博物馆、图书馆、档案馆,负责数字化项目的规划与实施;

  • 政府部门:

    参与文化产业数字化升级;

  • 教育研究机构:

    从事数字人文教学与研究;

  • 企业与新媒体:

    文化企业、互联网公司,从事数字内容策划、数据分析、信息架构等工作。

热门岗位包括数字内容策划、数字资源管理员、文化遗产数字化专员等。据行业调研,数字人文领域人才缺口持续扩大,复合型人才更受市场青睐。

结语

从“文科消亡论”到“文科抢手潮”,这一年多的舆论反转,与其说是文科的命运转折,不如说:技术越发展,人类对意义、价值、伦理与文明的理解需求就越强烈。

文科不会因AI而消亡,它将借势改变——不是变成另一种东西,而是回到它本该在的位置:在技术飞速奔跑时,提醒人们不要忘记为什么出发。

数字人文,正是这种改变的实践形态。它以交叉融合的学科特质,培养兼具理论深度与技术能力的复合型学术力量,为人文研究的当代转化与体系创新提供了坚实基础。对于每一位身处浪潮之中的主体而言,与其被“文科生”或“理科生”的标签定义,不如主动成为学习者与创造者——去拓展技术的边界,也去追寻科技与人类的意义。

技术改变的是能力,人文守护的是方向。 这或许就是从“消亡论”到“抢手潮”背后,最值得我们记住的那条线。

END

点击往期文章,申请加入或更多了解数字人文专业发展联盟:

欢迎加入丨数字人文专业发展联盟入会方式

转载丨数字人文专业发展联盟正式成立

首届数字人文专业发展联盟年会暨第六届清华数字人文国际会议在昆明学院成功举办

会议通知丨融合与边界:人工智能时代的数字人文发展新进阶

阅读原文

跳转微信打开

课程介绍丨基于AIGC工具的文献多模态资源制作与数字叙事设计

2026年4月5日 17:30

2026-04-05 17:30 北京

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

本课聚焦AI时代下的文献多模态资源制作,为教师及其他文化工作者带来更多在教学和创意领域的新思路、新工具。

课程针对古籍、古诗词理解困难和大众传播普及率不高的问题,课程从可信数据视角切入,以敦煌遗书、古诗词为例,演示文献内容从“数据化-信息化-知识化-艺术再造”处理全流程涉及的资料考证、文案策划、视觉传达设计、多模态制作的实操过程和成果展示。

可供中小学文史教师、数字人文教学科研人员、文化创意工作者、爱好者学习借鉴,用于备课、课程教学、创意传播。

主讲人:张宁

北京师范大学文理学院中文系讲师、硕士研究生导师,北京师范大学珠海校区图书馆数字人文中心主任,中国计算机学会(CCF)人文智能专业委员会执行委员。研究方向为古籍数字叙事、VR古籍游戏、数字人文教育等。 主持国家社会科学青年基金1项、省部级课题3项、获中国发明专利授权2项,发表中外学术论文30余篇,主持建设"文献多模态资源AI标注与问答平台”“京师.数字记忆3D展厅平台”“全球数字人文教育资源智能检索平台”。

*了解培训详情及报名请扫描本文海报二维码。

←了解我们正在进行的项目

籍合学院

中华书局旗下

古籍整理与传统文化学习平台

阅读原文

跳转微信打开

课程介绍丨AI时代的数字目录学及其基础设施

2026年4月4日 17:30

2026-04-04 17:30 北京

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

本课程将视角延伸至数字目录学与数字人文基础设施建设,并结合教学反馈展开讨论。

教师将聚焦人工智能时代的数字目录学发展,结合清华大学团队近年来在相关基础设施研发与课程教学中的实践经验,对数字目录学的未来发展方向、基础设施建设路径及相关教学活动进行系统性梳理与反思。

主讲人:唐宸

清华大学人文学院副教授,教育部哲学社会科学实验室“中华传统文化智能实验室”核心成员,兼任《数字人文》编辑,主要从事中国古典文献学、数字人文研究,研发了“典津-全球汉籍影像开放集成系统”“奎章阁-中国古典文献资源导航系统”“中国数字人文(DHCN)”等基础设施。

*了解培训详情及报名请扫描本文海报二维码。

←了解我们正在进行的项目

籍合学院

中华书局旗下

古籍整理与传统文化学习平台

阅读原文

跳转微信打开

课程介绍丨AI+文献学课程建设与科研思考

2026年4月3日 17:30

2026-04-03 17:30 北京

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

本课开始,老师们将在智慧课程建设这个主题的基础上围绕科研与教学展开进一步思考。

课程以AI+文献学课程为案例,探讨AI在文献学智慧课程设计中的教学应用场景与创新边界;最终落脚于数字化研究方法的学理反思,构建技术工具与人文阐释互鉴共生的文献学研究新生态。

课程的内容要点分别有数字人文与古典文献学的交叉融合路径与思考,AI辅助下的文献学课程设计、教学创新与反思以及文献学的数字化研究方法的思考。

主讲人:贾智

中山大学中国语言文学系(珠海)教授、博士生导师、系副主任。主要研究方向为汉语言文字学,特别是中古汉语、近代汉字的发展、流变和域外传播研究,兼及敦煌遗书、域外文献整理与研究。

*了解培训详情及报名请扫描本文海报二维码。

←了解我们正在进行的项目

籍合学院

中华书局旗下

古籍整理与传统文化学习平台

阅读原文

跳转微信打开

课程介绍丨AI+语言学的智慧课程建设与实践设计

2026年4月2日 17:30

2026-04-02 17:30 北京

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

本讲开始,我们进入智慧课程建设模块。首要的工作就是夯实理论基础,构建系统的方法论。

本课紧扣“AI课程建设”的核心主题,以《语言学概论》课程为具体案例,分析从顶层设计到课堂落地的智慧课程建设全流程。

首先,教师带领学员解读国家教育数字化战略行动的最新政策,剖析智慧课程建设的核心意义和内涵。

在此基础上,进一步探讨大语言模型、自动化知识图谱分析、课程多源数据库建设等前沿信息技术,如何从底层逻辑上重塑语言学乃至整个新文科的教学目标、内容体系与课堂中的师生关系。

最后,通过“语言学概论”课程从0到1的建设实录,真实展示如何借助信息技术破解文科教学长期存在的难点,构建数智化混合式教学新形态。

主讲人:龙润田

暨南大学文学院副教授,博士生导师,北京市课程思政教学名师,暨南大学汉语方言研究中心研究员、岭南数字人文广东省实验教学示范中心研究员、暨南大学—科大讯飞方言语音科技联合实验室研究员。主要从事南方少数民族语言历史与文化、语言智能与数据计算、国际中文教育相关领域的研究工作。主持国家社科基金、国家出版基金、教育部国家语委专项等国家级、省部级项目多项。在国内外权威期刊发表论文20余篇。获国家发明专利授权2项,软件著作权3项,研发TonePro、FormantPro等语言调查软件,建设“新发现少数民族古文字数据库”等数据资源。研究成果获第二十二届中国社会科学院吕叔湘语言学奖,教学成果曾获北京高校优质本科教材课件奖等省部级教学成果奖两项。

*了解培训详情及报名请扫描本文海报二维码。

←了解我们正在进行的项目

籍合学院

中华书局旗下

古籍整理与传统文化学习平台

阅读原文

跳转微信打开

课程介绍丨AI驱动的数字人文统计研究全流程重构

2026年4月1日 17:30

2026-04-01 17:30 北京

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

本讲我们继续模块三的学习,从统计的视角切入。

针对人文学者在量化转型中普遍面临的“门槛高、应用难”等困境,本课尝试提炼一套“数据筑基、逻辑领航、AI协同”的研究路径。应当明确,统计学并非点石成金的魔法,若原始数据本身存在严重的“幸存者偏差”,任何精妙的方法都只能是徒劳的修饰。

在筑牢数据严谨性这一底线的前提下,讲座旨在通过RTCO提示词框架实现人文逻辑与AI执行力的深度对接,使大模型从“不可知的黑箱”转化为透明、专业的“虚拟统计专家”。

这套流程的本质,是将学者从繁琐、低效的代码纠缠中释放,把宝贵的精力重新投入到“变量洞察”与“深度学理阐释”的科研本位之中,真正实现在AI时代下人文研究效率与解释深度的同步飞跃。

主讲人:沈威

华中师范大学语言与语言教育研究中心副教授,博士,硕士生导师。研究方向为中文信息处理、现代汉语语法。主持、参与各级各类项目15项,出版独著1部,合著2部,参编教材1部。发表论文40余篇。主持并研发了“当代小说语料库”“汉语复句语料库”“汉语中介语动态语料库”和“我国中小学生写作能力评价与教学策略研究数据库”等语料库。

*了解培训详情及报名请扫描本文海报二维码。

←了解我们正在进行的项目

籍合学院

中华书局旗下

古籍整理与传统文化学习平台

阅读原文

跳转微信打开

《数字人文》2026年第1期——“数字人文与出土文献研究”专刊出新

2026年4月1日 17:30

数字人文 2026-04-01 17:30 北京

以下文章来源于:DH数字人文

DH数字人文

清华大学、中华书局联合主办《数字人文》(Journal of Digital Humanities)季刊,旨在为方兴未艾的数字人文研究提供理论探讨和专题研究的平台。

《数字人文》上新了!

《数字人文》2026年第1期是“出土文献与数字人文专刊”,系国内学界首次以学术专刊形式对出土文献等冷门“绝学”内数字人文成果的集中展示。本期共刊发12篇文章,从内容上看,包括理论探索、平台建设、个案研究和出版实践等多方面,关注甲骨和简帛的缀合、古文字识别与析形,探索天文地理,介绍数据库平台及数字化出版方式。从涉及的材料类型和时代上看,涵括甲骨文、金文、战国秦汉简帛、石刻等,跨越商周到蒙元数千年历史。这些文章,反映近几年来相关领域数字人文的成果,并加以综述,希望能对关心出土文献研究的学者提供新的视角,为数字人文拓展新的领域。本期专刊从选题确定到编校完成,历时超两年,编辑部对作者们的大力支持表示诚挚感谢,也衷心邀请更多出土文献领域采用数字人文手段进行研究的学者不吝赐稿!我们愿意为最新的实践创造发表平台,让更多新颖的、有意义的学术探索尽快公之于众。

目    录

 理论与平台

数字人文与当代中国出土文献研究的现代性特征

许  可

人工智能古文字析解模型的初步训练

聂 菲 宋奥齐

数智时代的出土文献研究:“古汉语小站”建站经验与反思

薛腾阔 

动态视图在文字编管理系统中的应用研究 

数字人文与甲骨学研究

人工智能引导人类直觉产生的甲骨新缀第41-50 组

李霜洁 蒋玉斌

数智化整理助推甲骨文校重工作新发展

莫伯峰 巩诗晨 武智融

面向识别研究的甲骨文数据集标准的探索

陈婷珠

数字人文与简帛学研究

楚简古书类文献通假研究的数据库方法

——以“清华简”(壹—玖)为中心

 孙 欣 刘志基

语料信息处理视角下的里耶秦简缀合研究

冯慧敏 郭帅帅

秦汉简帛文献数据库的建设及文字学应用

张再兴 林 岚

实践与出版

上博简五《竞建内之》“星子曰为齐”考

——基于天象模拟技术的探析

李 凡

蒙元时期石刻族谱文献的数字化分析

——以地域分布与时代特征为中心

王 琪 

动态视图在文字编管理系统中的应用研究 

古文字工具书的数字化转型思考与实践

——以 《古文字构形类纂·金文卷》为例

姜 慧 闵怡然 

动态视图在文字编管理系统中的应用研究 

征稿启事

CONTENTS

Theory and Platform

Digital Humanities and Modern Characteristics of Contemporary Research on Unearthed Documents in China

Xu Ke 

Preliminary Training of an AI Model for Ancient Script Analysis

Nie Fei, Song Aoqi

Research on Unearthed Texts in the Digital-Intelligence Era: The “Classical Chinese Hub” Website—Development Experience and Reflections

Xue Tengkuo

Digital Humanities and Oracle Bone Studies

AI-Guided Human Intuition Discovers New Oracle Bone Fragment Rejoinings: Series 41–50

Li Shuangjie, Jiang Yubin

New Developments in Repetition Proofi ng for Oracle Bone Inscriptions Driven by Digitalization Collations

Mo Bofeng,Gong Shichen, Wu Zhirong

Exploration of Oracle Bone Inscription Data Set Standards for Recognition Research

Chen Tingzhu

Digital Humanities and Bamboo Slips and Silk Studies

The Database Method for the Study of Ancient Literature in the Chu Bamboo Slips: Centered around the Tsinghua Bamboo Slips (1-9)

Sun Xin, Liu Zhiji

Research on Liye Qin Bamboo Slips Conjugation from the Perspective of Digital Humanities 

Feng Huimin, Guoshuaishuai

The Construction and Application of the Qin-Han Bamboo Slips and Silk Database

Zhang Zaixing, Lin Lan

Practice and Publication

Research on the “ 星子曰为齐” in the “Jing Jian Nei Zhi” of “Bamboo Slips V in the Shanghai Museum”:Analysis Based on Celestial Event Simulation Technology

Li Fan

Digital Analysis of Stone Carving Genealogical Documents during the Mongolian Era and the Yuan Dynasty: Focusing on Geographical Distribution and Times Characteristics

Wang Qi

Reflection and Practice of the Digital Transformation of Ancient Chinese Character Reference Books:Taking the Compilation of Ancient Character Confi guration Categories Formations —the Volume of Bonze Inscriptions as an Example

Jiang Hui, Min Yiran

Call for Papers

数字使人文更新

投稿:https://szrw.cbpt.cnki.net

数字人文门户网站:www.dhcn.cn

阅读原文

跳转微信打开

课程介绍丨基于可视化编排的 AI 史料挖掘与溯源验证

2026年3月31日 17:31

2026-03-31 17:31 北京

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

本课开始我们进入模块三:学习利用零代码编程开展研究的工作全流程。

在生成式人工智能(AIGC)重塑知识生产的当下,人文学者面临着双重困境:传统的编程工具(如 Python)学习曲线陡峭,让人望而却步;而新兴的大模型虽然能快速生成内容,但其固有的黑箱机制与幻觉风险,使得输出结果难以满足人文学科对证据来源与逻辑可控性的严苛要求。

如何在享受技术红利的同时,捍卫学术研究的严谨性?本课程将围绕具体的数字人文研究案例,讲授一套AI条件下“低门槛、高严谨”的研究流程。

主讲人:张光伟

陕西师范大学历史文化学院讲师,硕士研究生导师。担任陕西师范大学丝绸之路历史文化虚拟仿真实验教学中心(省级)主任,国际长安学研究院数字长安研发中心主任,全国历史学实验室建设联盟秘书长,国际教育合作协会(GPE)咨询委员会委员。主要从事"人工智能+历史学"交叉学科研究。发表各类相关研究论文20余篇,参与、主持多项国家级、省部级社科基金与自然科学基金项目。开设数字人文与新文科以及国际理解教育相关课程。

*了解培训详情及报名请扫描本文海报二维码。

←了解我们正在进行的项目

籍合学院

中华书局旗下

古籍整理与传统文化学习平台

阅读原文

跳转微信打开

课程介绍丨零代码搭建人文数据库及人文智能体

2026年3月30日 17:30

2026-03-30 17:30 北京

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

本课程为方法论与工具实操课。教授学员零代码搭建人文数据库及人文智能体的具体方法。

以自研的汉语方言学大词典数字化平台、汉语方言语音特征数智平台、广州话电子字典、明清坊刻通俗小说数据库为实例,帮助学员在实践中理解人文数据库建设的完整路径。剖析上述平台的设计思路、前后端实现及AI智能体研发逻辑,逐步建立起符合学术规范的数据基础设施建设方法论。继而通过零代码平台实操,演示如何无需编程即可搭建人文类数据库和智能体,并利用其服务学术研究与教学。

主讲人:彭志峰

暨南大学文学院中文系讲师,广东省岭南数字人文实验教学示范中心(省级)副主任,暨南大学-科大讯飞方言语音科技联合实验室(省级)副主任,暨南大学汉语方言研究中心(省级)研究员,粤语语料库建设与大模型评测重点实验室(市级)研究员,主持4项省部级项目,研究方向为数字人文与方言科技。

*了解培训详情及报名请扫描本文海报二维码。

←了解我们正在进行的项目

籍合学院

中华书局旗下

古籍整理与传统文化学习平台

阅读原文

跳转微信打开

课程介绍丨大语言模型的原理及应用

2026年3月29日 17:31

2026-03-29 17:31 北京

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

本课程为零代码编程模块基础课,讲解大语言模型的原理及工具应用。课程将会展示大语言模型的技术原理与演进,常用的大模型工具以及大模型应用案例。

课程遵循"原理—工具—场景"递进逻辑:先介绍神经网络模型原理与预训练、后训练范式,建立技术认知框架;继而对比评测国内外主流大模型,掌握工具选型能力;最终聚焦语料数据加工、文本改编等具体场景,演示如何高效调用模型,以及通过领域语料建立专用模型。

主讲人:胡韧奋

北京师范大学文学院、国际中文教育学院副教授,研究方向为计算语言学、数字人文,主讲Python编程与数据分析、自然语言处理等课程,主持十余项科研课题,在国内外高水平刊物和计算机领域顶会发表学术论文50余篇,获国家发明专利授权6项,作为主持人或核心成员构建了中文词向量资源库、CCA中文搭配助手、古诗文断句标点系统、“AI太炎”古汉语大模型等资源和应用。

*了解培训详情及报名请扫描本文海报二维码。

←了解我们正在进行的项目

籍合学院

中华书局旗下

古籍整理与传统文化学习平台

阅读原文

跳转微信打开

课程介绍丨国产“龙虾”替代方案深度测评与实战指南

2026年3月28日 17:30

2026-03-28 17:30 北京

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

本课是本次培训的“加课”,深度解析当下的“OpenClaw”热点。

课程聚焦海外智能体框架OpenClaw在国内遇到的技术限制、部署成本、数据合规等痛点。先讲OpenClaw是什么、为什么火,再讲为什么要转国产替代。这也是本次讨论的核心脉络,帮助大家厘清从海外框架到国产方案的技术演进逻辑。

课程通过讯飞AstronClaw、腾讯WorkBuddy深度测评,给出国产“龙虾”三步实操法,帮大家把大模型变成能落地执行的主动辅助系统,减少重复劳动、提升效率,最后辨析需求真伪并答疑。

主讲人:沈威

华中师范大学语言与语言教育研究中心副教授,博士,硕士生导师。研究方向为中文信息处理、现代汉语语法。主持、参与各级各类项目15项,出版独著1部,合著2部,参编教材1部。发表论文40余篇。主持并研发了“当代小说语料库”“汉语复句语料库”“汉语中介语动态语料库”和“我国中小学生写作能力评价与教学策略研究数据库”等语料库。

*了解培训详情及报名请扫描本文海报二维码。

←了解我们正在进行的项目

籍合学院

中华书局旗下

古籍整理与传统文化学习平台

阅读原文

跳转微信打开

基于改进YOLOv8的刺绣动态检测与分类研究

2026年3月28日 17:30

鲍亚林 吉国秀 2026-03-28 17:30 北京

以下文章来源于:DH数字人文

DH数字人文

清华大学、中华书局联合主办《数字人文》(Journal of Digital Humanities)季刊,旨在为方兴未艾的数字人文研究提供理论探讨和专题研究的平台。

针对现在检测和分类算法存在分类种类少、准确率低、无法满足实时检测需求等问题,本文将实时分类技术应用于传统刺绣行业,为刺绣文化研究和保护提供宝贵的算法支持。文章对现有YOLOv8算法进行改进。

多模态学习

鲍亚林 / 辽宁大学文学院

吉国秀 / 辽宁大学文学院

针对现在检测和分类算法存在分类种类少、准确率低、无法满足实时检测需求等问题,本文将实时分类技术应用于传统刺绣行业,为刺绣文化研究和保护提供宝贵的算法支持。文章对现有YOLOv8算法进行改进。首先,基于DCGAN网络均衡刺绣图像数据集,解决小样本刺绣图像类别不均衡问题。其次,将YOLOv8的主干网络替换为InceptionNeXt模块,实现在不同尺度上提取特征,增强特征提取能力;增加GAM模型作为过渡模块,在特征融合前对信息进行筛选,提升网络的特征融合能力。最后,使用改进后的网络模型对测试集进行实验,并使用图片、视频和摄像头进行离线和在线验证。实验证明,改进后的模型对10种刺绣类别的分类性能表现出色,整体平均准确率达到0.9043,平均精度达到0.9151。与其他分类检测算法相比,改进后的YOLOv8模型具有明显的优势,达到了较高的泛化能力和鲁棒性,能够满足实际应用中的实时性需求。

关键词:动态检测 刺绣分类 YOLOv8 实时分类 数字人文

作为中国传统历史文化的工艺象征之一,刺绣蕴含着丰富的文化意蕴与美学价值。在技术转型的背景下,刺绣传承的方式悄然发生改变。刺绣由以往博物馆式静态传承走向面向大众的活态传承。刺绣活态传承由囿于以往“口传心授”的谱系性方式,转向突破自身专业性和排他性的多方互动。立足于数智时代,技术是缩减主体间隔与形成文化交流的关键枢纽。借助于数智技术的传输路径,刺绣内部的专业知识扩散并渗透到民众的日常生活世界,人们在感受传统刺绣带来的意象气韵时,也在享受当代技术建构的创新实践。因此,数智技术成为刺绣回归日常生活的重要介质。

当下,非遗数据库是整合、完善非遗传承人及其代表性项目的重要系统化存储手段。非遗数据库建构的首要基础是数据的完备性。从广义上来看,数据完备性至少包括体量的充盈及分类的合理化两大方面。对于我国刺绣类非遗来说,其数据集种类多样,具备数据量庞杂的特点。但传统的刺绣分类识别主要依靠专业人员,耗时大、成本高、能力差异等因素都限制资源的合理化利用。因此,刺绣分类智能化是打破传统人工藩篱的基本思路。例如,董馥伊[1]首次引入计算机技术局部矢量化的方法,实现了传统栽绒毯纹样特征的智能检索分类。

近年来,深度学习技术被广泛地应用到刺绣分类识别领域中。刘净净、郭飞等[2]改进BP神经网络,使得模型的正确识别率高达78%,开辟了刺绣深度学习分类的先河。目前基于深度学习的刺绣研究现状如表1所示,刺绣的深度学习分类方法虽然能实现刺绣的智能检测,构建较为完善的非遗分类结构体系,但是这些方法以静态识别为主,程序烦琐、局限性大、灵活性低,尚未真正实现刺绣实时检测的功能。因此,本文旨在借助目标检测领域先进、高效、准确的YOLOv8模型[3],为刺绣动态实时视频分类提供有力支持。

def

表1 基于深度学习的刺绣研究现状[4][5][6][7][8][9][10]

针对现在检测和分类算法存在的问题,本文将计算机视觉和人工智能技术与数字人文领域结合,对现有YOLOv8算法进行改进。基于DCGAN网络均衡刺绣图像数据集,解决小样本刺绣图像类别不均衡问题;改进YOLOv8的主干网络,引入InceptionNeXt模块,实现在多个尺度上高效提取特征,从而提升特征提取能力;增加GAM模型作为过渡模块,在特征融合前对信息进行筛选,提升网络的特征融合能力。最后使用改进后的网络模型对测试集进行实验,将实验结果进行可视化分析,与现有的技术进行比较,并验证所提出的方法的有效性。同时,使用图片、视频和摄像头进行离线、在线验证。通过这一研究,为刺绣文化的传承与创新提供一种全新的技术手段,将传统手工艺与现代科技有机融合,为刺绣艺术的发展注入新的活力。本文的研究成果不仅对于刺绣文化的传承和推广具有重要意义,还将为多端部署技术在文化艺术领域的应用提供有益的参考和借鉴,其基于YOLOv8的刺绣动态检测与分类流程图如图1所示。

一、整理和优化刺绣数据集

本文的分类对象为中国传统十大名绣:汴绣、汉绣、杭绣、京绣、鲁绣、瓯绣、蜀绣、苏绣、湘绣和粤绣。每种刺绣因其历史背景和地域文化的差异,形成了独特的针法与风格,例如汴绣的“蒙针绣”、苏绣的“双面绣”、京绣的“打籽针”、蜀绣的“锦纹针”、鲁绣的“抽丝编花”、瓯绣的“八字针”、杭绣的“贴续绣”、粤绣的“乱底针”、汉绣的“齐针”和湘绣的“掺针”,都是各自绣种的工艺代表。为了构建全面的刺绣样本库,本研究的刺绣作品来源广泛,包括小红书、抖音、微博、京东等线上网络渠道和博物馆、文化馆等线下文化机构公开的数字图像资源(共计1,263件),以及刺绣大师与传承人提供的作品图像(共计152件)。此外,还补充和吸收相关刺绣艺术书籍和刊物中的高质量图片(共计315件)。所有采集的图像均经过非遗领域专家的严格质量把控与品种鉴定,以确保样本的艺术代表性和数据完整性。

图1 基于YOLOv8的刺绣动态检测与分类流程图

数据预处理技术是指在将数据输入模型之前,对数据进行一系列处理操作,以提高模型的性能和泛化能力。常见的数据预处理技术包括数据均衡、数据增强、数据标准化、归一化和数据降维等,在医学影像分析、农业检测、遥感影像等领域,已广泛应用于各类计算机视觉任务中。针对数据集样本不均衡问题,郭忠远等[11]利用DCGAN模型均衡和扩充红枣外观缺陷数据集,使得模型准确率上升2.18%—3.26%;袁卫民等[12]利用DCGAN模型,生成虚拟样本,使得准确率优于其他算法,解决了轴承故障数据不均衡的问题。同时,针对数据集样本容量较小问题,郑慧怡等[13]利用添加椒盐噪声和随机旋转技术,实现了数据样本容量的扩充。陈金荣等[14]利用翻转、亮度转换和旋转等技术扩充了数据集的总量,从而提高模型的准确率,极大地降低了漏检率。

针对当前刺绣数据集种类不均衡和样本较少等问题,本文在已有前沿方法的基础上,采用对抗生成网络技术和数据增强技术,整理和优化刺绣数据集,有效增加少样本类别的数据量,增强模型对不同类别特征的捕捉能力,从而提高分类的准确性。相比于现有前沿数据预处理方法,本文针对不同刺绣针法和图案的特点,进行优化适配,确保增强后的图像仍然保留了刺绣特有的细节和艺术性。

(一)类别均衡

由于地域和文化背景的差异,一些刺绣因其历史悠久或地理位置偏远,获取相关图像的难度较大,导致此类别的数据样本较少;而另一些刺绣因文化传播广泛、应用场景多样,相关图像较多。因此,在实际收集这些刺绣图像时,往往会面临类别不均衡的问题。在不均衡的数据集中,模型容易偏向于多样本类别,忽视少样本类别,从而导致分类结果偏向常见类别,严重影响分类的准确性和可靠性。

为了实现不同类别刺绣样本的均衡,可以考虑收集更多的小样本刺绣图像,或者减少大样本的刺绣集图像数量。但由于刺绣类别的不均衡性,获取较多的小样本刺绣图像存在较大难度。利用生成对抗网络(Generative Adversarial Networks,GAN)生成图片,可以有效解决上述问题。[15]传统GAN尽管在生成逼真图像方面表现出色,但在训练稳定性和生成图像质量上存在诸多挑战,导致模型在训练过程中容易出现梯度消失、模型崩塌和生成的样本类别不可控等现象。[16]

深度卷积生成对抗网络(Deep Convolutional Generative Adversarial Networks,DCGAN)通过引入卷积层、批量归一化、去掉池化层、使用Leaky ReLU激活函数以及改进架构设计,显著提升了传统GAN的性能。[17]通过改进,DCGAN在生成图像质量、训练稳定性和模型鲁棒性方面表现出色,因此,本研究使用DCGAN来生成小样本刺绣图像,以缓解类别不均衡问题。为了确保传统刺绣样本和非遗数据库数据的真实性和完整性,基于DCGAN生成的刺绣图像仅作为模型训练中的辅助数据,旨在提升分类性能,而非用于非物质文化遗产数据库的核心数据保存。同时,为了保证DCGAN生成的刺绣图像在艺术性和工艺上的代表性,生成过程严格依据各类刺绣的针法和纹理特征进行,且由非遗领域专家进行审查和筛选,以确保生成图像在风格和工艺上与传统刺绣相符,从而避免偏离原有的工艺特色和文化价值。

DCGAN的结构如图2所示。从中可以看出,DCGAN由生成器和判别器组成。生成器的任务是从随机噪声中生成逼真的图像,判别器的任务是区分真实图像和生成器生成的假图像。通过生成器和判别器的反复对抗训练,不断迭代优化,两者共同提升,生成高质量的图像。

利用DCGAN生成特定类别的刺绣图像,有助于平衡数据类别,有效扩充数据集,使各类别的数据量趋于一致,从而提升模型在各类别上的分类性能。生成的刺绣图像变化情况如图3所示。

(二)数据增强

利用深度学习进行刺绣检测与分类时需要大量的刺绣图片作为训练样本,如果没有足够的训练样本支撑,当网络深度较深时就极易出现过拟合的情况。在深度学习中,数据增强是提升模型性能的一种常用手段,可以在不降低网络深度的同时又能够有效地拟合数据,提高模型的鲁棒性和泛化能力。亚历克斯·克里泽夫斯基(Alex Krizhevsky)等人[18]通过对CIFAR-10数据集的图像进行随机裁剪和水平翻转,显著提高了分类准确率。西哈姆·塔比克(Siham Tabik)等人[19]则在手写数字识别任务MNIST数据集中使用了扭曲和缩放等变换手段,成功提升了模型的表现性能。

在刺绣图像分类领域,目前的研究主要集中在特征提取和模型设计方面,对于数据增强的研究较为有限。刺绣作为一种兼具生命情感与审美意象的手工艺,其图案庞杂丰富,但由于刺绣图像收集和标注的困难,训练样本通常较为有限。为有效缓解这一问题,支撑更深的神经网络训练,本研究采用常见的数据增强方法,包括旋转、水平翻转、垂直翻转、随机裁剪、随机改变亮度和添加高斯噪声。[20]在数据预处理阶段,对原始刺绣图像应用上述增强方法,提高模型分类性能、防止网络过拟合,并生成新的训练样本,部分刺绣数据增强示例如图4所示。

图2 DCGAN结构

图3 刺绣图像生成过程示例

图4 部分刺绣数据增强示例

原始数据集分别按照0.7、0.2和0.1的比例随机分为训练集、验证集和测试集。原始刺绣数据集、刺绣增强数据集和经过DCGAN均衡后的刺绣图像图幅数如表2所示。

表2 均衡和生成数据集划分情况

二、YOLOv8原理及改进

(一)网络结构设计

在目标检测算法中根据检测过程的不同,可以分为双阶段算法和单阶段算法。双阶段算法先提取图像候选区域再进行类别的判定,其漏识别率较低,但速度较慢,典型网络有RCNN和Faster-RCNN。[21]单阶段算法则不需要产生候选区域阶段,一步到位直接产生物体的类别概率和位置坐标值,经过单次检测即可直接得到,因此有着更快的检测速度,最典型的是YOLO系列算法。[22]考虑到刺绣在线检测的实时性,因此采用YOLO算法来分类刺绣图像。

YOLOv8是由Ultralytics公司于2023年1月发布的一种目标检测算法,[23]本研究基于YOLOv8算法,旨在对十种刺绣图像进行分类。针对当前YOLOv8算法存在的分类准确率不足等问题,我们对其进行了改进,以提高刺绣分类的准确度。为增强多尺度信息提取能力,我们将YOLOv8的主干网络替换为InceptionNeXt模块,从而提升特征提取的性能。通过引入并行卷积操作,模型能够捕捉到更多的图像细节和上下文信息,从而提高特征提取的效率和整体性能。在原始的YOLOv8中,主干网络提取特征后,直接将其输入到颈网络。尽管YOLOv8在特征融合方面已有一定设计,但对于关键信息的针对性提取和识别仍显不足。因此,我们引入全局注意机制(Global Attention Mechanism,GAM)模型作为过渡模块,在特征融合前对信息进行筛选,以增强关键信息的识别能力。

1.InceptionNeXt模块

InceptionNeXt模块在ConvNeXt和Inception架构的基础上进行了一系列改进,同时引入更优化的模块设计,适用于图像分类、目标检测等多种计算机视觉任务。[24]用InceptionNeXt模块取代原有的C2F模块,可以实现在提高模型特征提取能力的同时,不额外增加网络参数数量。InceptionNeXt通过并行卷积操作(3×3,1×11,11×1)在不同尺度上提取特征,同时引入跳跃连接并添加了常量映射,这种分解不仅有效减少了参数量和计算量,还保留了大核深度卷积的优点,扩大了感知领域,提高了模型性能。InceptionNeXt模块的主要结构如图5所示。

图5 InceptionNeXt模块结构图

2.GAM注意力机制模块

近年来,注意力机制已成为目标检测任务中的关键组成部分。[25]注意力机制的灵感来源于人类视觉系统,能够筛选大量信息并找到重要数据。GAM注意力机制模块使用通道注意力机制和空间注意力机制,通过关注全局信息和局部信息的交互,增强特征表达能力,并广泛应用于图像分类、目标检测等计算机视觉任务,其结构如图6所示。GAM通过引入全局和局部的注意力机制,对全局上下文信息进行引导,调节局部特征的表达,提升网络对重要特征的捕捉能力,最终提高网络的识别和分类能力。[26]对于给定的输入特征,,中间状态特征F2和输出特征F3定义为:

1)

其中,表示按元素进行乘法操作。

图6 GAM注意力机制模块结构图

3.改进后的网络结构

改进后的网络结构如图7所示,使用刺绣增强均衡数据集,将输入的刺绣图像首先通过主干网络部分逐步提取特征。在主干网络部分中,刺绣图像特征通过5个卷积模块、4个InceptionNeXt模块和1个SPPF模块后,得到不同尺度的特征图。再由颈部网络将不同尺度的刺绣特征图进行融合,最后头部网络根据分类需求输出预测结果以及置信度。改进后的网络结构通过多尺度特征提取和全局特征交互与融合等操作,提高了目标检测与分类的性能和鲁棒性,并在复杂场景下取得更准确的分类结果。

图7 改进后的YOLOv8网络结构

(二)超参数设置

本研究模型在CPU(Intel Core I7-12700K,20线程,3.6GHz)和GPU(NVIDIA RTX 3070,8GB,5888CUDA)上进行训练,使用Adam作为模型的优化算法。为加速网络收敛,避免网络陷入局部最优解,学习率自适应调节方法,其超参数具体设置如表3所示。

表3 超参数设置

(三)评价指标

在图像分类问题中,通常使用二元交叉熵损失函数(Binary Cross Entropy,BCE)作为分类损失函数。[27]在刺绣十分类问题中,BCE的梯度形式更优,训练时更加稳定,训练输出时对每一种类别k进行判断,并输出置信度,其公式如(2)所示:

(2)

其中,yi为第i刺绣样本的真实类别,pi为网络对刺绣样本i的预测类别。

为了能够有效评估改进后的YOLOv8模型对刺绣的检测和分类结果,本研究采用召回率(Recall)、准确率(Accuracy)、精度(Precision)、F1值(F1-Score)和AP作为评价指标。上述五种评价指标均为数值越大,代表模型的分类性能越优,公式如下所示:

(3)

(4)

(5)

(6)

其中,TP为真正例,表示模型正确地将类别k的刺绣样本预测为类别k;TN为真负例,表示模型正确地将不属于类别k的刺绣样本预测为不是类别k;FP为假正例,表示模型错误地将不属于类别k的刺绣样本预测为类别k;FN为假负例,表示模型错误地将属于类别k的刺绣样本预测为其他不是类别k的类别。

(7)

以召回率为横坐标,精度为纵坐标,便能绘制出精度召回率(Precision-Recall,P-R)曲线。P-R曲线与横纵轴围成的面积代表对应刺绣类别的AP。其中,围成的面积越大,AP值就越高,对应模型的检测效果就越好。

为了防止模型出现过拟合状态,采用早停法策略确定合适的训练周期。[28]假设Eopt(t)是在第t个周期下的最优验证集损失值,GL(t)为泛化误差。当泛化误差GL(t)的增长率大于指定值时,则停止训练,如公式(8)所示:

(8)

三、实验结果可视化分析

(一)训练结果可视化

1.损失曲线

图8展示了改进后的YOLOv8模型在训练过程中随着迭代周期次数的增加,训练集和验证集损失值的变化趋势。从图8可以看出,由于前期学习率较大,导致模型在验证集上的损失曲线出现震荡,但总体呈下降趋势,表明模型在持续学习特征并不断地进行优化。在第25个周期后,预测损失的偏差逐渐减小。在第40个周期后,验证集的损失值逐渐趋于稳定,并在第45个周期左右基本达到收敛状态。选择在验证集上损失值最小时的权重,即第48个周期下的权重作为模型最终权重。

图8 训练集与验证集损失曲线

2.分类结果评价指标

将测试集的刺绣图像输入到最终的分类模型中,检测改进后的YOLOv8模型的分类效果,其刺绣分类结果评价指标如表4所示。再对表4的内容进行可视化分析与展示,其结果如图9所示。

表4 改进后的模型刺绣分类结果评价指标

图9 刺绣分类结果评价指标柱状图

从图9中可以看出,刺绣分类模型在各个类别上表现出色,整体平均召回率为0.90434,平均准确率为0.90434,平均精度为0.91505,平均F1值为0.90751,平均AP达到0.96889。鲁绣、京绣和蜀绣表现尤为突出,鲁绣的各项指标几乎达到最佳。汉绣、瓯绣和湘绣在各项指标上表现均衡,特别是汉绣的精度和AP较高,显示出较强的分类能力。而杭绣虽然精度较高,但是其召回率较低,表示模型可能遗漏了部分真正例。从整体来看,改进后的分类模型在大多数刺绣类别上能保持高识别精度和召回率。

3.分类结果可视化分析

图10展示了改进后的分类模型在不同刺绣类别上的混淆矩阵,图11展示了不同刺绣类别的P-R曲线。从图10的混淆矩阵可以看出,改进后的分类模型在大多数刺绣类别上的分类表现较好,特别是鲁绣,其主对角线上的值较高,表明这一类别的样本大部分被正确分类。然而,对于汴绣和湘绣,存在较明显的分类错误,其他类别的样本被误分类为这些类别的频率较高,说明模型在这两个类别上的区分能力有待提升。

图11的P-R曲线进一步展示了模型在不同阈值下的精度和召回率之间的权衡关系。曲线上每个点表示在对应召回率下的最大精度值,当P=R时对应的阈值点即为均衡点(Best Event Point,BEP),BEP越大,则说明模型对此类别的分类性能越好,即P-R曲线越靠近右上角。对于综合混淆矩阵和P-R曲线的分析,证明改进后的分类模型整体性能较好,能够较准确地分类大部分刺绣类别。对于鲁绣,模型的分类效果几乎没有误分类。尽管杭绣的P-R曲线明显低于其他类别,表明模型在识别杭绣时的效果不佳,但其精度较高,使得在目标检测过程中有较好的性能。改进后的模型在对刺绣图像的识别和分类的表现稳定且优异,这表明模型在处理大部分刺绣类别时已经达到了较高的精度和可靠性,展示了很强的泛化能力和鲁棒性,能够满足实际应用中的需求。

图10 混淆矩阵

图11 P-R曲线

t-分布随机邻域嵌入(t-Distributed Stochastic Neighbor Embedding,t-SNE)[29]是一种用于高维数据降维的非线性算法,特别适用于在二维或三维空间中可视化高维数据。由劳伦斯·范德马滕(Laurens van der Maaten)和杰弗里·辛顿(Geoffrey Hinton)于2008年提出,t-SNE通过将高维数据点嵌入到低维空间中,同时尽可能保持相似数据点的邻近关系,因而广泛用于数据可视化和探索性数据分析。t-SNE首先在高维空间中计算数据点之间的相似度。对于每对高维数据点i和j,t-SNE使用基于高斯分布的条件概率表示数据点j在给定数据点i的情况下作为邻居的概率,如公式(9)所示:

(9)

其中,是根据数据点i的局部密度自动调整的,k是所有数据点的索引(除去数据点i本身)。

在低维空间中,t-SNE使用类似的方法计算数据点基于学生氏t分布,yi和yj之间的相似度qij的关系如公式(10)所示:

(10)

其中,yk和yl表示降维后的数据点。t-SNE通过最小化高维空间和低维空间相似度分布之间的Kullback-Leibler散度[30],使得低维空间中的数据点配置尽可能反映高维空间中的邻近关系,实现高维数据的有效降维,从而成为数据科学和机器学习领域的常用工具之一。将YOLOv8模型的颈网络输出特征图作为输入,基于t-SNE算法进行高维数据降维,原始网络和改进后的网络的降维结果可视化如图12所示。

图12 t-SNE降维可视化

对于t-SNE降维结果,在理想情况下,同一类别的刺绣样本会聚集在一起,不同类别的刺绣样本应该形成相对清晰的簇,簇与簇之间有明显的间隙。由图12可知,使用原始YOLOv8模型对刺绣进行分类,降维结果表明模型对不同类别的刺绣在二维空间中有一定程度的分离,例如,汴绣和鲁绣有较为明显的聚集区,表明这些类别的样本特征较为一致。但图中存在一些不同类别之间的重叠,特别是在图的中央区域,湘绣和京绣的样本较为紧密地聚集在一起,表明这些类别内部的样本特征相对一致,原始YOLOv8模型没能有效提取到这些刺绣的独特特征,表明模型在区分这些类别时存在一定困难。而对于粤绣,其簇分布较为分散,表明该类别的样本特征差异较大,分类效果不理想。

改进后的YOLOv8模型进一步优化了特征提取部分,使得同一类别的特征更加一致,不同类别刺绣的特征更加可分离、类别分布更加集中、边界更加清晰,各个团簇之间的间距也更加合理,这将有利于模型区分不同类别的刺绣。对于部分类别的刺绣,如湘绣和京绣,在降维图像不同区域形成了多个相对独立的小团簇,表明这些类别的刺绣存在多种独特特征,其特征分布存在一定的异质性。改进后的模型从可视化角度权衡分类性能表现,分类效果更加理想,有助于提高模型对于不同类别刺绣的识别准确性和稳定性。这种优化使得模型更能够捕捉到刺绣类别之间的微妙差异,有效地区分湘绣和京绣等部分类别的刺绣,并且能够在降维图像中形成相对独立的小团簇,进一步凸显了这些类别之间的特征差异和异质性,从而提高了模型的泛化能力和分类精度。

(二)消融实验结果及分析

表5为消融实验结果,采用准确率、精度和F1值作为评价指标,并对使用不同数据集训练的结果进行比较。从表5可以看出,采用原始刺绣数据集的YOLOv8的准确率仅为52.02%,说明在少量刺绣样本的数据集下,YOLOv8对刺绣图像的分类效果较差。B和C都是对数据集的数据增强,从表中可以看出,当数据集采用刺绣增强数据集时,B较于A的准确率提高了30.02%,精度提高了62.2%,说明模型泛化能力增强。C是在B的基础上引入了刺绣增强均衡数据集,训练数据量显著增加了,模型的训练效果也进一步提升,准确率随之提高,达到了70.15%,增强了模型的稳定性。

D在YOLOv8中引入了InceptionNeXt模块,准确率为85.74%,相较于C,提高了22.22%,F1值为89.74%,提高了18.37%,说明模型提取了有效的特征,提高了分类准确率。E为YOLOv8中引入了GAM模块,准确率为84.88%,相较于C,提高了21%,F1值为89.17%,提高了17.62%,说明GAM模块通过关注全局信息和局部信息的交互,增强特征表达能力。F为本研究改进后的YOLOv8模型,在C的基础上,准确率、精度和F1值分别提高了28.91%、27.04%和19.71%。准确率达到最大值90.43%,比D和E分别提高了5.47%和6.54%。

表5 消融实验结果

(三)与其他网络对比实验分析

为了验证本研究改进后的YOLOv8模型的分类性能,本文选取LeNet[31]、AlexNet[32]、VGGNet[33]、ResNet[34]、Inception[35]和Xception[36]经典分类网络进行比较。以上6个网络均使用相同的网络参数和软硬件平台进行训练。表6为本研究改进后的YOLOv8模型和其他经典分类网络模型对十种刺绣分类的实验结果,粗体表示评估指标的最佳值。从表6中可以看出,本研究提出的方法在所有指标都达到了最优值,表明该模型对十种刺绣的分类表现出了优越的性能。

表6 与不同经典分类网络的对比结果

本研究选择刘净净等人改进的MLP网络[37]、周泽聿等人改进的Xception-TD网络[38]和刘羿漩等人改进的DenseNet网络[39]进行比较,比较结果如表7所示。可以看出,本研究提出的方法支持最多10种类型刺绣图像,且同时支持在线检测,除了准确率指标外,其余指标均达到最优值。

表7 与不同改进分类网络的对比结果

四、实验结果检测验证

(一)静态图片验证

随机从刺绣图像测试集中选取不同种类的刺绣图像作为验证样本,进行基于CAM(Class Activation Map,类激活映射)热力图的可解释性分析。CAM热力图是一种用于解释卷积神经网络决策过程的可视化技术,它通过突出输入图像中对最终分类结果最有贡献的区域,帮助研究者和用户理解模型在做出决策时关注的部分。[40]

首先将输入的刺绣图像通过神经网络中的多层卷积和池化操作,提取出包含不同区域空间信息和语义信息的高层次的特征图。在特征提取之后,通过全连接Softmax层进行处理,以输出每个刺绣类别的概率。同时在训练过程中进行权重映射,将每个特征图的权重wc与其对应的特征图进行加权求和,然后进行ReLU操作,其公式如下:

(11)

其中,fx(x,y)表示第k个特征图在位置(x,y)的值。最终生成一个与输入图像大小相同的CAM热力图,并将其与原始图像叠加,以直观地显示不同区域对最终分类决策贡献程度,不同随机刺绣样本检测结果及热力图如图13所示。

图13 静态图片检测结果及热力图

从图13中可以看出,改进后的模型在对杭绣进行分类时,主要关注作品中光滑的针脚和细致的纹理部分。杭绣针法以精细、柔和的细节处理著称,特别是对眼部线条和光影的处理,采用对口、走势、平金、吊角、提金、拨路、盘棕等二十余种技法,创作出的作品具有光泽、平整、顺滑、洁净、巧妙的特质。热力图中亮度最高的区域集中在猫眼周围,表明模型识别出这部分刺绣的细腻和顺滑之处,这与杭绣针法柔中带刚的特征相一致。针对汴绣的图样,模型的关注点集中在人物的服装和发饰部分,热力图高亮区域表明模型识别出蒙针和滚针绣律动、庄重的表形效果,这与汴绣针法精致细腻、稳静柔和的特点相吻合。鲁绣针法强调虚实结合,通过通镶拼、花边、小扣锁、绣花等技法,使不同针法和谐统一,作品层次清晰、色调淡雅,呈现出浮雕般的立体效果,给人以深邃而生动的视觉体验。针对鲁绣作品,模型特别关注了图案中层次分明、浮雕般的刺绣部分。热力图显示,模型对这些立体感强烈的部分给予了高度关注,这正是鲁绣通过虚实结合和不同针法的巧妙运用所体现出的特点。在京绣分类中,模型重点关注了作品中富有宫廷风格的金线和色彩鲜艳的图案。热力图的高亮部分集中在图像的边角处,覆盖了具有端庄质朴、绣线配色鲜艳而不俗的区域,这与京绣针法强调华贵典雅和“平金打籽”的特征相一致。

改进后的YOLOv8分类模型在四种刺绣图像上均能准确识别出对应的刺绣类型,能够正确地关注到刺绣图像中的典型区域,这些区域包含了刺绣的重要细节和特征,显示了其在特征提取和分类上的有效性。

(二)离线视频验证

刺绣视频是由一系列连续的图像组成,在进行视频分类检测时,通常会将视频数据拆解成单帧图片,并对单帧图片进行提取,转换成一系列静态图片,然后将静态图片输入到模型进行独立分类。由于视频的每一帧都会得到一个独立的分类结果,通常需要对这些结果进行整合,以获得最终的分类结果。本研究使用多数投票法对分类结果进行整合,[41]分别统计每种刺绣类别的出现频率,再整合所有帧的分类结果,实现对视频内容的准确分类。

视频测试集选取4段长度在13秒至28秒的刺绣展示片段,使用视频处理库OpenCV[42]将视频文件打开,并转化为RGB格式,输入到改进后的分类模型中,执行前向预测,并生成CAM热力图,结果如图14所示。

从图14中可以看出,在对湘绣视频的分类过程中,热力图显示模型主要关注熊猫的头部区域(左上)和梅花部分(右上)。这部分图像的针法异样,柔中带刚,粗中呈细,线隐针藏,体现了湘绣独有的全异绣和鬅毛针等针法的特点。针对蜀绣视频的分类,模型的关注点集中在山峦的边缘和顶部区域。热力图的高亮部分表明模型识别出这些区域所展示的晕针和掺针技法所形成的柔和渐变效果,这与蜀绣“针脚整齐、线片光亮、紧密柔和”的技艺特点相吻合。在粤绣视频的分类中,热力图显示模型的关注点主要在作品中表现物象肌理的部分,特别是凤凰羽毛的细节。这些区域展示了粤绣中的平针和乱底等针法,表现了复杂的肌理和图案设计,进一步凸显了粤绣在针法运用上的灵活性与独特性。所有四个刺绣视频的预测结果都与实际结果一致,进一步验证了改进后的YOLOv8模型在刺绣分类任务中的高准确性和可靠性,为刺绣视频分类提供了一种可靠的实现途径。

(三)在线验证

基于摄像头的在线分类技术可以实现对刺绣作品的实时检测和分类,自动采集和记录每件作品的分类信息,从而构建一个完整的刺绣数据库。这些数据可以用于后续的分析和研究,如优化生产工艺、改进设计方案和市场需求预测等。该实时检测系统主要由摄像头、图像处理单元、刺绣检测与分类算法、数据存储系统和用户界面组成。摄像头用于实时采集刺绣作品的图像数据,本研究选取海康威视的工业面阵相机,型号为MV-CU013-A0GC,以确保图像的细节清晰度和质量。图像处理单元负责对摄像头捕获的图像进行预处理,包括图像去噪、裁剪、尺寸调整和颜色校正等,通常配备GPU加速,以支持实时图像处理和深度学习模型的推理。刺绣分类算法使用本文改进的YOLOv8深度学习模型。数据存储系统负责存储每一件刺绣作品的分类信息和对应的图像数据。用户界面提供一个图形化界面,用于监控刺绣作品的检测和分类过程,用户可以实时查看分类结果、图像数据和统计信息。为提高资源使用效率,图像处理单元由个人计算机组成,搭载英特尔I5-12500H处理器和512GB固态硬盘,满足存储和算法运行的要求。

通过使用cv2库函数,调用生产线或非遗工坊的摄像头,实时捕捉每件刺绣作品的图像。将捕获的图像传输到图像处理单元,进行预处理,以确保图像质量适合后续的分类任务。预处理后的图像由刺绣分类算法进行特征提取,提取图像中的关键特征,再对提取的特征进行进一步分析,实现对刺绣作品的实时分类。最后,将分类结果连同图像数据一起存储到数据存储系统中,生成每件作品的唯一标识符和分类标签。本次选取10个不同种类的刺绣手工艺品(团扇、手帕、桌布和书签)共计16件,在不同角度下进行在线验证,所得到的评价指标如表8所示。

表8 不同种类刺绣在线验证评价指标

图14 离线视频检测结果

根据表8的结果,对每种刺绣作品进行6次验证后,平均置信度达到了0.9171,平均帧率为43.6FPS,超过了目标检测实时性要求的30FPS。这表明该系统不仅能够准确地识别刺绣作品,还能够在高于实时性要求的速度下进行处理。以苏绣团扇、汴绣团扇、湘绣手帕、鲁绣桌布和蜀绣书签为例,在不同角度下进行检测,检测结果如图15所示。从图15中可以看出,在不同种类、不同角度下的刺绣图像的置信度均高于0.865,改进后的分类模型可以精准检测出画面中出现的刺绣,并实时返回检测结果。

五、结论

本文基于改进的YOLOv8算法对刺绣图像进行分类,首先,基于DCGAN网络均衡刺绣图像数据集,解决小样本刺绣图像类别不均衡问题。其次,将YOLOv8的主干网络替换为InceptionNeXt模块,实现在不同尺度上提取特征,增强特征提取能力。再次,增加GAM模型作为过渡模块,在特征融合前对信息进行筛选,提升网络的特征融合能力。最后,使用改进后的网络模型对测试集进行实验,并使用图片、视频和摄像头进行离线和在线验证。

实验结果表明,改进后的算法在各个类别上分类性能表现出色,整体平均召回率为0.90434,平均准确率为0.90434,平均精度为0.91505,平均F1值为0.90751,平均AP达到0.96889。在对刺绣图像、视频和摄像头检测的识别和分类的表现稳定且优异,达到了较高的精度和可靠性,实现了较强的泛化能力和鲁棒性,能够满足实际应用中的需求。

图15 在线验证检测结果

未来的工作重点是收集更多刺绣图像,丰富不同种类刺绣数据集,让模型能够在更多样的样本上进行训练。研究使用更高效、轻量化的主干网络进行替换,来达到更高的分类精度和满足更高要求的实时性。同时将分类模型进行多端部署,开发满足桌面端、移动端(iOS和Android)和Web端的刺绣检测与分类系统,将实时分类技术与数字人文结合,有助于更好地保护和传承刺绣文化。通过数字化和系统化的管理,刺绣作品可以被详细记录和保存,为后续的文化研究和保护提供宝贵的数据支持。

将实时分类技术应用于传统刺绣行业,体现了现代技术与传统手工艺的跨领域融合与创新,不仅为传统手工艺注入了新的活力,促进了刺绣行业的现代化发展,同时也为计算机视觉和人工智能技术开辟了新的应用场景,推动了传统手工艺与现代技术的协同进步。

Research on Embroidery Dynamic Detection and Classification Based on Improved YOLOv8

Bao Yalin, Ji Guoxiu

Abstract: Aiming at the current detection and classification algorithms, which have problems such as few classification types, low accuracy rate, and inability to meet the real- time detection needs, the real-time classification technology is applied to the traditional embroidery industry to provide valuable algorithmic support for the research and protection of embroidery culture.To address these issues, this paper proposes improvements to the existing YOLOv8 algorithm.Firstly, a DCGAN network is employed to balance the embroidery image dataset, addressing the imbalance in small sample embroidery image categories. Secondly, the backbone network of YOLOv8 is replaced with the InceptionNeXt module, enabling feature extraction at different scales, enhancing the feature extraction capabilities. Additionally, the GAM model is introduced as a transition module to filter information before feature fusion, thereby improving the network’s feature fusion capabilities. Finally, the improved network model is tested on the test set, with experiments conducted using images, videos, and real-time validation via camera.Experimental results demonstrate that the improved model excels in classifying 10 types of embroidery, achieving an overall average accuracy of 0.9043 and an average precision of 0.9151. Compared with other classification and detection algorithms, the improved YOLOv8 model has obvious advantages, achieves high generalisation ability and robustness, and is able to meet the real-time demand in practical applications.

Keywords: Dynamic Detection; Embroidery Classification; YOLOv8; Real-Time Classification; Digital Humanities

编辑 | 臧杰

本文系辽宁省“兴辽英才计划”项目“新时代文化遗产保护、利用的新理念、新方法研究”(XLYC1904008)阶段性成果。

向上滑动 查看注释

[1]董馥伊:《传统栽绒毯单独纹样的特征检索与应用》,《装饰》2015年第12期。

[2]刘净净、郭飞、刘玉:《刺绣图片的计算机智能识别》,《电脑知识与技术》2012年第35期。

[3]Jia Rong et al., “Underwater Object Detection in Marine Ranching Based on Improved YOLOv8,”Journal of Marine Science and Engineering, vol. 12, no.1, 2024, p. 55.

[4]郑锐、钱文华、徐丹等:《基于卷积神经网络的刺绣风格数字合成》,《浙江大学学报(理学版)》2019年第3期。

[5]赵含笑:《基于深度学习的刺绣图像分类与识别研究》,硕士学位论文,青海师范大学,2020年。

[6]张贝:《青海刺绣纹样的边缘提取研究与应用》,硕士学位论文,青海师范大学,2021年。

[7]周泽聿、王昊、张小琴等:《基于Xception-TD的中华传统刺绣分类模型构建》,《数据分析与知识发现》2022年第Z1期。

[8]刘羿漩、齐振岭、董苗苗等:《基于改进DenseNet的刺绣图像分类识别的研究》,《计算机测量与控制》2023年第1期。

[9]李圆、陈志豪、张慧等:《基于深度学习的服装图案刺绣风格化设计探析》,《武汉纺织大学学报》2023年第5期。

[10]刘羿漩、葛广英、齐振岭等:《基于改进深度卷积生成对抗网络的刺绣图像修复》,《激光与光电子学进展》2023年第20期。

[11]Zhongyuan Guo, Hong Zheng, and Xiaohang Xu et al., “Quality Grading of Jujubes Using Composite Convolutional Neural Networks in Combination with RGB Color Space Segmentation and Deep Convolutional Generative Adversarial Networks,”Journal of Food Process Engineering, vol. 44, no. 2, 2021, pp.1-14.

[12]袁卫民、周凯峰、陈飞宇等:《数据不平衡下基于DCGAN和AMCNN的滑动轴承故障诊断方法》,《工业控制计算机》2023年第9期。

[13]郑慧怡、吴华煊、杜志强:《肠道宏基因组图像增强和深度学习改善代谢性疾病分类预测精度》,《遗传》2024年第10期。

[14]陈金荣、许燕、周建平等:《基于改进YOLOv5的红花目标检测算法研究》,《农机化研究》2025年第1期。

[15]王坤峰、苟超、段艳杰等:《生成式对抗网络GAN的研究进展与展望》,《自动化学报》2017年第3期。

[16]徐永士、贲可荣、王天雨等:《DCGAN模型改进与SAR图像生成研究》,《计算机科学》2020年第12期。

[17]Alec Radford, Luke Metz, Soumith Chintala, “Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks,”arXiv preprint, arXiv:1511.06434, 2015.

[18]Alex Krizhevsky, Ilya Sutskever, and Geoffrey Hinton, “ImageNet Classification with Deep Convolutional Neural Networks,” Communications of the ACM, vol. 60, no. 6, 2017, pp. 84-90.

[19]Siham Tabik, Daniel Peralta et al., “A Snapshot of Image Pre-Processing for Convolutional Neural Networks: Case Study of MNIST,” International Journal of Computational Intelligence Systems, vol.10, no. 1,2017, pp. 555-568.

[20]鲍亚林、唐戈:《基于AlexNet深度学习的刺绣图像分类研究》,《毛纺科技》2023年第6期。

[21]Sultan Daud Khan, Yasir Ali, Basim Zafar et al., “Robust Head Detection in Complex Videos Using Two-Stage Deep Convolution Framework,” IEEE Access, vol. 8, 2020, pp. 98679-98692.

[22]陈科圻、朱志亮、邓小明等:《多尺度目标检测的深度学习研究综述》,《软件学报》2021年第4期。

[23]Sohan Mupparaju, Sai Ram Thotakura, Rami Reddy et al., “A Review on YOLOv8 and Its Advancements,”International Conference on Data Intelligence and Cognitive Informatics, Springer, Singapore, 2024, pp. 529-545.

[24]Tiantian Su, Anan Liu, Yongran Shi et al., “IremulbNet: Rethinking the Inverted Residual Architecture for Image Recognition,” Neural Networks, vol.172, 2024, pp. 106-140.

[25]车万翔、窦志成、冯岩松等:《大模型时代的自然语言处理:挑战、机遇与发展》,《中国科学:信息科学》2023年第9期。

[26]Yichao Liu, Zongru Shao, Nico Hoffmann, “Global Attention Mechanism: Retain Information to Enhance Channel-Spatial Interactions,” arXiv preprint, arXiv:2112.05561, 2021.

[27]Petr Hurtik, Stefania Tomasiello, Jan Hula et al., “Binary Cross-Entropy with Dynamical Clipping,” Neural Computing and Applications, vol. 34, no. 14, 2022, pp. 12029-12041.

[28]T. Zhang, T. Zhu, K. Gao et al., “Balancing Learning Model Privacy, Fairness, and Accuracy with Early Stopping Criteria,” IEEE Transactions on Neural Networks and Learning Systems, vol. 34, no. 9, 2021, pp. 5557-5569.

[29]Matthew C. Cieslak, A. Castelfranco et al., “t-Distributed Stochastic Neighbor Embedding (t-SNE): A Tool for Eco-Physiological Transcriptomic Analysis,” Marine Genomics, vol.51, 2020.

[30]陈挺、李国鹏、王小梅:《基于t-SNE降维的科学基金资助项目可视化方法研究》,《数据分析与知识发现》2018年第8期。

[31]Yann LeCun, L. Bottou, Yoshua Bengio et al., “Gradient-Based Learning Applied to Document Recognition,” Proceedings of the IEEE, vol. 11, no. 86, 1998, pp. 2278-2324.

[32]Alex Krizhevsky, Ilya Sutskever, Geoffrey E. Hinton, “Imagenet Classification with Deep Convolutional Neural Networks,”Advances in Neural Information Processing Systems, 2012, p. 25.

[33]Karen Simonyan, Andrew Zisserman, “Very Deep Convolutional Networks for Large-Scale Image Recognition,” arXiv preprint, arXiv:1409.1556, 2014.

[34]Kaiming He, Xiangyu Zhang, Shaoqing Ren et al., “Deep Residual Learning for Image Recognition,”Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2016, pp.770-778.

[35]Christian Szegedy, Vincent Vanhoucke, Sergey Ioffe et al., “Rethinking the Inception Architecture for Computer Vision,”Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2016, pp. 2818-2826.

[36]François Chollet, “Xception: Deep Learning with Depthwise Separable Convolutions,”Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2017, pp. 1251-1258.

[37]刘净净、郭飞、刘玉:《刺绣图片的计算机智能识别》,《电脑知识与技术》2012年第35期。

[38]周泽聿、王昊、张小琴等:《基于Xception-TD的中华传统刺绣分类模型构建》,《数据分析与知识发现》2022年第Z1期。

[39]刘羿漩、葛广英、齐振岭等:《基于改进深度卷积生成对抗网络的刺绣图像修复》,《激光与光电子学进展》2023年第20期。

[40]窦慧、张凌茗、韩峰等:《卷积神经网络的可解释性研究综述》,《软件学报》2024年第1期。

[41]王爱丽、张宇枭、吴海滨等:《基于集成卷积神经网络的LiDAR数据分类》,《哈尔滨理工大学学报》2021年第4期。

[42]J. Yang, “Real-Time Object Tracking Using OpenCV,” 3rd International Conference on Data Science and Computer Application (ICDSCA), IEEE, 2023, pp. 1472-1475.

扫描下方二维码即可购买《数字人文》期刊

校对  |   肖爽

美编  |  王秀梅

数字使人文更新

投稿:https://szrw.cbpt.cnki.net

数字人文门户网站:www.dhcn.cn

阅读原文

跳转微信打开

课程介绍丨数据基础与人文数据结构化

2026年3月27日 17:31

2026-03-27 17:31 北京

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

零代码编程的科研教学与智慧课程建设专题培训班将于4月7日—17日在籍合学院平台举行。正式开课前,我们将按照授课次序,逐一发布每门课程详细介绍,以便各位学员做好学习准备。

本课程为零代码编程模块基础课,也是我们本次培训的第一讲。目标是帮助学员建立数据与数据结构的基础理论,这也是我们开启后续所有工作的理论基础。

数字人文的交叉,在于将计算机科学的结构化思维、海量数据处理能力与复杂计算模型引入人文研究领域。其中,知识的结构化是推动人文学科突破性进展的基石。知识的结构化数据处理并非简单地将人文材料(如古籍扫描、文物三维模型)存入计算机形成“机采数据”,其本质在于将蕴含复杂概念体系、事件关系和文化内涵的人文知识节点,转化为由清晰定义的概念节点及其间的有效关系构成的逻辑体系。

主讲人:李斌

南京师范大学文学院教授,语言大数据与计算人文研究中心负责人。主要从事计算语言学和数字人文领域的研究,特别集中于古汉语信息处理领域的古文断句、分词、词性标注、词义分析的标准制定、资源构建和自动分析等具体技术研发。研制多种语料库在国际LDC平台发布,出版专著《语言探秘》等3部,发表论文70多篇。主持完成国家社会科学基金项目2项、教育部社科青年项目1项。

*了解培训详情及报名请扫描本文海报二维码。

←了解我们正在进行的项目

籍合学院

中华书局旗下

古籍整理与传统文化学习平台

阅读原文

跳转微信打开

❌