报名开启 | 第四届语料库与数字人文暑期学院(2号通知)
戴俊阳 徐惠 2026-05-07 12:00 北京
![]()
暑校报名5月5日开始,5月15日截止,线上线下免费学习!
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
第四届语料库与
数字人文暑期学院
— 2号通知 —
![]()
CDHSUMMER2026
随着大数据与人工智能技术的发展,语言、文学、历史等人文研究都越来越多地引入了计算技术。人文学科与计算技术的交叉研究,关键在于基于语料库的人文大数据构建、计量和大语言模型的应用。
为推动计算语言学与数字人文的学科建设与人才培养,南京师范大学联合北师港浸大、澳门大学、香港科技大学、南京农业大学五校,于2026年7月25日-8月4日(共11天),通过线上线下结合的形式举办语料库与数字人文暑期学院,包括讲习班实训和讲座论坛两大部分。
![]()
01
报名链接
![]()
扫描上方二维码即可进行报名
02
各班概况
01
A班:数据库编程讲习班
以《全唐诗》为例,教习人文语料库构建技术与交互式检索网站开发方法,实现文史数据的结构化存储与动态展示。
主讲:李斌(南京师范大学)
设备要求:需准备16G内存以上的Windows 10/11笔记本电脑
详细课程大纲:
第一讲:课程简介与软件安装
第二讲:数据表的构建
第三讲:数据库的查询
第四讲:PHP程序设计
第五讲:字符编码
第六讲:字符串处理
第七讲:交互式网站搭建
第八讲:本地小模型优化
02
B班:语言统计方法讲习班
聚焦语料库计量分析,系统讲授基于SPSS的统计基础、参数检验、非参数检验、聚类分析、相关分析、卡方检验、多元线性回归及逻辑回归等核心方法,帮助学员掌握语言研究中的定量分析技能与统计报告生成能力。
主讲:沈威(华中师范大学)
设备要求:需准备安装有SPSS 27.0及以上版本的Windows/Mac笔记本电脑
详细课程大纲:
第一讲:统计基础与SPSS安装实操
第二讲:常见的参数检验
第三讲:常见的非参数检验
第四讲:聚类分析
第五讲:相关分析
第六讲:卡方检验
第七讲:多元线性回归
第八讲:逻辑回归
03
C班:大模型编程讲习班
掌握大语言模型基础原理与人文场景落地技术,能够独立开发面向文史研究的大模型应用。
主讲:王东波、刘浏(南京农业大学)
设备要求:需准备性能较好的Windows/Mac笔记本电脑(推荐16G以上内存)
详细课程大纲:
第一讲 大语言模型基础
第二讲 基础模型和推理模型
第三讲 提示工程
第四讲 继续预训练和监督微调
第五讲 强化学习
第六讲 大模型的部署
第七讲 检索增强生成
第八讲 AI Agents
招生要求:具备基础Python编程能力,对大语言模型有基础认知。
03
专家讲座与配套活动
01
系列讲座
邀请20位领域顶尖学者,开设20场讲座,覆盖理论前沿、技术方法与应用实践,每日上午线上线下同步直播。
特邀讲座和论坛嘉宾
新疆大学 冯志伟教授
澳门大学 袁毓林教授
香港理工大学 黄居仁教授
中国社科院民族所 龙从军研究员
中国社科院语言所 张永伟研究员
北京大学 苏祺研究员
北京大学 朱本军研究员
华中科技大学 唐旭日教授
同济大学 王昊奋教授
南京大学 黄书剑教授
南京农业大学 王东波教授
南京师范大学 李斌教授
北京师范大学 胡韧奋副教授
中国人民大学 卢达威副教授
北京语言大学 饶高琦副研究员
华中师范大学 沈威副教授
中国传媒大学 王璐璐副教授
江南大学 王萌副教授
(持续邀约中)
02
主题圆桌论坛
设置2场专题Panel,围绕「LLM时代人文学科的理论重构」「语言学与数字人文的未来」展开深度对话,开放学员提问与交流环节。
03
文化考察与学术研讨
每日下午安排南京及周边特色人文考察与分组学术研讨,线下学员可全程参与。
04
成果展示与颁奖
闭幕式设置优秀成果汇报环节,邀请专家现场点评,为优秀学员颁发证书。
04
招生与报名规则
01
招生规模
本次暑期学院计划录取线下学员120人,线上学员80-100人,总计不超过240人。其中主办五校(南师大、北师港浸大、澳大、香港科技大学、南农大)学员录取不超过 60 人,其他单位学员录取不超过 180 人。
02
面向对象
全国高校及科研院所数字人文、计算语言学、语料库语言学、中国语言文学、历史学、文献学、考古学、新闻传播学等相关学科的本科生、研究生,以及青年教师、科研人员。
03
分班报名要求
学员仅可选择1个平行讲习班进行报名,不可兼报,各班报名要求如下:
数据库编程讲习班:面向零基础或编程初学者,具备大学英语四级及以上水平即可报名,已具备计算机相关专业背景者请勿申请。
语言统计方法讲习班:具备基础的文本分析认知,对语料库计量分析有学习需求,已具备统计学/计算机专业背景者请勿申请。
Python大模型编程讲习班:具备基础的Python编程能力,对大语言模型有基础认知,尚未掌握人文场景大模型开发与应用技术,已具备计算机相关专业背景者请勿申请。
04
报名方式
报名时间:官方报名通道将于2026年5月5日正式开启,2026年5月15日截止报名,报名二维码及链接将在官方公众号同步发布。
报名材料:申请人需填写报名表单,并上传个人简历、研究基础与学习目标说明,主办方将根据报名材料进行择优录取。
录取通知:最终录取结果将于2026年6月1日前通过邮件及官方公众号推送,录取学员需签署上课承诺书,承诺全程参与课程学习、按时提交作业,报名成功后无特殊原因不得中途退课、不得更换报名班级。
05
结课与考核方式
本次暑期学院以独立完成的人文研究成果为核心考核目标,具体要求如下:
数据库编程讲习班:独立构建专属人文数据库与交互式检索网站。
语言统计方法讲习班:完成基于语料库的人文研究计量分析报告。
Python大模型编程讲习班:完成面向人文研究场景的大模型应用开发。
学员成果将在闭幕式进行集中汇报,邀请领域专家进行现场点评与指导;完成全部课程学习、通过成果考核的学员,将颁发暑期学院结业证书,优秀成果将授予优秀学员证书。
05
组织架构
(以下各项排名不分先后)
主办单位
南京师范大学文学院
联合主办单位
澳门大学人文学院
香港科技大学人文学部
北师香港浸会大学人文社科学院
南京农业大学信息管理学院
特约支持单位
中国社科院民族所民族语言文化行为实验室
协办组织/单位
中国民族语言学会语言资源与计算人文专委会
中国古籍保护协会古籍智能开发与利用专委会
中国人工智能学会语言智能专委会
江苏省人工智能学会自然语言处理专委会
江苏省修辞学会
数字人文专业发展联盟
浙江大学文学院
出版与媒体支持
科学出版社
高等教育出版社
中华书局古联公司
外语教学与研究出版社
南京大学出版社
南京师范大学出版社
汉语堂公众号
DH数字人文公众号
语言服务公众号
比特人文公众号
![]()
相关链接: