阅读视图
Evaluating and Understanding the Geocoding of City Directories of Paris (1787-1914): Data-Driven Geography of Urban Sprawl and Densification
Assemblies of Points: Strategies to Art-historical Human Pose Estimation and Retrieval
A Critical Collection History of Nineteenth-century Women’s Letters: Overcoming the Occluded Archive with Data-Driven Methods
Making Sense of the Emergence of Manslaughter in British Criminal Justice
Image Reuse in Eighteenth-Century Book History: Large-Scale Data-Driven Study of Headpiece Ornament Variants
社群沙龙 | 寒假线上读书会等你来,附时间和参与方式!
AI研究协作网络 2026-02-05 09:00 浙江
以下文章来源于:AI研究协作网络
AI研究协作网络AI Studies——面向AI前沿的科技、社会与人文跨学科研究的“无形学院”。
公众号后台发送 读书会 ,即可获得阅读文本!
点击蓝字
关注我们
线上读书会 寒假系列
主编寄语
@刘永谋
研究性读书非为博闻强记,而是要读出问题、观点和见识,读出新东西。
@段伟文
勇于不求甚解,善于发现捷径。
@杨庆峰
读书读自己,日久明我心。
@闫宏秀
细品研磨文本,静心潜研思想。以新带新,打造未来之路,成就美好学术。
2月8日
第1次
The Silicon Shrink: How Artificial Intelligence Made the World an Asylum
2月15日
第2次
The Political Philosophy of AI: An Introduction
2月24日
第3次
Narrative and Technology Ethics
3月1日
第4次
A Companion to Applied Philosophy of AI
1
2026年2月8日 19:00-21:00
腾讯会议:770-5414-7384
The Silicon Shrink: How Artificial Intelligence Made the World an Asylum
作者:Daniel Oberhaus
推荐指数:★★★★★
人工智能介入精神健康领域时暴露出一个根本问题:源于精神科学认识论缺陷的伦理风险。现代精神病学的诊断标准(DSM)在很大程度上建立在专家共识之上,而并非稳固的生物标志物基础之上。这一点在临床实践中或许可以被暂时容忍,但当这些本身就具有社会建构色彩的诊断标签,被当作客观无误的基准真相输入人工智能系统时,问题便被放大了。本书以“算法疯人院”(Algorithmic Asylum)的隐喻,指向一个更日常、也更隐蔽的伦理风险:我们的悲伤、焦虑乃至个性差异,将在大规模算法筛查中被不断压缩进病理化的框架之中,进而我们每个人都有可能被算法界定为某种特定类型的精神病患。也正因如此,真正值得警惕的,或许并非这些系统是否会偶尔出错造成误判和漏判,而是当它们以诊断和治疗为名将精神疾病操作化、制度化和自动化之后,我们是否仍然保有拒绝其判断、逃离其分类逻辑的现实可能性。
领读人
杨雨
复旦大学
青年研究员
李曈
首都医科大学
副教授
刘颖
中国科学院
助理研究员
2
2026年2月15日 19:00-21:00
腾讯会议:770-5414-7384
人工智能政治哲学
作者:Mark Coeckelbergh
推荐指数:★★★★★
人工智能不只是一种技术,更是一种政治。《人工智能政治哲学》从当代政治哲学的具体主题切入讨论人工智能政治,包括自由、操纵、剥削和奴役;平等、公正、种族主义、性别歧视和其他形式的偏见与歧视;民主、专业知识、参与和极权主义;权力、规训、监控和自我建构;与后人类主义和超人类主义相关的动物、环境和气候变化等由此勾勒出人工智能政治哲学的思考框架。如果我们想要解决21世纪全球和地区最紧迫的这些问题,就必须在思考政治和思考技术之间建立对话,并追问:我们需要什么样的政治技术来塑造未来?
领读人
谭泰成
北京建筑大学
讲师
李尉博
中国社会科学院
助理研究员
董屹泽
南京师范大学
博士生
3
2026年2月24日 19:00-21:00
腾讯会议:770-5414-7384
Narrative and Technology Ethics
作者:Wessel Reijers
Mark Coeckelbergh
推荐指数:★★★★★
本书提出,技术与文本、小说和电影类似,都在“讲述故事”,并由此构建了我们在数字时代的生活世界。技术对我们生活体验的影响正不断增强:机器人技术的创新挑战着工作的本质,新兴的生物技术影响着我们的自我认知,而基于区块链的智能合约则深刻改变着人际关系。在探究这些技术的意义时,赖耶斯和科克尔伯格以保罗·利科的哲学诠释学为基础,构建了一种全新的、叙事性的技术哲学与伦理研究方法。作者带领读者踏上一段旅程:从对实践哲学的探讨出发,经由借鉴麦金太尔、海德格尔和利科思想的诠释学技术实践概念,再到瓦洛尔的美德伦理以及利科的伦理目标,最终构建出一种能够指导研究与创新领域伦理实践的方法。通过创立引人入胜的技术诠释学伦理,本书为研究者将伦理融入日常技术实践提供了一个具体框架。
领读人
李洋
上海交通大学
博士生
杨映瑜
上海交通大学
博士生
周明妹
上海交通大学
博士生
4
2026年3月1日 19:00-21:00
腾讯会议:770-5414-7384
A Companion to
Applied Philosophy of AI
作者:Martin Hähnel
Regina Müller
推荐指数:★★★★★
在人工智能加速嵌入治理、医疗、教育与法律等关键制度场域的当下,许多争论早已不再是“技术是否可行”,而是“何种社会秩序正在被重写”。该书以“应用哲学”作为方法论支点,将人工智能置于认识论、伦理学、社会政治哲学与法哲学的交叉视域中,系统梳理从知识与不透明性、偏见与认识不正义,到信任、责任缺口、基本权利、全球治理与“AI人格”等核心议题。它既追问AI如何改变我们理解自我、行动与责任的方式,也直面算法化制度对公共正当性、权力结构与民主控制的持续压力;通过多学科作者群的分工与对话,为读者提供一套可用于分析现实政策与制度设计的概念工具箱,从而把“AI伦理”从零散的规范宣言推进为可辩护、可落地的哲学论证框架。
领读人
罗菲
上海交通大学
博士生
褚星妤
上海交通大学
硕士生
邱宇姗
中国人民大学
硕士生
读书会持续招募中!无论您是深耕 AI 领域的科学家和工程师,还是人文社会科学研究者,如果您也想成为领读人,或者想要推荐相关书籍,欢迎扫描以下二维码告诉我们。
读书会是AI研究协作网络系列沙龙活动之一。AI正在重构世界,为了促进AI Studies以及锚定智能时代的核心议题,我们将精选兼具深度与可读性的书籍,既有拆解 AI 技术原理的学术力作,也有探讨智能社会的通俗佳作,让不同背景的读者能轻松入局。 读书会主要由青年学者、硕士博士研究生领读,主编与编委也会不定期空降分享。领读人和读本一般通过招募形式确定。期待与您共同思考智能时代的“大问题”和“小问题”!
排版设计:谭泰成
责任编辑:王春丽
点击关注,后台发送 读书会 ,获取阅读文本!
仅用于 学术交流 ,无商业用途。如有侵权,联系删除!
新著 | 刘洋《文学计算导论》
刘洋 2026-02-05 17:00 江西
以下文章来源于:四十二史
四十二史本公号致力于推介高水平科幻学术论著和前沿研究,并发布科幻文艺批评、世界科幻动态、社团活动消息。
四十二史
科幻春秋
《文学计算导论》
内容简介
《文学计算导论》是一部深入探讨文学作品量化分析方法的专著。它系统介绍了文学计算这一领域,从 19 世纪的手工文本统计分析到数字时代利用计算机技术的系统研究方法,不仅回顾了历史渊源,还探讨了如何通过数学模型、特征量建构、数字细读等方法解析文学作品,以揭示其内在的隐藏结构和普遍规律。全书覆盖了作者归属与风格分析、人物关系网络、计量叙事研究、文学文本的情感计算、文本分形结构分析及最新的人工智能技术在文学研究中的应用等多个方面,全面展示了文学计算这一前沿的跨学科领域的发展现状和未来潜力。
本书适合数字人文、文学、语言学、自然语言处理、复杂系统等领域的研究者以及对文学计算感兴趣的研究生和本科生阅读。
作者简介
刘洋,知名科幻作家,物理学博士,重庆大学人文社科高等研究院研究员,中文系副教授,创意写作基地副主任。在国内外发表科幻作品200万余字,出版短篇小说集4部,长篇小说3部,部分被翻译为英语、德语等在国外出版,6次获得全球华语科幻星云奖。主要研究方向为数字人文、创意写作,主持国家自然科学基金与国家社会科学基金项目各一项,在各类核心期刊发表论文20余篇,出版著作《科幻创作》《科幻创作的未来版图》等。
绪论
文学计算(Literary Computing),即通过计量的方式进行文学作品的挖掘、分析、比较和批评,是当前方兴未艾的数字人文潮流的一个重要组成部分,但其传统和源流又远远早于数字人文这一概念所通常涵盖的时间范围。在19世纪末,欧洲和美国的一些科学家就已经尝试通过量化的方式,对文学作品进行分析,这可以看作是最早期的文学计算研究。显然,这一领域属于典型的跨学科研究,对文本的数字化和特定要素的读取涉及信息科学,对数据的计算涉及统计学,对数据中隐藏模式和结构的提取涉及物理学,对作品中角色或创作者的性格、精神的量化分析涉及心理学,对文本中地理分布和变迁路径的提取和可视化呈现涉及地理学,等等。
从事过句长研究的统计学家乌德尼·尤尔
跨学科研究固然是令人兴奋的,因为它打破学科的边界,通过新的视角和范式来处理既有的问题,往往能带来新的洞见,但也带来了新的困惑、怀疑和批评。特别是那些尝试在人文学科与自然学科之间架设有效联系和方法论桥梁的努力,尤其容易遭受各方的质疑。正如查尔斯·珀西·斯诺在《两种文化与科学革命》的演讲中提到的那样,科学与人文之间“存在互不理解的鸿沟”。作为一名科学家与作家,斯诺常常白天和科学家同事们一起工作,晚上则又和文学家朋友们聚在一起,因此他深刻地体会到在当时的社会环境中,文学家和科学家之间的互不理解甚至是厌恶、敌意。我非常理解斯诺的这种感受,因为我本身是做物理研究出身的,在我学术生涯的初期,我主要从事凝聚态物理学研究。与此同时,在读研究生的时候,我就开始创作科幻小说,并一直持续至今。也正因为我对科幻小说的喜爱,后来,我从理学院转到人文学院,开始接触到更多人文学者和文学理论。我发现,斯诺所说的鸿沟,在今天并没有弥合,因为两类学者的基本学术素养、关心的问题和研究的范式都截然不同。但与斯诺所说不同的是,今天的两类学者之间似乎并没有太多敌意了,因为随着人文学科在话语权利结构中的整体收缩,两者连产生敌意的基础都已经失去了。
查尔斯·珀西·斯诺
事实上,在文学与自然科学的交融进程中,我们可以大致区分出两种学科跨越的方向,每一种都引起了众多争议。一种是将自然科学的概念引入文学理论中,但抛弃了其数学上的复杂结构,而是仅将其作为一种类比物,以帮助阐明某种特定的理念、结构和关系。例如,当丹尼尔·奥尔布赖特使用“波浪美学”分析叶芝的诗歌时,他只是借用量子力学中微粒和波之间的模糊关系,阐释某些诗歌文本所具有的特征,比如内部边界的丧失、主客体与主体间界限的丧失等。他并不是说,诗歌的内部结构与波具有数学上的同构性,因此,自然也不能将涉及波的一系列数学公式套用到诗歌结构分析之中。显然,这类学科跨越的方式通常由人文学者发起。在后现代文化理论中,我们还可以找到很多这样的例子,比如让-弗朗索瓦·利奥塔对不确定性原理的借用、让·鲍德里亚对熵的借用、雅克·拉康对拓扑学概念的借用,等等。这种做法在自然科学界引起了一些不满,比如物理学教授艾伦·索卡尔及其合著者在一本书中就批评道:“自然科学并非仅是可供人文科学随时取用的隐喻库。”
艾伦·索卡尔、让·布里克蒙:《时髦的空话》
另一种跨越方式则是由自然科学家主动发起。他们将原本属于自然科学的研究范式引入文学研究领域,发展出实证的、量化的文学研究。这个过程中有时候也会借用一些科学概念,比如信息熵、温度等,但这类借用并不只是将概念作为某种隐喻,而是伴随着其数学结构的引入。比如,对文学文本的信息熵的计算,使用的正是香农给出的公式,而当我们讨论文本的温度时,其背后的机制也正是热力学中的麦克斯韦-玻尔兹曼分布。在20世纪后半叶,随着计算机的出现和自然语言处理算法的发展,对文本的读取、数值统计和数学建模变得更为方便,这类量化研究就逐渐变得流行起来。本书所涉及的内容大部分即是这一类的研究。为了与文学史考证等实证型研究相区别,我们统一将其称为文学计算。
麦克斯韦-玻尔兹曼分布
对文学计算的批评主要来自人文学界,他们的意见大致可以分为三类:其一,文学文本来自具有主观性的人类,其中并不具有如物理学那样的客观规律;其二,量化研究只是复现了一些我们早已经知晓的结论,并没有提出和解决有意义的文学问题;其三,大部分文学计算研究只是基于词频的模式分析,其数据不足以支撑它所声称的结论,或者说,文学文本和文学概念在计算过程中被简单化了。
对于第一类批评,已经有大量的研究结果可以作为反驳的案例。从齐普夫定律到最近基于情感计算的文本叙事模式划分,大量的研究都显示,在看似随机和主观的文本中,的确存在着某些客观的规律。这一点很好理解,因为作家的写作过程并非完全自由,他会受到诸多客观条件的限制:正确的语法、叙事的惯例、词汇的有限性,等等。它们就像一个封闭的箱子一样,将大量的随机运动的分子约束在一起,虽然每个分子的运动轨迹是很难预测的,但作为一个整体,这个体系却呈现出很多可以量化的特征,比如压强、温度、平均自由程、动能分布函数等。
关于词频分布的齐普夫定律
第二类和第三类批评事实上指出了当前文学计算研究应该努力的方向。也就是说,多做探索性而非验证性的工作,而且尽量超出词频、句长等简单指标,对高层次文学概念进行更精细的数学建模,以处理真正的文学问题。当然,要进行探索性的工作,通常就需要处理新的概念和新的问题,自然也就需要进行复杂特征量的建构。所以,从某种程度上来讲,这两个问题是一体的。
必须承认,在高层次文学概念和可计量的特征量之间建立稳定而有效的连接并不容易,但也绝不是不可能完成的任务。例如,在本书的第四章,我提出了一种对叙事节奏进行量化表征的方法。在文学计算领域,叙事研究一直相对匮乏。因为叙事研究中的要素难以量化,带有强烈的主观性,所以比其他文本特征更难处理。例如,研究文体风格、人物关系网络、情感分析等可以分别通过词频统计、对话关系、情感词典等手段实现量化,但叙事风格、手法、场景等要素的界定方式则极为模糊。在传统的叙事学研究中,通常需要根据叙事场景的切换,将文本划分为不同的叙事单元,这种工作通常只有具备较高文学素养的专业人员才能完成,因为叙事场景之间或许并不存在天然的分割线,要让计算机准确分辨是十分困难的。但是,基于叙述的两种形式——展示和告知——来体现出叙事节奏的特征,可以绕开场景划分的障碍。具体来说,我设计了一种算法,可以将这两种叙述形式进行自动识别,从而得到了一条叙述形式的时间序列。基于这个时间序列,通过傅里叶变换等数学手段,就可以从中提取出与叙事节奏相对应的特征量。
经傅里叶变换后的叙事节奏谱
比起自然科学领域的概念,比如温度、动量等,文学概念的量化不仅更难以处理,而且这些可计量的特征量与传统的文学概念在匹配时往往具有与自然科学概念不同的三种特性。其一,非精确性,也就是说两者并不是精确契合的。比如我之前提到的对叙事节奏进行量化的特征量,其本质上来源于从叙述形式时序数据中提取出的频谱峰。虽然其与叙事节奏具有较强的关联,但这毕竟只是一个间接的匹配方案。此外,实际的频谱图通常是一个连续谱,其中的峰值可能并不显著,呈现出一个平台状结构,这也会影响到对峰值数据的提取。所以,从概念到数据,这中间其实经过了多次近似过程。其二,非唯一性,也就是说用于表征某个文学概念的特征量并非只有一种形式。比如对于“词汇丰富度”这个概念,用以表征它的特征量就有数十种之多,从最简单的型-例比,到特征量K,乃至文本的信息熵,等等。其三,非普适性,也就是说这些特征量并不是在任何情况下都适用的。比如我们刚才提到的特征量K和信息熵,在表征词汇丰富度时,它们都具有一个难以克服的缺陷,即对雷同文本的不敏感。如果我们将同一段文字重复一遍合并成新的文本,那么根据两者的计算公式,其计算结果和单一文本是完全相同的,而这显然是不合理的。这意味着,对于具有较多雷同片段的文本来说,用特征量K和信息熵来作为词汇丰富度的指标是不合适的。
弗兰科·莫莱蒂:《远读》
在人工智能算法迅速发展的今天,我们越来越强烈地感到,文学计算研究不仅是可行的,而且是必要的。这种必要性至少体现在两个方面。其一,传统的文学细读方法无法处理当前迅速涌现的巨量文学文本。除了由传统出版社出版的纸质书籍,还有数量远超前者的网络文学作品——其每部作品的文本长度也几乎比前者大一个数量级。其二,人工智能文本生成正在逐渐进入人们的生活,其在大部分制式文章的写作上都取得了较好的效果,但在文学创作领域仍然很不成熟。从已有的一些基于大语言模型的小说写作实验来看,其主要缺陷可以归纳为一点,就是缺少“文学性”。比如,它的叙事节奏很不稳定,在很多不重要的细节上花费大量笔墨,而在关键情节上却一笔带过;它的比喻和描写都极为平庸,没有新奇性和创造性;它的人物缺少鲜明的个性和深刻的行为动机;故事情节的套路化痕迹极为明显;等等。克服上述这些缺陷的方法,就是加入一个文学插件,或者定制专业的文学创作大模型。想要向计算机系统传达何谓“文学性”,自然需要采用计算机的语言——也就是数字化的、量化的表述,这正是文学计算研究所要做的。当我们能用量化的方式对比喻、隐喻、风格化的描写、叙事节奏等文学概念进行表征以后,它们就可以作为一些重要的控制指标参与到文本生成算法之中,帮助其增强生成内容的文学性。
然而,即使在当前这个普遍数字化的时代,进行文学计算研究的困难仍然是巨大的。除了来自领域本身的巨大挑战,教育体系、学科壁垒等社会层面的客观障碍也不容忽视。从高中开始的文理分科,一直到大学和研究生期间的专业教育,都与文学计算研究所需要的跨度极大的知识结构相违背。而很多大学和研究机构在行政和科研上的简单粗糙的学科化管理,也让跨学科研究变成一件吃力不讨好的事情。因此,虽然口头上不断喊出跨学科的口号,但实际上却形塑出了一种不鼓励跨学科研究的氛围。如何在学生培养和制度管理上克服这些障碍,是当前发展文学计算这类跨学科领域所必须思考的问题。
事实上,打破专业和学科的界限,不仅是文学计算的需要,也是当今众多跨学科研究和前沿领域发展的需要。希望本书可以在跨学科研究的方法和路径上为各领域的研究者提供一些有益的参考。
图片来源网络,如有侵权,请联系删除
责任编辑:黄艺宸
您可能还想看
四十二史
宇宙的未来/现在/过去
长按二维码关注
DARIAH Working Groups Funding Call 2026-2027: Meet the winning projects
In September 2025, DARIAH launched the fifth Working Groups (WG) Funding Scheme Call for the years 2026-2027. This scheme is dedicated to – and open only for – the DARIAH Working Groups, and is intended to support their activities, small-scale projects and innovative ideas to be put forward, implemented, or sustained.
In this call, which was launched in September and was closed in mid November 2025, we received 8 applications overall. The evaluation of these applications was carried out by two reviewers for each proposal, concluding to a reviewers’ meeting in which the winning proposals were agreed among the whole evaluation committee as well as the Board of Directors.
This year, DARIAH awarded 7 WGs with funding to explore innovative ideas, build up their expertise or sustain existing tools and services, dedicating an overall budget of €40.000 to the call.
The winning projects:
- Performing Arts: Structuring Semantic Knowledge for the Digital Age – Theatralia WG
This project builds on the previous two project phases which advanced the digital structuring of research in
the Performing Arts. The first (2021–2023) established a state-of-the-art overview and identified the need for a shared, computerized descriptive language to support digital knowledge exchange and enhance scholarly value in the field. The second phase (2024–2025) began developing such a model, resulting in two open-access tools: a Dublin Core-based descriptive model for Performing-Arts archives and a multilingual prototype thesaurus (Version 1) created with OpenTheso (an open-source vocabulary management tool).
This third phase aims to deepen this work by expanding the thesaurus and improving its accessibility. Although Version 1 comprises about one hundred curated English terms, the underlying corpus contains roughly 1,400 multilingual concepts. Phase 3 will involve reviewing, refining, and translating these concepts, with the goal of producing a configured Version 2 containing approximately 250 terms across multiple languages. In parallel, the WG will explore integrating the thesaurus into a user-friendly digital interface, potentially through collaboration with the Croatian DARIAH-HR platform tezaurus.hr, while examining how it may interoperate with the Dublin Core for Performing Arts (a metadata standard for describing cultural-heritage resources).
- Research Data Management Tools and Strategies for Language Diversity – Research Data Management + Multilingual DH WGs
This joint project aims to organise a two full-day workshop on “Research Data Management Tools and Strategies for Language Diversity”. The workshop will bring together researchers in multilingualism, data stewards and educational designers, who will create one to three textual Open Educational Resources (OERs), either as guidelines or case-studies, to be published on DARIAH-Campus. This project aims to explore how linguistically diverse, crosslingual data can be combined with datasheets, data papers, data management plan wizards and semantic artefacts, and how the latter facilitate multilingual data sharing and reuse in digital humanities communities. These OERs will also address CARE principles (Collective Benefit, Authority to Control, Responsibility, Ethics), as well as inclusiveness and minority representation.
- Connecting the Collections: A Roadmap for Interoperable Music Linked Data – Artificial Intelligence and Music WG
“Connecting the Collections” is an intensive, Dagstuhl-style seminar designed to strategically relaunch the Artificial
Intelligence and Music (AIM) Working Group. It addresses the critical fragmentation of digital music resources where, despite AI advancements, the field remains hampered by isolated data silos and poor reuse of semantic models. To overcome these barriers, this project convenes a multidisciplinary group of leading experts from the UK, Netherlands, Spain, Norway, Italy, and France for a 3-day participatory workshop dedicated to creating interoperable data ecosystems and promoting the ethical reuse of standards.
The seminar will adopt a co-creation methodology, dissecting four diverse use cases ranging from managing music
archives to large-scale audio analysis. Through structured requirement engineering sessions and roundtable discussions, participants will critically evaluate existing music ontologies and identify specific gaps in implementing FAIR (Findable, Accessible, Interoperable, Reusable) principles. We will move beyond speculative discussion to draft practical solutions for connecting disparate musical assets via Knowledge Graphs and Semantic Web technologies.
- Workflows for feminist data-linking – Women Writers in History WG
A major issue hampering scholarship on historical women authors, publishers and readers, has been the lack of
standardized identifiers allowing researchers to manipulate and link data, thereby overcoming current digital data silos. This project will theorize and redress this data imbalance by carrying out a pilot to create standardized identifiers for 100-200 historical women who lack them, currently rendering them digitally near-invisible and unfindable.
Starting with a reflection on the current state of the datascape, the WG will identify gaps and patterns in coverage, critically testing different kinds of identifiers for usability and adaptability, and formulating a series of best practices. Collaboration with the DHwiki and BiblioData WGs will be crucial at this stage of the project. The pilot’s starting-point will be data in four databases built or managed by WG project members, RECIRC (Reception and Circulation of Early Modern Women’s Writing, 1550-1700), SHEWROTE (Studying Historical Early Women’s Reception: Oeuvres, Texts, Engagements), Texts on the Move and Electronic Enlightenment, which we will comprehensively survey as a first step towards our long-term goal of linking data across datasets, creating a data ecosystem of interoperable databases focusing fully or partly on historical women authors, publishers and readers. In doing so, we will adopt a mixed approach, creating identifiers using a variety of resources, including Wikidata, the CERL (Consortium of European Research Libraries) Thesaurus, and VIAF. These experiences will form the basis for a white paper to be submitted to Transformations and a workflow for feminist data linking for the SSH Open Marketplace.
- BIBTRAIN, Bibliographical Data Training Materials – BiblioData WG
The Bibliodata WG aims to create a set of training materials to help students and practitioners understand how to retrieve, process, and analyse bibliographical data for curatorial and scientific purposes, as well as how to work with specific bibliodata-related tools (such as the AVOBMAT tool for bibliodata analysis, QA Catalogue for metadata quality assessment, OpenCitations toolings, etc). With respect to the individual capacities and expertise of WG members, the materials will cover both general issues related to work with bibliographical data (such as data cleaning, data harmonisation, etc.) and more specific tasks introducing the use of particular software tools, datasets, and workflows. All materials will be made publicly available via DARIAH-Campus.
The BIBTRAIN materials will build on the previous activities of the BDWG, particularly on the findings of the Bibliodata Landscape Analysis Report and the Open Bibliodata project (DARIAH Theme 2022–2024), within which a set of six bibliodata-related workflows was developed and made publicly available via the SSH Open Marketplace. The ambition of the project is to foster and broaden the community of bibliodata curators and researchers by delivering innovative and practical training materials to the interested audience, reflecting the latest development and methodological approaches in the field.
- Bringing together initiatives on new standards and metadata for visual data – Visual Media & Interactivity WG
The Visual Media and Interactivity DARIAH WG brings together researchers interested in the use and development of methods, tools, infrastructures, and workflows for creating, storing, archiving, annotating, and sharing visual, audiovisual, and 3D content. For the period 2026-2027, the WG is focusing on enhancing the community within DARIAH and scoping opportunities towards the adoption of common platforms, standards and formats through the organisation of a series of online meetings and four face to face workshops to map existing efforts and develop a roadmap for the community.
All researchers exploring visual media corpora in the various disciplines of the humanities and social sciences, and wishing to share their methods, challenges and research outputs, are welcome to join this effort!
- Standardizing and diversifying OER workflows: Templates and best practices – #dariahTeach WG
Open Educational Resources (OER) are vital for accessible, high-quality education and central to the #dariahTeach WG. However, diverse formats and embedded external content often create barriers to reuse and interoperability. This project will organise a hands-on workshop with OER creators from across Europe to co-develop a reusable Markdown (MD) template for DARIAH-Campus. This template will enable smoother offline content creation and include best practices for migrating content from other formats.
Participants will bring case studies from their own work, ensuring the workflow meets actual needs and aligns with the EU’s new skills agenda. We will address aspects of accessibility, including multilinguality, decolonization of concepts and wording, and inclusivity for both contributors and users. We will test the integration of typical DH OER functionalities into the MD template and explore options for collaborative case studies. The template will incorporate insights from other OER formats using Markdown, such as TeachBooks, and will be informed by the #dariahTeach Social Justice Course as a model for a new design framework.
By standardizing DARIAH OER creation and conversion, we aim to:
* reduce technical hurdles for educators and researchers,
* foster collaboration across European institutions,
* and ensure that future DARIAH-Campus resources are consistent, accessible, and reusable.
This funding scheme will run from January 2026 until end of March 2027. The funded projects will be invited to present their project results during the DARIAH Annual Event 2027. Keep an eye on our news section as we will be posting more information on their development.
Fertig – vorerst. Unfertigkeit als epistemischer Wert in den digitalen Geisteswissenschaften
Café con Sofía Rodríguez. 10 de febrero de 2026
Café con Sofía Rodríguez
Arqueología en redes: la experiencia de la Asociación Científico-Cultural Zamora Protohistórica
10 de febrero de 2025 – 19:00 (GMT+1)

Sofía Rodríguez
Asociación Científico-Cultural Zamora Protohistórica
Resumen de la intervención
El objetivo de esta charla es reflexionar sobre el papel de las redes sociales en la divulgación del trabajo arqueológico desarrollado por asociaciones culturales. A partir de la experiencia de la Asociación Científico-Cultural Zamora Protohistórica, se abordarán las labores de digitalización y difusión de material arqueológico, la elaboración de contenidos divulgativos sobre la historiografía de los yacimientos de El Castrico y el Castro de La Encarnación —trabajados por la asociación desde 2017— y la creación de formatos audiovisuales adaptados a redes sociales. Asimismo, se prestará atención a la visibilización del trabajo de investigadoras y arqueólogas, al desarrollo de iniciativas como el Museo Virtual de Patrimonio Zamorano y a otras actividades de divulgación realizadas en el propio municipio de Rabanales, como la Ruta de las Estelas o las jornadas de puertas abiertas al final de cada campaña. Finalmente, se subrayará la importancia del apoyo institucional del Ayuntamiento de Rabanales y de la Diputación de Zamora, tanto en la organización de estas actividades como en la difusión en redes sociales, fundamental para que los contenidos lleguen a la población local.
Biografía
Enlace al proyecto
El proyecto Proyecto Castrum Zoelarum: En Busca de los Orígenes (Castrum Zoelarum Digital) de la Asociación Científico-Cultural Zamora Protohistórica fue ganador del premio de la HDH a Mejor iniciativa de comunicación, divulgación y/o difusión en medios sociales en 2023.
Más información sobre el proyecto en: https://zamoraprotohistorica.jimdoweb.com/castrum-zoelarum/
La entrada Café con Sofía Rodríguez. 10 de febrero de 2026 se publicó primero en HDH - Humanidades Digitales Hispánicas.
EADH: Estensione scadenza invio proposte
Siamo lieti di comunicare che il termine ultimo per l’invio di contributi per la conferenza 2026 di EADH (European Association for Digital Humanities) è stato prorogato al 27 febbraio 2026.
La conferenza si terrà dal 15 al 19 settembre 2026 presso la Jagiellonian University di Cracovia (Polonia), ed è co-organizzata dal Jagiellonian Centre of Digital Humanities, dall’Institute of Polish Language of the Polish Academy of Sciences e dall’Università di Breslavia.
Il tema è “Linking Europe: Digital Humanities Without Borders” e il nuovo termine per l’invio è fissato alle 23:59 di venerdì 27 febbraio 2026.
Il bando completo e altre informazioni sono disponibili qui:https://eadh2026.confer.uj.edu.pl/cfp
Le proposte possono essere inviate tramite ConfTool:
https://www.conftool.net/eadh2026/index.php
L'articolo EADH: Estensione scadenza invio proposte proviene da AIUCD.
李宇明:语言学应努力为社会提供语言红利
徐惠 2026-02-04 17:05 江西
李宇明文回顾语言学贡献与成果,展望数智时代使命,提学科优化以增语言红利。
本文转载自:今日语言学
语言学应努力为社会提供语言红利
李宇明李宇明
《中国语文》2026年全新改版,李宇明教授大作作为第一期首篇文章,系统总结新中国成立以来中国语言学经世致用的巨大成就,为新时代学科建设和创新发展鼓与呼。
——《中国语文》总编王锋
提要:本文把语言学作为研究对象,提出语言学的根本任务就是帮助解决社会发展中语言问题的主张,遵循“从语言生活中来,到语言生活中去”的研究范式,在语言生活中寻找学术靶点,并把学术成果用于解决语言生活问题,满足语言生活需求,推动语言生活进步,从而促进社会进步。文章回顾了1949年以来语言学在语言统一、语言文字现代化、语言国情把控、语言教育等四个方面为中国社会发展做出的重要贡献,总结了最近二十年来语言生活研究在八个方面所取得的成效,展望了数智社会中语言学在语言数据研究、机器语言智能测试与解释、语言智能产品应用、语言职业新格局、数智时代语言生活言说等方面的新使命。新使命需要学科优化,语言学应打破当前以语文学为基础、以语种和语言结构为基本框架的学科设置,加强学科内外沟通和学科交叉发展,重视语言学共同体的建设。通过学科优化提升语言学的学科地位,扩大语言学在学科间的学术穿透力和对社会的影响力,让语言学为国家、为人民提供更多的语言红利,包括社会红利和经济红利。
关键词:语言学 学科建设 语言生活 学术共同体 语言红利
中国古代语文学为社会发展做出过巨大贡献,如《说文解字》《切韵》《干禄字书》《康熙字典》等历代的字书韵书,奠定了传统文化的基础,发挥了“经艺之本、王政之始”(许慎《说文解字叙》)的作用。1892年切音字运动发轫、1898年《马氏文通》出版,开启了中国语言规划和中国语言学的现代历程(周有光《切音字运动百年祭》,《语文建设》1992年第5期。王海棻《〈马氏文通〉研究百年综说》,《中国语文》1998年第5期)。一百多年来,中国语言学发扬经纶济世的优秀传统,在中国从半封建半殖民地社会蝶变为现代化大国的进程中,做出了应有贡献。
习近平总书记在2024年9月的全国教育大会上强调,要“构建以各学科标识性概念、原创性理论为主干的中国哲学社会科学自主知识体系”(习近平《加快建设教育强国》,《求是》2025年第11期)。本文根据构建“自主知识体系”的精神,回顾1949年以来语言学为中国社会发展做出的主要贡献,包括二十年来在语言生活研究方面所取得的成效,探讨语言学为社会提供语言红利(社会红利和经济红利)的重要途径,并展望智能时代语言学应承担的新使命,提出优化语言学学科建设的若干浅见,以提升其学科地位和服务社会的学术能力。
1
语言学的社会贡献
中华人民共和国1949年成立至今已经走过七十多年的光辉历程。语言学伴随着国家的发展而发展,且为国家发展、社会进步做出了重要的学术贡献,贡献了巨大的“语言红利”(王均主编《当代中国的文字改革》,当代中国出版社,1995年。苏培成主编《当代中国的语文改革和语文规范》,商务印书馆,2010年。费锦昌主编《中国语文现代化百年记事(1892—2013)》,商务印书馆,2021年。项开喜《中国共产党与百年语言文字事业》,《中国语文》2021年第4期)。在学术大变局的当下简要梳理一下这些贡献,可以在一个新高度上再次认识语言学在促进国家发展、社会进步中的价值(包括物质价值和精神文化价值),再次审视语言学与社会的关系,进一步明确解决社会发展中的语言问题这一根本使命。
1.1 助力国家实现语言统一
在白话文运动、国语运动、简体字运动的基础上,新中国进一步确定了民族共同语的标准并大力推广,实现了国家的语言统一。在1955年召开的“全国文字改革会议”“现代汉语规范问题学术会议”两次会议的基础上,国务院1956年发出了《关于推广普通话的指示》。这是一次重要的语言地位规划、语言本体规划和语言学习规划。1982年《中华人民共和国宪法》第十九条规定“国家推广全国通用的普通话”,这是第一次把推广普通话法治化,但普通话的国家地位还是隐含的。2000年《中华人民共和国国家通用语言文字法》颁布,确定普通话和规范汉字为“国家通用语言文字”,并较为详细地规定了使用、管理和监督的一系列法条。这又是一次重要的语言地位规划,明确了普通话的国家通用语言文字的法律地位,也明确了国家通用语言与其他语言和汉语方言的关系。由此可见,语言地位规划不是一次完成的。
七十多年来,国家通用语言的一些重要标准通过本体规划逐步形成:
语音规范:北京音系;
文字规范:规范汉字,以《通用规范汉字表》(2013)为基准;
词汇规范:以北方方言为基础,以《现代汉语词典》为核心;
语法规范:典范的现代白话文著作所蕴含的语法体系;
语体规范:现代白话文;
注音拼写规范:《汉语拼音方案》。
历史上,汉语只有统一的书面语,因方言分歧而没有统一的口语。现代的语言统一,特别是近七十来年的语言统一,首先是口语的统一,截至2022年全国普通话普及率已经达到80.72%(教育部“教育这十年‘1+1’系列发布会”,第六场:介绍党的十八大以来语言文字事业改革发展成就,http://www.moe.gov.cn/fbh/live/2022/54618/mtbd/202207/t20220705_643272.html。近来,普通话普及率可能达到85%左右);其次是整理和简化汉字,确定白话文文体,使书面语更加规范高效。语言统一对社会的贡献主要有以下几个方面:第一,保证国家各领域信息畅通;第二,因统一语言的使用而不断增进集体共识,增强国家和中华民族的认同;第三,改变语言和方言的“碎片化”格局,开拓统一市场,方便经济信息和技术传播,搭建中国经济发展金桥;第四,在国际上代表国家行使语言职责,促进中文的国际传播。
1.2 促进语言文字现代化
现代化是一个时间概念,不同时期有不同的现代化标准和任务。二十世纪五十年代至七十年代,语言文字现代化的主要任务是规范化。八十年代以后开始提出标准化、信息化的任务。标准化是从工业化角度对规范化提出的新要求,是由人用规范发展为工业生产用的规范,也是信息化发展的基础。随着人工智能的发展,特别是大语言模型的问世,“数智化”或“智能化”成为语言文字现代化的新任务。这一现代化进程,不仅是语言文字本身的现代化,更是语言文字应用的现代化,亦即语言技术、语言媒体的现代化,满足有声媒体、网络媒体、人工智能的技术需求,以及其从业人员的相关需求。
语言文字及其应用的发展,语言技术是重要的推动力。在利用电波处理语言信息的进程中,语言技术推动语言文字及其应用发展的巨大作用更加显著,也显示出语言规划、语言学对语言技术、语言媒体发展的重要作用(李宇明《语言技术对语言生活及社会发展的影响》,《中国社会科学》2017年第2期)。
语言文字现代化的社会贡献是:第一,国家通用语言拥有了全媒体、融媒体的现代媒体阵势,特别是帮助11亿网民过上了网络语言生活(2025年1月17日,中国互联网络信息中心(CNNIC)发布第55次《中国互联网络发展状况统计报告》。《报告》显示,截至2024年12月,中国网民规模达11.08亿人,互联网普及率升至78.6%),使中文在世界格局的竞争中占据有利地位;第二,为语言文字的信息处理、智能处理奠定了语言数据、语言技术等基础,为“人-机-机-人”的现代语言交际模式做了准备;第三,语言文字现代化受惠于社会现代化,同时也是社会现代化特别是社会信息化、智能化的强大助力。
1.3 把握语言国情
了解中国的民族语言、汉语方言状况和语言使用状况,是二十世纪三十年代以来中国语言学的重要任务。二十世纪五六十年代,汉语方言研究有效帮助方言区的普通话学习,民族语言的识别与调查奠定了民族语言研究的基础。其后有一系列的重要成果问世,如:《中国语言地图集》(1987年),《普通话基础方言基本词汇集》(1996年),《现代汉语方言音库》(1992年—1999年),《中国语言文字使用情况调查资料》(2006年),《中国的语言》(2007年)(中国社会科学院、澳大利亚人文科学院编《中国语言地图集》,(香港)朗文出版(远东)有限公司,1987年。陈章太、李行健主编《普通话基础方言基本词汇集》,语文出版社,1996年。侯精一主编《现代汉语方言音库》,上海教育出版社,2003年。中国语言文字使用情况调查领导小组办公室编《中国语言文字使用情况调查资料》,语文出版社,2006年。孙宏开、胡增益、黄行主编《中国的语言》,商务印书馆,2007年),“中国语言资源有声数据库”(2008年—2014年),“中国语言资源保护工程”(2015年至今),《中国语言生活状况报告》(2005年至今)(国家语委组织编写的系列丛书,商务印书馆出版,自2005年至今已出版二十年)等。这些研究成果的价值是:第一,基本了解中国的语言(包括汉语方言)状况,持续追踪了解语言文字的使用状况,为语言政策的制定奠定国情基础;第二,更新语言调查技术和调查规范,培养语言调查研究人才,建立语言和方言的识别与划分理论(曹志耘《我国大规模语言调查的成就与启示》,《中国语文》2023年第6期);第三,树立语言资源理念(苏新春《语言资源观:语言生活派的一个重要基础理论》,《语言战略研究》2025年第5期),建立可永久保存的规模巨大的多模态的中国语言资源数据库;第四,这些行动和理论产生了重要的国际影响。
1.4 推动语言教育
中国语言学最近七十多年最为显著的发展,是建立了较为系统的学科体系,虽然今天看来这一学科体系还不完善。中国的语言学发展从来与语言教育血肉一体,许多重要的语言学著作都是为教育而做,或曾经作为教材,甚至就是课堂讲义的整理,如马建忠《马氏文通》、黎锦熙《新著国语文法》、王力《中国现代语法》、岑麒祥《语言学史概要》、朱德熙《语法讲义》等。
语言教育是关乎社会福祉与发展的重要教育,当年的扫盲教育意义重大。全民语文知识的普及也影响深远。1951年6月6日,《人民日报》发表《正确地使用祖国的语言,为语言的纯洁和健康而斗争!》的社论,同时开始连载吕叔湘、朱德熙合写的《语法修辞讲话》,共刊载46次。《新华字典》《现代汉语词典》的编纂,也是帮助全民用好语文知识的基础工程。中小学语文教育是中国语言学的传统领地,用力最勤,贡献最多。在盲文、手语设计和特殊教育、语言康复领域,语言学更是起到了支柱性作用。外语教育,特别是改革开放以来的外语教育,不仅培养了大批外语人才,也使国人眼界大开,有助于中国走向世界。海外华文教育、国际中文教育,使中华语言文化走出国门,逐渐成为当今世界的公共文化产品。这些语言教育的社会意义是:第一,提升了国民文化素养,现今文盲率仅为2.67%,为国民和国家发展打下了文化基础;第二,帮助特殊人群融入主流社会,共享知识与文明;第三,提升了国家处理海内外事务的语言能力;第四,维系海外华裔的语言文化认同,推动中华语言文化的海外传播。
语言学学科建设、语言文字事业发展为国家所做的贡献难以尽述。此处的重点,不是要把这些贡献全部一一列举,而是要以此显示语言学与国家发展、与社会进步的关系,特别是要凸显语言学的社会功用与使命。
2
在语言生活中寻找学术靶点
科学萌芽很早,但科学真正成为社会分工的一个重要部门,只是十六世纪以来近几百年的事情。语言学萌芽起码可以追溯到古希腊、古印度和古中国,但语言学成为科学,按照传统的说法,国际上是十八世纪比较语言学的兴起,中国是十九世纪末的《马氏文通》问世。
从事科学研究离不开探求真相、探讨真理的兴趣,社会支持一部分人从事科学生产,并使其成为一个重要的社会部门,是为了让科学帮助解决社会发展中的问题,包括物质世界的问题、社会问题和精神世界的问题(李宇明《语言学研究:问题的“问题化”》,《东北师范大学学报(哲学社会科学版)》2020年第5期)。这是科学的本源问题,解决这些问题是科学的社会使命,称为A类问题。科学部门成立之后,分化为不同的学科,于是又衍生出一系列的学科问题,称为B类问题。社会要支持学科发展,需要通过评审来明确支持谁不支持谁,于是又派生出C类问题。ABC三类问题当然各有侧重,也各有其价值,但本质上是有一致性或优先性的,那就是解决好A类问题。因为A类问题是科学的本源问题;解决学科问题是为了发展学科,发展学科也是为了能更好地解决A类问题;对学科进行评审,本质上也是评价学科解决A类问题的能力和作为。语言学也面临ABC这三大问题,处理好这三大问题,关键在于关注语言生活。
2.1 关注语言生活
最早提及“语言生活”的文献,是罗常培、吕叔湘先生在1955年10月“现代汉语规范问题学术会议”上所做报告《现代汉语规范问题》(罗常培、吕叔湘《现代汉语规范问题》,现代汉语规范问题学术会议秘书处编《现代汉语规范问题学术会议文件汇编》,科学出版社,1956年),虽然在这一文献中,“语言生活”还带有引号,是个临时用法。在1961—1965年的《文字改革》杂志中,有4例相关用法。在二十世纪七十至九十年代,“语言生活”的使用逐渐增多,发展为一个学术术语。进入二十一世纪,特别是《中国语言生活状况报告(2005)》的编纂出版以及2006年“构建和谐语言生活”成为国家语言文字事业的重要工作目标之后,“语言生活”也成为语言规划研究领域的基础性术语。李宇明根据现在语言生活的状况这样定义“语言生活”:“语言生活是运用、学习和研究语言文字、语言知识、语言技术的各种活动。”(李宇明《语言生活与语言生活研究》,《语言战略研究》2016年第3期)这是一个较为宽泛的定义,几乎包含了人类社会发展中的所有语言问题,可以看作语言学的A类问题。
语言学的B类问题,笔者以为主要有三:第一,探索语言规律;第二,促进语言的社会应用;第三,建设语言学学科。后两个问题与语言生活的关系比较明显,建设语言学学科属于语言研究生活,促进语言的社会应用就是促进语言生活的进步,而语言规律与语言生活的关系如何看则受制于语言观。语言是结构与功能的统一体,语言研究自然要研究结构,研究语音、词汇、语法、文字,研究方言的结构,研究语言古今结构因素的演变,研究语言之间的结构因素的接触,而且也要研究语言的功能,研究语言如何言说世界,研究语言如何助人做事改变世界。语言结构研究主要是language(语言)的研究,在中国常被称为“本体”研究,而语言功能研究则主要是discourse(话语)的研究,包括哲学意义上的“语言行为”“言说”的研究。即使是language的本体研究与语言生活也有密切关系,而语言功能的研究,亦即discourse(话语)、语言行为、言说等研究,基本都在语言生活的范畴之中。事实上,七十多年来国际语言学界发生的“话语转向”也越来越明显,社会语言学、功能语言学、话语分析、互动语言学、语言行为学等,都与“话语转向”相关(徐赳赳《话语分析二十年》,《外语教学与研究》1995年第1期。方梅、李先银、谢心阳《互动语言学与互动视角的汉语研究》,《语言教学与研究》2018年第3期。陶红印《当代多模态互动的转向与汉语功能语言学的发展展望》,《语言文字应用》2025年第2期)。沈家煊也赞成“言语是语言之本”的说法(沈家煊《语法研究也要重视拉波夫》,《语言战略研究》2025年第5期)。如此说来,语言学的B类问题与A类问题也基本相同,也是要解决社会发展的语言问题,亦即语言生活问题。
2.2 中国近二十年的语言生活研究举隅
近二十年来,语言生活研究成为一批中国学者的自觉学术追求,不仅做了学术理论和研究范式的探讨,还努力解决语言生活的问题,促进语言生活进步,帮助社会获取“语言红利”(郭熙《七十年来的中国语言生活》,《语言战略研究》2019年第4期。李宇明《语言生活研究与中国语言学的历史使命》,《昆明学院学报》2023年第1期。李宇明《二十年来的中国语言生活研究》,《语言战略研究》2025年第1期。苏新春《语言资源观:语言生活派的一个重要基础理论》,《语言战略研究》2025年第5期)。其中有许多可圈可点的研究,例如:
1)语言生活的监测研究。2004年国家语言资源监测与研究中心成立,语言监测主要采用新兴起的语料库研究手段,监测领域由平面媒体逐渐扩展到有声媒体、网络媒体、教育教材、少数民族语言及海外华语,每年的监测成果通过教育部、国家语委的新闻发布会和《中国语言生活状况报告》发布出来,并在年末举行的“汉语盘点”向社会发布年度字、词、流行语、新词语、网络用语等标志性数据。二十来年的语言生活监测,用大数据证明了“千字万词”即可满足语言生活的基本需求;发现了汉语“每年千词”的新词语生产能力,且新词语以三音节为主;支持了语文教材、国际中文教育教材、语文辞书的编纂,并为“规范汉字表”等规范的研制提供了参考。此外,还利用网络技术和舆情监测的理论与方法,监测语言舆情和语言热点,认识语情的发生发展规律,协助语情处理,发挥资政作用。
2)“语言生活皮书”系列的编纂出版。《中国语言生活状况报告》(俗称“绿皮书”)是最早编纂、影响最大的语言生活皮书,已经持续编纂二十年,且有英文版7卷、日文版4卷、韩文版5卷,俄文版1卷。海外许多图书馆有收藏,国际学术杂志有评论,许多学者有引用。在绿皮书之后,还编纂了《中国语言政策研究报告》(俗称“蓝皮书”),以反映和引导语言生活领域的学术研究;编纂了《世界语言生活状况报告》(俗称“黄皮书”),以反映世界各国、国际组织的语言生活,使国人能够“正眼看世界”;编纂了《中国语言文字事业发展报告》(俗称“白皮书”),系统介绍国家和地方的语言文字事业发展状况,发布一些重要的统计数据。此外,还组织编纂了《北京语言生活状况报告》《广州语言生活状况报告》《上海语言生活状况报告》《粤港澳大湾区语言生活状况报告》《闽台语言生活状况报告》《中国语言服务发展报告》等皮书,展示了一些地区和领域的语言生活景观,体现了区域语言学、领域语言学的学术理念。“语言生活皮书”系列的持续编纂,记录了二十年来中国语言生活的现实状况、中国语言生活的研究状况,同时也是国内外了解现代中国的重要资料。
3)国家语言资源的调查与保护。语言调查是语言研究的基本手段,也是中国语言学的传统作业。用语言资源理念统领语言调查,是2007年开始论证的“中国语言资源有声数据库建设”和2015年开始启动的“中国语言资源保护工程”。这两个调查,调动了全国的汉语方言学、民族语言学及信息科学界的力量,将方言学、社会语言学、类型学、语料库语言学的原理及中国语言调查的传统经验融为一体,形成了一套科学有效的技术规范和工作规范(《中国语言资源保护调查规范》系列、《中国语言资源保护工作规范》),建起123个语种及其主要方言的有声数据库(王锋《新的语言观与科学保护各民族语言文字实践》,《西北民族大学学报(哲学社会科学版)》2016年第2期。曹志耘《我国大规模语言调查的成就与启示》,《中国语文》2023年第6期)。这两个前后连贯的语言资源调查活动,不仅是用语言普查式的理念深入了解语言国情,为中国语言文化的保存保护打下了坚实基础,而且其技术和标准可以进一步用于边境语言调查,并可作为世界语言调查的参考。把握世界语言状况,了解世界语言知识,参与世界语言规划,是“大国学问”“大国之为”,只有世界大国,才有此需要,有此视野,有此学力。语言资源的调查与保护,需要从中国延伸到世界,可编纂出“万国语言志”一类的大制作。
4)国家语言能力的建设。语言能力研究过去只涉及个人的语用能力,直到二十世纪九十年代才有人提出国家语言能力问题,且主要涉及的还是国家的外语能力。近十几年来中国学者在语言能力领域用功最勤,收获较大(李宇明《试论个人语言能力和国家语言能力》,《语言文字应用》2021年第3期)。根据“以言行事”的语言观,个人语言能力可看作“个人用语言完成人生事务的能力”。个人要发展“三语”(包括“准三语”)能力,既要重视国家通用语言的学习,也要维持汉语方言和民族母语的能力,还要掌握一两门外语。国家语言能力是“国家处理海内外各种事务所需要的语言能力”,其中最重要的是掌控语言资源的能力和话语言说能力。语种能力是掌控语言资源的基础,应熟练掌握世界上最为重要的20来种语言以获取新知,能够使用200来种语言参与全球治理。话语言说能力,特别是行政、外事、军事安全、新闻舆论、科技教育、经济贸易等六大领域的话语言说能力,能向国内外很好表达欲言之事,实现沟通与互信,用言说推动社会进步。
5)语言扶贫和语言助力乡村振兴。贫困是全人类当然也是中国都在长期应对的重大社会问题。在中国减贫脱贫的征程中,学界积极参与,发挥语言扶贫之力。面向贫困地区编纂有针对性的多媒体普通话读本,搭建多个网络学习平台,开发适用的普通话测试标准及软件,大批志愿者深入贫困地区开展语言扶贫工作。同时还开展了一系列的学术研究,从语言能力与人力资本、语言教育与贫困代际阻断、语言与技术传播和生产要素流动等角度,研究语言扶贫原理,总结语言扶贫经验,精准开展语言扶贫。“语言扶贫”是共和国发展史上的浓重一笔,更是中国语言学史上的神来之笔。在巩固脱贫攻坚成果的基础上,国家又开始做乡村振兴这篇大文章。将语言扶贫成果同乡村振兴有效衔接,又成为语言生活研究的新课题,探讨乡村语言资源的收集保护和开发利用,做好乡村振兴背景下的乡村语言规划。
6)应急语言服务。每逢灾害发生,应急救援都需要提供翻译等语言服务。2008年汶川地震,2010年玉树地震,应急救援的语言服务问题更加凸显。2020年,新冠疫情暴发,语言学界迅速行动,利用语言生活研究积攒起来的语言资源和人力资源,及时研发了《抗击疫情湖北方言通》《疫情防控外语通》《疫情防控“简明汉语”》(李宇明、赵世举、赫琳《“战疫语言服务团”的实践与思考》,《语言战略研究》2020年第3期)。2022年成立国家应急语言服务团,应急语言服务迈入常规发展阶段,开展了法律法规建设、应急语言调查、《突发事件应急术语实用手册》编纂、救援现场应急语言服务演练、国际应急语言服务等。应急语言服务的理论研究也在深入,提出了应急语言服务的语言沟通、语言抚慰和应急语情监测等三大功能,应急语言服务应关注现场救援、社会大众和国际社会等三大场域,做到“平时备急,急时不急”。应急语言服务事关国家应急救援、韧性城市建设和国家安全,体现着语言学人的学术道德与社会使命。
7)语言经济与语言产业发展。语言不仅具有交际和思维的属性,也具有文化和经济等功能。从经济和产业的角度去看待语言,在数智时代尤为重要。《国家语委“十二五”科研规划2011年度项目指南》首次把“语言经济与语言产业发展战略研究”列为重要的科研方向。二十多年来的语言经济、语言产业研究,从四个方面揭示了语言的经济功能:第一,语言能力是劳动力构成的重要要素,特别是在服务业等非体力劳动行业,在数字经济成为重要经济形态的时代;第二,语言是经济活动的参与者、协调者,在技术与经济信息的传播、生产要素流动、统一市场的形成等方面发挥着重要作用;第三,语言产业是国家经济的重要组成部分,呈现各种业态,孕育各种语言职业,提供有形或无形的各种语言产品,满足社会的语言需求;第四,语言数据是数字经济的关键生产要素,加持着新质生产力的发展,数字经济赋予语言以生产力的性质。
8)大华语与海外华语传承。华人踏浪出海在海外形成华族,华族既使用汉语方言,也使用超方言的华语。随着近几十年来新华人移居欧美和非洲等地,以及海外华语与国内汉语的协调互动,传统“华语”的概念已显不足,于是产生了“大华语”的概念。在宏观思考全球华语问题、全球语言问题中,大华语几经定义,概念逐渐明晰。大华语是指“以普通话/国语为基础的全世界华人的共同语”,各华语社区存在多种华语变体,目前各华语变体正在向着趋近趋同的方向发展。在大华语观念的指导下,国内外专家合作编纂了《全球华语词典》和《全球华语大词典》;邢福义先生领衔开展“全球华语语法研究”,已出版《全球华语语法》的香港卷(田小琳主编)、马来西亚卷(郭熙主编)、美国卷(陶红印主编)和新加坡卷(周清海主编)。这些研究把语言生活的学术触角从国内延伸到海外,用世界眼光看待全球华人的共同语及华语变体,对华语教育的认识更为自觉,世界华语的研究范式也随之更新(李宇明《世界汉语与汉语世界》,《中山大学学报(社会科学版)》2021年第3期)。
2.3 “从语言生活中来,到语言生活中去”的研究范式
上面这些例子,体现了“从语言生活中来,到语言生活中去”的研究范式,在实践中了解世界、认识世界,进而改造世界。
语言生活是研究的出发点,亦是研究的归宿地。研究需要问题驱动,但这问题不是来自“面壁”的觉悟,也不是来自某个理论的推演或某部著作的提示,而应来自语言生活的现实,是语言生活中的真问题。这就需要深入语言生活,具身了解语言生活,像费孝通先生那样“用双脚做学问”,发现语言生活中需要解决的问题,在语言生活中寻找“学术靶点”。
语言生活中发现的问题是“源问题”,需要把来自社会的源问题转化为学术问题,实现问题的“问题化”(李宇明《语言学研究:问题的“问题化”》,《东北师范大学学报(哲学社会科学版)》2020年第5期)。“问题化”起码需要考虑三点:其一,研究价值。在确定课题的研究价值时,学界经常看的是学科价值,这自然很需要,但是并不充分,还需要听听学科之外的看法,看他们能否理解或认可这个课题的意义。这种价值判断法可称为“两个评判人”的办法。语言学这些年的许多研究,同仁都认为很有价值,但是并未获得社会认可,未得到社会支持,未发挥理想的社会效益,这是值得反思的。其二,有无研究先例。把语言生活中发现的源问题,与学科曾经处理过的问题关联起来,将源问题植入一个相关相近的学术体系中。一旦把问题纳入一个学术体系,就可以用学术的办法来处理。如果在现有学术体系中无法找到其位置,还可以考察邻近学科有无处理相似语言问题的经验,以为借鉴。当然也可以建立全新的学术框架以应对新问题。其三,有效的研究方法。语言研究的方法库中已经有大量积累,且许多研究方法还有专门技术与装备的支撑,随着科技的进步,语言研究还会使用更多的新方法新手段。方法是解决问题的利器,对方法应抱积极态度。但是,方法也不是可供炫耀的奢侈品,有效的方法便是最好的方法,不可助长“技术主义”。
语言生活也是研究成果的最佳验证处。研究结论如何,不仅要用传统的学术评审办法来评价,比如专家评审会、论文刊发杂志的等级等,还应在语言生活检验中进行评价,看是否切合实际,解决问题的方略举措是否有效,在语言生活检验中不断完善研究。研究成果不仅要接受语言生活的检验,而且也需把成果返还到问题来源处去发挥作用,利用学术、政策、产品等多种手段,解决语言生活问题。在研究成果接受检验、付诸应用的同时,又是发现新问题、产生新冲动的开始,又是一个研究的新起点。如此循环往复,推动研究螺旋式前进。
当然,语言生活研究也需要注意成果的学术化、学科化,形成理论和方法,让研究成果进入课程、教材等人才培养体系,通过人才培养以发展语言科学。通过持续努力,也可能发展出新的学科分支甚至新的分支学科,形成新的学术流派。放眼语言学史,许多交叉学科、学术流派,都是在解决社会语言问题中发展起来的。这种研究范式,便于统筹解决语言学的A类问题与B类问题。
3
数智时代语言学的新使命
“信息化、数字化”本来是两个颇为时髦的词语,但随着大语言模型的横空出世,这两个词语似乎已不能准确表达时代特点,而要用“数智化”或“智能化”方可言说到位。近些年,国家面对人工智能积极布局,提升对人工智能的基础支撑能力,实施“数据要素×”“人工智能+”行动,推动人工智能与经济社会各行业各领域的广泛深度融合,重塑人类生产生活范式(例如:2017年,国务院发布《新一代人工智能发展规划》;2018年,教育部发布《高等学校人工智能创新行动计划》;2023年,中共中央、国务院印发《数字中国建设整体布局规划》;2023年12月,国家数据局会同16部门联合印发《“数据要素×”三年行动计划(2024—2026年)》;2024年,工业和信息化部等4部门联合印发《国家人工智能产业综合标准化体系建设指南(2024版)》,教育部印发《关于加强中小学人工智能教育的通知》;2025年3月,教育部、国家语委、中央网信办印发《关于加强数字中文建设推进语言文字信息化发展的意见》;2025年8月,国务院发布《关于深入实施“人工智能+”行动的意见》)。
当前,驱动人工智能发展的主要是数据。就此而言,数据决定着人工智能发展的水平与速度,也成为数字经济的关键生产要素。人工智能及数据产业的发展,“数据要素×”“人工智能+”行动的实施,不仅在加速社会及技术的进步,也将深刻影响语言生活和语言研究(李宇明《人机共生时代的语言数据问题》,《华中师范大学学报(人文社会科学版)》2023年第5期。王春辉《语言智能与语言数据研究二十年》,《语言战略研究》2025年第3期)。对这种影响,需要及时关注、研究,并促其良性发展(刘海涛《数智时代语言规划须顺势而为》,《语言战略研究》2024年第5期)。
3.1 语言研究的新取向新功用
数智时代为语言学提供了一些新课题,语言学也能够为数智时代的发展做出独特贡献。例如:
1)语言数据研究。驱动人工智能发展的数据,80%以上都是语言数据。有支持通用大语言模型发展的通用型语言数据,也有特殊行业、特殊人群、特殊场域的支持专用大语言模型发展的专用型语言数据。语言数据的生产、交易、应用是一个庞大的产业链,不同环节上的语言数据表现为不同形态的语言产品,具有不同的价值,需要根据特定的标准进行加工、检验和认定(李宇明、梁京涛《语言数据的生产要素功能与产权制度构建》,《语言教学与研究》2024年第2期。)。比如语言数据库建设过程中的多模态语言数据的采集、整理、标注、建库、集成等,语言数据交易中的确权、确价、上市交易等,语言数据转化为各种智能产品中的技术开发、产品应用、市场推广、售后服务等。认识语言数据产业链的构成及运行规律,研究产业链各环节的标准制定、语言产品认定、语言数据人才培养及相关的法规、伦理等问题,充分发挥语言数据作为科技要素、生产要素的“乘数效应”,已成为语言学的重要课题。语料研究是语言学的传统项目,但以往的语料研究是面向语言学的,面向语言信息化的,而今需要面向语言智能化。
2)机器语言智能的测试与解释。现今大语言模型输出的语言,基本上合乎词汇、语法、篇章规范,很少有语言错误,这是令人吃惊的。可以说,母语使用者、外语学习者,经过十数年的学习都难以达到如此水平。人类输出的语言与机器输出的语言有何异同?人类的语言学习、人脑的语言运作与机器的语言学习、语言运作有何不同?过去语言学研究的基本上是自然语言(也研究了手语、旗语、符号语言等),探究的是自然语言的特性及其大脑、神经运作机理,而今语言为两个“物种”所使用,机器也是语言使用者,可输出语言,可与人对话,机器输出的语言、机器语言行为及其语言运作机理,成为语言学研究的新对象(袁毓林《人工智能大飞跃背景下的语言学理论思考》,《语言战略研究》2023年第4期)。
然而,人们对机器的语言输出也表现出较多不满,主要是机器“幻觉”问题。它似乎“无所不知”,但也常“信口雌黄”,说出没有根据、不合实情、缺乏情感的话语。这就需要使用者具有鉴别能力,或是通过一个强大可信的优质知识库来校验其输出,而且也需要思考,“幻觉”是大语言模型的学习方式造成的根本缺陷?通过学习方式的改变是否可以有所改善?能否通过人类“调教”或改进语言数据的供给而减弱其幻觉、减少其“信口雌黄”的语言行为?
大语言模型不仅具有“幻觉”,而且还具有不透明性。人类至今还不知道它是如何思考的,它究竟知道些什么,这就需要采取一定手段对大语言模型进行测试。这种测试,各个学科都在行动,几乎发展为一种学问。语言学在测试方面有其独特的价值,比如测试大语言模型具有的语言学知识,包括语言交际所需要的常识,如空间常识、时间常识、数量常识、人伦常识等(詹卫东、孙春晖、肖力铭《语言学知识驱动的空间语义理解能力评测数据集研究》,《语言战略研究》2024年第5期)。
3.2 智能产品的应用普及
以大语言模型为代表的智能终端、智能体等智能产品的应用普及,正在赋能、孕育各种新质生产力,促进智能经济和智能社会的发展。语言学应关注其应用,支持其应用。
1)在语言研究中的应用。大语言模型在文献搜集、知识库建构与检索、语料统计与遴选、文图转换甚至文稿草拟等方面,都可为研究者提供帮助。积极探索、实施人机协同的语言学研究模式意义重大。研究手段的更新,必能产生新的语言学成果,甚至产生语言学新的分支学科(袁毓林《人工智能大飞跃背景下的语言学理论思考》,《语言战略研究》2023年第4期。王春辉《语言智能与语言数据研究二十年》,《语言战略研究》2025年第3期)。
2)智能产品的社会应用。科学可以成为第一生产力,科研成果可以较为及时地转入社会应用。智能产品的应用,多数要通过人机对话来实现,“人机对话”能力已成为智能时代新的语言能力,也是语言教育的新内容。人机对话的中介是“提示语(Prompt)”,提示语的使用水平直接关系到智能产品给出回答的质量。研究提示语的内容结构,研究提示语与机器输出的关系,提升社会各领域、各人群使用提示语的水平,提升对机器回答进行整理、甄别和再行加工润色的能力,成为语言学的新课题。提示语工程师的培养,全民人机对话能力的教育,成为语言学的新任务。
3.3 语言职业的新格局
语言职业是从事语言知识、语言技术(艺术)、语言产品生产的职业,是语言产业的支撑力量,是语言转化为生产力的关键要素,也是语言学人才的主要就业领域,因而应成为语言学关心、研究的对象。语言职业研究主要有两个方面:
1)职业的语言能力标准。每个语言职业都需要一定的语言能力,研究各语言职业所需要的语言能力,制定语言能力标准,据此对就业人员进行测试与培训。数智时代,语言职业都要涉及语言数据、语言智能等问题,需要有一些新的指标要求,需要进行增能培训。
2)语言职业的格局变化。新的语言技术、语言产品的出现,必然形成或消减一些语言产业,导致一些语言职业产生或消亡。电报员、电话接线员、打字员等职业的产生与消失,便是例证。速录师、礼仪主持人、数据标注员、网络主播等是新近产生的语言职业。语言智能也将改变语言职业的格局,产生一些新职业,冲击一些老职业。新职业是逐步形成的,需要敏锐发现、积极培育,制定新岗位的人才规格及考核标准,多途径提供新岗位的人才供给,条件成熟就应进入国家职业分类目录。一些低层面的翻译、咨询、培训、创意、文秘、讲解、校对等工作,预计会受到人工智能的较大冲击。对于逐渐失去活力的语言职业,需要及时进行社会预警,通过培训实现劳动力转移。语言职业的格局变化,牵涉语言产品的社会应用,牵涉语言人才的社会就业,直接牵涉语言学的生存与发展。
3.4 数智时代语言生活的言说
言说世界是语言的重要功能。数智时代语言生活的言说,就是告诉社会,数智时代的语言生活是什么样子,为何如此,发展趋势如何,个人和社会需要如何适应等。不同学科、许多社会团体都会对数智时代进行言说,但是,以语言学视角对数智时代的言说,只有语言学才合适去做,也只有语言学才能做到。
人工智能是自文字创制、印刷术发明、有声媒体出现、网络技术应用以来人类语言技术发展史上的又一高峰。其前的语言技术都是着力解决语言(文字)的传播问题,而人工智能则试图帮助人脑来处理语言及知识,几乎涉及人类所有的智力活动,改变人类的交际方式、语言和知识的处理方式、甚至思维习惯,从而也改变语言职业的技能要求、语言产业的布局与产品、乃至语言生活的方方面面。面对数智时代新的语言生活,个人的素质和技能需要提升,社会也需要新的语言规划。
进行数智时代语言生活的言说,是对语言学自身能力的巨大考验。这是因为:其一,人工智能处在科学技术前沿,发展迅速,趋势多变,对语言生活的影响也是逐渐显现、且在不断变化之中,把握起来具有难度;其二,我国语言学研究的主要兴趣仍在语言本体,对语言生活关注总体上是不够的,对人工智能也较为陌生,且语言学总体上属于经验科学,以现有材料为基础进行归纳是基本传统,较少进行演绎思维,更不轻易做预测性研究;其三,语言学的表述体系,基本上是本学科可懂的专业性话语,不大擅长将学术进行社会化表述。这些情况表明,对数智时代语言生活这一言说对象要有科学认识,对其发展前景要有科学预测,还需要改善语言学的研究范式和话语方式。当然,话语言说也是一个不断“试误”、不断完善的过程,失误、完善的过程就是认识不断提升的过程。关键是要有言说数智时代语言生活的意识和行动。
4
优化语言学学科建设
优化语言学学科建设,是为了使学科更有能力去解决社会发展中的语言问题。先俯瞰一下中国语言学学科设置的现状,简略分析其局限性,然后不揣谫陋,就其优化问题谈些浅见。
4.1 语言学学科的设置现状与学科冲动
中国的语言学学科设置有三个明显特点:其一,与文学为伍,形成一级学科。这是小学服务经学传统的延续;其二,以语种为纲,汉语、各民族语、英语、法语、日语、俄语、德语、西班牙语等各自分立;其三,主要以语言的结构要素为据,建立学科分支,如语音学、词汇学、语法学、修辞学等,此外还分古代、现代及方言等。这显然是受索绪尔结构语言学框架的影响。
应该承认,这种学科设置发挥了很多积极作用,如大学的中文教育、外文教育,也推动了各种具体语言学的发展,特别是语言本体研究的发展。但是,以语文学为基础、以语种和语言结构为基本框架的设置,已显现许多局限性。比如,学界被语种、结构等要素切分为蜂巢状,将学人分割在一格格的蜂巢中,不便于观全局谋大局,不便于从本体研究走向功能研究,不便于将一人研究利及整个学界。再如,不在一级学科层面设置学科,对内难以统筹规划,致使中国语言研究没有形成要解决的共同问题,没有共同的学术目标;对外不利于学科交叉互惠,不能与其他学科有效交叉,共同培养与语言学相关的社会所需人才。这不仅严重阻碍了语言学的发展,也使其他学科不能便利分享语言学成果,使国家不能很好获取语言学红利。
学界早有打破这种局限性的学科冲动。2009年11月21日在华中师范大学召开“语言学学科建设研讨会”以来,学界及两会提案不停呼吁语言学设立一级学科或学科门类,并提出过许多可供参考的方案(陆俭明、沈阳《关于建立“语言学”一级学科的建议》,《语言科学》2010年第1期。刘丹青、张伯江《时势之必需,学术之大业——设立语言学一级学科的重要意义和学理基础》,《语言科学》2010年第1期。杨亦鸣、徐杰《语言学应该调整为一级学科》,《语言科学》2010年第1期。游汝杰《语言学的学科地位问题》,《语言科学》2010年第1期。李宇明《语言学是一个学科群》,《语言战略研究》2018年第1期)。《研究生教育学科专业目录(2022年)》在教育学门类下设立国际中文教育一级学科,这是打破学科设置局限性的一次重要尝试。以语言资源、语言经济、语言产业、法律语言、儿童语言、老年语言、语言病理、语言与健康、语言与认知等为内容,成立研究单位,设置研究课题,召开学术会议,开设杂志专栏、出版专著等,表现出了学界为打破学科限制而进行的机制性努力(李葆嘉《“新文科教育”的先行足迹:语言科技二十年》,《南京师范大学文学院学报》2023年第3期)。这些学科冲动反映着学术发展趋势,相信最终能够为学位制度设计者所认识,成为学科设置上的体制现实。
4.2 语言学学科建设的优化设想
优化学科建设,首在意识。优化学科建设的目的,亦是优化与否的检验,就是看解决社会发展中语言问题的情况。学界早就流行“社会服务”或“科普”的提法,这种提法有积极意义,但是明显地对A类问题的认识不到位,没有把服务社会、帮助社会解决问题看作学科的首要职责,仿佛是一种“副业”,是余力之为,甚至是一种“学术慈善”“学术施舍”。学界也有“把论文写在祖国大地上”的口号,口号不能仅仅是一种提倡,而应是学术自觉行为。
其次,要有利于打破“蜂巢格局”,在体制和机制上都要方便学科沟通和学科交叉。如果说二十世纪的科学走向是分工精细,那么二十一世纪的科学走向是交叉融合,是多学科联合解决复杂问题(陈平《语言交叉学科研究的理论与实践》,《语言战略研究》2021年第1期)。语言学的学科优化必须在沟通、交叉上多做文章,免得陷入“孤芳自赏”的窘境。
再次,有利于语言学教育和语言教育。语言学教育是语言学学术延续的基本保证。当前看来,中小学有语文课有外语课,大学有中文系、外语系等,但都是在进行语言教育,而不是语言学教育,真正的语言学的学术训练多数是从硕士阶段开始的。与其他学科相比,培养时间开始得太晚,且一些优秀青年学生早流向了其他学科。中小学语文教育的一个重要问题是缺乏学科支撑,语言文字学、文学、教育学没有构成面向中小学语文教学的学科体系,这与中小学数学教育、物理教育、历史教育等的情况完全不同。没有一个统一学科支撑的中小学教育,是不能持续得到学术给养、得到合适人才供给的,是缺乏明晰发展方向的。语言教育除了中小学语文教育、外语教育之外,还有民族语言教育、国际中文教育、华文教育等,各类语言教育之间的学术沟通、乃至语言教育与语言学教育之间的沟通,都是需要学科优化来解决的。
具体的学科优化,起码有两个问题应考虑其中:
第一,改善语言学的学科设置。经过近二十年语言学学科设置问题的学术探讨和工作实践,借鉴世界语言学的发展方向,可以考虑这样的可行思路:
1)现有学科设置基本不动,以稳定语言学的基本盘,维护语言学与文学等学科的传统学术关系。但鼓励建立新的学术方向或分支学科,特别是面向社会有新学术靶向的分支学科,如语文学、乡村语言学、产业语言学、语言健康学、老年语言学、军事语言学等;或是面向现代科学技术发展的,如语言数据学、机器语言行为学、人工智能伦理学等。
2)争取在第14学科门类(交叉学科门类)下设置语言学一级交叉学科,同时鼓励有条件的单位自主设立语言学的一级交叉学科。
第二,加强语言学共同体建设。现代的科研活动都是有组织的社会学术活动,涉及互有分工、互有协作的一群人,形成学术共同体。学术共同体由三个部分构成:
1)科研主体,包括科研工作者、科研机构、学术团体、学术杂志与出版部门等。
2)科研支撑部门,包括科研管理机构、科研基金会、科研评价机构、科研成果社会推广机构等。
3)科研成果应用部门,包括教育、科技产品生产、产品的社会应用等。
就语言学来说,其学术共同体的建设任务重要而急切。语言学科研的四大主体之间沟通早已存在,但并不紧密,特别是语言学社团和语言学杂志的作用还需充分发挥。语言学社团对学人、学科的沟通、帮助、引领作用还有待加强,语言学社团之间也需要建立学术上的关联协同。语言学杂志在科研中的地位空前重要,承担着提供成果发表、促进学术交流、引领学术发展、培养学术队伍、支持学科建设、帮助学界获取社会话语权等学术使命,但似乎语言学杂志与语言学人的关系不如从前亲近、密切。近期,看到《中国语文》《方言》《当代语言学》的改版征稿启事,其中不乏语言生活、语言学人的内容,这些新动向令人瞩目。
语言学的支撑部门与语言学科研主体间的关系越来越直接,越来越重要,几乎关系到语言学的生存空间和发展空间,关系到语言学的学科设置和学科投入,项目的数量及项目设置的合适性,学人和学科评价,学术成果的社会应用等。这些支撑部门多数不是单一支撑语言学的,因此会对语言学在科学体系中的地位进行评判,会对语言学的社会价值进行评价,从而决定该如何支持语言学。让这些部门了解语言学自然重要,更重要的是语言学也可由此了解自己的价值,站在学科之外看学科也是重要的视角。
推动语言知识转化为人才教育价值和市场价值,直接关系到语言学对社会的实际作用。比如语言教师的培养与发展,语言学教材与语言教材的编纂出版,与语言相关专业的就业状况,语言测试产品、自动翻译产品、应急救援语言产品等的研发应用,辞书业、术语业、语言博览业的发展,语言数据库等与信息化、数智化相关的工程建设、人才培养和产品开发,世界各地的中文教学等。语言成果的应用领域,过去主要关注了语言教学、语言测试、辞书编纂等,但并没有将这些应用成果看作语言学共同体的一员,更没有语言产业、语言职业、语言产品意识,这不利于语言学的发展,更不利于语言产业的发展。
总之,具有语言学共同体意识,共同体各方面取得共识,形成发展合力,是优化语言学学科建设、开拓语言学发展空间、提升语言学学科品位的重要举措。
5
结语
语言学研究有狭义和广义之别。研究语言的科学叫“语言学”,以“语言学”为研究对象的叫“语言学学”,属于科学学的范畴,一切影响语言研究的因素均可纳入语言学学的研究视野。语言学与语言学学两者是相辅相成的,以往的语言研究中已经包含有大量语言学学的内容。随着社会发展和科学技术的进步,特别是科学技术进入生产力范畴之后,以及社会对科学技术的评价逐渐加力之后,语言学学的研究就显得重要起来。本文讨论的话题有语言学的,但更多的是语言学学的。由于“语言学学”说出来有点拗口,就如“科学学”一样,在表达上不一定要严格区分语言学和语言学学,但是有语言学学的意识十分重要。
本文回顾了1949年以来语言学在语言统一、语言文字现代化、语言国情把控、语言教育等四个方面为中国社会发展做出的重要贡献,总结了二十年来在语言生活的监测研究、“语言生活皮书”系列的编纂出版、国家语言资源的调查保护、国家语言能力的建设、语言扶贫和语言助力乡村振兴、应急语言服务、语言经济与语言产业发展、大华语与海外华语传承等八个方面所取得的成绩。通过这些回顾和总结进一步认识到语言学的根本任务就是要帮助解决社会发展中的语言问题,因此要关注语言生活,深入了解语言生活,在语言生活中寻找学术靶点,发现新的研究课题,开展富有创新性的学术研究。通过学术研究解决语言生活中的问题,从而促进语言生活的发展,进而也助力社会进步。语言学遵循“从语言生活中来,到语言生活中去”的研究范式,其实这也就是“从实践中来,到实践中去”的范式。
而今,社会正步入数智时代,语言生活正在发生巨变,语言学也将担负起新的学术使命和社会使命,在语言数据研究、机器语言智能的测试与解释、语言智能产品的应用、语言职业新的格局变化、数智时代语言生活的言说等方面,都应有所建树。语言学的当务之急是优化学科建设,在体制和机制上方便学科沟通和学科交叉,鼓励建立面向社会的有新学术靶向的分支学科,重视加强语言学共同体的建设。提升语言学的学科品味,开拓语言学的发展空间,扩大语言学在学科间的穿透力和对社会的影响力,让语言学为国家、为人民贡献最大红利。
来源:《中国语文》2026年第1期
>>>中国社科院语言所网信室编辑
来源编辑:今日语言学 公众号
转载编辑:区域国别学与跨文化研究
比特人文
投稿邮箱:dhbase@126.com
扫码关注 获取更多资讯
JADH2026 CFP
JADH2026: “Whose World, Whose Data? Sustainability in Digital Umwelts”
The Japanese Association for Digital Humanities (JADH) is pleased to announce its 15th annual conference, to be held at Kyushu University on September 11-13, 2026.
Digital data do not exist in isolation. They come to life only within specific contexts of use, interpretation, infrastructure, and care. Following Jakob von Uexküll’s concept of Umwelt, this conference understands data as embedded in situated worlds of meaning—worlds shaped by disciplines, institutions, technologies, cultures, languages, and communities. Umwelt is the contextually constituted world in which data gain meaning through use and interpretation.
Under the theme “Whose World, Whose Data? Sustainability in Digital Umwelts,” this conference invites participants to rethink digital sustainability not simply as long-term preservation or technical endurance, but as a question of whose worlds are sustained, transformed, or allowed to fade through digital practices.
Sustainability, from this perspective, is not only about keeping data alive. It is also about circulation, reuse, reinterpretation, care, neglect, and even release. Data may migrate across multiple digital Umwelts—archives, platforms, communities, disciplines—changing their meanings and functions along the way. At the same time, some data may lose relevance, remain unused, or demand ethical reconsideration regarding their continued existence.
This conference provides a forum to explore how digital humanities can engage with these questions across various theoretical, methodological, practical, ethical, and regional perspectives. Contributions may be theoretical, methodological, empirical, technical, practice-based, reflective, ethical, or regional, and interdisciplinary approaches are especially encouraged.
Topics of Interest (include, but are not limited to)
We welcome papers, panels, posters, and other formats addressing topics such as:
- Digital sustainability through adaptation, transformation, and reuse
- Data lifecycles, circulation, reuse, and transformation
- Umwelt, context, and situated meaning in digital humanities
- AI and Machine Learning as distinct digital Umwelts
- Whose data are preserved, and whose are marginalized or lost
- Community-based archives and local knowledge infrastructures
- Indigenous, minority, and endangered-language data practices
- Ethical questions of care, ownership, access, and responsibility
- Data governance, power, and institutional environments
- Infrastructure, platforms, and their implicit “worlds”
- Forgetting, obsolescence, deletion, and non-use as design choices
- Cross-cultural and cross-regional perspectives on digital data
- Environmental, social, and cultural sustainability in DH
- Rethinking archives, databases, and collections as living worlds
However, it's important to clarify that the conference's scope extends beyond the theme. Topics of interest span a wide range, including AI, data mining, information design and modeling, software studies, and humanities research enabled through the digital medium; computer-based research and computer applications in literary, linguistic, cultural, and historical studies, including electronic literature, public humanities; and interdisciplinary aspects of modern scholarship. Examples might include text analysis, corpora, corpus linguistics, language processing, language learning, and endangered languages; the digital arts, architecture, music, film, theater, new media and related areas; the creation and curation of humanities digital resources; and the role of Digital Humanities in academic curricula. The range of topics covered by Digital Humanities can also be consulted in the journal Digital Scholarship in the Humanities (http://dsh.oxfordjournals.org/), Oxford University Press.
Abstracts submitted should be of 500-1000 words in length in English, including the title and authors’ names.
Please submit abstracts via the ConfTool website below, which is not yet open, by 11:59 PM, 15 Apr, 2026 (HAST).
https://www.conftool.net/jadh-2026/ (TBA)
Submissions for presentation papers will be accepted starting around February at the same URL above:
Presenters will be notified of acceptance on May 30, 2026.
Type of proposals:
- Interactive presentations: Interactive poster session presentations may include work-in-progress on any of the topics described above as well as demonstrations of computer technology, software, and digital projects.
- Short papers: Short papers are allotted 10 minutes (plus 5 minutes for questions) and are suitable for describing work-in-progress and reporting on shorter experiments and software and tools in early stages of development.
- Long papers: Long papers are allotted 20 minutes (plus 10 minutes for questions) and are intended for presenting substantial unpublished research and reporting on significant new digital resources or methodologies.
- Panels: Panels (90 minutes) are comprised of either: (a) Three long papers on a joint theme. All abstracts should be submitted together with a statement, of approximately 500-1000 words, outlining the session topic and its relevance to current directions in the digital humanities; or (b) A panel of four to six speakers. The panel organizer should submit a 500-1000 words outline of the topic session and its relevance to current directions in the digital humanities as well as an indication from all speakers of their willingness to participate.
Use of generative AI language tools:
Recently, while chatbots as a new text-generating tool are becoming widespread, various problems have been pointed out. Since the Digital Humanities field needs to respond constructively to this situation, the JADH Program committee does not prohibit it. However, at least at present, generative AI language tools will not be recognized as an author. Instead, please report the significant use of generative AI language tools, as described in the arXiv's policy.
https://blog.arxiv.org/2023/01/31/arxiv-announces-new-policy-on-chatgpt-...
After the conference:
JADH strongly encourages you to improve your presentations at this conference based on the discussions during your presentation and submit them to our open-access journal, the Journal of the Japanese Association for Digital Humanities (https://www.jstage.jst.go.jp/browse/jjadh/list/-char/en).
Contact
Please direct inquiries about any aspect of the conference to:
conf2026 [ at ] jadh.org
Program Committee:
- Naoya Iwata (Nagoya University, Japan), Chair
- Towa Suda (Nagoya University, Japan), Vice-chair
- Kiyonori Nagasaki (International Institute for Digital Humanities/Keio University, Japan), Vice-chair
- Mari Agata (Keio University, Japan), Vice-chair
- Paul Arthur (Edith Cowan University, Australia)
- Marcus Bingenheimer (Temple University, USA)
- Elisa Beshero-Bondar (Penn State Erie, The Behrend College, USA)
- James Cummings (Newcastle University, UK)
- J. Stephen Downie (University of Illinois, USA)
- Maciej Eder (Polish Academy of Sciences, Poland)
- Øyvind Eide (University of Cologne, Germany)
- Makoto Goto (National Museum of Japanese History, Japan)
- Yuta Hashimoto (National Museum of Japanese History, Japan)
- Bor Hodošček (The University of Osaka, Japan)
- Yuho Kitazaki (University of Osaka, Japan)
- Jae-Yon Lee (Ulsan National Institute of Science and Technology, Korea)
- JenJou Hung (Dharma Drum Institute of Liberal Arts, Taiwan)
- Jieh Hsiang (National Taiwan University, Taiwan)
- Akihiro Kawase (Doshisha University, Japan)
- Nobuhiko Kikuchi (National Institute of Japanese Literature, Japan)
- Asanobu Kitamoto (ROIS-DS Center for Open Data in the Humanities / National Institute of Informatics, Japan)
- Naoki Kokaze (Chiba University, Japan)
- Chao-Lin Liu (National Chengchi University, Taiwan)
- Yoko Mabuchi (Wayo Women's University, Japan)
- Hajime Murai (Future University Hakodate, Japan)
- Natsuko Nakagawa (Kyushu University, Japan)
- Satoru Nakamura (University of Tokyo, Japan)
- Chifumi Nishioka (National Institute of Informatics, Japan)
- Ikki Ohmukai (University of Tokyo, Japan)
- Geoffrey Rockwell (University of Alberta, Canada)
- Christof Schöch (Trier University, Germany)
- Martina Scholger (University of Graz, Austria)
- Masahiro Shimoda (Musashino University, Japan)
- Raymond Siemens (University of Victoria, Canada)
- Tomoji Tabata (University of Osaka, Japan)
- Ruck Thawonmas (Ritsumeikan University, Japan)
- Toru Tomabechi (International Institute for Digital Humanities, Japan)
- Ayaka Uesaka (Osaka Seikei University, Japan)
- Karina van Dalen-Oskam (Huygens Institute KNAW & University of Amsterdam, Netherlands)
- Raffaele Viglianti (University of Maryland, USA)
- Christian Wittern (Kyoto University, Japan)
- Taizo Yamada (University of Tokyo, Japan)
- Hilofumi Yamamoto (Institute of Science Tokyo, Japan)
- Natsuko Yoshiga (University of Osaka, Japan)
- Richard Tsai (Academia Sinica)
UK DARIAH Day 2025: Imagining Future Digital Research Infrastructures
The second UK DARIAH day was hosted by the Edinburgh Futures Institute (University of Edinburgh) on Friday 7 November, in collaboration with the five other UK DARIAH partners (King’s College London, University of Brighton, University of Exeter, University of Leeds and the School of Advanced Study, University of London). The event explored the futures of digital research infrastructures in the arts and humanities, with a focus on the current and potential relationships between UK and European infrastructures. It was supported by DARIAH-EU, DISKAH, and the Centre for Data, Culture & Society.
Jennifer Edmond (DARIAH Ireland/Trinity College Dublin) began the day with a keynote that drew on her personal history of engagements with DARIAH across her career to illustrate the crucial impact research infrastructures can have on individual career trajectories. As the current National Coordinator for DARIAH in Ireland, Edmond’s talk demonstrated how effective infrastructure relies on the humans who guide individuals to understand their own potential pathways into larger scale infrastructures and who act as the crucial connective tissue between local, national and international levels.
Edmond’s talk was followed by Sally Chambers’ (DARIAH/British Library) wide-ranging exploration of the different national and regional models of DARIAH membership, demonstrating the importance of adapting models to local contexts and existing national infrastructures. The CLARIAH model used in a number of countries such as Spain and Austria was highlighted, which seeks to combine the strengths of the two most significant European humanities infrastructure projects DARIAH and CLARIN (the Common Language Resources and Tools Infrastructure).
Speakers leading UK-based digital research infrastructures presented on the aims and focus of a series of distinct yet complementary initiatives. William Nixon from Research Libraries UK (RLUK) discussed their new strategy that seeks to further the organisation’s emphasis on collaboration, open research and digital scholarship. André Piza (Turing) shared work commissioned by the AHRC-funded DataCulture project and undertaken with David Beavan (Turing), Arianna Ciula (KCL) and many others to develop a roadmap for national research software engineering capability in the arts and humanities, in recognition of the ever increasing need for greater collaboration between RSEs and humanities researchers. The final two morning presentations from Karina Rodriguez Echavarria (Brighton) and Eamonn Bell (Durham) focused on AHRC/UKRI-funded initiatives to strengthen training and community-building in relation to high performance computing in the arts and humanities. The DISKAH (Digital Skills in Arts and Humanities) fellowship programme is developing a cohort of arts and humanities researchers engaged in large-scale computational methods, while the CCP-AHC (Collaborative Computational Project for Arts, Humanities and Culture) is focused on the sustainable development and discoverability of software, pipelines and workflows for arts and humanities research.
The discussion following the morning’s presentations reflected on the diverse possible future routes to strengthening the connections between UK and European digital research infrastructures. Given the existing digital research connections between the UK and Ireland, particularly through the UK-Ireland Digital Humanities Association, Edmond highlighted the potential for exploring a UK-Ireland regional DARIAH coordination model with an emphasis also on strengthening collaboration across the UK’s four nations.
Over lunch, a community-led showcase featured posters and presentations on a rich variety of activities and contributions from DARIAH UK cooperating partners and beyond. These ranged from discipline-specific initiatives (e.g. a project on digital literary studies) to cross-disciplinary publication and training platforms (e.g. Journal of Open Humanities Data, RESHAPED), and from national mapping exercises of infrastructures to underpinning practices of software engineering processes and infrastructures connected to digital accessibility.
In the afternoon, David Selway spoke on behalf of the iDAH (Infrastructure for Digital Arts and Humanities) programme at the AHRC on their current approach to digital research infrastructures. His talk demonstrated the breadth of recent investments, such as the RICHeS (Research Infrastructure for Conservation and Heritage Science) programme, the Enact Practice Research Data Service and support for the work of the Software Sustainability Institute. Selway emphasised the ongoing nature of the programme and the importance of consultation with the community on its future shape and development.
The final workshop session of the day provided space for collective imaginings of future digital infrastructures. Drawing from their project on Infrastructure Futures for Digital Cultural Heritage, Melissa Terras and Jen Ross (Edinburgh) encouraged us to be hopeful and creative in our infrastructure discussions. Workshop participants were given the opportunity to discuss a selection of thought-provoking scenarios as prompts for reflecting on the current and future design of digital infrastructures. The workshop highlighted the diversity of potential infrastructure futures and the value of speculative design in prompting us to think beyond existing models and constraints.
In sum, the day provided a valuable opportunity to reflect on both existing digital infrastructure developments and to imagine potential futures. The day’s talks demonstrated the breadth of recent infrastructure investments in a range of digital research initiatives for the arts and humanities in the UK. From an open research perspective, the event reinforced the view that openness, interoperability, and recognition for data and software work are foundational to building sustainable and connected digital research infrastructures. At the same time, discussions throughout the day foregrounded the importance of the interconnectivity of infrastructures and of events like the DARIAH day for strengthening and forging connections. For just as we need to think beyond local institutional infrastructures in our national context, we must also be conscious of the risks of nationally siloed infrastructures and of the ways knowledge sharing and connections at the international level can further amplify the impact and reach of the UK’s digital research infrastructures.
Authors: Naomi Wells (School of Advanced Study), Lisa Otty (University of Edinburgh), Arianna Ciula (King’s College London), Barbara McGillivray (King’s College London)

This post is republished from The Edinburgh Centre for Data, Culture & Society website.
DMR 2026 评测任务 | UMR 自动解析评测正式发布
徐惠 2026-02-03 00:00 江西
DMR2026 UMR自动解析评测发布,含时间、数据、方式等关键信息。
DMR 2026(The 7th International Workshop on Designing Meaning Representations,第七届语义表示设计国际研讨会)将作为 LREC 2026的官方研讨会,于2026年5月11日至16日在西班牙马略卡岛举办。本次研讨会设置评测任务,由Charles University组织,旨在评估自动生成UMR(Uniform Meaning Representation,通用语义表示)标注的不同方法。
评测关注从文本到语义表示的整体建模能力,涵盖句子级语义图结构、节点属性、语义节点与表层文本之间的对齐关系,以及跨句子的篇章级语义关系。UMR是一种较新的语义表示形式,面向语言学类型差异显著的多语言场景,致力于提供统一、可对齐的语义表示框架。尽管UMR在设计理念上源于 AMR,但在表示层次和标注体系上均存在显著差异。与AMR在CoNLL 2019和2020年评测任务中已得到系统性研究和广泛应用相比,UMR自动解析仍处于起步阶段,相关研究和实践正在开展当中。
01、评测任务官方网站
02、时间安排(Timeline)
2026年2月1日:发布训练集(Train)与验证集(Dev)。
2026年2月16日:发布盲测测试集(Blind test),测试阶段开始。
2026年2月27日:系统输出结果提交截止,测试阶段结束。
2026年3月1日:公布评测结果。
2026年3月15日:系统报告论文提交截止。
2026年3月22日:系统报告论文评审完成。
2026年3月30日:终稿(Camera-ready)提交截止。
03、数据(Data)
本次评测任务训练数据基于UMR 2.1,包含英语、中文和捷克语(以上语言均提供训练集与测试集),可能还会包含其他语言(仅提供测试集),测试数据规模为每种语言约100句。
所有训练集与开发集数据将免费公开,无需注册或签署任何使用协议。此前未公开的测试数据将在评测任务结束后,以相同方式公开发布。
盲测数据集已经完成分词与句子切分;系统输出结果需严格保持输入中的分词和句子切分一致。
04、评测方式(Evaluation)
评测标准包括Smatch和AnCast,以及由任务组织者开发的节点映射算法。详细的评测方案及评测工具将于 2026年2月1日前发布。
评测任务会选用一个主评测指标用于系统排名,同时计算若干附加指标(例如概念识别的F1值),主要聚焦于句子级语义图结构。对于支持相关预测的系统,还将额外评测篇章级关系以及节点与词语之间的对齐关系。
本次评测任务不划分子赛道,所有系统均在同一评测体系下进行评估。
05、参与方式(Participation)
注册(Registration):
有意参与评测的个人或团队需填写Google Form(链接:https://forms.gle/pc2c7A27TxeHjRKZ7)进行注册。注册无截止日期,但强烈建议尽早注册,以便通过邮件接收重要通知。
提交(Submission):
参赛者提交的是系统输出结果(解析后的数据),而非系统本身。
【提交入口由Charles University提供,链接将在评测任务官网公布。每次结果提交都会进行自动合法性检查。本次评测任务对所有研究者开放,无任何参与限制。】
06、任务组织者(Organizers)
本次评测任务由 Daniel Zeman 与 Jan Štěpánek(Charles University)共同组织。
两位组织者在自然语言处理领域具有丰富的评测任务组织经验,曾主导或参与多项 CoNLL 与 MRP 评测任务,研究方向涵盖多语言语义角色标注、依存句法分析以及多语言语义表示解析等。
比特人文
投稿邮箱:dhbase@126.com
扫码关注 获取更多资讯
“字”从遇见你:国内首家文字学博物馆开放
欢迎关注 2026-02-03 00:00 江西
分享一篇文章
中体佳: “字”从遇见你:国内首家文字学博物馆开放
日前,国内首座以文字学为核心主题的专题博物馆——文字学博物馆正式于海淀树村落成开放。文字学博物馆由中国文化研究会和海淀区政府合作设立,旨在为公众搭建起跨越千年的文字文明对话平台,让古老汉字与各民族文字在新时代焕发新生机。
没有网红展馆的喧嚣,却在一字一画、一器一拓里,读懂了文字从刻痕到笔墨的生长轨迹。展馆陈设,从文字的产生、定义、体系与传承,以及文字何以重要。
推门而入便被入口处的甲骨文“名”字馆徽吸引。
该博物馆的前身为中国文化研究会于1992年主题为“汉字走向21世纪”的展览。时逢计算机实现汉字录入,人们产生了关于汉字会不会消亡的讨论。通过开设此展览与交流并得出结论:中国文字会像中华文明一样源远流长。
建国初期,汉字发展曾面临重大抉择:要不要沿用方块字,推行拉丁化是否更利于扫盲,成为各界热议焦点,苏联专家亦曾建议以拉丁化。
毛主席力排众议,明确指出“中国历史就体现在方块字里”,坚定守护汉字文脉,同时推动汉字简化,让古老方块字既承载千年历史,又适配时代需求、便利大众使用。
中国语符进化:肢体语言,鸟兽之鸣,人类语言,语言符号,文字与语言符号并行,文字时代。
笔写为书。刀刻为契。
爨,cuan 4,一字描述了“烧火做饭”的全景全流程。京西门头沟有个“爨底下村”,村里有好吃的豆腐。
苏东坡抬杠王安石↑
展板中展示的“温”字甲骨文,取象于人在浴盆中沐浴的形态,本义为“温水沐浴”,后引申出温暖、温柔、温习等含义。这一造字逻辑也呼应了虢季子白盘作为水器的功能属性,体现了商周时期文字与器物的关联。
甘甜,唯一嘴里能含得住的口味。
孔子曰:“觚不觚,觚哉!觚哉!”
核心意:器具不像该有的样子,还算器具吗?实则吐槽礼崩乐坏、名实不符。
馆内陈列文物皆为复制品。
这不是戒尺,是“概”:大概齐~就这么来的。
这座藏在海淀树村的小众展馆,没有厚重的门槛,却能让每个走进来的人,在慢逛细品中读懂文字的力量。央视有一部很不错的纪录片《“字”从遇见你》,非常推荐。
文字学博物馆
地址:海淀区正白旗西路1号院20号
时间:周二至周日09:00-16:00(周一闭馆)
门票:免费参观,10:00和14:00 有志愿者讲解。
文字学博物馆当前处于试运营阶段,免费向公众开放。官方小程序已开通个人预约通道。
欢迎关注中体佳,
Building Folkloric Futures: A Behind-The-Scenes Look At Designing A Speculative Digital Archive Of Caribbean Storytelling
What would it mean to design a digital archive that doesn’t simply preserve the past, but actively looks both backward and forward—one that helps us think differently about how the past and future speak to each other?
This question kept coming up as I began building Folkloric Futures, an Omeka-based digital archive that brings together Caribbean folklore, literature, visual art, and community storytelling. From the beginning, I knew I didn’t want to create an archive that treated folkloric figures as static artifacts or neatly categorized traditions. These stories are alive. They change depending on who tells them, where they’re told, and why they’re remembered.
Folkloric Futures started as a way to test that idea in practice.
I’m a PhD candidate in English at the University of Virginia, and my academic research focuses on Caribbean literature and speculative storytelling. My dissertation looks at how folkloric Caribbean figures like the soucouyant, douen, jumbie, and moko jumbie move across novels, oral traditions, and visual culture—and how those movements shape ideas about identity, belonging, and survival. But I kept asking myself a bigger question: what would it look like to take those ideas out of a dissertation and build something people could actually explore, use, and contribute to?
This project is my attempt to answer that.
Why folklore—and why speculation?
There’s a line from Martinican writer Patrick Chamoiseau that I return to often: “Their eyes had seen so much that they no longer distinguished between dream and reality” (from Creole Folktales). For me, that line captures what folklore does best. These stories don’t offer neat explanations of the past; they give people ways to live alongside it.
Caribbean folkloric figures are full of contradictions. The soucouyant is frightening, but also powerful—an older woman who sheds her skin and moves through the night as fire. The douen is a child spirit who lingers at the edge of the forest, both vulnerable and unsettling. The moko jumbie towers above the crowd during Carnival, part guardian, part performer. These figures carry history in ways that are felt rather than explained—through fear, humor, warning, and care.
Speculation gives me a way to work with that complexity. Instead of asking, “What is this figure?” speculation asks, “What can this figure do?” What stories does it carry? What futures does it hint at? What happens if we design an archive that allows those meanings to shift rather than settle?
Designing an archive that tells stories
At a basic level, Folkloric Futures is a digital archive built in Omeka. It brings together literary excerpts, oral histories, visual art, and creative reinterpretations of Caribbean folklore. But very quickly, I realized that the hardest part of the project wasn’t collecting materials—it was deciding how the archive should feel.
Most digital archives aim for visual consistency and neutrality. This one couldn’t. These figures don’t belong to a single mood, palette, or structure. So instead of designing one uniform template, I let each figure shape its own page.
The soucouyant’s page uses deep violets and ember-like gradients to suggest heat, night, and movement. The douen’s page is quieter, built around forest greens and shadow, echoing stories of childhood loss and ecological liminality. The moko jumbie’s page is bright and vertical, drawing on the energy of Carnival and the figure’s role as a watcher from above.
These choices aren’t just aesthetic. They’re a way of letting design do some of the storytelling work—guiding how people encounter each figure before they ever read a word.
Metadata, but make it human
Metadata turned out to be one of the most surprising parts of this project.
Folkloric figures don’t stay in one place. Their names change across islands, and their meanings shift between generations. Trying to force them into fixed categories felt like losing what mattered most about them. So instead of treating metadata as a rigid checklist, I started treating it as something closer to a set of prompts.
Instead of asking only where a figure comes from, the archive makes room for multiple origins. It doesn’t settle on a single interpretation, but allows overlapping themes and contradictions to sit side by side. In this way, metadata becomes another storytelling layer—one that reflects how folklore actually moves through the world.
Ethics as something you build in, not add later
Because Folkloric Futures works with living traditions, ethics could not be an afterthought. Early on, I wrote a project charter to guide decisions about collaboration, credit, and care.
That meant committing to a few core ideas:
- contributors are collaborators, not data sources
- artists deserve material compensation
- people should control how their stories are shared
- accessibility matters, especially for oral and low-bandwidth storytelling
These principles shape everything from submission forms to design choices. Ethics, in this project, isn’t a separate section—it’s part of the infrastructure.
Teaching as part of the archive
Folkloric Futures is also a teaching project. In Spring 2026, I’ll be running a workshop series that invites participants to experiment with archives, oral storytelling, mapping, and creative worldmaking—using both digital tools and low-tech alternatives.
The goal isn’t technical mastery—every workshop includes a low-tech version by design. It’s about helping people see archives as places where stories can be questioned and expanded. In this way, teaching feeds back into the archive, and the archive becomes something shaped by ongoing learning rather than a finished authority.
What building in public has taught me
Working on this project has changed how I think about archives. I’ve learned that design decisions are never neutral, that aesthetics shape interpretation, and that building in public requires patience, iteration, and accountability.
Most of all, it’s reinforced my belief that speculation isn’t escapism. In Caribbean storytelling, imagination is often a survival strategy—a way of carrying history forward without being trapped by it. Folkloric Futures tries to honor that by creating a digital space that doesn’t just preserve stories, but invites people to think with them.
Because an archive, at its best, doesn’t just hold the past. It helps people live with it.
【新聞稿】2026台北國際書展:展現百年知識「藍圖」 首度揭開中研院區建築軌跡
Hacia un marco analítico verdaderamente latinoamericano de análisis de políticas públicas sobre ciberseguridad

Por Erick Mendoza Lara
Programa de Jóvenes Investigadores en Humanidades Digitales
La ciberseguridad en América Latina no puede entenderse desde las mismas lógicas que guían su análisis en contextos nacionales aislados. Cuando observamos el caso mexicano, encontramos un sistema público de ciberseguridad que, pese a sus esfuerzos institucionales, organizacionales, financieros y programáticos resultan insuficientes para cubrir el espectro completo de amenazas que representa el ciberdelito.
Esta insuficiencia no es casual ni exclusiva de México, responde a la característica estructural de la criminalidad digital que trasciende fronteras con una facilidad que algunos marcos analíticos publicados aún no han logrado capturar adecuadamente.