DHlab представила проект «VR-путешествие по Солнечной системе» на «Неделе космоса»
Сообщение DHlab представила проект «VR-путешествие по Солнечной системе» на «Неделе космоса» появились сначала на DHlab.
Сообщение DHlab представила проект «VR-путешествие по Солнечной системе» на «Неделе космоса» появились сначала на DHlab.
Сообщение Лаборатория Digital Humanities СФУ представила VR-тренажёр «VR следж-хоккей: Вызов» на Всеармейском форуме «Преодоление» появились сначала на DHlab.
안녕하세요! 카이스트 디지털인문사회과학부의 김태균입니다.
올해 여름, KAIST에서 계산사회과학(Computational Social Science, CSS)에 관심 있는 분들을 위한 집중 프로그램인 <2026 SICSS-Korea (Summer Institute in Computational Social Science)>를 KDI School과 함께 개최할 예정입니다(with 윤지성 교수님, 조성아 교수님).
최근 들어 계산사회과학은 그 어느 때보다 중요해지고 있습니다. 이는 새로운 방법론의 등장 때문만이 아니라, 사람, 정보, 기술, 제도 등이 서로 얽혀 만들어내는 사회적 과정을 사회과학의 이론적 관점과 데이터·컴퓨팅을 결합하여 이해하는 것의 중요성이 매우 커지고 있기 때문입니다. 특히나 인공지능이 이러한 사회적 과정 위에서 작동하고 이를 다시 재구성하는 핵심 기술로 자리 잡으면서, 이러한 이해의 필요성은 아주 커지고 있습니다.
이런 맥락에서 계산사회과학은 사회과학 연구에 컴퓨팅을 적용하는 것을 포함하는 건은 물론이거니와, 사람, 정보, 기술, 제도 등이 어떻게 상호작용하는지를 이해하려는 다학제적 시도입니다. 정치학, 지리학, 사회학, 커뮤니케이션, 경제학 등 다양한 사회과학 분야와, 산업공학, 컴퓨터과학, 정보학, 네트워크과학 등의 통찰을 연결하며, 그동안 분절적으로 다뤄져 왔던 연구 흐름들을 하나의 관점으로 통합합니다.
—
이번 프로그램에는 국내외에서 활동하는 계산사회과학 분야의 탑 클래스 연구자들이 참여하여 강연을 진행할 예정입니다. 최신 연구 흐름과 방법론을 직접 접할 수 있는 기회가 될 것입니다. 이와 더불어, 이번 프로그램은 단순한 강의 중심 프로그램에 그치지 않고, 참가자들이 직접 아이디어를 발전시키고 함께 연구를 논의하는 작고 밀도 있는 1주 프로그램으로 구성되어 있습니다.
약 15명 내외로 소수 인원을 선발하며, 선발된 참가자에게는 KAIST 기숙사 숙박 및 다수의 식사가 지원됩니다(단, 이동 비용은 지원되지 않습니다).
다음은 주요 일정입니다. 특히 4월 23일 2시에 온라인 설명회가 예정되어 있으니 많이 참여 부탁 드립니다(RSVP 링크 및 줌 링크는 포스터 참고):
일정: 2026년 6월 22일–27일
장소: KAIST 대전 캠퍼스 N4 디지털인문사회과학부
온라인 설명회: 2026년 4월 23일 (오후 2시, KST)
지원 마감: 2026년 5월 4일
결과 발표: 2026년 5월 6일

게시물 2026 SICSS-Korea이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.
https://site.hanyang.ac.kr/web/faculty/26-3-5

게시물 [채용] 전임 / 한양대 인문과학대학 / 2026년도 2학기이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.
徐惠 2026-04-10 09:00 江苏
![]()
张民团队获吴文俊AI科技进步特等奖,其NLP技术达国际领先且应用广泛。
转载自“中国人工智能学会”
吴文俊人工智能科学技术奖
2026年3月29日,第十五届吴文俊人工智能科学技术奖颁奖典礼在常州隆重举行,现场颁发了科技贡献奖、科技进步奖、自然科学奖、技术发明奖及青年科技奖等多个重磅奖项,全方位致敬在智能科技领域深耕细作、勇攀高峰的先行者们。今天,我们将走近2025年度吴文俊人工智能科技进步奖特等奖获奖项目——深度自然语言理解和生成关键技术及应用。
PART.01
『项目简介』
【成果名称】深度自然语言理解和生成关键技术及应用
【完成人】张民,李俊涛,陈科海,余正涛,肖桐,户保田,刘学博,李正华,骆卫华,王超超,李军辉,张梅山,高盛祥,黄于欣,朱靖波
【完成单位】哈尔滨工业大学(深圳),苏州大学,阿里巴巴达摩院(杭州)科技有限公司,昆明理工大学,智慧芽信息科技(苏州)有限公司,东北大学
【提名单位】哈尔滨工业大学(深圳)
第一完成人简介
![]()
张民教授
哈工大(深圳)特聘校长助理,计算与智能研究院院长,苏州大学未来科学与工程学院院长。ACL/AAIS Fellow。国自然创新群体(A 类)首席科学家,国家杰青,“国家百千万人才工程”入选者,国家有突出贡献中青年专家,享受国务院政府特殊津贴。AFNLP 候任主席,ACL/SIGHAN 主席 (2020-2023)。研究方向包括自然语言处理、大模型、人工智能和 AI4SE。CSRankings NLP 领域个人和团队排名世界第一(2022-2026),Best Paper 5 篇(ACM MM 2022、COLING 2022 等)。提出以语言为核心的语言智能原生的人工智能新范式,团队自主研发“立知”Uni-MoE 全模态混合专家大模型,是国内高校唯一拥有完整自主知识产权、获网信办和工信部双认证的大模型,实现了大模型技术从“跟跑”,到“并跑”和“领跑”的跨越式发展。曾或现任 IEEE/ACM T-ASLP、CL、NLE、JCST、中国科学:信息科学、软件学报等 11 本国内外学术期刊编委和高级领域编委。
团队项目简介
![]()
![]()
![]()
![]()
团队风采
语言是知识的载体,文字是知识的固化,语言智能是人工智能的基石。项目团队几十年来聚焦语言智能研究,历经以语言学为基础的符号逻辑主义时代,以特征工程为核心的统计机器学习时代,以预训练和单一任务精调的深度学习时代,迎来了智能涌现的大模型时代。团队始终坚持“一个中心、两个基本点”的科学理念,即以“语言智能”为核心,以“语言结构与语义的深度理解”和“语义连贯与准确的高效可控生成”为基本点,提出了符号主义与连接主义有机融合、以语言为核心的语言智能原生的人工智能新范式,自主研发“立知”Uni-MoE 全模态混合专家大模型,攻克了多项智能建模技术难题。项目成果获多位诺贝尔奖得主、图灵奖得主 Geoffrey Hinton、Yoshua Bengio 和 OpenAI 创始人等国际顶尖学者引用和积极评价,经院士专家鉴定达国际领先水平,并成功应用于阿里巴巴等几十家企业,支撑产品进口替代、打破国外封锁,近三年创收超 160 亿元,技术年调用量逾 6000 亿次,服务全球 200 余个国家和地区的数十亿消费者,月活设备超 6 亿台。
PART.02
『获奖理由』
本项目由哈尔滨工业大学(深圳)牵头,联合苏州大学、阿里巴巴达摩院(杭州)科技有限公司、昆明理工大学、智慧芽信息科技(苏州)有限公司、东北大学六家主要完成单位,面向深度自然语言理解与生成这一人工智能核心领域,针对复杂语义理解、自然语言生成、跨领域适配等关键问题取得了突破性进展。主要技术创新包括:提出了复杂语言结构与深层语义的高精度理解方法,融合了多源符号知识的高效可控文本生成范式和混合专家驱动的垂直领域自适应框架,建立了深度语言理解新体系,实现了语义精准、一致连贯的文本生成,并增强了跨模态、跨领域的自适应能力。项目技术已在多个行业头部企业大规模落地应用,取得显著经济与社会效益,有力推动行业创新与技术进步。整体技术达到国际先进水平,产业应用成效突出,推广前景广阔。
中国人工智能学会副理事长赵春江院士为张民教授颁奖
获奖感言
![]()
能获此奖,莫大荣焉!我们深知,这份荣誉不仅是授予我们的,更是授予所有为人工智能事业默默耕耘的奋斗者,是对自然语言处理和“智能涌现”大模型时代的充分认可!
衷心感谢中国人工智能学会和吴文俊人工智能科学技术奖励委员会。吴先生等前辈们在新中国诞生之初百废待兴中开创中国人工智能研究之先河,励精图治,使中国成为唯一能和美国并跑的人工智能强国,中国人工智能学会成为中国最具权威性的人工智能学术组织。
人类社会已经进入人工智能时代,时代飞速发展,人类社会将被重塑,人类面临前所未有的挑战和机遇。让我们一起,抓住这一历史机遇,为实现我国人工智能科技自立自强、中华民族伟大复兴和全人类的人工智能事业快乐幸福地工作和生活!
![]()
比特人文
投稿邮箱:dhbase@126.com
扫码关注 获取更多资讯
![]()
2026-04-10 08:31 湖北
![]()
Social Network Analysis and Text Mining for Big Data: The Power of Words and Networks提出了前沿的方法和工具,弥合了文本挖掘与社交网络分析研究之间的鸿沟,同时也为分析大规模文本和网络数据提供了新的见解。
![]()
《面向大数据的社会网络分析与文本挖掘:语言与网络的力量》(Social Network Analysis and Text Mining for Big Data: The Power of Words and Networks)提出了前沿的方法和工具,弥合了文本挖掘与社交网络分析研究之间的鸿沟,同时也为分析大规模文本和网络数据提供了新的见解。这些工具旨在满足商业分析师和研究人员的需求,以助力开创性分析结果的产生。
本书首先对社会网络分析和文本挖掘给出了明确定义,并融合了作者在该领域广泛研究中精心挑选的方法和工具。随后,重点演示了词汇与网络之间的相互作用如何释放大数据分析的全部潜力。书中的核心亮点是 Semantic Brand Score (SBS),这是一种通过文本分析评估品牌重要性的多功能且强大的指标。以上内容均通过实际应用和案例研究得到了证实与阐述,展示了这些分析方法在支持变革和优化管理决策方面的价值。书中还介绍了一款专门的软件工具,帮助用户执行文中详述的各项分析。
该书是商业领袖、营销专业人士、政策制定者、研究人员和大学生的必读之作。它为提升公司绩效和社会行动成效提供了实用的洞察和可操作的建议。全书写作风格兼顾了专业性与易读性,使资深研究人员和初涉该领域的读者都能理解其中的复杂概念。
一
作者介绍
![]()
安德烈亚·弗龙泽蒂·科拉东
Andrea Fronzetti Colladon
Andrea Fronzetti Colladon在罗马第三大学(Roma Tre University)担任教授,并负责领导商业与集体智能实验室(Business and Collective Intelligence Lab)。他致力于研究组织与个人的沟通、决策及变革模式,通过解码复杂系统为管理决策提供科学依据。他的研究融合了网络科学、自然语言处理和机器学习方法,并与社会科学、心理学和人文学科理论相结合,体现了深厚的跨学科底蕴。他发明了语义品牌评分(Semantic Brand Score)和OCEAN™变革管理模型(OCEAN™ Change Management Model),旨在将学术洞察转化为组织领导者可用的实践工具。其学术足迹涵盖了与麻省理工学院集体智能中心(MIT Center for Collective Intelligence)、东北大学(Northeastern University)和西奈山医院(Mount Sinai Hospital)等国际顶尖机构的广泛合作。作为多部学术著作的作者,他的代表作品包括本书以及《引领有意义的变革》(Leading Meaningful Change),这些著作为理解语言与网络在数据分析中的力量提供了重要框架。此外,他还通过教学与咨询服务于TIM(TIM)、Enel(Enel)和萨奇广告(Saatchi & Saatchi)等知名企业,助力团队应用创新管理工具并在复杂环境中提升竞争力。
![]()
罗伯托·韦斯特雷利
Roberto Vestrelli
Roberto Vestrelli现为意大利佩鲁贾大学(University of Perugia)工业与信息工程专业的博士候选人。他与安德烈亚·弗龙泽蒂·科拉东教授(Andrea Fronzetti Colladon)合著了《大数据的社会网络分析与文本挖掘:词汇与网络的力量》(Social Network Analysis and Text Mining for Big Data: The Power of Words and Networks)一书,展示了其在大数据分析领域的学术造诣。罗伯托·韦斯特雷利(Roberto Vestrelli)的研究方向集中于社会网络分析、文本挖掘及其在商业、环境治理与社会科学中的应用。他的研究成果涵盖了气候风险信息披露对企业价值的影响、媒体在塑造能源叙事中的作用,以及大语言模型在评估新闻自由时的表现等前沿课题。此外,他还参与开发了针对GDELT数据库(GDELT)的文本重构工具,并致力于通过大数据方法分析非洲地区的外国直接投资决定因素。通过将语义品牌评分等量化指标应用于数字营销与服务管理,他为理解复杂网络中的言论力量提供了重要的技术支持与理论视角。
二
出版信息
书名:《面向大数据的社会网络分析与文本挖掘:语言与网络的力量》(Social Network Analysis and Text Mining for Big Data: The Power of Words and Networks)
作者:Andrea Fronzetti Colladon, Roberto Vestrelli
出版时间:2025年6月20日
出版社:Routledge
DOI:
三
内容简介
本书系统展示了语言与社会网络相互交织所产生的深刻影响。该书的核心论点在于,文本与社会联系并非彼此孤立的两类对象,而是在持续互动中共同塑造人的观念、态度乃至更广泛的历史进程。作者以跨学科的研究视野,将社会网络分析(social network analysis, SNA)与文本挖掘加以整合,旨在揭示大数据表象之下更为复杂的社会关系结构与意义生成机制。
在方法层面,本书首先从社会网络分析的基本概念出发,细致介绍了节点、边、中心性和社群发现等关键工具,并说明这些分析框架如何被用于识别非正式领导者、追踪信息传播路径以及刻画群体内部的互动模式。随后,论述转向文本挖掘领域,涉及语料预处理、命名实体识别、情感分析等核心技术。全书最具特色之处,在于将二者加以有机结合:作者不仅将文本转化为词汇共现网络,还提出了语义品牌评分(Semantic Brand Score, SBS)这一指标,用以衡量某一品牌、概念或议题在社会话语中的重要性、关联性与记忆度。
本书试图回应的一个关键问题,是传统大数据分析中结构维度与语义维度之间长期存在的割裂。在海量非结构化文本的处理中,单纯依赖词频统计往往难以揭示更深层的意义关系,而复杂的机器学习模型虽然具有较强的预测能力,却常常因其“黑箱”特征而缺乏充分的可解释性。针对这一局限,本书提出了一条兼具理论解释力与方法可操作性的研究路径,即通过考察词语之间的连接关系来界定其意义生成方式。与此同时,它也在一定程度上克服了传统问卷调查中常见的响应偏差问题:通过对电子邮件流、社交媒体评论等自然生成数据的分析,研究者能够更接近群体行为与决策过程中的“诚实信号”,从而获得对社会互动模式更为真实的把握。
对于数字人文研究而言,这本书具有明显的方法论启发意义。它既可被视为连接计算分析与人文解释的桥梁,也可被视为重新审视文化、历史与社会现象的一种分析透镜。借助书中所提供的工具与案例,研究者得以超越传统质性细读的单一路径,在大规模文本数据中识别潜在的主题演变、话语结构与权力关系。无论是分析媒体报道、法律文献,还是文学文本——例如书中讨论的《爱丽丝梦游仙境》——这种方法都展示出较强的解释潜力。它不仅有助于重构历史语境中话语如何被策略性地使用,例如俾斯麦对电报文本的修辞性处理,也能够用于考察当代社会在气候风险、人工智能等议题上的认知偏向与舆论形成机制。
四
章节目录
一、 语言与网络的隐藏力量:统一分析方法
二、网络分析:核心概念与指标
1 社会网络分析
2 基础术语
3 从头构建网络
4 全网络指标
5 聚类与社区
5.1 聚类
5.2 社区发现
5.2.1 Louvain 算法
6 相似性度量
6.1 Jaccard 相似性
6.2 SimRank 与其他度量
6.3 同质性与同类匹配
7 网络拓扑结构
8 网络鲁棒性与韧性
8.1 碎裂化度量
8.2 网络拓扑对其鲁棒性的影响
9 节点中心性
9.1 度中心性
9.2 接近中心性
9.3 中介中心性与结构洞
9.4 特征向量中心性
9.5 独特中心性
10 关键角色
11 考虑时间:互动性度量
11.1 轮换领导力
11.2 贡献的响应性与平衡
11.3 同步性
三、文本挖掘
1 语料库预处理
1.1 描述性统计
2 命名实体识别
3 关键词提取与文档分类
3.1 文档分类的特征提取
3.2 文档相似性
3.3 寻找同义词和相关词汇
4 内容分析
4.1 新颖性与信息量
4.2 可读性与数值强度
4.3 情绪挖掘
4.4 代词与关系词
5 构建自定义度量:效度与信度
四、从语言到网络
1 构建词网络
2 语义品牌评分
2.1 品牌形象与联想
2.2 提高品牌连接性
3 网络主题模型
五、文本挖掘与社会网络分析的集成:案例研究与应用
1 媒体报道揭示了领先科技公司的品牌重要性吗?
1.1 理解语料库特征
1.2 寻找最相关的语料库内容
1.3 衡量科技巨头的语义重要性
1.4 理解品牌重要性的驱动因素
1.5 区分语义重要性的正负驱动因素
2 评估工作的未来:哪些工作最容易受到人工智能颠覆?
2.1 从在线新闻中识别 AI 技术
2.2 AI 的角色
2.3 衡量暴露程度
2.4 创新度量
3 数据驱动的职场文化提升方法
3.1 区分正面评论与负面评论的因素是什么?
3.2 主题模型与多语言分析
3.3 内容分析
4 通过 Airbnb 评论的文本挖掘评估纽约市的城市体验
4.1 空间自相关与价格相关性
4.2 城市特征相关性
4.3 品牌形象
![]()
![]()
![]()
五
章节摘要
第一章
语言与网络的隐藏力量:统一分析方法
语言和网络在塑造历史、文化和人类行为方面拥有巨大的力量。本引言章节探讨了词汇如何通过精心构建的叙事产生激发情感反应、驱动社会变革或引发冲突的潜力,正如 Franco-Prussian War 期间的 Ems Dispatch 所证明的那样。与此同时,通过 Social Network Analysis (SNA) 描绘的人类联系揭示了维系社会、影响领导力并推动运动的隐藏结构。当 Text Mining 与 SNA 的技术工具相结合时,会产生极具价值的洞见,从而使人们能够更深入地理解决策过程和社会动态。基于这一观点,本章介绍了支持复杂系统研究的分析工具,阐明了语言和网络如何塑造人类互动以及社会结果。
Words and networks hold immense power in shaping history, culture, and human behavior. This opening chapter explores how words, through carefully crafted narratives, have the potential to evoke emotional responses, drive societal change, or initiate conflicts, as demonstrated by the Ems Dispatch during the Franco-Prussian War. At the same time, (human) connections – mapped through social network analysis (SNA) – reveal the hidden structures that bind societies, influence leadership, and drive movements. Invaluable insights emerge when the techniques and tools of text mining and SNA are combined, enabling a deeper understanding of decision-making processes and social dynamics. In line with this view, this chapter introduces analytical tools to support the study of complex systems, shedding light on how words and networks shape human interaction and societal outcomes.
第二章
网络分析:核心概念与指标
本章介绍了(社会)网络分析的基础与高级概念,为理解网络如何辅助研究复杂现象奠定了坚实基础。内容从定义网络及其核心组成部分(如节点与边)展开,解释了如何利用来自访谈或非结构化来源的数据来表述和分析社会现象。通过引入中心性指标,本章使读者能够识别网络中处于战略位置的节点,并探讨了聚类与社区,重点介绍了在图谱中检测这些结构的技术。讨论进一步延伸至识别社会系统中的关键角色,以及理解网络位置变迁所带来的影响。此外,本章还探索了动态网络分析,概述了考察随时间演变的互动动态的方法,并引入了诸如轮换领导力等指标。依托作者的专业积累,本章对其实际科研工作中应用最广、影响最大的指标和技术进行了实用的、以研究为导向的综述。本章并不追求面面俱到,而是旨在为读者提供掌握并应用基础与高级概念所需的核心工具。
This chapter introduces fundamental and advanced (social) network analysis concepts and builds a foundation for understanding how networks help study complex phenomena. It begins with defining networks and their main components, such as nodes and edges. The chapter explains how to represent and analyze social phenomena using data from interviews or unstructured sources. It introduces centrality metrics, enabling readers to identify strategically positioned nodes within a network, and examines clusters and communities, focusing on techniques to detect them in a graph. The discussion extends to identifying key roles within a social system and understanding the implications of positional changes in a network. The chapter also explores dynamic network analysis, outlining methods for examining time-evolving interaction dynamics and introducing metrics such as rotating leadership. Building on the authors’ expertise, this chapter offers a practical, research-driven overview of the most impactful metrics and techniques used in their scientific work. Rather than aiming for exhaustive coverage, it focuses on equipping readers with essential tools needed to grasp and apply both foundational and advanced concepts.
第三章
文本挖掘
本章全面介绍了文本挖掘与自然语言处理(NLP),重点探讨了分析大规模非结构化文本数据的实用技术。内容涵盖了数据预处理、情感分析和命名实体识别等核心方法,并特别侧重于词网络的构建与解读。文中展示了评估文本特征(如新颖性、信息量和复杂性)的基础及高级方法。此外,本章还突出了社会网络分析在考察词汇关系中的创新应用,为文本数据分析提供了独特的视角。
This chapter offers a comprehensive introduction to text mining and natural language processing (NLP), emphasizing practical techniques for analyzing large-scale unstructured text data. It covers core methods like data preprocessing, sentiment analysis, and named entity recognition, with a particular focus on constructing and interpreting word networks. We present basic and advanced approaches for evaluating textual features, such as novelty, informativeness, and complexity. We also highlight the innovative application of social network analysis to examine word relationships, offering a unique perspective on textual data analysis.
第四章
从语言到网络
本章探讨了将文本数据转化为网络的方法,以及利用社会网络分析技术对其进行分析的优势。文中强调了结合文本挖掘与网络分析以理解词汇间关系的强大力量,并阐述了该方法在市场营销和自然语言处理等领域的应用。本章还介绍了 Semantic Brand Score,这是一种通过网络分析衡量文本数据中品牌或概念重要性及记忆度的综合指标。最后,我们展示了这些方法的实际应用,包括品牌形象分析以及一种新颖的主题模型构建方法。
This chapter explores the transformation of textual data into networks and the benefits of analyzing them using social network analysis techniques. The chapter emphasizes the power of combining text mining and network analysis to understand relationships between words and how this approach can be applied to fields such as marketing and natural language processing. The chapter also introduces the Semantic Brand Score, a composite indicator designed to measure the importance and memorability of brands or concepts within textual data by leveraging network analysis. Lastly, we demonstrate practical applications of these methods, including brand image analysis and a novel approach to topic modeling.
第五章
文本挖掘与社会网络分析的集成:案例研究与应用
本章通过四个案例研究阐明了整合网络分析与文本挖掘技术的价值。第一个案例研究利用 New York Times 的在线新闻文章,评估了四个科技品牌的 Semantic Brand Score。第二个案例研究探讨了人工智能对劳动力动态的影响,其数据基础源于专利和职位描述。第三个案例研究聚焦于从 Glassdoor 收集的某全球咨询公司员工评论,展示了识别组织优劣势感知的有效方法。最后一个案例研究则通过挖掘 New York City 的 Airbnb 住客评论,利用非结构化文本勾勒出该市的各类城市特征。虽然目前已有大量用于 Social Network Analysis 和 Text Mining 的软件包,以及 R 和 Python 等编程语言的函数库,但能有效融合这些方法的图形界面应用仍较为匮乏。由本书作者之一开发的 SBS BI 软件集成了前述章节讨论的网络分析、文本挖掘及词网络分析技术,为研究者提供了针对这些方法的集成化解决方案。
This chapter presents four case studies that illustrate the value of integrating network analysis and text mining techniques. The first case study assesses the Semantic Brand Score of four technology brands by analyzing online news articles from the New York Times. The second case study explores the influence of artificial intelligence on workforce dynamics, using textual data from patents and job descriptions. The third case study focuses on employee reviews for a global consulting firm collected from Glassdoor, showcasing methods to effectively identify perceived organizational strengths and weaknesses. The final case study examines Airbnb guest reviews in New York City, leveraging unstructured text to map various urban characteristics of the city. While numerous tools and software packages are available for social network analysis and text mining, along with extensive libraries for programming languages like R and Python, few graphical interface applications effectively combine these methodologies. The SBS BI software, developed by one of the book’s authors, incorporates the network analysis, text mining, and word network analysis techniques discussed in the previous chapters, providing an integrated approach to these methods.
六
章节选读
第一章
语言与网络的隐藏力量:统一分析方法
社会网络分析(SNA)是一种方法论路径,用于描绘由相互连接的实体所构成网络的结构、关系与动态。从根本上说,SNA 关注的是对个体、组织,或任何一种(社会)系统之间关系的映射与测量。这些连接通常被称为“边”(edges),它们将各个实体——也就是“节点”(nodes)——连接起来,形成网络框架。SNA 的历史根源可以追溯到社会学与人类学。当时,研究者试图理解社会结构与亲属体系。然而,直到计算工具和图论出现之后,SNA 才真正发展成为一门坚实而有前景的分析学科。随着我们所处的世界日益互联互通,分析和解释周围复杂系统的能力也变得愈发重要。今天,SNA 的应用已经远远超出社会科学本身,延伸到诸如生物学领域——例如研究蛋白质相互作用;流行病学领域——例如追踪疾病传播;商业领域——例如识别关键影响者;以及网络安全领域——例如检测计算机网络中的脆弱点。
当某一现象被以网络形式分析和表征时,对其结构和连接的考察能够揭示大量关于其运作方式的信息。例如,在一个社会系统中,高度连接的个体,亦即“中心节点”,可能在影响信息扩散方面发挥关键作用。而系统中的边缘节点虽然看似不那么重要,却可能提供接触新信息的机会,或在不同社群之间充当桥梁。同样,SNA 还可以用于评估复杂系统的韧性、适应性与脆弱性。例如,在一个高度中心化的网络中,移除一个关键节点便可能导致整个系统碎裂。相反,在一个更加去中心化的结构中,失去单一节点对整体功能的影响则较小。想一想,在对抗流行病或病毒时,正确切断一个人际网络中的连接是何等关键。
另一方面,文本挖掘是从大量非结构化文本中提取有价值信息和模式的过程。在一个被电子邮件、社交媒体帖子、文章、评论、访谈转录稿等数字内容所充斥的世界里,文本挖掘为我们提供了一套工具,使我们能够将海量文本数据转化为结构化数据。文本挖掘植根于自然语言处理(NLP)、计算语言学和信息检索。起初,它的应用相对有限,主要涉及一些较为简单的任务,例如从文献语料中提取关键词,或进行文档分类。然而,随着机器学习和人工智能的进步,文本挖掘已经扩展到更广泛的复杂技术之中,例如情感分析、主题建模以及实体识别。文本挖掘的应用几乎没有边界。企业利用它分析顾客评论和社交媒体讨论,从而依据消费者反馈调整策略。法律专业人士借助它筛查成千上万份文件,识别与案件相关的信息。在学术界,研究者则可以利用文本挖掘分析科学论文或文学作品,发现那些本来可能被忽略的趋势与洞见。
文本挖掘真正的挑战,在于人类语言的非结构化本质。语言丰富、复杂,并且高度依赖语境,这使其难以用传统统计方法加以分析。词语常常具有多重意义,语境会深刻影响理解,而不同语言之间的语法结构又可能存在巨大差异。本书讨论了多种文本预处理、分类和分析技术,旨在将表面上的混乱转化为有意义的结构化信息。我们也强调文本挖掘在不同领域中的实际应用,通过现实案例展示文本数据如何能够被有效利用。例如,我们表明,只要分析得当,文本就能够揭示潜在情绪、识别新兴趋势,并为理解人类行为提供有价值的洞见。到目前为止,我们已经介绍了两门看似彼此分离的学科。前者聚焦于从人类语言中分析并组织信息内容,后者则聚焦于组织和解释社会关系与互动。那么,这两个领域之间的连接究竟是什么?语言研究与网络研究之间的联系又在哪里?对此,我们已经可以从一个应用场景中找到部分答案:思考我们的大脑如何运作,以及为什么我们能够记住所读到或听到的内容。
正如前文所示,当词语变得令人难忘时,它们就拥有塑造命运或引发革命的力量。那么,究竟是什么决定了可记忆性?可记忆性并非纯属偶然;它是语言、结构和内容经过有意识选择之后,与人类心智发生共鸣的结果。词语和话语的可记忆性,对于理解它们如何影响人类行为至关重要。当令人难忘的词语被内化时,它们会塑造我们的感知,并驱使我们以某种特定方式行动。长期以来,研究者一直试图解释,为什么有些事物会被记住,而另一些则不会。很多人能够立刻认出某个鞋类品牌,或准确回忆起自己在商店里与谁交谈过,却很难记住购物清单上的项目。一个多世纪以来,心理学家始终在试图理解,究竟是什么因素决定了词语与文本的可记忆性。人类语言是表达和传递复杂思想的一种极其强大的工具。它的力量在于其组合性本质:意义不仅由单个词语决定,也由它们的线性结构和相互关系共同决定。对这两个方面——即词语意义及其连接关系——进行分析,有助于回答一个关键问题:为什么有些概念比其他概念更容易被记住,为什么某些词语更具可记忆性。Aka 及其同事发现,可记忆性的一个关键因素,在于我们的大脑会将词语与特定的语义类别联系起来。例如,像 uhm 和 damn 这样的口语词与俚语更容易被记住;与死亡相关的词语,如 bury 和 kill,也更容易被记住;与宗教相关的词语,如 altar,也同样如此。
语义记忆,也就是对一般知识与事实的记忆,在词语记忆中发挥着重要作用。我们的大脑和记忆是以联想方式运作的;也就是说,一个词之所以能留在我们脑中,是因为它与记忆中已经存储的某个概念发生了连接。因而,那些意义深厚、带有情感负荷、或与个人经验相关的词语,更容易被记住,这一点并不奇怪。按照 Tulving 的说法,语义记忆就像一个巨大的关于世界一般知识的存储系统,其中包括事实、概念和意义。因此,语义的认知层面,关涉的是大脑如何借助通过语言被调取和操控的储存信息,来表征抽象与具体概念。词语之所以会变得令人难忘,是因为它们在我们内心深处激起了某种共鸣——要么唤起与经验相连的情感,要么连接到先前获得的知识。传统观点通常认为,词语的结构(以及连接关系)与其意义是在大脑中分开处理的:前者由额叶区域处理,后者由颞叶区域处理。然而,Shain 等人在一项最新研究中发现,这两个要素实际上是通过同一个广泛分布的额颞脑网络来处理的。人脑的这种运作方式意味着:当我们阅读或聆听一个句子或一段话语时,大脑并不会把结构与意义分离开来;二者是同时并且整合地被处理的。
语义学研究的是语言中的意义,研究词语和短语如何表达思想、传达观念。但正如前文所指出的,人类语言不仅具有语义,也具有结构,也就是词语彼此如何关联、如何连接。词语会受到其所处语境、句法和语法结构的塑造。例如,请看这个句子:The bank closed at 5 PM。bank 这个词可以指金融机构、河岸,甚至可以指飞机的一个倾斜动作。语义学帮助我们识别这些可能的意义,但句子的结构及其中其他词语,尤其是动词 closed,则提示这里所说的是一家金融机构。类似 at 5 PM 这样的时间表达,又进一步澄清了这一解释。由此可见,一个词的意义,是通过它与其他词语的互动而形成的。因此,文本分析不能排除对词语连接关系的研究,因为词语的意义往往与其关系网络不可分割。
那么,有哪些工具可以用统一的方式分析词语的意义及其连接关系?本书最后几章试图回答这一问题,我们提出了一些分析方法,将词语与其关系纳入同一个统一框架之中加以考察。
例如,当我们把网络分析应用于文本时,就可以揭示词语之间的关系,以及这种相互连接性如何影响它们的可记忆性与影响力。网络分析使我们能够对术语、短语以及更广泛文本结构之间的连接进行可视化与量化。通过研究语义网络,我们学会把语言视为一个由相互连接元素构成的复杂系统,正如社会网络将人与人之间的关系加以映射一样。在这种网络中,节点可以代表词语或短语,边则代表它们之间的连接,例如共现关系。借助这一视角,我们能够识别出那些在传统分析中并不容易显现的模式与结构。例如,通过绘制一篇演讲或一段文字的语义网络,我们可以识别出那些充当“枢纽”的关键词——即在整个话语中高度连接、并对整体信息产生显著影响的词语。这些枢纽词对于文本的可记忆性可能至关重要,因为它们能够锚定内容,并促进回忆。同样地,应用于文本的网络分析还可能揭示文本的模块化结构,呈现不同主题或议题如何相互连接,并共同服务于一则信息的整体意义。本书表明,网络分析一旦与文本分析结合,就会成为剖析语言复杂性的强有力工具;它不仅使我们能够以统一方式理解各个组成部分,也使我们能够理解这些组成部分如何共同生成意义。
将社会网络分析与文本挖掘整合起来,为理解人类行为带来了一个新的维度。网络并不仅仅关乎谁与谁发生连接,正如词语也绝不仅仅是孤立的发声。二者结合起来,构成了一幅由互动、影响与意义交织而成的复杂织锦。通过同时分析个体、组织,甚至观念之间的关系,以及它们所使用的语言,我们就能够以前所未有的方式洞察信息如何流动、决策如何形成,以及人们如何回应其周围世界。例如,通过结合网络与词语的力量,我们就能够描绘、分析并理解媒体如何塑造某一位领导人或某一政治党派的形象。当某个政治人物在语义网络中处于中心位置时,他可能会在公民心中留下强烈印象。设想一个政治品牌频繁出现在新闻报道中,并经常与深嵌于媒体话语中的多样化主题或概念联系在一起,例如慈善、可持续性或移民议题。这个政治品牌就可能在潜在选民心中脱颖而出。实际上,只要观察媒体话语所生成的词语网络,便有可能预测选举结果。然而,网络分析与语义分析的结合,并不限于政治领域。这种方法可以应用于广泛的行业与场景。以推动能源转型这一挑战为例:我们如何确保像 energy community 或 green transition 这样的概念能够在消费者心中引发共鸣,并进而影响其行为?如果仅仅依赖这些术语出现的频率,一场单纯的媒体宣传攻势可能远远不够。真正使这些概念具有影响力的,是意义与词语连接方式的结合——也就是,这些信息如何与共同价值、日常关切或未来愿景发生联系。某些词语被如何、有意识地安放在媒体话语结构之中,往往决定了一场行为变革是否能够成功;正如精确校准过的修辞既可能引发冲突,也可能促进和平。
同样,企业传播材料,如新闻发布会或年度报告,也可以被分析,以揭示企业在大流行病、气候风险或社会议题参与等关键问题上的关注程度。这些文档中所形成的词语网络,不仅有助于衡量企业讨论这些问题时的强度,也有助于衡量其承诺的一致性与深度。总之,本书从理论与实践两个层面,为如何运用词语与网络的力量提供指导,重点讨论社会网络分析、文本挖掘及其整合应用。
以上内容来自书籍官网
经数字人文资讯小编翻译整理而成
如需转载,请后台私信联系
编辑 丨魏翔
校对 丨洪冰凤
排版 丨罗斯鹏
![]()
01fish 2026-04-09 16:01 北京
![]()
shiji-kb:一个开源的古籍知识工程项目。做了两件事:
第一,用AI将《史记》130篇、57万字全部转化为结构化知识——18类实体近10万次标注、3,185个事件、7,652条关系、675项知识单元;
第二,把整个过程沉淀为26个可复用的知识库构造方法论Skill文档,覆盖从校勘到知识推理的9大阶段。换一部书,管线不变,参数调整,即可构造新的知识库。
传统文史研究的核心困境是人力瓶颈,而中国古典文献的总量以亿字计,这个宝库还没有被充分挖掘。这个项目最开始的初心是要回答一直以来的问题:AI能否把"皓首穷经"从数十年压缩到数周?AI能否把知识变为活的?
当前实践下来答案是肯定的。一个人加一群AI Agent可以完成全部工作。现成果以及方法论已开源,欢迎参与一同创造。
项目创作者为西瓜(鲍捷),一个研究人工智能知识工程30+年的文史爱好者。
Github地址(开源)
https://github.com/baojie/shiji-kb
(这个项目处于频繁更新状态,内容在不断丰富和调整,AI在把知识变为活的,这个知识库也是一个活的)
在线体验
https://baojie.github.io/shiji-kb
(文末有交流群,开放出来,非常期待收到更多反馈)
类别 | 数量 | 说明 |
|---|---|---|
文本标注 | 130篇,57.7万字 | 18类实体语义标注,100%覆盖 |
实体 | 12,380词条,99,214次标注 | 人名4,112、地名1,861、官职2,158等18类 |
事件 | 3,185个,11类事件类型 | 98.7%事件已标注公元纪年(前2700年~前87年) |
事件关系 | 7,652条,9种类型 | 含1,876个跨章换乘(互见/共人/共地/同期) |
事件地铁图 | 130条线路 | 支持缩放/拖拽/搜索/实体链接/原文引用 |
知识单元 | 434事实 + 241技能 | 7,497个实体关联 |
方法论Skill | 26个文档,9大阶段 | 可复用,适用于其他任何书籍 |
![]()
内容细节详见:给《史记》加上语法高亮:一个人+一群AI的55小时
打开任何一篇,古文不再是黑字白底的方块字——人名、地名、官职、时间、朝代、邦国、氏族、身份、制度、族群、器物、天文、生物、数量、神话、典籍、礼仪、刑法,18类实体各有颜色。平均每6个字就有一个实体被识别上色。对话也被标记——斜体加淡褐底色,让"王侯将相宁有种乎!"从叙述中浮现。
这是18类实体+年表和事件
![]()
![]()
![]()
除了语法高亮之外,我还做了语义排版,这个也处于实验状态当中,做了第一章,词和句层面的工作都开启了。
语义排版,如下图:
![]()
裴骃《集解》、司马贞《索隐》、张守节《正义》——已对齐到正文的具体句子。鼠标悬停,注释自动浮现。不用翻书,不用离开页面。
这目前是实验项目,只做完了第一章,本月上齐,在 labs 那个文件夹。
![]()
从130篇中提取了3,185个历史事件(战争、继位、政治、改革、家族等11类),98.7%标注了公元纪年。事件之间建立了7,652条关系——因果、延续、包含、对立、互见等9种类型,其中1,876条跨章关系让分散在不同篇章的同一段历史重新连接。
![]()
130篇 = 130条地铁线路,3,185个事件 = 3,185个站点,跨章关系 = 换乘连线。支持缩放、拖拽、搜索,点击站点可跳转到原文。时间轴横跨公元前2700年到前87年——整部《史记》的全景图。
![]()
所有实体汇总为结构化索引,每类一个独立页面(人名、地名、官职、时间、朝代、邦国、器物……共18类)。含595条别名映射(刘邦=沛公=汉王=高祖=高帝=刘季),644处语义消歧。点击任何实体,看它在130篇中的全部出处。
![]()
事实层:434项知识单元,覆盖人物传记、诸侯国、军事战役等14个主题。每项含定义、上下文、关联实体、原文出处。
技能层:241项从《史记》叙事中提炼的实战案例——治国理政57项(如推恩令:用分封瓦解诸侯)、军事战略54项(如背水一战:置之死地而后生)、外交谈判24项。不是成语,是有时间、人物、过程、结果的完整案例。
![]()
十二诸侯年表——15列×637行,362年间14个政权——在纸质书上几乎不可用。现在:表头吸顶、交替行背景色、悬停高亮、表内实体照样标注。
![]()
基于知识图谱数据的策略游戏。人物能力值来自《史记》记载,势力版图来自标注的地名关系。
由于我本人在游戏这块技能有限,因此我只完成了第一步,这块期待游戏方面的朋友一起来创造。
游戏目前在这个仓库下:https://github.com/baojie/shiji-kb/tree/main/app/game
这是整个项目最有价值的部分,《史记》只是一个起点。 《史记》处理过程中的skill已完整沉淀下来,是一套可复用方法论。
目前的skill整个框架,还是比较粗糙的,会慢慢改进。
26个Skill文档,覆盖从原始文本到知识应用的9大阶段:
![]()
你可以用这套skill来分析你选定的任何书籍。
每个阶段都有详细的操作文档:
阶段 | Skill数 | 核心文档 | 干什么 |
|---|---|---|---|
校勘 | 1 | SKILL_01 | 多版本比对,底本校正 |
结构分析 | 6 | SKILL_02~02f | 章节切分、段落编号、结构语义分析 |
实体构建 | 4 | SKILL_03~03e | 18类NER标注、消歧、多轮反思审查 |
事件构建 | 5 | SKILL_04~04e | 事件提取、十表处理、纪年推断、年代审查、年份消歧 |
关系构建 | 2 | SKILL_05a~05b | 9种事件关系、人物关系+家谱 |
本体构建 | 1 | SKILL_06a | 词表→分类树→OWL/RDF |
逻辑推理 | 1 | SKILL_07 | 矛盾检测、规律发现 |
SKU构造 | 1 | SKILL_08 | 知识单元化 |
应用构造 | 3 | SKILL_09~09b | 阅读器、地铁图、游戏化 |
可以看到,在这个skill框架当中,后面几个类别的skill比较少,我当前主要工作主要放在了前面,这一整套skill会持续迭代,发布出来也是期待收到更多反馈。
换一本书,需要调整的只是: 实体类型(佛经需增加"佛教术语"类)、体裁分类(编年体和纪传体提示词不同)、别名规则、年份体系。框架不变,参数变。
扩展路线:
目标 | 字数 | 现状 |
|---|---|---|
史记(已完成) | 57万字 | ✅ |
汉书、后汉书、三国志 | ~200万字 | 近期 |
二十四史全集 | ~4,600万字 | 中期 |
资治通鉴系列 | ~700万字 | 中期 |
诸子百家、四库全书 | 数亿字 | 远期 |
![]()
打开 https://baojie.github.io/shiji-kb ,选章节即可。
推荐体验路线:
顺序 | 看什么 | 链接 |
|---|---|---|
1 | 项羽本纪——鸿门宴、乌江自刎,最精彩的叙事 | 007章 |
2 | 刺客列传——荆轲刺秦,对话高亮效果最佳 | 086章 |
3 | 十二诸侯年表——362年全景,感受表格渲染 | 014章 |
4 | 实体索引——按人名/地名/官职分类浏览 | 索引首页 |
5 | 事件地铁图——130条线路的全景历史 | 地铁图 |
6 | 史记争霸——策略游戏 | 游戏 |
git clone https://github.com/baojie/shiji-kb.git 仓库里的结构化数据(JSON/Markdown)可以直接喂给Claude、GPT等大模型:
数据目录 | 内容 | 适合问什么 |
|---|---|---|
kg/events/data/ | 3,185个事件+关系 | "秦统一六国的完整时间线" |
kg/entities/data/ | 12,380个实体+别名 | "韩非和李斯的所有交集" |
kg/chronology/data/ | 380位君主在位年+公元映射 | "公元前260年发生了什么" |
kg/genealogy/data/ | 帝王世系图 | "刘邦的后代有谁当了皇帝" |
kg/relations/data/ | 人物关系网络 | "项羽阵营的核心人物关系" |
ontology/skus/ | 675项知识单元 | "《史记》中有哪些外交策略" |
![]()
这是项目最大的复用价值。26个Skill文档在 skills/ 目录下,每个都是完整的操作手册。
最简路径:
将这些skill和你的文本,交给claude/或者任何agent,根据这一套方法论,帮我构造一个xxx知识库。每个Skill文档包含:输入输出规范、标注规则、质检工具、常见错误、反思修正流程。直接照着做就行。
skill 你可以用在任何编程助手来调用。创作者使用的是claude code,若你没有安装,此处非常推荐上手,安装地址为 Claude Code 安装与使用教程(新手超详细版)
创作场景 | 怎么用 |
|---|---|
历史小说/剧本 | kg/events/ 查事件时间线, |
历史游戏 | ontology/skus/的241项技能直接转化为游戏技能卡 |
短剧/短视频 | ontology/eureka.md里的洞见就是现成的选题 |
教学备课 | 实体索引页面按类别浏览,配合三家注弹窗 |
学术研究 | 事件关系做一致性检验,自动发现记载矛盾 |
![]()
项目在知识提取过程中意外发现了20多个跨章洞察——这些不是预设的研究假设,而是知识图谱结构化后自然涌现的模式:
![]()
这个项目的核心价值不是"给《史记》加了颜色"——是把"书变成知识库"这件事的完整方法论开源了。
26个Skill、9大阶段、每个工序都有lint和validate工具。一个人加AI,用同一条管线,可以处理任何书籍。《史记》57万字是第一个试验田,二十四史4,600万字是下一步,列表非常长,逐步让几千年积累的文字全部结构化。
关于这个项目,只开启了1%,欢迎共同来迭代。知识工程的所有问题,在当前AI时代都已经解决,只剩下我们坚定执行和创造。
最终愿景:建立一个由AI Agent维护和持续进化的知识网络,让任何人都能以问答、可视化、推理的方式探索数千年的智慧。
在线体验:https://baojie.github.io/shiji-kb
GitHub:https://github.com/baojie/shiji-kb
非常期待和你一起探索各种 AI 增强阅读的可能性,欢迎来群里和项目创造者直接交流
![]()
若群满了,可以加 18501790646 备注ai阅读
调研 & 撰写:AI(Claude)
主导 & 审校:01fish
Winnie E. Pérez Martínez’s post on the Scholars’ Lab blog this week got me thinking. In “Breadth and Depth, a Self-Centered Dialectic,” she revisits how we discuss breadth and depth as two approaches to digital humanities professional development. In this framing, one that I have put forward myself, we can think of careers in DH as operating on two axes. On the one, we are expected to know a little about a lot of things. On the other, we are directed more towards narrow, specialist-level knowledge about a smaller subset of methods. Breadth vs. depth. Few careers really ask us to go entirely in both directions. More practically, we tend to specialize in a couple areas within DH and develop passing familiarity with many more.
For me, the dichotomy between breadth and depth was a way to help students map their career plans onto the different skills they might acquire. I thought of it as a way to free yourself from the need to be expert in everything. In her post, Pérez Martínez expertly shows how breadth and depth actually inform and lead to one another. There can be no one right way in. If you start deep, you might find yourself broadening, and starting wide can help you to focus in. What most resonated about Pérez Martínez’s post, though, was the way in which you can see an exceptional scholar and practitioner wrestling over whether they are enough, over whether they could ever develop the necessary skills they need to feel complete. Those anxieties never really go away. I feel them too. I recognized myself in Pérez Martínez’s post, and I couldn’t help but sense that the breadth against depth framing seemed to be having the opposite effect I would want, heightening anxiety rather than mitigating it.
Pérez Martínez proposes a broadening of the axes I had envisioned. Breadth and depth move beyond just X and Y, curling in upon themselves until they start to push outwards. The moment reminded me of the age-old dichotomy of “hack” vs. “yack” in DH work and how Laura Braunstein offered “stack” as an important third term. In addition to coding and technological critique as key parts of DH work, Braunstein’s intervention elevates “the often invisible technological, social, and physical structures within which scholarship is produced and disseminated.” For Braunstein, DH work is more than just the sum of what we do, it also consists of the structures we put in place to enable that work. In the same spirit and inspired by Pérez Martínez, I have been wondering what breadth and depth leave out, what they gesture towards within and beyond the teaching that we do.
Put another way, what is education if not just content? One point of comparison here is L. Dee Fink, whose Taxonomy of Significant Learning illuminates the various components of teaching.
![]()
Caption: L. Dee Fink’s Taxonomy of Significant Learning as shared on Florida International University’s Center for the Advancement of Teaching.
Fink’s Taxonomy usefully illustrates all the things that lie beyond the subject matter in the courses we teach. Learning is more than consuming books, articles, or topics. Teaching is more than passing along skills and methods. If we think of DH merely as skill building, we live too much in the upper right of the circle. We leave out the rest of what makes DH experiences—and DH learning—significant for so many of us. We ignore the transformative mentoring that shows a variety of career options. We miss the collaborative practices that can change how we view our work in dialogue with others. We do not account for how true interdisciplinarity changes our perspectives on our own research processes. We need a new term to trouble the dichotomy between breadth and depth that can capture a more capacious view of what it means to practice digital research and teaching, one that goes beyond subject matter, methods, and skills.
I find this particularly urgent in the age of generative AI, a complicated set of technologies that threatens to instrumentalize education beyond recognition. What counts as methodological training if you can vibe code your way to a launched digital project? What counts as digital pedagogy if our students are secretly using chatbots as study partners? How do we make room for conversations about professional development that do not reduce people to a tidy axis of skill acquisitions?
What lies beyond the breadth and depth of what it means to be a digital humanist?
I would introduce a third term for DH professional development: “breath.” Breadth and depth ask us to think about what we can and cannot do, about the subject matter and methods of DH work. The terms ask us to think about the limits of our knowledge and our inability to pursue universal expertise. Breath asks us to reframe the conversation entirely. It is an invitation to pause and re-embed our work in the body. How do we feel about our labor? Who are the working souls in DH and how do we engage with them? How do we work or overwork our own body to the point of breathlessness? What is the lived experience of our labor that transcends the skills or methods? What are the affects—the joys, frustrations, traumas, triumphs—of DH work that cannot be captured by thinking in terms of skill acquisition? How do our energies map onto a living, breathing community of thinkers and doers beyond the work on the table in front of us? Where do we fit in?
Breadth and depth ask students to think about where they could be, professional development by way of spatial orientation. Breath invites students to consider where they are, to think of themselves as real people with real needs that need attending.
原创 联盟观察 2026-04-09 18:01 北京
![]()
从“文科消亡论”到“文科抢手潮”,舆论场在过去一年间经历了戏剧性的反转。2026年春招季,“大厂月薪3万疯抢文科生”“AI叙事设计师”“人机交互伦理顾问”等话题接连登上热搜。与此同时,“文科无用”“文科危机”的论调从未真正消失。
看似矛盾的现象背后,本质上并非文理之争,面对新技术革命,所有学科从业者都必须直面“如何应变”之问。
有研究者指出:“一个仅擅代码编写而不理解代码将服务于何种人群、产生何种社会影响的程序员,难以在人工智能时代保持核心竞争力。”同样,一位仅知埋首故纸堆而对数字工具一无所知的人文研究者,亦难在人工智能时代发出属于自己的声音。
技术从不“偏袒”任何一个学科,它只会鼎力相助那些善于驾驭它向善的人。那么,文科如何以技术之力激活人文之思?答案,藏在“数字人文”里。
![]()
从“文科价值”到“数字人文”
在技术浪潮中,文科真正不可替代的价值从未改变,只是表达方式需要更新。
技术擅长回答“怎么做”,而“做什么”“为什么做”需要文科进行价值判断。当AI在工具理性层面越走越远时,恰恰需要文科来回答“应该往哪走”。技术可以提供答案,但无法回答更关键的问题:这些答案意味着什么?它们将把我们带向何处?
“而这正是文科长期承担的任务。问题不在于文科“该不该存在”,而在于它能否以新的形态存在——不是被保留下来的旧文科,而是被重构出来的新文科。”郭英剑老师在《中国科学报》 (2026-03-24 第3版 大学观察)如是说。
数字人文,正是这一重构的重要路径。一名数字人文专业的毕业生,也许在文化遗产机构里从事数字档案的知识图谱构建,也许在科技企业中参与文化类大模型的内容策略与价值对齐。他们既保留人文研究的批判性思维与阐释传统,又掌握数据建模、文本挖掘、空间分析等数字方法,形成“问题导向、方法多元、实践驱动”的综合素养。
![]()
政策与专业布局
数字人文的发展,已从学术探索上升为国家战略与教育实践。
政策层面
《教育强国建设规划纲要(2024—2035年)》明确提出:深化新文科建设,强化科技教育和人文教育协同,让人工智能助力教育变革。这为数字人文的发展提供了顶层设计与制度保障。
专业建设层面
数字人文的发展格局已初步形成。2022年,教育部正式将数字人文纳入《普通高等学校本科专业目录》。目前,全国已有15所院校获批设立数字人文本科专业。
数字人文专业发展联盟成立与发展
2025年1月,数字人文专业发展联盟在北京成立,由中华书局古联公司联合25家高校共同组建。仅一年,联盟理事单位已从25家增至近50家。该联盟聚焦专业发展方向与路径、师资培训、课程设置、人才培养与就业、数字人文实验室建设等议题,为数字人文教育的标准化、国际化与可持续发展提供了平台支撑。
点击图片购买《中国数字人文发展报告》一览中国数字人文发展全貌,内含数字人文专业介绍、相关政策、就业前景与相关机构名录等。
![]()
课程与培养——复合型人才的锻造路径
数字人文要培养的是“兼具人文精神和科技素养的复合型人才”。从培养目标、课程体系、教学模式到评价管理体系,各高校正在展开系统性探索。
以内蒙古师范大学蒙古学学院为例,作为国内第一个开设数字人文本科专业的院校,其专业定位强调产学研融合——人才培养、学科研究和产业服务三位一体。在课程体系建设中,紧密结合社会需求,融合传统与新兴,兼顾学生背景多样性以促进文理交叉,并强化实践与实验教学环节。
从多所院校的课程设置来看,数字人文专业通常包含三大模块:人文基础课程(文史哲核心)、技术工具课程(编程、数据库、可视化等)、交叉应用课程(数字档案、文化遗产数字化、人文知识图谱等)。这种结构使学生既保有深厚的人文底蕴,又具备驾驭数字工具的能力。
![]()
中国数字人文官网:https://nav.dhcn.cn/
![]()
实践成果——数字人文的落地与突破
数字人文并非空中楼阁,已在文化遗产保护、学术研究、文化传播等领域取得实质性突破。
“数字敦煌”:通过三维扫描、VR技术,将莫高窟“搬”到全世界,实现文化遗产的永久保存与全球共享。
故宫博物院:数字化文物建档、智慧展览,让文物“活”起来,使公众得以突破时空限制亲近历史。
“九歌·推敲”小程序:由清华大学中华传统文化智能实验室和数字人文研究中心研发,借助人工智能技术,将“推敲”功夫落地为一套可操控、可解释、可回退的智能化写作流程,让诗词爱好者拥有自己的“韩愈”。
中华智慧阅读空间:古联公司依托中华书局古籍经典资源,深度融合智能交互投影与AIGC技术,研制了《天工开物》《本草纲目》等沉浸式智慧阅读空间,实现从“读书”到“入书”的认知升维。
这些案例表明,数字人文正在使人文研究从“解释世界”向“改变世界”延伸。
![]()
就业前景——复合型人才的广阔空间
数字人文人才就业方向多元,前景广阔:
博物馆、图书馆、档案馆,负责数字化项目的规划与实施;
参与文化产业数字化升级;
从事数字人文教学与研究;
文化企业、互联网公司,从事数字内容策划、数据分析、信息架构等工作。
热门岗位包括数字内容策划、数字资源管理员、文化遗产数字化专员等。据行业调研,数字人文领域人才缺口持续扩大,复合型人才更受市场青睐。
![]()
结语
从“文科消亡论”到“文科抢手潮”,这一年多的舆论反转,与其说是文科的命运转折,不如说:技术越发展,人类对意义、价值、伦理与文明的理解需求就越强烈。
文科不会因AI而消亡,它将借势改变——不是变成另一种东西,而是回到它本该在的位置:在技术飞速奔跑时,提醒人们不要忘记为什么出发。
数字人文,正是这种改变的实践形态。它以交叉融合的学科特质,培养兼具理论深度与技术能力的复合型学术力量,为人文研究的当代转化与体系创新提供了坚实基础。对于每一位身处浪潮之中的主体而言,与其被“文科生”或“理科生”的标签定义,不如主动成为学习者与创造者——去拓展技术的边界,也去追寻科技与人类的意义。
技术改变的是能力,人文守护的是方向。 这或许就是从“消亡论”到“抢手潮”背后,最值得我们记住的那条线。
END
点击往期文章,申请加入或更多了解数字人文专业发展联盟:
首届数字人文专业发展联盟年会暨第六届清华数字人文国际会议在昆明学院成功举办


2026-04-09 09:01 浙江
![]()
智能增强工具与新型生产关系的构建
原载于《理论探索》2025年第4期
〔摘要〕
人工智能作为增强工具逐渐取得了共识,如通过大模型工具实现了知识增强、推理增强,可穿戴、外骨骼工具实现了身体增强。因此,智能增强是通过人工智能工具反思智能科技对人类的增强效应及新型生产关系构建的规范性范畴。人工智能若作为工具性存在,生产关系依然是基于人-人的,劳动具有社会性、属人性;人工智能若作为智能体存在,生产关系的变革就成为必然,必须与新质生产力相耦合,劳动者将演变为人-机融合的形态,劳动对象从实在存在演变为虚拟存在,劳动工具消融在主体中或者取代人类主体。
〔关键词〕
智能增强工具,新质生产力,新型生产关系
杨庆峰,复旦大学科技伦理与人类未来研究院研究员,复旦大学哲学学院教授、博士生导师。
当前,人工智能理解存在着一种规范性特征:人工智能用来增强人类而不是取代人类。然而,这一理解并不是静态的,还需要注意到未来的变化。总体来说,人工智能理解的未来变化是从无人工智能的工具进化为具备自主性的智能体(agent)。在这一特征前提下,生产关系与生产力的关系问题也将发生根本的翻转:以智能科技为代表的生产力走在了生产关系的前面。换句话说,这些智能科技正在提高生产力并呼吁与之相适应的新型生产关系类型。从劳动过程来看,机器劳动成为可能,劳动活动的属人性、社会性前提变得摇摆;劳动主体将演变为人-机协同体;劳动工具将消融在主体之中或者取代主体;劳动对象已经从实在对象变为虚拟存在;更可能的是,随着企业智能体的运用,未来工厂完全可能会出现智能体同事。鉴于此,本文将讨论智能增强工具如何构建形态多异的生产关系以及如何理解这种新的生产关系。
一、智能增强工具:人工智能理解的规范性特征
笔者曾经讨论过当前我们时代的特征这一问题,初步的结论是无论从国家战略还是从事物本质层面看,数智时代已经取代智能时代、信息时代成为我们当前所处时代的最好概括。在人工智能本质的理解中,工具论成为很显著的一个叙事特征,深深地隐藏在不同群体关于人工智能叙事中。人工智能领域存在四种叙事类型:科学化叙事、科幻化叙事、媒介化叙事和诗意化叙事。科学化叙事中科学理性最强、技术想象最弱;媒介化叙事中实用理性最强、技术想象最强;科幻化叙事中则科学理性弱化、技术想象最强;诗意化叙事中科学理性适中、技术想象适度。从不同的叙事中窥到其中隐含的工具论前提。
工具论观念在科学化叙事中表现尤其明显,这种叙事强调人工智能是一个独特的工具。人工智能科学家李飞飞指出人工智能是一个文明意义强大的工具。人类文明发展的轨迹是我们创造工具,是为了让生活变得更好。当然,工具也可能被滥用,这就更需要我们思考如何使其更好地服务于人类。这正是李飞飞“以人为本的人工智能研究所”的根本理念。也正是因为人工智能是一个具有文明意义的强大工具,接下来的事情是尽早建立将人类福祉置于核心位置的理论框架。因此,以人为本的人工智能最重要的就是赋能于人的理念。在她看来,思考人工智能与人类的关系建立需要遵循两个原则:尊重人类的主体性和尊重人性。第一个原则是避免将人工智能作为主语,因为将人工智能作为主体会剥夺人类的主体性;第二个原则是开发和使用人工智能过程中,尊重每个人渴望健康、希望富有成效、渴望成为受人尊重的人的品性。在2025年法国人工智能峰会上,李飞飞提出了一个以人为本的三原则和人工智能治理框架。三原则给人印象深刻:尊严、能动性和社区;治理框架强调应该摆脱科幻、意识形态以及割裂化思维。摆脱科幻意味着把治理放置在经验的数据与严格的研究之上,强调人的理性;摆脱意识形态意味着要防止滥用误用,也是强调人的理性;防止割裂思维意味着要把人工智能看作是一个生态系统,开源才能发展。
在剩下的三种叙事中,都是反思工具论设定的。诗意化叙事和科幻化叙事中,将人工智能看作是工具的理解是被反思和批判的。海德格尔在《技术的追问》中重点批判了工具论的观念,强调了现代技术的集置本质。在集置中,人和一切对象都变成了持存物。从这一观念出发,人工智能作为现代技术的极致形式更是如此,成为“存在升级”的主导因。科幻化叙事更是突出人工智能和机器人的自主意识,这种叙事突出人与机器的对立,如果机器仅仅是一般工具,那么冲突无法达到极致。媒介化叙事对于工具论这一平淡观念也是拒绝的。出于对公众的引导,即便是承认工具论观念,也是把这种观念导致的社会效应最大化。所以,在四种不同叙事中,对于人工智能的理解存在着极大差异:从工具到主体。如果我们继续追问人工智能的工具性,那么面临的两个问题:人工智能是体现什么关系的工具?它是什么性质的工具?
人工智能是体现什么关系的工具?人工智能与使用者的关系一直是学者们讨论的话题。DeepMind根据通用性和成效将通用人工智能划分为笨手(no AI)、熟手(emerging,胜过一些)、能手(Competent,胜过50%)、专家(expert,胜过90%)、大师(Virtuoso,胜过,99%)、超人(superhuman)。我们可以看到辅助、增强、协同等三种关系都有所体现。熟手与能手意味着人工智能工具可以超出50%的一般人做事情,这对于使用者来说,发挥协同作用没有问题。因为在科研领域,已经胜过了大多数的研究生;协同的关系已经出现在专家层面,在这个层面,人工智能工具已经胜过90%的人。大多数的教授专家与人工智能工具可以分工协作,完成目标任务。还有一类大师,则会对使用者进行必要的指导。此时人工智能开始指导使用者,类似于导师。在这个划分中,笨手不仅不会产生帮助,还会减少使用者的效率。至于超人作用,还没有具体的论文进行研究。我们只能从文学作品中获得一些启发,人类要突破自己的感官和知识的限制,必须达到超人层面。在尼采那里,凡人则通过三级变形——骆驼、狮子和孩子——达到超人,能够实现权力意志的自由支配。
人工智能是什么性质的工具?我们从两个最常见的概念谈起:人工智能作为日常工具(tool)和人工智能作为科研工具(instrument)。在不同场景中,人工智能作为工具出现。如家庭场景中有扫地机器人、服务场景有迎宾机器人、商业场景经常见到咖啡机器人等。这些工具略有智能成分,实现特定功能。作为日常工具的人工智能和生活世界高度融合,成为很重要的辅助工具。但是人工智能作为科研工具则有极大的专业特殊性,可以看作是身体器官的延伸。比如在AI4Science、AI4Social Science领域,人工智能是作为科研工具起到作用,在科学研究准备阶段、科学研究进行阶段、科学研究发展阶段以及成果分享阶段发挥着不同的作用。人工智能作为科研工具很容易让我们想到现象学的例子。现象学工具箱里有很多范畴工具。如今,人工智能已经表现出明显的现象学特性,因为众多的人工智能工具已经让学术研究者感到眼花缭乱,这在很大程度上增加了学术界的负担。此时,所谓的辅助、增强和协同作用反而大受影响,甚至会对研究者造成不必要的扰乱。
然而,这种工具论的理解却存在着明显的问题。哲学上的反思在于如果是技术,那么工具可以被替换。因为需要不同,所以可以采用不同的工具。对于人工智能来说,如果是作为笨手、熟手和能手,这种替换的概率还是很大的。然而进入专家和超人层面,恐怕就不是那么容易更替的了。如今例如ChatGPT和DeepSeek等大模型被使用顺手了,那么它很难被放弃,此时工具论的观念限制就会出现。约书亚·本杰明(Yoshua Bengio)从另外一个角度指出了工具论存在的问题。“很多人都希望人工智能可以成为工具。但智能体(Agent)作为一个自主的实体,有自己的目标,会自主选择如何实现这些目标,希望智能体成为工具就有些一厢情愿了。”在海德格尔看来,把现代技术看作是人类的活动和满足人类需要的方法的工具论观念并没有看到现代技术集置的本质特性,看不到现代技术呈现为一种天命。这种海德格尔式的理解对于人工智能来说始终触不到痛点。现在国内的学者看到了人工智能与人类的双主体特性、看到了人工智能具有的能动性这一关键点。赵汀阳看到了人工智能会演变为新的主体,带来新的存在论问题。主体意识觉醒或者能动性呈现是“新主体”独有的特性。“由于大量应用需求的推动,以及‘接受’评价原则的采纳及相关研究的深入和成果推广,人工智能技术的发展已形成了一种新的可能性:在不远的将来,某些人工智能产品或技术载体如情感交互机器人,会被部分大众接受为‘非人非物、亦人亦物’的第三种存在物。”非人非物的“第三种存在”是人工智能的独特规定性。所以从两位学者的论述中可以看出,人工智能作为新的主体、人工智能作为第三种存在都显示了人工智能具有的一种超越工具的规定性。这一转变让我们意识到对人工智能的工具论理解存在的局限。
对人工智能的工具论反思导致的可能性出路,我们要进行追问。很多学者开始提出人类与人工智能出现了一种共在、协同、协调的关系,在这种关系中,人工智能表现为具备甚至超越人类主体的存在,双方为了完成共同生存和进化而共在一个宇宙。为了适合这一规定性,人工智能需要新的规定性。
人工智能作为智能体(agent)存在,表现出能动性(agency)。在这一规定中,人工智能与环境、场景、语境形成了良性互动,能够适应环境的演变、对来自环境的危机作出及时反应,采取最优化行动。无论是在强调历史过去的人类数据构造的环境下,还是来自机器合成的数据构造的环境下,都能够作出上述行为。这一点意味着人工智能可以很好地利用合成数据,而不只是会产生模型崩溃这样唯一的结果。模型崩溃的担忧来自一种线性思维:机器在错误的数据基础上产生新的合成数据,无限下去,必然会产生灾难性后果。但是,错误的数据只是在传统人类中心立场下的判断结果,而非机器认可的数据。对于机器来说,数据是否可以识别才是有效的标准。就如同0、1形式的数据可能被解读,而其他形式的数据是无法被解读的,因此也就没有意义。此外,“无限下去”的设定如同回形针的设定一样,机器设计者不允许出现无限的情况,机器自身也不会允许自身无限无效率地运行下去。
此外,智能体与包括人类在内的环境因素必然会合成在一起。因此人工智能作为系统将是另一个重要的规定性。此处的系统并不是一个控制论系统,一个封闭式的机器依靠自动性运转,而是人类掌控着这个自动进程。此处的系统主要突出的是与智能本身无限繁殖特性相关的扩容性。但是对于智能系统来说,它会通过不同的接口(interface),其中最为主要的代表形式是应用程序编程接口,这是一种程序之间的接口。主程序随时通过特定的机制调取其他子程序。接口类似于人体的关节,使得不同的智能体程序产生关联,从而构成一个系统。所以人工智能系统是通过一种特定接口如应用程序编程接口实现行动的系统,只要赋予不同对象以接入的可能性,最终会实现万物互联的一个总体系统。
因此,我们通过对人工智能工具论的分析最终展现了对人工智能理解的变化,反思工具论理解的狭隘,将作为智能体、系统总体的人工智能面貌呈现出来。在这个过程中,一种类似于第三世界的观念——“第三种存在”——被提出来,但是非人非物过于模糊。作为新的主体的人工智能始终是哲学阐述,也就是诗意化叙事的构造物,展现了构造智力自身的精细结构,同时人工智能具有人格这样的心理学阐述。人工智能系统被视为人格所需的三个核心条件:自主性、心智理论和自我意识。可以说让我们感受到对人工智能在内的智能科技有了一个总体把握。而在智能科技与数智时代的变迁中,生产力与生产关系也获得了进一步分析的智能化背景。
二、数智时代生产关系与生产力关系模式的四种类型
“形成与新质生产力相适应的生产关系”是最近理论界讨论的问题。但是从历史角度看,生产关系与生产力的关系问题一直以来都是学术界关心的问题。20世纪60年代前后,中国学界曾有过一场生产关系与生产力的关系的讨论。李达指出劳动过程涉及劳动者、劳动工具和劳动对象等三个要素;“人类的劳动”是社会的劳动,具有社会性、在基于人的社会关系中进行,人类劳动的特征贯穿在各个历史形态中;相比之下,经济学领域则讨论生产关系与生产力的关系问题。这个时期以农业为例,呈现出生产关系走在了生产力前面的特征。
我们将在不同情况下考察生产关系与生产力的关系问题的不同模式,最终指向与新质生产力相适应的生产关系如何理解?“不同情况”是一个权宜称呼,它指代我们对生产关系与生产力的反思要建立在人工智能理解的嬗变逻辑下理解。当人们把人工智能看作是一般工具时,理解依然处在传统生产力阶段;当人们意识到工具的增强性,有着一种突破的可能性;但是只有人们充分理解人工智能具有的能动性规定,也就是说突破了工具论思维时,我们才可以说进入新质生产力的了解中。我们将通过四象限构筑生产力与生产关系的框架便于展开分析。
第一种情况是传统生产关系与传统生产力的关系问题。传统生产力主要是指与农业时代、工业时代相适应的生产力。从动力形式来说,比如来自畜力、蒸汽动力和电力。当前人力被比喻为牛马,这在一定程度上将人还原到自然力。人在无技术装备的情况下,靠体力来进行劳动,那么还是停留在自然层面。蒸汽动力和电力是来自于人工的力量,或者是所谓的工业技术的力量。与这种生产力共在的生产关系就呈现为二元的关系,比如奴隶与奴隶主、农民与地主、工人与资本家。从劳动过程来看更为清楚。劳动主体是作为依附个体的人,或者是没有技术装备或者有技术装备;劳动对象是实在对象,比如种植农产品和生产工业产品;劳动工具是无智能的工具,只是按照物理原理组装的工具而已。从适应关系的性质来看,这种关系是一种非实质性适应,其实质是一种比喻性描述。畜力、蒸汽动力、电力的使用之后出现二元社会关系的划分,人们会想当然地将二者看作是因果关系。但是这或许类似于原始思维的效果,把两个相继出现的现象如布谷鸟、春天看作是具有因果关系,而忽略了对其内在关联的阐述。
第二种情况是新型生产关系与传统生产力的关系问题。这种关系状态下,生产力依然是传统的,比如自然能源消耗型的技术占主导,如石油、畜力在社会中继续使用。但是生产关系会发生变化,因为随着社会制度的变化,二元结构本质上发生变化,随之进入的是一种来自外在影响的新型生产关系的出现,比如合同关系的出现。这种关系是现代社会变迁的产物,合同作为一种新的形式成为维护人与人之间权益的方式,受到当事人意愿决定和时间的限制。原先的二元层次之间存在着生死冲突的可能性,而且在常规时期,双方默认了不可变更,只是在特殊时期才出现反抗。新的二元形式中,主体具有了自由选择的可能性。从动力形式来说,没有变化,依然处在工业时代或者农业时代;从劳动过程来看,首先劳动者发生了变化,作为独立个体的人开始出现,可以按照理性作出自由选择,而且能够获得一定技术的加持;劳动工具、劳动对象与上述基本相同。从适应关系来看,新的生产关系开始呼吁新的技术的合理运用,具备理性的人利用老的技术。理性的人与老的技术始终表现出各种不适应性的冲突。
第三种情况是传统生产关系与新质生产力的关系问题。新质生产力是随着信息技术、智能技术等新兴技术出现而形成的范畴。新质生产力不仅是技术类型上的新,而且也是性质上的新。如果是技术类型上的新,那么只可以成为新型生产力,更多是表达了生产力的指向上的新,体现了科技的伦理关怀,如科技向善、智能向善;如果是性质上的新,也体现了指向构筑人民的美好生活,如通过各类数字技术可以确保数字福祉、通过智能技术可以构筑未来智能化生活,做到智能养老、智能护幼。但此时,生产关系落后于生产力的变化。以自动驾驶汽车为例,旧有的法律无法考虑将汽车看作是责任主体,所以面对自动驾驶汽车的事故责任划分时显得力不从心;还有智能科技提出许多全新的问题,而现有的法律制度没有办法应对这种变化。所以这种落后是非常明显的。而新的技术创新需要更好的法律法规加以保护和约束。从劳动过程来看,劳动主体没有发生一些变化,停留在自由选择的个体层面,但是劳动主体必须意识到人类与智能工具之间具有的多种复杂关系;劳动工具带有了一定的智能性,称之为具备智能的工具。按照Deep Mind的划分,进入了熟手、专家,甚至大师的水平。人工智能语言模型在感知道德专业知识方面可与专家伦理学家相媲美,也就是说达到了专家水平。劳动对象出现了很多新的形式,如数字劳动对象、机器劳动对象等。
第四种情况是新型生产关系与新质生产力的关系问题。在这种关系中,新型生产关系可以从多个方面进行呈现。劳动主体不但有自由意志,还有更强大的推理、感知和记忆能力,甚至抵达超人状态,这是增强人类的问题。增强人类将成为新型生产关系的一个重要变化。增强人类可以从两个层面进行理解,其一人类利用药物、神经技术和智能技术对个体的增强,从而出现所谓的增强人类,这种增强技术与人类的融合是永久性的或者是无法断开的连接。这个维度的极致形式就是超人的出现。而且不是比喻意义上的超人。其二是人类借助各种智能增强工具实现的增强,个体可以作出选择能够断开连接。此外,生产关系中出现了新的关系形式,如机器人同事、虚拟同事或者增强同事。这种关系无疑是新鲜的,机器人超强的同理心、超强的推理能力会给人类造成倒逼。大模型在社会情境判断方面可以胜过人类。社会情境判断(SJT)是一种标准化的心理测试工具,提供行为选项,让参与者选择最适当与最不适当的行为。这意味着在人机共存的关系中,机器能够优于人类进行情境判断并处理好社会关系。当然未来工厂甚至可能出现的情况是人类完全退场,工厂原先人声嘈杂的情况不再有,只剩下自动机器运转的声音;黑夜不再有人需要加班,不再有灯光。因为机器无休止的运转,不再需要所谓的光源。原先的适用关系将会有实质性适应作为内涵充实起来。与原先的比喻性适应不同,这种适应已经有各种关系类型开始呈现出来,比如智能契约关系用来约束超级人类与超级机器、共在关系引导人类与超级智能体的相处等。在这种关系中一切都是全新的有待于讨论的问题。
三、智能增强工具的本质与新型生产关系变革
总体来说,数智时代下构建适应新质生产力的生产关系要对劳动主体和劳动工具的新特征有认识。在这一基础上,才能理解劳动过程发生的性质变化。
首先,劳动过程出现性质的变化。人类劳动的社会性、基于人类关系进行的两种性质会发生逐渐地改变。如果人工智能作为一般工具性存在,那么在新型生产关系的构建时,“人类劳动”或者劳动的主体依然是没有本质变化的,这种劳动依然是基于人-人的,具有社会性、属人性。因为工具无法改变使用者的本质规定,所以这种社会性和属人性依然是不变的,在问题出现时或者责任的承担上,依然是使用者承担责任。“在人工智能发展中的‘对齐问题’上,人工智能带来的危害从根本上说来自于人工智能的研发者、制造者和使用者。因此,需要规范和约束的不是人工智能技术本身,而是研发、制造和使用人工智能的人。”在赛博格主体下,劳动性质还保留社会性、与人相关,但是已经变得微弱;而在纯粹的机器主体下,劳动的社会性、人际性会完全消失。因为对于机器而言,社会性是不存在的。机器与机器之间只是系统构成的关系,从本质上看,是功能耦合的结果,没有社会性可言。而没有社会性、属人性的劳动关系不存在。但是生产关系依然会存在。因为机器生产创造的价值却是实在的。就如同数字流量带来财富可以进入流通领域,购买商品。但是数字流量本身却没有任何的属人性。
其次,劳动主体会发生两个方面的变化。一方面,人类劳动主体依然存在。人类在通用目的工具或者通用人工智能的加持下实现增强,这也就是上面所说的智能增强。智能增强会以两种形式与人类实现融合,嵌入与非嵌入。未来主体会成为赛博格形式,比如利用脑机接口进行融合;还有装着外骨骼设备进行各种劳动。利用大模型实现增强,能够处理额外的任务;另一方面,机器劳动主体逐渐涌现。自动机器、智能决策系统会逐渐取代传统人类角色而变成劳动主体。比如在一些工厂已经出现了智能安全检查员取代了人工检查。劳动主体成为机器或者平台,比如在生产中人工智能利用合成数据生成新的数字产品。人工智能科学家的出现就属于这种形式。在生物医药领域,人工智能科学家在虚拟实验室从事科研工作。诸如DeepSeek等可以撰写科学论文等。目前以DeepSeek-R1为代表的开放模型用于科学研究的尝试已经从这里开始了,覆盖数学和神经科学研究。“选题包括生物信息学、计算化学、认知神经科学等。”这些都说明知识生产主体发生的变化。如果人工智能作为agent存在,生产关系的变革就成为必然。从生产关系的主体来看,会出现新的主体形式。
(1)独立个体:人-机、机-机。比如我开着一辆自动驾驶汽车,借助车上的导航装置行进。在这个常见的现实场景中,人与汽车相对,人类司机控制着车辆,去往人类设定的目的地。如果是一般的非智能汽车,那么掌控权完全在人手中,当然,出现问题也只是司机走神或者疏忽犯错。但是如果是L3级别汽车,L3自动驾驶指的是在特定条件下,车辆能够完全自主驾驶,驾驶员可以在系统请求时接管车辆。这种级别的自动驾驶被称为“有条件自动化”,因为它依赖于特定的场景,如高速公路,在这些条件下系统可以完全接管驾驶任务。在高速路上,驾驶系统掌管驾驶任务。此时驾驶系统掌管汽车就成为另一个关系模式。如果是L4级汽车,那么要求系统在其设计运行条件下持续地执行全部动态驾驶任务并自动执行最小风险策略。在这种关系中,驾车的人与汽车是可分离的,我们称之为独立个体。
(2)复合实体:在复合主体中,会出现多种类型,比如人-机与人、人-机与机、人与人-机、机与人-机。因此,生产关系会出现非人的形式,比如人机协同关系、人机协调关系、人机共在关系等。与新质生产力相符合生产关系类型根基不是单个实体,而更可能是人-机融合的存在对象。
第三,劳动工具也会发生变化。然而,我们想说的是,这种成见需要反思。当我们站在人工智能的另外一个规定性上,这种成见的牢固性就会发生变化。按照陈小平的看法,人工智能产品是非人非物的第三类存在。大胆设想一下,第三类存在最终会以超级智能的形式出现。本文指出,要认识到人工智能作为工具性存在特征,因为在伦理规范的范围内,人类的主导地位始终要确保,而人工智能的辅助作用就要保持着;还要认识到人工智能的主体性变化。无论人们是否承认,人工智能作为新主体的齿轮已经发生转动,趋势难以避免。有两种力量在推进这个转动。一些学者通过赋予人工智能的人格、道德地位、自我意识来确保其主体性。另一些学者较为聪明地将这个问题转变为准主体或者拟主体来处理,认识阻力没那么大了。但是一切都是悄然在发生变化。
第四,劳动对象也会发生极大的变化。以能源开采为例,以往是开采地球自然资源,如石油、天然气、煤炭,或者利用风能等,自然资源是实体对象。但是数智时代中劳动对象会成为数字对象。在这种情况下,数据就变成了资产,变成了财富。如果一个公众号能够吸粉10万人以上,就能够带来明显受益。不少平台也给出免费、各种各样优惠措施来吸引用户,用户的数据就构成了保障。因此,数字经济成为与实体经济相并列的新的经济形式,生产劳动对象也变为数字对象。从劳动对象来看,虚拟对象开始层出不穷,比如各类数字产品开始出现。笔者曾经在上海当代艺术博物馆看到一个数字艺术作品,艺术家把观众看新闻产生的微表情用3D打印设备打印出来,从而作为展品放在场馆中展览。倘若能够进入商品流通,恐怕每个个体都要回购自己的情感数字品。勒汉·埃拉舍科(Reham A.Elsheikh)等指出,可以采取创新的深度卷积网络(AA-DCN)模型识别出包括愤怒、悲伤、快乐、轻蔑、厌恶、惊讶、恐惧和中性等八类情感。从适应关系角度看,传统的个体关系根本无法与新质生产力相适应。
从上面分析看出,劳动主体、劳动工具和劳动对象的变化意味着劳动过程的性质变化。这种变化表现为劳动主体从人到非人的变化的性质变化,劳动对象从实在对象变为数据对象的变化,劳动工具从单个的实体变为与人的融合形态的变化,而这影响新型生产关系的构建。这种关系中机器主体、赛博格主体将成为新的形式,影响着生产关系的构建。
四、超工具人工智能的哲学根据与新型生产关系构建
如果我们接受本杰明·约书亚的观点,很多人坚持的“人工智能仅仅是工具”的想法只是一厢情愿。我们需要做的是通过澄清人工智能多于工具的规定性内容让这些一厢情愿的人认清现实是什么。当这一点澄清之后,对于适应于新质生产力的生产关系讨论就有了一个全新的出发点。正如上面论述的,人工智能超出工具性的理解有三个方面内容,而且我们也可以为这三种理解找到合适的哲学根据。
从技术本身看,人工智能成为智能体,智能体是实体,能够自主选择目标,自主决策并且选择实现目标的方式。在这一观点中,自主性成为关键的哲学概念,它是人工智能进行感知、决策和行动的一个重要特征。从传统人工智能系统中,学习过程是有人类监督的学习过程,人类对数据进行标注,然后人工智能机器进行学习,所以标注行为的主观性很容易演变为人工智能的偏见;在决策中,人类的主导地位不容撼动,机器决策的天花板就出现了。但是在智能体的情况下,学习过程变成了无监督学习、机器决策变成完全自主。以具身智能机器人为例,新一代的机器人将通过现实生活中实际人的行为进行模仿学习,而这以前是通过视频数据完成学习。在这一情况下,辛顿的担忧也就变得可以理解了。因为人类的行为存在极大偶然性,人性的复杂使得行为变得难以理解,如果机器可以在现实中模仿并超越,那么的确危险很大。
从哲学角度看,人工智能是主体,具有意识、自主性。更为重要的是,计算机科学界已经开始介入意识问题的讨论中。谭铁牛指出,“通用人工智能旨在研制出具有与人类相同智能水平乃至超过人类智能水平的机器,甚至可能使机器拥有自主意识”。这一观点刺激了科学界,与辛顿对话的周伯文指出,“这一个观点可能让在坐的许多研究者感到惊讶” 。同时也激励了哲学界,因为意识问题关乎概念的理解,而且反思性极强,辛顿指向的是使用词语的一套理论,人们可能正确地运用某个词语,但是理论也可能是错误的。有意思的是,李飞飞拒绝这一概念的使用。她认为人工智能利用了先进的数据学习、模式识别,重要的是理解,而意识是一种科幻想象中的东西。辛顿与李飞飞之间表面是对立的,但深层却是一致的:对意识的非实在论设定。对于辛顿而言,意识是概念的理解和运用;对于李飞飞而言,意识是科幻的想象或者是形而上学的想象结果,她的态度让我们想起了牛顿。物理学要远离哲学。所以说,这两个人目前越来越清晰地表现出来一种认识张力。但是意识的说法带有太强的形而上学色彩,并且与智能科学的实证研究方法形成了鲜明的冲突。尽管意识的说法具有吸引力,但是关于意识的讨论框架极具冲突性。这种冲突性大大影响观点的可用性。最为重要的是,这种认识并没有将人与机器的关系纳入其中,而依然是把二者看作割裂的两级。
从系统看,人工智能作为系统存在,这种理解不显山露水,但是却慢慢浸润到社会肌体内部,以一种深度智能化的形式表现出来。在这个过程中,有些对象是以不同形式、不同层次纳入系统,比如程序员利用应用程序编程接口在另一个系统中嵌入其他应用程序,用户使用母体APP进行一个平台,然后无数个APP嵌入在母体上,就让我们想到藤壶附着在鲸鱼的身体上。这个母体最希望产生的行为是无数个体涌入系统深处,这将是一个没有底、可以无限突破的过程。我们可以在西蒙栋(Gibert Simondon)和埃吕尔(Jacques Ellul)的技术哲学中找到哲学根据。这两位在人工智能的系统理解上提供了哲学根据。西蒙栋通过元素(element)、个体(individual)、组装(ensemble)等三个范畴完成了技术物系统的构建。这种观点认为技术物自身呈现为一个系统,比如复杂的汽车、电话等都是不同技术个体组装的结果。然而这个系统却是自封闭系统,而与社会没有链接起来。比如已开发的、但未普及使用的技术物或者已经为社会淘汰的技术物品,甚至演变为其他意义形式存在的技术物品。此时,技术功能完全丧失,尽管其作为技术组装的形式尚在,但是已经完全丧失了技术物的特征。埃吕尔的哲学则使得技术物系统和社会系统链接起来,构成了一个更大的系统。技术物从来不是一个单独的存在,它必须和社会系统以不同形式整合在一起。以基础设施的形式成为社会运行的物质基础。以城市智能治理为例,首先,视频采集系统布局城市角落,这是智能体的感知来源;其次,视频对象的数据进入到数据中心,进行数据分析智能化处理,这是决策的基础;最后,智能机器采纳数据中心给出的数据进行智能化行动,比如智能红绿灯与自动驾驶汽车。这个系统作为基础设施而存在。此外,以智能辅助工具的形式成为人们决策的一个重要伙伴。现在的导航系统、各类APP都是如此,能够辅助人类实现自己的目标。
人工智能新的认识内涵已经为我们反思新型生产关系提供了一个完全不同的基础。从总体上看,劳动过程智能化嵌入深度逐渐变得明显,劳动过程的社会性与属人性开始消失;劳动主体也出现了和智能机器协同的新形态,这种协同不仅仅表现在劳动层面,而且还表现在日常相处,一种新的伙伴关系会阻碍或者刺激劳动的效率;劳动工具的智能化程度开始加大甚至变成了主体,这种新主体会成为他者,嵌入原有劳动者的自然身体或者社会身体中;劳动对象也成为虚拟存在,而处置虚拟劳动对象将成为一种常态。这四者会影响到新型生产关系的整体构建。因此,新型生产关系的构建必须要考虑整个劳动过程、主体、工具和对象的改变。
![]()
徐惠 2026-04-09 09:01 江苏
![]()
苏大7月办修辞学国际研讨会,设青年优秀论文奖,5月31日截止报名。
转载自“江苏省修辞学会”
会议通知
为推动我国中西修辞学界的深度对话,探索在全球化和跨文化背景下修辞学发展的新路径、新范式,进一步深化语言战略与话语修辞研究,江苏省修辞学会拟于2026年7月在苏州举办江苏省修辞学会2026年年会暨第二届语言战略与话语修辞国际学术研讨会。会议由江苏省修辞学会主办、苏州大学外国语学院承办、西交利物浦大学语言学院和苏州城市学院协办。会议主题为:中西修辞研究的交流互鉴。届时,大会将邀请国内外知名学者做主旨发言,并组织专题论坛。
一、会议主题
中西修辞研究的交流互鉴
主要议题
包括但不限于以下议题:
1)话语、修辞与社会变革
2)修辞学跨领域融合研究
3)中西修辞史研究
4)中西修辞教育研究
5)“修辞能力”研究
6)中西修辞范畴研究
7)中西修辞批评研究
8)修辞与传播研究
主旨发言专家(音序)
1)Angeliki Athanasiadou (希腊塞萨洛尼基亚里士多德大学教授)
2)Randy Harris (加拿大滑铁卢大学教授)
3)Mark Turner (美国凯斯西储大学学院教授)
4)皇甫素飞(淮阴师范学院教授)
5)鞠玉梅(齐鲁工业大学教授)
6)苗兴伟(北京师范大学教授)
7)束定芳 (上海外国语大学教授)
8)谭学纯 (福建师范大学教授)
9)袁影 (苏州大学教授)
10)祝克懿(复旦大学教授)
11)宗守云(上海师范大学教授)
主编论坛(音序)
1)方小兵(南京大学教授、《中国语言战略》主编)
2)高群(阜阳师范大学教授、《阜阳师范大学学报(社会科学版)》“修辞学论坛”主持人)
3)束定芳(上海外国语大学教授、《外国语》主编)
4)王军(苏州大学教授、Language and Semiotic Studies主编)
二、优秀论文奖
本次会议面向四十岁及以下的青年学者设置优秀论文奖,获奖者将颁发“王希杰修辞学奖”,并获得由袁氏奖励金赞助的奖金。申报参评者(包括青年教师、博士后、博士及硕士研究生)需成为江苏省修辞学会会员(填写会员申请表并发送至表中指定邮箱)(附件1)并提交论文全文及参会回执(附件2)。申报截至时间:2026年5月31日。
提交邮箱:soochow2026@126.com
三、时间和地点
会议时间:
2026年7月10日报到,7月11-12开会,7月12离会。
会议地点:
苏州大学(天赐庄校区)
四、会务费
普通参会人员会务费为800元/人,全日制学生凭学生证减半。用餐由组委会统一安排,住宿与往返交通费用自理。
五、联系方式
会务邮箱:soochow2026@126.com
请有意参会者将参会回执(见附件)于2026年5月31日前通过电子邮件发送至会务邮箱。论文摘要经专家评审合格后,会务组将发出正式邀请函。
江苏省修辞学会
苏州大学外国语学院
2026年4月7日
![]()
附件下载
附件1:江苏省修辞学会会员申请表
附件2:参会回执
比特人文
投稿邮箱:dhbase@126.com
扫码关注 获取更多资讯
![]()
Lately, I’ve been thinking a lot about that canonical debate around depth vs. breadth in digital humanities (DH). I remember initially my reaction was feeling that “true” DHers should be both, that this was an aptitude anyone could and should develop in the spirit of the discipline.1 After much method trial-and-error, I then grew frustrated that I hadn’t found “my thing” and disappointed to think I could only do DH in breadth, not depth. I was bound to a path instead of choosing one. Eventually, I decided I didn’t care for the division at all.
Lately, though, I’ve started wondering, what if the question has multiple axes acting simultaneously? What if breadth leads to depth, the opposite happens, or something else altogether? What if, instead of choosing a path, it emerges, for each one of us, from our own individual way of sharing, problem-solving, organizing, and researching?
In my “failing” to become an expert at one single thing calling out to me, I had no choice but accepting and recognizing the value of breadth, and inevitability of failure—another core DH moment—even if my perceived failure was personal in nature.2 But the beauty of “rock bottoms” is that they create an opportunity for radical change because one’s ego is finally humble enough to give up on what isn’t working and engage in earnest reflection, even start over. ON/OFF. Unplug and replug. It’s a time to accept losses and reassess them against growth, assets, skills, experience, effort, connections. What did you learn in the process? In DH, the process is key.3
Through the process, I learned I’ve been wrong all along: depth & breath are really two sides of the same coin. What separates us should be instead the base principles for a constructive bridge uniting DH inquiry. I used to think that not knowing and being new to the tools of an environment was a disadvantage (breadth+1), but it turns out specialists (depth+1) often don’t remember what a beginner feels or needs, precisely because they have intimate knowledge of their fields. The specialist (depth+1) is always iterating over their craft, perfecting techniques or creating new ones, deeply connected to the innovations of peers, organizations, and entities influencing their work. Generalists (breadth+1), typically, pay attention to what’s going on in multiple fields, who’s working where, what is the budget distribution, how do you get more students in to apply for your programs, how do you process their applications. DH emerges from a delicate act of balancing out critical responsibilities among experts of both kinds, each deeply attuned to their own and each other’s tasks.
Revisiting this discussion with recent insights, I realized that, as far as the depth & breadth goes, I am through and through a digital humanist in breadth (of course, an oxymoron). This is how my brain works. I have a good instinct for quickly finding unusual connections between topics, and a curiosity for learning anything, so I end up knowing a little bit about many things, not much about anything at all. I used to badly resent this indecisiveness in my learning pattern, the inability to choose and stick to one thing passionately forever, but I have been reworking this perspective to understand that what I am is flexible, curious, nimble. This is a quality that makes me good at handling unknown situations, at learning how to learn new things on my own, and at translating that knowledge of the learning process to expert audiences.
And yet, over time, I have found myself going back to specific projects, questions, topics. I keep thinking about design, minimal computing, pedagogy, infrastructures, technology, small datasets, and collaborative work, for example, over and over again in recent years. These are now inescapable research areas for me. Won’t this path of ceaseless returning eventually lead to depth as projects grow and change from recurring personal concerns, interests? Maybe we all become breadth/depth hybrids if we spend long enough earnestly engaging DH work, which is kind of pretty, it means connection awaits at the center where both axes intersect.
See, for example, Brandon Walsh’s blog entry “Breadth And Depth in DH Professional Development” (May 12 2023); Matthew Lincoln’s blog entry “Depth-First DH” (24 Aug 2014). ↩
Check out Quinn Daedal’s “Toward a Taxonomy of Failure” for a few personal case studies of professional failure, and the pivotal edited volume Reframing Failure in Digital Scholarship (2025). ↩
There’s an edited volume around this topic, On Making in the Digital Humanities (2023), and there’s the oldie but goldie “Process as Product: Scholarly Communication Experiments in the Digital Humanities” (2012) by Coble et al, where scholars discuss process as approached in the digital publication sphere. ↩
In schnellen Schritten geht es auf die DHd2027 in Marburg zu. Daher möchten wir uns an dieser Stelle noch einmal herzlich für die Konferenzbegleitungsbeiträge unserer Reisestipendiat:innen der DHd2026 bedanken. Stipendien gab es für Doktorand:innen und (very) early career DHers. Sie wurden vom DHd-Verband sowie von NFDI4Culture, NFDI4Memory und CLARIAH-AT vergeben.
Die Stipendiat:innen konnten im Gegenzug die Konferenz entweder auf Social Media begleiten oder haben im Anschluss an die Tagung jeweils einen Blogpost verfasst, der die breite Palette an Themen und Ansätzen auf der DHd dokumentiert. Nachfolgend findet sich eine Übersicht über die verschiedenen Blogposts mit den dazugehörigen Links:
Diese Blogposts in ihrer Themenvielfalt zeigen die Bandbreite der Methoden und Ansätze in den Digital Humanities im deutschsprachigen Raum. Die vielseitigen Beiträge der Stipendiat:innen sind ein wertvoller Beitrag zur Dokumentation der Diskurse und Erlebnisse der DHd2026, wofür wir uns ganz herzlich bedanken!
Das vierte Community Meeting 2026 von NFDI4Objects findet virtuell statt! Die Veranstaltung richtet sich an Einsteiger:innen und Interessierte und bietet spannende Einblicke in die Arbeit des Konsortiums. Freut euch auf interaktive Formate, Austauschmöglichkeiten und dezentrale Online-Workshops.
Programm und Workshop-Termine folgen in Kürze – merken Sie sich den Termin schon jetzt vor!
Hiermit laden wir Euch sehr herzlich zum nächsten Clustertreffen des CC „Authority Files and Community-driven Vocabularies“ am 29. April 2026, von 13 bis 14:30 Uhr, ein. Dieses Mal wird es ein Hands on für DANTE mit unserem Chair Michael Markert von der VZG geben.
DANTE ist ein Webservice zur Pflege und Veröffentlichung von Vokabularen, der von der Verbundzentrale des GBV auch für NFDI4Objects-Institutionen bereitgestellt wird. Zu unserem Hands-On-Treffen wollen wir gemeinsam Datensätze im DANTE-Testpool anlegen und bearbeiten, damit neue Nutzer:innen sich mit der Funktionalität vertraut machen können.
Bringt gern Beispieldaten aus dem Bereich Personen, Körperschaften, Orte und Sachbegriffe zum Ausprobieren mit!
Es wäre schön, wenn auch erfahrene DANTE-Nutzer:innen zur Unterstützung bei Fragen dabei sein könnten.
Hier sind die Zoom-Zugangsdaten: https://dainst-org.zoom.us/j/93752320746?pwd=HTwLEQw0aUraauAoZbx8hpnKnse6PD.1
Meeting-ID: 937 5232 0746
Kenncode: 673534
Dieses Mal würde wir uns aus Planungsgründen über Anmeldungen im Vorfeld sehr freuen.
Am Dienstag, 28. April 2026 von 9 bis 11 Uhr findet die nächste Sitzung des Community Clusters Protected Heritage Sites online statt.
Themen der Sitzung sind:
Abschluss: Datenmodelle für Maßnahmenobjekte und Schutzflächen
Voraussichtlich wird dies die letzte Sitzung sein, in der die Modelle Thema sind. Falls Sie keine Zeit haben, an dem Treffen teilzunehmen, schicken Sie daher gerne Ihre Anmerkungen per E-Mail, damit sie in der Diskussion berücksichtigt werden können.
Zoom-Raum: https://zoom.us/j/91094521138?pwd=zJLwXZetdBcpMpssA9RpZPVCRFUWDP.1
Meeting-ID: 910 9452 1138
Kenncode: 286763
Das Protokoll der 15. Sitzung des CC Protected Heritage Sites vom 12.03. ist ab sofort via OSF verfügbar: https://osf.io/pwzg4/.
Hier finden Sie auch die aktuellen Entwürfe der Datenmodelle.