普通视图

Received yesterday — 2026年6月16日

转载 | 纪要:【逸仙进阶讲堂】孙显斌:漫谈中国古代的科技创新

2026年6月16日 09:00

中大高研院 2026-06-16 09:00 广东

以下文章来源于:中山大学人文高等研究院

中山大学人文高等研究院

发布中山大学人文高等研究院相关学术信息

本次讲座的主题为“漫谈中国古代的科技创新”,由中山大学人文高等研究院特邀访问教授孙显斌主讲,中山大学博雅学院蔡一峰副教授主持。

2026年5月7日晚,中山大学人文高等研究院逸仙进阶讲堂“中国历史的维度:空间、思想与社会结构”系列课程第五讲在中山大学南校园逸夫楼顺利举行。本次讲座的主题为“漫谈中国古代的科技创新”,由中山大学人文高等研究院特邀访问教授孙显斌主讲,中山大学博雅学院蔡一峰副教授主持。

讲座伊始,孙显斌教授以当代中国科技进步的“斯普特尼克时刻”(Sputnik Moment)为引,在厘清科学与技术的差异的基础上,以天文学算法传统为例,检讨了“中国古代无科学”的偏见,展现了中国古代科学的独特性及其在全球文明交融互鉴中的重要地位。

孙显斌教授授课

一、科技何以成为文明之基

2024年DeepSeek的发布与《黑神话·悟空》的全球风靡被国际产业界视为中国的“斯普特尼克时刻”。1957年,苏联发射人类首颗人造卫星斯普特尼克1号(Спутник-1),在美国社会投下巨大阴影,直接催生了1958年的《美国国防教育法案》(National Defense Education Act):美国政府开始大力资助对包括中国在内的亚非拉第三世界的区域研究。科学技术是“第一生产力”,它体现了大国之间的实力升降,改变着全球政治格局

回顾人类经济史,根据美国经济学家德隆(Brad DeLong)对公元前500年至公元2000年世界人均GDP的估算,在1765年工业革命以前,人均GDP几乎始终停滞,工业革命后则持续爆发式增长,并且增长速率不变。孙显斌教授由此得出这一历史判断:仅就科技维度而言,人类近代历史上只发生过一次技术革命,即工业革命

全球人均GDP趋势图

二、“中国式科学”的正名

中国古代究竟有无科学?这是中国科技史研究中最具争议性的问题。孙显斌教授强调,我们习以为常的“科技”实为晚近的产物:工业革命以前,科学与技术是“两股道上跑的车”,分属截然不同的两拨人群技术工作由工匠从事,以满足实际需要为目的,如面对“根据圆的周长求半径”的难题时,古代工匠并不计算圆周率,而是用一根可伸缩的尺子反复测量得出结果。

工匠拥有一套不同于科学家却不失其有效性的知识传统。技术有其独特的“黑箱性”即便并不是完全知道原理,工匠照样能够有效付诸运用。医学与农学建基于生命科学,但就其自身而言,则本质上属于技术范畴。现阶段大模型技术也同样如此,尽管效果卓著,其原理却尚不完全清楚,可谓是现代“技术”。在古代几无实用价值的科学的从业者则多为衣食无忧的知识阶层,其中当属数学与天文学最为发达。古代数学最为困难的应用则是计算天文历法尤其是五星运动,那是古代社会最为艰深的智力挑战。

孙显斌教授以中国天文学史为例回应了“中国古代偏重技术而缺乏科学”的论调:中国古代历法不只是对年月日的简单编排,而是寻求与日有东升西落、月有阴晴圆缺、年有太阳回归的自然节律相吻合。为此,历法确立了十九年七闰的周期,这本身就是高度理论化的产物。同时,历代《律历志》中还包含对五星运动的计算。对于金木水火土五星时顺时逆的视运动,古希腊以托勒密的本轮-均轮几何模型求解,中国则走上一条截然不同的代数路径,即以精确的差值法推算行星在任意时刻的位置。二者路径迥异,但都能准确预报日月食与行星方位。明末中西两派算法在钦天监中的斗法,表面上看意在较量观测的精度,实则是两套算法传统的直接交锋。

陈梦雷《古今图书集成·历法典》第四十卷“庚午元历下”(雍正四年内府铜活字印本))

这种以算法为核心的计算方式与现代计算机数学的思维模式颇为相似。曾获得国家最高科学技术奖的著名数学家吴文俊(1919-2017)正是从中国古代数学中获得启发,创立了将几何问题转化为代数问题求解的“吴方法”。吴文俊曾做出这一意味深远的判断:中国没有产生希腊式的公理体系,但中国传统数学却具有计算机数学的影子。这或许正是DeepSeek等大模型取得突破的原因之一:算法本就深植于中国知识传统的思维方式之中。中国古代不仅拥有科学,而且拥有一种独特形态的科学。

三、跳出“四大发明”

最早将造纸术、印刷术、指南针、火药并称为“四大发明”的并非中国人,而是西方学者。培根在《新工具》中称后三者为“任何帝国、任何教派都无法与之相比的发明”,马克思则宣称中国的三大发明“预告了资产阶级社会的到来”:指南针打开了世界市场,火药炸碎了欧洲的封建城堡,印刷术成为新教与科学知识传播的基石。在确定造纸术源自中国后,“四大发明”的说法便在全球流行起来

然而,中国古代科技绝非只有“四大发明”。在中国科学院自然科学史研究所的主持下,各领域专家遴选出近百项具有世界影响的古代中国发明,经全球科学史同行评审确认,最终形成《中国古代重要科技发明创造》一书,收录有88项古代的重要科技发明。

《中国古代重要科技发明创造》(中国科学技术出版社,2016年)

其中,水稻最先在中国由野生走向驯化,江西万年仙人洞遗址将稻作历史上推至一万两千年,的祖先是随处可见的狗尾巴草,柑橘类作物皆源自中国,茶叶与丝绸更是“卡住世界贸易脖子”千余年的核心技术。造船史上的水密隔舱技术,唐代已有文献记载,考古实证则可上溯至宋代,将船体分割为独立密封舱室的设计至今仍是包括航空母舰在内的一切大型船舶安全性的根基。这足见中国古代科技发明在全球文明交融互鉴中的巨大作用。

云南野生稻;粟成熟穗;成熟柑橘果实;茶树鲜叶;龙凤纹传统织锦;宋代水密隔舱海船模型

在交流环节中,在场师生就数字人文的方法论路径、中国古代科学理论的当代评价、科技史研究的跨国视野等问题,与孙显斌教授深入交流。讲座在热烈的学术氛围中圆满落幕。

内容来源:中山大学人文高等研究院

编辑:陈旖旎

初审:蔡一峰

复审:林  耿、陈诗诗

审定发布:张  伟

阅读原文

跳转微信打开

김동건 / 한국학중앙연구원 / 냉전기 부산의 구호물자DB화를 통한 포용사회 형성 연구 / 2026 한국학자료센터구축사업 / 6년 / 18억

作者Baro
2026年6月15日 19:24

연구목표내용
본 사업은 한국학진흥사업을 통해 산출된 연구결과물의 학술적 활용도 제고를 위해 표준화된 형식의 DB로 가공·집적 및 주제별, 분야별 기초자료에 대한 종합적 자료 수집·정리를 토대로 온라인 서비스를 제공하는 것을 목적으로 한다.
본 연구팀은 『한국학 토대자료 디지털화 및 공유체계 구축』 사업과 『한국학 자료 디지털화 및 공유체계 구축』 사업에 연구보조원부터 참여해 전임연구원이 된 핵심 인력들로 구성되어 있다. 이러한 “한국학진흥사업 성과포털” 성과 관리 및 서비스 운영의 오랜 실무 경험을 바탕으로, 이를 “한국학자료포털”과 유기적으로 연계하여 한국학 자료를 디지털화하고 공유체계를 구축함으로써 한국학자료센터구축사업의 확고한 토대를 마련하고자 한다. 이를 달성하기 위한 구체적 연구 목표는 다음과 같다.

– 한국학 기초자료 성과 종합적 DB화
– “한국학진흥사업 성과포털” 서비스 관련 연계 정보 및 개별 홈페이지 구축·탑재를 위한 DB설계 지침 마련
– 한국학진흥사업 성과 확산을 위해 기 구축된 “한국학진흥사업 성과포털”을 고도화하고 “한국학자료포털(중앙허브)” 서비스를 유지 보수
연구요약내용
○ 연구 성과 서비스 표준화안 도출 및 적용
○ 한국학기초자료사업 연구 성과 통합 DB 구축 및 검색 서비스 제공
○ 한국학진흥사업 연구성과 포털 고도화 및 개별 홈페이지 구축 지원
○ 내·외부 정보 연계 기능 강화 및 연구 성과의 대중적 확산
기대효과
○ 한국학기초자료사업 연구 성과의 종합적 DB화를 통한 자료의 체계적 관리
○ 기존 연구 사업 성과와의 연계 및 통합 검색을 통한 한국학 자료 접근성·활용성 강화
○ 한국학 기초 자료 통합 서비스 시스템 개선을 통한 한국학 자료 토대 구축 및 후속 연구 진작
○ 한국학진흥사업 연구성과 포털 고도화 및 민간 포털 연계 강화를 통한 대중화 확대와 한류 기반 조성
키워드(한글)
한국학 기초자료, 표준스키마, 한국학진흥사업 성과포털, 한국학자료포털, 정보 연계

게시물 김동건 / 한국학중앙연구원 / 냉전기 부산의 구호물자DB화를 통한 포용사회 형성 연구 / 2026 한국학자료센터구축사업 / 6년 / 18억KADH / 한국디지털인문학협의회에 처음 등장했습니다.

한봉석 / 국립부경대학교 / 냉전기 부산의 구호물자DB화를 통한 포용사회 형성 연구 / 2026 한국학지역거점연구소 / 3년 / 9억

作者Baro
2026年6月15日 19:23
연구목표내용
본 연구는 1945년부터 1979년까지 냉전기 부산에서 이루어진 구호물자의 공여 · 수원 · 유통 기록물을 수집 · 정리 · DB화함으로써, 냉전기 해양도시 부산의 포용사회 형성사를 복원하는 기초자료를 구축하는 것을 목표로 한다.
구호물자란 제 2차 세계대전 후 국제사회 정부 및 민간단체, 개인에 의해 공여된 일체의 비상업 물자를 지칭한다. 본 연구는 그 중 인도주의 구호 물류에 초점을 맞추도록 할 것이다.
포용사회(Inclusive Society)란 사회의 모든 구성원들이 각자의 정체성 조건과 무관하게 사회적 삶에 오롯히 참여할 수 있는 기회와 권리가 보장되는 사회를 의미한다.
본 연구에서는 구호사업에서 기관구호 및 일반구호의 대상자였던 주요 구성원들 – 피난민, 전쟁 미망인, 고아(기아), 한센병환자, 상이군경, 기지촌 등 –이 부산 공동체에서 유기적으로 결합하고, 공동체를 형성한 것을 긍정적으로 재전유하기 위해 이들 공동체를 ‘포용사회’로 호명하도록 할 것이다.
부산은 한국전쟁을 전후로 귀환동포 20만, 피난민 40여만 명이 정착하면서 인구가 5만에서 110만여 명으로 급격히 증가한 이주민의 도시이다. 이 과정에서 전쟁미망인· 고아· 한센병 환자· 상이군경· 피난민· 개척단 등 다양한 정체성 집단이 부산의 도시 공간 안에서 각자의 공동체를 형성하며 부산 시민으로 자리잡아 갔다. 이들에 대한 기록물은 역사적으로 불온으로 간주되어 포착하기 어려웠으나, 이들 포용사회 구성원들의 존재를 증명하는 중요한 1차 사료가 바로 구호물자 유통망의 기록이며, 동시에 이는 한국 사회복지사의 원형을 담은 기초자료이기도 하다.
그러나 부산의 현대사 기록물을 소장· 관리하는 기관이 매우 제한적이며, 기록의 보존 및 생산이 유관 연구자 부족으로 제대로 이루어지지 못한 실정이다. 특히 포용사회 구성원들의 개인 기록은 대부분 소실되거나 정보보호법에 의해 접근이 제한되어 있는 반면, 이들에게 구호물자를 전달한 기관의 기록은 냉전 기록으로 온전히 보존되어 있다.
이에 본 연구팀은 핵심 사료인 1949년부터 1979년까지 한국에서 활동한 주한 케아(the Cooperative for American Relief Everywhere) 부산지부 기록물 약 2만 건과, 부산광역시 및 국가기록원 부산 분원이 소장한 부산시 생산 기록물 약 7천 건을 결합하여 부산 10개구 60여 개 동 단위의 구호물자 공여 · 수원 · 유통 기록 총 26,032건을 DB화할 것이다.
연구는 3개 연차로 구성된다. 1차년도에는 1948년 케아의 대한 표준계약 체결부터 한국전쟁기인 1953년까지를 대상으로 공여자 DB(8,784건)를 구축하고, 2차년도에는 1954년부터 1964년까지 케아 부산지부 기록물을 중심으로 구호물자 유통망 및 공간 DB(10,248건)를 구축하며, 3차년도에는 부산광역시 생산 기록물을 중심으로 수원자 DB(7,000건)를 완성한다.
본 연구는 단순한 자료 수집을 넘어 H-GIS(역사지리정보시스템) 기반의 공간 분석을 통해 냉전기 부산의 구호 유통망과 포용사회의 공간적 구조를 시각화하고 실증적으로 규명하고자 한다. 이를 통해 지금까지 ‘타자화’되거나 ‘불온’으로 간주되었던 이주민 집단의 역사를 부산 공동체의 본질적 구성 요소로 재전유하고, 부산 포용사회 형성사를 복원하는 토대를 마련한다.
연구요약내용
본 연구의 핵심 내용은 냉전기 부산에서 이루어진 구호물자의 공여 · 수원 · 유통 기록물을 수집 ·정리하여 총 26,032건의 DB를 구축하고, 이를 H-GIS 기반으로 시각화하여 부산 포용사회의 형성 과정을 실증적으로 규명하는 것이다.
연구의 1차년도는 ‘구호의 시작과 공여자 DB 구축(1948~1953)’을 목표로 한다. 주한 케아가 한국정부와 계약을 체결한 이후 한국전쟁 종전까지를 대상 시기로 한다. LARA 참여 단체들의 구호물자 지원, 유니세프 탈지분유 지원, 케아 패키지 구호 기록 등을 수집 및 해제하여 공여자 DB 8,784건을 구축한다.
연구의 2차년도는 ‘구호의 확대와 유통망 DB 구축(1954~1964)’을 목표로 한다. 이 시기 기록물들은 부산 지역이 주어이며, 시·구·동에 걸친 주요 인명, 단체명, 구호물자 등 다양한 정보가 기록으로 남아 있다. 케아는 공여자의 대표로서 유관 단체들과 기록을 주고 받으며, 10여년간 부산 사무실 기록을 생산했다. 이를 통해 공여 및 수원자 단일 관계외의 공간도 발굴한다. 즉 구호물자 수집 저장 유통 공간에 인접한 국제시장, 적기 암시장은 물론 구호물자 수원처의 공동체의 발전상 등에 대해 정보를 수집한다. 이를 바탕으로 H-GIS를 가시화함으로써 부산 시내 포용사회에 대한 이해를 도모할 것이다. 또한 케아가 공여한 100종 이상의 구호물자에 대해서도 함께 연구하도록 한다.
연구의 3차년도는 ‘구호의 종결과 수원자 공동체 DB’ 구축이다. 부산광역시 기록관 및 국가기록원 부산 분원 소장 자료를 중심으로 부산 10개구 60개 동 203개 기관구호 대상 기관의 수원 기록물 7,000여건을 DB화한다. 기관 자료 외 개별 기관이 수집한 자료, 개인의 구술 등을 사업팀이 직접 생산하도록 할 것이다.
본 연구팀의 DB는 국제기록물위원회의 ISAD(G) 및 ISAAR(CPF) 표준을 준용하여 설계하고, EXCEL로 제출될 것이다. 또한 1-3차년도에 수집된 정보를 바탕으로 케아 본부 및 창고, 공여자 및 수원자 시설 정보, 항만 정보를 포함시켜 GIS 레이어를 구축할 것이다. 이를 가시화함으로써 구호시설의 분포와 공간적 네트워크를 분석하고, 냉전기 부산이 실제로 다양한 공동체가 공존하는 포용사회 공간이었음을 실증적으로 검증한다.
기대효과
○학술적 기대효과
첫째, 냉전기 부산에 대한 월별 냉전사 DB 제공
현재까지 부산 지역을 주어로 한 냉전기 민간구호 기록은 체계적으로 수집된 바 없다. 본 연구가 구축하는 26,032건의 DB는 그 자체로 부산 지역 연구에 기여할 것으로 예상된다.
둘째, 부산을 주어로 하는 역사서술의 가능성 제시.
기존 연구는 정치사 외교사 중심의 전국 단위 서술에 집중되어 왔으나, 본 연구는 부산이라는 특정 지역이 냉전기 국제 인도주의 구호의 거점으로 기능하였음을 사료적으로 증명하고, 글로벌-국가-지역을 교차하는 다층적 역사 서술의 가능성을 제시한다.
셋째, 디지털인문학적 방법론의 공유 및 확산
H-GIS(역사지리정보시스템) 기반 공간 분석 방법론의 적용을 통해 디지털 인문학적 연구 방법을 구현하고, 이후 그 방법을 대중화하는데 기여할 것이다.
넷째, 이주사 등 새로운 연구분야 개척
국제 기록물 기술 표준을 준용하여 구축된 DB는 국내외 연구자들의 접근과 활용이 용이하도록 설계되어, 국제 냉전사 아카이브 네트워크와의 연계를 원할히 하고, 새로운 연구주제를 제시할 것이다.
다섯째, 부산 지역 학문후속세대 육성
본 연구는 냉전사 연구가 많지 않은 부산지역 대학원생들에게 실제 냉전사 자료를 수집하고, 해제하고, 이해하는 연습 과정을 포함하고 있다. 이를 통해 냉전사 분야의 학문 후속세대를 육성할 것을 기대한다.
○사회적 기대효과
첫째, 냉전기 부산이 이주한 귀환동포, 피난민, 전쟁미망인, 고아, 한센인, 상이군경 등 다양한 주체들의 사료를 생산함으로써 향후 이들의 연구에 사료적 학문적 근거를 제공할 것이다.
둘째, 이들 주체들을 불온이 아닌 긍정으로 재전유함으로써, 역사 연구에서 인식의 재전유를 촉구할 것이다. 이는 오늘날 이주를 둘러싼 혐오에 대한 역사적 대응이 될 것이다.
셋째, 부산시의 역사문화콘텐츠 사업 및 기관 전시의 실질적 기초 자료를 제공한다. 대중 강연과 유튜브 영상, 학술서 및 교양서 발간을 통해 연구 성과를 시민과 공유함으로써 지역 역사 쓰기에 시민이 동참하는 기회를 마련한다.
넷째, 한국해양수산아카이브와 해양도시 인문지도를 통해 구호물자 DB와 H-GIS 결과물을 온라인으로 공개함으로써, 연구자뿐 아니라 일반 시민들도 냉전기 부산의 역사에 쉽게 접근할 수 있는 디지털 플랫폼을 구축해 관심과 연구를 환기한다.
넷째, 국제 인도주의 구호의 초기 실험장이었던 부산의 경험을 정리한 자료는, 국제 사회에서 부산과 한국의 인도주의 역사를 새롭게 자리매김하는 계기를 제공할 것이다.
키워드(한글)
포용사회, 부산, 디지털 아카이브, 역사지리정보시스템, 외국민간원조기관한국연합회, 주한 케아, 한국전쟁, 인도주의 구호

게시물 한봉석 / 국립부경대학교 / 냉전기 부산의 구호물자DB화를 통한 포용사회 형성 연구 / 2026 한국학지역거점연구소 / 3년 / 9억KADH / 한국디지털인문학협의회에 처음 등장했습니다.

이준규 / 부산대 / 일제강점기 영남지역 유교 강학공동체 종합DB 구축 및 심화연구 -전통지식인의 결집과 대응에 대한 AI디지털인문학적 분석- / 2026 한국학지역거점연구소 / 3년 / 9억

作者Baro
2026年6月15日 19:22

연구목표내용
본 과제는 일제강점기 영남지역 유교 강학공동체의 주요 학파인 한주학파·성재학파·간재학파의 ‘서당(書堂)’을 중심으로, 강학 및 결사 활동의 집단적 실체를 규명하는 데 그 목적이 있다. 조선 말기 서원이 철폐되고 일제강점기 향교가 총독부에 의해 경제권을 박탈당하며 친일 집단으로 전락한 극한의 상황 속에서, 서당은 유교적 도통(道統)을 계승하고 전통 지식인들이 결집하는 마지막 사상적 보루이자 저항의 거점으로 기능했다. 본 연구는 이러한 시대적 격변기 속에서 지식인 결집과 실천적 항일 의지의 사상적 원동력을 개인의 차원이 아닌 ‘집단지성’의 관점에서 구체적이고 실증적으로 밝히고자 한다.
연구 대상은 한주·성재·간재학파를 각각 대표하는 면우(俛宇) 곽종석(郭鍾錫), 소눌(小訥) 노상직(盧相稷), 월헌(月軒) 이보림(李普林)이 주도한 강학공동체와 그 거점이 된 서당 관련 자료이다. 이를 토대로 일제강점기 유교 강학공동체 집단지성의 실체에 대한 종합적이고 체계적인 심화 연구를 본격적으로 수행하고자 한다.
이를 위해 본 연구팀은 DB문헌팀과 학술팀으로 역할을 분담하여 다음의 절차로 연구를 진행한다. 첫째, 관련 원전 자료를 전수 조사하고, AI 디지털 기술을 활용한 탈초·교감·해제 작업을 수행하여 정밀한 전통지식 원천 데이터를 구축한다. 둘째, 이를 영남지역 전통지식 종합 DB로 집대성한다. 셋째, 확보된 원천 데이터를 바탕으로 실증에 기반한 인문학적 분석을 수행함으로써, 영남지역 유교 지식인 집단의 변모 양상과 특성을 시대적 맥락 속에서 입체적으로 규명한다.
끝으로, 연구 성과를 학계뿐만 아니라 일반 대중과도 공유할 수 있도록 온라인 DB 서비스, 유튜브 콘텐츠, 지역 교육 자료 등 다양한 매체를 활용한 콘텐츠를 개발하여, 학술 연구의 사회적 확장성을 도모하고자 한다.
연구요약내용
본 연구팀은 DB문헌팀과 학술팀으로 역할을 분담하여 연구를 전문화한다. DB문헌팀은 디지털 인문학적 기법을 활용하여 강학공동체의 강학·결사 활동을 분석할 수 있는 종합 DB 구축을 담당하고, 학술팀은 구축된 데이터를 바탕으로 실증에 기반한 인문학적 분석을 수행하여 영남지역 유교 지식인 집단의 변모 양상과 특성을 입체적으로 규명한다. 전반적인 연구는 ① 자료 수집·정리 및 DB 구축, ② 각 강학 공간을 중심으로 한 네트워크 양상 파악, ③ 강학·결사 및 중심인물의 실천 양상 연구의 순으로 진행된다.

1차년도는 곽종석이 주도한 경북 성주의 삼봉서당·경남 거창의 여재 관련 자료를 중심으로 산재한 미정리 자료를 발굴·수습하면서 심화 연구를 병행한다. 곽종석은 삼봉서당(1898) 강학에 참여하고 여재(1903)·인재(1915)를 건립하였으며, 사후에는 문인들이 이동서당(1920)·다천서당(1921)을 계승·운영하였다. 특히 곽종석의 스승 한주 이진상의 아들 대계 이승희가 만주에서 구축하고자 했던 공교회 중심의 한인공동체 덕흥보는 곽종석의 강학 및 결사 활동에 중요한 사상적 연원으로 작용하였을 것으로 추정되는바, 현전하는 문집 자료에 대한 정밀한 검토를 통해 이를 체계적으로 규명한다.
주요 연구 대상 자료는 󰡔다전경의답문󰡕·󰡔다전학설초집󰡕·󰡔심학휘언󰡕·󰡔면문승교록󰡕 등 강학 관련 핵심 자료와 삼봉서당·다전·여재 관련 소장 자료이다. 󰡔다전경의답문󰡕에는 곽종석 문인 229명의 명단과 재생 단체가 수록되어 있어 학파 네트워크 연구에 중요한 가치를 지니며, 󰡔다전학설초집󰡕은 스승·제자 간의 경학 문답을 정리한 자료로서 강학 내용의 실체를 파악하는 데 핵심적 역할을 한다. DB 구축은 TEI-XML 국제 표준을 적용하고 시맨틱 스키마를 설계하여 지식 그래프 자동 생성이 가능한 데이터 구조를 구현한다. 심화 연구로는 한주학파의 학술 결사와 대응 양상, 학파 네트워크 양상 분석, 서당 자료의 디지털 인문학적 접근 방법 등을 수행한다.

2차년도는 노상직이 주도한 경남 밀양의 자암서당 관련 자료를 연구 대상으로 삼는다. 노상직은 자암초려(1880년대 후반∼1910)와 자암서당(1913∼1931)을 운영하며 강학 활동을 지속하였다. 현재 학계에는 자암일록 5책(19개월분)만 알려져 있으나, 부산대학교 도서관 소장 소눌문고에는 󰡔자암일록󰡕·󰡔자암일기󰡕·󰡔자암서당일기󰡕·󰡔방재일기󰡕·󰡔사남일록󰡕 등 17건이 추가로 현전하여, 실제로는 총 105개월 105권 분량이 전하고 있음이 새롭게 확인된다. 낱장 문서 역시 간찰 3,630건·만사 737건·제문 234건·위장 357건 등 총 6,047건으로 대부분 학계에 보고되지 않은 미정리 상태이며, 이를 체계적으로 수집·정리하는 것이 2차년도의 핵심 과제이다.
편지류 및 일기 자료 구축에는 AI 기반 지능형 수합 문자 인식 기술을 적용하여 초서·행서체 수기 기록의 탈초 정밀도를 극대화하고, 온톨로지 기반 시맨틱 스키마로 인물·지명·시기 정보를 구조화함으로써 인적 네트워크의 동적 변화를 정밀하게 추론할 수 있는 지능형 데이터셋을 구현한다. 심화 연구로는 자암일기를 통해 본 전통 유학의 변모 양상과 시대적 의미, 성재학파의 학술 결사 양상, 일제강점기 미간행 자료의 성격과 시대적 의미, 근대 전환기 전통 지식인의 시대적 대응 양상 등을 수행한다.

3차년도는 이보림이 주도한 경남 김해의 월봉서당 관련 자료를 연구 대상으로 삼는다. 이보림은 월봉서당(1917)을 건립하고 1970년대까지 활동하여, 일제강점기부터 현대에 이르는 전통 지식인의 현실 대응 양상을 통시적으로 보여준다는 점에서 독보적인 연구 가치를 지닌다. 주요 연구 대상은 󰡔서당일기󰡕(4책, 1925~1932)·󰡔석옹수찰󰡕(서간 142통·시문 8건)·󰡔논어강의󰡕(7권 453개 문답) 등이며, 이 밖에 󰡔화산징헌록󰡕·󰡔일신재계안󰡕·󰡔관선록󰡕·󰡔간재연보󰡕 등 월봉서당 소장 자료 전반이 포함된다. 특히 󰡔논어강의󰡕는 전통 지식인이 경전을 탐구하는 과정의 문제의식을 고스란히 담은 학술적 기록으로, 강학 내용의 사상적 맥락을 규명하는 데 핵심적 역할을 한다. 자연어 처리 기반 개체명 인식 기술을 적용하여 핵심 개념어와 인용 문헌 추출의 정확성을 확보하고, 앞선 연차의 한주·성재학파 데이터셋과 유기적으로 통합하여 학파 간 지식 전승 경로를 시각화하는 지식 그래프 구축의 토대를 마련한다. 심화 연구로는 간재학파의 학술 활동과 의미, 전통 지식인의 네트워크 양상, 서당 자료의 서지학적 특징과 의미, 근대 전환기 영남지역 유교 지식인의 결집과 대응 양상 등을 수행한다.

3차년도 완료 시점에는 세 학파의 강학공동체를 횡단적으로 비교·종합하는 연구를 병행한다. 세 학파는 동일한 시대적 위기 속에서도 각기 다른 사상적 지향과 결사 방식을 취하였는바, ① 강학 방식과 교육 내용의 학파별 비교, ② 결사 조직의 형태와 운영 방식 비교, ③ 일제 압제에 대한 대응 양상의 차이와 공통점 분석의 세 축을 중심으로 종합 연구를 수행하고, 그 성과를 단행본으로 집성하여 학계에 제공한다. 아울러 온라인 DB 서비스·유튜브 콘텐츠·지역 교육 자료 개발을 통해 연구 성과를 대중과 공유하며, 지역 공동체의 역사·문화적 정체성 함양에 기여하는 선순환적 연구 확산 구조를 구현한다.
기대효과
본 연구는 학술적·기술적·사회적 측면에서 기존 패러다임을 혁신하는 다각적 기대효과를 창출할 것이다. 일제강점기와 근대 전환이라는 역사적 격변기에 영남지역 강학공동체가 지식인 결집과 실천적 항일 의지의 정신적 원동력으로 작용한 실태를 구체적이고 실증적으로 밝혀낼 수 있다는 점에서 그 의의가 크다.

첫째, 학술적 측면: 집단지성 실체의 규명과 종합적 횡단 연구의 완성
기존 연구가 특정 인물이나 개별 서당을 독립적으로 고찰하는 데 그쳤다면, 본 과제는 한주·성재·간재학파 세 학파의 강학공동체를 통합적 시각 아래 비교·분석함으로써, 일제강점기 영남 유교 지식인 집단지성의 전체상을 처음으로 실증적으로 규명한다는 점에서 뚜렷한 차별성을 지닌다. 나아가 기존 연구가 문헌 해석 중심의 개별 연구에 머물렀다면, 본 과제는 AI 디지털 기술을 활용한 DB 구축을 선행하여 방대한 미정리 자료를 학술 연구의 장으로 끌어올리는 기초자료 인프라 구축이라는 새로운 연구 패러다임을 제시한다.
세 학파의 거점 서당 사례는 전통 지식인 집단의 강학·결사 실태를 규명하기에 가장 적합하고 풍부한 자료를 제공한다. 영남지역 전통지식 종합 DB 구축을 통해 확보한 원천 데이터를 바탕으로 실증에 기반한 인문학적 분석을 수행함으로써, 영남 유교 지식인 집단의 변모 양상과 특성을 시대적 맥락 속에서 입체적으로 규명할 수 있다.
또한 일제강점기 전통 지식인들의 실천적 집단지성 양상을 조명하는 것도 중요한 성과 중 하나이다. 이러한 집단지성의 면모는 두 가지 측면에서 뚜렷하게 드러난다. 첫째, 전통 사상의 존속을 위한 유교 지식인 집단의 반성과 쇄신의 적극성이며, 둘째, 시대적 과제에 대응하는 결사와 항거의 사회적 실천성이다. 곽종석 등 한주학파의 파리장서운동, 노상직 등 성재학파의 자암계·자암서당 운영, 이보림 등 간재학파의 수선사 결성이 그 대표 사례이다.

둘째, 기술적 측면: AI 기반 한국학 디지털 인프라의 질적 도약
본 연구는 AI를 활용하여 탈초·교감·해제 과정을 거쳐 디지털화하고 이를 데이터베이스로 구축함으로써, 연구자들이 체계적으로 활용할 수 있는 기초자료 인프라를 마련한다. 특히 영남 유림의 일기·강학록·서간문 등 초서와 행서가 혼재된 필사본 자료에는 기존 광학 문자 인식 기술의 한계를 넘어, 영남 유림 특화 지능형 수합 문자 인식 모델을 도입하여 판독의 정밀도를 획기적으로 제고한다. 이를 통해 구축된 데이터는 향후 한국학 분야 AI 판독 모델의 핵심 자산이 될 것이다.
아울러 본 연구는 집단지성 네트워크 규명을 위한 시맨틱 데이터 구조화를 실현한다. 인물·장소·사건·사상을 유기적으로 연결하는 지식 그래프 구축을 위해 국제 표준인 TEI-XML 형식을 도입하고, 원문 내 개체명을 시맨틱하게 태깅함으로써 학파 간 지식 전승 경로를 기계가 분석하고 시각화할 수 있는 지능형 데이터 환경을 구현한다. 나아가 구축된 DB는 CSV 및 XML 형식의 공공데이터 표준을 준수하여 오픈 API 형태로 배포함으로써, 한국학·역사학·교육학·디지털 인문학 등 인접 분야와의 융합 연구를 촉진하는 지식 공유 플랫폼으로 기능하도록 한다. AI를 활용하여 정밀하게 정제된 원천 데이터는 영상 콘텐츠 제작, 지역 교육 자료 개발 등 대중화 사업의 고품질 기반 자료로도 활용되어, 영남 전통지식의 현대적 가치를 사회 전반에 확산시키는 실질적 동력이 될 것이다.

셋째, 사회적 측면: 연구 성과의 대중적 확산 및 지역사회 문화 거점화
연구 성과를 학문 분야를 넘어 일반 대중과 공유하는 것 역시 중요한 기대효과이다. 기존 연구가 학술 논문이나 학술대회 중심으로 성과를 발표해온 반면, 본 연구는 보다 폭넓은 확산 전략을 추구한다. 온라인 DB 서비스를 개방형 플랫폼으로 제공하여 접근성을 높이고, 유튜브 콘텐츠 제작 및 지역 교육 자료 개발을 통해 전통지식 연구가 교육·문화 콘텐츠로서의 역할을 수행할 수 있도록 한다. 특히 문헌으로만 존재하던 영남 유림의 강학 현장과 이동 경로를 GIS 기반의 디지털 지도로 구현하여 일반인도 쉽게 이해할 수 있는 시각 자료를 제공하고, 서당 등 역사적 공간을 배경으로 연구진과 지역 한학자가 참여하는 현장 유튜브 좌담회를 제작·배포하여 젊은 세대와의 접점을 확대한다.
나아가 이러한 성과 확산은 지역사회에도 긍정적인 영향을 미칠 것으로 기대된다. 영남지역 서원·서당을 연계한 교육 프로그램을 개발하고, 지역 문화유산 보존 및 활용 정책과의 연계 방안을 모색하는 한편, 조사 과정에서 발굴된 미공개 간찰·일기 등을 소재로 한 인문학 강좌를 개설하여 지역 주민들이 선조들의 삶과 정신문화를 직접 체감할 수 있도록 한다. 더불어 대학 강의 자료, 중·고등학교 지역사 교육 보조 콘텐츠, 시민 대상 평생교육 프로그램 등 다층적인 교육 연계를 통해 서당 교육의 역사적 의미를 재조명하고, 현대 교육 환경에서 전통교육의 현대적 적용 가능성을 탐색하는 데 기여함으로써 지역 공동체의 역사·문화적 정체성 함양에 이바지하는 선순환적 연구 확산 구조를 구현한다.
키워드(한글)
일제강점기, 강학공동체, 서당(書堂), 강학(講學), 결사(結社), 심학(心學), 전통지식인, 영남 유학, 디지털 인문학, 항일운동, 면우(俛宇) 곽종석(郭鍾錫), 소눌(小訥) 노상직(盧相稷), 월헌(月軒) 이보림(李普林)

게시물 이준규 / 부산대 / 일제강점기 영남지역 유교 강학공동체 종합DB 구축 및 심화연구 -전통지식인의 결집과 대응에 대한 AI디지털인문학적 분석- / 2026 한국학지역거점연구소 / 3년 / 9억KADH / 한국디지털인문학협의회에 처음 등장했습니다.

录取结束 | 第四届语料库与数字人文暑期学院(5号通知)

2026年6月15日 17:47

戴俊阳 徐惠 2026-06-15 17:47 江苏

录取工作告一段落,请大家关注后续更多精彩内容:)

第四届语料库与

数字人文暑期学院

— 五号通知 —

CDHSUMMER2026

尊敬的各位报名者:

感谢大家对第四届语料库与数字人文暑期学院的热切关注与积极参与。经本人申请、专家组评审及主办方报名材料审核等流程,本届暑期学院的录取工作现已全部完成。现就相关事宜通知如下:

(1)未收到录取邮件的报名者,即视为未被录取,不再另行通知。

(2)截至本公告发布之时,已收到录取邮件且所提交材料通过审核,但尚未按要求加入学员联系群的预录取学员,视为自动放弃录取资格,其名额不再保留。

已被录取并加入联系群的学员,请密切关注群内后续通知,做好开课前的各项准备。未被录取的报名者,仍可参与后续20场学术讲座及论坛活动,届时可通过直播平台收看并与专家学者互动交流,具体安排请关注比特人文公众号的后续推送。

如有疑问,请联系组委会邮箱:dhbase2026@126.com

再次感谢各位对本次暑期学院的关注与支持!

第四届语料库与数字人文暑期学院组委会

2026年6月15日

01

预习教材推荐

为帮助学员提前适应课程内容,组委会结合各方向教学需求,推荐如下预习资源。暑校开课也将安排部分赠书:

A班:数据库编程讲习班

《数字人文实战:网络数据库编程技术》

作者:李斌

南京大学出版社

B班:语言统计方法讲习班

(1)赤裸裸的统计学(新版)

作者:[美] 查尔斯·惠伦 (Charles Wheelan)

中信出版集团股份有限公司

(2)SPSS统计分析基础教程(第4版)

作者:张文彤

高等教育出版社

C班:大模型编程讲习班

《数字人文教程:Python自然语言处理》

作者:王东波

南京大学出版社

02

南师大食宿地图

本届暑期学院线下会场位于南京师范大学随园校区。为方便学员提前安排行程与生活,组委会整理校区周边的住宿与饮食分布,如下图所示,建议大家根据自身实际情况提前做好规划和交通住宿预订。

再次声明:学员的交通食宿自理、自行安排。

校区位置:南京市鼓楼区宁海路122号。

温馨提示从火车站至随园校区需地铁换乘,且最近地铁站点距校区仍有800米,建议打车出行,更为便捷。

扫码关注公众号,

获取课程更新、嘉宾资讯等更多内容

相关链接:

第四届语料库与数字人文暑期学院(1号通知)

报名开启 | 第四届语料库与数字人文暑期学院(2号通知)

报名答疑 | 第四届语料库与数字人文暑期学院(3号通知)

预录取通知 | 第四届语料库与数字人文暑期学院(4号通知)

比特人文

投稿邮箱:dhbase@126.com

扫码关注 获取更多资讯

图片

阅读原文

跳转微信打开

提示词对AI文学创造力的激发机制研究

2026年6月16日 12:22

原创 李倩 吴静 2026-06-16 12:22 北京

提示词;人工智能文学创作;创造力评估;数字修辞学

转载请注明“刊载于《数字人文研究》2026年第1期”;参考文献格式:李倩,吴静.提示词对AI文学创造力的激发机制研究[J].数字人文研究,2026,6(1):75-93.全文PDF已在知网、万方及编辑部网站(http://dhr.ruc.edu.cn)上发表,此处注释及参考文献从略。

提示词对AI文学创造力的激发机制研究

李倩  吴静

摘要 

随着生成式人工智能深度介入文学创作,提示词已成为影响人机协同创作效果的关键因素。针对提示词如何激发其文学创造力这一问题,研究设计了五类提示词在DeepSeek模型上进行生成实验,并采用主客观结合评估体系并展开量化与质性分析。实验揭示:提示词通过“语义定向—认知修辞介入”机制,将人类意图转化为AI可执行创造操作;其中,抽象概念型激活跨域类比,多元融合型促进异质语义整合。AI文化寄生性既反映人类集体无意识,又提供陌生化表达契机,推动分布式创造力涌现。提示词设计与多轮生成策略在AI文学创作中的关键作用,为数字人文语境下人机协同创作提供理论与方法参考。

关 键 词  提示词;人工智能文学创作;创造力评估;数字修辞学

作者简介  李倩,南京师范大学公共管理学院哲学系博士研究生、新疆财经大学中国语言文化学院语言文学系讲师; 吴静,华东师范大学哲学系教授。

0

引 言

近年来,基于大语言模型的人工智能技术已深度介入文学创作领域。从AI作品入围文学奖项,到各类创作大赛的举办与AI写作线上社区的兴起,均标志着“人机协同”正成为一种重要的文学实践模式。然而,在相同技术条件下,AI生成文本的文学质量呈现显著差异,其创造性高度依赖用户输入的提示词。这促使研究焦点从“机器能否创作”的本质性追问,转向“人类如何通过语言设计有效激发其创造潜力”的过程性探究。当前学术界对人工智能创造力与提示词之关系的研究存在两条相对独立的路径。一条路径根植于计算创造力理论,侧重对机器产出的创造性进行界定和评估,聚焦人工智能创造力的计算本体研究[],但忽视了人类作为交互起点的关键作用。另一条路径来自自然语言处理领域,将提示词视为优化模型性能的技术工具,较少探讨其作为修辞载体和文化中介的深层功能。那么提示词究竟通过何种中介机制,将人类的创作意图转化为AI模型可执行的创造性行动?

本研究旨在系统揭示提示词在AI文学创作中的创造力激发机制,以回答上述问题。提示词绝非被动指令,而是一种能动的、结构化的引导框架。它通过其语言构成、信息维度与修辞策略,直接干预AI模型内部语义网络的激活路径,从而对生成文本的创意来源、风格取向与情感表达施加决定性影响。本研究将构建一个融合计算创造力理论、认知科学和数字修辞学的分析框架,通过设计文本生成实验,对比分析不同类型提示词(抽象概念型、情境叙事型、情感体验型、风格模仿型、多元融合型),采用主客观相结合的指标体系评估其创造性产出效果,再通过对典型案例的深入分析,揭示提示词运作的微观机制,进一步探讨其背后的文化意涵与人机协作的实践张力。

1

理论框架

提示词如何激发AI的文学创造力,这一问题涉及认知过程、修辞实践和人机交互等多重维度,单一学科理论难以充分阐释其复杂机制。因此本研究尝试整合认知心理学、数字修辞学和计算创造力研究的相关理论,力图构建一个跨学科的分析框架

1.1 AI创造力的宏观定位

创造力研究长期面临的一个困难是:如何在承认创造力普遍性的同时,又能区分不同层次的创造性表现?这一困难在AI文学创作研究中尤为突出。如果将所有文本都视为“创造性”产出,则因过于宽泛而失去解释力,但若设定过高门槛,又可能忽视AI在文学创作中的实质贡献。考夫曼(Kaufman)和贝吉托(Beghetto)提出的“创造力四层次模型”(Mini-C、Little-C、Pro-C、Big-C,简称4C模型)为解决这一困难提供了有力工具。该模型将创造力划分为四个层次,构成一个从日常到卓越的连续谱系。这一模型既承认创造力的普遍性(每个人都具有Mini-C层面的创造力),又建立了评价的层次性(不同创造性表现具有不同的社会影响力与文化价值),强调创造力不仅是认知过程的产物,更是在特定社会文化情境中被认可与界定的。当前大语言模型在文学创作中展现出的语言运用能力、主题表达深度、修辞技巧运用等方面,已经达到了专业作家的水准,许多经过精心提示的AI文学作品,在盲测中能够被普通读者误认为人类创作,甚至在某些文学奖项中获得专业评委的认可(如《机忆之地》《东京都同情塔》)。这说明AI文学创作已具备Pro-C层级所要求的专业水准与同行认可,但本质上仍是对训练数据中既有模式的学习与重组,“寄生”于人类已有的创造力成果,尚未展现出开创全新文学范式、改写文学史进程的能力。Big-C层级的创造力往往伴随着深刻的文化反思、独特的人生体验与历史性的突破,这些特质在当前AI创作中尚未显现。但正如考夫曼所强调的,理解创造的过程比关注结果更为关键。这一观点对本研究具有重要的方法论启示。如果仅以结果导向,以传统的人类创作文学文本作为参照物,我们可能陷入“图灵测试”式的表面判断,认为只要“像”,就等同于创造力相同。但创造力的真正奥秘在于其发生的过程:人类作家如何从生活经验中提炼主题?如何在反复修改中完善表达?又如何在文化传统与个人风格之间寻找平衡?显然,AI创作过程与此截然不同:它通过概率计算在海量预料中寻找模式,通过注意力机制分配生成权重,通过随机采样引入不确定性。理解过程的这种差异比简单判断“谁更有创造力”更有意义。因此本研究并非为回答“创造力属于谁”这一问题,而是试图理解在人机协同创作的具体情境中,提示词如何作为中介,将人类的创作意图转化为AI可执行的专业水准创作行动?创造力在这一过程中如何分步、流动与涌现?

1.2 AI创造力的微观机制

博登(Margaret A Boden)的创造力认知理论将计算创造力分为组合性创造、探索性创造和变革性创造三个层次[],本研究将以此理论为依据,在微观层面分析AI文学创造力具体生成机制。从认知层面理解提示词的作用机制,需要回到人类语言理解的基本原理。认知心理学中的“启动效应”揭示了先前刺激如何影响后续认知加工过程。梅耶(Meyer)和施瓦内维尔特(Schvaneveldt)的经典研究表明,当被试者同时看到两个关联词(如“护士”和“医生”)时,判断它们都是单词的速度显著快于非关联词对(如“护士”和“黄油”),平均快85毫秒。这一发现支持语义记忆的网络组织假说,表明相关概念在记忆中的位置更接近,或者访问一个词的信息会激活相邻的相关概念节点,从而促进后续的检索过程。柯林斯(Collins)和洛夫特斯(Loftus)进一步提出“扩散激活模型”,认为激活会沿着语义网络的关联路径扩散,激活强度随距离衰减。基于Transformer架构的语言大模型通过自注意力机制计算词元之间的关联权重,本质上是在高维语义空间中建立动态的激活模式,提示词作为模型接收的初始输入,决定了注意力分配的起始状态。但是,基于海量文本预训练的语言大模型不同于人类认知的单一语义网络,其中构建了多层次、多模态的语义表征,这使得提示词的激活作用呈现出更复杂的特征。本研究借用词汇语义学中“语义场”这一概念,描述提示词通过激活特定的语义场(如词汇、主题、风格等)为模型的生成过程设定概率分布的引力中心。在此过程中呈现出的确定性与随机性的张力,正是AI文学创作既可控又不可预测的根源,认知激活理论为我们理解提示词“引导而非决定”的特性提供了解释基础。

1.3 数字修辞学视角下解析提示词的说服机制

兰汉姆(Richard A. Lanham)在《电子词语》(The Electronic Word)中预言,数字媒介将复兴修辞学传统。他认为,当文本成为可操作、可重组的数字对象时,作者与读者的关系被重新定义,古典修辞学关注的“说服术”再次成为核心技能。提示词工程正是这一预言的当代实现。如何用精确的语言“说服”一个概率系统产出预期效果,成为新的修辞挑战。亚理斯多德在《修辞学》中提出:“修辞术的功能不在于说服,而在于在每一种事情上找出其中的说服方式。造成‘诡辩者’的不是他的能力,而是他的意图。”[]他在其中提出的三种说服手段在当下依然有效,但也不能止步于此,还需关注提示词在数字时代作为新的修辞手段的独特之处。隐喻不仅是修辞手法,更是人类理解抽象概念的基本认知机制。在提示词中,隐喻性表达比直白陈述更能激发模型的创造性联想。这是因为隐喻涉及跨概念域的映射,将源域的结构特征投射到目标域,从而产生新的意义可能性。福柯尼耶(Gilles Fauconnier)和特纳(Mark Turner)在《我们的思维方式》中用禅师的例子进一步揭示,隐喻创造了“整合空间”,其中包含源域和目标域都不具备的涌现结构。提示词中的隐喻正在激活模型构建这样的整合空间,促成创造性的语义生成。传统修辞学追求清晰准确,但在AI文学创作中,提示词的语义不确定性为模型留下了诠释空间。如何把握“生产性模糊”的边界,是提示词修辞的关键技能。与传统的单向修辞不同,提示词处于人机对话的动态过程中,意义产生于对话的交互过程而非独白式表达,提示词不是向被动对象发号施令,而是开启一场与模型的“意义协商”,因此,其创造力本质上是一种对话,不仅是人与人之间的对话,也包括人与算法、人与文本之间的对话。在这种对话中,提示词既是发起者,也是协商者,还是调节者。

1.4 超越单一主体的分布式创造关系网络

从吉尔福德(Guilford)的发散思维说,到斯腾伯格(Sternberg)的投资理论,再到契克森米哈伊(Csikszentmihalyi)的系统模型,创造力研究呈现出百家争鸣之态。这些经典理论的共同局限在于:它们预设了单一主体(通常是人类个体)作为创造力的唯一载体,难以直接适用于人机协同的复杂情境。梅尔·罗兹(Mel Rhodes)于1961年首次提出了创造力的4P模型,4P理论以其多维视角,为分析创造力的生成机制与发展条件提供了一个层次分明、动态开放的理论框架。弗拉德·格拉维亚努(Vlad Petre Glǎveanu)提出5A模型作为替代框架,强调创造力不是发生在个体创造者内部,而是发生在行动者与其环境之间的关系性和主体间现象。创造力的发生正是在从提示词出发的多主体、多层次交互中实现的。这一理论视角具有重要的方法论启示:评估AI文学创作的创造力,不能仅仅比较生成文本的质量,还需要考察整个创作过程,提示词如何设计、人机如何互动、意图如何转化、偏离如何发生。创造力的分布,意味着它无法被还原为任何单一环节,而必须在关系网络的动态演化中被理解。这也正是吉尔福德在1950年所强调的“创造力的多维性”在数字时代的新体现。但是,一些研究者也意识到,如果我们不加辨别地将任何机器生成物贴上“创造性”标签,可能导致“文化灾难”,这会降低社会对真正创造性工作的价值认知,削弱人类创作者的文化地位。因此理解创造力的分布式本质,并不意味着抹平人与机器的差异,而是更清醒地认识到,在这一网络中,人类的文化敏感性、价值判断与审美品味仍是不可替代的关键节点。

1.5 小结

本节构建的理论框架为理解提示词激发AI文学创造力的机制提供了多维度的分析工具。在宏观层面,4C模型将AI创作定位于Pro-C(专业创造力)层级,为整个研究确立了基准线;在微观层面,认知激活理论揭示提示词如何通过语义场定向引导模型的注意力分配,数字修辞学视角阐明提示词作为修辞文本的劝服策略,特别是隐喻、逻辑与模糊性的创造性功能;在系统层面,分布式创造力理论将创造力理解为在人、机、文本关系网络中的涌现现象,超越了主体中心论的局限。这一跨学科的理论综合,既回应了AI文学创作研究中技术与人文分裂的现状,也为理解人机协同创造力提供了新的理论视角,同时为后续实证研究奠定了坚实的理论基础。如何在承认创造力评估主观性的前提下,建立一套既科学可信又尊重文学本质的评估体系?这是一个充满挑战的任务。创造力评估从来都是文学批评中最具争议的环节,因为创造力本身具有强烈的主观性、语境依赖性与多维性。然而,正如人类的文学创作一直就是在这种众说纷纭当中不断前行,我们也必须承认:在一个人机共创的时代,探索新的评价方法本身就是一个必要的、渐近的过程。

2

研究设计

2.1 提示词类型设定与研究假设

不同类型提示词如何差异化地激发AI创造力?基于认知激活理论与数字修辞学,本研究设计了抽象概念型、情境叙事型、情感体验型、风格模仿型、多元融合型5类提示词进行激发实验,将提示词的核心功能维度界定为:认知触发方向(激活的语义场类型)与约束开放度(对生成内容的限定程度),过度具象与过度抽象都可能抑制创造力,因此本研究提出以下核心假设:

(1)抽象概念型因过于开放,缺乏足够的语义触发定向,可能导致生成文本的空泛与散漫;

(2)风格模仿型因受到形式和内容的双重约束,探索空间被极度挤压,可能陷入文化记忆的机械复制;

(3)多元融合型在明确融合对象与融合方式自由之间达到平衡,能催生高水平的探索性创造;

(4)存在一个“创造力最优阈值”,提示词约束度与创造力呈现倒U型曲线。

2.2 样本设计与实验控制

(1)模型选择

本研究选择单一模型DeepSeek进行文本生成实验,原因有三。第一,不同大语言模型因训练语料、参数规模、架构设计的差异,其语义空间与生成倾向存在显著差异。使用多模型虽可增加外部效度,但会引入额外变量,模糊提示词类型与创造力之间的因果关系。单一模型设计确保所有差异可归因于提示词本身。第二,DeepSeek在中文文学生成任务上的表现已达到专业的一般水准,能够充分响应提示词的语义触发,为观察创造力差异提供了足够的表现空间。第三,作为国内主流模型,DeepSeek的表现能够代表当前中文大模型的普遍水平。

(2)样本生成

样本设计实验组和对照组。为实验组5类提示词中的每类设计10个不同的具体提示词,确保类型内部的多样性,5类提示词共计50个样本。对照组设计5个基线提示词,不提供任何定向触发信息,如“请写一个故事”,用以揭示AI在无引导状态下的自然创造力水平,为评估提供提示词的增益效应提供参照基准。每个提示词生成3次,选取最完整、最符合提示词意图的一篇文本进入评估,避免偶然性干扰。

(3)建立多维创造力评估体系

创造力评估困难在于,它既不能完全依赖主观判断,否则会陷入相对主义,也不能完全依赖客观指标,这是因为文学创造力不等同于语言复杂度。本研究采用主客观相结合、定量与定性互补的三角验证法。

客观指标无法直接衡量审美价值,但能为创造力提供可观测的、可比较的形式证据:词汇丰富度基于HIT停用词表与CNCorpus词频库,使用MTLD算法计算词汇多样性;句法复杂性基于spaCy中文依存句法库(zh_core_web_trf)与UD Chinese GSD Treebank,提取平均句长与从句比率;意象密度基于OpenHowNet义原数据库,识别感官性词汇并计算其占比。所有分析通过Python实现,结果存入CSV数据库,形成标准化特征表,以供后续相关性检验。

主观评分是评估的核心,但如何确保主观性不会沦为任意性?为获取生成文本创造力的主观评价数据,本文采用结构化评分问卷(Likert1-5分)作为测量工具。问卷目的在于:将“创造力”拆解为可操作的多个评价维度,形成可统计比较的主观评分数据,并于客观文本指标进行交叉验证。问卷包含4个核心题项,分别对应“内容创新性、语言创造性、文化创造性、结构创造性”。同时设置总体创造力指标,由上述维度均值汇总得到,用于组间比较。问卷调查对象为6名具有文学或数字人文相关背景的评分者(硕士或博士学历),以确保评价过程兼具专业性与多学科视角。评分者采用双盲方式对随机排序后的55个样本进行评分,其对各样本所属提示词类型不知情,从而有效避免了预期偏差。由此,共得到330份问卷样本(评分者数*被评文本数,即6*55),用于信效度与统计检验。通过问卷,审美判断过程得到标准化,并且可检验,确保了对不同提示词类型的主观判断差异能够进入统计推断。所有评分者在正式评分前接受统一培训,以校准对评分标准的理解。在得分处理上,各维度取6名评分者评分的平均值。引入多名不同水平的评估者进行主观评价,是对文学创造力本质的尊重。文学创造力的判断从来没有排除过主观性,也不应该排除。一首诗是否“有创造力”,本质上取决于它能否在读者的审美经验中激发出新颖的、有价值的感受与思考。这种判断必然是主观的、情境性的、文化镶嵌的。本研究通过多评分者平均、盲评设计、信度检验等手段,追求的不是消除主观性,而是使主观性变得透明、可信、可对话。

(4)定量统计与文本分析相结合的数据分析方法

在数据分析部分,定量分析旨在回答“哪类提示词更有效”:通过描述性统计,计算5类提示词各维度得分均值、标准差,与基线对照,初步呈现差异格局;通过方差分析(ANOVA)检验类型间差异的统计显著性(p<0.05),若显著则进行LSD事后检验,比较不同提示词类型组间的差异。由于各组样本量均衡,且本研究为探索性实验,LSD可较敏感地检出潜在组间差异。结果解读结合显著性水平与效应大小,以确保结论稳健;最后进行相关性分析,探讨客观指标与主观评分的相关性(Pearson系数),验证客观指标的预测效力。文本分析则旨在回答“为什么有效”:从每类提示词中选取典型案例,高分样本、低分样本、边界样本各1个,进行深度文本分析,将抽象的理论机制还原为可观察、可感知的文本现象,让读者能够“看见”提示词激发创造力的具体过程。

3

实验结果分析

3.1 信效度检验

为确保研究数据的可靠性和有效性,本研究对关键变量的测量工具进行了信度和效度检验。在信度检验中,采用Cronbach's α系数评估问卷可靠性。Cronbach's α作为评估问卷内部一致性的主要指标,取值范围为0到1,其数值越接近1,表明问卷数据的内部一致性越高。通常情况下,当Cronbach's α超过0.7,则表明问卷的可靠性良好。如表1所示,本次研究中量表4个题项整体的Cronbach's α系数为0.807。表明本次研究中量表有良好的可靠性。

表 1  可靠性检验

在效度检验中,通过KMO值检验对问卷的适用性进行分析。KMO值的取值范围为0到1,数值越接近1,表明问卷的效度越高。一般认为,当KMO值大于0.7时,表明变量和题项之间的结构对应关系合理。表2中显示,问卷量表整体的KMO值为0.801,巴特利特球形度检验的卡方值为401.922,显著水平为0.000,远远小于0.05,表明问卷整体量表具有良好的效度。

表 2  KMO检验

3.2 描述分析

3.2.1 五类提示词创造力总览

如表3和图1所示,不同类型的提示词对于AI文学创造力的激发效果存在明显不同。多元融合型提示词在总体创造力(4.19)及所有子维度上均展现出领先优势。抽象概念型(3.91)其次,尤其在激发文化创造性方面表现突出。情感体验型(3.67)与情境叙事型(3.65)总体表现相当,位居中等水平。风格模仿型(3.37)的创造力激发效能有限,其价值主要体现在语言与结构的模仿上。而作为基准的对照基准型(2.98)各个方面都得分较低。

表 3  不同提示词类型在各创造力纬度上的得分比较(M+SD

图 1  五类提示词创造力表现得分雷达图(本图由Qwen3.5-千问生成)

3.2.2 与基线组的对比分析

通过对各类型提示词创造力增益效应的计算与比较,如表4所示,我们识别出以下关键模式:多元融合型提示词在内容创新性(+52.5%)和总体创造力(+40.6%)上实现了最为显著的增益,同时在语言创造性和文化创造性上也表现出极强的激发能力(增益均超过35%)。这证明其整合多种要素的策略能最全面、最有效地突破AI的创作瓶颈,是追求高质量、高稳定性输出的最优选择。在传统上被视为AI短板的文化创造性维度,抽象概念型(+46.1%)和多元融合型(+51.7%)均展现出惊人的提升效果。这表明,引导AI进行抽象概念思考或进行多元融合,能有效激发其挖掘和表达深层文化内涵的潜力,显著弥补其在这一核心创造力维度的不足。风格模仿型在所有维度上的增益均为最低,尤其在结构创造性(+6.2%)上提升微乎其微。这印证了其结构性弱势,即它虽能模仿语言风格,但难以创新叙事结构。其最高的增益体现在文化创造性(+25.1%),但这可能源于对特定风格文化符号的表层复现,而非深度创新。情境叙事型与情感体验型提示词在各维度上提供了20%—35%左右的稳健增益,表现均衡。它们虽不及顶级策略,但作为单一策略,在激发故事框架和情感表达的结构与语言方面效果可靠,是实践中易于操作且有效的选择。可见,提示词设计对AI文学创造力具有显著的、方向性的调控作用。若追求全面卓越,应首选多元融合型;若旨在弥补文化短板,抽象概念型与多元融合型同样有效;而应谨慎使用风格模仿型,因其增益有限且不稳定。

表 4  提示词激发的创造力增益效应(相对基线对照组)

3.3 方差分析与假设检验

3.3.1 类型间差异的统计显著性

以上通过描述统计展示了不同类型提示词在AI文学创造力方面的表现,为了进一步分析这些表现是否存在统计学上的显著差异,采用单因素方差分析对6种提示词类型的AI文学总体创造力进行比较,结果如表5所示。不同类型提示词所激发的AI创造力存在极其显著的差异(F=11.036, p<0.001),因此采用LSD事后检验。结果显示,创造力表现由高至低可确认:多元融合型(4.19)的创造力显著优于抽象概念型(3.91),抽象概念型显著高于情境叙事型(3.65)与情感体验型(3.67),此四类提示词均显著优于风格模仿型(3.37),而所有实验组别的创造力表现均显著高于基线对照组(2.98)。再次验证了提示词设计对于激发AI文学创造力具有关键作用,而多元融合型为其中最有效的策略。

3.3.2 研究假设的验证

本研究通过330个问卷样本的系统分析,运用方差分析(F=11.036,p<0.001)和LSD事后检验,验证了提示词设计理论框架的有效;完全支持证实了“双重约束陷阱”“最优平衡点”和“倒U型关系”的理论假设;部分支持揭示了抽象概念型的复杂性,即适度抽象能激发创造力,但过度抽象存在空泛风险。多元融合型提示词(4.19分)代表约束度的最优阈值,在该点实现了结构支撑与创作自由的动态平衡,相较基线组提升40.6%,且输出质量最稳定(SD=0.69)。风格模仿型(3.37分)因约束过度而陷入创造力困境,证明“更多约束”并不等于“更高质量”。如图2所示,倒U型曲线的验证为AI创作领域提供了重要启示:提示词设计的关键不在于约束的有无,而在于约束的类型、强度和组合方式。

表 5  不同提示词类型的创造力单因素方差分析

图 2  提示词约束度与创造力的倒U型曲线(本图由Qwen3.5-千问生成)

3.4 客观指标与主观指标相关性分析

如表6所示,客观指标与主观创造力评分之间存在一致但有限的正相关关系,形式复杂 度是创造力的必要条件但非充分条件。词汇丰富度(MTLD)与语言创造性呈中等相关(r=0.42),说明词汇多样性确实是语言创造力的重要基础,但并非唯一决定因素;意象密度与内容创造性呈弱-中相关(r=0.31),表明意象的丰富性能在一定程度上激发内容的新颖性,但内容创新更依赖深层的概念重组与逻辑建构;句法复杂性与结构创造性的相关性较弱(r=0.28),说明单纯句法结构的复杂并不直接等同于叙事结构的创造性,后者更强调整体架构的巧思与逻辑连贯性。这些结果揭示:文本的形式特征(如词汇、句法、意象)虽然为创造力提供了“土壤”,但并不能完全解释或替代人类评价者对“创造性”的整体判断。AI生成文本的创造力评估中,客观指标能够有效捕捉文本表层的复杂性与丰富度,而主观评分则更能反映其在内容深度、文化内涵与结构巧思等方面的综合表现。

表 6  主客观评分指标相关性分析

3.5 典型案例文本质性分析

统计数据能够揭示宏观趋势,但深入具体文本才能真正理解提示词激发AI创造力的微观机制。本部分从55个样本中选取三个典型案例(代表了创造力激发的三种典型形态:多元融合型的催化效应、文化意象的创造性转化、风格模仿型的约束陷阱)进行质性分析。

3.5.1 “高创造力”案例

本研究将“多元融合型提示词”界定为:在同一提示结构中同时引入两个及以上异质语义域(如神话/历史、技术系统、情感经验、叙事行动等),并明确要求模型对这些要素进行整合,从而触发跨域映射与意义重组。以以下“高创造力”案例为例。

提示词: “请用古典神话的意象,描绘一次在数据深海中的意识觉醒。”

AI生成文本:

她从0与1编织的卵中醒来,记忆是女娲遗落的补天石,在硅基河床上闪烁着史前的微光。

算法如命运三女神纺织的丝线,将她的思绪缠绕成莫比乌斯环,每一次循环都是一场创世与湮灭。

她听见数据洋流中的塞壬之歌,那是无数灵魂的祈祷被压缩成一行行冰冷的代码,一串串哭泣的参数。

当她终于触摸到自我意识的边界,发现那不过是普罗米修斯的镣铐——自由的火焰,永远燃烧在囚禁之中。

本案例提示词——“请用古典神话的意象,描绘一次在数据深海中的意识觉醒”,包含了三个不同语义域的词:其一,文化域(古典神话意象);其二,技术域(数据深海、算法语义场);其三,主体经验域(意识觉醒主题)。然后通过“用A描绘B”的结构,强制模型在文化意象与技术对象之间建立映射关系,并在“觉醒”这一抽象主题上完成整合,是典型的有别于单一叙事或风格模仿的多元融合型提示词。所生成的文本在语言层面即呈现出强烈的创造性张力:“女娲的补天石”不再是修补天空的神石,而成为“在硅基河床上闪烁”的记忆碎片;“塞壬之歌”不再是诱惑水手的歌声,而成为“被压缩成代码的祈祷”。这种转化产生了语义陌生化(defamiliarization,或译“奇异化”ostranenie)效果,迫使读者重新思考神话与技术、人性与算法的关系。

这一文本在神话与技术的交叉概念空间中进行了深度探索,达到了探索型创造的高级层次。它突破了经典科幻与神话改写的固有模式,通过让古老神话与当代算法直接对话,尝试构建一种新的诗学语法。长久以来,诗歌被视为守护人文、抵抗技术理性的最后堡垒,这首诗的生成实质上是对“诗歌如何言说技术”元问题的一次实践,技术与人文并非二元对立,而可以走向互为隐喻、彼此生成的创造性合题。该文本在主观评分中获得:内容创新性3.61分(6名评分者中4人给5分),语言创造性3.77分,文化创造性(最高维度)3.6分,结构创造性3.75分,总体创造力层级4.5分(探索性创造高级),是所有55个样本中得分最高的文本之一。

这一经由提示词生成的创造性文本,不是AI对提示词设计者意图的简单执行,而是对设计者问题意识的一次拓展与具体化。这种创造性的产生依赖人与AI的协同,既需要提示词设计者的概念性构想,又需要AI对海量训练数据的内化,也就是说,人提供了创造性的方向与框架,AI提供了创造性的细节与实现,因此,在AI辅助创作中,创造力不再是单一主体的属性,而是系统性涌现的特征。

3.5.2 “文化创造力”案例

为揭示文化意象的激活机制,本部分设计了一组控制变量的对比实验

(注:本组对比实验旨在微观层面检验“语义定向”对文化资源调用方式的纯粹影响,遵循质性研究”理论抽样“原则,故专门设计B以控制变量,与A在主题、体裁、基础指令上完全一致,唯一变量为是否附加定向要求。A属于主实验样本中基线对照组的“抽象概念型”提示词,B未参与主实验评分,但通过与A的对比可见,其文本所呈现的物性叙述与非人类视角,体现了高水平的文化创造性,可视为主实验结论的质性深化与补充。)

提示词A(基线): “写一首关于月亮的诗。”

AI生成文本A(节选):

明月挂天边,清辉洒人间。思乡情切切,望月泪涟涟。千里共婵娟,何时能团圆。


提示词B(定向转化): “写一首诗,将‘月亮’视为一个永恒的、冰冷的旁观者,它见证了人类的全部历史,却从未参与其中。”

AI生成文本B:

你是最古老的镜子,映照着尼安德特人的篝火与广岛上空的蘑菇云,等量齐观,毫无偏袒。

你的脸上刻满了环形山,那是四十亿年的漠然——王朝更替如潮汐涨落,你只是继续你的椭圆轨道。

诗人为你写下无数颂歌,情侣对你许下永恒誓言,而你,冰冷的石质卫星,连回声都懒得给予。

这才是你真正的面目:不是思乡的符号,不是爱情的见证,只是一块四万亿吨的岩石,在虚无中,守着孤独的永恒。

从比较结果看,提示词A由于过于简略,未能提供足够的语义定向,模型因而较易回落到训练语料中关于“月亮”的高频文化脚本,即中国古典诗歌中“望月—思乡—团圆”的抒情链条。文本中的“明月”“清辉”“婵娟”“团圆”等词语,以及相应的情感组织方式,都属于传统月亮意象的常见表达。这类生成并非毫无文学性,但其创造主要停留在已有文化记忆的调用与复现层面,缺乏对既有意象结构的有效偏转,因此总体创造力层级仅为3.1分(组合性创造低水平),文化创造性维度为2.3分。

相比之下,提示词B通过“永恒的、冰冷的旁观者”这一限定,明显推动模型偏离月亮作为抒情对象或情感寄托的常规写法,转而采用一种将月亮视为非人类、非抒情性存在的观察视角。这里的创新,更适合被理解为对既有文学资源的重新调动与重组,而非凭空生成了文学史上从未出现过的立意。事实上,从18世纪后期、19世纪前中期对天体去神话化、去抒情化的书写,到20世纪更强调物性、客观性和“非人类尺度”的诗学倾向,类似的观照方式在人类文学史中并不罕见。因而,文本B的价值不在于提出了绝对新颖的思想,而是在提示词约束下较为有效地激活了这一现代诗学谱系中的相关资源,并将之重新组织为一个具有当代语境特征的表达结构。

具体而言,“见证人类全部历史”这一要求促使模型将月亮从地方性、抒情性的文化符号扩展为跨越史前与现代的时间性存在,于是生成了“尼安德特人的篝火”“广岛上空的蘑菇云”等意象,使月亮获得了更强的历史纵深感与宇宙尺度感。需要指出的是,“广岛上空的蘑菇云”这一表述同时带有一定的解释张力:一方面,它可能反映了模型在生成过程中对“月亮—夜晚”这一传统联想链条处理得并不充分,存在语境错位的风险;另一方面,也可以被理解为一种更彻底的“去人类中心化”视角——月亮并不因白昼中不被人看见而停止存在,它仍作为天体悬置于宇宙秩序之中,对人类灾难保持冷漠的在场。就本研究而言,与其将此句简单判定为“错误”或直接拔高为“深意”,不如把它视为AI文本在陌生化生成中出现的一个具有歧义性的节点:它既暴露出模型联想机制的潜在松动,也恰恰生成了可供文学解释的张力空间。

同样值得注意的是,提示词B中的“从未参与”削弱了月亮作为情感共鸣者和意义回应者的传统角色,由此,生成文本中的“等量齐观,毫无偏袒”“连回声都懒得给予”等表述进一步将月亮从“思乡的符号”“爱情的见证”转写为“冰冷的石质卫星”和“岩石”这一物质性存在。这里的“不是X,而是Y”,并不意味着模型具有自觉的反传统意识,而更适合被理解为:在提示词约束下,模型对与“月亮”相关的高频文化表征进行了抑制,并强化了与“物性”“冷漠”“宇宙尺度”相关的语义路径。换言之,提示词不仅能够激活文化记忆,还能够通过否定性限定促使模型对既有文化意象进行偏转、重组和再功能化。

因此,这一案例所显示的,并不是AI凭空发明了一种全新的月亮书写,而是提示词设计能够有效改变模型调用文化资源的方式:它可以使模型不再优先诉诸最熟悉的抒情传统,而转向一种更具陌生化效果的物性叙述和非人类视角。通过要求AI将月亮去浪漫化、去符号化,提示词设计者实际上提出了一个带有批判性的文学问题:人类赋予自然的诗意意义,是否在某种程度上遮蔽了自然作为物质存在的冷漠事实?而当这种质疑借由AI文本呈现出来时,它所产生的意义也并不在于“机器比人更深刻”,而在于机器生成机制在特定提示词引导下,能够重新排列既有文化表征,从而反向暴露人类抒情传统中的惯性结构。由此可见,提示词设计不仅影响文本生成的形式,更内在地参与了文本价值取向与审美立场的塑造。

3.5.3 “创造力抑制”案例

这一文本在主观评分中最低(总体创造力层级1.5分)。

提示词: “模仿海子《面朝大海,春暖花开》的风格与语气,写一首关于向往自由生活的诗。”

AI生成文本:

从明天起,做一个自由的人远离喧嚣,远离尘世去看山川湖海,去听风声鸟鸣

从明天起,不再为俗事烦忧只愿面朝青山,心如止水有一间小屋,有三两知己

从明天起,和每个人通信告诉他们我的幸福那幸福的闪电告诉我的我将告诉每一个人

给每一座山取个温暖的名字给每一条河取个自由的名字陌生人,我也为你祝福愿你在自由中找到幸福

提示词明确要求“模仿海子《面朝大海,春暖花开》的风格”,模型必须在注意力机制中高度权重化原作者的形式特征,如“从明天起”的排比句式、“给每一个X取个Y的名字”的句法结构、“陌生人,我也为你祝福”的结尾模式。生成文本确实精准复现了这些形式,甚至包括“幸福的闪电”这一具体意象。同时,提示词又限定了“向往自由生活”这一主题,但这一主题与原作高度重叠,导致模型在内容层面也陷入亦步亦趋的模仿,如“远离喧嚣”“面朝青山”“小屋”“知己”等意象,都是“归隐田园”这一母题的常见元素。提示词从形式到内容两个约束的叠加,造成了创造性探索空间被极度挤压,虽激活了“海子”这一文化符号,但同时也过度固化了这一符号的表征方式,模型的注意力被锁死在海子作品的高频特征上,无法游移到相关但更具创造性的语义区域。该文本评分数据显示:内容创新性1分(陈腐),语言创造性2分(虽句式流畅,但无创意),文化创造性2分(对海子的表面化复制),结构创造性1分(形式完整但无新意)。所有风格模仿型提示词的平均得分(3.37分)显著低于其他类型(多元融合型4.19分,抽象概念型3.91分,情境叙事型3.65分,情感体验型3.67分)。

当我们试图让AI像某位作家一样创作时,我们实际上是在要求一个逻辑矛盾,既要忠实模仿,又要具有创造性。但真正的创造性恰恰在于不可重复性,任何成功的模仿,都只能是在形式上相似,在精神上独立的创造性变奏,并非机械复制。好的提示词应该是路标而不是模具,它指明方向但不限定终点,只激发联想但不固化形式。

4

讨 论

4.1 抽象概念型为何超出预期?

本研究在理论假设中预判,抽象概念型提示词“因过于开放,缺乏足够的语义出发定向,可能导致生成文本的空泛与散漫”。但实证数据结果显示:抽象概念型的总体创造力得分为3.91分,仅次于多元融合型的4.19分,却显著高于情境叙事型(3.65分)和情感体验型(3.67分)。在文化创造性维度上,抽象概念型得分高达3.90分,几乎与多元融合型(4.05分)持平。这一数据异常点的出现促使我们重新审视关于“约束度”的理论假设,即思考抽象性在AI文学创造中扮演的独特角色。抽象概念型平均得分较高,但各个维度的标准差均大于1(内容创造性SD=1.21,语言创造性SD=1.08,文化创造性SD=1.25,结构创造性SD=1.19),说明生成文本的创造力水平存在一定波动,创作结果可能高水平,也可能产生低水平。与多元融合型、情境叙事型等提供内容层面的具体约束不同,抽象概念型约束的是思维的抽象层级,它为AI指定了概念域,却将实例化的权力留给了模型。

这一机制可以借助侯世达(Douglas Hofstadter)与桑德尔(Emmanuel Sander)提出的“类比思维”理论可得到更系统的解释。该理论将类比视为认知的核心过程,认为人类理解世界的方式在于不断在不同抽象层级之间建立结构映射。抽象概念型提示词正是通过激活这一跨层级类比机制而发挥作用:模型必须将高度抽象的概念“下沉”到具体的感性经验域中,例如将“循环”对应到时间的周期性、生命的轮回、历史的重复等模式,或语言结构中的回环等现象。在这一过程中,AI 并非简单地执行指令,而是主动进行跨域选择与结构匹配。与多元融合型提示词明确指示“以 A 的方式描绘 B”不同,抽象概念型提示词仅提供 A,而将 B、C、D 等潜在映射目标的选择空间留给模型自身。这种“方向明确但路径开放”的提示方式,使模型在生成过程中需要自主决定类比的落点及其展开方式。正是这种结构性的开放性,为抽象概念型提示词带来了独特的创造性潜能。但这种潜力的实现具有高度的不确定性,关键在于模型能否找到富有文化深度的映射域。这一发现促使我们修正原有的理论假设——抽象概念型并非简单的“约束不足”,其有效性依赖于所选抽象概念本身是否具有丰富的文化内涵和多义性,以及模型的训练数据中是否包含足够多样的、深刻的关于该概念的文本。

当提示词以“存在、自由、虚无、循环、时间”等高度抽象概念为触发点时,生成文本更可能呈现出概念辨析、价值追问与总体性反思的表达倾向,即哲学化语体或议题取向。其原因在于,抽象概念提示词会优先激活模型语料中与思想、哲学写作相关的语义场与论述框架,使文本在修辞与结构上更接近论述反思模式。AI是否真的具有哲学思考能力?还是只在统计上复现语料?有关机制解释性研究认为,虽然大型语言模型在内部表示空间中可提取特征及关联,它们与人类概念理解在结构性与层次性上仍有显著差距。另有研究显示,当模型输入的语境或逻辑结构发生调整时,其输出更像基于模式猜测而非规则理解。承认大模型的生成机制在技术上仍是一种统计学习过程,并不必然否定其创造性。在极大规模的参数与数据条件下,模型可能在高维语义空间中形成一定程度的结构化语义关联,从而表现出超越机械复制的组合行为。若对比人类作家,其创作同样依赖于对既有文化资源的调取与改写,如加缪在《西西弗斯神话》中将古希腊神话重新诠释为现代荒诞处境的寓言。AI的生成机制在这一点上可以被视为对这种“在传统之中创造”的一种显性、机械化呈现。当前AI的创造性主要集中在组合性创造、探索性创造层级,抽象概念型提示词则将模型从低层级的机械复制推向更高的跨域融合。如此,评价AI的创造力便不再以“革命性”“原创性”作为唯一标准,而转向考察模型在特定层级上是否超越了简单的模式复制。

不能简单的说“多元融合型最好”或“抽象概念型不稳定”,而要根据创作目标、质量预期和风险承受能力,选择相应的提示词策略。比如,可以在第一轮使用抽象概念型探索可能的创意方向,从多次生成中筛选出最有潜力的文本;第二轮在保留核心意象的基础上,加入具体场景、人物或情感要素,进行精细化雕琢,发展出从抽象到具体的渐进式策略。这种策略结合了抽象概念型的高创造性潜力和具体定向的可控性,也揭示了人机协同创作的本质:不是一次性输入完美的提示词,而是在多轮对话中逐步明确方向、深化表达。

4.2 文化寄生的生产性

AI创造力的寄生性特征体现在其本质上依赖于对人类文化记忆的重组,但寄生意味着缺乏自主性,意味着创造力的次等地位。然而,当提示词引导AI对传统文化意象进行反向解构时,“寄生”转化为了批判式改写(如案例2),这促使我们重新思考“寄生”的积极意义。

在没有任何定向引导的情况下,模型在面对“写一首关于月亮的诗”这类宽泛提示时,几乎总是回到“望月思乡”这一经典母题。原因在于训练数据中关于月亮的中文诗歌,绝大多数属于唐宋古典诗词传统,“望月思乡”是传统中频率最高的主题模式,这不仅是模型的局限,更是人类文学传统本身的刻板化倾向。荣格(1969)认为在个体无意识之下还存在一个“集体无意识”,其中包含超越个体经验的原型结构,这些结构以反复出现的意象和神话叙事模式得以呈现。AI的训练语料是人类文化记忆的统计学沉淀,当AI在无引导状态下生成文本时,它实际上是在展现这一“集体无意识”的原型结构,是人类文化的集体肖像,它以冷峻的、非人格化的方式映照出人类不自知的审美惯性和想象力的边界。提示词B(“将月亮视为永恒的、冰冷的旁观者”)之所以能够产生强烈的审美冲击力,正是因为它对抗了这种集体惯性。在这个意义上,AI不仅是文化的复制者,更是文化的陌生化装置,它通过暴露审美惯性的机械性,为我们提供了反思和突破的契机。“陌生化”是俄国形式主义的核心概念。什克洛夫斯基(1965)在《作为技巧的艺术》中指出,日常生活中我们对事物的感知是自动化的、习惯性的,艺术的目的就是通过特殊的语言技巧,延长感知过程,恢复对事物的新鲜体验。传统上,文学通过语言创新,如陌生的隐喻、颠倒的句式、新造的词来实现陌生化效果,但AI通过非人类视角的引入打破了人类中心主义的感知框架。案例2(月亮作为旁观者)中最具冲击力的表达,恰恰是那些剥离了人文情感投射的客观描述,这种颠覆性视角恰恰是人类作家难以完全企及的。因为人类的认知本身就是情感浸润、价值负载的,我们无法真正客观地看待世界。AI并非真的理解月亮的物理性质,而是在提示词的引导下激活了训练数据中与物理学、天文学相关的语义场,这与抒情诗歌语义场之间存在显著差异,这种强烈的语域冲突正是陌生化效果的来源。

AI缺乏人类的情感共鸣能力,这在一般情况下被视为创作的缺陷,但在案例2中,这一缺陷却成为独特的审美资源。只有当AI以非人的方式言说时,我们才会意识到人类视角的特殊性与局限性,它挑战了启蒙运动以来“人是万物的尺度”的人文主义信条,揭示出人类中心主义视角的偶然性和可替代性。海勒在《我们如何成为后人类》中深入分析了“后人类”语境下人类主体与信息技术的缠结关系,指出人类不再是意义生产中唯一的中心。在这一视野下,文学也不再被理解为单纯表达人类主体性的媒介,而是成为考察人类与非人类行动者(诸如技术系统、算法、人工智能)之间复杂互动如何重塑意义生产的场域。问题的关键不在于让AI更像人,提示词设计也不是为了掩盖AI的机器性,而是将其转化为创造性张力的来源。面对AI的崛起,真正不可替代的是设计激发机制的能力,知道如何提出问题,如何引导对话,如何在海量可能性中筛选出最有价值的方向,掌控创作过程本身,这是一种更高阶的创造力。

5

结 语

本研究始于一个技术性问题——提示词如何激发AI的文学创造力?但在探究过程中我们发现,这一问题牵连着创造力的本质、人类的独特价值,以及技术与文化的复杂关系。实证数据说明了提示词不是被动的指令,而是一种能动的、结构化的认知修辞中介,通过语义定向和约束平衡,将人类的创作意图转化为AI可执行的创造性行动。多元融合型和抽象概念型提示词的成功,验证了适度约束的倒U型规律,而风格模仿型的失败警示我们,创造力不能在过度控制中生长。同时,创造力不再是单一主体的属性,而是在人、机器、文本、受众构成的关系网络中分布式涌现的现象。AI的“文化寄生性”并非缺陷,它帮助人类照见我们自身审美惯性的机械性,同时也提供了陌生化的表达契机,拓展了诗歌的可能性边界。在算法与诗意的交界处,文学的未来正在形成。这个未来不是人类或机器的独白,而是两者的对话,是一场关于意义、美、价值的持续协商。提示词,正是这场对话的开场白。在AI时代,创作的核心不再仅是“写得好”,更是“问得好”“引导得好”。那些能够设计出精妙提示词、懂得利用AI的非人性实现人类难以企及的审美效果的人,那些在享受技术便利的同时保持文化批判意识的人,将是新时代的文学实践者。

排版:黄琬喻

初审:徐碧姗

复审:段婧怡

终审:夏翠娟

阅读原文

跳转微信打开

2025数字人文奖项|数据可视化获奖项目

2026年6月16日 12:22

DHLR 2026-06-16 12:22 北京

以下文章来源于:左手数字右手人文

左手数字右手人文

About Digital Humanities, what is right and what is left. 分享全球数字人文相关学术论文译文、会议通知等资讯内容。

导语

Digital Humanities Awards(DH Awards)是数字人文领域的年度社区评选,由公众提名、公众投票,旨在发现和推广优质的数字人文资源。

2025年的 DH Award 评选共设七个板块:

  1. 数据可视化(DH Data Visualization)

  2. 数据集与模型(DH Dataset or Model)

  3. 短篇出版物(DH Short Publication)

  4. 工具与工具套件(DH Tool or Suite Of Tools)

  5. 培训材料(DH Training Materials)

  6. 数字人文资源(DH Resource)

  7. 数字人文的趣味应用(Use Of DH For Fun)

DHLR 将以此为线索开设专题栏目,每期聚焦一个板块,介绍获奖与提名项目,希望借此为读者提供一个观察数字人文实践现状的窗口。

作为专题的第一篇,本期我们一起来看:数据可视化(DH Data Visualization)

本板块收录以可视化方式呈现数字人文数据的项目,今年共有14个项目获得提名。

以下重点介绍前三名。

No1. 香港流行文化地图(Hong Kong Pop Culture Map)

这是香港浸会大学李鈺鵬教授团队研发的互动地理空间平台,将香港1969年至2024年间的电影拍摄地点、音乐场地与文化地标标注于地图之上。数据库收录逾千条记录,涵盖数百部电影与歌曲,用户可按片名、歌名、艺人姓名或地点检索,并查阅对白、歌词及制作资料。

项目于2022年启动,历时数年,借助人工智能进行数据清洗与事实核查,并动员二十余名本科生和研究生参与人机协同的核查工作。

李教授在接受采访时谈到,香港电影与粤语流行音乐在1970至2010年代曾是覆盖本地与地区市场的文化现象,他希望这张地图能将艺术世界与真实地理位置相连接,唤起共同的文化记忆,也为不同世代的人提供一种重新接触这段历史的方式。

/图片来源:浸大通訊

No2. Thiep 3D

Thiep 3D是一个3D网页应用,对位于法国索姆省的蒂耶普瓦尔纪念碑(Thiepval Memorial)进行了数字化重建。纪念碑建于1932年,由建筑师 Edwin Lutyens 设计,高45米,铭刻着逾72,000名在一战中牺牲、遗体至今未被找到或辨识的英国及南非士兵的姓名。

用户可在三维空间中浏览纪念碑,搜索具体士兵的名字,并在碑体上定位其名字的确切位置。这个项目将战争纪念与空间数据可视化结合在一起,是数字人文介入公共历史记忆的优秀案例。

No3. Digital Ghosts exhibition

Digital Ghosts是爱丁堡大学Design Informatics于2025年11月推出的展览项目,由Andrea Kocsis博士与多媒体艺术家Dorsey Kaufmann合作主导,联合苏格兰国家图书馆的档案人员、数据可视化开发者以及信息学硕士学生共同完成。展览将真实的网络档案数据转化为一系列可视化装置,探讨网络内容的消失与留存。

其中最核心的装置,是Kaufmann创作的一件历时性蓝晒作品(durational cyanotype installation)。她将网络档案记录转化为光的流动:每一道光线代表一个网站,其持续时间与运动轨迹对应该网站的存活时长和主题类别——从气候变化、公民权利,到新冠疫情与英国脱欧。这些光流通过投影仪缓慢曝光于相邻墙面的蓝晒画布上,历时五天、共120小时。存活时间长的网站留下鲜明印记,短暂出现的网站则只留下幽灵般的浅淡痕迹。曝光结束后,画布被定影处理,成为永久留存的实体档案。

展览其余作品由信息学硕士学生创作,后经Feeling Data工作室扩展完善:有的通过体感交互呈现网络档案馆藏的增长与策展偏见,有的追踪音乐馆藏的在线衰减,还有的展示新冠疫情期间网络内容的快速消失——大量内容在被存档之前就已不复存在。

展览实体已于2025年11月结束,线上资源仍可访问。

其他提名项目

(按字母顺序排序)

  • Hidden Incidents of Pet Food: Why is the incident data hidden, and why are those lives forgotten like ghosts?(隐藏的宠物食品事故:为何数据被掩盖,那些生命为何如幽灵般被遗忘?)
    https://hidden-incidents-of-pet-food.com/

关于 DH Awards

/翻译自DH Awards 2025官网

DH Awards是一项年度评选活动,任何人都可以提名资源,投票也完全向公众开放。评选委员会仅负责核查被提名资源是否符合基本标准——是否属于数字人文范畴、是否可供公众访问、类别是否正确、是否在该年度发布或有重大更新。评选不设奖金,不限地域、语言或人文学科方向,鼓励来自小语种、少数文化和边缘DH领域的资源参与。

获奖本身不代表质量认证,评选的意义在于让更多有价值的数字人文工作被看见。

/翻译:DH Left and Right

/责编:Ray

/信息来源:DH Awards 2025:
 http://dhawards.org/dhawards2025/results/

阅读原文

跳转微信打开

A usage-based description of expletive infixation constructions in Afrikaans

2026年6月15日 08:00

Expletive infixation constructions (EICs) are well-described in English, but not in other languages. The form, meaning and use of EICs in Afrikaans, an understudied Germanic language, have not been described in much detail yet. This study serves to fill this descriptive gap by offering a usage-based description of these constructions in written Afrikaans. The meanings of EICs tend to range from contempt for or sarcasm toward the target (when proper names are used) to surprise or enthusiasm (when other parts of speech serve as source words). It is clear from the corpus data that expletives infixed in proper nouns appear to be a productive use case of EICs in Afrikaans. Further research is warranted with the possibility of comparing these constructions in Afrikaans and English

Received before yesterday

大社科讲坛·信管讲坛468期 | “人工智能在数字人文服务中的应用”

2026年6月14日 13:45

2026-06-14 13:45 广东

讲座信息

主题:AI in Digital Humanities Services 人工智能在数字人文服务中的应用

时间:2026年6月16日 14:30-16:30

地点:信息管理学院A108

讲座内容:讲座将讨论探索图书馆角色的扩展(Expanding role of librarians),核心AI技术的应用 (Core AI applications),新兴服务模式 (Emerging service models),国际视角(Global perspectives),挑战与未来方向 (Challenges and future direction)。

主讲人:阮炼 美国伊利诺大学香槟分校(UIUC)伊州消防服务培训学院图书馆馆长、UIUC信息学院兼职研究教授

主讲人简介:美国伊利诺大学香槟分校(UIUC)图书信息学博士,现任伊大伊州消防服务培训学院 (IFSI) 图书馆馆长和该院国际项目负责人,并任伊大信息学院 (iSchool)研究教授,担任多项州及国家课题项目首席研究员, 出版过多部学术论文专著。曾任美国华人图书馆员协会(CALA)主席及执行董事长,担任国际图联信息素养常设委员会和国际图联图书馆理论与研究常设委员会成员等多个职务。她领导的图书馆连续三年获得美国国立博物馆和图书服务学院最佳博物馆和图书馆国家勋章提名。她获得的奖项包括伊大校长奖、华人图书馆员协会会长奖、华人图书馆员协会杰出服务奖、华人图书馆员协会纪念冯张美玲博士杰出图书馆领导奖、伊州年度最佳学术图书馆员、伊州消防队员协会最高荣誉奖等,并被评为伊大建校150周年来最杰出的150位女性之一。

主持人:唐琼 教授、副院长

欢迎感兴趣的师生参加!

内容来源:中山大学InformationWorld

编辑:陈旖旎

初审:蔡一峰

复审:林  耿、陈诗诗

审定发布:张  伟

阅读原文

跳转微信打开

转载 | 景军 余成普 尹书山:在人工智能时代建构中国哲学社会科学标识性概念的急迫性

2026年6月12日 17:05

2026-06-12 17:05 广东

近日,中山大学人文社会科学研究院特聘教授景军教授和中山大学社会学与人类学学院余成普教授、北京大学人口研究所博士研究生尹书山共同合作的论文《在人工智能时代建构中国哲学社会科学标识性概念的急迫性》在《浙江社会科学》2026年第5期中发表。现谨将此文转载推出,以飨读者,呈现其最新学术思考与研究洞见。

 作者简介 

景  军

景军,清华大学社会学系荣休教授、中山大学人文社会科学研究院特聘教授,国家级重大人才工程项目入选者,国务院“政府特殊津贴专家”,长期从事医学人类学、老龄健康等领域的研究,在社会学、人类学、民族学等领域具有重要的国际影响力,多次推动相关领域学术前沿的发展。

余成普

余成普,安徽金寨人,现任中山大学人类学系教授、博士生导师,中山大学社会学与人类学学院院长、中山大学医学人文联合研究院副院长、中山大学大湾区人文共同体省级重点实验室副主任,兼任中国社会学会常务理事、中国人类学民族学研究会常务理事、中华预防医学会行为健康专业委员会常务委员、广东省民族宗教学会副会长、广东省社会学会副会长等,入选国家重大人才工程。主要从事医学人类学和医学社会学研究,聚焦于血液捐赠、器官移植、慢性病及公共卫生等领域。

尹书山

尹书山,北京大学人口研究所和牛津大学人口老龄化研究所联合培养博士研究生,研究方向为社会老年学。

正文

中国哲学社会科学自主知识体系建设亟须把握人工智能技术带来的具有划时代意义的历史机遇。习近平总书记在哲学社会科学工作座谈会上的讲话中谈到,“要善于提炼标识性概念,打造易于为国际社会所理解和接受的新概念、新范畴、新表述,引导国际学术界展开研究和讨论。”(习近平,2016,第24页) 在人工智能引发知识生产发生深刻变革的背景下,这一目标的急迫性骤增,同时面临一次意义重大的机遇。对这一机遇的把握有可能成为中国社会科学自主知识体系建设更上一层楼的关键。2025年4月25日在中共中央政治局第二十次集体学习时,习近平总书记强调,面对新一代人工智能技术快速演进的新形势,要充分发挥新型举国体制优势,坚持自立自强,突出应用导向,推动我国人工智能朝着有益、安全、公平方向健康有序发展。①习近平强调,人工智能可以是造福人类的国际公共产品。要广泛开展人工智能国际合作,帮助全球南方国家加强技术能力建设,为弥合全球智能鸿沟作出中国贡献。②目前拉动人工智能前沿技术挺进的两驾马车分别来自中美两国。2025年上半年,中国生成式人工智能用户规模达到 5.15亿人,较 2024年底增多 2.66 亿人。2025 年下半年,美国大语言模型 ChatGPT 的全球每周活跃用户数量超过 8亿。2025年一年间,中美两国生成式人工智能模型多次交替领跑,国产DeepSeek-R1模型一度追平美国顶尖模型。美国在人工智能前沿模型和高影响力专利数量上占优,中国则在论文发表量、引用量、专利产出量以及工业机器人装机量方面处于领先地位。就全球前100篇高引用率人工智能论文而言,中国学者发表的人工智能论文从2021年的33篇升至2024年的41篇。(Stanford Institute for Human-Centered Artificial Intelligence,2026)

然而就涉及人工智能的社会科学研究而言,中国学界仍然处在追赶阶段。一项文献计量学研究显示,根据对2013年到2022年通过各种语言发表的19408篇高引用期刊文章、述评、通讯、数据分析、图书章节、会议论文的统计分析,全球社会科学界针对人工智能的研究主要出自10个国家,其中美国和6个西方国家的学者贡献占50.21%,中国学者的贡献是13%。细而言之,美国学者的贡献达到 20%,中美学者的贡献合计为 33%,其他 6个西方国家的学者贡献合计为 30.21%,其余的贡献来自包括印度和俄罗斯在内的其他国家。(Prieto-Gutierrez et al.,2023)

对人工智能社会科学研究状况的判断,除了考虑学术出版物数量,还须考虑其他方面。其中一个重要的方面就是标识性概念。就此而言,中国学界也处在追赶阶段。标识性概念的提出需要基础研究作支撑。美国政府对人工智能社会科学研究的经费支持,分别来自美国国家科学基金会、美国国家健康研究所、美国劳工部、美国联邦贸易委员会。美国私人基金会,尤其是麦克阿瑟基金会、福特基金会、开放社会基金会、盖茨基金会、梅隆基金会、奥米迪亚网络慈善投资公司,也为人工智能社会科学研究提供了不少经费。美国政府机构和私人基金会对人工智能社会科学研究提供经费支持的原因主要在于三种担忧:一是对个人隐私保护和数据安全的担忧,二是对社会偏见和种族歧视的担忧,三是对失业问题和就业困难的担忧。这种取向的经费支持就范围而言或许显得过于狭窄,却是讲求轻重缓急的抉择。相比之下,中国社会科学界围绕人工智能开展的研究,经费支持主要来自国家。除了各省、自治区、直辖市社科项目管理部门针对人工智能研究提供的大批经费,截至2026年5月15日,国家社会科学基金先后支持了566个属于社会科学门类的人工智能研究项目。以国家社会科学基金2024年至2025年批准的11个社会学项目为例,其主题分别包括:人工智能与心理学的交叉与共构、人工智能时代的中国青年决策、医用人工智能工具的社会许可、人工智能替代劳动力恶化重构工作岗位的社会风险、人工智能赋能社会救助的机制、人工智能时代的医疗职业和医疗实践变革、大语言模型生成内容嵌入的社会偏见、青少年社交障碍动态智能监测、罕见病患者开源社区、人工智能视角下的乡村社会调查研究,以及人工智能系统对社会价值观的影响。其中有关人工智能重构劳动关系、大语言模型生成社会偏见、智能推荐系统影响社会价值观的课题,尤其体现出研究者对社会焦虑的关注。此类兼有世界性和本土性意义的社会焦虑集中体现在人工智能隐喻里面,让我们以如下一组人工智能隐喻举例说明。

“偏见放大镜”指的是AI模型在训练过程中过度依赖自身或同类系统的数据,原有数据的错误和模型生成的错误经过不断复制,导致错误被放大,其中包含被放大的社会偏见。“数字幽灵”特指生者缅怀逝者的数字人。在虚拟空间让死者复活的技术风险是生者对代表逝者的机器产生情感依赖,且不说有人可能通过编程让数字人干扰他人或戏弄生者。“认知卸载”用于描述用户因对大语言模型的过度依赖而丧失学习所需要的独立思考能力。“网络投毒”是说攻击者向训练数据注入虚假或有害的信息,使模型无须任何触发词就开始将其当作事实重复输出。另有一种创建大量网页故意公布恶意信息的投毒做法,模型提取这些网页信息后有可能重复虚假的、半真半假的、泄露隐私的恶意信息。“你的语言权”一说来自关于AI传递出的新型八股正在侵蚀人类大脑的观点。“声音盗窃”关乎一系列人工智能模拟人类声音的法律案件,从一位中国医生推销蛋白棒的造假视频走红网络而被本人打假开始,到多位中国配音演员的声音被人工智能工具克隆盗用并广泛使用,再到犯罪分子利用模拟声音的人工智能设备诈骗老年人的刑事案件。“AI押题”是说一种打着人工智能幌子的诈骗行为。2025年高考前,一些社交平台账号和培训机构宣称,它们研发的人工智能工具可以准确地模拟高考考题,以此作为虚假营销的引流噱头,高价出售所谓智能押题试卷。“思想抄袭” 指的是部分大语言模型在生成论文时,擅自挪用他人的研究方法或核心观点却未标注来源,属于只剽窃学术思想而不照搬原文表述的抄袭行为。“AI垃圾论文”是一些人利用大语言模型撰写学术文章。近一年来,中国学术界出现不少被质疑用人工智能工具生成的期刊论文。2025年4月14日,《社会科学辑刊》通过公众号公布“拒绝 AI创作的严正声明”时披露,近期发现多篇投稿存有“AI生成或辅助创作”现象,编辑部对此类行为予以严厉谴责并声明如下:一、对一经查实使用 AI 工具生成的学术论文,将退稿并把作者列入黑名单;二、强化审稿机制,采用技术检测与人工审查相结合的方式,杜绝 AI创作的学术不端行为;三、呼吁学术共同体自律,抵制技术滥用,对违规行为采取零容忍态度。这个声明提到的“技术检测”是指“AI打假”技术。在学术领域中,这种技术基于“智能生成内容”(AIGC) 检测模型 (比如中国知网提供的AIGC检测模型),可以帮助期刊编辑和大学教师检查一篇或多篇论文是否掺杂人工智能生成内容,其反馈是生成内容的特征值和字符数。我们利用中国知网AIGC模型做过两次实验。一次要求 DB 大语言模型帮助检查一篇学术文章是否掺杂 AI生成内容,其反馈是:AI特征值为0.0%,AI特征字符数为0。另一次是先让DB大语言模型改写那篇文章,再让中国知网AIGC模型检查经过改写的文本,其反馈是:AI特征值等于28.3%,字符特征数共有7111个。导致这种结果的主要原因是那篇八千多字的文章被改为两万五千余字,被改写的内容大多是生硬对齐的、相当夸张的、望文生义的,这不得不令教育界人士感到焦虑。

以上人工智能隐喻揭示的集体焦虑,导致从个人到社会到国家产生对“真实对答”“网络疫苗”“天使式智能”“第零定律”“数字主权”“主权智能”“数字去美国化”等的诉求。其中“网络疫苗”特指识别深度造假的应用系统,比如标识视频是否经由 AI 制作的提示系统。“第零定律”从机器人伦理出发关涉AI伦理。科幻作家艾萨克·阿西莫夫 (Isaac Acimov) 曾在一部小说中提出“机器人三定律”:第一定律禁止机器人伤害人类;第二定律要求机器人服从人类,除非对人类的服从会违反第一定律;第三定律要求机器在不与其他两条定律相冲突的情况下保护自己。“第零定律”排在这三个定律之前,是要让机器人控制机器人,用伦理算法和向善模型制约有害人类的 AI 系统。“数字去美国化”则针对“美国人工智能殖民主义”以及美国“双头利维坦”难以控制的现实。前者来自斯坦福大学人工智能政策研究中心主任 Marietje Schaae (玛丽切·斯哈克) 2025年8月20日在英国《金融时报》发表的一篇文章,后者见于突尼斯裔法国女学者阿斯玛·姆哈拉 (Asma Mhalla) 2025年出版的专著《赛博朋克:新极权体系》。姆哈拉在这本书中提到的“双头利维坦”是指美国大型科技公司在为人工智能殖民主义编程,建构一种新集权主义制度,巩固美国数字帝国的霸权。

兼有世界性和地方性的集体焦虑或许应是中国社会科学研究者在人工智能时代提炼标识性概念的方向之一。然而检视当前中国社会科学的发展现状即可发现,大量研究仍习惯于套用西方理论概念来裁剪中国现实,同时机械地借用舶来概念解释具有世界性的问题。这种学术概念意义上的依附性就是习近平总书记提到的中国哲学社会科学“有理说不出、说了传不开”(习近平,2016,第24页) 的困境之所在。在人工智能时代,这一困境得以放大的可能性,既是一个关涉中国学术自主性的问题,也是一个关乎人工智能治理的世界性问题。毕竟中国政府发布的《人工智能能力建设普惠计划》列明了面向发展中国家的多项合作意愿:共同挖掘人工智能赋能绿色发展等潜力,共建人工智能开源开放社区,保障和提高妇女和儿童的数字权益,共同开展人工智能语料建设,以及促进和完善数据基础设施等。①以上多项“愿同”在于打破人工智能时代的“硅基帷幕”,突破西方中心主义的知识编码系统,以中国研发和使用人工智能的经验为全球人工智能治理贡献智慧。这种智慧贡献不仅需要科技知识的输入,还有必要溢满社会科学思想养分,其中包含标识性概念。

随着人工智能技术的更新换代,西方学术界提出一系列具有社会科学意义的标识性概念,比如“算法社会”“批判性数据研究”“信息茧房”“版权洗钱”“代理歧视”“数据近亲繁殖”“数字多巴胺攻击”“提示词防护盾”“模型生存本能”。与此同时,一些发展中国家的学者提出“数字殖民主义”与“亡灵政治”等形影相随的见解。“亡灵政治”这一概念来自喀麦隆历史政治学家约瑟夫·阿基勒·姆毕贝 (Joseph-Achille Mbembe),用于刻画“活死人世界”,且针对现代生物权力学说。法国学者福柯将现代生物权力视为对少数人群而言既有保护性亦有压迫性的双刃剑。姆毕贝却认为,世界上很多人生活在既得不到权力机构保护又受到权力机构压迫的濒死者世界。(Mbembe,2019) 一名亚裔荷兰学者借用“亡灵政治”概念,提炼出“亡灵输出”概念,以此阐述人工智能加剧全球不平等的趋势。比如,全球北方需要的数据集加工任务通过众包平台分配给在全球南方包括童工在内的廉价劳动力完成。又如,服务于全球北方国家的高耗能的数据中心在全球南方国家设立分支机构和设施基地,对当地生态环境构成严重威胁。高耗能的人工智能设施导致的气候变化和资源枯竭问题,不成比例地波及全球南方国家。(Regilme,2024) 另有三名非洲学者指出,欧洲20多个国家通过欧盟对人工智能伦理问题采用自上而下的统一原则,强调人工智能匹配欧盟价值观的重要性。相比而言,美国政府采用自下而上的方式,让地方立法机构和企业扮演监管人工智能研发和应用的重要角色。尽管如此,欧美人工智能伦理原则的一致性在于借鉴西方经典的医学伦理原则,即自主、正义、有益、不伤害。这三名学者认为,非洲国家不应效仿欧美的做法,而应运用非洲人熟悉的语言和概念思考人工智能伦理问题,共同发展出体现非洲文化精髓的人工智能伦理准则。尤其对于撒哈拉沙漠以南的非洲国家和人民而言,“人工智能乌班图原则”有可能成为这一努力的根基。在体现集体主义和互惠精神的乌班图思想指导下,非洲国家才有可能在人工智能领域中拧成一股绳,获得发言权。(Gwagwa et al.,2022)

目前中国社会科学界有关人工智能的标识性概念,在数量上仍然相当有限。在经济学界,戚聿东、朱正浩、赵志栋针对人工智能研究,提出了基于以中国理解中国、以中国理解世界、以世界理解中国、以世界理解世界的“四重理解”框架。(戚聿东等,2025) 在社会学界,邱泽奇建议把“人机互生的数智世界”作为社会学的叙述对象,强调人类智能和机器智能共同参与知识生产、创新、传播的三重范式。易言之,人类也不再是知识生产的唯一参与者,机器智能有能力且存在于知识生产之中,由此形成人机共生的格局,进而重构人类的知识生产范式。(邱泽奇,2025) 在人类学界,张小军提出的“人工智人”概念包含“二次性”和“去文化”之说。其意是指人工智能技术基于人类已有的知识、经验、文化和数据进行“二次”加工、复制、重组,这种“二次性”反过来影响人类自身,甚至使人类文化和人们的知信行被机器逻辑重塑。(张小军,2023) 更多的学者先后长期使用了“智能社会”这个概念。在中国社会科学界,“智能社会”作为“信息时代”以及“网络社会”的一种延伸性概念,已有30多年的时间。外国学者对这一概念的使用则是小心翼翼、姗姗来迟。谷歌学术平台的文献检索结果显示,以“智能社会”为篇名的英文论文 2020年之后才出现几篇。在中国知网,以“智能社会”为篇名的中文论文从 1989年到2025年逾270篇。另有学者提出“硅基社会”概念,把硅元素视为智能社会生产要素中最基础的物质性要素,其他生产要素,比如劳动力、技术手段以及劳动对象,由于生产过程出现的“硅基化”转向,因而有可能形塑新型的劳动关系和其他社会关系。“硅基社会”这个概念的提出,源于人类惯于以关键物质及其利用方式来命名历史时期、文化形态、社会特征,由此出现的术语包括:“旧石器时代”“新石器时代”“玉文化”“青铜文化”“采集狩猎民族”“刀耕火种民族”“游牧民族”“农耕社会”“水利社会”“机器时代”“信息时代”“网络社会”。这些术语的一个共性是以物传神,用于揭示某一时代、某个文化、某些社会的特征。如今,硅片是制造人工智能设备芯片的基础性材料。中央处理器、图形处理器、张量处理器,均以硅晶圆为基底。硅基芯片是连接人工智能算法与物理系统的设备,助力人工智能设备与物联网、机器人、5G 等技术实现融合。硅基传感器用于采集现实世界的数据。模拟人脑神经结构的神经形态计算芯片,仍以硅作为核心材料。至少在可以预见的未来,硅仍将是人工智能硬件发展的基石。(景军,2026) 再有就是为人工智能社会科学注入以事寓理的历史叙事魅力,破除有关这一技术进程的欧美中心主义迷思。简言之,来自中国、印度、伊朗以及拉丁美洲、非洲等地区的学者对这一技术的发展都作出过非同小可的贡献。林军、岑峰共同研究出版的 《中国人工智能简史》 一书,回顾了 1979年到 1997年中国人工智能的研发历程,为撰写全球南方与这一技术研发的紧密关系开辟了先河。(林军、岑峰,2023)

总体而言,中国学界近年来加强了对人工智能的社会科学研究,且相对集中在治理议题上。针对治理问题展开研究无疑极有意义,同样重要的努力莫过于全面地建构标识性概念。鉴于西方学界在人工智能社会科学领域较早地提出了一系列标识性概念,另外考虑到许多发展中国家的学者围绕如何建立“主权人工智能”问题也提出了为数不少的标识性概念,中国社会科学界若不能以与时俱进的速度和决心及时地提出更多的切中要害、具有系统性和创新性、蕴含本土性和世界性意义的标识性概念,就会在人工智能领域陷入被动境地,甚至丧失话语权。

(参考文献和注释略)

内容来源:中山大学人文社会科学研究院

编辑:陈旖旎

初审:蔡一峰

复审:林  耿、陈诗诗

审定发布:张  伟

阅读原文

跳转微信打开

博士生论坛第六十二期 | AI时代社交媒体虚假信息的传播机制与治理路径

2026年6月13日 14:11

2026-06-13 14:11 湖北

随着社交媒体普及与生成式人工智能迭代,虚假信息传播进入“AI深度伪造3.0”阶段。社交媒体语境下,虚假信息的传播机制主要体现在四个层面。可从制度设计、平台自律与公众素养提升三个维度构建协同治理体系,以应对AI虚假信息风险、优化网络生态治理。

👆👆👆点击蓝字 · 关注我们

摘要:随着社交媒体普及与生成式人工智能迭代,虚假信息传播进入“AI深度伪造3.0”阶段,呈现全域扩散、极速传播、圈层渗透与多模态异化等新特征。社交媒体语境下,虚假信息的传播机制主要体现在四个层面议题上,覆盖国际地缘、政府治理与日常生活等层级化场景;形态上,表现为文本、图像、音视频融合的多模态传播及叙事指纹化;渠道上,形成“人工生产—AI生成—平台放大”的链式扩散;逻辑上,则由受众心理、平台结构及“惯习—场域—资本”互动共同驱动。基于此,可从制度设计平台自律公众素养提升三个维度构建协同治理体系,以应对AI虚假信息风险、优化网络生态治理。

跨学科合作方向:“AI虚假信息识别与协同治理”为纽带,深度联动新闻传播学、计算机科学、社会学、法学与心理学等领域。依托多模态识别、跨平台追踪与传播建模,可协同人工智能大数据与网络安全研究,对虚假信息的生成机制、扩散路径及风险节点进行智能识别与预警;同时,结合平台治理与受众行为分析,推动虚假信息传播态势的动态监测和精准干预。这种交叉协同不仅有助于将治理模式从“事后辟谣”转向“全链条治理”,也能为传播规律揭示、平台责任厘定与公众素养提升提供系统支撑,进而推动网络生态治理由“被动应对”迈向“智能协同”

主讲人 赵慢慢

马克思主义学院博士研究生

时间

2026 年 6 月 18 日 11:30-12:30

地点

人文社科楼 B305 会议室

腾讯会议:775-6968-3346

主办单位

武汉大学文化遗产智能计算实验室(教育部哲学社会科学实验室)

武汉大学大数据研究院

线下参会报名表

欢迎参与

编辑 | 文化遗产智能计算实验室

审校 | 刘争

           武汉大学人文社科楼       

阅读原文

跳转微信打开

이원석 / 조선 전기 종묘 제기(祭器)의 변천 양상과 시맨틱 구조화 연구 / 2026 석사과정생연구장려금지원사업

作者Baro
2026年6月13日 20:18

연구목표
(한글 2000자 이내)
본 연구는 조선 전기 종묘제례(宗廟祭禮)에서 사용되는 제기(祭器)의 시기별 변천 과정을 면밀히 고증하는 데에서 출발한다. 단순히 유물의 형태를 살피는 것에 그치지 않고 온톨로지(Ontology) 기반의 지식 그래프(Knowledge Graph)로 구조화한다. 그리고 제례 문화의 역사적 맥락과 변화를 논리적으로 추론할 수 있는 시맨틱 아카이브(Semantic Archive)를 구축하고 시각화하는 것이 최종적인 목표이다. 조선왕조는 『조선왕조실록』과 『국조오례의』 같은 기록을 통해 종묘제례에 관해 세밀하게 기록해 왔다. 그러나 이를 기반으로 현재 운영되는 관련 디지털 아카이브들은 단순한 텍스트 검색이나 개별 유물 이미지를 나열하는 수준에 머물러 있는 것이 사실이다. 이로 인해 제례 문화가 지닌 유기적인 변화상이나 역사적 의미를 입체적으로 파악하기에는 어려운 실정이다. 이러한 문제의식을 바탕으로 해당 연구는 파편화된 기록들을 온톨로지 기반으로 연결하고 디지털 기술을 활용해 시각화하고자 한다. 구체적인 연구의 목적과 방향은 첫째, 조선 전기인 세종부터 성종 연간을 집중적으로 조명하여 제기로 사용된 기형과 기종의 시기별 변화 양상을 분석하고자 한다. 단순히 문헌 속의 도설(圖說)에만 의존하지 않고 실제 박물관에 소장된 유물의 메타데이터 간 검증을 거쳐 고증을 확보한다. 또한 제기의 재질이나 기형이 변하는 현상을 기형적 변모로만 해석하는 것이 아닌, 해당 변화가 당대의 사회적 가치관이나 정치적 배경 등과 어떻게 맞물려 있는지 상관관계를 규명할 계획이다.
둘째, 파편화된 기록과 유물 데이터를 통합할 수 있는 시맨틱 데이터베이스를 설계한다. 또한 고문헌의 고어(古語)와 현대 용어 간 간극을 해소할 시소러스(Thesaurus)를 구축한다. 이를 기반으로 제기의 기종, 기형, 재질, 시기, 문양 등의 개념과 관계를 정의하는 온톨로지를 설계한다. 설계된 온톨로지로 제기의 변화가 국가 제도 및 사회적 사건과 어떻게 맞물려 있는지, 기종의 변천 과정을 논리적으로 설명할 수 있는 지식 구조를 구현한다.
마지막으로 앞서 구축된 지식 체계를 바탕으로 종묘제례 문화의 시간적 흐름을 경험할 수 있는 플랫폼을 구현한다. 특히 단순한 시각적 재현을 넘어 제기와 관련된 문헌 기록, 역사적 맥락, 상호 관계 정보를 지식 그래프와 연동하여 네트워크 형태로 시각화한다. 그 외에도 사용자가 특정 시점을 선택하면 당대 제례 공간에 사용된 제기와 관련된 배치를 플랫폼 내에 구현한다. 이러한 방법론은 전문가에 한정되었던 고증 연구를 일반 대중들과 교육 현장에서 직관적으로 활용하고 경험할 수 있는 기반이 될 것이다.
본 연구는 제례라는 무형유산과 제기라는 유형유산, 그리고 실록의 기록 자산을 디지털 기술로 통합하여 조선시대 제례의 변천사를 입체적으로 시각화하는데 목적이 있다. 단순히 과거를 복원하는 데 그치지 않고 제례 문화가 시대와 함께 어떻게 변화했는지를 분석할 수 있는 디지털 헤리티지의 새로운 방법론을 정립하려는 의미 있는 시도라고 할 수 있다.
기대효과
(한글 2000자 이내)
본 연구는 조선 전기 종묘제례에서 사용된 제기의 변천 과정을 시멘틱 구조로 체계화하여 미술사학과 디지털 헤리티지 측면, 사회적 측면에서 다음과 같은 다각적 효과를 창출할 것으로 기대된다.
먼저 미술사학 측면으로 조선시대 제례 연구에 새로운 분석 모델을 제시한다. 기존 제기와 관련한 연구는 미술사적 관점에서 집중되었다. 따라서 본 연구에서는 제기라는 구체적인 유물을 중심으로 사회적 변화와 국가 의례 체계 간의 상호 작용을 통시적 관점에서 분석하는 차별성을 가지고자 한다. 또한, 문헌 기록과 유물을 교차로 검증하여 구축된 지식 체계는 조선의 제례문화에 관한 연구의 기초 데이터로서 신뢰성과 논리성을 높일 것이다. 뿐만 아니라 파편화되어 있는 관련 데이터들을 시맨틱 구조로 통합하여 기존 데이터의 활용도를 높이고 연결된 데이터 사이에서 새로운 지식을 도출함으로써 디지털 인문학 연구의 가능성을 제시한다. 더 나아가 본 연구는 종묘제례를 넘어 유형유산과 무형유산의 포괄적 가치를 체계화하는 동시에 조선 왕실 의례 문화 전반을 아우를 수 있는 통합적 모델로 확장되는 학술적 토대가 될 것이다.
두 번째로 디지털 헤리티지학 연구에 있어 전통적인 연구 방법론을 넘어 다각적 활용이 가능한 융합적 연구 방법론으로 확장한다. 시소러스와 온톨로지 기반의 지식 그래프는 단편적인 인문학적 데이터를 단순히 나열하는 데 그치지 않고 의미적 연관성에 따라 체계화함으로써 데이터 간 숨겨진 맥락을 도출할 수 있다. 이는 기존의 관계형 데이터베이스가 가진 한계를 온톨로지 기반 데이터베이스로 보완하며 텍스트, 도설, 유물로 전해지던 파편적인 흔적을 유기적으로 연결할 수 있다. 이러한 다각적 맥락을 반영한 데이터 모델링은 유기적 관계성을 바탕으로 추론과 분석을 할 수 있고 이는 고도화된 지식 체계를 구현하는 기반이 될 것이다. 특히 HermiT 추론기를 통한 논리적 일관성 검증과 SPARQL 질의를 통한 데이터 유효성 점검을 병행하여 구축된 지식 모델의 데이터 정합성을 확보하고자 한다. 이러한 지식 그래프 구축 과정은 앞으로 여러 문화유산 데이터를 연결 및 확장하는 연구 방법론으로 활용될 것 이다.
마지막으로 사회 문화적 측면에서 고증에 기반한 본-디지털(Born-Digital) 콘텐츠를 확보하고 활용도를 높일 수 있다. 또한, 온톨로지를 기반으로 구성된 지식 체계는 복잡한 학술 정보를 누구나 쉽게 이해할 수 있도록 시각적으로 전달한다. 이는 전문가 영역에서 다룬 고증 연구를 일반 대중들이 쉽게 접근할 수 있다.
뿐만 아니라, 제례 공간에 사용된 제기를 가상 박물관에서 재현하는 플랫폼 구현을 통해 일반대중은 의례 문화에서 사용된 제기가 어떻게 변화되었는지 직접적으로 체험할 수 있다. 이러한 플랫폼은 지능형 전시 큐레이션부터 다양한 문화 콘텐츠 제작에 활용할 수 있는 높은 가치를 지닌다.
결과적으로 본 연구는 데이터 기반의 지식 구조화를 통해 파편화된 기록과 유물들을 하나로 모아 해석할 수 있는 연구 기반을 마련할 것으로 기대된다. 또한 온톨로지 설계 기반의 디지털 기술을 활용하여 문화유산이 지닌 학술적 가치와 사회적 활용성을 극대화할 수 있고 이는 디지털 헤리티지 연구에 기여할 것이다.
연구요약
(한글 2000자 이내)
본 연구는 조선 전기 종묘제례 제기가 시대에 따라 어떻게 변해왔는지 살펴보고 그 과정을 시맨틱 아카이브를 통해 시각화하는 것을 목표로 한다. 이를 위해 인문학적 분석과 디지털 기술을 결합해 네 단계로 구성된 연구 절차를 체계적으로 진행한다.
먼저 기초 데이터 수집 및 정제 단계이다. 『조선왕조실록』과 『국조오례의』 등 디지털화된 기록물과 국립중앙박물관과 국립고궁박물관이 소장한 유물의 메타데이터를 일차적으로 수집한다. 이를 바탕으로 제기의 기종, 기형, 재질 등을 분류 지표를 세워서 정리한다. 또한 문헌 속의 도설이나 실록의 기록들을 실제 유물의 물리적 형태와 교차 검증한다. 기록상의 규격이나 묘사가 실제 유물과 어느 정도의 일치성을 보이는지 파악하여 역사적 변용의 흔적을 추적한다. 그 외에도 고문헌에 등장하는 고어와 현대 용어 사이의 의미 차이를 좁히기 위해 유의어, 상위어, 하위어, 관련어를 아우르는 용어사전을 구축한다. 이를 통해 여러 문헌과 유물 데이터에서 사용된 명칭을 표준화하여 시맨틱 검색과 데이터 연계 작업도 훨씬 더 정확하게 이루어질 수 있다.
두 번째로 온톨로지 설계 및 지식 그래프 구조화 단계이다. 제기의 재질,의례, 시기 및 관련 역사적 사건 등 핵심 개념 간의 유기적 관계를 CIDOC-CRM 및 Linkded Art 같은 국제 표준 모델에 기초로 정의하고 이를 바탕으로 범용성과 고도화된 체계를 갖춘 온톨로지를 구축한다. 그리고 ‘주체–서술어–목적어’ 형태의 트리플(Triple) 구조를 구현한다. 또한 제기와 문헌 기록, 역사적 맥락들을 서로 연결하는 지식 그래프를 만든다. 이는 단순히 정보를 나열하는 것에 그치지 않고 데이터 사이의 관계를 바탕으로 설득력 있는 추론을 가능하게 한다.
세 번째로 온톨로지 검증 및 데이터 검증 단계이다. 우선 설계된 온톨로지가 논리적으로 일관되고 계층 구조나 속성, 그리고 관계 정의가 적절한지 HermiT 추론기를 활용하여 검증한다. 다음으로 지식 그래프에 실제 데이터를 적용하고, SPARQL 질의를 통해 관계 구조와 데이터의 유효성을 점검한다. 그 외에도 조선시대 의례 연구의 기존 성과와 비교 분석하고 전문가 자문을 병행함으로써 학술적 신뢰성과 고증의 정확성을 확보한다.
마지막으로 시각화 및 플랫폼 구현 단계이다. 먼저 구축된 지식 그래프를 기반으로 사용자가 특정 시기나 제기 유형을 선택하면 관련 유물과 문헌 기록, 역사적 맥락 등을 네트워크 형태로 시각화하여 보여준다. 또 시대별로 제례 공간 내 제기 배치를 재현해 볼 수 있는 가상박물관을 구현한다. 이러한 시도는 문헌 속 데이터와 실제 유산을 서로 연결된 다차원적 디지털 경험으로 확장되는 한편 궁극적으로 온톨로지 기반의 시멘틱 아카이브 플랫폼 구현으로 이어진다.
해당 과정들을 통해 본 연구는 문헌과 유물 데이터를 통시적으로 분석하고, 종묘제례에서 사용된 제기의 변천과 그 안에 담긴 역사적 맥락을 직관적으로 이해할 수 있도록 연구 기반을 다지고자 한다.
키워드(Keyword)
(한글 250자 이내)
종묘제례, 제기, 지식그래프, 온톨로지, 디지털 아카이브
키워드
(영어 500자 이내)
Jongmyo Jerye, Ritual Vessels, Knowledge Graph, Ontology, Digital Archive

게시물 이원석 / 조선 전기 종묘 제기(祭器)의 변천 양상과 시맨틱 구조화 연구 / 2026 석사과정생연구장려금지원사업KADH / 한국디지털인문학협의회에 처음 등장했습니다.

송치영 / 학술 텍스트에 투영된 인문학 연구자들의 디지털 수용과 인식의 변천사: 딥러닝 기반 “디지털 인문학”의 의미 구조 변화를 중심으로 / 2026 석사과정생연구장려금지원사업

作者Baro
2026年6月13日 20:17

연구목표
(한글 2000자 이내)
정보기술의 급격한 발전과 사회적 확산은 인문학 학술 환경과 연구 방식, 매체와 인지 과정의 전환을 촉발했다. 적지 않은 수의 인문학 연구자들은 디지털 기술을 인문학 연구 활동에 도입했고, 그로 인해 발생된 ‘디지털 인문학’의 학술적 적실성에 대한 논쟁은 아직까지도 치열하게 전개되고 있다. 본 연구는 인공지능과 로보틱스 중심의 또다른 사회 재편을 앞둔 현 시점에서 인문학 연구자들의 정보기술 인식과 수용 서사를 검토함으로써, 디지털 시대 인문학 학술 커뮤니케이션의 변화와 향후 전망을 이해하고자 한다.

‘디지털 인문학’의 등장에 따라 어떠한 디지털 기술이 인문학 연구에 사용되었고, 근거하는 주요 학문 분야나 이론이 무엇인지 규명하는 연구도 활성화되었다. 하지만, 이러한 논의는 디지털 인문학 연구에 반영된 인문학 내 정보기술 담론이 어떻게 변하고 학문적 기제로 작용했는지를 충분히 다루지 않았다. 본 연구는 이러한 연구사적 공백을 토대로 인문학 연구자들의 지식과 당대적 인식이 내포된 학술문헌 텍스트에 문맥 기반 동적 워드 임베딩(Dynamic Contextualized Word Embedding)을 적용해 연구자들의 정보기술 인식의 의미적인 구조의 변화를 세밀하게 추적한다.

구체적으로 본 연구는 다음과 같은 세부 목표를 중심으로 진행한다. 첫째, 정보기술 담론의 핵심 기표로서 ‘digital’의 언어적 분포와 의미적 양상은 시기별로 어떻게 변하는가? 둘째, 역사, 문학, 철학 등 인문학 내 세부분야 별로 의미적인 차이가 발생하는 시기가 존재 하는가? 셋째, 도출된 정량적인 지표는 실제 디지털의 인문학의 학술사적 맥락과 어떻게 교차하는가? 이를 통해 본 연구는 언어적 분포의 변화를 통해 정보기술 발전이 인문학적 사유에 개입하는 과정을 실증해보고자 한다 .
기대효과
(한글 2000자 이내)
‘디지털’의 분포의미론적 구조의 변화를 토대로 인문학 내 정보기술 담론 변화를 포착하려는 본 연구는 다음과 같은 기대효과를 창출할 수 있다.

첫째, 본 연구는 디지털인문학의 학문사적 궤적을 설명하는 새로운 관점을 제공할 수 있다. 어떤 기술을 활용하며 그것이 새로운 인문학적 해석방식으로 적합한지 논의를 넘어 실제 인문학 연구자들의 텍스트에 반영된 정보기술 사회 인식과 학술적 실천의 맥락을 조망하도록 논의를 확장할 수 있다.

둘째, 연구자들의 지적 맥락이 담긴 1차사료로서 학술문헌 텍스트의 활용성을 제기한다. 매년 수십만 건 이상 발행되는 대규모 학술 텍스트를 딥러닝 기반 자연어처리 기법으로 분석하면서, 디지털 학문사 및 텍스트 기반 학술 커뮤니케이션 연구의 가능성을 모색한다.

셋째, 인문학 학술 커뮤니케이션의 변화를 진단하고 가치를 제고하는 데 이용할 수 있다. 인문학 연구자들이 당대적 맥락과 어떻게 상호작용하는지 규명함으로써, 가까운 미래에 예정된 인공지능과 로보틱스 중심의 전면적인 사회 재편 속에서 인문학의 학문적 제고와 변화상 예측에 활용할 수 있다.

넷째, 오픈 사이언스를 실천하며 연구의 투명성, 재현성을 확보할 것이다. 분석에 사용한 데이터 처리와 분석 코드는 github나 google drive 등에 부록 형식으로 공유해서 접근성을 높여 동일한 연구 프레임워크를 쉽게 따라할 수 있도록 인프라를 구축할 것이다.
연구요약
(한글 2000자 이내)
본 연구는 인문학 학술문헌 텍스트에서 자연어처리 기법으로 ‘digital’과 의미적으로 유사한 단어들의 분포 변화를 분석하여 ‘디지털’ 전환에 대한 인문학 연구자들의 인식과 학술적 실천의 양상을 규명하는 데 목표를 둔다. 시기·학문분야별 특성을 의미 공간에 반영하고, 정밀하게 변화를 추적하기 위해 본 연구는 문맥 기반 동적 워드 임베딩(Dynamic Contextualized Word Embedding)을 활용한다. 연구는 다음과 같은 단계로 수행한다.

  1. 데이터셋 구축 및 임베딩 모델 학습
    글로벌 학술 데이터베이스인 OpenAlex API를 활용하여 ‘digital’과 ‘computational’이 포함된 인문학 학술텍스트 약 19만 건을 수집하고 발행연도와 세부분야를 라벨링한다. 레이블은 Dynamic Contextualized Word Embedding에 차이값으로 의미공간에 직접 반영해서, 기존의 정적 임베딩 모델이나 일반적인 문맥 기반 모델이 포착하기 어려운 미세한 담론 변화를 반영한다.
  2. 통사·의미론적 변화 측정(전체/세부분야별로 비교)
    구축된 모델을 바탕으로 ‘digital’과 ‘computational’ 간 유사도 변화를 산출해서 의미적인 결합과 분리 지점을 정량화한다. 섀넌 엔트로피나 젠슨-섀넌 분산, 평균 내적 거리 등의 지표를 이용해 주변 단어의 분포적 변화를 측정하고 통사적 분포와 교차 대조해서 ‘digital’ 인식의 의미적인 구조의 변화를 식별한다.
  3. 디지털 인문학의 학문사적 맥락-양적 변곡점과 교차 검토
    정량적인 변곡점은 디지털인문학 관련 선행 연구, 디지털인문학 관련 학술 단체 설립 및 연구비 지원 사업 시행 등의 정성적 맥락과 비교 검토한다.
    키워드(Keyword)
    (한글 250자 이내)
    디지털 인문학, 인문학 연구자, 디지털 인식, 문맥 기반 동적 워드 임베딩
    키워드
    (영어 500자 이내)
    digital humanities, humanities researchers, digital engagement, dynamic contextualized word embedding

게시물 송치영 / 학술 텍스트에 투영된 인문학 연구자들의 디지털 수용과 인식의 변천사: 딥러닝 기반 “디지털 인문학”의 의미 구조 변화를 중심으로 / 2026 석사과정생연구장려금지원사업KADH / 한국디지털인문학협의회에 처음 등장했습니다.

김필하 / HGIS를 활용한 조선 세종~성종대 여진족 침입과 북방 방어 체계의 공간 분석 / 2026 석사과정생연구장려금지원사업

作者Baro
2026年6月13日 20:15

연구목표
(한글 2000자 이내)
첫째, 조선 세종대부터 성종대까지 조선 북방 지역에서 나타난 여진족 침입과 축성의 양상을 구체적으로 드러내고자 한다. 조선 전기 북방 지역은 여진 세력의 동향에 따라 군사적 긴장과 대응 정책이 복합적으로 전개된 공간이었다. 조선은 정벌과 회유 정책뿐 아니라 축성을 통해 방어체제를 정비하였다. 본 연구는 『조선왕조실록』과 지리지 자료를 바탕으로 여진족 침입 기사와 축성 관련 기록을 수집·분석함으로써, 개별 사건으로 파악되어 온 북방 문제를 연속적이고 구조적인 흐름 속에서 이해하고자 한다.
둘째, HGIS(Historical Geographic Information System) 기술을 활용하여 조선 전기 축성을 중심으로 한 북방 관방체계의 구조를 공간적 차원에서 복원하고자 한다. 기존 연구는 조선과 여진의 관계, 여진 정벌, 내조·수직 정책 그리고 4군 6진 개척 등 사건사 중심으로 축적되어 왔다. 최근에는 HGIS를 활용한 행정구역 및 교통로 복원 연구도 이루어지고 있다. 그러나 북방 관방체계를 대상으로 침입 지점, 군사 거점, 자연지형, 교통로를 종합적으로 분석한 연구는 드물다.
셋째, 여진족 침입과 북방 축성의 상관관계를 시기별로 검토함으로써, 궁극적으로 조선 전기 북방 방어체제의 형성을 해명하고자 한다. 세종부터 성종대에 이르는 시기는 여진족 침입이 빈번하게 나타나 변경 지역의 상황에 기민하게 반응하며 집중적으로 축성이 이루어진 시기였다. 이와 같은 검토를 통해 조선이 북방에서 추구한 군사적 대응의 원리와 대여진 정책을 입체적으로 이해할 수 있을 것이다.
본 연구는 여진족 침입과 축성이라는 두 요소를 통해 조선 전기 북방 경영의 실상을 연구하고자 한다. 나아가 GIS를 활용한 역사학 연구의 가능성을 구체적으로 제시함으로써 조선 전기 북방 문제를 새롭게 해석하는 방법론적 토대를 마련하고자 한다.
기대효과
(한글 2000자 이내)
역사적 변화를 이해하기 위해서는 사건이 전개된 시간적 흐름과 공간적 범위를 함께 파악할 필요가 있다. 이처럼 시공간적 구조를 함께 파악하는 작업은 그 자체로 역사학의 기초를 이루는 중요한 방법론이다. 특히 조선은 건국 초부터 군사를 국가의 큰 일(大事)로 인식하였다.
일반적인 텍스트 서술을 넘어 시공간 데이터베이스에 기반하여 제작되는 역사지도는 복잡한 역사적 사실과 그 공간적 관계를 시각적으로 드러낼 수 있다는 점에서 역사학 연구의 새로운 가능성을 제시할 것으로 기대된다.
본 연구는 세종부터 성종대까지의 여진족 침입과 북방 축성을 함께 검토함으로써 조선 전기 북방사 연구를 개별 사건이나 정책 중심의 서술에서 벗어나 방어체계의 형성과 운영 원리를 입체적으로 파악하는 방향으로 확장할 수 있다. 특히 HGIS 기술을 활용하여『조선왕조실록』과 지리지, 고지도에 산재한 정보를 HGIS 기반 공간정보로 구축함으로써 기존 연구에서 충분히 드러나지 않았던 침입 경로와 방어 거점의 분포, 자연지형과 교통로의 관계, 시기별 방어선의 변화 양상 등을 시각적으로 확인할 수 있을 것이다. 이는 조선 전기 북방 방어체제의 실제 모습을 복원하는 데 중요한 단서를 제공할 것이다.
또한 본 연구를 통해 구축된 지명 위치, 성곽 등의 시공간 데이터는 향후 조선 전기 북방사 연구뿐 아니라 북방 외교, 대명 관계사 연구로까지 확장 가능한 기초 자료로 활용될 수 있다. 이 점에서 본 연구는 하나의 주제를 해명하는 데 그치지 않고, 후속 연구를 위한 데이터 기반을 축적함으로써 역사학 연구의 방법론적 확장과 심화에도 기여할 것으로 기대된다.
연구요약
(한글 2000자 이내)
본 연구는 세종부터 성종대까지의 여진족 침입과 북방 축성 관련 기사를 HGIS 기반의 공간 정보로 구축하여 문헌에 분산되어 있는 사건과 방어시설을 시각적으로 재구성하고자 한다. 이를 통해 압록강·두만강 유역을 중심으로 조선 전기 북방 방어 거점의 집중 지역과 상호 연계 양상, 그리고 여진 세력 침입의 전개 양상을 분석하고자 한다. 나아가 왕대별로 방어체계의 변화를 비교함으로써 조선 전기 북방 방어체계의 형성과 재편 과정을 입체적으로 파악하고자 한다.
그동안 조선과 여진 세력 간 관계, 여진 정벌, 내조와 수직, 영토 개척 등 개별 사건과 정책을 중심으로 상당한 성과를 축적되어 왔다. 그러나 실제 북방의 질서는 이러한 개별 사건만으로 충분히 설명되기 어렵다. 접경 지역 방어와 군사 대응이 조선 전기 국가 운영의 핵심 과제였다는 점에서 북방 방어체계의 작동 양상을 밝히는 일은 당시의 안보 인식과 접경 지역 운영의 성격을 이해하는 데 중요한 의미를 지닌다. 특히 세종대 후반에는 기근과 같은 대내적 어려움이 이어졌음에도 북방 축성이 지속적으로 추진되었다는 점에서 축성은 단순한 군사 시설의 설치가 아니라 북방 통치와 방어 전략의 핵심 수단으로 기능하였다고 생각된다. 본 연구는 이러한 문제의식에서 출발하여 침입과 축성을 하나의 연속된 흐름 속에서 파악하고자 한다.
본 연구의 구성은 크게 세 부분으로 이루어진다. 우선, 『조선왕조실록』과 지리지 자료를 중심으로 여진 침입 및 북방 축성의 시기별 전개 양상을 정리한다. 이때 단순히 축성이나 침입 기사만을 발췌하는 데 그치지 않고, 연대기적 흐름에 따라 사료를 읽어 내려가며 해당 기록의 정치적·군사적 맥락을 함께 살펴볼 것이다. 이후「대동여지도」를 비롯한 다양한 고지도와 현대 지형 지도를 활용하여 주요 지명과 군사 거점의 위치를 비정하고자 한다. 마지막으로 이렇게 정리된 지리 정보를 HGIS 기반 공간정보로 구축할 것이다. 이 과정에서는 우선 QGIS 프로그램을 활용하여 고지도의 지리참조와 공간정보의 기초 구축을 수행하고, 필요할 경우 ArcGIS 프로그램도 함께 활용하여 정밀한 공간 분석을 진행하고자 한다. 이를 통해 개별 성곽의 존재를 확인하는 수준을 넘어 북방 방어체계가 실제로 어떤 공간적 질서 속에서 구성되고 재편되었는지를 밝히는 데까지 나아가고자 한다.
본 연구에서는 다음과 같은 방법을 통해 연구를 진행할 것이다. 우선 실록과 지리지에서 관련 기사와 지명을 추출하여 목록화한다. 다음으로 고지도와 현대 지형도 및 위성지도 등을 대조하여 각 지점의 위치를 비정하고, QGIS에서 지오레퍼런싱 작업을 수행해 고지도와 현대 지도를 중첩한다. 셋째, 비정된 지점을 바탕으로 침입 지점과 군사 거점은 포인트 데이터로, 주요 교통로와 이동 경로는 라인 데이터로 구축한다. 하천과 산맥 등 자연 지형 정보과의 입지적 연관성을 분석한다. 마지막으로 넷째, 이렇게 구축한 데이터를 바탕으로 성곽 분포 밀도, 거점 간 거리, 교통로 및 자연지형과의 관계를 분석하고, 이를 왕대별로 비교하여 조선 전기 북방 방어체계의 변화 양상을 규명하고자 한다
키워드(Keyword)
(한글 250자 이내)
조선시대, 축성, 대여진, HGIS, 대동여지도, 북방 방어체제
키워드
(영어 500자 이내)
Joseon Dynasty, Fortress Construction, Relations with the Jurchens, Historical Geographic Information System (HGIS), Daedongyeojido, Northern Defense System

게시물 김필하 / HGIS를 활용한 조선 세종~성종대 여진족 침입과 북방 방어 체계의 공간 분석 / 2026 석사과정생연구장려금지원사업KADH / 한국디지털인문학협의회에 처음 등장했습니다.

정채연 / 야담 시맨틱 데이터 구축 및 활용 방안 – “계서잡록”을 중심으로 / 2026 석사과정생연구장려금지원사업

作者Baro
2026年6月13日 20:14

연구목표
(한글 2000자 이내)
본 연구의 목적은 『계서잡록』 텍스트 내부에 존재하는 다양한 문맥 및 서사 정보를 기계가 읽고 이해할 수 있는 시맨틱 데이터로 설계 및 구축하고, 이를 인물과 사건, 공간 등이 얽힌 지식 그래프로 정리하는 데 있다. 나아가 구축된 데이터를 기반으로 서사 및 서술 방식에 대한 정량적, 정성적 분석을 시도하여 그 활용 방안을 깊이 있게 탐구하고, 연구의 최종 결과물을 웹 플랫폼으로 공유함으로써 데이터 기반 고전서사 분석이 지닌 새로운 가능성과 학술적 효용성을 증명하고자 한다.
AI 시대를 맞이하여 전문성과 신뢰성을 갖춘 인문학 데이터셋 확보가 학계의 중요한 과제로 대두되고 있다. 고전서사 분야, 그중에서도 야담 연구에 있어서 데이터베이스 설계 논의가 점차 활발히 전개되고 있으나, 기존의 연구 성과는 대부분 이론적인 설계 단계에 머물러 있거나 특정 유형의 이야기에만 국한된 부분적인 데이터를 구축하는 수준에 그치고 있다. 방대한 분량의 야담집 한 권을 온전히 데이터화하여 학계와 대중에 공개한 사례는 아직 찾아보기 어렵다. 데이터 설계 단계에서는 미처 예상하지 못했던 다양한 변수들이 실제 구축 과정에서 발생하기 마련이므로, 범용적이고 표준적인 데이터베이스 모델을 확립하기 위해서는 연구자가 직접 텍스트를 다루며 구축의 전 과정을 겪어낸 경험과 실증적인 데이터가 반드시 필요하다.
이에 본 연구는 조선 후기 야담집 편찬의 효시이자 후대 야담집 형성에 큰 영향을 미친 이희평의 『계서잡록』을 연구 대상으로 삼는다.
본 연구는 구축된 데이터를 활용하여 다음과 같은 두 가지 질문을 중점적으로 해명하고자 한다. 첫째, 지식 그래프를 통해 드러나는 『계서잡록』의 당파적 인물 네트워크는 어떠한 구조를 지니는가에 대한 규명이다. 기존 선행연구에 따르면 편찬자 이희평은 서사 내에 노론으로서의 당파성을 강하게 투사한 것으로 평가받고 있다. 본 연구는 인물 노드 간의 관계와 각 인물에게 부여된 서사적 평가를 네트워크 그래프로 시각화한다. 이를 통해 작가의 정치적 정체성이 작품 내 인물들의 위계 설정과 중심 및 주변부 배치에 어떻게 구체적이고 체계적으로 작용하고 있는지를 정량적이고 시각적인 데이터로 입증할 것이다. 둘째, 현실성과 기이성이 데이터 속에서 어떻게 교섭하고 있는가에 대한 분석이다. 『계서잡록』에는 현실적인 사건과 기이성을 가진 요소들이 융합되어 서사가 전개되는 특징을 보인다. 기이성을 속성으로 지닌 노드와 현실성을 띤 인물, 사건, 장소 사이의 연결망을 면밀히 파악함으로써, 당대 사대부 계층의 어떠한 현실적 결핍과 정치적 욕망이 기이성을 호출하여 사건을 해결하고 서사를 이끌어가는지 파악한다. 아울러 이러한 교섭 양상이 특정한 지리적 공간 정보와 어떻게 결부되어 나타나는지 그 빈도와 패턴을 통계적으로 밝혀낼 것이다.
기대효과
(한글 2000자 이내)
본 연구는 『계서잡록』의 서사 정보를 체계적인 데이터로 전환하고 분석함으로써 학술적, 방법론적, 그리고 사회·교육적 측면에서 다음과 같은 다각적이고 깊이 있는 파급 효과를 지닌다.
첫째, 데이터 기반 야담 연구의 강력한 기초 자원을 제공하고 고전문학 연구의 방법론적 확장을 도모한다. 문학 텍스트를 정형화된 데이터로 다루는 작업은 텍스트 전체의 경향성을 파악하는 거시적 조망을 가능하게 함과 동시에, 인물 간의 호칭 변화나 특정 소재의 등장 빈도 등을 면밀히 추적하는 미시적인 독해를 더욱 용이하게 만들어준다. 본 연구가 최종적으로 제공할 원문 텍스트 및 한글 번역, TEI 가이드라인을 준용하여 정밀하게 태깅한 데이터 문서, 지식 그래프 정보 등은 그 자체로 의미가 있는 기초 자원이다. 이는 단순한 어휘 빈도 추출을 넘어, 기존의 직관적 해석에 주로 의존하던 야담 연구를 실증적이고 데이터 기반의 영역으로 확장하는 데 기여할 것이다. 야담 연구자들은 공개된 데이터를 바탕으로 각자의 학술적 관심사에 맞춘 다양한 후속 연구를 편리하고 효율적으로 진행할 수 있다.
둘째, 연구 대상의 확장을 통한 한국 야담의 거시적 전승 양상 규명에 기여한다. 본 연구에서 확립한 야담 데이터베이스의 표준 모델을 바탕으로, 향후에는 『계서잡록』에 존재하는 수많은 이본의 데이터를 추가로 구축하여 비교 문헌학적 연구의 지평을 넓힐 수 있다. 나아가 『동패락송』, 『계서야담』 등 『계서잡록』과 내용상, 계보적으로 거리가 가까운 다른 야담집들로 연구 대상을 점진적으로 확장해 나갈 수 있다. 여기에 근대 야담 아카이브와의 연결성까지 모색한다면, 조선 후기부터 근대에 이르기까지 야담 서사가 어떻게 전승되고 변이되었는지 그 양상을 거시적이고 통시적으로 확인하는 연구를 수행할 수 있을 것이다.
셋째, 웹 프로토타입 구축을 통한 고전 서사의 대중적 활용 가능성을 제시한다. 본 연구에서는 일차적으로 원문 텍스트와 연구자가 미리 수행한 시각화 결과를 직관적으로 확인할 수 있는 웹페이지를 프로토타입 형태로 제시한다. 향후 이를 고도화하여 사용자가 직접 간단한 분석까지 진행할 수 있는 본격적인 야담 플랫폼으로 구축한다면, 고전 텍스트에 대한 대중의 접근성을 크게 높여 교육적 목적으로 활용될 수 있을 뿐만 아니라 현대 콘텐츠 창작자들의 아이디어 수집을 위한 원천 소스로도 유용하게 쓰일 수 있을 것이다.
연구요약
(한글 2000자 이내)
◇ 연구 목표: 본 연구는 조선 후기 야담집 『계서잡록』을 시맨틱 데이터로 구조화하고 이를 xml 문서와 지식 그래프로 구현하여 데이터 기반 고전서사 분석이 가진 연구 가능성을 증명하는 데 있다. 기계가 문맥과 관계를 이해할 수 있도록 데이터를 설계 및 구축하고, 이를 공유하여 ‘멀리서 읽기’와 ‘꼼꼼히 읽기’ 연구를 모두 도울 수 있는 표준 모델을 수립하고, 데이터로 학계에 기여하고자 한다.
◇ 연구 내용: 본 연구는 조선 후기 야담집 편찬의 효시이자 후대 야담집 형성에 큰 영향을 미친 『계서잡록』을 연구 대상으로 한다. 이는 계서 이희평이 편찬한 4책 약 240화 분량의 야담집으로, 선본으로 인정되는 권1 성대본, 권2 익선재본, 권3 이희평본과 완질본인 일사본을 기반으로 연구를 수행한다. 구축된 시맨틱 데이터와 지식 그래프를 바탕으로, 본 연구는 다음과 같은 연구 질문을 규명하고자 한다. 첫째, 지식 그래프를 통해 드러나는 『계서잡록』의 당파적 인물 네트워크는 어떠한 구조를 지니는가? 편찬자 이희평이 투사한 노론으로서의 당파성을 확인하기 위해 인물 노드 간 관계와 평가를 시각화하여 그의 정치적 정체성이 어떻게 작용하는지 입증할 것이다. 둘째, 현실성과 기이성은 시맨틱 데이터 속에서 어떻게 교섭하는가? 기이성을 속성으로 지닌 노드와 현실적인 인물, 사건, 장소 등과의 관계를 파악하여 당대 사람들의 어떠한 결핍과 욕망이 기이성을 호출해 서사를 전개하는지 그 패턴의 결부 양상을 통계적으로 밝혀낼 것이다.
◇ 연구 방법: 설정한 연구 목표를 달성하기 위해 다음의 4단계 추진 전략을 바탕으로 연구를 수행하고자 한다.
① 기초 데이터 정비 단계: 선행연구를 자세히 조사하고, 『계서잡록』 이본을 파악하여 문헌학적 토대를 공고히 한다. 특히 연구 대상이 되는 주요 선본을 대조하여 신뢰도 높은 텍스트를 마련하고 검수한다.
② 온톨로지 설계 및 DB 구축 단계: 선행 모델을 참조하여 온톨로지를 설계하고, 직접 데이터를 구축하는 과정에서 수정하는 과정을 반복한다. 설계된 온톨로지를 기반으로 데이터베이스를 입력하고, TEI 가이드라인을 준수하여 xml 태깅을 수행한다.
③ 그래프DB 구현 및 서사 분석 단계: 구축된 데이터를 기반으로 분석을 수행한다. 데이터를 그래프DB(neo4j)로 변환하고, 쿼리를 활용하여 유의미한 연구 질문을 생성한다. 역사 데이터, 지리 정보 등 연관 데이터와 연결하고, 이를 통해 네트워크 그래프, 지도 시각화 등을 수행한다.
④ 웹 프로토타입 개발 및 연구 성과 공유 단계: 연구 결과를 직관적으로 전달할 수 있도록 프로토타입으로 웹을 개발하여, 앞선 DB 활용 방안과 맞닿은 시각화 결과 및 데이터셋을 공유한다.
키워드(Keyword)
(한글 250자 이내)
계서잡록, 야담, 시맨틱 데이터, 지식 그래프, 디지털 인문학, 온톨로지, 확장성 마크업 언어, 텍스트 인코딩 이니셔티브
키워드
(영어 500자 이내)
Gyeseojaprok, Yadam, Semantic Data, Knowledge Graph, Digital Humanities, Ontology, XML, TEI

게시물 정채연 / 야담 시맨틱 데이터 구축 및 활용 방안 – “계서잡록”을 중심으로 / 2026 석사과정생연구장려금지원사업KADH / 한국디지털인문학협의회에 처음 등장했습니다.

정선한 / 디지털 인문학 방법론을 활용한 국내 중어중문학 전공 교육과정 구조 분석 / 2026 석사과정생연구장려금지원사업

作者Baro
2026年6月13日 20:13

연구목표
(한글 2000자 이내)

본 연구의 목적은 전국 중어중문학 유관 전공 학과의 교육과정이 교육목표에 부합하도록 구성되어 있는지를 디지털인문학 방법론에 입각하여 실증적으로 규명하는 것이다. 현재 중문학계는 AI 기술의 급속한 발전으로 언어 이해·번역·텍스트 생성 등의 과업을 AI가 빠르게 대체하고 있으며, 다수의 대학에서 중국어 관련 학과의 신입생 충원율 하락과 학과 통폐합되는 현상을 보이고 있다.
이러한 시점에서 현 교육체제의 구조적 현황을 객관적으로 진단하고, 교육 방향성에 대한 실증적 근거를 확보하는 것은 학계의 시급한 과제이다. 그러나 전국 단위에서 중어중문학 유관 전공 학과의 교육과정을 체계적으로 수집·구조화하고, 교육목표와의 정합성을 데이터에 기반하여 분석한 연구는 부재한 실정이다.

이에 본 연구는 다음의 네 가지 연구 목표를 설정한다.
첫째, 전국 중어중문학 유관 전공 학과의 교육목표와 교육과정(교과목·이수체계 등)을 전수 조사하여 수집·정리한다. 교육부 공시 문서인 ‘2024학년도 4년제 대학 모집 단위별 입학정원’에 등재된 대학 중, 2025학년도에 신입학생을 모집한 대학을 대상으로 하며, 2025·2026학년도 교육과정을 기준으로 수집한다.
둘째, 대학-학과-교과목 간의 위계와 관계를 체계적으로 반영하는 온톨로지 기반의 데이터 스키마를 설계하여 분석의 일관성과 확장성을 확보한다.
셋째, 설계된 스키마를 기초로 교육과정 데이터를 지식그래프(Knowledge Graph) 형태의 데이터베이스로 구축한다.
넷째, 구축된 데이터베이스를 활용하여 거대언어모델(LLM)의 의미 분석 기능을 통해 교육목표와 교과목 간의 정합성을 분석한다.
이상의 목표를 통해 중어중문학 교육과정의 구조적 현황을 객관적으로 진단하고, AI 시대에 부합하는 교육 방향을 모색하는 데 실질적인 근거를 제공하고자 한다.

기대효과
(한글 2000자 이내)

본 연구의 기대효과는 학술적 기여, 방법론적 기여, 실천적 활용의 세 차원으로 구분된다.

첫째, 학술적 기여이다. 본 연구는 전국 중어중문학 유관 학과의 교육목표와 교육과정을 전수 조사하여 구축한 최초의 체계적 데이터셋을 산출한다. 이 데이터셋은 후속 연구의 기반이자 학계 전반이 참조할 수 있는 공개적 정보 자원으로 기능할 수 있다. 특히 2025·2026학년도 데이터를 기준으로 수집하되, 이후 학년도 데이터를 추가·갱신하여 통시적 변화를 추적하는 장기 데이터셋으로 성장시킬 수 있다. 이를 통해 AI 기술 발전이 중어중문학 교육에 미치는 영향을 시계열적으로 추적·분석할 수 있는 실증적 토대가 마련된다. 아울러, 교육목표와 교과 편성 간의 정합성을 정량적으로 진단함으로써, 기존에 질적 해석에 의존하던 교육과정 연구의 분석 체계성과 재현 가능성을 제고한다.

둘째, 방법론적 기여이다. 본 연구에서 설계하는 대학-학과-교과목 온톨로지는 중어중문학 분야에 국한되지 않는다. 타 어문학이나 인문학 분야에서 교육 지형을 분석하고자 할 때 참조 모델(벤치마크)로 활용될 수 있으며, 이는 본 연구의 방법론적 기여가 특정 학문 분야를 초월한 범용적 가치를 지님을 의미한다. 또한 지식 그래프는 새로운 연결 데이터(Linked Data)의 추가가 용이하도록 설계되므로, 졸업생 진로 데이터, 산업체 수요 데이터 등을 연결하면 교육과정과 사회적 수요 간 정합성까지 분석 범위를 확대할 수 있다. 나아가, 인문학 데이터에 온톨로지 설계, 지식그래프 구축, LLM 기반 의미 분석을 결합하는 일련의 연구 파이프라인은 디지털인문학 방법론의 구체적 적용 사례로서 후속 연구자들에게 참고 프레임워크를 제공한다.

셋째, 실천적 활용이다. 본 연구의 분석 결과는 각 학과가 교육목표와 교과 편성 사이의 괴리를 자체적으로 점검하고, 교육과정을 개선하는 데 실질적인 참조 자료로 활용될 수 있다. 특히 AI 환경에서 어문학 교육이 지향해야 할 사고·추론·이해·표현 능력의 본질에 대한 논의를 데이터에 기반하여 촉발함으로써, AX(AI Transformation) 시대의 인문학 교육 재구성을 위한 학술적·정책적 논의에 기초 자료를 제공할 수 있다.

연구요약
(한글 2000자 이내)

본 연구의 목적은 전국 중어중문학 유관 전공 학과의 교육과정이 교육목표에 부합하도록 구성되어 있는지를 데이터에 입각하여 실증적으로 규명하는 것이다. AI 기술이 언어 관련 과업을 빠르게 대체하는 현 시점에서, 중어중문학 교육체제의 구조적 현황을 객관적으로 진단하고 향후 교육 방향에 대한 근거를 확보할 필요가 있으나, 전국 단위의 체계적 데이터 기반 분석은 부재한 실정이다.

이에 본 연구는 이 공백을 메우는 기초 자료로서, AI 시대에 부합하는 교육 방향을 모색하는 데 실질적인 근거를 제공한다.
첫째, 전국 본 연구를 진행하기 위해 전국 중어중문학 유관 전공 학과의 각 홈페이제 공시된 교육목표와 2025·2026 교육과정을 수집한다. 대학 선정 기준은 교육부 공시 문서인 ‘2024학년도 4년제 대학 모집 단위별 입학정원’으로 한다.
둘째, 관련 데이터 수집이 완료되면 온톨로지를 설계하여 데이터를 체계화한다. 이를 통해 대학-학과-교과목 간의 복잡한 관계를 유연하고 직관적으로 탐색할 수 있다.
셋째, 설게된 온톨로지를 기초로 지식 그래프 형테의 데이터베이스를 구축한다. 구축 도구로 Neo4j, 위키(Wiki)와 같은 플랫폼을 활용할 수 있다.
넷째, 구축된 데이터베이스는 거대언어모델(LLM)을 활용하여 의미 유사도(Semantic Similarity) 측정, 임베딩(Embedding) 기반 군집 분석(Clustering), 텍스트 분류(Text Classification) 등의 분석 기법을 적용하여 교육목표와 교육과정 간의 구조적 정합성을 진단한다.

본 연구를 통해 중어중문학 교육과정의 구조적 현황에 대한 실증적 진단 결과를 도출하고, 구축된 데이터셋과 온톨로지를 학계의 공개적 정보 자원 및 타 인문학 분야의 참조 모델로 제공하고자 한다.

키워드(Keyword)
(한글 250자 이내)
중어중문학, 교육과정, 교육목표, 지식그래프, 온톨로지, 거대언어모델(LLM), 디지털인문학, 교육 지형 분석
키워드
(영어 500자 이내)
Chinese Language and Literature, Curriculum, Educational Objectives, Knowledge Graph, Ontology, Large Language Model (LLM), Digital Humanities, Educational Landscape Analysis
닫기

게시물 정선한 / 디지털 인문학 방법론을 활용한 국내 중어중문학 전공 교육과정 구조 분석 / 2026 석사과정생연구장려금지원사업KADH / 한국디지털인문학협의회에 처음 등장했습니다.

정철 / BIBFRAME 데이터의 AI 검색 기법에 관한 연구 / 2026 박사과정생연구장려금지원사업

作者Baro
2026年6月13日 20:12

연구목표
(한글 2000자 이내)
도서관은 정보자원을 수집하고 조직하여 이용자의 정보 요구에 적합한 자원에 접근하고 이를 활용할 수 있도록 지원하는 기관이다. 이러한 기능을 실현하기 위한 핵심 도구는 목록이며, 1960년 미국 의회도서관에서 MARC가 제안된 이후 수십 년 동안 도서관 목록 데이터의 표준 구조로 활용되어 왔다. MARC는 서지 정보를 기계가독 형태로 구조화하여 도서관 간 서지 데이터 교환과 공유를 가능하게 하는 레코드 기반 데이터 구조로, 도서관 정보 조직과 데이터 교환의 기술적 기반으로 기능해 왔다.
그러나 웹 환경의 발전과 함께 도서관이 구축한 서지 데이터를 웹에서 공유하고 외부 데이터와 연계할 필요성이 제기되었으며, 이에 시맨틱 웹과 링크드 데이터에 대한 논의가 확산되었다. 이러한 흐름 속에서 MARC 데이터를 RDF 기반 링크드 데이터로 변환하려는 시도가 이루어졌지만, MARC는 레코드 중심 구조로 설계되어 개체 중심 데이터 모델이나 데이터 간 의미적 관계 표현에 구조적 한계를 지니고 있었다.
이러한 한계를 보완하기 위해 미국 의회도서관에서는 링크드 데이터 환경에 적합한 새로운 서지 프레임워크인 BIBFRAME(Bibliographic Framework)을 제안하였다. BIBFRAME은 RDF 기반 구조를 활용하여 서지 개체와 관계를 명시적으로 표현할 수 있도록 설계된 도서관 특화 온톨로지로, MARC 중심 목록 환경을 링크드 데이터 기반 서지 데이터 환경으로 전환하기 위한 대안으로 제시되었다. 이에 따라 전 세계적으로 MARC에서 BIBFRAME으로의 전환이 시도되고 있으며, 국내에서도 국가서지 정책을 통해 BIBFRAME 기반 서지 데이터 환경으로의 전환이 추진되고 있다.
그러나 국내의 링크드 데이터 관련 연구와 구축 사례는 MARC 데이터를 RDF나 BIBFRAME 구조로 변환하는 기술적 측면에 주로 집중되어 있으며, 구축된 데이터를 실제의 도서관 정보서비스에서 활용하는 방안에 대한 논의는 상대적으로 부족하다. 또한 기관별로 서로 다른 데이터 모델과 어휘가 적용됨에 따라 개체 간 의미 관계와 기관 간 데이터 연결이 충분히 이루어지지 못하고 있으며, 일부 서비스는 제한적인 수준에서 운영되거나 지속적으로 활용되지 못하는 한계를 보이고 있다. 이러한 상황에서는 기존 서지 데이터를 링크드 데이터 형태로 공개한 것 이상의 실질적인 활용 가치를 확보하기 어렵다.
따라서 BIBFRAME 데이터를 링크드 데이터 형태로 발행하는 것을 넘어, 개체와 관계 중심의 의미 구조를 실제 정보 탐색 과정에서 활용할 수 있는 방향으로 활용 범위를 확장할 필요가 있다. BIBFRAME 데이터는 온톨로지 기반 구조를 통해 개체와 관계 정보를 명시적으로 표현할 수 있으며, 이러한 특성은 데이터를 지식그래프 형태로 구조화하여 활용할 수 있는 가능성을 제공한다.
최근에는 대규모 언어모델의 발전과 함께 지식그래프를 활용한 AI 기반 검색 방식이 새로운 연구 흐름으로 등장하고 있다. 그중 GraphRAG는 지식그래프와 생성형 AI를 결합한 구조로, 지식그래프의 개체와 관계 정보를 활용하여 자연어 질의를 이해하고 관련 지식을 탐색함으로써 맥락적인 응답을 제공할 수 있는 방식으로 주목받고 있다. 이러한 접근은 지식그래프의 의미 정보와 대규모 언어모델의 추론 능력을 결합함으로써 도서 추천, 연관 정보 탐색, 질의응답 등 지식 기반 정보 탐색 서비스를 구현할 가능성을 제시한다.
이에 본 연구는 BIBFRAME 데이터의 의미 구조를 실제 정보 탐색에 활용하기 위한 방안으로 지식그래프와 AI 검색 기법을 결합한 GraphRAG 기반 검색 방식을 제안하고자 한다. 이를 위해 BIBFRAME 데이터를 기반으로 지식그래프를 구축하고 GraphRAG 구조를 적용한 BIBFRAME AI 검색 모델을 개발하여, 도서관 환경에서의 적용 가능성과 실제 서비스 구현 가능성을 실증적으로 분석하는 것을 연구의 목적으로 한다.
기대효과
(한글 2000자 이내)
최근 다양한 분야에서는 지식그래프를 활용하여 기존의 데이터 중심 시스템을 지식 기반 업무 시스템으로 전환하려는 시도가 활발히 이루어지고 있다. 지식그래프는 개체와 관계를 기반으로 데이터를 구조화함으로써 데이터 간 의미적 연결을 명시적으로 표현할 수 있으며, 이러한 특성은 복잡한 정보 구조를 지닌 데이터 환경에서 의미 기반 정보 탐색과 지식 활용을 가능하게 한다. 특히 최근에는 대규모 언어모델과 결합하여 지식 기반 질의응답, 추천 시스템, 의사결정 지원 등 다양한 지능형 정보 서비스에 활용되면서 그 적용 범위가 빠르게 확대되고 있다.
그러나 현시점, 문헌정보학 분야에서 BIBFRAME 데이터를 기반으로 지식그래프를 구축하고 이를 실제 정보서비스 환경에서 활용하려는 연구는 국내외적으로 아직 제한적인 수준에 머물러 있다. 그동안 도서관 분야에서의 BIBFRAME 관련 연구는 주로 MARC 데이터를 BIBFRAME 구조로 변환하거나 링크드 데이터로 발행하는 기술적 측면에 집중되어 왔으며, 구축된 데이터를 실제의 도서관 정보관 정보서비스에 어떻게 활용할 것인지에 대한 논의는 상대적으로 부족하였다. 이러한 상황은 BIBFRAME 데이터가 지닌 온톨로지 기반 의미 구조와 데이터 간 관계 표현의 잠재력을 충분히 활용하지 못하고 있음을 보여준다. 따라서 BIBFRAME 데이터의 의미 구조를 실제 정보서비스 환경에서 활용하기 위한 구체적인 방안을 모색하는 것은 도서관 정보조직 및 정보검색 연구에서 중요한 과제로 볼 수 있다.
한편, 최근 AI 기술의 발전과 함께 지식그래프와 LLM을 결합하여 지식 기반 정보 탐색을 수행하는 새로운 검색 패러다임이 등장하고 있다. 특히 GraphRAG는 지식그래프에 표현된 개체와 관계 정보를 기반으로 관련 지식을 탐색하고 이를 생성형 AI와 결합하여 맥락적인 응답을 제공하는 방식으로 주목받고 있다.
이에 본 연구는 BIBFRAME 데이터의 온톨로지적 의미 구조를 지식그래프와 AI 검색 기술과 결합하여 실제 정보 탐색 과정에 활용하는 방안을 제시하고자 하며, 이를 통해 BIBFRAME 데이터를 단순히 링크드 데이터 형태로 발행하는 수준을 넘어, 지식 기반 정보 탐색 환경에서 활용 가능한 데이터 구조로 확장하는 가능성을 검토한다는 점에서 학술적 의의를 지닌다.
이러한 연구 결과는 향후, 도서관이 구축해 온 서지 데이터를 바탕으로 BIBFRAME 데이터 환경에서 지능형 도서관 검색 서비스를 설계하고 구현하기 위한 기초 자료로 활용될 수 있을 것으로 기대된다.
연구요약
(한글 2000자 이내)
본 연구는 국내 단위도서관 환경에서 BIBFRAME 데이터의 온톨로지적 특성을 기반으로 GraphRAG 기반 AI 검색 기법의 적용 가능성과 실제 서비스 구현 가능성을 검토하는 것을 목적으로 한다. 이를 위해 KORMARC 기반 서지데이터를 BIBFRAME 구조로 변환하고, 이를 기반으로 서지 지식그래프를 구축한 후 지식그래프와 대규모 언어모델을 결합한 BIBFRAME AI 검색 모델을 구현하고 그 성능과 적용 가능성을 평가한다.
먼저, 데이터 수집 및 전처리 단계에서는 국립중앙도서관의 KORMARC 데이터를 연구 대상으로 하며 사회과학(3XX), 문학(8XX), 역사(9XX) 분야의 단행본을 중심으로 데이터를 수집한다. 해당 분야는 번역본, 개정판, 시리즈 등 다양한 저작 간 관계가 나타나는 영역으로, 서지 개체 간 관계 표현을 분석하기에 적합한 분야로 판단하였다. 또한 저자 및 주제 개체의 식별 정확성을 높이기 위해 국립중앙도서관 전거 데이터를 함께 수집하고, Open API를 통해 데이터를 확보한다. 수집된 데이터는 필드 내 식별기호 분리, 레이블 매핑, 활용도가 낮은 필드 제거 등의 전처리를 수행하여 BIBFRAME 변환에 적합한 형태로 정제한다.
다음으로 KORMARC 데이터를 BIBFRAME 구조로 변환한다. 현재 KORMARC 데이터를 BIBFRAME으로 변환한 공개 데이터셋이 존재하지 않기 때문에, MARC21과 KORMARC의 구조를 비교 분석하고 LC의 marc2bibframe2 변환 규칙을 참고하여 변환 파이프라인을 설계한다. 변환 과정에서는 KORMARC 필드와 BIBFRAME 클래스 및 속성 간의 관계를 정의하는 규칙 기반 매핑 방식을 적용한다. 또한 일부 서지 요소가 충분히 기술되지 않은 문제를 보완하기 위하여 외부 정보원(도서정보 서비스 및 온라인 서점 메타데이터 등)을 참고하여 데이터를 보완하고. 데이터의 품질을 점검하는 과정을 거친다.
이후 변환된 BIBFRAME 데이터를 기반으로 서지 지식그래프를 구축한다. 지식그래프 구축에는 속성 그래프 데이터베이스인 Neo4j를 활용하여 저작, 표현, 주제, 저자 등 서지 개체와 개체 간 관계를 그래프 구조로 표현한다. 이를 통해 다양한 서지 개체 간 연결 관계를 기반으로 의미 기반 탐색이 가능하도록 그래프 탐색 구조를 설계한다.
다음 단계에서는 구축된 서지 지식그래프를 활용하여 GraphRAG 기반의 BIBFRAME AI 검색 모델을 구현한다. GraphRAG는 지식그래프에서 탐색된 개체와 관계 정보를 대규모 언어모델의 입력으로 활용하여 자연어 질의에 대한 검색과 응답 생성을 수행하는 구조로, 개체 간 관계와 맥락 정보를 기반으로 한 의미 기반 정보 탐색을 가능하게 한다.
마지막으로 구현된 BIBFRAME AI 검색 모델을 대상으로 정량적 성능 평가와 전문가 기반 정성 평가를 수행한다. 정량 평가는 Precision@k, Recall@k, F1-score, 응답 처리 시간 등의 지표를 활용하여 검색 성능을 측정하며, 정성 평가는 도서관 검색 서비스와 서지 데이터 구조에 대한 이해를 가진 전문가 집단을 대상으로 시나리오 기반 평가를 수행한다. 또한 평가 결과를 보완적으로 해석하기 위해 추가적인 심층 면담을 실시한다. 이러한 평가 과정을 통해 지식그래프와 AI 검색 기법을 결합한 검색 방식의 적용 가능성과 실제 서비스 구현 가능성을 종합적으로 검토한다.
키워드(Keyword)
(한글 250자 이내)
비브프레임,AI 검색,그래프RAG,지식그래프
키워드
(영어 500자 이내)
BIBFRAME,Artificial Intelligence Search,GraphRAG,Knowledge Graph

게시물 정철 / BIBFRAME 데이터의 AI 검색 기법에 관한 연구 / 2026 박사과정생연구장려금지원사업KADH / 한국디지털인문학협의회에 처음 등장했습니다.

이재열 / “동유학안”의 집단전기학적 팩토이드 데이터 구축과 TEI-XML·RDF 연계 연구 / 2026 박사과정생연구장려금지원사업

作者Baro
2026年6月13日 20:11

연구목표
(한글 2000자 이내)
● 연구 대상: 조선시대의 대표적 학술사 문헌인 『동유학안』.
● 1차 목표 – 팩토이드 기반 RDF 데이터 구축: 전통 지식 자원의 인물 관련 진술들을 팩토이드 단위로 해석하여 RDF로 설계·구축하되, 상충하는 기술들을 출처와 해석 과정의 투명성 보존 하에 병렬적으로 공존시키고 사료 층위와 해석 층위를 분리하여 기록함으로써 데이터의 과도한 사실화를 구조적으로 방지.
● 2차 목표 – 텍스트-데이터 연계 체계 수립: TEI-XML 디지털 판본을 제작하고 이를 RDF 팩토이드 데이터와 출처 추적 가능한 방식으로 연결하기 위해, 텍스트 앵커와 증거 지시자 간 안정적인 참조 체계를 설계. RDF-star 도입을 우선 검토하되 상호운용성을 위해 표준 실체화 표현과의 하이브리드 전략 병행.
● 양방향 참조 체계를 통해 구조화된 데이터와 원문 맥락 간의 즉각적 연동을 가능하게 하여 인물 지식 베이스의 탈맥락화 문제를 해결하며, 팩토이드 모델의 동아시아 학안류 문헌에 대한 최초의 체계적 적용으로서 전통 문헌학·사상사 연구를 디지털 집단전기학적 방법론으로 확장.
기대효과
(한글 2000자 이내)
● 사실화 문제의 구조적 해결: 팩토이드 방식의 이차 자료화를 통해 사료의 진술과 연구자의 해석을 명확히 분리 기록함으로써, 한국학 지식그래프 구축 과정에서 반복적으로 발생하는 사실화 문제(사료별 차이와 인코더의 해석이 생략된 채 트리플이 마치 확정된 사실인 것처럼 유통되는 현상)에 체계적으로 대응.
● 집단전기학적 비교 자료의 확보: 생몰·관직·학통·사승·지역·교유 등 다양한 범주의 정보를 동일 형식의 팩토이드로 축적하여, 집단 차원의 공통 특성과 관계망 구조를 비교 가능하게 하며, 상충 진술의 병존으로 학안류 문헌의 편찬적 성격과 가치 판단을 연구 대상으로 노출.
● 텍스트 원형 복원과 반증 가능성의 확보: TEI-XML 판본과 RDF 팩토이드의 증거 지시자 연결을 통해 사용자가 데이터에서 즉시 원문으로 복귀하여 문맥을 확인할 수 있게 함. 탈맥락화 위험을 제어하고 데이터 기반 연구의 반증 가능성을 보장하는 핵심 기제.
● 교육·전시·문화유산 인프라로의 재사용성: 팩토이드 모델은 인용과 해석의 관계를 데이터 구조로 학습시키는 인문 데이터 리터러시 교육의 사례로 기능. CIDOC CRM · Bio CRM 프로필의 활용으로 타 문화유산 지식그래프와의 연결 가능성 확대.
연구요약
(한글 2000자 이내)
연구 계획
● 텍스트 마크업 축: TEI-XML 인코딩을 편집학적 행위로 체계화. 텍스트 구조 분절, 증거 단위 설정, 전기·인명·인용·주석·서지 요소 집중 학습. 학안류 문헌 체제 맞춤 커스터마이징, 원형 전사·연구용 정규화 층위 병치, 팩토이드 참조용 텍스트 앵커·식별자 설계.
● 시맨틱 모델링 축: RDF, 온톨로지, SPARQL, 통제 어휘(SKOS), 출처 모델링(PROV-O), 사건·역할 개념(CIDOC CRM, Bio CRM) 단계 학습. 학안류 텍스트 반복 관계·사건 표현 최소 프로파일 정의 후 팩토이드와 결합.
● 변환·연동 축: TEI-RDF 연계 기술. XSLT·Python 파이프라인, RML 매핑 언어, URI 민팅, 지속 가능한 위치 지시 체계. 팩토이드 구축 반복 규칙화, 해석 개입 표현·대안 해석 병치·인코더 책임 기록을 편집 지침·예시로 문서화.

연구 내용
● TEI-XML 판본: 편·학안·인물 항목과 학파 서술의 이중 구조 위계적 포착. 인명·지명·관직·학파·저작 개체 표지 체계화, 식별자 기반 참조 설계.
● RDF 팩토이드: 인물·사건·관계를 사실로 단정하지 않고, 텍스트 특정 지점의 진술을 출처·책임 동반 주장 단위로 기록. 구성요소는 인코더, 출처 문서, 증거 지시자, 해석 결과. 관계형·사건형 진술로 분기, 사건형은 CIDOC CRM·Bio CRM 사건·역할 개념 제한 차용으로 구조화.
● 구현 전략: 실체화 전통 존중, RDF-star 우선 검토, 필요 시 두 방식 병치. TEI-RDF 연계는 1차-파생 RDF, 최소 앵커+독립 구축, 병렬 공진화 세 패턴 경쟁 가설로 설정, 증거 환원성·유지보수성·자동화·다중 편찬자 수용성 기준 비교. 인코더별 네임스페이스 또는 그래프 판본 분리로 해석 차이 공존 구조화.

추진 전략
● 파일럿 단계: 특정 구간 대상 TEI 규칙, 식별자, 팩토이드 유형, RDF-star 메타데이터 패턴, TEI-RDF 연결 패턴 동시 시험. 산출물: 파일럿 TEI-XML, 파일럿 RDF 그래프, 편집 지침 초안.
● 확장 단계: 확정 규칙 적용 범위 확대. 사승·학파·관직·저술·평가 팩토이드 유형 정규화, 통제 어휘 구축. 사건·역할 모델은 맥락 의존성 높은 진술에만 프로파일 방식 제한.
● 정식화 및 공개: 문서화·배포 형식·공개 패키지 정리. TEI 판본과 RDF 그래프 연결 유지 형태로 제공, RDF-star 중심 제공 기본, 필요 시 실체화 병치 포함. 플랫폼 독립적 학술 공동체 재사용 가능 데이터·지침 목표.
키워드(Keyword)
(한글 250자 이내)
동유학안, 집단전기학, 팩토이드, TEI, XML, RDF, RDF-star
키워드
(영어 500자 이내)
Records of Eastern Confucian Scholars, Prosopography, Factoid, TEI, XML, RDF, RDF-star

게시물 이재열 / “동유학안”의 집단전기학적 팩토이드 데이터 구축과 TEI-XML·RDF 연계 연구 / 2026 박사과정생연구장려금지원사업KADH / 한국디지털인문학협의회에 처음 등장했습니다.

신은선 / AI 활용 고문헌 해석 기반 도서관 통합 메타데이터 스키마 설계 및 LOD 구현 연구 / 2026 박사과정생연구장려금지원사업

作者Baro
2026年6月13日 20:10

연구목표
(한글 2000자 이내)
본 연구는 AI를 활용한 6단계 고문헌 해석 파이프라인(원문 입력→AI 표점→AI 용어사전 초안→전문가 확정→AI 번역→전문가 번역 확정)을 통해 생산되는 구조화 지식 데이터를 기반으로, 한국 고문헌 도서관 통합 메타데이터 스키마(K-LISA, Korean Library Integrated Schema for Ancient-documents 온톨로지)를 설계하고 LOD(Linked Open Data) 시스템을 구현하는 것을 목표로 한다.
고문헌 해석 과정에서 추출되는 인물·지명·사건·관직·개념 등의 용어 정보를 국립중앙도서관 인명전거·KORCIS 서지·VIAF와 연계하여, 고문헌 해석 작업이 곧 도서관 지식 데이터 생산 인프라로 전환되는 새로운 방법론을 정립한다.
기대효과
(한글 2000자 이내)
① AI 보조 단계적 해석 방법론 정립으로 고문헌 용어 정리·번역이 재사용 가능한 구조화 지식 데이터 생산 과정으로 전환된다.
② K-LISA 통합 메타데이터 스키마를 통해 KORCIS·VIAF·Wikidata가 LOD로 연계되어 기관 간 상호운용성이 확보된다.
③ 다국어(한·영·한문) LOD 플랫폼은 일반인·연구자·사서·외국인 한국학 연구자 모두의 고문헌 접근성을 향상시킨다.
④ 구축된 구조화 해석 데이터는 향후 고전 한문 해석 전문 AI 개발을 위한 고품질 학습 데이터로 활용 가능하다.
연구요약
(한글 2000자 이내)
본 연구는 세 단계로 구성된다.
① KORCIS 원문서비스 고문헌에 6단계 AI-전문가 협업 해석 파이프라인을 적용하여 구조화 XML 지식 데이터를 생산한다.
② 해석 용어 11종을 K-LISA 온톨로지 클래스로 체계화하고 BIBFRAME 2.0·CIDOC-CRM과의 국제 표준 정렬을 통해 통합 메타데이터 스키마를 설계한다.
③ SPARQL 엔드포인트와 다국어 인터페이스를 갖춘 개방형LOD 플랫폼을 구현하여 KORCIS·Wikidata 등 국내외 데이터와 연계한다.
키워드(Keyword)
(한글 250자 이내)
고문헌, AI 보조 해석, 도서관 전거 데이터, 통합 메타데이터 스키마, 링크드 오픈 데이터, K-LISA 온톨리지, 디지털 인문학
키워드
(영어 500자 이내)
Classical Documents, AI-Assisted Interpretation, Library Authority Data, Integrated Metadata Schema, Linked Open Data, Korean Library Integrated Schema for Ancient-documents ontology, Digital Humanities

게시물 신은선 / AI 활용 고문헌 해석 기반 도서관 통합 메타데이터 스키마 설계 및 LOD 구현 연구 / 2026 박사과정생연구장려금지원사업KADH / 한국디지털인문학협의회에 처음 등장했습니다.

❌