[채용] 전임 / 한성대 / 문학과 대중 서사 기반 K-콘텐츠
창의융합대학 문학문화콘텐츠학과
(필수) 해당 분야 박사학위 소지자
(우대) AI+X 융합 연구 실적 보유

게시물 [채용] 전임 / 한성대 / 문학과 대중 서사 기반 K-콘텐츠이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.
창의융합대학 문학문화콘텐츠학과
(필수) 해당 분야 박사학위 소지자
(우대) AI+X 융합 연구 실적 보유

게시물 [채용] 전임 / 한성대 / 문학과 대중 서사 기반 K-콘텐츠이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.
Humanitext Reader is a multilingual parallel reader for the Greek and Latin classics. It presents the original text alongside translations in four languages (Japanese, English, Chinese, and Korean), sentence by sentence, with dictionary look-ups and notes on grammar and syntax. More than a reading tool, it is a participatory library where readers improve the texts together through discussion and error reports.
https://humanitext.ai/apps/reader
Humanitext Reader is an online library for reading the classics of ancient Greek and Latin. It is built for readers who cannot read the originals directly: the source text and translations in four languages — Japanese, English, Chinese, and Korean — are displayed side by side, one sentence at a time, with notes on syntax and usage. Beyond reading, it is a participatory library that improves its texts through dialogue among readers and through error reports.
One idea runs through everything: to open the classics to everyone.
The library currently holds 921 works by 93 authors — roughly 1.8 million sentences across all languages, in four display languages. The originals are Greek (grc) and Latin (lat); the display languages are Japanese, English, Chinese, and Korean.
/read/<urn>?c=<comment_set_id>).The originals are based on canonical TEI corpora such as the Perseus Digital Library and Open Greek and Latin, with the source and original licence (CC BY-SA 3.0 or 4.0) shown on each work page. In keeping with ShareAlike, the original texts on this site are also provided under CC BY-SA 4.0. The translations and notes in each language are AI-generated artifacts, separate from the original text.
Humanitext Reader is a new way into the world of the classics — read together, one sentence at a time, and made better by the community that reads it.

게시물 Humanitext Reader이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.
2027학년도 봄학기 KAIST 디지털인문사회과학부 대학원 신입생을 모집합니다.
많은 관심과 참여 바랍니다.
*온라인 입시설명회: 2026.06.18(목) 17:00
→ 사전등록 신청: https://bit.ly/4uCXXUF
* 디지털인문사회과학부 입학안내(지원서 작성 및 전형 관련): https://ghss.kaist.ac.kr/pages/sub/sub05_01

게시물 2027학년도 봄학기 KAIST 디지털인문사회과학부 대학원 신입생 모집이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.
한국디지털인문학협의회가 발행하는 학술지 <디지털인문학>(Korean Journal of Digital Humanities) 제3권 제1호, 2026년 5월호가 AccessON을 통해 공개되었습니다. 이번 호에는 AI 시대의 역사연구와 디지털 문헌학, 조선 의학 지식의 데이터 모델링, 문학·영화 수용 분석, 신문 텍스트 데이터 수집 워크플로, 디지털 인문학 인터뷰 등 총 5편의 글이 수록되었습니다.
원문목록: AccessON KJDH Vol.3 No.1
<디지털인문학> 3권 1호 논문 목록
The Korean Association for Digital Humanities is pleased to announce the publication of Korean Journal of Digital Humanities, Vol. 3, No. 1, May 2026. This issue features five contributions on AI-era historical research, digital philology, data modeling for Joseon medical texts, computational reception analysis, text-data collection workflows, and an interview on digital humanities.
All articles are available open access through AccessON: https://accesson.kr/kjdh/v.3/1/2026

게시물 『디지털인문학』 3권 1호 발간 안내 (KJDH Vol.3, No.1)이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.
https://find.xn--gt1b.xyz/search
중세 한국어와 근대 한국어, 석독구결을 포함한 텍스트 약 1,000개를 망라한 말뭉치를 검색해보세요.

게시물 한국어 역사 말뭉치 DB, ‘ᄎᆞ자쎠’이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.
한국중국어교육학회 회원 여러분께
안녕하십니까, 회원 여러분.
항상 한국중국어교육학회에 보내주시는 관심과 성원에 감사드리며, 회원 여러분의 건강과 학문적 발전을 진심으로 기원합니다. 한국중국어교육학회에서는 중국어 교수자의 전문성 강화와 AI 활용 역량 제고를 지원하고자 『2026년 여름방학 특강』을 마련하였습니다.
[특강 개요]
■ 프로그램 안내 링크 : 중국어교육학회 하계방학 AI 역량 집중 프로그램 2026
https://aicourse.up.railway.app/index.html
■ 프로그램명 : AI 역량 집중 프로그램 – 중국어 교육의 미래를 설계하다
■ 일시 : 2026년 6월 27일(토)~28일(일), 오전 10시~오후 5시
■ 대상 : 한국중국어교육학회 2026 연회비 납부한 회원 혹은 평생회원(선착순 30명)
■ 회원 가입 및 연회비 납부 안내
회원 가입 : https://kacle.jams.or.kr/co/main/jmMain.kci
연회비 : 3만 원
평생회비 : 30만 원(평생회비 납부 회원은 연회비 납부 면제)
입금 계좌 : 토스뱅크 1001-6993-9125 (예금주: 구현아)
※ 입금 시 입금자명을 “홍길동 연회비” 형식으로 기재해 주시기 바랍니다.
■ 수업 방식 : Zoom을 활용한 온라인 실시간 강의
※ 접속 주소는 참가 신청자에 한해 추후 안내 예정
이번 특강은 한국외국어대학교 박정원 교수님을 모시고 「AI 역량 집중 프로그램 – 중국어 교육의 미래를 설계하다」를 주제로 진행됩니다. 2026년 6월 27일(토)과 28일(일) 양일간 운영되며, 급변하는 교육 환경 속에서 중국어 교육의 새로운 방향을 모색하고 교수 역량을 한층 높일 수 있는 뜻깊은 시간이 될 것으로 기대합니다.
특강은 Zoom을 활용한 온라인 방식으로 진행되오니, 여름방학 기간 중에도 회원 여러분의 많은 관심과 적극적인 참여를 부탁드립니다.
[신청 안내]
■ 신청 기간 : 2026년 6월 4일(목) ~ 10일(수)
■ 신청 방법 : 첨부된 참가신청서를 작성하여 chinedu@hanmail.net으로 제출
기타 문의사항은 chinedu@hanmail.net으로 연락해 주시면 성심껏 안내해 드리겠습니다.
회원 여러분의 건강과 학문적 성취를 기원하며, 이번 특강에서 뜻깊은 배움과 교류의 시간을 함께 나누기를 기대합니다.
감사합니다.
한국중국어교육학회 드림
게시물 [특강] 중국어교육학회 하계방학 AI 역량 집중 프로그램 2026 @한국중국어교육학회 2026.06.27.-28.이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.
한국고전번역학회 회원 여러분께안녕하십니까? 한국고전번역학회입니다.
오는 6월 26일(금) 한국고전번역학회와 한국고전번역원이 공동 주최하는 제34회 기획학술대회가 열립니다.
일시 : 2026년 6월 26일(금) 13:00~18:00
장소 : 한국고전번역원 대강당(지하 1층)
기획주제 : AI시대 고전번역과 교육
행사의 세부 일정은 다음과 같습니다.

학술대회와 관련하여 궁금하신 점은 본 메일 혹은 아래의 번호로 언제든 연락주시기 바랍니다.
총무이사 이남면 : 010-9193-8252
총무간사 송주영 : 010-9427-2112
회원 여러분의 많은 관심과 참여를 부탁드립니다.
감사합니다.
한국고전번역학회 배상.
게시물 [학술대회] AI시대 고전번역과 교육 @한국고전번역학회 2026.06.26.이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.
한국학중앙연구원 디지털인문학연구소에서 2026년 8월 19일(수)부터 20일(목)까지 이틀간 개최하는 ‘2026 디지털인문학 여름교실’ 워크숍 공지입니다. 관심 있는 분들의 많은 참여를 바랍니다.
자세한 사항은 아래 링크 참고
https://digitalhumanities.kr/2026/05/21/summer-school.html
본 워크숍의 수강 신청은 아래의 구글 폼(Google Forms)을 통해서만 접수를 받습니다.

게시물 2026 디지털인문학 여름교실 워크숍이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.
Guest editors: Amanda Licastro, Ben Lee, Julia Flanders, Vanesa Cañete Jurado, Nirmala Menon, John Walsh, Haining Wang, Joel Lee, Doreen Chen
Abstracts due: August 1, 2026
Digital Humanities Quarterly invites abstracts for a special issue devoted to the topic of artificial intelligence (AI) in relation to digital humanities pedagogy. Though AI-based approaches to the digital humanities have been a part of the field for decades, recent years have seen an explosion of methodologies utilizing AI, and of critical discussion concerning the implications for digital humanities pedagogy. Abstracts are due August 1, 2026 to editors@digitalhumanities.org. Please use the subject header: “DHQ AI Pedagogy Special Issue.”
We are interested in a wide-ranging view of AI in the digital humanities pedagogical context, including:
Submissions should meet the following requirements:
We ask that prospective authors submit 500-word abstracts for review by August 1, 2026. Authors will be notified in November 2026 and invited to submit full papers by March 2027, which will be peer reviewed. A full timeline will be provided to authors upon the invitation to contribute a full paper.
For questions related to this call, please contact the DHQ editors at: editors@digitalhumanities.org. Please use the subject header: “DHQ AI Pedagogy Special Issue.”
Past CFPs can be found in our CFP archive.
https://dhq.digitalhumanities.org/submissions/cfps.html

게시물 [CFP] Artificial Intelligence and Digital Humanities Pedagogy (DHQ)이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.
일시 : 2026.06.04 – 05
장소 : 경북대 인문한국진흥관 학술회의실
기조강연

게시물 [학술대회] 경계를 넘어: AI와 인문학이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.
□ 사업 개요
◦ (사업명) 인문사회 대학기초연구소지원 사업
◦ (추진근거) 「고등교육법」제7조, 「학술진흥법」제5조 등
◦ (사업목적) 거점국립대학의 기초학문 보호 역할 등을 고려하여, 지역 내 연구 거점 기반 마련 및 신진 연구인력 양성, 기초·융복합 연구소 육성
◦ (지원대상) 지역 거점국립대학
◦ (지원내용) 대학 내 지역 ‘인문사회 연구원’을 설립하여, 연구소 관리체계 구축, 학문후속세대 양성, 지역대학 등과 공동연구 수행
◦ (지원기간) 총 5년(3+2년)
◦ (지원예산/규모) ’26년 총 120억 원 / 총 3개교
– 교당 연간 40억 원 이내(간접비 포함) ※ 대학에 총액으로 교부
□ 주요 추진 내용
◦ (인문사회 연구원 설립·운영) 대학의 자율적 인문사회 분야 연구소 관리·지원 체계 확립 및 지역 내 학술 연구플랫폼 기능 수행
※ ▴연구소의 개편․조정(확대, 통합, 신설 등), ▴현황 조사․공개, ▴연구소 운영 실적 평가 및 운영 지원, ▴지역 내 공동연구 및 협력 확대 등
◦ (지역 정주형 연구 인력 양성) 인문사회 연구원을 통한 안정적인 연구 환경 제공과 연구 지원 강화 등으로 우수 연구 인력 유입 및 양성
※ 전임교원의 연구 몰입 및 성과 창출을 위한 다앙한 학내 제도·방안 마련, 인문사회 연구원당 20명~30명(초과 가능)의 학술연구교수 채용 및 활용 의무를 통해 지역 일자리 확보·지원
◦ (기초·융복합 연구 강화) 연구원 산하 연구소의 기초·융복합(중점 주제) 연구 지원을 통한 기초학문 보호·육성 및 연구 성과의 사회적 기여 강화
※ 대학별 특성화 연구를 수행하기 위한 ‘중점 주제 연구소’를 자율적으로 지정(2개 이내)하고, 연구 인력(지역 내 타 대학 인력 포함하여 지역 공동연구 수행) 및 연구비 지원(사업비 20% 이상)



게시물 2026년 인문사회 대학기초연구소지원 사업 선정대학(경북대, 전남대, 전북대) 주요 계획이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.
https://faculty.yonsei.ac.kr/opening.php?mid=m02&lang=ko&uid=242&act=view
| 영어영문학 | 영미시 (18C & 19C 영시 제외) / 수사학 | 1 | ||
| 영미문화연구 / 영미비평이론 / 디지털인문학(영문학 중심) | 1 | |||

게시물 [채용] 전임 / 연세대 영어영문학과 / 디지털인문학이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.
인하-KADH 디지털인문학·AI융합연구 석학 특강
강연자 : Mark Algee-Hewitt (스탠퍼드 리터러리 랩)
“스칼라 읽기: Interpreting Quantitative Evidence with Critical Meaning”
일시 : 2026년 6월 1일 오후 4-6시
장소 : 인하대 60주년 기념관 112호 Creative Space
공동주최 : 인하대 인문AI융합연구소/디지털인문학연구센터/한국학연구소, 한국디지털인문학협의회
문의 : 윤미선 교수(msy207@inha.ac.kr)
참가신청:
https://docs.google.com/forms/d/e/1FAIpQLSemL37nXjEJelOiYTeCfYTzTbD_qxescRoPAozw2_kZ-k-l6g/viewform
ZOOM
https://inha-ac-kr.zoom.us/j/85264681657?pwd=jSWNqkP2HUyL1o2sYQ31tvBw4NHQZD.1
회의 ID: 852 6468 1657
암호: 958578

게시물 [특강] 스칼라 읽기: Interpreting Quantitative Evidence with Critical Meaning (Mark Algee-Hewitt)이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.
연구요약문
연구목표
(한글 2000자 이내)
시 창작에서 DeepSeek는 중국 시학(詩學) 코퍼스를 기반으로, 사용자의 지시에 따라 시를 생성하는 창작기제를 무상으로 제공하는 중이다. 이 시스템은 대규모 언어 데이터에 포함된 지역 세대 성별 감정 언어와 어휘 습관을 학습함으로써, 중국 고전시로부터 현당대시에 이르는 다양한 시 양식을 모방해낸다. 나아가 DeepSeek를 비롯한 생성형 AI의 다중모달(multimodal) 기술은 사용자가 제시하는 감각적 정서적 정보와 기계의 연산 판단을 결합시키는 ‘상호작용적 창작(interactive co-creation)’의 조건을 갖추게 되었다.
본 연구는 인간의 전유물로 여겨져 왔던 문학이 AI의 등장으로 ‘인간문학’과 ‘AI문학’으로 분화되어 가는 현실 상황에 주목한다. 인간이 수 천 년에 걸쳐 축적해 온 문학 경험을 AI가 학습하여 생성한 시를 예술로 규정할 수 있는지, 그리고 그것의 예술적 성과는 어떤 기준으로 평가해야 하는지 등을 본격적으로 논의해야 하는 지금이야말로 ‘인간문학’과 ‘AI문학’이 분리되기 이전의 과도기적인 협업 단계라고 보기 때문이다.
중국의 AI 시 창작은 2014년 마이크로소프트 아시아연구소(Microsoft Research Asia)가 개발한 ‘샤오빙(小冰)’으로 말미암는다. 2017년, 마이크로소프트는 샤오빙의 시를 모아 첫 시집 《햇살은 유리창을 잃고(陽光失了玻璃窗)》(이하 《햇살》)을 출간하게 된다. 《햇살》은 샤오빙이 1920년대 이후에 발표된 519명의 중국 현대시 작품을 학습한 뒤 감정 서사와 시적 이미지를 결합해 산출한 결과물로서 작품의 문법적 오류와 의미의 연쇄 논리적 연결의 불완정성 등이 한계로 지적되었다. 일각에서는 이 한계를 샤오빙을 설계한 엔지니어들이 학습 대상인 신시(新詩)의 미학적 특성을 충분히 이해 모델링하지 못한 데서 발생한 알고리즘 설계의 문제로 인식하기도 한다.
이러한 한계는 DeepSeek 이후 일정 부분 보완되는 양상을 보이기도 한다. 훠준밍은 샤오빙을 비롯한 초기 시 생성 AI가 작품 수준이 높지 않아 비판을 받았던 데 비해, DeepSeek는 시 모방 능력과 비평 능력, 그리고 알고리즘 수준 등이 높아서 인간 시 창작의 주요 특징들을 정교하게 인식 구현한다고 주장한다. 반면 시인 위졘(于坚)처럼 AI의 본질은 데이터 분석과 재조합에 있으므로 기존 텍스트를 모방 재배열하는 산출을 진정한 의미의 시 창조로 볼 수 없으며, 그런 의미에서 “딥시크는 시인이 아니라 지식인일 뿐”이라고 규정하는 입장도 있다. 그럼에도 평가의 다양한 갈래 모두는 새로운 도구의 출현이 시가장에 구조의 변화를 유발하고 있음을 긍정하는 바다.
본 연구는 샤오빙과 DeepSeek를 중심으로 AI 시 창작과 비평, 그리고 인간-AI 협업이 중국 시가장에 어떠한 변화를 가져오고 있는지를 분석하고자 한다. 이를 위하여 첫째, 중국 AI 시 창작의 출현과 발전 과정을 정리한다. 둘째, DeepSeek를 비롯한 생성형 AI의 시 생성 메커니즘과 그 시학 특징을 분석한다. 셋째, ‘협업’ 단계의 도래가 창작 주체의 개념, 비평 기준, 문학 권위의 구조, 그리고 작품 판별 및 검증의 장치를 어떻게 재편하는지 살펴본다. 그럼으로써 AI 시대 중국 시의 새로운 창작 질서와 시학 협업의 가능성을 전망하고자 한다.
기대효과
(한글 2000자 이내)
첫째, 본 연구는 AI 창작을 둘러싼 논의를 AI 시의 의의와 문학장 구조 분석의 대상으로 전환시키는 데 기여한다. 샤오빙과 DeepSeek의 사례를 통해 AI가 시의 창작 방식, 비평 주체, 문학 권위의 구조를 재편하는 실질적인 역할을 하고 있음을 입증함으로써 AI 시 연구의 기초를 마련한다.
둘째, 이미지 기반 생성에서 대규모 언어모델 기반 생성으로 이어지는 AI 시 창작 메커니즘과 그 변화를 분석함으로써 AI 시의 특징과 한계를 구명한다. 이를 통해 기존 연구가 주로 지적한 문법 오류나 의미 공백을 신시(新詩) 미학과 알고리즘 설계 사이의 긴장 관계로 재해석할 수 있는 분석의 틀을 마련한다.
셋째, DeepSeek가 시 생성과 함께 시인 선정, 작품 평가, 비평 담론의 생산 등을 수행하고 있는 점에 주목함으로써 AI가 문학장의 비평 주체로 진입하는 현상을 확인한다. 이는 시 창작과 비평을 분리해 온 기존 문학 연구의 관점을 재검토하게 하고, 인간 비평가의 역할 변화와 새로운 협업 모델에 대한 논의의 출발점이 될 것이다.
연구요약
(한글 2000자 이내)
본 연구는 샤오빙과 DeepSeek를 중심으로 AI 시 창작과 비평, 그리고 인간-AI 협업이 중국 시가장에 어떠한 변화를 가져오고 있는지를 분석하고자 한다. 이를 위하여 첫째, 중국 AI 시 창작의 출현과 발전 과정을 정리한다. 둘째, DeepSeek를 비롯한 생성형 AI의 시 생성 메커니즘과 그 시학 특징을 분석한다. 셋째, ‘협업’ 단계의 도래가 창작 주체의 개념, 비평 기준, 문학 권위의 구조, 그리고 작품 판별 및 검증의 장치를 어떻게 재편하는지 살펴본다. 그럼으로써 AI 시대 중국 시의 새로운 창작 질서와 시학 협업의 가능성을 전망하고자 한다.
가. 샤오빙 시의 특징과 언어 결합 양상(샤오빙)
마이크로소프트 아시아연구소는 2017년 《햇살》을 간행한 데 이어, 2019년에는 두 번째 시집 《꽃은 푸른물의 침묵(華是綠水的沈默)》(이후 《꽃은》)을 출판하였다. 《꽃은》은 샤오빙이 이미지를 인식해 생성한 시 초안을 바탕으로 아마추어 시인이 이를 수정 보완한 6천여 편의 응모작 중에서 200편을 선별해 엮은 시집으로, ‘인간-AI’ 협업이라는 창작 방식을 실현한 사례라 할 수 있다. 샤오빙의 시는 인간 언어 형식을 모방하려는 지향을 보인다. 하지만 실제 수행 과정에서는 불완전한 언어 결합 양상을 드러내기도 한다. 현대 중국어의 어법 규범에 부합하지 않을 뿐 아니라, 이미지 간의 연상과 서술 논리를 단절시키는 경우가 다수 발견된다. 이러한 언어적 결함은 샤오빙의 이미지 기반 시 생성 방식과 연관되어 있다. 예를 들어, ‘가을비 속 낙엽’이 담긴 이미지를 입력하면, 시스템은 그 안의 ‘나뭇잎’, ‘빗방울’, ‘시들고 노란색’ 등 시각적 요소를 자동으로 추출하고, 이를 의미 단위로 변환하여 시 생성 모듈에 전달한다. 시 생성 단계에서는 ‘나뭇잎’이 ‘시든 덩굴’, ‘늙은 나무’, ‘졸린 까마귀’로, ‘빗방울’은 ‘폭우로’, ‘시들고 노란색’은 ‘외로움’ 혹은 ‘고독’ 등 어휘로 치환되어 다양한 조합을 생성하게 된다. 이러한 결함은 시 장르의 특수성 속에서 정서의 그럴듯함으로 해석되기도 한다. 샤오빙의 시는 개별 문장의 완결성이나 논리성에서는 한계를 보이지만, 감정 서사에 강하여 독자에게 일정 수준의 정서적 설득력을 제공하기 때문이다.
나. 대규모 언어모델 기반 시 생성과 비판(DeepSeek)
DeepSeek 시의 특징은 다음과 같다. 첫째, 즉시 생성이다. 사용자가 입력을 주는 즉시, AI는 사전에 학습된 언어⦁이미지 패턴을 기반으로 시를 산출해 낸다. 시의 즉시 생성은 창작 과정에서 ‘시간’이 차지하는 의미를 근본적으로 변화시킨다. 이는 장기간의 학습과 해석 과정을 필요로 하는 작업이다. 반면에 AI는 이러한 과정을 생략하고 이미 학습된 대규모 언어모델을 통하여 시간이 압축된 창작을 수행하게 된다. 창작 행위가 더 이상 ‘시간의 예술’이 아니라, ‘지시’와 ‘응답’의 즉각적인 상호작용으로 전환하는 것이다. 둘째, 반복 학습의 가능성이다. 기존의 데이터가 충분히 학습되어 있지 않은 경우에도 사용자가 주제나 형식을 반복적으로 제시하고 그 결과물에 피드백을 제공하면, AI는 이를 반영하여 정제된 결과를 산출하게 된다. 생성형 AI의 시 쓰기는 결과물의 산출에 그치지 않고, 이용자의 지시와 피드백을 계속 반영하면서 시의 질적 수준을 높여가는 창작 과정을 보여주기도 한다. AI의 즉시성과 반복 학습이 질 높은 시 창작에 기여하기 위해서는, 그것의 계속적인 생성 가능성이 이용자 자신의 문학적 기준과 미적 판단에 의지해야만 한다.
그런 의미에서 현시점의 인간-AI 관계는 ‘활용’ 단계로부터 ‘협업’ 단계로 전환중이다. 사용자는 AI 산출 결과에 피드백을 제공하고 수정과 재생성을 반복함으로써 자신의 미적 목적을 향해 나아간다. 이 과정은 인간과 AI가 상호 응답을 거듭하며 작품을 함께 창작해 가는 과정이기 때문에 양자 간의 대화는 질의응답에 머무는 것이 아니라 인간의 창의적 의도와 기계의 계산이 결합된 ‘공동 구성(co-construction)’의 실현이 될 수밖에 없다.
키워드(Keyword)
(한글 250자 이내)
AI, 중국 시, 샤오빙(小冰), DeepSeek, 인간문학, AI문학, 협업, 창작, 비평
키워드
(영어 500자 이내)
AI, Chinese Poetry, XiaoIce, DeepSeek, Human Literature, AI Literature, Collaboration, Creation, Criticism
게시물 김민정 / 서울대학교 / 생성형 AI 시대의 시가장(詩歌場) 재편 – 샤오빙(小冰), DeepSeek를 중심으로 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.
연구요약문
연구목표
(한글 2000자 이내)
본 연구는 대규모 언어모델(LLM)에게 詩話 지식과 비평문(평어) 데이터를 학습시켜 고전시 비평 언어를 가르치는 방법론을 제시한다. 시화는 시론부터 시인에 대한 평가 등 시와 시인에 대한 정보들을 가지고 있는 문헌이며, 시 비평문은 함축적인 비평어로 작성되어 있어 전문 연구자도 이해하는 데 많은 시간과 노력이 필요한 자료지만, 이는 모두 고전시를 이해하는 데 직접적으로 도움이 되는 정보다. 그러나 현대인들이 이러한 문헌들을 모두 읽는 것이 사실상 불가능하고, 현대 언어를 주로 학습한 LLM을 도움을 받더라도 LLM은 이러한 정보 없이 시를 해석하기 때문에 시를 이해하는 데 어려움을 겪는다.
이를 해결하기 위하여 본 연구는 시화 데이터와 비평문 데이터를 언어모델에 학습시켜 고대 비평 언어를 내재화시켜 고대 비평가의 관점에 보다 가까이 접근하는 방법을 제시한다. 이를 통해 시화 지식이 고전시를 이해하는 데 얼마나 도움이 되는지를 검증하고 비평문이 없는 시 작품에 대하여 비평문을 생성하여 시 감상에 이해를 돕는다.
본 연구는 AI 시대에 고전문학 분야의 구체적인 문제를 기술로 해결하는 방법을 제시한다. 이는 향후 고전시 학습을 위한 AI 보조 도구를 개발하는 데 기반이 되는 연구로서 고전시에 대한 진입장벽을 낮추고 인문학과 AI 기술의 융합 연구의 모범 사례가 될 것이다.
기대효과
(한글 2000자 이내)
(1) 학제 간 협업 촉진
본 연구와 같이 고전시 지식과 AI 기술을 융합한 연구의 성과를 인공지능 관련 분야의 학회에서 발표하게 된다면, 공학 연구자들까지 고전시를 잠재력 있는 연구 분야로 인식하고 학제 간 협업이 활성화될 수 있다. 나아가 기술 분야에서도 고전시 연구자가 자연스럽게 양성되어 연구자가 부족한 현실적인 문제까지 해결할 수 있다.
(2) 기술 방법론의 확장 및 후속 연구 촉발
본 연구는 고대 중국시 비평에 한정하였으나 서양의 작품에도 적용 가능하다. 현대어로 쓰인 문학 작품이라면 LLM의 정교한 임베딩을 활용하여 더 고품질의 결과를 얻을 수 있을 것이다. 본 연구를 재현 가능하도록 만들기 위해 깃허브에 코드를 공개할 예정이므로 다른 연구자들이 이를 자신의 연구에 사용할 수 있다.
(3) 교육 현장 및 인문학 시장에서 선도
본 연구는 현재 기술의 수준을 파악하고 인문학자들의 판단이 필요한 지점을 고찰하여 AI 시대에 인문학을 어떻게 교육하고 학습해야 하는지 논의의 토대를 세운다. 연구 종료 후에는 훈련된 AI 모델을 대학이나 일반인 교육 기관에서도 교육 보조 도구로 사용할 수 있다. 이를 통해 개인 학습자들도 시 감상에 도움을 받아 고전시의 진입장벽이 낮아지는 효과를 거둘 수 있다.
연구요약
(한글 2000자 이내)
(1) 데이터셋 수집 및 전처리
비평문 데이터는 각 시인의 서적에서 직접 추출한다. 詩話 데이터는 중국 고전시 전문 디지털 아카이브인 搜韻에서 제공하는 총 93종을 사용한다. 시–비평문 데이터는 비평문이 함께 수록된 출판물을 대상으로 수집하며, 당송대 주요 시인의 작품 가운데 비평이 확인되는 작품 3,000편을 확보하는 것을 목표로 한다.
(2) 데이터 탐색적 분석(EDA)
전처리를 통해 정제된 비평문 데이터 및 시화 데이터에 대하여 전통적인 텍스트 마이닝 기법을 활용하여 탐색적 분석을 수행한다. 자주 등장하는 비평 용어를 추출하고, 연구자의 검토를 거친다. 추출된 비평 용어들은 전문 비평 서적을 참조하여 그 의미와 용례를 검토한다.
(3) 모델에게 지식 학습
첫 번째 단계는 지속적 사전학습(Continual pre-training. CPT)를 사용하여 시화 데이터의 언어적 특성과 지식을 모델에게 가르치는 것이다. 두 번째 단계에선 시-비평문 데이터를 모델에 지도 미세조정(Supervised Fine-tuning. SFT)시킨다. 이때 테스트 데이터는 별도로 분리하여 이후 진행될 평가 단계에서 사용하고 학습에는 학습 데이터셋만 사용한다. 지도 미세조정은 일반 미세조정(full fine-tuning)과 LoRA 두 가지 방식으로 실험한다. 정량적 평가 지표는 s-bert 기반의 코사인 유사도를 사용한다. 이는 길이에 무관하며 전체 의미를 파악한다는 점에서 본 연구의 데이터의 특성에 적합하다. BERTScore는 핵심 비평어가 포함되어 있는지 확인하기 위해 재현율로 판단할 것이다. 정성적 평가 지표는 LLM-as-a-judge를 활용한다.
(4) 조합 비교(Ablation Study)
본 연구의 가설을 검증하기 위해 방법론을 조합하여 비교 실험을 수행한다. 각 조합에 테스트 데이터셋을 적용하고 평가 지표로 성능을 측정한다. 각 조합은 Baseline, Baseline + CPT, Baseline + SFT, Baseline + CPT + SFT으로 구성된다.
(5) 비평 추론 방법론을 연구한 논문 집필 및 학술 대회 참가 준비
최종 실험 성과는 학술 대회에 참가하여 발표할 예정이다. 무엇보다도 학제 간 연구자들과 학술적인 교류를 통해 인문학과 인공지능의 융합 연구 가능성을 제시하는 것이 학술대회 발표의 가장 중요한 목적이다.
(6) 클라우드 서비스의 활용
모델 학습 단계에서는 안정적인 고성능 GPU 환경이 필수적이다. 고성능 GPU를 직접 구매하기에는 개인 연구자가 감당하기 어려운 수준이기에, 클라우드 서비스를 활용하여 필요한 시점에만 GPU를 사용해서 다소 경제적인 비용으로 실험을 진행하고자 한다.
(7) 연구의 한계점
고대 중국어는 극도로 자원이 부족한 희소 언어로서 가장 좋은 방법론을 찾더라도 완벽한 성능을 기대하기는 어렵다. 그러나 희소 언어 환경을 극복하는 방법들이 활발하게 개발되고 있으므로 본 연구 또한 기술적 발전과 함께 성능이 개선될 가능성이 크다.
키워드(Keyword)
(한글 250자 이내)
중국고전시, 문학 비평, 시화, 지속적(계속적) 사전 학습, 지도학습 미세조정, 희소 언어, 대규모 언어모델
키워드
(영어 500자 이내)
Chinese classical poetry, Literary Criticism, Shi-hua, Continual Pre-training, Supervised Fine-tuning, Low-resource Language, Large Language Model
게시물 이다연 / 한국연구재단 / 중국 고전시 비평 언어에 대한 AI 학습 방법론 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.
연구요약문
연구목표
(한글 2000자 이내)
본 연구의 목적은 서로 다른 문학 사조가 단일 텍스트 내부에서 어떻게 공존하고 분포하는지를 분석할 수 있는 방법론을 구축하는 데 있다. 이를 위해 트랜스포머 기반 딥러닝 언어 모델인 Sentence-CamemBERT를 활용하여 19세기 프랑스 소설 스탕달(Stendhal)의 『적과 흑』(Le Rouge et le Noir)과 귀스타브 플로베르(Gustave Flaubert)의 『보바리 부인』(Madame Bovary)에 나타난 낭만주의와 사실주의의 혼재 양상을 정량적으로 가시화하고, 그 결과를 질적 해석과 통합하고자 한다.
19세기 프랑스 소설은 낭만주의에서 사실주의와 자연주의로 이어지는 흐름 속에서 전개되었으나, 개별 작품들은 단일 사조로 환원되기 어려운 복합적 미학 구조를 보여준다. 『적과 흑』은 주인공의 열망과 사회 현실에 대한 관찰이 교차하는 서사를 통해 낭만주의적 정념과 사실주의적 인식이 중첩되는 양상을 보여준다. 『보바리 부인』 역시 사실주의적 재현 속에 낭만주의적 욕망을 내면화한 주인공을 제시함으로써 서로 다른 미학적 경향이 공존하는 텍스트로 평가된다. 그러나 기존 연구는 주로 면밀한 텍스트 분석에 기반한 질적 해석에 머물러 있어, 사조적 특징이 텍스트 내부 어느 지점에서 강화되거나 약화되는지, 그리고 어떠한 분포와 변화를 보이는지를 체계적으로 검토하는 데 한계가 있었다. 이에 본 연구는 언어 모델 기반 임베딩을 활용하여 소설 내부에서 서로 다른 사조적 경향이 어떻게 분포하고 이동하는지를 계량적으로 분석하고자 한다. 본 연구의 구체적인 목표는 다음과 같다.
첫째, 낭만주의와 사실주의에 충실한 전형적 텍스트를 선정하고, 언어 모델 기반 임베딩을 통해 문학 사조 앵커 벡터(literary movement anchor vectors)를 구축한다. 이를 통해 『적과 흑』과 『보바리 부인』에 나타난 사조 혼재의 분포와 변화 양상을 분석하기 위한 참조 축(reference axis)을 마련한다.
둘째, 분석 대상인 두 소설을 챕터 단위로 임베딩한 뒤 각 챕터의 벡터와 사조 앵커 벡터 간의 의미적 거리를 코사인 유사도로 측정한다. 그리고 그 결과를 사조 맵(literary movement map)으로 시각화하여 챕터 단위의 사조 경향과 분포, 시계열적 변화 양상을 검토한다.
셋째, 사조 맵을 기반으로 서로 다른 미학적 경향이 강화되거나 약화되는 구간을 식별하고, 챕터 내부 임베딩 벡터의 분산(variance)을 통해 사조적 경향의 변동 정도를 분석한다. 나아가 챕터 간 서사적 전환이 나타나는 구간과 변동성이 높은 챕터를 중심으로 질적 해석을 수행함으로써 정량 분석과 질적 해석을 통합한다.
기대효과
(한글 2000자 이내)
게시물 유은순 / 가톨릭대학교 / 트랜스포머 기반 언어 모델을 활용한 문학 사조 혼재 연구 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.
연구요약문
연구목표
(한글 2000자 이내)
본 연구의 목표는 최근 급격히 발전하고 있는 거대 언어 모델(Large Language Model, LLM)을 이용하여 옛한글 자료 번역을 효율적이고 일관적으로 수행할 수 있는 “MCP(Model Context Protocol)기반 번역가-LLM 협업 번역 모델”을 제시하고 해당 모델의 성능 평가를 통해 그 효용성을 검증하는 것이다.
최근 급속도로 발전하고 있는 인공지능(Artificial Intelligence, AI) 기술은 다양한 분야와 융합하고 있으며 산업계, 학계 및 일상의 모든 영역에서 혁신적인 변화를 이끌고 있다. 특히 최근 소개된 LLM(ChatGPT, Gemini 등)은 자연어를 이해하고 생성하는 능력을 바탕으로 다양한 분야와 융합 및 활용되고 있다.
옛한글로 기록된 자료는 우리 민족의 역사, 철학, 문학, 그리고 한국어의 원형을 보여주는 중요한 문화유산이다. 그럼에도 옛한글 자료의 현대한글 번역 작업은 다른 분야에 비해서 매우 느리게 진행되고 있다. 그 이유는 옛한글 자료의 번역은 해당 분야에 대한 고도의 지식과 전문성을 요구함으로 인해 소수의 전문가들만이 이를 수행할 수 있기 때문이다.
이러한 상황에서 최근 소개된 LLM(ChatGPT 5.2나 Gemini 3 등)은 방대한 옛한글–현대한글 병렬 자료의 학습을 통해 옛한글 자료를 일정한 수준의 현대한글로 번역할 수 있는 능력을 갖추고 있다. 이는 기존에 전적으로 전문 번역가에 의존해왔던 옛한글 자료의 번역 작업에 큰 변화를 가져올 수 있는 기술적 환경이 마련된 것이다.
하지만 LLM 단독 번역의 결과는 잘못된 표기 변환 혹은 표현 변환, 옛한글 어휘의 잘못된 해석, 문맥에 맞지 않는 번역 등 아직은 부족한 점을 보이고 있다. 이는 전문 번역가가 LLM에 옛한글 자료의 번역에 필요한 적절한 지식을 제공하는 협업구조를 통해 해당 문제를 보완할 수 있다. 그리고 이러한 협업 구조를 구축하는 기술적 방법으로써 MCP(Model Context Protocol)를 활용할 수 있다.
따라서 본 연구에서는 옛한글 자료의 번역에 있어 전문 번역가와 LLM이 가진 한계점을 상호 보완함으로써 옛한글 자료 번역의 속도와 생산성을 향상시킬 수 있는 옛한글 번역을 위한 MCP기반 번역가-LLM 협업 번역 모델을 제시하고 이의 효용을 검증하는 것을 목표로 두고 있다.
기대효과
(한글 2000자 이내)
본 연구를 통해서 기대하는 학문적, 사회적 기대효과는 다음과 같다.
■ 옛한글 자료 번역과 인공지능의 융합을 통한 새로운 번역 모델 제시
기존에 전문 번역가가 전적으로 수행했던 옛한글 자료 번역을 번역가-LLM 협업 모델로 전환함으로써 번역의 속도와 생산성을 향상시키고 오류 감소 및 일관성 있는 번역 결과를 산출하는 새로운 옛한글 자료 번역 모델을 제시한다.
■ 옛한글 번역 지식 자료의 체계화 및 활용성 제고
번역 지식이 개별 연구자의 경험에 머무르지 않고 재사용 가능한 자료로 체계화 및 축적됨으로써 번역의 일관성과 효율성이 향상되며, 향후 옛한글 번역 연구 및 번역 교육에서 활용 가능한 기반 자료로 사용될 수 있다.
■ 고전어 자료 번역에 참조 모델 제공과 번역 작업의 인공지능 융합 촉진
전문 번역가와 LLM의 협업을 체계화한 번역 모델을 제공함으로써, 옛한글 자료의 번역에서 뿐만 아니라 고전어 자료 번역 분야 전반에서 활용 가능한 참조 모델을 제시하고, 고전어 자료 번역 연구에 인공지능의 융합을 촉진한다.
■ 옛한글 자료의 현대한글 번역 자동화를 통한 인문학 대중화 촉진
옛한글 자료의 대규모 현대한글 번역은 일반인들도 쉽게 옛한글 자료를 접근할 수 있는 기회를 제공한다. 이는 인문학의 대중적 확산과 문화유산의 현대적 활용에 기여할 것이다.
연구요약
(한글 2000자 이내)
본 연구에서는 옛한글 자료의 현대한글 번역을 효율적이고 일관성 있게 수행하기 위한 MCP기반 번역가–LLM 협업 번역 모델 및 그 성능의 분석을 수행한다. 이는 전문 번역가 위주로 수행되던 기존 번역 방식의 한계성을 극복하고 거대 언어 모델(Large Language Model, LLM)과의 협업을 통해 대량의 옛한글 자료를 일관성 있게 번역할 수 있는 가능성을 증대하려는 것이 목적이다.
연구 목적을 달성하기 위해 수행할 연구 내용은 다음과 같다.
■ 첫째, 번역 지식 자료의 설계 및 체계화
옛한글–현대한글 번역의 정확성과 일관성 향상에 필요한 번역 지식(표기 변환, 전문용어의 해석, 어조 지침 등) 자료의 유형을 정의하고, 이를 LLM이 활용 가능한 형태의 자원으로 체계화하는 방법을 연구한다.
■ 둘째, MCP기반 번역가–LLM 협업 번역 모델의 설계 및 구축
구축된 번역 지식 자료는 MCP를 활용 LLM에 전달되고, LLM이 이를 참조해 번역을 수행하는 번역가-LLM 협업 번역 모델의 설계 및 구축을 연구한다.
■ 셋째, MCP기반 번역가–LLM 협업 번역 모델의 적용 및 성능 분석
구축된 번역가-LLM 협업 번역 모델을 실제 옛한글 자료 번역에 적용하여 번역의 정확성, 일관성, 그리고 재현 가능성 측면에서의 성능을 분석 연구한다.
연구 목적을 달성하기 위한 연구 방법은 다음과 같다.
■ 첫째, 번역 지식 자료 구축
전문 번역가가 번역한 옛한글–현대한글 자료와 번역가-LLM 번역 협업 과정 중에 파악되는 번역 지식을 체계적으로 표현 및 구축하는 방법을 연구한다. 또한 번역 지식 자료를 대량으로 자동 구축하기 위한 방법의 연구도 수행한다.
■ 둘째, MCP기반 번역가–LLM 협업 번역 모델의 설계 및 구축
번역 지식 자료의 구축, LLM의 번역 생성, 오류 검토 및 수정 사항의 지식 자료화 등의 과정을 순환적으로 적용하는 작업 흐름의 정립을 연구하며, 이를 바탕으로 MCP기반 번역가-LLM 협업 번역 모델의 설계 및 구축을 연구한다.
■ 셋째, 구축된 MCP기반 번역가–LLM 협업 번역 모델의 성능 분석
동일한 옛한글 자료를 대상으로 단순 LLM 번역 결과와 MCP기반 번역가–LLM 협업 번역 결과를 비교하여 정확성, 문맥 일관성, 오류 감소 정도를 분석한다. 그리고 LLM의 처리 과정을 추적하여 정량적 비교를 수행하고, 정성적 분석과 사례 분석을 병행함으로써 제안한 협업 번역 모델의 유효성과 한계점을 분석한다.
키워드(Keyword)
(한글 250자 이내)
옛한글, 번역, 인공지능, 거대 언어 모델, 모델 콘텍스트 프로토콜, 옛한글-현대한글 병렬 자료, 자연어 처리
키워드
(영어 500자 이내)
Pre-Modern Korean, Translation, Artificial Intelligence(AI), Large Language Model(LLM), Model Context Protocol(MCP), Pre-Modern Korean-Modern Korean Parallel Text, Natural Language Processing(NLP)
게시물 강남오 / 강원대학교 강릉캠퍼스 / 옛한글 자료 번역을 위한 MCP기반 번역가-LLM 협업 번역 모델 연구 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.
연구요약문
연구목표
(한글 2000자 이내)
사형은 국가가 보호하려는 최우선 가치 및 질서를 어긴 사람들에게 선고된다. 따라서 사형은 조선의 통치이념과 중요 가치가 무엇인지 알 수 있는 소재이다. 감형 기준을 설명할 때 법학에서는 일정한 기준이 있다고 설명하며, 이를 법치와 연관 짓는다. 역사학에서도 일정한 기준이 있음을 인정하지만 이를 유교적 관점으로 해석하고자한다. 즉 사형과 감형 문제는 예치주의, 법치주의 등 통치 이념 설명과도 연관된다. 또한 사형 감형은 단순히 휼형(恤刑)·애민(愛民)뿐만 아니라 국정 운영 사상 및 방식, 감형의 정당화 논리가 응축되는 지점이기도 하다. 한편 조선의 통치 철학 중 하나인 흠휼에 대해서도 단순한 수사로만 작동했는지 아니면 실제로 통계적으로 유의미한 감형의 논리로 사용되었는지는 실제 사례를 통해 분석해야 한다.
정리하면 사형과 사형 감형의 사례를 분석하는 것은 통치 이념·국정운영 방식 해명, 역모 등 정치 상황 고려 측면에서는 정치사, 법이 실제 적용되는 모습을 검토하는 측면에서는 사회사, 법과 형벌 및 법감정 검토 측면에서는 법제사의 관점에서 바라볼 수 있는 주제이다. 기존에는 특정 왕대나 자료를 중심으로 살펴봤으며, 모든 연구들이 각기 기준이 달라 통합해서 이해하기도 어려워 조선 전시기를 동일한 기준으로 분석할 필요가 있다. 그런데 개인이 모든 기록을 다 검토하기 어렵기 때문에 AI인문학 방법론으로 분석하여 조선 전 시기의 사형 및 감형 사례를 검토한 후 그 안에 담긴 역사적 맥락과 의미를 읽고자 한다. 이는 AI 시대 역사학의 방향과 역사학자의 역할을 제시해주는 기능도 할 것이다.
게시물 정연주 / 고려대학교 / 언어모델을 활용한 조선시대 사형·감형 사례 추출과 시대적 맥락 분석 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.
연구요약문
연구목표
(한글 2000자 이내)
고려시대 연구의 핵심 자료인 『고려사』와 『고려사절요』는 조선 초 여러 차례의 개수 과정을 거쳐 완성된 사서이다. 기존 연구는 이들 사서가 원전 사료를 충실히 수록했다는 점에 주목하여 묘지명 등과의 비교를 통해 찬자의 시각과 편찬 의도를 분석해 왔다. 하지만 기존의 연구 방식은 서술 양상의 대조에 치중하여 사료 간 유사성을 객관적으로 증명할 정량화된 수치가 부족하다는 한계가 있다. 또한 주로 자구 일치 여부를 확인하는 수준에 머물러 의미와 맥락 중심의 심층적 분석이 미흡하며, 분석 시기 역시 방대한 사료의 양으로 인해 고려 전 시기를 포괄하지 못했다는 문제점이 있다.
기술적 발달로 텍스트 정량화가 가능해지면서 사료 간 유사도 분석이 진행되어 왔으나, 유사도 지표는 대칭적인 성격을 띠기 때문에 사료 편찬의 계보나 방향성을 설명하기에는 역부족이다. 이에 본 연구는 커버리지(Coverage) 개념을 도입하여 이러한 단점을 극복하고자 한다. 커버리지는 한 사료의 정보가 다른 사료에 포함된 정도를 측정함으로써 사료 사용의 우선순위와 선택 및 배제 과정을 실증적으로 추론하게 한다. 이를 통해 사료 간 관계를 원사료-편찬사료-요약사료라는 계층적 구조로 재구성하고, 텍스트 공유 양상을 방향성 있는 비대칭 구조로 분석할 수 있다.
커버리지 기반 분석은 단순한 유사도 측정으로는 포착하기 힘든 요약・삭제・재구성과 같은 서사적 개입 양상을 식별하는 데 효과적이다. 특정 의미 단위가 포함되지 않는 경우를 편찬자의 선택적 삭제로 해석하고, 사건은 유지되나 평가 어휘가 변하는 경우를 의도적인 재구성으로 구분하여 분석함으로써 사료 간의 차이를 단순한 불일치가 아닌 능동적인 편찬 행위의 결과로 규명할 수 있다. 결론적으로 본 연구는 정적인 비교를 넘어 커버리지라는 동적 지표를 통해 고려사 편찬 과정의 실제 작동 방식을 밝히고, 원간섭기를 포함한 고려 전 시기로 연구 범위를 확장하여 역사학 방법론의 새로운 지평을 넓히고자 한다.
기대효과
(한글 2000자 이내)
첫째, 사료 비판의 객관화가 가능하다. 그동안 연구자의 주관적 분석에 의존했던 사료 비교를 유사도 점수나 커버리지 값과 같은 수치화된 지표로 제시함으로써 분석의 객관성을 확보한다.
둘째, 거시적인 역사상 도출이 가능하다. 수작업으로는 분석하기 어려웠던 방대한 분량의 사료에 대해 정렬(Alignment) 분석을 수행함으로써, 지엽적인 데이터에 매몰되지 않고 시대를 관통하는 변화 양상을 관찰할 수 있다. 이는 삼국시대 및 조선시대와의 비교 연구로도 확장 적용이 가능하다.
셋째, 역사학 연구 방법론의 지평을 확대할 수 있다. 전통적인 문헌 해독 방식과 최신 NLP 기술을 결합한 시도는 고려시대 전반의 정보 계승 구조를 분석하는 데 있어 새로운 표준 모델을 제시한다. 특히 SIKU-BERT와 같은 모델을 활용한 맥락적 유사성 측정은 단순 키워드 매칭을 넘어선 ‘맥락적 사료 비판’의 가능성을 열어준다.
마지막으로, 연구 과정에서 생성되는 데이터셋과 언어 모델의 실용적 활용이다. 이는 향후 역사 정보 서비스나 디지털 아카이브 시스템에 탑재될 수 있다. 특히 특정 사료 검색 시 연관 사료를 함께 제시하고, 사료 간 정보 일치율과 차이점을 시각화하여 보여줌으로써 역사 기록의 전승 과정을 쉽게 이해하도록 돕는 교육적 도구로 활용할 수 있다.
연구요약
(한글 2000자 이내)
본 연구는 『고려사』 열전, 『고려사절요』 졸기, 그리고 고려시대 묘지명을 비교 분석하여 사료 간의 유사성을 확인하고 정보의 원천 자료가 전승되는 과정을 탐색하는 것을 목적으로 한다. 연구 대상으로 인물 중심의 사료인 열전, 졸기, 묘지명을 선정한 이유는 인물에 대한 서술이 찬자의 시각 변화와 사료 간의 상호참조성을 가장 잘 보여주는 소재라고 생각했기 때문이다. 특히 관찬사서인 열전·졸기와 미화의 성격이 강한 묘지명 사이의 주관적 평가를 배제하고 실질적인 유사도를 비교함으로써, 사료 편찬 과정에서 각 자료가 구체적으로 어떻게 활용되었는지 규명하고자 한다.
연구 방법론 측면에서는 최신 자연어 처리 기술인 BERT를 활용한다. 우선 한 인물에 대한 세 종류의 사료를 병렬 코퍼스로 구축한 뒤, 문장 임베딩을 통해 코사인 유사도와 커버리지 값을 산출한다. 이를 연구자가 구축한 정답셋과 비교하여 모델의 신뢰도를 검증하고, 틀린 지점을 분석함으로써 의미 단위의 비대칭성을 확인한다. 나아가 사료 특유의 변용 패턴을 모델에 학습시키는 파인튜닝 과정을 거쳐 고려 전 시기의 묘지명을 대상으로 실험을 확대하여 방법론의 일반화 가능성을 입증하고자 한다.
백임지의 사례를 통한 시범 분석 결과, 세 사료는 입사 경위나 최종 관직 등 핵심 정보는 공유하고 있으나 서술 방식에서는 뚜렷한 차이를 보인다. 열전과 졸기에는 백임지의 농민 출신 배경과 무인정변 내용이 명시된 반면, 묘지명에서는 이러한 불리한 사실이 누락되고 대신 구체적인 관직 역임이나 장례 정보가 강조되는 비대칭적 양상이 확인된다. 또한 동일 구문에 대한 문자열 유사도와 커버리지 값의 차이는 찬자의 개입을 시사한다.
향후 본 연구는 고려 전 시기를 대상으로 유사도 계산 자동화를 수행하며, 모델의 예측과 실제 데이터 간의 간극인 ‘비대칭적 계승’의 실체를 규명할 것이다. 사료 간 분량 차이가 큰 경우나 특정 양식이 결여된 사례 등 다양한 변수를 고려하여 실험을 진행하고, 최종적으로 종합 고찰을 통해 고려시대 사료 계승 구조를 역사적 맥락에서 재해석하고자 한다.
키워드(Keyword)
(한글 250자 이내)
사료의 상호참조성, 비대칭적 계승, 정렬 기반 커버리지 기법, BERT 기반 임베딩, 병렬 코퍼스
키워드
(영어 500자 이내)
Cross-referentiality among Historical Sources, Asymmetrical Succession, Alignment-based Coverage Technique, BERT-based Sentence Embedding, Parallel Corpus
게시물 이현정 / 고려대학교 / 정렬 기반 커버리지 기법을 활용한 고려시대 사료의 비대칭적 계승 연구: 『고려사』 열전, 『고려사절요』 졸기, 고려시대 묘지명을 중심으로 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.
연구요약문
연구목표
(한글 2000자 이내)
▮연구의 목적과 필요성
본 연구의 목적은 조선 후기 평비본(評批本) 한문소설들의 문맥 및 비평 정보들을 시맨틱 데이터로 전환하고 이를 기반으로 고전소설의 향유 양상을 작품론 연구에 활용할 수 있는 방안을 제시하는 것이다.
향유 정보를 갖춘 소설 유관 텍스트 가운데 작품에 직접적 감상-비평을 본문과 물리적으로 인접한 형태로 드러내는 것은 평비본이다. 현재 평비본소설 논의는 「광한루기」 연구를 제외하면 신자료 발굴 차원에서 서지 정리·계열 검토 등을 개괄하는 식의 기초 단계에 머물러 있다. 더군다나 지원자의 조사 결과 협주·협비·두주 등이 단순 낙서 차원을 넘어 자료 전반에 걸쳐 지속적으로 나타나는 평비본-주석본은 학계에 알려진 것보다 방대한 20여 종에 달한다.
본 과제에서는 ①그간 알려지지 않은 광의의 평비본소설 20여 종 목록을 공유해 고전소설사의 외연을 확장하고, ②서지 및 계열 검토를 넘어 자료에 나타난 비평의 내용과 역할이 어떻게 유형화·구체화되는지, 또 그것들이 본문의 각 장면과 어떻게 유기적으로 연결되는지를 분석해 고전소설의 향유 맥락을 실증적으로 복원하고자 한다.
그간 고전소설 연구는 접근이 용이한 선본을 중심으로 이루어졌으며 텍스트 내부 작품론 분석에 치중된 결과 작품을 둘러싸고 전개된 문인지식인층의 참여적·향유적 맥락은 상대적으로 부차화되었다. 또한 고전소설비평론 역시 긍정-부정[수용-배격]이라는 이분법적 도식 속에서 논의됐는데 평비본소설에 담긴 다양한 비평 양상은 이러한 구도를 넘어 다각적인 향유 맥락을 포착하는 출발점이 된다. 이러한 분석은 “고전소설의 비평 정보는 어떻게 유형화되어야 하는가?”·“각 이본의 독서 흔적들은 어떻게 관리되어야 하는가?”라는 문제와도 연결되며 나아가 향유자의 흔적을 매개로 작품론 분석을 심화하는 자료적 토대를 형성할 수 있다.
▮목표 달성을 위한 단계적 절차
중점 목표 : 본 지원자는 온톨로지 기반 한국한문소설 시맨틱 데이터 모델링 방법론(2025)을 참고해 각 자료의 문맥 및 비평 정보가 의미적으로 연결될 수 있는 데이터를 구축하고 이를 토대로 고전소설 연구에서의 활용 방안을 모색하고자 한다.
연구 범위 : 1년이라는 연구 기간을 고려해 연구 대상을 3종[<만복사저포기(萬福寺樗蒲記)> 일본 내각문고본, <숙향전(淑香傳)> 단국대본, <이생규장전(李生窺牆傳)> 일본 내각문고본]으로 한정한다.
연구 방법 : 위 평비본소설 3종의 서지적·서사적·비평적 요소들을 시맨틱 데이터로 구조화하고 이를 학술적으로 활용하는 방안을 검토하기 위해 아래와 같은 단계적 연구 절차를 밟는다.
①자료적 토대의 구축 : 이미지 판독의 정밀성 확보를 위해 「숙향전」은 단국대 천안 캠퍼스 현장 촬영을 『서발비평본금오신화』 역시 자료를 전사한 고려대본을 직접 촬영해 저해상도 문제를 해결했다. 또한 세 작품의 본문과 두주에 대한 전산화 및 역주 작업을 완료해 즉각적인 태깅 준비를 마쳤다.
②논리적 기반의 설계 : 데이터 범용성 확보를 위해 선행 XML 논의에서 제안된 마크업 지침안을 적극 수용해 먼저 각 자료를 외부 정보와 내부 정보로 구분한다. 다음 외부 정보는 관리정보·서지정보·구성정보로 대별하고, 내부 정보는 의미적 단위로 분절된 장면을 골격으로 각종 서사적 개체 및 평비·비점 등을 계층적으로 배치해 자료의 물리적·문맥적 특징을 충실히 반영한다.
③ 실질적 데이터 생성: VS Code 환경에서 실물 이미지와 대조하며 본격적으로 XML 데이터를 생성한다. 또한 단순 태깅 작업에 그치지 않고 여타 한문본 계열과의 차이점과 기 연구에서 제안된 마크업 모델링의 실효성 등을 함께 검증한다.
④ 학술적 활용안 검토 : 완성된 시맨틱 데이터를 바탕으로 해당 비평이 각각 어떤 장면과 연결되는지 확인하고 각각의 역할과 기능에 따라 유형화한다. 이를 통해 평비 기입의 맥락, 관심 대목과 관심 등장인물, 비평에 활용되는 개념어와 전고 등 향유 양상의 다층적 지점들을 분석한다. 나아가 서발문의 작성자와 및 현대 연구자들의 비평과 비교함으로써 각각의 관심과 해석이 어디에서 교차하고 어긋나는지를 살필 예정이다.
기대효과
(한글 2000자 이내)
본 연구는 조선 후기 평비본 한문소설의 문맥 및 비평 정보를 시맨틱 데이터로 구조화하여, 향유자의 독서 흔적을 분석 가능한 연구 자원으로 전환하고 고전소설수용사의 실증적 기반을 마련하고자 했다. 이러한 논의의 결과물은 아래와 같은 성과를 기대할 수 있다.
① 자료적 근거에 기반한 독자 반응의 재구성 : 본 과제는 평비본소설에 내함된 비평 정보들을 데이터 시맨틱 차원에서 구조화함으로써 각 평비자가 어느 구간에서 어떠한 반응을 보였는지 구체화하는 것에 초점을 두었다. 그런 점에서 기 연구과제에서 「상사동전객기」 이본에 부기된 비점과 평문 등을 바탕으로 당대의 향유 맥락을 복원하고자 했던 작업과도 분명한 연결 지점이 있다.
이러한 접근은 독자반응비평 방법론이 갖는 이론중심적 한계, 즉 막연하게 추정되어 온 향유자들의 관심처와 해석 양상을 자료중심적 차원에서 실증적으로 복원·보완한다는 점에서 강점을 지닌다. 이는 단순히 연구방법론의 심화뿐만 아니라 고전소설 교육 현장에서 학습자들을 대상으로 오늘날 나의 감상과 과거 문인지식층의 반응을 비교·검토할 수 있는 교육 자원 –데이터로 읽는 고전소설- 으로도 확장될 수 있다.
② 고전소설사의 지평 확대와 연구 환경 조성 : 본 과제는 기 연구과제와 마찬가지로 이본에 산재된 다양한 향유의 흔적들을 작품 단위로 수집하고, 그간 학계에서 상대적으로 소외되었던 평비본소설의 신자료 목록을 발굴-공유한다는 점에서 고전소설 수용사 연구를 위한 1차적 토대로 기능할 수 있다. 이러한 평비본소설에 대한 검토는 장기적으로는 상술한 문집류·정사류·필기류·간찰류 등 향유 정보를 담아내고 있는 여러 유형의 리소스들과 연계·분석이 가능하다.
특히 본 과제에서는 분석 내용을 단순히 논문 제출만으로 그치는 것이 아니라 표준화된 모델링에 기반한 XML 데이터를 함께 구축·공개한다는 점에서 그 확산성이 크다. 이는 여타 평비본·주석본 소설 연구 전반에 적용 가능한 모델을 제시함과 동시에 향후 고전소설사 수용사와 관련한 방대한 유관 자료들이 효율적으로 축적·연결될 수 있는 개방형 연구 환경을 조성하는 데 일조할 수 있다.
③ 시맨틱 데이터 기반의 연구 분석 모델 제시 : 본 과제에서 생성하는 시맨틱 데이터는 텍스트의 의미와 구조를 조직화하는 작업이기에 웹상의 비정형 데이터를 대상으로 단순 수치와 빈도만을 추출하는 초기 디지털인문학의 피상적 접근과는 질적으로 차별된다. 그간 다수의 DH연구들은 자료와 작품의 형태적·문맥적 요소들을 정밀하게 담아내기보다 통계 기반의 기술중심적 접근에 치중해왔다. 그 결과 해석적 지평이 제한되고 다른 분석 맥락으로 재활용하기도 어려우며 무엇보다도 기존 내용학 연구의 깊이와 괴리되는 측면이 많았다. 물론 고무적이게도 최근 전근대 장르들에 대한 시맨틱 데이터 모델링과 관련한 개념적 설계들이 활발해지는 추세지만, 연구자가 직접 표준 포맷에 맞추어 시맨틱 데이터를 생성·공유하고 실제 작품론 분석에 적용하는 연구는 여전히 드문 실정이다.
그런 점에서 본 과제는 단순 이론적 설계를 넘어 실제적 활용 방안을 모색하고 기존 아날로그 논의 성과들과의 접점을 확보한다는 점에서 의의를 지닌다. 다시 말해 고도화된 XML 데이터를 학계에 제공하는 성과는 물론 데이터 기반의 고전소설 연구 프로세스를 제시한다는 점에서 중요한 연구사적 의미를 갖는다.
연구요약
(한글 2000자 이내)
○ 연구의 목적과 필요성
본 연구의 목적은 조선 후기 평비본(評批本) 한문소설들의 문맥 및 비평 정보들을 시맨틱 데이터로 전환하고 이를 기반으로 고전소설의 향유 양상을 작품론 연구에 활용할 수 있는 방안을 제시하는 것이다.
본 과제에서는 ①그간 알려지지 않은 광의의 평비본소설 20여 종 목록을 공유해 고전소설사 외연을 확장하고, ②서지 및 계열 검토를 넘어 자료에 나타난 비평의 내용과 역할이 어떻게 유형화·구체화 되는지, 또 그것들이 본문의 각 장면과 어떻게 유기적으로 연결되는지를 분석해 고전소설의 향유 맥락을 실증적으로 복원하고 나아가 작품론 분석을 심화하는 자료적 기반을 구축하고자 한다.
그간 고전소설 연구는 접근이 용이한 선본을 중심으로 이루어졌으며 텍스트 내부 작품론 분석에 치중된 결과 작품을 둘러싸고 전개된 문인지식인층의 참여적·향유적 맥락은 상대적으로 부차화되었다. 또한 고전소설비평론 역시 긍정-부정[수용-배격]이라는 이분법적 도식 속에서 논의됐는데 평비본소설에 담긴 다양한 비평 양상은 이러한 구도를 넘어 다각적인 향유 맥락을 포착하는 출발점이 된다. 이러한 분석은 “고전소설의 비평 정보는 어떻게 유형화되어야 하는가?”·“각 이본의 독서 흔적들은 어떻게 관리되어야 하는가?”라는 문제와도 연결된다.
○ 연구 방향성
그간 학계에서 평비본소설을 비롯한 고전소설 수용사 논의가 본격화되지 못한 이유는 향유 맥락과 관련한 유관 작품의 목록이 충분히 공유되지 못한 점에도 있겠으나, 무엇보다 이러한 원천 리소스들을 구조화한 학술 데이터가 제대로 생성-공유되지 못한 데에 기인한다. 이러한 문제의식에 입각해 본 연구는 최근 제안된 한국한문소설 XML 마크업 방법론을 참고해 각 자료의 문맥 및 비평 정보를 의미적으로 연결하는 데이터를 구축하고 이를 토대로 고전소설 연구에서의 활용 방안을 모색하고자 한다.
○ 연구 대상
1년의 연구 기간을 감안해 연구 대상을 3종[<만복사저포기(萬福寺樗蒲記)> 일본 내각문고본, <숙향전(淑香傳)> 단국대본, <이생규장전(李生窺牆傳)> 일본 내각문고본]으로 한정한다. 이들 작품은 분량 대비 평어의 밀도가 높은데다 문장 품평·고유명사 설명·교감 제안·서사 국면에 대한 반응·등장인물 평가 등 다양한 비평 양상을 포함하고 있어 향유 유형을 귀납적으로 도출하기에 적합하다. 또한 서·발문을 함께 갖추고 있어 작품 안팎의 비평을 연계한 종합적 분석도 가능하며 특히 <숙향전> 단국대본의 경우 여타 이본과는 교감이 어려울 정도로 내용적 차이가 크다는 점에서 그 자체만으로도 소개적 가치를 지닌다.
○연구 방법
① 자료적 토대의 구축 : 먼저 조선후기 평비본소설의 이본 현황을 전수 조사하고 관련 목록의 이미지와 서지 정보를 체계적으로 정리한다. 이미지 판독의 정밀성 확보를 위해 해당 원본을 직접 촬영해 저해상도 문제를 해결한다. 또한 세 작품의 본문과 두주에 대한 전산화 및 역주 작업을 완료해 태깅이 가능한 상태로 정비한다.
② 논리적 기반의 설계 : 선행 논의에서 제안된 한문소설 마크업 지침안을 적극 수용해 먼저 각 자료를 외부 정보와 내부 정보로 구분한다. 다음 외부 정보는 관리정보·서지정보·구성정보 층위로 나누고, 내부 정보는 의미적 단위로 분절된 장면을 골격으로 각종 서사적 개체 및 평비·비점 등을 계층적으로 배치해 자료의 물리적·문맥적 특징을 충실히 반영하고 범용성을 확보한다.
③ 실질적 데이터 생성 : VS Code 환경에서 실물 이미지와 대조하며 본격적으로 XML 데이터를 생성한다. 또한 단순 태깅에 그치지 않고 여타 한문본 계열과의 차이점과 기 연구에서 제안된 마크업 모델링의 실효성 등을 함께 검증한다.
④ 학술적 활용안 검토 : 완성된 시맨틱 데이터를 바탕으로 해당 비평이 각각 어떤 장면과 연결되는지 확인하고 각각의 역할과 기능에 따라 유형화한다. 이를 통해 평비 기입의 맥락, 관심 대목과 관심 등장인물, 비평에 활용되는 개념어와 전고 등 향유 양상의 다층적 지점들을 분석한다. 나아가 서발문의 작성자와 및 현대 연구자들의 비평과 비교함으로써 각각의 관심과 해석이 어디에서 교차하고 어긋나는지를 검토한다.
키워드(Keyword)
(한글 250자 이내)
한문소설(漢文小說), 평비본(評批本), 소설비평, 이본(異本), 향유 양상, 독자반응비평, 시맨틱 데이터, 확장성 마크업 언어(XML), 인공지능(AI), 온톨로지(Ontology)
키워드
(영어 500자 이내)
korean novels in literary sinitic(漢文小說), Pingbiben(評批本), Fiction Criticism, Variant Editions, Aspects of Reception, Reader-Response Criticism, Semantic Data, XML(Extensible Markup Language), AI(Artificial Intelligence), Ontology
게시물 이길환 / 고려대학교 / 한국고전소설의 향유 데이터 구축 및 활용 방안 연구 : 조선후기 평비본(評批本) 한문소설을 중심으로 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.