普通视图

Received before yesterday学术机构（海外组织）

김민정 / 서울대학교 / 생성형 AI 시대의 시가장(詩歌場) 재편 – 샤오빙(小冰), DeepSeek를 중심으로 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월

作者Baro

2026年5月14日 23:07

연구요약문
연구목표
(한글 2000자 이내)
시 창작에서 DeepSeek는 중국 시학(詩學) 코퍼스를 기반으로, 사용자의 지시에 따라 시를 생성하는 창작기제를 무상으로 제공하는 중이다. 이 시스템은 대규모 언어 데이터에 포함된 지역 세대 성별 감정 언어와 어휘 습관을 학습함으로써, 중국 고전시로부터 현당대시에 이르는 다양한 시 양식을 모방해낸다. 나아가 DeepSeek를 비롯한 생성형 AI의 다중모달(multimodal) 기술은 사용자가 제시하는 감각적 정서적 정보와 기계의 연산 판단을 결합시키는 ‘상호작용적 창작(interactive co-creation)’의 조건을 갖추게 되었다.
본 연구는 인간의 전유물로 여겨져 왔던 문학이 AI의 등장으로 ‘인간문학’과 ‘AI문학’으로 분화되어 가는 현실 상황에 주목한다. 인간이 수 천 년에 걸쳐 축적해 온 문학 경험을 AI가 학습하여 생성한 시를 예술로 규정할 수 있는지, 그리고 그것의 예술적 성과는 어떤 기준으로 평가해야 하는지 등을 본격적으로 논의해야 하는 지금이야말로 ‘인간문학’과 ‘AI문학’이 분리되기 이전의 과도기적인 협업 단계라고 보기 때문이다.
중국의 AI 시 창작은 2014년 마이크로소프트 아시아연구소(Microsoft Research Asia)가 개발한 ‘샤오빙(小冰)’으로 말미암는다. 2017년, 마이크로소프트는 샤오빙의 시를 모아 첫 시집 《햇살은 유리창을 잃고(陽光失了玻璃窗)》(이하 《햇살》)을 출간하게 된다. 《햇살》은 샤오빙이 1920년대 이후에 발표된 519명의 중국 현대시 작품을 학습한 뒤 감정 서사와 시적 이미지를 결합해 산출한 결과물로서 작품의 문법적 오류와 의미의 연쇄 논리적 연결의 불완정성 등이 한계로 지적되었다. 일각에서는 이 한계를 샤오빙을 설계한 엔지니어들이 학습 대상인 신시(新詩)의 미학적 특성을 충분히 이해 모델링하지 못한 데서 발생한 알고리즘 설계의 문제로 인식하기도 한다.
이러한 한계는 DeepSeek 이후 일정 부분 보완되는 양상을 보이기도 한다. 훠준밍은 샤오빙을 비롯한 초기 시 생성 AI가 작품 수준이 높지 않아 비판을 받았던 데 비해, DeepSeek는 시 모방 능력과 비평 능력, 그리고 알고리즘 수준 등이 높아서 인간 시 창작의 주요 특징들을 정교하게 인식 구현한다고 주장한다. 반면 시인 위졘(于坚)처럼 AI의 본질은 데이터 분석과 재조합에 있으므로 기존 텍스트를 모방 재배열하는 산출을 진정한 의미의 시 창조로 볼 수 없으며, 그런 의미에서 “딥시크는 시인이 아니라 지식인일 뿐”이라고 규정하는 입장도 있다. 그럼에도 평가의 다양한 갈래 모두는 새로운 도구의 출현이 시가장에 구조의 변화를 유발하고 있음을 긍정하는 바다.
본 연구는 샤오빙과 DeepSeek를 중심으로 AI 시 창작과 비평, 그리고 인간-AI 협업이 중국 시가장에 어떠한 변화를 가져오고 있는지를 분석하고자 한다. 이를 위하여 첫째, 중국 AI 시 창작의 출현과 발전 과정을 정리한다. 둘째, DeepSeek를 비롯한 생성형 AI의 시 생성 메커니즘과 그 시학 특징을 분석한다. 셋째, ‘협업’ 단계의 도래가 창작 주체의 개념, 비평 기준, 문학 권위의 구조, 그리고 작품 판별 및 검증의 장치를 어떻게 재편하는지 살펴본다. 그럼으로써 AI 시대 중국 시의 새로운 창작 질서와 시학 협업의 가능성을 전망하고자 한다.
기대효과
(한글 2000자 이내)
첫째, 본 연구는 AI 창작을 둘러싼 논의를 AI 시의 의의와 문학장 구조 분석의 대상으로 전환시키는 데 기여한다. 샤오빙과 DeepSeek의 사례를 통해 AI가 시의 창작 방식, 비평 주체, 문학 권위의 구조를 재편하는 실질적인 역할을 하고 있음을 입증함으로써 AI 시 연구의 기초를 마련한다.
둘째, 이미지 기반 생성에서 대규모 언어모델 기반 생성으로 이어지는 AI 시 창작 메커니즘과 그 변화를 분석함으로써 AI 시의 특징과 한계를 구명한다. 이를 통해 기존 연구가 주로 지적한 문법 오류나 의미 공백을 신시(新詩) 미학과 알고리즘 설계 사이의 긴장 관계로 재해석할 수 있는 분석의 틀을 마련한다.
셋째, DeepSeek가 시 생성과 함께 시인 선정, 작품 평가, 비평 담론의 생산 등을 수행하고 있는 점에 주목함으로써 AI가 문학장의 비평 주체로 진입하는 현상을 확인한다. 이는 시 창작과 비평을 분리해 온 기존 문학 연구의 관점을 재검토하게 하고, 인간 비평가의 역할 변화와 새로운 협업 모델에 대한 논의의 출발점이 될 것이다.
연구요약
(한글 2000자 이내)
본 연구는 샤오빙과 DeepSeek를 중심으로 AI 시 창작과 비평, 그리고 인간-AI 협업이 중국 시가장에 어떠한 변화를 가져오고 있는지를 분석하고자 한다. 이를 위하여 첫째, 중국 AI 시 창작의 출현과 발전 과정을 정리한다. 둘째, DeepSeek를 비롯한 생성형 AI의 시 생성 메커니즘과 그 시학 특징을 분석한다. 셋째, ‘협업’ 단계의 도래가 창작 주체의 개념, 비평 기준, 문학 권위의 구조, 그리고 작품 판별 및 검증의 장치를 어떻게 재편하는지 살펴본다. 그럼으로써 AI 시대 중국 시의 새로운 창작 질서와 시학 협업의 가능성을 전망하고자 한다.

가. 샤오빙 시의 특징과 언어 결합 양상(샤오빙)
마이크로소프트 아시아연구소는 2017년 《햇살》을 간행한 데 이어, 2019년에는 두 번째 시집 《꽃은 푸른물의 침묵(華是綠水的沈默)》(이후 《꽃은》)을 출판하였다. 《꽃은》은 샤오빙이 이미지를 인식해 생성한 시 초안을 바탕으로 아마추어 시인이 이를 수정 보완한 6천여 편의 응모작 중에서 200편을 선별해 엮은 시집으로, ‘인간-AI’ 협업이라는 창작 방식을 실현한 사례라 할 수 있다. 샤오빙의 시는 인간 언어 형식을 모방하려는 지향을 보인다. 하지만 실제 수행 과정에서는 불완전한 언어 결합 양상을 드러내기도 한다. 현대 중국어의 어법 규범에 부합하지 않을 뿐 아니라, 이미지 간의 연상과 서술 논리를 단절시키는 경우가 다수 발견된다. 이러한 언어적 결함은 샤오빙의 이미지 기반 시 생성 방식과 연관되어 있다. 예를 들어, ‘가을비 속 낙엽’이 담긴 이미지를 입력하면, 시스템은 그 안의 ‘나뭇잎’, ‘빗방울’, ‘시들고 노란색’ 등 시각적 요소를 자동으로 추출하고, 이를 의미 단위로 변환하여 시 생성 모듈에 전달한다. 시 생성 단계에서는 ‘나뭇잎’이 ‘시든 덩굴’, ‘늙은 나무’, ‘졸린 까마귀’로, ‘빗방울’은 ‘폭우로’, ‘시들고 노란색’은 ‘외로움’ 혹은 ‘고독’ 등 어휘로 치환되어 다양한 조합을 생성하게 된다. 이러한 결함은 시 장르의 특수성 속에서 정서의 그럴듯함으로 해석되기도 한다. 샤오빙의 시는 개별 문장의 완결성이나 논리성에서는 한계를 보이지만, 감정 서사에 강하여 독자에게 일정 수준의 정서적 설득력을 제공하기 때문이다.

나. 대규모 언어모델 기반 시 생성과 비판(DeepSeek)
DeepSeek 시의 특징은 다음과 같다. 첫째, 즉시 생성이다. 사용자가 입력을 주는 즉시, AI는 사전에 학습된 언어⦁이미지 패턴을 기반으로 시를 산출해 낸다. 시의 즉시 생성은 창작 과정에서 ‘시간’이 차지하는 의미를 근본적으로 변화시킨다. 이는 장기간의 학습과 해석 과정을 필요로 하는 작업이다. 반면에 AI는 이러한 과정을 생략하고 이미 학습된 대규모 언어모델을 통하여 시간이 압축된 창작을 수행하게 된다. 창작 행위가 더 이상 ‘시간의 예술’이 아니라, ‘지시’와 ‘응답’의 즉각적인 상호작용으로 전환하는 것이다. 둘째, 반복 학습의 가능성이다. 기존의 데이터가 충분히 학습되어 있지 않은 경우에도 사용자가 주제나 형식을 반복적으로 제시하고 그 결과물에 피드백을 제공하면, AI는 이를 반영하여 정제된 결과를 산출하게 된다. 생성형 AI의 시 쓰기는 결과물의 산출에 그치지 않고, 이용자의 지시와 피드백을 계속 반영하면서 시의 질적 수준을 높여가는 창작 과정을 보여주기도 한다. AI의 즉시성과 반복 학습이 질 높은 시 창작에 기여하기 위해서는, 그것의 계속적인 생성 가능성이 이용자 자신의 문학적 기준과 미적 판단에 의지해야만 한다.
그런 의미에서 현시점의 인간-AI 관계는 ‘활용’ 단계로부터 ‘협업’ 단계로 전환중이다. 사용자는 AI 산출 결과에 피드백을 제공하고 수정과 재생성을 반복함으로써 자신의 미적 목적을 향해 나아간다. 이 과정은 인간과 AI가 상호 응답을 거듭하며 작품을 함께 창작해 가는 과정이기 때문에 양자 간의 대화는 질의응답에 머무는 것이 아니라 인간의 창의적 의도와 기계의 계산이 결합된 ‘공동 구성(co-construction)’의 실현이 될 수밖에 없다.
키워드(Keyword)
(한글 250자 이내)
AI, 중국 시, 샤오빙(小冰), DeepSeek, 인간문학, AI문학, 협업, 창작, 비평
키워드
(영어 500자 이내)
AI, Chinese Poetry, XiaoIce, DeepSeek, Human Literature, AI Literature, Collaboration, Creation, Criticism

게시물 김민정 / 서울대학교 / 생성형 AI 시대의 시가장(詩歌場) 재편 – 샤오빙(小冰), DeepSeek를 중심으로 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.

13 - 韩国数字人文协会（KADH）

이다연 / 한국연구재단 / 중국 고전시 비평 언어에 대한 AI 학습 방법론 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월

作者Baro

2026年5月14日 23:05

연구요약문
연구목표
(한글 2000자 이내)
본 연구는 대규모 언어모델(LLM)에게 詩話 지식과 비평문(평어) 데이터를 학습시켜 고전시 비평 언어를 가르치는 방법론을 제시한다. 시화는 시론부터 시인에 대한 평가 등 시와 시인에 대한 정보들을 가지고 있는 문헌이며, 시 비평문은 함축적인 비평어로 작성되어 있어 전문 연구자도 이해하는 데 많은 시간과 노력이 필요한 자료지만, 이는 모두 고전시를 이해하는 데 직접적으로 도움이 되는 정보다. 그러나 현대인들이 이러한 문헌들을 모두 읽는 것이 사실상 불가능하고, 현대 언어를 주로 학습한 LLM을 도움을 받더라도 LLM은 이러한 정보 없이 시를 해석하기 때문에 시를 이해하는 데 어려움을 겪는다.
이를 해결하기 위하여 본 연구는 시화 데이터와 비평문 데이터를 언어모델에 학습시켜 고대 비평 언어를 내재화시켜 고대 비평가의 관점에 보다 가까이 접근하는 방법을 제시한다. 이를 통해 시화 지식이 고전시를 이해하는 데 얼마나 도움이 되는지를 검증하고 비평문이 없는 시 작품에 대하여 비평문을 생성하여 시 감상에 이해를 돕는다.
본 연구는 AI 시대에 고전문학 분야의 구체적인 문제를 기술로 해결하는 방법을 제시한다. 이는 향후 고전시 학습을 위한 AI 보조 도구를 개발하는 데 기반이 되는 연구로서 고전시에 대한 진입장벽을 낮추고 인문학과 AI 기술의 융합 연구의 모범 사례가 될 것이다.
기대효과
(한글 2000자 이내)
(1) 학제 간 협업 촉진
본 연구와 같이 고전시 지식과 AI 기술을 융합한 연구의 성과를 인공지능 관련 분야의 학회에서 발표하게 된다면, 공학 연구자들까지 고전시를 잠재력 있는 연구 분야로 인식하고 학제 간 협업이 활성화될 수 있다. 나아가 기술 분야에서도 고전시 연구자가 자연스럽게 양성되어 연구자가 부족한 현실적인 문제까지 해결할 수 있다.
(2) 기술 방법론의 확장 및 후속 연구 촉발
본 연구는 고대 중국시 비평에 한정하였으나 서양의 작품에도 적용 가능하다. 현대어로 쓰인 문학 작품이라면 LLM의 정교한 임베딩을 활용하여 더 고품질의 결과를 얻을 수 있을 것이다. 본 연구를 재현 가능하도록 만들기 위해 깃허브에 코드를 공개할 예정이므로 다른 연구자들이 이를 자신의 연구에 사용할 수 있다.
(3) 교육 현장 및 인문학 시장에서 선도
본 연구는 현재 기술의 수준을 파악하고 인문학자들의 판단이 필요한 지점을 고찰하여 AI 시대에 인문학을 어떻게 교육하고 학습해야 하는지 논의의 토대를 세운다. 연구 종료 후에는 훈련된 AI 모델을 대학이나 일반인 교육 기관에서도 교육 보조 도구로 사용할 수 있다. 이를 통해 개인 학습자들도 시 감상에 도움을 받아 고전시의 진입장벽이 낮아지는 효과를 거둘 수 있다.
연구요약
(한글 2000자 이내)
(1) 데이터셋 수집 및 전처리
비평문 데이터는 각 시인의 서적에서 직접 추출한다. 詩話 데이터는 중국 고전시 전문 디지털 아카이브인 搜韻에서 제공하는 총 93종을 사용한다. 시–비평문 데이터는 비평문이 함께 수록된 출판물을 대상으로 수집하며, 당송대 주요 시인의 작품 가운데 비평이 확인되는 작품 3,000편을 확보하는 것을 목표로 한다.
(2) 데이터 탐색적 분석(EDA)
전처리를 통해 정제된 비평문 데이터 및 시화 데이터에 대하여 전통적인 텍스트 마이닝 기법을 활용하여 탐색적 분석을 수행한다. 자주 등장하는 비평 용어를 추출하고, 연구자의 검토를 거친다. 추출된 비평 용어들은 전문 비평 서적을 참조하여 그 의미와 용례를 검토한다.
(3) 모델에게 지식 학습
첫 번째 단계는 지속적 사전학습(Continual pre-training. CPT)를 사용하여 시화 데이터의 언어적 특성과 지식을 모델에게 가르치는 것이다. 두 번째 단계에선 시-비평문 데이터를 모델에 지도 미세조정(Supervised Fine-tuning. SFT)시킨다. 이때 테스트 데이터는 별도로 분리하여 이후 진행될 평가 단계에서 사용하고 학습에는 학습 데이터셋만 사용한다. 지도 미세조정은 일반 미세조정(full fine-tuning)과 LoRA 두 가지 방식으로 실험한다. 정량적 평가 지표는 s-bert 기반의 코사인 유사도를 사용한다. 이는 길이에 무관하며 전체 의미를 파악한다는 점에서 본 연구의 데이터의 특성에 적합하다. BERTScore는 핵심 비평어가 포함되어 있는지 확인하기 위해 재현율로 판단할 것이다. 정성적 평가 지표는 LLM-as-a-judge를 활용한다.
(4) 조합 비교(Ablation Study)
본 연구의 가설을 검증하기 위해 방법론을 조합하여 비교 실험을 수행한다. 각 조합에 테스트 데이터셋을 적용하고 평가 지표로 성능을 측정한다. 각 조합은 Baseline, Baseline + CPT, Baseline + SFT, Baseline + CPT + SFT으로 구성된다.
(5) 비평 추론 방법론을 연구한 논문 집필 및 학술 대회 참가 준비
최종 실험 성과는 학술 대회에 참가하여 발표할 예정이다. 무엇보다도 학제 간 연구자들과 학술적인 교류를 통해 인문학과 인공지능의 융합 연구 가능성을 제시하는 것이 학술대회 발표의 가장 중요한 목적이다.
(6) 클라우드 서비스의 활용
모델 학습 단계에서는 안정적인 고성능 GPU 환경이 필수적이다. 고성능 GPU를 직접 구매하기에는 개인 연구자가 감당하기 어려운 수준이기에, 클라우드 서비스를 활용하여 필요한 시점에만 GPU를 사용해서 다소 경제적인 비용으로 실험을 진행하고자 한다.
(7) 연구의 한계점
고대 중국어는 극도로 자원이 부족한 희소 언어로서 가장 좋은 방법론을 찾더라도 완벽한 성능을 기대하기는 어렵다. 그러나 희소 언어 환경을 극복하는 방법들이 활발하게 개발되고 있으므로 본 연구 또한 기술적 발전과 함께 성능이 개선될 가능성이 크다.
키워드(Keyword)
(한글 250자 이내)
중국고전시, 문학 비평, 시화, 지속적(계속적) 사전 학습, 지도학습 미세조정, 희소 언어, 대규모 언어모델
키워드
(영어 500자 이내)
Chinese classical poetry, Literary Criticism, Shi-hua, Continual Pre-training, Supervised Fine-tuning, Low-resource Language, Large Language Model

게시물 이다연 / 한국연구재단 / 중국 고전시 비평 언어에 대한 AI 학습 방법론 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.

13 - 韩国数字人文协会（KADH）

유은순 / 가톨릭대학교 / 트랜스포머 기반 언어 모델을 활용한 문학 사조 혼재 연구 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월

作者Baro

2026年5月14日 23:04

연구요약문
연구목표
(한글 2000자 이내)
본 연구의 목적은 서로 다른 문학 사조가 단일 텍스트 내부에서 어떻게 공존하고 분포하는지를 분석할 수 있는 방법론을 구축하는 데 있다. 이를 위해 트랜스포머 기반 딥러닝 언어 모델인 Sentence-CamemBERT를 활용하여 19세기 프랑스 소설 스탕달(Stendhal)의 『적과 흑』(Le Rouge et le Noir)과 귀스타브 플로베르(Gustave Flaubert)의 『보바리 부인』(Madame Bovary)에 나타난 낭만주의와 사실주의의 혼재 양상을 정량적으로 가시화하고, 그 결과를 질적 해석과 통합하고자 한다.
19세기 프랑스 소설은 낭만주의에서 사실주의와 자연주의로 이어지는 흐름 속에서 전개되었으나, 개별 작품들은 단일 사조로 환원되기 어려운 복합적 미학 구조를 보여준다. 『적과 흑』은 주인공의 열망과 사회 현실에 대한 관찰이 교차하는 서사를 통해 낭만주의적 정념과 사실주의적 인식이 중첩되는 양상을 보여준다. 『보바리 부인』 역시 사실주의적 재현 속에 낭만주의적 욕망을 내면화한 주인공을 제시함으로써 서로 다른 미학적 경향이 공존하는 텍스트로 평가된다. 그러나 기존 연구는 주로 면밀한 텍스트 분석에 기반한 질적 해석에 머물러 있어, 사조적 특징이 텍스트 내부 어느 지점에서 강화되거나 약화되는지, 그리고 어떠한 분포와 변화를 보이는지를 체계적으로 검토하는 데 한계가 있었다. 이에 본 연구는 언어 모델 기반 임베딩을 활용하여 소설 내부에서 서로 다른 사조적 경향이 어떻게 분포하고 이동하는지를 계량적으로 분석하고자 한다. 본 연구의 구체적인 목표는 다음과 같다.
첫째, 낭만주의와 사실주의에 충실한 전형적 텍스트를 선정하고, 언어 모델 기반 임베딩을 통해 문학 사조 앵커 벡터(literary movement anchor vectors)를 구축한다. 이를 통해 『적과 흑』과 『보바리 부인』에 나타난 사조 혼재의 분포와 변화 양상을 분석하기 위한 참조 축(reference axis)을 마련한다.
둘째, 분석 대상인 두 소설을 챕터 단위로 임베딩한 뒤 각 챕터의 벡터와 사조 앵커 벡터 간의 의미적 거리를 코사인 유사도로 측정한다. 그리고 그 결과를 사조 맵(literary movement map)으로 시각화하여 챕터 단위의 사조 경향과 분포, 시계열적 변화 양상을 검토한다.
셋째, 사조 맵을 기반으로 서로 다른 미학적 경향이 강화되거나 약화되는 구간을 식별하고, 챕터 내부 임베딩 벡터의 분산(variance)을 통해 사조적 경향의 변동 정도를 분석한다. 나아가 챕터 간 서사적 전환이 나타나는 구간과 변동성이 높은 챕터를 중심으로 질적 해석을 수행함으로써 정량 분석과 질적 해석을 통합한다.
기대효과
(한글 2000자 이내)

학문적 기대효과 : 인공지능 기반 문학 연구 방법론 구체화

전통적인 질적 비평에 의존해 왔던 문학 사조 연구에 트랜스포머 기반 딥러닝 언어 모델을 활용한 정량적 분석을 도입함으로써, 문학적 통찰을 데이터에 기반하여 재검토할 수 있는 연구 방법을 마련한다. 특히 질적 연구가 사조의 혼재를 대표적인 장면이나 단락을 중심으로 논의해 온 것과 달리, 본 연구는 텍스트 전체에 걸쳐 나타나는 사조 혼재의 분포와 변화 양상을 계량적으로 분석함으로써 단일 사조로 환원되지 않는 복합적 미학 구조를 보다 체계적으로 조망할 수 있는 분석 틀을 제공한다.

사회적 기대효과 : 인공지능 시대 인문학의 역할 재정립

본 연구는 기술과 인문학적 해석이 상호 보완적인 관계를 형성할 수 있음을 보여줌으로써, 인공지능 시대에 문학 연구의 역할과 가능성에 대한 인식을 확장하는 데 기여한다. 나아가 문학이 인공지능 모델과 데이터 자원을 통해 지속적으로 연구 지평을 갱신할 수 있는 영역임을 환기시키고 인문학의 사회적 가치에 대한 이해를 심화하는 계기를 제공한다.

교육적 기대 효과 : 디지털 인문학 교육 모델 설계

최근 대학의 인문학 교육은 인공지능 기술과의 융합을 적극적으로 모색하는 방향으로 빠르게 전환되고 있다. 본 연구에서 구축한 코퍼스와 언어 모델 기반 데이터, 그리고 재현 가능한 분석 절차는 인공지능 시대에 부합하는 교육 자료로 활용될 수 있다. 또한 전통적인 독해와 데이터 분석을 융합한 디지털 문학 교육 모델로 확장될 수 있다.
연구요약
(한글 2000자 이내)
본 연구의 목적은 서로 다른 문학 사조가 단일 텍스트 내부에서 어떻게 공존하고 분포하는지를 정량적으로 분석하기 위한 통합적 방법론을 제안하는 데 있다. 이를 위해 트랜스포머 기반 딥러닝 언어 모델를 활용하여 스탕달의 『적과 흑』과 플로베르의 『보바리 부인』에 나타난 낭만주의와 사실주의의 혼재 양상을 정량적으로 가시화하고, 그 결과를 질적 해석과 결합하는 통합적 분석 절차를 구축한다. 이는 기존 질적 연구가 대표적 장면이나 단락을 중심으로 사조의 혼재를 논의해 온 경향을 보완하고, 텍스트 전체에 걸쳐 나타나는 사조적 경향의 분포와 변화 양상을 체계적으로 파악하기 위한 시도이다. 본 연구는 다음과 같은 절차로 수행된다 : 첫째, 각 사조의 미학적 특성을 대표하는 전형적 작품 10편씩 총 20편으로 앵커 코퍼스를 구축한다. 작품 선정 과정에서는 문학사적 대표성과 작가 간 균형을 고려하여 특정 작가에 편중되는 것을 방지한다. 분석 대상 텍스트는 프로젝트 구텐베르크에서 제공하는 프랑스어 원서를 활용하며, 특수 기호와 주석 등 분석에 불필요한 요소를 제거하는 전처리 과정을 거친다. 둘째, 전처리된 소설은 챕터 단위로 분할한 뒤 중첩 슬라이딩 윈도우(overlapping sliding windows) 방식으로 세분화하여 서사 흐름의 단절을 최소화하고 의미 변화를 연속적으로 포착한다. 그리고 프랑스어 말뭉치를 기반으로 사전 학습된 트랜스포머 언어 모델 Sentence-CamemBERT를 활용하여 슬라이딩 윈도우 단위로 임베딩을 생성하고, 이를 집계하여 챕터별 대표 벡터를 산출한다. 셋째, 사조의 전형적 작품들의 임베딩을 기반으로 낭만주의와 사실주의 앵커 벡터(anchor vector)를 구축한다. 앵커 벡터는 사조의 평균 문체를 도출하기 위한 기준이 아니라 두 소설이 서로 다른 미학적 경향 가운데 어디에 가까운지를 판단하기 위한 참조 축이다. 넷째, 소설의 각 챕터 벡터와 앵커 벡터 간 코사인 유사도를 측정하여 의미적 거리를 산출하고, 그 결과를 사조 맵으로 시각화한다. 사조 맵은 텍스트 내부에 나타나는 미학적 경향의 분포와 서사 전개에 따른 이동을 좌표 공간에 보여줌으로써 사조 혼재를 분포와 변화의 관점에서 조망하게 한다. 마지막으로 정량 분석과 질적 해석을 결합한 통합적 접근을 수행한다. 챕터 간 사조 전환 구간을 식별하고, 해당 지점에서 나타나는 서사적 특징에 대한 질적 해석을 진행한다. 또한 각 챕터를 구성하는 윈도우 벡터와 앵커 간 유사도의 분산을 측정하여 챕터 내부의 사조적 안정성과 변동성을 평가한다.
키워드(Keyword)
(한글 250자 이내)
디지털 인문학, 딥러닝 언어 모델, 문학 사조, 텍스트 임베딩, 정량적 분석
키워드
(영어 500자 이내)
Digital Humanities, Deep Learning Language Models, Literary Movements, Text Embedding, Quantitative Analysis

게시물 유은순 / 가톨릭대학교 / 트랜스포머 기반 언어 모델을 활용한 문학 사조 혼재 연구 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.

13 - 韩国数字人文协会（KADH）

강남오 / 강원대학교 강릉캠퍼스 / 옛한글 자료 번역을 위한 MCP기반 번역가-LLM 협업 번역 모델 연구 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월

作者Baro

2026年5月14日 23:02

연구요약문
연구목표
(한글 2000자 이내)
본 연구의 목표는 최근 급격히 발전하고 있는 거대 언어 모델(Large Language Model, LLM)을 이용하여 옛한글 자료 번역을 효율적이고 일관적으로 수행할 수 있는 “MCP(Model Context Protocol)기반 번역가-LLM 협업 번역 모델”을 제시하고 해당 모델의 성능 평가를 통해 그 효용성을 검증하는 것이다.

최근 급속도로 발전하고 있는 인공지능(Artificial Intelligence, AI) 기술은 다양한 분야와 융합하고 있으며 산업계, 학계 및 일상의 모든 영역에서 혁신적인 변화를 이끌고 있다. 특히 최근 소개된 LLM(ChatGPT, Gemini 등)은 자연어를 이해하고 생성하는 능력을 바탕으로 다양한 분야와 융합 및 활용되고 있다.

옛한글로 기록된 자료는 우리 민족의 역사, 철학, 문학, 그리고 한국어의 원형을 보여주는 중요한 문화유산이다. 그럼에도 옛한글 자료의 현대한글 번역 작업은 다른 분야에 비해서 매우 느리게 진행되고 있다. 그 이유는 옛한글 자료의 번역은 해당 분야에 대한 고도의 지식과 전문성을 요구함으로 인해 소수의 전문가들만이 이를 수행할 수 있기 때문이다.

이러한 상황에서 최근 소개된 LLM(ChatGPT 5.2나 Gemini 3 등)은 방대한 옛한글–현대한글 병렬 자료의 학습을 통해 옛한글 자료를 일정한 수준의 현대한글로 번역할 수 있는 능력을 갖추고 있다. 이는 기존에 전적으로 전문 번역가에 의존해왔던 옛한글 자료의 번역 작업에 큰 변화를 가져올 수 있는 기술적 환경이 마련된 것이다.

하지만 LLM 단독 번역의 결과는 잘못된 표기 변환 혹은 표현 변환, 옛한글 어휘의 잘못된 해석, 문맥에 맞지 않는 번역 등 아직은 부족한 점을 보이고 있다. 이는 전문 번역가가 LLM에 옛한글 자료의 번역에 필요한 적절한 지식을 제공하는 협업구조를 통해 해당 문제를 보완할 수 있다. 그리고 이러한 협업 구조를 구축하는 기술적 방법으로써 MCP(Model Context Protocol)를 활용할 수 있다.

따라서 본 연구에서는 옛한글 자료의 번역에 있어 전문 번역가와 LLM이 가진 한계점을 상호 보완함으로써 옛한글 자료 번역의 속도와 생산성을 향상시킬 수 있는 옛한글 번역을 위한 MCP기반 번역가-LLM 협업 번역 모델을 제시하고 이의 효용을 검증하는 것을 목표로 두고 있다.
기대효과
(한글 2000자 이내)
본 연구를 통해서 기대하는 학문적, 사회적 기대효과는 다음과 같다.

■ 옛한글 자료 번역과 인공지능의 융합을 통한 새로운 번역 모델 제시
기존에 전문 번역가가 전적으로 수행했던 옛한글 자료 번역을 번역가-LLM 협업 모델로 전환함으로써 번역의 속도와 생산성을 향상시키고 오류 감소 및 일관성 있는 번역 결과를 산출하는 새로운 옛한글 자료 번역 모델을 제시한다.

■ 옛한글 번역 지식 자료의 체계화 및 활용성 제고
번역 지식이 개별 연구자의 경험에 머무르지 않고 재사용 가능한 자료로 체계화 및 축적됨으로써 번역의 일관성과 효율성이 향상되며, 향후 옛한글 번역 연구 및 번역 교육에서 활용 가능한 기반 자료로 사용될 수 있다.

■ 고전어 자료 번역에 참조 모델 제공과 번역 작업의 인공지능 융합 촉진
전문 번역가와 LLM의 협업을 체계화한 번역 모델을 제공함으로써, 옛한글 자료의 번역에서 뿐만 아니라 고전어 자료 번역 분야 전반에서 활용 가능한 참조 모델을 제시하고, 고전어 자료 번역 연구에 인공지능의 융합을 촉진한다.

■ 옛한글 자료의 현대한글 번역 자동화를 통한 인문학 대중화 촉진
옛한글 자료의 대규모 현대한글 번역은 일반인들도 쉽게 옛한글 자료를 접근할 수 있는 기회를 제공한다. 이는 인문학의 대중적 확산과 문화유산의 현대적 활용에 기여할 것이다.
연구요약
(한글 2000자 이내)
본 연구에서는 옛한글 자료의 현대한글 번역을 효율적이고 일관성 있게 수행하기 위한 MCP기반 번역가–LLM 협업 번역 모델 및 그 성능의 분석을 수행한다. 이는 전문 번역가 위주로 수행되던 기존 번역 방식의 한계성을 극복하고 거대 언어 모델(Large Language Model, LLM)과의 협업을 통해 대량의 옛한글 자료를 일관성 있게 번역할 수 있는 가능성을 증대하려는 것이 목적이다.

연구 목적을 달성하기 위해 수행할 연구 내용은 다음과 같다.

■ 첫째, 번역 지식 자료의 설계 및 체계화
옛한글–현대한글 번역의 정확성과 일관성 향상에 필요한 번역 지식(표기 변환, 전문용어의 해석, 어조 지침 등) 자료의 유형을 정의하고, 이를 LLM이 활용 가능한 형태의 자원으로 체계화하는 방법을 연구한다.

■ 둘째, MCP기반 번역가–LLM 협업 번역 모델의 설계 및 구축
구축된 번역 지식 자료는 MCP를 활용 LLM에 전달되고, LLM이 이를 참조해 번역을 수행하는 번역가-LLM 협업 번역 모델의 설계 및 구축을 연구한다.

■ 셋째, MCP기반 번역가–LLM 협업 번역 모델의 적용 및 성능 분석
구축된 번역가-LLM 협업 번역 모델을 실제 옛한글 자료 번역에 적용하여 번역의 정확성, 일관성, 그리고 재현 가능성 측면에서의 성능을 분석 연구한다.

연구 목적을 달성하기 위한 연구 방법은 다음과 같다.

■ 첫째, 번역 지식 자료 구축
전문 번역가가 번역한 옛한글–현대한글 자료와 번역가-LLM 번역 협업 과정 중에 파악되는 번역 지식을 체계적으로 표현 및 구축하는 방법을 연구한다. 또한 번역 지식 자료를 대량으로 자동 구축하기 위한 방법의 연구도 수행한다.

■ 둘째, MCP기반 번역가–LLM 협업 번역 모델의 설계 및 구축
번역 지식 자료의 구축, LLM의 번역 생성, 오류 검토 및 수정 사항의 지식 자료화 등의 과정을 순환적으로 적용하는 작업 흐름의 정립을 연구하며, 이를 바탕으로 MCP기반 번역가-LLM 협업 번역 모델의 설계 및 구축을 연구한다.

■ 셋째, 구축된 MCP기반 번역가–LLM 협업 번역 모델의 성능 분석
동일한 옛한글 자료를 대상으로 단순 LLM 번역 결과와 MCP기반 번역가–LLM 협업 번역 결과를 비교하여 정확성, 문맥 일관성, 오류 감소 정도를 분석한다. 그리고 LLM의 처리 과정을 추적하여 정량적 비교를 수행하고, 정성적 분석과 사례 분석을 병행함으로써 제안한 협업 번역 모델의 유효성과 한계점을 분석한다.
키워드(Keyword)
(한글 250자 이내)
옛한글, 번역, 인공지능, 거대 언어 모델, 모델 콘텍스트 프로토콜, 옛한글-현대한글 병렬 자료, 자연어 처리
키워드
(영어 500자 이내)
Pre-Modern Korean, Translation, Artificial Intelligence(AI), Large Language Model(LLM), Model Context Protocol(MCP), Pre-Modern Korean-Modern Korean Parallel Text, Natural Language Processing(NLP)

게시물 강남오 / 강원대학교 강릉캠퍼스 / 옛한글 자료 번역을 위한 MCP기반 번역가-LLM 협업 번역 모델 연구 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.

13 - 韩国数字人文协会（KADH）

정연주 / 고려대학교 / 언어모델을 활용한 조선시대 사형·감형 사례 추출과 시대적 맥락 분석 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월

作者Baro

2026年5月14日 23:00

연구요약문
연구목표
(한글 2000자 이내)
사형은 국가가 보호하려는 최우선 가치 및 질서를 어긴 사람들에게 선고된다. 따라서 사형은 조선의 통치이념과 중요 가치가 무엇인지 알 수 있는 소재이다. 감형 기준을 설명할 때 법학에서는 일정한 기준이 있다고 설명하며, 이를 법치와 연관 짓는다. 역사학에서도 일정한 기준이 있음을 인정하지만 이를 유교적 관점으로 해석하고자한다. 즉 사형과 감형 문제는 예치주의, 법치주의 등 통치 이념 설명과도 연관된다. 또한 사형 감형은 단순히 휼형(恤刑)·애민(愛民)뿐만 아니라 국정 운영 사상 및 방식, 감형의 정당화 논리가 응축되는 지점이기도 하다. 한편 조선의 통치 철학 중 하나인 흠휼에 대해서도 단순한 수사로만 작동했는지 아니면 실제로 통계적으로 유의미한 감형의 논리로 사용되었는지는 실제 사례를 통해 분석해야 한다.
정리하면 사형과 사형 감형의 사례를 분석하는 것은 통치 이념·국정운영 방식 해명, 역모 등 정치 상황 고려 측면에서는 정치사, 법이 실제 적용되는 모습을 검토하는 측면에서는 사회사, 법과 형벌 및 법감정 검토 측면에서는 법제사의 관점에서 바라볼 수 있는 주제이다. 기존에는 특정 왕대나 자료를 중심으로 살펴봤으며, 모든 연구들이 각기 기준이 달라 통합해서 이해하기도 어려워 조선 전시기를 동일한 기준으로 분석할 필요가 있다. 그런데 개인이 모든 기록을 다 검토하기 어렵기 때문에 AI인문학 방법론으로 분석하여 조선 전 시기의 사형 및 감형 사례를 검토한 후 그 안에 담긴 역사적 맥락과 의미를 읽고자 한다. 이는 AI 시대 역사학의 방향과 역사학자의 역할을 제시해주는 기능도 할 것이다.

사형 및 사형 감형 사례의 인물별·사건별 추출 및 검수
언어모델을 활용하여 태조~철종실록에서 사형 및 사형 감형 사례를 인물별·사건별로 추출하고 검수하여 정리하고자 한다. 사형 및 사형 감형은 키워드 검색만으로는 해결하기 어렵다. 이 때문에 단순 규칙 기반으로 사료를 추출하는 기존 디지털인문학 방식으로는 한계가 있으므로 AI인문학 방법론을 도입할 것이다.
왕대별·범죄별 사형 및 사형 감형의 건수·비율·차이 비교를 통한 기준 확보
추출한 사료를 바탕으로 왕대별·범죄별 사형 및 사형 감형의 건수, 비율, 차이 등을 비교하고자 한다. 멀리서 읽기(distant reading) 방식으로 전체 경향을 조망하여 특정 왕대에서 관찰되는 현상이 일시적이고 특수적인 것인지 혹은 장기적 경향 속에서 반복되는 패턴인지 판별 가능한 기준을 얻을 것이다. 전수 조사를 통해 기준을 세우고 경향성을 확인한 다음 연구를 진행한다면 보다 정밀한 질적 해석이 가능해질 것이다. 이를 통해 다른 연구에서도 참고할 수 있는 비교 기준을 설정하고자 한다.
사형·감형이 작동되는 논리와 정치·사회적 조건, 역사적 배경 고찰
이상의 결과를 토대로 변곡점을 찾고 그에 대해 구체적 분석을 진행한다. 사형과 감형이 작동되는 논리와 각 왕대별 정치적·사회적 조건, 역사적 배경 등을 고찰하고 전쟁, 기근, 역병 등과 함께 사회 안정을 위해 감형이 더 늘어났는지 검토하여 사회 안정 기능도 살펴볼 수 있다. 감형시 언급되는 담론의 내용 및 유형, 흠휼의 실제 적용 양상, 감형 판단 기준 역시 검토할 예정이다. 이를 통해 사형과 사형 감형이 단순히 형벌제도가 아니라 국가가 사회 질서를 유지하고 통치를 정당화하는 방식과 긴밀히 연관되어 있음을 밝히고 조선의 국정운영과 통치 이념 등을 장기적 시야에서 재구성하고자 한다.
기대효과
(한글 2000자 이내)
연구결과의 학문적 기대효과 ◾ 사례 전체 분석을 통한 사형·사형 감형 의미의 재검토
본 연구는 조선 전시기 실록에 나타난 사형 및 사형 감형 사례를 사건 단위로 정리·구조화하여, 특정 왕대·자료 중심 연구가 갖는 한계를 보완한다. 사형·감형의 규모와 추이를 장기 추세로 제시하여 기존 연구와 동일한 결론에 도달하더라도 그 결론이 특정 시기의 우연인지, 반복적으로 나타나는 경향인지 검증 가능한 근거를 제공한다. ◾ 왕대별·범죄별 비교를 통한 기준 제시
왕대별·범죄별로 사형 사건의 규모와 감형 비율을 비교할 수 있어 특정 왕대 혹은 특정 범죄의 관행이 장기 추세 속에서 예외인지 일반적 경향과 유사한지 판단할 기준을 제공한다. ◾ 통치이념·국정 운영 방식의 실증적 검토
감형이 적용되는 범죄와 거의 적용되지 않는 범죄가 구분되면 국가가 중요하게 다룬 가치와 용인 범위를 실증적으로 제시할 수 있다. 더 나아가 흠휼이 수사에 머물렀는지 실제 정책으로 작동했는지를 사례 기반으로 검토할 수 있게 되어 조선의 통치 이념과 국정 운영 방식에 대해서도 설명할 수 있게 될 것이다.
연구결과의 활용방안 ◾ 분석 대상 확대와 후속 연구로의 연결
본 연구의 방법론을 활용하여 『승정원일기』, 『비변사등록』, 『일성록』, 『추안급국안』, 『심리록』 등으로 분석 범위를 넓혀 사형·감형의 논리와 운영 방식을 더 촘촘히 추적할 수 있다. 또한 장기 추세와 비교 기준을 통해 특정 왕대 또는 특정 범죄군을 더 깊이 있게 해석하는 연구로도 이어질 수 있다. ◾ 형벌 전반을 비롯한 연구 범위 확장
사형뿐 아니라 유배·장형 등 다른 형벌에도 동일한 사건 단위 정리와 비교 분석을 적용할 수 있으며, 제도와 현실 사이의 간극을 통해 당대 사회상을 해명하는 사회사적 연구로 확장 가능하다. 또한 사료를 연결하고 문맥을 읽어야 하는 모든 연구들에 해당 방법론을 적용할 수 있다. ◾ AI인문학의 방법론 제시
AI를 역사 해석 주체로 사용하는 것이 아니라 사료를 정리하고 분석하는 도구로 활용할 수 있다. 이 과정에서 인간이 개입하여 더 나은 결과물을 얻도록 검수와 재학습을 진행한다. 이를 통해 AI활용과 관련하여 역사학 연구가 나아갈 방향과 연구자의 역할을 구체적으로 보여주는 연구 사례가 될 것이다.
연구요약
(한글 2000자 이내)
본 연구의 대상은 태조~철종대 실록이며, 고종대부터는 대한제국이 선포되면서 정치체제 및 법제 운영의 기준이 바뀌어 동일한 기준으로 비교하기 어렵기 때문에 제외한다. 조선 전 시기를 유사한 기준으로 분석하기 위해 실록만 활용한다. ◾ 연구 대상

사형 집행 사례와 더불어 율이나 당시의 인식에 따라 사형에 해당하는 범죄를 저질렀으나 감형이 된 사례를 검토·분석한다.
『대명률』과 『경국대전』부터 『대전회통』까지 조문에 감형이 명시되지 않았음에도 감형이 된 경우, 또는 최종 확정 처벌이 더 낮아지거나 석방되는 경우를 포함한다. 사면, 무고로 인한 석방 역시 추출하여 다른 감형 유형과 비교할 것이다. 이후 1년간 기록이 나타나지 않으면 불명으로 처리한다. ◾ 연구 방법 ① 사형 관련 표현을 찾아 사건 후보를 만들고 문맥을 검토하여 사형 집행·감형·불명으로 구분(사건 탐지(Event Detection))
② 실록 웹페이지의 인물명 태깅 정보를 활용해 인명을 추출하고, 인물과 기사 후보를 연결해 최초 등장 이후 1년간 관련 기사를 묶어 사건 단위로 재구성(사건 추적(Event Tracking))
③ 관계 추출(Relation Extraction)로 인물-율명-형벌 연결을 구조화하고, 일부 사례를 선별해 기준 마련
④ 추정 결과는 확정하지 않고 사람의 검수와 오류 수정을 반복하는 HITL(Human In The Loop) 방식으로 기준을 계속 다듬음
⑤ 위의 방법을 Few-shot prompting 프롬프트 기반으로 진행함 ◾ 분석 및 해석
추출·정리한 데이터를 바탕으로 왕대별·범죄별 사형·감형을 정리하고, 사형이나 감형 증감의 역사적 배경, 정치적 상황, 역병·기근 등 사회적 상황, 형벌 및 법감정 등 법제사적 맥락, 국왕의 국정운영 사상 및 방식과 통치 이념 등을 함께 고려하여 시대적 맥락을 검토한다.
키워드(Keyword)
(한글 250자 이내)
조선왕조실록, 사형, 감형, 디지털인문학, AI인문학, 언어모델
키워드
(영어 500자 이내)
Veritable Records of the Joseon Dynasty, death sentence, commutation, digital humanities, AI humanities, large language model, LLM

게시물 정연주 / 고려대학교 / 언어모델을 활용한 조선시대 사형·감형 사례 추출과 시대적 맥락 분석 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.

13 - 韩国数字人文协会（KADH）

이현정 / 고려대학교 / 정렬 기반 커버리지 기법을 활용한 고려시대 사료의 비대칭적 계승 연구: 『고려사』 열전, 『고려사절요』 졸기, 고려시대 묘지명을 중심으로 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월

作者Baro

2026年5月14日 22:59

연구요약문
연구목표
(한글 2000자 이내)
고려시대 연구의 핵심 자료인 『고려사』와 『고려사절요』는 조선 초 여러 차례의 개수 과정을 거쳐 완성된 사서이다. 기존 연구는 이들 사서가 원전 사료를 충실히 수록했다는 점에 주목하여 묘지명 등과의 비교를 통해 찬자의 시각과 편찬 의도를 분석해 왔다. 하지만 기존의 연구 방식은 서술 양상의 대조에 치중하여 사료 간 유사성을 객관적으로 증명할 정량화된 수치가 부족하다는 한계가 있다. 또한 주로 자구 일치 여부를 확인하는 수준에 머물러 의미와 맥락 중심의 심층적 분석이 미흡하며, 분석 시기 역시 방대한 사료의 양으로 인해 고려 전 시기를 포괄하지 못했다는 문제점이 있다.
기술적 발달로 텍스트 정량화가 가능해지면서 사료 간 유사도 분석이 진행되어 왔으나, 유사도 지표는 대칭적인 성격을 띠기 때문에 사료 편찬의 계보나 방향성을 설명하기에는 역부족이다. 이에 본 연구는 커버리지(Coverage) 개념을 도입하여 이러한 단점을 극복하고자 한다. 커버리지는 한 사료의 정보가 다른 사료에 포함된 정도를 측정함으로써 사료 사용의 우선순위와 선택 및 배제 과정을 실증적으로 추론하게 한다. 이를 통해 사료 간 관계를 원사료-편찬사료-요약사료라는 계층적 구조로 재구성하고, 텍스트 공유 양상을 방향성 있는 비대칭 구조로 분석할 수 있다.
커버리지 기반 분석은 단순한 유사도 측정으로는 포착하기 힘든 요약･삭제･재구성과 같은 서사적 개입 양상을 식별하는 데 효과적이다. 특정 의미 단위가 포함되지 않는 경우를 편찬자의 선택적 삭제로 해석하고, 사건은 유지되나 평가 어휘가 변하는 경우를 의도적인 재구성으로 구분하여 분석함으로써 사료 간의 차이를 단순한 불일치가 아닌 능동적인 편찬 행위의 결과로 규명할 수 있다. 결론적으로 본 연구는 정적인 비교를 넘어 커버리지라는 동적 지표를 통해 고려사 편찬 과정의 실제 작동 방식을 밝히고, 원간섭기를 포함한 고려 전 시기로 연구 범위를 확장하여 역사학 방법론의 새로운 지평을 넓히고자 한다.
기대효과
(한글 2000자 이내)
첫째, 사료 비판의 객관화가 가능하다. 그동안 연구자의 주관적 분석에 의존했던 사료 비교를 유사도 점수나 커버리지 값과 같은 수치화된 지표로 제시함으로써 분석의 객관성을 확보한다.
둘째, 거시적인 역사상 도출이 가능하다. 수작업으로는 분석하기 어려웠던 방대한 분량의 사료에 대해 정렬(Alignment) 분석을 수행함으로써, 지엽적인 데이터에 매몰되지 않고 시대를 관통하는 변화 양상을 관찰할 수 있다. 이는 삼국시대 및 조선시대와의 비교 연구로도 확장 적용이 가능하다.
셋째, 역사학 연구 방법론의 지평을 확대할 수 있다. 전통적인 문헌 해독 방식과 최신 NLP 기술을 결합한 시도는 고려시대 전반의 정보 계승 구조를 분석하는 데 있어 새로운 표준 모델을 제시한다. 특히 SIKU-BERT와 같은 모델을 활용한 맥락적 유사성 측정은 단순 키워드 매칭을 넘어선 ‘맥락적 사료 비판’의 가능성을 열어준다.
마지막으로, 연구 과정에서 생성되는 데이터셋과 언어 모델의 실용적 활용이다. 이는 향후 역사 정보 서비스나 디지털 아카이브 시스템에 탑재될 수 있다. 특히 특정 사료 검색 시 연관 사료를 함께 제시하고, 사료 간 정보 일치율과 차이점을 시각화하여 보여줌으로써 역사 기록의 전승 과정을 쉽게 이해하도록 돕는 교육적 도구로 활용할 수 있다.
연구요약
(한글 2000자 이내)
본 연구는 『고려사』 열전, 『고려사절요』 졸기, 그리고 고려시대 묘지명을 비교 분석하여 사료 간의 유사성을 확인하고 정보의 원천 자료가 전승되는 과정을 탐색하는 것을 목적으로 한다. 연구 대상으로 인물 중심의 사료인 열전, 졸기, 묘지명을 선정한 이유는 인물에 대한 서술이 찬자의 시각 변화와 사료 간의 상호참조성을 가장 잘 보여주는 소재라고 생각했기 때문이다. 특히 관찬사서인 열전·졸기와 미화의 성격이 강한 묘지명 사이의 주관적 평가를 배제하고 실질적인 유사도를 비교함으로써, 사료 편찬 과정에서 각 자료가 구체적으로 어떻게 활용되었는지 규명하고자 한다.
연구 방법론 측면에서는 최신 자연어 처리 기술인 BERT를 활용한다. 우선 한 인물에 대한 세 종류의 사료를 병렬 코퍼스로 구축한 뒤, 문장 임베딩을 통해 코사인 유사도와 커버리지 값을 산출한다. 이를 연구자가 구축한 정답셋과 비교하여 모델의 신뢰도를 검증하고, 틀린 지점을 분석함으로써 의미 단위의 비대칭성을 확인한다. 나아가 사료 특유의 변용 패턴을 모델에 학습시키는 파인튜닝 과정을 거쳐 고려 전 시기의 묘지명을 대상으로 실험을 확대하여 방법론의 일반화 가능성을 입증하고자 한다.
백임지의 사례를 통한 시범 분석 결과, 세 사료는 입사 경위나 최종 관직 등 핵심 정보는 공유하고 있으나 서술 방식에서는 뚜렷한 차이를 보인다. 열전과 졸기에는 백임지의 농민 출신 배경과 무인정변 내용이 명시된 반면, 묘지명에서는 이러한 불리한 사실이 누락되고 대신 구체적인 관직 역임이나 장례 정보가 강조되는 비대칭적 양상이 확인된다. 또한 동일 구문에 대한 문자열 유사도와 커버리지 값의 차이는 찬자의 개입을 시사한다.
향후 본 연구는 고려 전 시기를 대상으로 유사도 계산 자동화를 수행하며, 모델의 예측과 실제 데이터 간의 간극인 ‘비대칭적 계승’의 실체를 규명할 것이다. 사료 간 분량 차이가 큰 경우나 특정 양식이 결여된 사례 등 다양한 변수를 고려하여 실험을 진행하고, 최종적으로 종합 고찰을 통해 고려시대 사료 계승 구조를 역사적 맥락에서 재해석하고자 한다.
키워드(Keyword)
(한글 250자 이내)
사료의 상호참조성, 비대칭적 계승, 정렬 기반 커버리지 기법, BERT 기반 임베딩, 병렬 코퍼스
키워드
(영어 500자 이내)
Cross-referentiality among Historical Sources, Asymmetrical Succession, Alignment-based Coverage Technique, BERT-based Sentence Embedding, Parallel Corpus

게시물 이현정 / 고려대학교 / 정렬 기반 커버리지 기법을 활용한 고려시대 사료의 비대칭적 계승 연구: 『고려사』 열전, 『고려사절요』 졸기, 고려시대 묘지명을 중심으로 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.

13 - 韩国数字人文协会（KADH）

이길환 / 고려대학교 / 한국고전소설의 향유 데이터 구축 및 활용 방안 연구 : 조선후기 평비본(評批本) 한문소설을 중심으로 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월

作者Baro

2026年5月14日 22:59

연구요약문
연구목표
(한글 2000자 이내)
▮연구의 목적과 필요성
 본 연구의 목적은 조선 후기 평비본(評批本) 한문소설들의 문맥 및 비평 정보들을 시맨틱 데이터로 전환하고 이를 기반으로 고전소설의 향유 양상을 작품론 연구에 활용할 수 있는 방안을 제시하는 것이다.
 향유 정보를 갖춘 소설 유관 텍스트 가운데 작품에 직접적 감상-비평을 본문과 물리적으로 인접한 형태로 드러내는 것은 평비본이다. 현재 평비본소설 논의는 「광한루기」 연구를 제외하면 신자료 발굴 차원에서 서지 정리·계열 검토 등을 개괄하는 식의 기초 단계에 머물러 있다. 더군다나 지원자의 조사 결과 협주·협비·두주 등이 단순 낙서 차원을 넘어 자료 전반에 걸쳐 지속적으로 나타나는 평비본-주석본은 학계에 알려진 것보다 방대한 20여 종에 달한다.
 본 과제에서는 ①그간 알려지지 않은 광의의 평비본소설 20여 종 목록을 공유해 고전소설사의 외연을 확장하고, ②서지 및 계열 검토를 넘어 자료에 나타난 비평의 내용과 역할이 어떻게 유형화·구체화되는지, 또 그것들이 본문의 각 장면과 어떻게 유기적으로 연결되는지를 분석해 고전소설의 향유 맥락을 실증적으로 복원하고자 한다.
 그간 고전소설 연구는 접근이 용이한 선본을 중심으로 이루어졌으며 텍스트 내부 작품론 분석에 치중된 결과 작품을 둘러싸고 전개된 문인지식인층의 참여적·향유적 맥락은 상대적으로 부차화되었다. 또한 고전소설비평론 역시 긍정-부정[수용-배격]이라는 이분법적 도식 속에서 논의됐는데 평비본소설에 담긴 다양한 비평 양상은 이러한 구도를 넘어 다각적인 향유 맥락을 포착하는 출발점이 된다. 이러한 분석은 “고전소설의 비평 정보는 어떻게 유형화되어야 하는가?”·“각 이본의 독서 흔적들은 어떻게 관리되어야 하는가?”라는 문제와도 연결되며 나아가 향유자의 흔적을 매개로 작품론 분석을 심화하는 자료적 토대를 형성할 수 있다.

▮목표 달성을 위한 단계적 절차
 중점 목표 : 본 지원자는 온톨로지 기반 한국한문소설 시맨틱 데이터 모델링 방법론(2025)을 참고해 각 자료의 문맥 및 비평 정보가 의미적으로 연결될 수 있는 데이터를 구축하고 이를 토대로 고전소설 연구에서의 활용 방안을 모색하고자 한다.
 연구 범위 : 1년이라는 연구 기간을 고려해 연구 대상을 3종[<만복사저포기(萬福寺樗蒲記)> 일본 내각문고본, <숙향전(淑香傳)> 단국대본, <이생규장전(李生窺牆傳)> 일본 내각문고본]으로 한정한다.
 연구 방법 : 위 평비본소설 3종의 서지적·서사적·비평적 요소들을 시맨틱 데이터로 구조화하고 이를 학술적으로 활용하는 방안을 검토하기 위해 아래와 같은 단계적 연구 절차를 밟는다.

①자료적 토대의 구축 : 이미지 판독의 정밀성 확보를 위해 「숙향전」은 단국대 천안 캠퍼스 현장 촬영을 『서발비평본금오신화』 역시 자료를 전사한 고려대본을 직접 촬영해 저해상도 문제를 해결했다. 또한 세 작품의 본문과 두주에 대한 전산화 및 역주 작업을 완료해 즉각적인 태깅 준비를 마쳤다.

②논리적 기반의 설계 : 데이터 범용성 확보를 위해 선행 XML 논의에서 제안된 마크업 지침안을 적극 수용해 먼저 각 자료를 외부 정보와 내부 정보로 구분한다. 다음 외부 정보는 관리정보·서지정보·구성정보로 대별하고, 내부 정보는 의미적 단위로 분절된 장면을 골격으로 각종 서사적 개체 및 평비·비점 등을 계층적으로 배치해 자료의 물리적·문맥적 특징을 충실히 반영한다.

③ 실질적 데이터 생성: VS Code 환경에서 실물 이미지와 대조하며 본격적으로 XML 데이터를 생성한다. 또한 단순 태깅 작업에 그치지 않고 여타 한문본 계열과의 차이점과 기 연구에서 제안된 마크업 모델링의 실효성 등을 함께 검증한다.

④ 학술적 활용안 검토 : 완성된 시맨틱 데이터를 바탕으로 해당 비평이 각각 어떤 장면과 연결되는지 확인하고 각각의 역할과 기능에 따라 유형화한다. 이를 통해 평비 기입의 맥락, 관심 대목과 관심 등장인물, 비평에 활용되는 개념어와 전고 등 향유 양상의 다층적 지점들을 분석한다. 나아가 서발문의 작성자와 및 현대 연구자들의 비평과 비교함으로써 각각의 관심과 해석이 어디에서 교차하고 어긋나는지를 살필 예정이다.
기대효과
(한글 2000자 이내)
 본 연구는 조선 후기 평비본 한문소설의 문맥 및 비평 정보를 시맨틱 데이터로 구조화하여, 향유자의 독서 흔적을 분석 가능한 연구 자원으로 전환하고 고전소설수용사의 실증적 기반을 마련하고자 했다. 이러한 논의의 결과물은 아래와 같은 성과를 기대할 수 있다.

① 자료적 근거에 기반한 독자 반응의 재구성 : 본 과제는 평비본소설에 내함된 비평 정보들을 데이터 시맨틱 차원에서 구조화함으로써 각 평비자가 어느 구간에서 어떠한 반응을 보였는지 구체화하는 것에 초점을 두었다. 그런 점에서 기 연구과제에서 「상사동전객기」 이본에 부기된 비점과 평문 등을 바탕으로 당대의 향유 맥락을 복원하고자 했던 작업과도 분명한 연결 지점이 있다.
이러한 접근은 독자반응비평 방법론이 갖는 이론중심적 한계, 즉 막연하게 추정되어 온 향유자들의 관심처와 해석 양상을 자료중심적 차원에서 실증적으로 복원·보완한다는 점에서 강점을 지닌다. 이는 단순히 연구방법론의 심화뿐만 아니라 고전소설 교육 현장에서 학습자들을 대상으로 오늘날 나의 감상과 과거 문인지식층의 반응을 비교·검토할 수 있는 교육 자원 –데이터로 읽는 고전소설- 으로도 확장될 수 있다.

② 고전소설사의 지평 확대와 연구 환경 조성 : 본 과제는 기 연구과제와 마찬가지로 이본에 산재된 다양한 향유의 흔적들을 작품 단위로 수집하고, 그간 학계에서 상대적으로 소외되었던 평비본소설의 신자료 목록을 발굴-공유한다는 점에서 고전소설 수용사 연구를 위한 1차적 토대로 기능할 수 있다. 이러한 평비본소설에 대한 검토는 장기적으로는 상술한 문집류·정사류·필기류·간찰류 등 향유 정보를 담아내고 있는 여러 유형의 리소스들과 연계·분석이 가능하다.
특히 본 과제에서는 분석 내용을 단순히 논문 제출만으로 그치는 것이 아니라 표준화된 모델링에 기반한 XML 데이터를 함께 구축·공개한다는 점에서 그 확산성이 크다. 이는 여타 평비본·주석본 소설 연구 전반에 적용 가능한 모델을 제시함과 동시에 향후 고전소설사 수용사와 관련한 방대한 유관 자료들이 효율적으로 축적·연결될 수 있는 개방형 연구 환경을 조성하는 데 일조할 수 있다.

③ 시맨틱 데이터 기반의 연구 분석 모델 제시 : 본 과제에서 생성하는 시맨틱 데이터는 텍스트의 의미와 구조를 조직화하는 작업이기에 웹상의 비정형 데이터를 대상으로 단순 수치와 빈도만을 추출하는 초기 디지털인문학의 피상적 접근과는 질적으로 차별된다. 그간 다수의 DH연구들은 자료와 작품의 형태적·문맥적 요소들을 정밀하게 담아내기보다 통계 기반의 기술중심적 접근에 치중해왔다. 그 결과 해석적 지평이 제한되고 다른 분석 맥락으로 재활용하기도 어려우며 무엇보다도 기존 내용학 연구의 깊이와 괴리되는 측면이 많았다. 물론 고무적이게도 최근 전근대 장르들에 대한 시맨틱 데이터 모델링과 관련한 개념적 설계들이 활발해지는 추세지만, 연구자가 직접 표준 포맷에 맞추어 시맨틱 데이터를 생성·공유하고 실제 작품론 분석에 적용하는 연구는 여전히 드문 실정이다.
그런 점에서 본 과제는 단순 이론적 설계를 넘어 실제적 활용 방안을 모색하고 기존 아날로그 논의 성과들과의 접점을 확보한다는 점에서 의의를 지닌다. 다시 말해 고도화된 XML 데이터를 학계에 제공하는 성과는 물론 데이터 기반의 고전소설 연구 프로세스를 제시한다는 점에서 중요한 연구사적 의미를 갖는다.
연구요약
(한글 2000자 이내)

○ 연구의 목적과 필요성
본 연구의 목적은 조선 후기 평비본(評批本) 한문소설들의 문맥 및 비평 정보들을 시맨틱 데이터로 전환하고 이를 기반으로 고전소설의 향유 양상을 작품론 연구에 활용할 수 있는 방안을 제시하는 것이다.
본 과제에서는 ①그간 알려지지 않은 광의의 평비본소설 20여 종 목록을 공유해 고전소설사 외연을 확장하고, ②서지 및 계열 검토를 넘어 자료에 나타난 비평의 내용과 역할이 어떻게 유형화·구체화 되는지, 또 그것들이 본문의 각 장면과 어떻게 유기적으로 연결되는지를 분석해 고전소설의 향유 맥락을 실증적으로 복원하고 나아가 작품론 분석을 심화하는 자료적 기반을 구축하고자 한다.
그간 고전소설 연구는 접근이 용이한 선본을 중심으로 이루어졌으며 텍스트 내부 작품론 분석에 치중된 결과 작품을 둘러싸고 전개된 문인지식인층의 참여적·향유적 맥락은 상대적으로 부차화되었다. 또한 고전소설비평론 역시 긍정-부정[수용-배격]이라는 이분법적 도식 속에서 논의됐는데 평비본소설에 담긴 다양한 비평 양상은 이러한 구도를 넘어 다각적인 향유 맥락을 포착하는 출발점이 된다. 이러한 분석은 “고전소설의 비평 정보는 어떻게 유형화되어야 하는가?”·“각 이본의 독서 흔적들은 어떻게 관리되어야 하는가?”라는 문제와도 연결된다.

○ 연구 방향성
그간 학계에서 평비본소설을 비롯한 고전소설 수용사 논의가 본격화되지 못한 이유는 향유 맥락과 관련한 유관 작품의 목록이 충분히 공유되지 못한 점에도 있겠으나, 무엇보다 이러한 원천 리소스들을 구조화한 학술 데이터가 제대로 생성-공유되지 못한 데에 기인한다. 이러한 문제의식에 입각해 본 연구는 최근 제안된 한국한문소설 XML 마크업 방법론을 참고해 각 자료의 문맥 및 비평 정보를 의미적으로 연결하는 데이터를 구축하고 이를 토대로 고전소설 연구에서의 활용 방안을 모색하고자 한다.

○ 연구 대상
1년의 연구 기간을 감안해 연구 대상을 3종[<만복사저포기(萬福寺樗蒲記)> 일본 내각문고본, <숙향전(淑香傳)> 단국대본, <이생규장전(李生窺牆傳)> 일본 내각문고본]으로 한정한다. 이들 작품은 분량 대비 평어의 밀도가 높은데다 문장 품평·고유명사 설명·교감 제안·서사 국면에 대한 반응·등장인물 평가 등 다양한 비평 양상을 포함하고 있어 향유 유형을 귀납적으로 도출하기에 적합하다. 또한 서·발문을 함께 갖추고 있어 작품 안팎의 비평을 연계한 종합적 분석도 가능하며 특히 <숙향전> 단국대본의 경우 여타 이본과는 교감이 어려울 정도로 내용적 차이가 크다는 점에서 그 자체만으로도 소개적 가치를 지닌다.

○연구 방법
① 자료적 토대의 구축 : 먼저 조선후기 평비본소설의 이본 현황을 전수 조사하고 관련 목록의 이미지와 서지 정보를 체계적으로 정리한다. 이미지 판독의 정밀성 확보를 위해 해당 원본을 직접 촬영해 저해상도 문제를 해결한다. 또한 세 작품의 본문과 두주에 대한 전산화 및 역주 작업을 완료해 태깅이 가능한 상태로 정비한다.
② 논리적 기반의 설계 : 선행 논의에서 제안된 한문소설 마크업 지침안을 적극 수용해 먼저 각 자료를 외부 정보와 내부 정보로 구분한다. 다음 외부 정보는 관리정보·서지정보·구성정보 층위로 나누고, 내부 정보는 의미적 단위로 분절된 장면을 골격으로 각종 서사적 개체 및 평비·비점 등을 계층적으로 배치해 자료의 물리적·문맥적 특징을 충실히 반영하고 범용성을 확보한다.
③ 실질적 데이터 생성 : VS Code 환경에서 실물 이미지와 대조하며 본격적으로 XML 데이터를 생성한다. 또한 단순 태깅에 그치지 않고 여타 한문본 계열과의 차이점과 기 연구에서 제안된 마크업 모델링의 실효성 등을 함께 검증한다.
④ 학술적 활용안 검토 : 완성된 시맨틱 데이터를 바탕으로 해당 비평이 각각 어떤 장면과 연결되는지 확인하고 각각의 역할과 기능에 따라 유형화한다. 이를 통해 평비 기입의 맥락, 관심 대목과 관심 등장인물, 비평에 활용되는 개념어와 전고 등 향유 양상의 다층적 지점들을 분석한다. 나아가 서발문의 작성자와 및 현대 연구자들의 비평과 비교함으로써 각각의 관심과 해석이 어디에서 교차하고 어긋나는지를 검토한다.
키워드(Keyword)
(한글 250자 이내)
한문소설(漢文小說), 평비본(評批本), 소설비평, 이본(異本), 향유 양상, 독자반응비평, 시맨틱 데이터, 확장성 마크업 언어(XML), 인공지능(AI), 온톨로지(Ontology)
키워드
(영어 500자 이내)
korean novels in literary sinitic(漢文小說), Pingbiben(評批本), Fiction Criticism, Variant Editions, Aspects of Reception, Reader-Response Criticism, Semantic Data, XML(Extensible Markup Language), AI(Artificial Intelligence), Ontology

게시물 이길환 / 고려대학교 / 한국고전소설의 향유 데이터 구축 및 활용 방안 연구 : 조선후기 평비본(評批本) 한문소설을 중심으로 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.

13 - 韩国数字人文协会（KADH）

안진산 / 경북대학교 / 한국어 신어 추출 파이프라인의 설계와 개발 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월

作者Baro

2026年5月14日 22:58

연구요약문
연구목표
(한글 2000자 이내)
본 연구의 목적은 기 수행 과제의 혼성어 추출 방법론과 기존 신어 조사 방법론을 통합하여, 한국어 신어 추출 파이프라인을 설계·개발하는 데 있다. 구체적인 연구 목적은 세 가지이다.
첫째, 거대 언어 모델(Large Language Model, 이하 LLM)을 기존 신어 조사 방법론의 판별 및 집필 단계에 도입하여 신어 조사의 생산성과 효율성을 높이되, 연구자가 언제든 개입하여 중단, 오류 확인 및 수정, 재개할 수 있는 HITL(Human in the Loop) 파이프라인을 설계한다. 파이프라인은 ‘[모듈 1: 말뭉치 수집], [모듈 2: 신어 후보군 추출], [모듈 3: 신어 후보군 정제], [모듈 4: LLM 보조 신어 판별], [모듈 5: LLM 보조 신어 집필]’의 5개 하위 모듈로 구성된다.
둘째, 최근 사전학계에서 논의되고 있는 LLM 보조 사전 편찬의 가능성과 제한 사항을 한국어 신어의 형성 및 사용 맥락에서 실증적으로 검토한다. LLM의 비결정성·비재현성·비사실성을 통제하고, 말뭉치 기반 언어 연구의 원리인 재현 가능성과 반증 가능성을 확보할 수 있는 LLM 보조 신어 판별·집필 프레임워크를 제안한다.
셋째, 신어성 판단의 경계적 사례―고유명사의 신어 지위, 자유 결합, 비유적 의미, 평가적 의미를 내포한 어휘 결합 등―에 대한 귀납적 검토를 통해, LLM 1차 판별을 위한 포괄적 지침과 연구자 2차 판별을 위한 세부적 지침을 이원화하여 수립한다. 이는 LLM과 연구자, 연구자 간 협업에서 일관된 판단 기준으로 기능할 수 있다.
기존 신어 조사 방법론은 기반 자료 수집에서 신어 판별·집필에 이르는 각 단계가 독립적으로 수행되어 전 과정의 재현과 반증이 어려웠으며, 수십만 개에 이르는 신어 후보 항목의 수작업 검토에 상당한 시간과 비용이 소요되어 왔다. 또한 LLM 보조 사전 편찬에 대한 학계의 관심은 커지고 있으나, LLM 생성 결과의 근본적 한계를 신어의 수집과 기술의 관점에서 실증적으로 검토한 연구는 아직 충분하지 않다. 아울러 자유 결합으로 대표되는 신어성 판단의 경계 문제는 전문가 사이에서도 합의가 어려운 쟁점을 포함하고 있어, LLM과 연구자 각각의 역할에 맞는 체계적 지침의 수립이 요구된다.
기대효과
(한글 2000자 이내)
본 연구의 기대 효과 및 활용 방안은 이론언어학, 응용언어학, 국제 공동 연구의 세 가지 측면에서 제시할 수 있다. 이론언어학적 측면에서, 신어는 언어 변화의 산물로서 단어 형성론, 형태론, 의미론 등의 연구 자료를 제공한다. 파이프라인을 통해 체계적으로 수집·정제된 신어 목록은 조어 유형별 생산성 변화를 통시적으로 추적할 수 있는 기반이 되며, LLM 보조 신어 판별 과정에서 축적되는 경계 사례에 대한 귀납적 검토 결과는 신어성 판단이라는 메타언어적 능력을 실증적으로 논의할 수 있게 한다.
응용언어학적 측면에서, 본 연구는 사전학과 자연언어처리 두 분야에 걸쳐 활용될 수 있다. LLM 보조 신어 판별·집필 실험은 LLM 보조 사전 편찬의 가능성과 한계를 실증적으로 검토하는 사례가 되며, LLM의 오류 유형을 체계적으로 분류함으로써 연구자의 개입이 필수적인 단계를 구체적으로 제시할 수 있다. 자연언어처리의 관점에서는 LLM 학습용 데이터의 시간적 한계로 인한 신어 오판 경향을 정량적으로 측정할 수 있으며, 참조 자료 제공 여부에 따른 성능 차이 비교는 RAG 기반 접근법의 효용을 검증하는 사례가 된다.
국제 공동 연구의 측면에서, 본 연구에서 제안한 모듈형 구조의 파이프라인은 언어 보편적으로 적용될 수 있어 영어, 독일어, 스페인어 등의 신어 관측소와 언어별 방법론을 비교할 수 있으며, ENEOLI(European Network on Lexical Innovation) 등 국제 프로젝트와의 연계를 통해 다언어 신어 연구의 방법론적 표준화에 기여할 수 있다. 나아가 동일한 사회·문화적 사건에 대해 각 언어권에서 형성·사용되는 신어의 담화 양상을 비교하는 작업 또한 가능해질 것이다.
연구요약
(한글 2000자 이내)
본 연구는 크게 세 가지 내용으로 구성된다. 먼저, 기존 신어 조사 방법론의 3단계(말뭉치 수집-신어 후보군 추출-신어 후보군 정제)와 본 연구에서 추가적으로 제안하는 LLM 보조 사전 편찬의 2단계(LLM 보조 신어 판별-LLM 보조 신어 집필)를 하나의 파이프라인으로 연결한다. 파이프라인은 총 5개 모듈로 구성되며, 각 단계별 입력값과 출력값, 소요 시간 등의 로그를 기록·관리함으로써 신어 수집의 절차적 투명성을 확보한다.
다음으로, LLM 보조 신어 판별·집필에 대한 정량적·정성적 평가를 수행한다. 판별 실험에서는 약 10만 개의 후보 항목을 대상으로 LLM-연구자 간 혼동 행렬 분석과 형태적·의미적 특성에 따른 오류 경향 분석을 수행하고, 집필 실험에서는 약 1,000개의 신어 항목을 대상으로 LLM-연구자 정의문, 설명문, 예문 쌍의 자카드 유사도, 코사인 유사도(문장 유사도) 측정과 오류 유형 분류를 수행한다. 두 실험 모두 말뭉치 용례, 웹 용례, 벡터스토어 등 참조 자료의 제공 여부에 따른 성능 차이를 비교하며, 모델 규모별 비용과 성능의 균형점을 탐색한다.
마지막으로, 이상의 평가 결과를 바탕으로 신어성 판단 지침을 수립한다. 고유명사의 신어 지위(임시적 재명명, 사회 현상을 담고 있는 고유명사 포함 구성 등), 자유 결합과 합성어의 경계(의미적으로 합성적인 어휘 결합, 비유적 의미 포함 유형, 평가적 의미 포함 유형 등)를 포함한 경계적 사례에 대한 귀납적 검토를 통해, LLM을 위한 일반 지침(신어 후보 항목을 최대한 유지하기 위한 포괄적 기준)과 연구자를 위한 상세 지침(형태적, 의미적, 담화·화용적 쟁점을 포함한 세부 기준)을 이원화하여 수립한다. 이를 통해 LLM과 인간, 인간과 인간 사이의 협업에 기준점이 될 수 있는 체계적 판단 근거를 마련한다.
키워드(Keyword)
(한글 250자 이내)
신어, 신어성 판단, LLM 보조 주석, LLM 보조 사전 편찬, 파이프라인 구조
키워드
(영어 500자 이내)
Neologism, Neological Intuition, LLM-assisted Annotation, LLM-assisted Lexicography, Pipeline Architecture

게시물 안진산 / 경북대학교 / 한국어 신어 추출 파이프라인의 설계와 개발 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.

13 - 韩国数字人文协会（KADH）

이윤정 / 홍익대학교 / 온톨로지 기반 문화정책 도메인 특화 LLM 및 RAG 시스템 개발에 관한 연구 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월

作者Baro

2026年5月14日 22:55

연구요약문
연구목표
(한글 2000자 이내)
최근 대규모 언어모델(LLM)과 검색 증강 생성(RAG) 기술의 발전은 문화정책 분야의 혁신을 주도하고 있다. LLM은 방대한 데이터를 바탕으로 고차원적인 언어 처리와 추론을 수행하여 정책 시뮬레이션 및 의사결정 지원에 탁월한 가능성을 보여주며, RAG는 외부의 정확한 지식 베이스를 참조함으로써 LLM의 본질적 한계인 환각 현상을 억제하고 답변의 신뢰성을 담보한다. 이 두 기술의 결합은 방대한 정책 문헌과 데이터를 실시간으로 분석하여 증거 기반(evidence-based) 정책 수립을 가능케 하고 행정가와 이해관계자 간의 협업을 촉진하는 전략적 도구로 부상하고 있다.
그러나 문화정책 도메인은 예술적 가치와 사회, 경제적 효용이 혼재된 복잡성과 용어의 의미적 유동성으로 인해 단순한 AI 도입만으로는 한계가 있다. 이에 대한 해법으로 제시되는 온톨로지(ontology)는 도메인 지식을 체계적으로 구조화하여 AI가 개념 간의 맥락과 위계를 명확히 이해하도록 돕는 핵심 기반이다. 온톨로지와 결합한 LLM 및 RAG 시스템은 단순한 키워드 매칭을 넘어 ‘의미론적 추론’을 수행함으로써, 모호한 정책 용어의 맥락을 파악하고 데이터의 파편화 문제를 해결하여 전문가 수준의 심층적 분석을 제공한다.
궁극적으로 온톨로지 기반의 LLM-RAG 시스템은 문화정책의 데이터 분석 및 의사결정 체계를 획기적으로 첨단화할 것이다. 이 시스템은 각 정책 분야에 특화된 다중 AI 컨설턴트 역할을 하여 지역 문화 격차 해소와 같은 복합적 문제에 대해 구체적이고 실효성 있는 대안을 제시한다. 또한 비정형 텍스트와 정량적 지표를 융합 분석하여 정책의 성공 및 실패 패턴을 도출하여 직관이나 경험에 의존하던 기존 관행을 탈피하고 과학적 데이터에 근거한 객관적이고 투명한 정책 수립 프로세스를 확립하는데 기여할 것이다.

본 연구는 전술한 기술적 당위성을 바탕으로 온톨로지 기반 문화정책 도메인 특화 LLM 및 RAG 시스템(ONtology-driven LLM and RAG system specialized for the Cultural Policy Domain: 이하 CPD-ONLR)을 개발하는데 목적이 있다. 이를 통해 정책입안자, 정책결정권자, 행정 수행자, 관련 연구자 등이 문화정책 정보와 적용을 체계적으로 검색하고 관리할 수 있는 증거 기반 정보제공 체계를 마련하고자 한다. 구체적인 연구의 세부목표는 다음과 같다.

첫째, 문화정책 도메인 온톨로지 구축을 통한 지식의 표준화이다. 문화정책 분야에 산재한 비정형 텍스트와 이질적인 데이터를 체계적으로 통합하기 위해, 개념 간의 의미적 관계를 명시하는 고도화된 지식 그래프(knowledge graph)를 설계한다.
둘째, 신뢰성 있는 온톨로지 기반 LLM 및 RAG 시스템의 구현이다. 구축된 온톨로지를 문화정책 문헌에 특화된 지능형 질의응답 및 분석 시스템을 개발한다.
기대효과
(한글 2000자 이내)

학문적 기대효과
본 연구의 과정과 주요 결과는 문화정책과 AI 기술의 융합연구에 대한 선도적 모델을 제시하는 등 학문적으로 중요한 기초자료로 활용될 것이다. CPD-ONLR의 개발 과정은 문화정책학, 행정학, 데이터사이언스, 인공지능 등의 분야 등의 다학문적 접근과 융합연구를 촉진하여 추후 문화데이터 분석, 문화 거버넌스, AI 기반 정책연구 등 관련 분야 후속 연구에 핵심 자료를 제공할 것이다. 특히 본 연구에서 제시하는 문화정책 온톨로지 구축 방법, LLM과 RAG의 결합 등은 문화정책 연구의 새로운 학술 패러다임을 형성하는 데 기여할 것이다.
또한 구조화된 지식 그래프와 LLM의 유기적 결합은 모델 추론의 일관성을 높이고 잘못된 정보 생성을 억제할 수 있음이 보고되고 있으며, 본 연구는 이러한 첨단 기법을 문화정책 연구에 적용함으로써 AI 활용 사회과학 연구의 신뢰도를 제고할 것이다. 또한, 본 연구에서 구축된 문화정책 온톨로지는 방대한 문화정책 지식을 체계화하여 관련 학계에 표준화된 지식 인프라를 제공하고, 연구자들이 이를 활용하여 이질적인 문화정책 데이터를 비교하고 분석할 수 있게 하는 등 문화정책 연구의 이론적 기반 강화와 지식 축적의 선순환에 기여할 것으로 기대된다.
정책적 기대효과
본 연구에서 개발되는 CPD-ONLR은 데이터 기반 문화정책 수립을 위한 핵심 의사결정 지원도구로 활용될 것이다. 이는 문화정책 온톨로지와 관련 문서를 결합함으로써 정책입안자 및 정책결정권자는 방대한 법령, 백서, 연구보고서에서 정보와 근거를 즉시 확보하고 다양한 정책대안의 효과를 비교 및 분석할 수 있다. CPD-ONLR이 생성하는 답변에는 항상 출처가 명시되어 정책 판단의 신뢰성을 높일 수 있을 것이며, 이는 기존에 전문가 경험이나 정성적 분석에 의존하던 문화정책 평가 방식의 객관성을 강화하는데 도움이 될 것이다.
이와 같은 CPD-ONLR은 문화체육관광부, 한국문화관광연구원 등 주요 문화정책 기관에서 정책정보 조달 및 효과를 평가하고 의사결정을 내리는데 활용될 것이다. 이는 정책수립 단계에서부터 증거 기반 접근을 정착시켜 정책의 책임성과 투명성을 제고할 수 있다. 또한 본 CPD-ONLR이 제공하는 정보는 문화정책 법·제도 정비 및 중장기 계획 수립을 지원하고 국제기구의 문화정책 권고나 협약에 부합하는 정책설계가 가능해지는 등 정책적 활용 범위가 넓다. 이와 같이 본 연구는 국가 정책의 증거 기반 정책결정 문화조성에 기여하고, 정책담당자들이 복잡한 문화정책 환경에 선제적으로 대응할 수 있도록 도울 것이다.
연구요약
(한글 2000자 이내)
문화정책 온톨로지 구축
본 연구는 문화정책 도메인의 복합적 지식 구조를 체계화하기 위해 정책 및 현장 전문가로 구성된 이원화된 포커스 그룹 인터뷰(FGI)를 수행하여 핵심 클래스와 속성을 도출한다. 도출된 개념 모델은 Protégé 등을 활용해 법령, 백서, 지원사업 공고문의 구조적 특성을 반영한 온톨로지 스키마로 형식화되며, 정책 시나리오 기반의 인스턴스를 구축하여 추론의 논리적 정합성을 검증한다. 특히 중앙정부와 지자체 사업 간의 조건 차이 등 다양한 맥락을 인스턴스 수준에서 구별하고 일관된 추론 결과를 산출하는지 확인함으로써 향후 지능형 질의응답을 위한 견고한 지식 기반을 마련한다.
도메인 특화 LLM 파인튜닝 및 RAG 모듈 구현
구축된 온톨로지와 문화정책 코퍼스를 기반으로 LLaMA, Mistral 등 최신 LLM에 파라미터 효율적 파인튜닝(PEFT/LoRA)을 적용하여 도메인 특화 모델을 개발한다. 이 모델은 정책 문서의 고유한 서술 구조와 인과관계를 학습하여 근거 기반의 조건부 서술 능력을 갖추도록 최적화된다. 또한, 이미지, 공고문 등의 비정형 데이터와 최신 API 정보를 포괄하는 Agentic RAG 모듈을 구현하여, 판단형, 설명형, 복합형 등의 질의 유형에 따라 온톨로지 구조적 질의와 벡터 검색을 유연하게 결합하는 하이브리드 추론 경로를 운용한다. 이를 통해 환각 현상을 억제하고 최신성과 정확성이 담보된 투명한 정책 자문 서비스를 구현한다.
시스템 평가 및 검증
개발된 시스템(CPD-ONLR)의 실효성은 정량적·정성적 평가를 통해 입체적으로 검증된다. 정량적 차원에서는 RAG 평가 방법론을 준용하여 검색 모듈의 정밀도(precision), 재현율(recall), NDCG 지표와 생성 모듈의 문맥 적합성, 오정보 비율 등을 측정한다. 정성적 차원에서는 도메인 전문가가 참여하는 튜링 테스트 방식을 도입, AI 산출물과 전문가 보고서의 해석 깊이 및 타당성을 비교 분석함으로써 실무 현장에서의 활용 가능성과 신뢰성을 확보한다.
키워드(Keyword)
(한글 250자 이내)
문화정책, 증거기반 정책, 온톨로지, 검색 증강 생성, 대규모언어모델, 지식 그래프
키워드
(영어 500자 이내)
Cultural Policy, Evidence-based Policy, Ontology, Retrieval-Augmented Generation, Large Language Model, Knowledge Graph

게시물 이윤정 / 홍익대학교 / 온톨로지 기반 문화정책 도메인 특화 LLM 및 RAG 시스템 개발에 관한 연구 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.

13 - 韩国数字人文协会（KADH）

신근영 / 한국연구재단 / 아이트래킹을 활용한 중국어 정보 구조의 원칙과 인지적 처리 양상 연구 — 문답 구조에서 문장이 전달하는 정보와 의미의 구별을 중심으로 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월

作者Baro

2026年5月14日 22:50

연구요약문
연구목표
(한글 2000자 이내)
본 연구는 아이트래킹 실험을 통해 중국어 문답 구조에서 정보가 어떻게 배치되고 처리되는지를 실증적으로 분석하고, 그 결과를 바탕으로 문장이 전달하는 정보와 문장 의미가 어떻게 구별되는지를 중국어 정보 구조 관점에서 규명하는 것을 목표로 한다. 중국어 정보 구조 연구는 화제와 초점, 문장 성분 배열, 담화 기능 등 다양한 주제를 중심으로 축적되어 왔으나, 정보 초점의 배치가 실제 읽기와 이해 과정에서 어떠한 처리 부담과 시선 패턴 차이를 유발하는지에 대한 실험적 검증은 매우 제한적으로 이루어져 왔다. 특히 질문이 요구하는 정보 유형과 응답 문장의 정보 초점 위치가 어긋날 때, 문법적으로는 가능하지만 부적절하게 인식되는 현상이 발생하는데, 이는 문장 의미(언어 단위로서의 의미)와 문장이 전달하는 정보(문답 환경에서 선택·강조되는 정보)가 항상 일치하지 않음을 보여준다.
이에 본 연구는 특수의문문과 선택의문문으로 구성된 중국어 문답 구조를 연구 범위로 한정하고, 질문이 요구하는 정보 유형(대상 초점, 사건 초점, 대안 제시)과 응답 문장의 정보 초점 위치(문두, 문중, 문말), 배경 정보 제공 여부가 읽기 처리 과정에 미치는 영향을 아이트래킹 실험을 통해 분석한다. 구체적으로 시선 고정 시간, 회귀(재읽기) 발생 양상, 전체 읽기 시간을 주요 처리 지표로 삼아, 정보 초점 배치 원칙이 실제 인지적 처리 부담 차이로 구현되는지를 검증하고자 한다.
이를 통해 본 연구는 중국어 정보 구조를 단순한 이론적 기술 대상에 머무르지 않고, 실제 언어 처리 과정에서 작동하는 원리로서 객관적으로 제시하고, 문답 구조에서 문장이 전달하는 정보와 문장 의미가 구별되는 조건과 기제를 실증적으로 설명하는 것을 궁극적 목표로 한다.
기대효과
(한글 2000자 이내)
본 연구는 중국어 정보 구조 연구에 아이트래킹 기반 실증 방법을 도입함으로써, 기존의 이론적·통사적 논의를 실제 언어 처리 지표와 연결한다는 점에서 학문적·방법론적 기여가 기대된다. 첫째, 문답 구조에서 질문이 요구하는 정보 유형과 응답의 정보 초점 배치가 읽기 처리 부담에 미치는 영향을 정량적으로 제시함으로써, 문장이 전달하는 정보와 문장 의미의 구별 문제를 정보 구조 관점에서 실증적으로 뒷받침할 수 있다. 이는 정보 구조 연구에서 오랫동안 논의되어 온 초점과 배경 정보의 기능을 인지적 처리 차원에서 검증하는 사례를 제공한다는 점에서 의의가 있다.
둘째, 정보 초점의 위치와 배경 정보 제공 여부에 따라 특정 구간(초점 표지 영역, 핵심 술어 영역 등)에서 시선 고정 시간과 회귀 패턴이 어떻게 달라지는지를 제시함으로써, 중국어 정보 구조 원칙을 ‘처리 기반’으로 정교화할 수 있는 근거를 확보할 수 있다. 이를 통해 정보 구조 이론의 설명 범위를 문장 적절성 판단과 실제 이해 과정으로 확장하는 데 기여할 수 있을 것이다.
셋째, 연구 수행 과정에서 구축되는 문답 구조 실험 자극물 세트와 아이트래킹 분석 프로토콜은 향후 중국어 정보 구조 연구 및 실험 언어학 연구에서 재사용 가능한 중간결과물로 기능할 수 있다. 교육적 측면에서는 중국어 학습자가 문답 상황에서 응답의 자연스러움과 적절성을 판단하는 데 필요한 기준을 정보 초점과 처리 부담의 관점에서 설명하는 보조 자료로 활용될 수 있으며, 문법 규칙 중심 설명만으로는 어려운 ‘자연스러움’ 문제를 보완하는 데 기여할 수 있다. 또한 본 연구 성과는 학술대회 발표와 학술지 논문 게재를 통해 확산되어, 중국어 정보 구조 연구의 실험 기반 후속 연구로 연계될 수 있는 토대를 마련할 것으로 기대된다.
연구요약
(한글 2000자 이내)
본 연구는 중국어 문답 구조에서 정보 초점 배치와 배경 정보 제시가 읽기 처리 과정에 미치는 영향을 분석하기 위해 문장 읽기 과제 기반 아이트래킹 실험을 수행한다. 연구 대상은 특수의문문과 선택의문문으로 구성된 질문-응답 쌍이며, 질문이 요구하는 정보 유형과 응답 문장의 정보 초점 위치, 배경 정보 제공 여부를 실험 조건으로 설정한다. 실험 자극물은 문장 길이와 어휘 난이도를 통제하여 구성하고, 중국어 모어 화자를 대상으로 실험을 실시한다.
실험에서는 문장을 읽는 과정에서의 시선 고정 시간, 회귀 발생 여부와 경로, 전체 읽기 시간을 주요 분석 지표로 수집한다. 수집된 시선 데이터는 관심 영역(ROI) 기준으로 전처리한 뒤, 조건 간 처리 지표 차이와 상호작용을 통계적으로 검토한다. 이를 통해 질문의 요구와 응답의 정보 초점 배치가 일치하거나 불일치할 때 나타나는 처리 부담 차이를 비교 분석하고, 정보 구조 원칙이 실제 언어 처리 과정에서 어떻게 구현되는지를 검증한다.
본 연구는 1년 과제 범위에서 문답 구조를 중심으로 연구 범위를 명확히 한정하고, 분석 단위와 방법을 실험적으로 검증 가능한 수준으로 설정한다. 향후에는 본 과제에서 확립된 분석 틀과 처리 지표를 다른 문형으로 확장 적용할 수 있는 가능성도 함께 제시한다. 이를 통해 연구 목표와 방법, 범위가 일관되게 연결된 실증 연구를 수행하며, 중국어 정보 구조가 문장 해석과 적절성 판단에 작동하는 방식을 처리 지표를 통해 제시하고자 한다.
키워드(Keyword)
(한글 250자 이내)
중국어 정보 구조, 문답 구조, 정보 초점, 아이트래킹, 문장 처리
키워드
(영어 500자 이내)
Chinese Information Structure, Question–Answer Structure, Information Focus, Eye-tracking, Sentence Processing

게시물 신근영 / 한국연구재단 / 아이트래킹을 활용한 중국어 정보 구조의 원칙과 인지적 처리 양상 연구 — 문답 구조에서 문장이 전달하는 정보와 의미의 구별을 중심으로 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.

13 - 韩国数字人文协会（KADH）

이창민 / R 기반 데이터 분석을 활용한 한국 다큐멘터리 영화의 제작 경향 연구 / 2025 (B유형) 인문사회학술연구교수

作者Baro

2025年6月3日 02:03

이창민 / 한국예술종합학교 / R 기반 데이터 분석을 활용한 한국 다큐멘터리 영화의 제작 경향 연구 / 2천만 / 12개월 / 2025 (B유형) 인문사회학술연구교수 박사

연구목표:

본 연구는 기존 연구에서 제시한 한국 다큐멘터리 영화의 시대 구분을 실증적으로 검토하고, 필요에 따라 새로운 시대 구분을 제안하는 동시에, 시대별 창작 경향의 변화를 객관적이고 포괄적으로 규명하는 것을 목적으로 한다. 기존의 한국 다큐멘터리 영화에 대한 연구는 주로 특정한 정치적 환경의 변화나 사회적 사건을 중심으로 시대를 구분하거나, 사회적 관심을 받은 대표적인 작품과 경향을 중심으로 분석되어 왔다. 이러한 연구들은 한국 다큐멘터리 영화의 발전 과정을 조망하는 데 중요한 공헌을 했지만, 다큐멘터리 영화의 전체적인 흐름과 제작 경향을 포괄적으로 파악하는 데에는 일정한 한계가 있었다.
이러한 배경에서 본 연구는 한국에서 상영된 전체 다큐멘터리 영화(1975년부터 2024년까지 총 3,488편)를 대상으로 영화진흥위원회에서 제공하는 공식 목록과 K-Docs List의 작품 설명 데이터를 활용하여 실증적 분석을 수행한다. 이를 위해 프로그래밍 언어인 R을 이용한 데이터 수집 및 자동 텍스트 분석 기법을 적용하여 시대별 다큐멘터리 영화 제작의 양적 추이 및 질적 특성을 객관적으로 규명하고자 한다. 본 연구는 텍스트 데이터에 대한 정량적이고 자동화된 분석을 통해 기존의 시대 구분에서 나타난 주요한 특징과 실제 영화 작품의 내용 수준에서 나타나는 창작 경향의 차이를 비교하여 기존 시대 구분의 타당성을 검증할 뿐 아니라, 데이터에 근거하여 시대 구분의 재정의 및 보완 가능성을 탐색한다.
이를 통해 본 연구는 한국 다큐멘터리 영화가 시대적 변화와 사회적 맥락 속에서 어떻게 변화해왔는지를 객관적인 데이터를 통해 보다 명료하게 규명하고, 영화 작품 자체의 창작 경향과 내용 분석을 통해 다큐멘터리 영화가 시대마다 어떤 특성과 변화를 겪었는지를 실증적으로 제시한다. 특히 자동 텍스트 분석을 통해 포착되는 주제와 내러티브의 시대별 경향을 규명함으로써 기존의 질적 연구 중심으로 이루어진 다큐멘터리 영화 연구의 분석 방법론을 보완하고 새로운 분석 틀을 제시할 것으로 기대된다.
결국 본 연구의 궁극적인 목표는 한국 다큐멘터리 영화 연구에 있어 기존의 시대 구분을 데이터 기반의 분석을 통해 검증하고, 창작 경향의 객관적 특징을 실증적으로 파악함으로써, 한국 다큐멘터리 영화의 발전 과정에 대한 보다 명확하고 체계적인 이해를 제공하는 것이다. 이러한 분석을 통해 다큐멘터리 영화 연구뿐만 아니라 영화사, 미디어 연구 등 관련 분야에서 활용될 수 있는 중요한 학문적 기초 자료를 구축하고, 시대 구분 및 창작 경향 분석의 새로운 연구 방법론을 제안하고자 한다.

기대효과:

본 연구는 기존 한국 다큐멘터리 영화 연구에서 나타난 특정 작품이나 제한된 경향 중심 분석의 한계를 극복하고자, 한국에서 상영된 전체 다큐멘터리 영화의 텍스트 분석을 통해 실증적이고 포괄적인 시대 구분 및 창작 경향 분석을 수행한다. 이를 통해 한국 다큐멘터리 영화 연구의 분석적 틀을 확장하고, 기존 연구에서 설정한 시대 구분의 타당성을 보다 객관적으로 검증하며, 새로운 시대 구분을 탐색함으로써 학문적 기여를 기대할 수 있다. 특히 본 연구는 R 프로그래밍을 이용한 자동 텍스트 분석이라는 정량적 방법론을 도입하여 기존의 질적 중심 분석 방법론을 보완하고, 영화사 및 미디어 연구 등 다양한 분야에 활용될 수 있는 새로운 분석 방법을 제공할 수 있을 것으로 기대된다.
또한, 본 연구 결과는 실질적이고 정책적인 활용 가치를 지닌다. 연구 과정에서 도출된 체계적이고 객관적인 데이터는 특정 시기의 다큐멘터리 영화 제작 경향과 정책 변화 간의 상관관계를 규명할 수 있는 기초 자료가 될 것이다. 이를 바탕으로 다큐멘터리 영화 제작 지원 정책의 효과성을 평가하고 개선 방안을 마련할 수 있으며, 배급과 개봉 경향 분석을 통해 독립·예술 영화 지원 정책과 연계된 효과적인 배급 전략 수립에도 실질적인 도움을 줄 수 있다.
본 연구에서 구축된 데이터는 다큐멘터리 영화의 체계적인 아카이빙과 교육 자료 구축에도 중요한 기초 자료로 활용될 수 있다. 구체적으로 정리된 영화 목록과 경향 분석은 향후 지속 가능한 연구와 교육을 위한 기반으로 활용될 수 있으며, 다큐멘터리 영화가 사회적 기억을 구성하고 공적 담론 형성에 기여하는 방식을 탐구하는 후속 연구에도 유의미한 참고 자료가 될 것이다.
한편, 본 연구는 정량적 분석 방법론의 일반적 한계도 함께 내포하고 있다. 자동 텍스트 분석 기법은 전반적이고 객관적인 경향성을 신속히 도출할 수 있으나, 개별 텍스트가 지닌 미묘한 의미 차이나 감독의 구체적 의도, 작품의 세부적인 맥락을 충분히 반영하기 어렵다. 따라서 본 연구의 정량적 분석 결과는 질적 분석과 심층 인터뷰 등 보완적 연구 방법을 통해 보다 정교하게 보완될 필요가 있다.
추후 영화진흥위원회와 같은 공적 기관에서 보다 공식적이고 신뢰성 높은 자료와 설명 텍스트를 제공하게 된다면, 본 연구가 활용한 민간 자료의 한계를 극복하고 더욱 정밀한 연구가 이루어질 수 있을 것이다. 또한, 후속 연구에서는 상영된 영화뿐 아니라 미상영된 다큐멘터리까지 포함한 보다 포괄적인 제작 경향 분석을 수행할 필요가 있으며, 서울독립영화제 출품정보 등의 활용, 그리고 주요 창작자와 후속 세대에 대한 심층 인터뷰나 포커스 그룹 인터뷰를 통해 시대 구분의 타당성과 설득력을 더욱 심층적으로 평가하는 작업이 이어질 수 있을 것이다.

연구요약:

본 연구는 한국 다큐멘터리 영화의 시대 구분을 실증적으로 재검토하고, 시대별 창작 경향을 객관적으로 파악하여 기존의 연구가 지닌 한계를 보완하고 새로운 분석 틀을 제시하는 것을 목적으로 한다. 기존의 한국 다큐멘터리 영화 연구들은 주로 정치적 변화나 사회적 사건, 창작자들의 정체성 변화와 같은 외적 요인을 기준으로 시대 구분을 시도해왔으며, 이 과정에서 특정 작품이나 사회적으로 주목받은 영화들을 중심으로 논의를 전개하는 경향이 있었다. 이로 인해 한국 다큐멘터리 영화 전체의 포괄적이고 객관적인 분석이 미흡한 실정이었다.
본 연구는 이러한 한계를 극복하고자 1975년부터 2024년까지 한국에서 상영된 전체 다큐멘터리 영화 3,488편을 연구 대상으로 삼아 시대 구분과 창작 경향 분석을 수행한다. 연구 데이터는 영화진흥위원회가 제공하는 한국 영화의 공식 목록과 민간에서 운영하는 K-Docs List의 영화 작품 설명 텍스트로부터 수집한다. 특히 영화 작품 시놉시스 텍스트를 중심으로 자동 텍스트 분석 방법을 활용하여 정량적이고 실증적인 분석을 실시한다.
분석의 구체적인 방법으로는 프로그래밍 언어인 R을 이용한 데이터 수집과 전처리, 텍스트 분석이 활용된다. 우선, 영화진흥위원회가 제공하는 영화 목록을 기반으로 연도별 다큐멘터리 영화 제작 수의 양적 변화를 분석하고, 이를 통해 다큐멘터리 영화 제작의 시대적 증가 및 감소 추이를 파악한다. 다음으로 K-Docs List에서 제공하는 영화의 시놉시스 텍스트를 바탕으로, R 프로그래밍 환경에서 자동 텍스트 분석 기법을 적용해 시대별로 나타나는 주요 주제 및 창작 경향을 도출한다. 이 과정에서는 KoNLP와 quanteda 패키지를 병행하여 사용함으로써, 한국어 형태소 분석의 정확성을 높이고 다양한 분석 결과를 비교 검증할 예정이다.
본 연구는 분석 결과를 통해 기존 연구에서 제안된 시대 구분의 타당성을 검증하고, 동시에 데이터에 근거한 새로운 시대 구분의 가능성을 모색한다. 또한 텍스트 분석을 통해 드러나는 한국 다큐멘터리 영화의 시대별 주제 변화 및 창작 경향의 특성을 종합적으로 해석하기 위해, 김균과 전규찬이 제안한 장르-매체-사회라는 역사 사회학적 중층 모델을 수정하여 적용할 것이다. 이를 통해 한국 다큐멘터리 영화의 시대적 변화가 영화 산업의 발전뿐 아니라 사회적·정치적 맥락 속에서 어떻게 상호작용하며 형성되어 왔는지를 보다 체계적으로 규명할 것이다.
본 연구의 결과는 학술적 측면에서 기존의 질적 중심의 연구 방법을 보완하여 객관적이고 실증적인 다큐멘터리 영화 분석의 새로운 방법론을 제시할 것이다. 아울러 다큐멘터리 영화의 정책 수립, 제작 지원 방향, 배급 전략 수립 및 아카이빙 구축 등 실천적인 영역에서도 의미 있는 자료로 활용될 수 있을 것이다.
결론적으로 본 연구는 한국 다큐멘터리 영화 연구의 기존 한계를 극복하고, 시대 구분을 재정립함과 동시에 창작 경향의 객관적이고 포괄적인 분석을 통해 관련 연구 및 정책 수립에 중요한 기초 자료를 제공하는 것을 목표로 한다.

키워드:

한국 다큐멘터리 영화, 제작 경향, 텍스트 분석, R기반 데이터 분석, 빅데이터

Korean Documentary Cinema, Production Trends, Text Analysis, R-based Data Analysis, Big Data

13 - 韩国数字人文协会（KADH）

서경숙 / 문학과 코딩의 융합 교육: 가상현실과 인터렉티브 스토리텔링 도구의 활용을 중심으로 / 2025 (B유형) 인문사회학술연구교수

作者Baro

2025年6月3日 01:56

서경숙 / 충남대학교 / 문학과 코딩의 융합 교육: 가상현실과 인터렉티브 스토리텔링 도구의 활용을 중심으로 / 2천만 / 12개월 / 2025 (B유형) 인문사회학술연구교수 박사

연구목표:

본 연구의 목적은 가상현실(VR) 및 인터랙티브 스토리텔링 도구를 활용하여 문학 교육의 새로운 가능성을 모색하고, 동시에 인문학 전공자들이 코딩 및 디지털 기술에 보다 쉽게 접근할 수 있는 교육적 게이트웨이를 제공하고자 함이다. 또한 디지털 도구를 활용한 문학 교육의 효율성(학생들의 학습 몰입도 및 동기 부여, 흥미 증진)을 실증적으로 검토할 것이다. 구체적으로는 첫째, 코스페이시스와 트와인을 활용한 방탈출 게임(Escape Room Game) 제작을 통해 학생들이 문학 작품을 보다 능동적이고 창의적으로 탐구할 수 있는 학습 방법에 대해 알아볼 것이다. 이를 통해 학생들은 단순히 텍스트를 해석하는 수준을 넘어, 문학적 서사를 가상현실 환경에서 재구성하고, 상호작용을 통해 작품의 상징적 의미와 서사적 구조를 깊이 있게 이해할 수 있을 것이다.
둘째, 인문학 전공자들이 코딩 및 디지털 기술에 대한 두려움을 극복하고, 이에 보다 쉽게 접근할 수 있는 출발점을 제공하고자 한다. 컴퓨터 프로그래밍이 이공계 학생들의 전유물이라는 선입견을 없애고, 인문학과 학생들도 코스페이시스의 블록 기반 코딩과 트와인의 인터랙티브 기능을 활용하여 자연스럽게 디지털 콘텐츠를 설계하고 구현할 수 있도록 유도하고자 한다. 이를 통해 학생들이 디지털 리터러시를 강화하고, 코딩에 대한 두려움을 해소하며, 나아가 디지털 시대에 요구되는 실질적인 기술 역량을 갖출 수 있도록 돕고자 한다.
셋째, 본 연구는 디지털 도구를 활용한 문학 교육이 학생들의 학습 몰입도, 동기 부여, 비판적 사고 및 창의력에 미치는 영향을 실증적으로 분석하고 기존의 전통적 교수법과의 차이를 비교하고자 한다. 이러한 연구 결과를 바탕으로 디지털 시대에 적합한 인문학의 학문적 가치와 실용성을 재정립할 수 있는 구체적인 방안을 마련하고자 한다.

기대효과:

본 연구를 통해 얻을 수 있는 기대효과와 활용방안은 네 가지로 정리할 수 있다. 첫째, 본 연구는 문학 교육과 디지털 기술을 결합한 새로운 교수법을 제안함으로써, 전통적인 문학 교육의 틀을 넘어선 창의적이고 몰입감 있는 학습 환경을 조성할 것이다. 학생들은 문학 작품을 단순히 분석하는 것을 넘어, 직접 참여하고 경험하며 학습할 수 있다. VR 및 인터랙티브 스토리텔링을 활용하여 학생들이 문학 작품과 상호작용할 수 있는 기회를 제공함으로써, 학생들의 학습 동기와 몰입도를 극대화할 수 있다. 이러한 방식은 특히 디지털 세대의 학습 스타일에 부합하며 문학 작품을 보다 현실적이고 생생하게 체험하게 한다.
둘째, 디지털 리터러시(Digital Literacy)를 향상시킬 수 있다. 학생들은 코스페이시스와 트와인 같은 디지털 도구를 활용하여 서사를 창작하고 분석하는 과정을 통해 코딩 및 디지털 환경에 대한 이해를 높일 수 있다. 이는 디지털 시대에 필수적인 역량을 강화하는 데 기여할 것이다.
셋째, 융합형 KMOOC 강좌를 개발할 수 있다. 본 연구의 결과를 바탕으로 디지털 기술과 문학을 융합한 KMOOC 강좌를 개발하여 국내외 교육 기관 및 일반 대중에게 개방할 수 있다. 이를 통해 교육의 접근성을 높이고, 다양한 학습자들에게 새로운 인문학 학습 경험을 제공할 것이다.
넷째, 연구 결과를 국내외 학술지 및 학회 세미나에서 발표하여 학문적 교류를 강화할 것이다. 또한, 연구 결과를 정리한 백서 및 교육 가이드라인을 출판하여 다양한 교육 기관 및 연구자들에게 실질적인 자료를 제공할 수 있다.

연구요약:

이 연구는 상호작용성과 비선형적 서사를 결합한 인터랙티브 스토리텔링 도구인 트와인과, 블록 기반 코딩을 활용하여 3D 가상현실을 구현하는 코스페이시스를 방탈출 게임(Escape Room Game)에 적용한 문학 교육 방법을 제시한다. 이 접근법은 작품의 주제, 인물의 동기, 서사 구조에 대한 이해와 사고력, 그리고 코딩 능력을 동시에 향상시킬 수 있을 것이다. 연구는 이론적 고찰과 실제 교육 방법을 바탕으로 수업의 효율성을 검증하는 과정으로 이루어진다.
1) 게임기반 학습
게임 기반 학습(Game-based learning)은 구성주의의 원리를 구현하는 효과적인 방법이다. 특히 방탈출 게임과 같은 인터랙티브 학습 활동은 학습자가 문제를 해결하는 과정에서 능동적으로 참여하고 의미를 구성하도록 유도한다. 게임이론은 전략적 의사결정을 연구하는 수학적 접근 방식으로, 참가자들이 서로 영향을 미치는 상황에서 최적의 선택을 찾는 것을 목표로 한다. 게임이론의 주요 개념으로는 플레이어(Player), 전략(Strategy), 보상(Payoff), 그리고 균형(Nash Equilibrium)이 있다. 이러한 게임이론을 문학 교육에 적용될 때, 학생들이 이야기의 서사적 흐름을 능동적으로 결정하고 다양한 전략을 시도할 수 있는 학습 환경을 제공한다. 특히 방탈출 게임은 학습자가 이야기 속 문제를 해결하며 문학 작품의 맥락을 더 깊이 이해할 수 있도록 돕는 최적의 방식으로 평가된다. 이점에 대해 제임스 지는 게임을 통한 학습이 전통적인 강의식 교육보다 학습자의 몰입도를 높이고 능동적인 참여를 촉진한다고 주장했으며(2007), 어니스트 아담스(Ernest Adams)는 『게임 디자인의 기본』(Fundamentals of Game Design, 2013)에서 게임 속 내러티브 체험이 문학적 이해와 비판적 사고력을 향상시킨다고 강조하였다. 이안 보고스트 (Ian Bogost) 역시 『비디오 게임으로 일 할 수 있는 방법』(How to Do Things with Videogames, 2011)에서 게임 설계를 통한 학습이 이야기 구조를 탐색하고, 시스템적 사고를 활용하여 문학 텍스트를 분석하는 데 유용하다고 설명하였다. 이렇듯 게임화 된 문학 교육은 학생들이 문학 작품 속 인물의 동기와 사건의 흐름을 게임 규칙과 스토리라인으로 재구성하도록 돕는다. 방탈출 게임은 플레이어가 주어진 시간 내에 여러 퍼즐과 문제를 해결하여 탈출해야 하는 게임 형식으로, 논리적 사고와 문제 해결 능력을 요구한다. 문학 작품을 방탈출 게임 형식으로 각색하는 과정에서, 학생들은 문학적 서사를 퍼즐로 변환하고 문학 작품의 상징적 의미와 주제를 더욱 깊이 있게 이해하게 되며 다양한 코딩을 통해 가상현실 속에서 상호작용적 사건을 설계하고, 캐릭터의 행동을 제어하며, 퍼즐을 해결하는 방법을 배울 수 있다.

2) 문학작품의 각색과 코딩 기술의 결합 방법
연구는 프로그래밍과 코딩 등 디지털 기술에 익숙하지 않은 인문학 전공학생들을 위해 코스페이시스와 트와인을 활용해 문학 작품을 방탈출 게임으로 제작하는 과정에 대해 구체적으로 탐구하고자 한다. 전자는 학습자가 3D 가상 환경에서 창의적으로 콘텐츠를 제작하고, 이를 통해 상호작용을 설계할 수 있는 도구로 문학 작품을 체험형 콘텐츠로 확장하는 데 유용하며 후자는 하이퍼링크를 활용해 텍스트 기반의 다중 선택형 시나리오를 구축하는 인터렉티브 스토리 구축에 적합한 도구이다. 본 연구에서는 연구자가 시험 수업에서 실시했던 셰익스피어의 『햄릿』과 조지 오웰의 『1984』를 선정해 방탈출 게임으로 만드는 과정을 정리하였다.

3) 학습 성과분석
연구는 기존 문학 교육 연구에서 부족했던 실증적 데이터와 학습 성과 분석을 보완하여 향후 문학 교육의 새로운 교수법으로 게임 기반 학습과 코딩 활용 모델을 확립하는 데 기여하고자 한다. 문학 교육에서 코딩과 게임화 된 학습이 학습 효과를 어떤 영향을 미치는지 실증적으로 알아보기 위해서 양적 연구와 질적 연구를 병행하고자 한다. 이를 통해 학습자의 성취도, 참여도, 흥미도 등을 측정하고, 실제 교육적 효과를 정량적·정성적으로 분석한다.

키워드:

게임기반 문학 학습, 코딩, 코스페이시스. 트와인, 방탈출 게임, 디지털 리터러시

game-based literature learning, coding, Cospaces, Twine, escape room game, digital literacy

13 - 韩国数字人文协会（KADH）

김연정 / 텍스트 마이닝을 활용한 기후변화와 바이러스 재난 서사의 의미망 분석: 세쿼이아 나가마츠의『어둠 속에서 우리는 얼마나 높이 올라갈 수 있는가』를 중심으로 / 2025 (B유형) 인문사회학술연구교수

作者Baro

2025年6月3日 01:51

김연정 / 인천대학교 / 텍스트 마이닝을 활용한 기후변화와 바이러스 재난 서사의 의미망 분석: 세쿼이아 나가마츠의『어둠 속에서 우리는 얼마나 높이 올라갈 수 있는가』를 중심으로 / 2천만 / 12개월 / 2025 (B유형) 인문사회학술연구교수 박사

연구목표:

본 연구는 미국 작가 세쿼이아 나가마츠(Sequoia Nagamatsu)의 소설 『우리가 어둠 속에서 얼마나 높이 올라갈 수 있는가』(How High We Go in the Dark, 2022)를 중심으로 텍스트 마이닝 기법을 활용하여 기후변화와 바이러스 팬데믹이 서사적으로 형성하는 복합적 의미망을 정량적이고 체계적으로 분석하는 것을 목적으로 한다. 이를 통해 기후변화가 바이러스 팬데믹 서사에 미치는 구체적인 영향과 사회적 의미 변화를 살펴보고자 한다. 이 작품은 다수의 단편들이 서로 긴밀하게 연결되어 구성되어 있으며, 각 단편은 기후변화와 팬데믹으로 인한 사회적·윤리적·기술적 변화를 서로 다른 시공간적 배경에서 탐색한다. 따라서 본 연구에서는 텍스트 마이닝을 통해 각 단편에서 도출된 개념적 의미망이 어떻게 연결되고 변화하며, 전체적으로 어떤 의미망을 형성하는지를 분석할 것이다. 이를 바탕으로 현대사회가 직면한 기후변화와 바이러스 팬데믹이라는 복합적 위기가 문학적 상상력 속에서 어떻게 재현되고 의미화되는지를 고찰하고자 한다.
먼저, 본 연구는 작품에서 기후변화와 바이러스 팬데믹이 인간과 비인간 존재(동물과 기술)의 관계를 어떻게 재구성하는지를 분석한다. 작품 속 바이러스 팬데믹은 생물학적 사건에 그치지 않고, 인간과 비인간 존재의 관계를 근본적으로 변화시키는 촉매로 기능한다. 그 변화 과정에서 인간과 비인간 간의 경계가 점차 모호해지며, 기술적·생물학적 개입을 통한 새로운 형태의 인간 정체성이 등장한다. 이러한 서사적 변화를 「돼지 아들」(“Pig Son”)과 「기억의 정원을 지나서」(“Through the Garden of Memory”)를 중심으로 분석하며, 단어 임베딩(Word Embedding), 시계열 분석(Time-series Analysis)의 텍스트 마이닝 기법을 적용하여 개념 간 의미적 연관성과 서사적 변화를 살펴본다. 이러한 분석 결과는 캐서린 헤일스(Katherine Hayles)의 ‘포스트휴머니즘(posthumanism)’ 및 도나 해러웨이(Donna Haraway)의 ‘공-산(Sympoiesis)’ 개념과 연결하여 인간 정체성의 변화가 서사적으로 어떻게 구현되는지를 이론적으로 분석할 것이다.
다음으로, 본 연구는 소설에서 기후변화와 바이러스 팬데믹이 야기하는 사회적 재편 및 경제적 불평등이 형성하는 의미망을 분석하여 사회적 관계의 재구성 방식을 고찰하고자 한다. 바이러스 팬데믹은 전염병 확산으로 인한 사회적 혼란을 넘어 경제적 격차와 계급적 불평등을 심화시키고, 노동 구조와 생존 방식을 변화시키는 기제로 기능한다. 이 연구는 「애가의 호텔」(“Elegy Hotel”)과 「가능성의 관찰경」(“The Scope of Possibility”)을 중심으로 단어 군집 분석(Word Clustering)과 BERT 기반 의미 유사도 분석 (BERT-based Semantic Similarity Analysis)이라는 텍스트 마이닝 기법을 통해 경제적 불평등과 계급 격차가 서사적으로 어떻게 나타나는지를 분석한다. 이러한 분석 결과를 피에르 부르디외(Pierre Bourdieu)의 ‘자본(capital)’ 개념과 데이비드 하비(David Harvey)의 ‘신자유주의적 공간 재편(Neoliberal Spatial Reorganization)’ 개념과 연계하여 이론적으로 해석하고 논의할 것이다.
마지막으로, 본 연구는 바이러스 팬데믹 이후 인간 존재와 애도의 개념이 어떻게 변화하고 재구성되는지를 작품을 통해 탐색한다. 팬데믹 이후 인간이 죽음과 기억을 대하는 방식이 어떻게 서사적으로 변화하며, 이 과정에서 가상공간과 기술이 어떠한 역할을 수행하는지를 텍스트 마이닝 기법을 통해 정량적으로 규명한다. 「웃음의 도시」(“City of Laughter”)와 「도쿄 가상 현실 카페의 우울한 밤들」(“Melancholy Nights at the Tokyo Virtual Café”)을 중심으로 키워드 추출과 감성 분석을 수행하며, 분석 결과는 한나 아렌트(Hannah Arendt)의 ‘인간 조건(The Human Condition)’ 이론과 미셸 푸코(Michel Foucault)의 ‘헤테로토피아(Heterotopia)’ 개념을 적용하여 철학적·이론적으로 해석할 것이다.
궁극적으로 본 연구는 기후변화와 바이러스에 대한 현대적 위기를 문학적으로 재현한 『우리가 어둠 속에서 얼마나 높이 올라갈 수 있는가』를 텍스트 마이닝 기법을 통해 분석하고, 이를 철학적·사회이론적 개념과 연계하여 인간과 비인간 존재 간의 관계 변화, 사회적·경제적 구조 변화, 애도와 기억의 재구성 과정을 체계적으로 고찰할 것이다. 이를 통해 문학적 서사가 기후변화와 바이러스 팬데믹이라는 복합적 위기를 어떻게 제시하고 대응하는지 그 과정을 구체적으로 살펴볼 수 있을 것이다. 또한 팬데믹 이후 변화된 인간과 비인간 존재 간의 관계, 기술 발전으로 촉발된 사회적 불평등의 심화, 애도의 방식이 물리적 공간에서 가상공간으로 전환되는 현상 등을 통해 문학이 사회적 위기와 기술적 전환기를 어떠한 방식으로 비판하고 재구성하는지를 밝힐 것이다.

기대효과:

본 연구는 기후변화와 바이러스 팬데믹이 문학에서 어떻게 서사적으로 재현되는지를 분석하고, 디지털 인문학적 방법론을 활용하여 정량적 연구의 가능성을 모색한다. 연구 결과는 학문적·교육적 기여뿐만 아니라 사회·문화적 측면에서도 중요한 영향을 미칠 것으로 기대된다. 이에 따라 본 연구의 기대효과와 활용방안을 학술 연구와 교육에의 기여 그리고 사회·문화적 기여의 두 가지 범주로 나누어 제시하고자 한다.

1) 학술 연구와 교육에의 기여

본 연구는 기존 문학 연구에 텍스트 마이닝 및 데이터 기반 분석을 접목함으로써 디지털 인문학과 문학 연구의 융합을 촉진한다. 기존의 문학 연구는 주로 질적 분석에 의존해왔으나, 본 연구에서는 텍스트 마이닝 기법을 적용하여 문학 서사의 구조를 정량적으로 탐색하고, 이를 통해 보다 체계적이고 객관적인 해석을 제시하고자 한다. 특히, 기후변화와 바이러스 팬데믹 서사의 의미망을 분석하여 문학이 현대 사회의 위기와 변화에 어떻게 반응하는지를 탐색하는 새로운 연구 방향을 제시할 것이다. 이러한 연구 결과는 국내외 학술지에 논문으로 게재함으로써 기후문학, 포스트휴머니즘, 디지털 인문학 연구에 기여할 수 있으며, 대학 강의 및 세미나에서도 연구 내용을 반영할 수 있다.
또한, 본 연구는 후속 연구 및 학제 간 협력 프로젝트의 기반을 제공할 수 있다. 문학 연구뿐만 아니라 사회과학, 데이터 과학과의 연계를 통해 연구 범위를 확장할 수 있으며, 디지털 인문학적 접근법을 활용한 다양한 문학 연구가 가능하도록 연구 데이터를 공유할 계획이다. 더 나아가, 연구 성과를 바탕으로 온라인 공개 강좌(MOOC) 및 연구 워크숍을 운영하여 텍스트 마이닝을 활용한 연구 방법론을 학문 후속 세대와 공유하고, 문학 연구자들에게 새로운 분석 도구를 제공하는 데 기여하고자 한다.

2) 사회·문화적 기여

기후변화와 바이러스 팬데믹은 과학적·의료적 문제만이 아니라, 사회적·문화적 의미를 내포하는 중요한 현상이다. 본 연구는 문학이 이러한 위기를 어떻게 서사적으로 다루고 있는지를 분석함으로써, 대중이 기후변화와 바이러스 팬데믹을 이해하고 대응하는 방식에 영향을 줄 수 있는 문화적 의미를 탐색하고자 한다. 문학은 사회적 문제를 반영하고 대중의 감성을 형성하는 중요한 매체이므로, 연구 결과는 기후변화 및 팬데믹에 대한 사회적 인식을 변화시키고, 나아가 환경문제와 공공보건 문제에 대한 해결 방안을 모색하는데 기여할 수 있을 것이다. 이를 위해 연구 결과를 보다 널리 공유하고 활용할 수 있도록 다양한 방법을 모색한다. 먼저, 연구 내용을 대중과 쉽게 소통할 수 있도록 인포그래픽, 블로그 게시물, 팟캐스트 등 다양한 형식의 콘텐츠를 제작하여 공유할 계획이다. 이를 통해 문학 속 기후변화와 팬데믹 서사가 사회적 논의에 기여하는 방식을 알리고, 일반 독자들이 연구 결과를 보다 쉽게 이해할 수 있도록 한다. 또한, 연구 결과는 기후변화 및 팬데믹 관련 공공정책 연구에 참고 자료로 활용될 수 있다. 환경 및 공공보건 정책 연구자들과 협력하여 서사의 사회적 영향을 분석하고, 정책 수립 과정에서 문학적 접근을 반영할 수 있도록 기여하고자 한다. 이를 통해, 문학이 사회적 담론을 형성하고 정책적 변화를 이끌어낼 수 있는 중요한 도구로 활용될 수 있음을 강조할 것이다.
더 나아가, 연구 성과를 대중 매체 및 문화 콘텐츠와 연결하여 확산하는 방안을 고려할 수 있다. 유튜브 영상, 인터뷰 등의 형태로 연구 성과를 대중과 공유함으로써 보다 광범위한 사회적 영향을 미칠 수 있도록 한다. 또한, 기후변화와 팬데믹 관련 교육 자료를 개발하여 학교 및 공공 교육기관에서 활용할 수 있도록 함으로써, 차세대가 환경 및 공공보건 문제를 보다 깊이 이해할 수 있도록 기여할 것이다.

연구요약:

본 연구는 세쿼이아 나가마츠의 『우리가 어둠 속에서 얼마나 높이 올라갈 수 있는가』를 중심으로 텍스트 마이닝 기법을 활용하여 기후변화와 바이러스 팬데믹이 서사적으로 연결되고 전개되는 방식을 정량적으로 분석하고자 한다. 이 작품은 여러 독립적 단편으로 구성되어 있지만, 각 단편들이 상호 유기적으로 연결되면서 기후변화와 팬데믹이라는 복합적 위기가 인간과 비인간 존재의 관계, 사회적 재편, 애도의 방식을 어떻게 변화시키는지를 서사적으로 제시하고 있다. 이러한 복합적 서사를 정량적으로 탐색하여 문학이 현대적 위기를 어떻게 재현하는지를 고찰하고자 한다.
이를 위해 첫째, 기후변화와 바이러스 팬데믹이 인간과 비인간 존재의 관계를 어떻게 재구성하는지를 탐색한다. 「돼지 아들」에서는 단어 임베딩 기법을 활용하여 인간과 돼지, 유전자 조작, 바이러스 등의 개념들이 의미적으로 연결되는 방식을 분석하며, 이를 통해 팬데믹 이후 유전자 조작과 기술적 개입이 인간 정체성을 변화시키는 과정을 규명할 것이다. 이러한 분석을 캐서린 헤일스의 ‘포스트휴머니즘’ 개념과 연결하여, 유전자 조작과 기술적 개입이 인간과 동물의 경계를 허물고 새로운 존재 형태를 형성하는 과정을 탐색할 것이다. 또한, 「기억의 정원을 지나서」에서는 시계열 분석을 활용하여 팬데믹 이후 인간의 기억이 생물학적 차원에서 디지털 공간으로 전환되는 과정을 분석하고, 도나 해러웨이의 ‘공-산’ 개념을 적용하여 인간과 기술이 독립된 개체가 아니라 지속적으로 상호작용하며 공동으로 진화하는 방식을 조명할 것이다. 이를 통해, 팬데믹 이후 인간 정체성이 어떻게 기술과의 공진화를 통해 재구성되며, 문학이 이러한 변화 과정을 서사적으로 어떻게 형상화하는지를 규명하고자 한다.
둘째, 바이러스 팬데믹과 기후변화가 사회적 재편과 경제적 불평등을 어떻게 형성하는지를 탐색한다. 「애가의 호텔」에서는 단어 군집 분석을 활용하여 장례 서비스가 경제적 불평등과 계층 구조를 반영하는 방식을 분석하며, 피에르 부르디외의 ‘자본(capital)’ 개념과 연계하여 애도의 방식이 경제적 자본에 따라 어떻게 계층화되는지를 규명한다. 또한, 「가능성의 관찰경」에서는 BERT 기반 의미 유사도 분석을 통해 공공보건 정책과 계급 격차의 서사적 구조를 분석하며, 데이비드 하비의 ‘신자유주의적 공간 재편’ 개념을 적용하여 공공 의료 정책이 어떻게 계층적으로 구조화되는지를 해석할 것이다.
셋째, 팬데믹 이후 인간의 소통 방식과 애도의 개념이 어떻게 변화하는지를 분석하기 위해 「웃음의 도시」와 「도쿄 가상 현실 카페의 우울한 밤들」을 중심으로 키워드 추출 및 감성 분석을 수행한다. 이를 통해 팬데믹 전후의 인간이 죽음과 기억을 대하는 방식이 기존의 물리적 공간에서 디지털 공간으로 어떻게 이동하고 변형되는지를 탐색할 것이다. 특히 한나 아렌트의 ‘인간의 조건’ 개념을 적용하여 팬데믹 이후 애도의 방식이 개인적 차원에서 벗어나 공적 영역으로 확장되는 과정을 분석한다. 또한, 미셸 푸코의 ‘헤테로토피아’ 개념을 통해 가상공간이 새로운 형태의 애도의 장소로서 작동하는 방식을 고찰할 것이다. 본 연구에서는 가상공간이 팬데믹 이후 애도의 새로운 헤테로토피아로 등장하여 인간의 감정 표현, 사회적 기억의 형성, 그리고 인간관계의 구조적 변화를 어떻게 촉진하는지를 탐구하며, 이러한 변화가 팬데믹 시대의 인간성 이해에 어떠한 윤리적, 사회적 함의를 제시하는지를 고찰할 것이다.
마지막으로, 본 연구는 작품에서 개별적으로 탐색한 단편들이 서로 연결되면서 형성하는 종합적이고 입체적인 의미망을 분석하고자 한다. 각각의 단편이 기후변화와 바이러스 팬데믹이라는 두 가지 글로벌 위기를 다루면서 인간 존재, 사회적 재편, 경제적 불평등, 기술의 역할 및 애도의 방식이라는 주제를 독립적으로 탐색했으나, 개별적 접근으로는 드러나지 않는 더 큰 서사적 의미망이 존재한다. 본 연구의 최종 결론에서는 텍스트마이닝을 활용하여 각각의 단편에서 도출된 의미적 연관성과 패턴이 상호 작용하면서 형성하는 보다 상위 차원의 의미망을 규명하고자 한다. 다시 말해, 작품의 단편들 간에 공통적으로 나타나는 주제와 개념들이 어떤 구조적 네트워크를 형성하며, 기후변화와 팬데믹이라는 복합적 위기 속에서 인간의 윤리, 사회적 책임, 기술적 대응 방식, 그리고 기억과 애도의 의미가 어떻게 통합적으로 재구성되는지를 밝힐 것이다. 이러한 통합적 의미망을 통해, 본 연구는 문학이 단순히 개별 사건을 재현하는 것이 아니라, 위기와 혼란 속에서 전체적이며 통합적인 사회적·문화적 담론을 형성하고 있음을 심층적으로 고찰하고자 한다.

키워드:

기후변화, 바이러스, 팬데믹, 서사, 기술, 인간 정체성, 텍스트 마이닝, 세쿼이아 나가마츠, 『우리가 어둠 속에서 얼마나 높이 올라갈 수 있는가』

Climate Change, Virus, Pandemic, Narratives, Technology, Human Identity, Text Mining, Sequoia Nagamatsu, How High We Go in the Dark