普通视图

Received today — 2026年5月15日学术机构（海外组织）

김민정 / 서울대학교 / 생성형 AI 시대의 시가장(詩歌場) 재편 – 샤오빙(小冰), DeepSeek를 중심으로 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월

作者Baro

2026年5月14日 23:07

연구요약문
연구목표
(한글 2000자 이내)
시 창작에서 DeepSeek는 중국 시학(詩學) 코퍼스를 기반으로, 사용자의 지시에 따라 시를 생성하는 창작기제를 무상으로 제공하는 중이다. 이 시스템은 대규모 언어 데이터에 포함된 지역 세대 성별 감정 언어와 어휘 습관을 학습함으로써, 중국 고전시로부터 현당대시에 이르는 다양한 시 양식을 모방해낸다. 나아가 DeepSeek를 비롯한 생성형 AI의 다중모달(multimodal) 기술은 사용자가 제시하는 감각적 정서적 정보와 기계의 연산 판단을 결합시키는 ‘상호작용적 창작(interactive co-creation)’의 조건을 갖추게 되었다.
본 연구는 인간의 전유물로 여겨져 왔던 문학이 AI의 등장으로 ‘인간문학’과 ‘AI문학’으로 분화되어 가는 현실 상황에 주목한다. 인간이 수 천 년에 걸쳐 축적해 온 문학 경험을 AI가 학습하여 생성한 시를 예술로 규정할 수 있는지, 그리고 그것의 예술적 성과는 어떤 기준으로 평가해야 하는지 등을 본격적으로 논의해야 하는 지금이야말로 ‘인간문학’과 ‘AI문학’이 분리되기 이전의 과도기적인 협업 단계라고 보기 때문이다.
중국의 AI 시 창작은 2014년 마이크로소프트 아시아연구소(Microsoft Research Asia)가 개발한 ‘샤오빙(小冰)’으로 말미암는다. 2017년, 마이크로소프트는 샤오빙의 시를 모아 첫 시집 《햇살은 유리창을 잃고(陽光失了玻璃窗)》(이하 《햇살》)을 출간하게 된다. 《햇살》은 샤오빙이 1920년대 이후에 발표된 519명의 중국 현대시 작품을 학습한 뒤 감정 서사와 시적 이미지를 결합해 산출한 결과물로서 작품의 문법적 오류와 의미의 연쇄 논리적 연결의 불완정성 등이 한계로 지적되었다. 일각에서는 이 한계를 샤오빙을 설계한 엔지니어들이 학습 대상인 신시(新詩)의 미학적 특성을 충분히 이해 모델링하지 못한 데서 발생한 알고리즘 설계의 문제로 인식하기도 한다.
이러한 한계는 DeepSeek 이후 일정 부분 보완되는 양상을 보이기도 한다. 훠준밍은 샤오빙을 비롯한 초기 시 생성 AI가 작품 수준이 높지 않아 비판을 받았던 데 비해, DeepSeek는 시 모방 능력과 비평 능력, 그리고 알고리즘 수준 등이 높아서 인간 시 창작의 주요 특징들을 정교하게 인식 구현한다고 주장한다. 반면 시인 위졘(于坚)처럼 AI의 본질은 데이터 분석과 재조합에 있으므로 기존 텍스트를 모방 재배열하는 산출을 진정한 의미의 시 창조로 볼 수 없으며, 그런 의미에서 “딥시크는 시인이 아니라 지식인일 뿐”이라고 규정하는 입장도 있다. 그럼에도 평가의 다양한 갈래 모두는 새로운 도구의 출현이 시가장에 구조의 변화를 유발하고 있음을 긍정하는 바다.
본 연구는 샤오빙과 DeepSeek를 중심으로 AI 시 창작과 비평, 그리고 인간-AI 협업이 중국 시가장에 어떠한 변화를 가져오고 있는지를 분석하고자 한다. 이를 위하여 첫째, 중국 AI 시 창작의 출현과 발전 과정을 정리한다. 둘째, DeepSeek를 비롯한 생성형 AI의 시 생성 메커니즘과 그 시학 특징을 분석한다. 셋째, ‘협업’ 단계의 도래가 창작 주체의 개념, 비평 기준, 문학 권위의 구조, 그리고 작품 판별 및 검증의 장치를 어떻게 재편하는지 살펴본다. 그럼으로써 AI 시대 중국 시의 새로운 창작 질서와 시학 협업의 가능성을 전망하고자 한다.
기대효과
(한글 2000자 이내)
첫째, 본 연구는 AI 창작을 둘러싼 논의를 AI 시의 의의와 문학장 구조 분석의 대상으로 전환시키는 데 기여한다. 샤오빙과 DeepSeek의 사례를 통해 AI가 시의 창작 방식, 비평 주체, 문학 권위의 구조를 재편하는 실질적인 역할을 하고 있음을 입증함으로써 AI 시 연구의 기초를 마련한다.
둘째, 이미지 기반 생성에서 대규모 언어모델 기반 생성으로 이어지는 AI 시 창작 메커니즘과 그 변화를 분석함으로써 AI 시의 특징과 한계를 구명한다. 이를 통해 기존 연구가 주로 지적한 문법 오류나 의미 공백을 신시(新詩) 미학과 알고리즘 설계 사이의 긴장 관계로 재해석할 수 있는 분석의 틀을 마련한다.
셋째, DeepSeek가 시 생성과 함께 시인 선정, 작품 평가, 비평 담론의 생산 등을 수행하고 있는 점에 주목함으로써 AI가 문학장의 비평 주체로 진입하는 현상을 확인한다. 이는 시 창작과 비평을 분리해 온 기존 문학 연구의 관점을 재검토하게 하고, 인간 비평가의 역할 변화와 새로운 협업 모델에 대한 논의의 출발점이 될 것이다.
연구요약
(한글 2000자 이내)
본 연구는 샤오빙과 DeepSeek를 중심으로 AI 시 창작과 비평, 그리고 인간-AI 협업이 중국 시가장에 어떠한 변화를 가져오고 있는지를 분석하고자 한다. 이를 위하여 첫째, 중국 AI 시 창작의 출현과 발전 과정을 정리한다. 둘째, DeepSeek를 비롯한 생성형 AI의 시 생성 메커니즘과 그 시학 특징을 분석한다. 셋째, ‘협업’ 단계의 도래가 창작 주체의 개념, 비평 기준, 문학 권위의 구조, 그리고 작품 판별 및 검증의 장치를 어떻게 재편하는지 살펴본다. 그럼으로써 AI 시대 중국 시의 새로운 창작 질서와 시학 협업의 가능성을 전망하고자 한다.

가. 샤오빙 시의 특징과 언어 결합 양상(샤오빙)
마이크로소프트 아시아연구소는 2017년 《햇살》을 간행한 데 이어, 2019년에는 두 번째 시집 《꽃은 푸른물의 침묵(華是綠水的沈默)》(이후 《꽃은》)을 출판하였다. 《꽃은》은 샤오빙이 이미지를 인식해 생성한 시 초안을 바탕으로 아마추어 시인이 이를 수정 보완한 6천여 편의 응모작 중에서 200편을 선별해 엮은 시집으로, ‘인간-AI’ 협업이라는 창작 방식을 실현한 사례라 할 수 있다. 샤오빙의 시는 인간 언어 형식을 모방하려는 지향을 보인다. 하지만 실제 수행 과정에서는 불완전한 언어 결합 양상을 드러내기도 한다. 현대 중국어의 어법 규범에 부합하지 않을 뿐 아니라, 이미지 간의 연상과 서술 논리를 단절시키는 경우가 다수 발견된다. 이러한 언어적 결함은 샤오빙의 이미지 기반 시 생성 방식과 연관되어 있다. 예를 들어, ‘가을비 속 낙엽’이 담긴 이미지를 입력하면, 시스템은 그 안의 ‘나뭇잎’, ‘빗방울’, ‘시들고 노란색’ 등 시각적 요소를 자동으로 추출하고, 이를 의미 단위로 변환하여 시 생성 모듈에 전달한다. 시 생성 단계에서는 ‘나뭇잎’이 ‘시든 덩굴’, ‘늙은 나무’, ‘졸린 까마귀’로, ‘빗방울’은 ‘폭우로’, ‘시들고 노란색’은 ‘외로움’ 혹은 ‘고독’ 등 어휘로 치환되어 다양한 조합을 생성하게 된다. 이러한 결함은 시 장르의 특수성 속에서 정서의 그럴듯함으로 해석되기도 한다. 샤오빙의 시는 개별 문장의 완결성이나 논리성에서는 한계를 보이지만, 감정 서사에 강하여 독자에게 일정 수준의 정서적 설득력을 제공하기 때문이다.

나. 대규모 언어모델 기반 시 생성과 비판(DeepSeek)
DeepSeek 시의 특징은 다음과 같다. 첫째, 즉시 생성이다. 사용자가 입력을 주는 즉시, AI는 사전에 학습된 언어⦁이미지 패턴을 기반으로 시를 산출해 낸다. 시의 즉시 생성은 창작 과정에서 ‘시간’이 차지하는 의미를 근본적으로 변화시킨다. 이는 장기간의 학습과 해석 과정을 필요로 하는 작업이다. 반면에 AI는 이러한 과정을 생략하고 이미 학습된 대규모 언어모델을 통하여 시간이 압축된 창작을 수행하게 된다. 창작 행위가 더 이상 ‘시간의 예술’이 아니라, ‘지시’와 ‘응답’의 즉각적인 상호작용으로 전환하는 것이다. 둘째, 반복 학습의 가능성이다. 기존의 데이터가 충분히 학습되어 있지 않은 경우에도 사용자가 주제나 형식을 반복적으로 제시하고 그 결과물에 피드백을 제공하면, AI는 이를 반영하여 정제된 결과를 산출하게 된다. 생성형 AI의 시 쓰기는 결과물의 산출에 그치지 않고, 이용자의 지시와 피드백을 계속 반영하면서 시의 질적 수준을 높여가는 창작 과정을 보여주기도 한다. AI의 즉시성과 반복 학습이 질 높은 시 창작에 기여하기 위해서는, 그것의 계속적인 생성 가능성이 이용자 자신의 문학적 기준과 미적 판단에 의지해야만 한다.
그런 의미에서 현시점의 인간-AI 관계는 ‘활용’ 단계로부터 ‘협업’ 단계로 전환중이다. 사용자는 AI 산출 결과에 피드백을 제공하고 수정과 재생성을 반복함으로써 자신의 미적 목적을 향해 나아간다. 이 과정은 인간과 AI가 상호 응답을 거듭하며 작품을 함께 창작해 가는 과정이기 때문에 양자 간의 대화는 질의응답에 머무는 것이 아니라 인간의 창의적 의도와 기계의 계산이 결합된 ‘공동 구성(co-construction)’의 실현이 될 수밖에 없다.
키워드(Keyword)
(한글 250자 이내)
AI, 중국 시, 샤오빙(小冰), DeepSeek, 인간문학, AI문학, 협업, 창작, 비평
키워드
(영어 500자 이내)
AI, Chinese Poetry, XiaoIce, DeepSeek, Human Literature, AI Literature, Collaboration, Creation, Criticism

게시물 김민정 / 서울대학교 / 생성형 AI 시대의 시가장(詩歌場) 재편 – 샤오빙(小冰), DeepSeek를 중심으로 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.

13 - 韩国数字人文协会（KADH）

이다연 / 한국연구재단 / 중국 고전시 비평 언어에 대한 AI 학습 방법론 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월

作者Baro

2026年5月14日 23:05

연구요약문
연구목표
(한글 2000자 이내)
본 연구는 대규모 언어모델(LLM)에게 詩話 지식과 비평문(평어) 데이터를 학습시켜 고전시 비평 언어를 가르치는 방법론을 제시한다. 시화는 시론부터 시인에 대한 평가 등 시와 시인에 대한 정보들을 가지고 있는 문헌이며, 시 비평문은 함축적인 비평어로 작성되어 있어 전문 연구자도 이해하는 데 많은 시간과 노력이 필요한 자료지만, 이는 모두 고전시를 이해하는 데 직접적으로 도움이 되는 정보다. 그러나 현대인들이 이러한 문헌들을 모두 읽는 것이 사실상 불가능하고, 현대 언어를 주로 학습한 LLM을 도움을 받더라도 LLM은 이러한 정보 없이 시를 해석하기 때문에 시를 이해하는 데 어려움을 겪는다.
이를 해결하기 위하여 본 연구는 시화 데이터와 비평문 데이터를 언어모델에 학습시켜 고대 비평 언어를 내재화시켜 고대 비평가의 관점에 보다 가까이 접근하는 방법을 제시한다. 이를 통해 시화 지식이 고전시를 이해하는 데 얼마나 도움이 되는지를 검증하고 비평문이 없는 시 작품에 대하여 비평문을 생성하여 시 감상에 이해를 돕는다.
본 연구는 AI 시대에 고전문학 분야의 구체적인 문제를 기술로 해결하는 방법을 제시한다. 이는 향후 고전시 학습을 위한 AI 보조 도구를 개발하는 데 기반이 되는 연구로서 고전시에 대한 진입장벽을 낮추고 인문학과 AI 기술의 융합 연구의 모범 사례가 될 것이다.
기대효과
(한글 2000자 이내)
(1) 학제 간 협업 촉진
본 연구와 같이 고전시 지식과 AI 기술을 융합한 연구의 성과를 인공지능 관련 분야의 학회에서 발표하게 된다면, 공학 연구자들까지 고전시를 잠재력 있는 연구 분야로 인식하고 학제 간 협업이 활성화될 수 있다. 나아가 기술 분야에서도 고전시 연구자가 자연스럽게 양성되어 연구자가 부족한 현실적인 문제까지 해결할 수 있다.
(2) 기술 방법론의 확장 및 후속 연구 촉발
본 연구는 고대 중국시 비평에 한정하였으나 서양의 작품에도 적용 가능하다. 현대어로 쓰인 문학 작품이라면 LLM의 정교한 임베딩을 활용하여 더 고품질의 결과를 얻을 수 있을 것이다. 본 연구를 재현 가능하도록 만들기 위해 깃허브에 코드를 공개할 예정이므로 다른 연구자들이 이를 자신의 연구에 사용할 수 있다.
(3) 교육 현장 및 인문학 시장에서 선도
본 연구는 현재 기술의 수준을 파악하고 인문학자들의 판단이 필요한 지점을 고찰하여 AI 시대에 인문학을 어떻게 교육하고 학습해야 하는지 논의의 토대를 세운다. 연구 종료 후에는 훈련된 AI 모델을 대학이나 일반인 교육 기관에서도 교육 보조 도구로 사용할 수 있다. 이를 통해 개인 학습자들도 시 감상에 도움을 받아 고전시의 진입장벽이 낮아지는 효과를 거둘 수 있다.
연구요약
(한글 2000자 이내)
(1) 데이터셋 수집 및 전처리
비평문 데이터는 각 시인의 서적에서 직접 추출한다. 詩話 데이터는 중국 고전시 전문 디지털 아카이브인 搜韻에서 제공하는 총 93종을 사용한다. 시–비평문 데이터는 비평문이 함께 수록된 출판물을 대상으로 수집하며, 당송대 주요 시인의 작품 가운데 비평이 확인되는 작품 3,000편을 확보하는 것을 목표로 한다.
(2) 데이터 탐색적 분석(EDA)
전처리를 통해 정제된 비평문 데이터 및 시화 데이터에 대하여 전통적인 텍스트 마이닝 기법을 활용하여 탐색적 분석을 수행한다. 자주 등장하는 비평 용어를 추출하고, 연구자의 검토를 거친다. 추출된 비평 용어들은 전문 비평 서적을 참조하여 그 의미와 용례를 검토한다.
(3) 모델에게 지식 학습
첫 번째 단계는 지속적 사전학습(Continual pre-training. CPT)를 사용하여 시화 데이터의 언어적 특성과 지식을 모델에게 가르치는 것이다. 두 번째 단계에선 시-비평문 데이터를 모델에 지도 미세조정(Supervised Fine-tuning. SFT)시킨다. 이때 테스트 데이터는 별도로 분리하여 이후 진행될 평가 단계에서 사용하고 학습에는 학습 데이터셋만 사용한다. 지도 미세조정은 일반 미세조정(full fine-tuning)과 LoRA 두 가지 방식으로 실험한다. 정량적 평가 지표는 s-bert 기반의 코사인 유사도를 사용한다. 이는 길이에 무관하며 전체 의미를 파악한다는 점에서 본 연구의 데이터의 특성에 적합하다. BERTScore는 핵심 비평어가 포함되어 있는지 확인하기 위해 재현율로 판단할 것이다. 정성적 평가 지표는 LLM-as-a-judge를 활용한다.
(4) 조합 비교(Ablation Study)
본 연구의 가설을 검증하기 위해 방법론을 조합하여 비교 실험을 수행한다. 각 조합에 테스트 데이터셋을 적용하고 평가 지표로 성능을 측정한다. 각 조합은 Baseline, Baseline + CPT, Baseline + SFT, Baseline + CPT + SFT으로 구성된다.
(5) 비평 추론 방법론을 연구한 논문 집필 및 학술 대회 참가 준비
최종 실험 성과는 학술 대회에 참가하여 발표할 예정이다. 무엇보다도 학제 간 연구자들과 학술적인 교류를 통해 인문학과 인공지능의 융합 연구 가능성을 제시하는 것이 학술대회 발표의 가장 중요한 목적이다.
(6) 클라우드 서비스의 활용
모델 학습 단계에서는 안정적인 고성능 GPU 환경이 필수적이다. 고성능 GPU를 직접 구매하기에는 개인 연구자가 감당하기 어려운 수준이기에, 클라우드 서비스를 활용하여 필요한 시점에만 GPU를 사용해서 다소 경제적인 비용으로 실험을 진행하고자 한다.
(7) 연구의 한계점
고대 중국어는 극도로 자원이 부족한 희소 언어로서 가장 좋은 방법론을 찾더라도 완벽한 성능을 기대하기는 어렵다. 그러나 희소 언어 환경을 극복하는 방법들이 활발하게 개발되고 있으므로 본 연구 또한 기술적 발전과 함께 성능이 개선될 가능성이 크다.
키워드(Keyword)
(한글 250자 이내)
중국고전시, 문학 비평, 시화, 지속적(계속적) 사전 학습, 지도학습 미세조정, 희소 언어, 대규모 언어모델
키워드
(영어 500자 이내)
Chinese classical poetry, Literary Criticism, Shi-hua, Continual Pre-training, Supervised Fine-tuning, Low-resource Language, Large Language Model

게시물 이다연 / 한국연구재단 / 중국 고전시 비평 언어에 대한 AI 학습 방법론 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.

13 - 韩国数字人文协会（KADH）

유은순 / 가톨릭대학교 / 트랜스포머 기반 언어 모델을 활용한 문학 사조 혼재 연구 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월

作者Baro

2026年5月14日 23:04

연구요약문
연구목표
(한글 2000자 이내)
본 연구의 목적은 서로 다른 문학 사조가 단일 텍스트 내부에서 어떻게 공존하고 분포하는지를 분석할 수 있는 방법론을 구축하는 데 있다. 이를 위해 트랜스포머 기반 딥러닝 언어 모델인 Sentence-CamemBERT를 활용하여 19세기 프랑스 소설 스탕달(Stendhal)의 『적과 흑』(Le Rouge et le Noir)과 귀스타브 플로베르(Gustave Flaubert)의 『보바리 부인』(Madame Bovary)에 나타난 낭만주의와 사실주의의 혼재 양상을 정량적으로 가시화하고, 그 결과를 질적 해석과 통합하고자 한다.
19세기 프랑스 소설은 낭만주의에서 사실주의와 자연주의로 이어지는 흐름 속에서 전개되었으나, 개별 작품들은 단일 사조로 환원되기 어려운 복합적 미학 구조를 보여준다. 『적과 흑』은 주인공의 열망과 사회 현실에 대한 관찰이 교차하는 서사를 통해 낭만주의적 정념과 사실주의적 인식이 중첩되는 양상을 보여준다. 『보바리 부인』 역시 사실주의적 재현 속에 낭만주의적 욕망을 내면화한 주인공을 제시함으로써 서로 다른 미학적 경향이 공존하는 텍스트로 평가된다. 그러나 기존 연구는 주로 면밀한 텍스트 분석에 기반한 질적 해석에 머물러 있어, 사조적 특징이 텍스트 내부 어느 지점에서 강화되거나 약화되는지, 그리고 어떠한 분포와 변화를 보이는지를 체계적으로 검토하는 데 한계가 있었다. 이에 본 연구는 언어 모델 기반 임베딩을 활용하여 소설 내부에서 서로 다른 사조적 경향이 어떻게 분포하고 이동하는지를 계량적으로 분석하고자 한다. 본 연구의 구체적인 목표는 다음과 같다.
첫째, 낭만주의와 사실주의에 충실한 전형적 텍스트를 선정하고, 언어 모델 기반 임베딩을 통해 문학 사조 앵커 벡터(literary movement anchor vectors)를 구축한다. 이를 통해 『적과 흑』과 『보바리 부인』에 나타난 사조 혼재의 분포와 변화 양상을 분석하기 위한 참조 축(reference axis)을 마련한다.
둘째, 분석 대상인 두 소설을 챕터 단위로 임베딩한 뒤 각 챕터의 벡터와 사조 앵커 벡터 간의 의미적 거리를 코사인 유사도로 측정한다. 그리고 그 결과를 사조 맵(literary movement map)으로 시각화하여 챕터 단위의 사조 경향과 분포, 시계열적 변화 양상을 검토한다.
셋째, 사조 맵을 기반으로 서로 다른 미학적 경향이 강화되거나 약화되는 구간을 식별하고, 챕터 내부 임베딩 벡터의 분산(variance)을 통해 사조적 경향의 변동 정도를 분석한다. 나아가 챕터 간 서사적 전환이 나타나는 구간과 변동성이 높은 챕터를 중심으로 질적 해석을 수행함으로써 정량 분석과 질적 해석을 통합한다.
기대효과
(한글 2000자 이내)

학문적 기대효과 : 인공지능 기반 문학 연구 방법론 구체화

전통적인 질적 비평에 의존해 왔던 문학 사조 연구에 트랜스포머 기반 딥러닝 언어 모델을 활용한 정량적 분석을 도입함으로써, 문학적 통찰을 데이터에 기반하여 재검토할 수 있는 연구 방법을 마련한다. 특히 질적 연구가 사조의 혼재를 대표적인 장면이나 단락을 중심으로 논의해 온 것과 달리, 본 연구는 텍스트 전체에 걸쳐 나타나는 사조 혼재의 분포와 변화 양상을 계량적으로 분석함으로써 단일 사조로 환원되지 않는 복합적 미학 구조를 보다 체계적으로 조망할 수 있는 분석 틀을 제공한다.

사회적 기대효과 : 인공지능 시대 인문학의 역할 재정립

본 연구는 기술과 인문학적 해석이 상호 보완적인 관계를 형성할 수 있음을 보여줌으로써, 인공지능 시대에 문학 연구의 역할과 가능성에 대한 인식을 확장하는 데 기여한다. 나아가 문학이 인공지능 모델과 데이터 자원을 통해 지속적으로 연구 지평을 갱신할 수 있는 영역임을 환기시키고 인문학의 사회적 가치에 대한 이해를 심화하는 계기를 제공한다.

교육적 기대 효과 : 디지털 인문학 교육 모델 설계

최근 대학의 인문학 교육은 인공지능 기술과의 융합을 적극적으로 모색하는 방향으로 빠르게 전환되고 있다. 본 연구에서 구축한 코퍼스와 언어 모델 기반 데이터, 그리고 재현 가능한 분석 절차는 인공지능 시대에 부합하는 교육 자료로 활용될 수 있다. 또한 전통적인 독해와 데이터 분석을 융합한 디지털 문학 교육 모델로 확장될 수 있다.
연구요약
(한글 2000자 이내)
본 연구의 목적은 서로 다른 문학 사조가 단일 텍스트 내부에서 어떻게 공존하고 분포하는지를 정량적으로 분석하기 위한 통합적 방법론을 제안하는 데 있다. 이를 위해 트랜스포머 기반 딥러닝 언어 모델를 활용하여 스탕달의 『적과 흑』과 플로베르의 『보바리 부인』에 나타난 낭만주의와 사실주의의 혼재 양상을 정량적으로 가시화하고, 그 결과를 질적 해석과 결합하는 통합적 분석 절차를 구축한다. 이는 기존 질적 연구가 대표적 장면이나 단락을 중심으로 사조의 혼재를 논의해 온 경향을 보완하고, 텍스트 전체에 걸쳐 나타나는 사조적 경향의 분포와 변화 양상을 체계적으로 파악하기 위한 시도이다. 본 연구는 다음과 같은 절차로 수행된다 : 첫째, 각 사조의 미학적 특성을 대표하는 전형적 작품 10편씩 총 20편으로 앵커 코퍼스를 구축한다. 작품 선정 과정에서는 문학사적 대표성과 작가 간 균형을 고려하여 특정 작가에 편중되는 것을 방지한다. 분석 대상 텍스트는 프로젝트 구텐베르크에서 제공하는 프랑스어 원서를 활용하며, 특수 기호와 주석 등 분석에 불필요한 요소를 제거하는 전처리 과정을 거친다. 둘째, 전처리된 소설은 챕터 단위로 분할한 뒤 중첩 슬라이딩 윈도우(overlapping sliding windows) 방식으로 세분화하여 서사 흐름의 단절을 최소화하고 의미 변화를 연속적으로 포착한다. 그리고 프랑스어 말뭉치를 기반으로 사전 학습된 트랜스포머 언어 모델 Sentence-CamemBERT를 활용하여 슬라이딩 윈도우 단위로 임베딩을 생성하고, 이를 집계하여 챕터별 대표 벡터를 산출한다. 셋째, 사조의 전형적 작품들의 임베딩을 기반으로 낭만주의와 사실주의 앵커 벡터(anchor vector)를 구축한다. 앵커 벡터는 사조의 평균 문체를 도출하기 위한 기준이 아니라 두 소설이 서로 다른 미학적 경향 가운데 어디에 가까운지를 판단하기 위한 참조 축이다. 넷째, 소설의 각 챕터 벡터와 앵커 벡터 간 코사인 유사도를 측정하여 의미적 거리를 산출하고, 그 결과를 사조 맵으로 시각화한다. 사조 맵은 텍스트 내부에 나타나는 미학적 경향의 분포와 서사 전개에 따른 이동을 좌표 공간에 보여줌으로써 사조 혼재를 분포와 변화의 관점에서 조망하게 한다. 마지막으로 정량 분석과 질적 해석을 결합한 통합적 접근을 수행한다. 챕터 간 사조 전환 구간을 식별하고, 해당 지점에서 나타나는 서사적 특징에 대한 질적 해석을 진행한다. 또한 각 챕터를 구성하는 윈도우 벡터와 앵커 간 유사도의 분산을 측정하여 챕터 내부의 사조적 안정성과 변동성을 평가한다.
키워드(Keyword)
(한글 250자 이내)
디지털 인문학, 딥러닝 언어 모델, 문학 사조, 텍스트 임베딩, 정량적 분석
키워드
(영어 500자 이내)
Digital Humanities, Deep Learning Language Models, Literary Movements, Text Embedding, Quantitative Analysis

게시물 유은순 / 가톨릭대학교 / 트랜스포머 기반 언어 모델을 활용한 문학 사조 혼재 연구 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.

13 - 韩国数字人文协会（KADH）

강남오 / 강원대학교 강릉캠퍼스 / 옛한글 자료 번역을 위한 MCP기반 번역가-LLM 협업 번역 모델 연구 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월

作者Baro

2026年5月14日 23:02

연구요약문
연구목표
(한글 2000자 이내)
본 연구의 목표는 최근 급격히 발전하고 있는 거대 언어 모델(Large Language Model, LLM)을 이용하여 옛한글 자료 번역을 효율적이고 일관적으로 수행할 수 있는 “MCP(Model Context Protocol)기반 번역가-LLM 협업 번역 모델”을 제시하고 해당 모델의 성능 평가를 통해 그 효용성을 검증하는 것이다.

최근 급속도로 발전하고 있는 인공지능(Artificial Intelligence, AI) 기술은 다양한 분야와 융합하고 있으며 산업계, 학계 및 일상의 모든 영역에서 혁신적인 변화를 이끌고 있다. 특히 최근 소개된 LLM(ChatGPT, Gemini 등)은 자연어를 이해하고 생성하는 능력을 바탕으로 다양한 분야와 융합 및 활용되고 있다.

옛한글로 기록된 자료는 우리 민족의 역사, 철학, 문학, 그리고 한국어의 원형을 보여주는 중요한 문화유산이다. 그럼에도 옛한글 자료의 현대한글 번역 작업은 다른 분야에 비해서 매우 느리게 진행되고 있다. 그 이유는 옛한글 자료의 번역은 해당 분야에 대한 고도의 지식과 전문성을 요구함으로 인해 소수의 전문가들만이 이를 수행할 수 있기 때문이다.

이러한 상황에서 최근 소개된 LLM(ChatGPT 5.2나 Gemini 3 등)은 방대한 옛한글–현대한글 병렬 자료의 학습을 통해 옛한글 자료를 일정한 수준의 현대한글로 번역할 수 있는 능력을 갖추고 있다. 이는 기존에 전적으로 전문 번역가에 의존해왔던 옛한글 자료의 번역 작업에 큰 변화를 가져올 수 있는 기술적 환경이 마련된 것이다.

하지만 LLM 단독 번역의 결과는 잘못된 표기 변환 혹은 표현 변환, 옛한글 어휘의 잘못된 해석, 문맥에 맞지 않는 번역 등 아직은 부족한 점을 보이고 있다. 이는 전문 번역가가 LLM에 옛한글 자료의 번역에 필요한 적절한 지식을 제공하는 협업구조를 통해 해당 문제를 보완할 수 있다. 그리고 이러한 협업 구조를 구축하는 기술적 방법으로써 MCP(Model Context Protocol)를 활용할 수 있다.

따라서 본 연구에서는 옛한글 자료의 번역에 있어 전문 번역가와 LLM이 가진 한계점을 상호 보완함으로써 옛한글 자료 번역의 속도와 생산성을 향상시킬 수 있는 옛한글 번역을 위한 MCP기반 번역가-LLM 협업 번역 모델을 제시하고 이의 효용을 검증하는 것을 목표로 두고 있다.
기대효과
(한글 2000자 이내)
본 연구를 통해서 기대하는 학문적, 사회적 기대효과는 다음과 같다.

■ 옛한글 자료 번역과 인공지능의 융합을 통한 새로운 번역 모델 제시
기존에 전문 번역가가 전적으로 수행했던 옛한글 자료 번역을 번역가-LLM 협업 모델로 전환함으로써 번역의 속도와 생산성을 향상시키고 오류 감소 및 일관성 있는 번역 결과를 산출하는 새로운 옛한글 자료 번역 모델을 제시한다.

■ 옛한글 번역 지식 자료의 체계화 및 활용성 제고
번역 지식이 개별 연구자의 경험에 머무르지 않고 재사용 가능한 자료로 체계화 및 축적됨으로써 번역의 일관성과 효율성이 향상되며, 향후 옛한글 번역 연구 및 번역 교육에서 활용 가능한 기반 자료로 사용될 수 있다.

■ 고전어 자료 번역에 참조 모델 제공과 번역 작업의 인공지능 융합 촉진
전문 번역가와 LLM의 협업을 체계화한 번역 모델을 제공함으로써, 옛한글 자료의 번역에서 뿐만 아니라 고전어 자료 번역 분야 전반에서 활용 가능한 참조 모델을 제시하고, 고전어 자료 번역 연구에 인공지능의 융합을 촉진한다.

■ 옛한글 자료의 현대한글 번역 자동화를 통한 인문학 대중화 촉진
옛한글 자료의 대규모 현대한글 번역은 일반인들도 쉽게 옛한글 자료를 접근할 수 있는 기회를 제공한다. 이는 인문학의 대중적 확산과 문화유산의 현대적 활용에 기여할 것이다.
연구요약
(한글 2000자 이내)
본 연구에서는 옛한글 자료의 현대한글 번역을 효율적이고 일관성 있게 수행하기 위한 MCP기반 번역가–LLM 협업 번역 모델 및 그 성능의 분석을 수행한다. 이는 전문 번역가 위주로 수행되던 기존 번역 방식의 한계성을 극복하고 거대 언어 모델(Large Language Model, LLM)과의 협업을 통해 대량의 옛한글 자료를 일관성 있게 번역할 수 있는 가능성을 증대하려는 것이 목적이다.

연구 목적을 달성하기 위해 수행할 연구 내용은 다음과 같다.

■ 첫째, 번역 지식 자료의 설계 및 체계화
옛한글–현대한글 번역의 정확성과 일관성 향상에 필요한 번역 지식(표기 변환, 전문용어의 해석, 어조 지침 등) 자료의 유형을 정의하고, 이를 LLM이 활용 가능한 형태의 자원으로 체계화하는 방법을 연구한다.

■ 둘째, MCP기반 번역가–LLM 협업 번역 모델의 설계 및 구축
구축된 번역 지식 자료는 MCP를 활용 LLM에 전달되고, LLM이 이를 참조해 번역을 수행하는 번역가-LLM 협업 번역 모델의 설계 및 구축을 연구한다.

■ 셋째, MCP기반 번역가–LLM 협업 번역 모델의 적용 및 성능 분석
구축된 번역가-LLM 협업 번역 모델을 실제 옛한글 자료 번역에 적용하여 번역의 정확성, 일관성, 그리고 재현 가능성 측면에서의 성능을 분석 연구한다.

연구 목적을 달성하기 위한 연구 방법은 다음과 같다.

■ 첫째, 번역 지식 자료 구축
전문 번역가가 번역한 옛한글–현대한글 자료와 번역가-LLM 번역 협업 과정 중에 파악되는 번역 지식을 체계적으로 표현 및 구축하는 방법을 연구한다. 또한 번역 지식 자료를 대량으로 자동 구축하기 위한 방법의 연구도 수행한다.

■ 둘째, MCP기반 번역가–LLM 협업 번역 모델의 설계 및 구축
번역 지식 자료의 구축, LLM의 번역 생성, 오류 검토 및 수정 사항의 지식 자료화 등의 과정을 순환적으로 적용하는 작업 흐름의 정립을 연구하며, 이를 바탕으로 MCP기반 번역가-LLM 협업 번역 모델의 설계 및 구축을 연구한다.

■ 셋째, 구축된 MCP기반 번역가–LLM 협업 번역 모델의 성능 분석
동일한 옛한글 자료를 대상으로 단순 LLM 번역 결과와 MCP기반 번역가–LLM 협업 번역 결과를 비교하여 정확성, 문맥 일관성, 오류 감소 정도를 분석한다. 그리고 LLM의 처리 과정을 추적하여 정량적 비교를 수행하고, 정성적 분석과 사례 분석을 병행함으로써 제안한 협업 번역 모델의 유효성과 한계점을 분석한다.
키워드(Keyword)
(한글 250자 이내)
옛한글, 번역, 인공지능, 거대 언어 모델, 모델 콘텍스트 프로토콜, 옛한글-현대한글 병렬 자료, 자연어 처리
키워드
(영어 500자 이내)
Pre-Modern Korean, Translation, Artificial Intelligence(AI), Large Language Model(LLM), Model Context Protocol(MCP), Pre-Modern Korean-Modern Korean Parallel Text, Natural Language Processing(NLP)

게시물 강남오 / 강원대학교 강릉캠퍼스 / 옛한글 자료 번역을 위한 MCP기반 번역가-LLM 협업 번역 모델 연구 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.

13 - 韩国数字人文协会（KADH）

정연주 / 고려대학교 / 언어모델을 활용한 조선시대 사형·감형 사례 추출과 시대적 맥락 분석 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월

作者Baro

2026年5月14日 23:00

연구요약문
연구목표
(한글 2000자 이내)
사형은 국가가 보호하려는 최우선 가치 및 질서를 어긴 사람들에게 선고된다. 따라서 사형은 조선의 통치이념과 중요 가치가 무엇인지 알 수 있는 소재이다. 감형 기준을 설명할 때 법학에서는 일정한 기준이 있다고 설명하며, 이를 법치와 연관 짓는다. 역사학에서도 일정한 기준이 있음을 인정하지만 이를 유교적 관점으로 해석하고자한다. 즉 사형과 감형 문제는 예치주의, 법치주의 등 통치 이념 설명과도 연관된다. 또한 사형 감형은 단순히 휼형(恤刑)·애민(愛民)뿐만 아니라 국정 운영 사상 및 방식, 감형의 정당화 논리가 응축되는 지점이기도 하다. 한편 조선의 통치 철학 중 하나인 흠휼에 대해서도 단순한 수사로만 작동했는지 아니면 실제로 통계적으로 유의미한 감형의 논리로 사용되었는지는 실제 사례를 통해 분석해야 한다.
정리하면 사형과 사형 감형의 사례를 분석하는 것은 통치 이념·국정운영 방식 해명, 역모 등 정치 상황 고려 측면에서는 정치사, 법이 실제 적용되는 모습을 검토하는 측면에서는 사회사, 법과 형벌 및 법감정 검토 측면에서는 법제사의 관점에서 바라볼 수 있는 주제이다. 기존에는 특정 왕대나 자료를 중심으로 살펴봤으며, 모든 연구들이 각기 기준이 달라 통합해서 이해하기도 어려워 조선 전시기를 동일한 기준으로 분석할 필요가 있다. 그런데 개인이 모든 기록을 다 검토하기 어렵기 때문에 AI인문학 방법론으로 분석하여 조선 전 시기의 사형 및 감형 사례를 검토한 후 그 안에 담긴 역사적 맥락과 의미를 읽고자 한다. 이는 AI 시대 역사학의 방향과 역사학자의 역할을 제시해주는 기능도 할 것이다.

사형 및 사형 감형 사례의 인물별·사건별 추출 및 검수
언어모델을 활용하여 태조~철종실록에서 사형 및 사형 감형 사례를 인물별·사건별로 추출하고 검수하여 정리하고자 한다. 사형 및 사형 감형은 키워드 검색만으로는 해결하기 어렵다. 이 때문에 단순 규칙 기반으로 사료를 추출하는 기존 디지털인문학 방식으로는 한계가 있으므로 AI인문학 방법론을 도입할 것이다.
왕대별·범죄별 사형 및 사형 감형의 건수·비율·차이 비교를 통한 기준 확보
추출한 사료를 바탕으로 왕대별·범죄별 사형 및 사형 감형의 건수, 비율, 차이 등을 비교하고자 한다. 멀리서 읽기(distant reading) 방식으로 전체 경향을 조망하여 특정 왕대에서 관찰되는 현상이 일시적이고 특수적인 것인지 혹은 장기적 경향 속에서 반복되는 패턴인지 판별 가능한 기준을 얻을 것이다. 전수 조사를 통해 기준을 세우고 경향성을 확인한 다음 연구를 진행한다면 보다 정밀한 질적 해석이 가능해질 것이다. 이를 통해 다른 연구에서도 참고할 수 있는 비교 기준을 설정하고자 한다.
사형·감형이 작동되는 논리와 정치·사회적 조건, 역사적 배경 고찰
이상의 결과를 토대로 변곡점을 찾고 그에 대해 구체적 분석을 진행한다. 사형과 감형이 작동되는 논리와 각 왕대별 정치적·사회적 조건, 역사적 배경 등을 고찰하고 전쟁, 기근, 역병 등과 함께 사회 안정을 위해 감형이 더 늘어났는지 검토하여 사회 안정 기능도 살펴볼 수 있다. 감형시 언급되는 담론의 내용 및 유형, 흠휼의 실제 적용 양상, 감형 판단 기준 역시 검토할 예정이다. 이를 통해 사형과 사형 감형이 단순히 형벌제도가 아니라 국가가 사회 질서를 유지하고 통치를 정당화하는 방식과 긴밀히 연관되어 있음을 밝히고 조선의 국정운영과 통치 이념 등을 장기적 시야에서 재구성하고자 한다.
기대효과
(한글 2000자 이내)
연구결과의 학문적 기대효과 ◾ 사례 전체 분석을 통한 사형·사형 감형 의미의 재검토
본 연구는 조선 전시기 실록에 나타난 사형 및 사형 감형 사례를 사건 단위로 정리·구조화하여, 특정 왕대·자료 중심 연구가 갖는 한계를 보완한다. 사형·감형의 규모와 추이를 장기 추세로 제시하여 기존 연구와 동일한 결론에 도달하더라도 그 결론이 특정 시기의 우연인지, 반복적으로 나타나는 경향인지 검증 가능한 근거를 제공한다. ◾ 왕대별·범죄별 비교를 통한 기준 제시
왕대별·범죄별로 사형 사건의 규모와 감형 비율을 비교할 수 있어 특정 왕대 혹은 특정 범죄의 관행이 장기 추세 속에서 예외인지 일반적 경향과 유사한지 판단할 기준을 제공한다. ◾ 통치이념·국정 운영 방식의 실증적 검토
감형이 적용되는 범죄와 거의 적용되지 않는 범죄가 구분되면 국가가 중요하게 다룬 가치와 용인 범위를 실증적으로 제시할 수 있다. 더 나아가 흠휼이 수사에 머물렀는지 실제 정책으로 작동했는지를 사례 기반으로 검토할 수 있게 되어 조선의 통치 이념과 국정 운영 방식에 대해서도 설명할 수 있게 될 것이다.
연구결과의 활용방안 ◾ 분석 대상 확대와 후속 연구로의 연결
본 연구의 방법론을 활용하여 『승정원일기』, 『비변사등록』, 『일성록』, 『추안급국안』, 『심리록』 등으로 분석 범위를 넓혀 사형·감형의 논리와 운영 방식을 더 촘촘히 추적할 수 있다. 또한 장기 추세와 비교 기준을 통해 특정 왕대 또는 특정 범죄군을 더 깊이 있게 해석하는 연구로도 이어질 수 있다. ◾ 형벌 전반을 비롯한 연구 범위 확장
사형뿐 아니라 유배·장형 등 다른 형벌에도 동일한 사건 단위 정리와 비교 분석을 적용할 수 있으며, 제도와 현실 사이의 간극을 통해 당대 사회상을 해명하는 사회사적 연구로 확장 가능하다. 또한 사료를 연결하고 문맥을 읽어야 하는 모든 연구들에 해당 방법론을 적용할 수 있다. ◾ AI인문학의 방법론 제시
AI를 역사 해석 주체로 사용하는 것이 아니라 사료를 정리하고 분석하는 도구로 활용할 수 있다. 이 과정에서 인간이 개입하여 더 나은 결과물을 얻도록 검수와 재학습을 진행한다. 이를 통해 AI활용과 관련하여 역사학 연구가 나아갈 방향과 연구자의 역할을 구체적으로 보여주는 연구 사례가 될 것이다.
연구요약
(한글 2000자 이내)
본 연구의 대상은 태조~철종대 실록이며, 고종대부터는 대한제국이 선포되면서 정치체제 및 법제 운영의 기준이 바뀌어 동일한 기준으로 비교하기 어렵기 때문에 제외한다. 조선 전 시기를 유사한 기준으로 분석하기 위해 실록만 활용한다. ◾ 연구 대상

사형 집행 사례와 더불어 율이나 당시의 인식에 따라 사형에 해당하는 범죄를 저질렀으나 감형이 된 사례를 검토·분석한다.
『대명률』과 『경국대전』부터 『대전회통』까지 조문에 감형이 명시되지 않았음에도 감형이 된 경우, 또는 최종 확정 처벌이 더 낮아지거나 석방되는 경우를 포함한다. 사면, 무고로 인한 석방 역시 추출하여 다른 감형 유형과 비교할 것이다. 이후 1년간 기록이 나타나지 않으면 불명으로 처리한다. ◾ 연구 방법 ① 사형 관련 표현을 찾아 사건 후보를 만들고 문맥을 검토하여 사형 집행·감형·불명으로 구분(사건 탐지(Event Detection))
② 실록 웹페이지의 인물명 태깅 정보를 활용해 인명을 추출하고, 인물과 기사 후보를 연결해 최초 등장 이후 1년간 관련 기사를 묶어 사건 단위로 재구성(사건 추적(Event Tracking))
③ 관계 추출(Relation Extraction)로 인물-율명-형벌 연결을 구조화하고, 일부 사례를 선별해 기준 마련
④ 추정 결과는 확정하지 않고 사람의 검수와 오류 수정을 반복하는 HITL(Human In The Loop) 방식으로 기준을 계속 다듬음
⑤ 위의 방법을 Few-shot prompting 프롬프트 기반으로 진행함 ◾ 분석 및 해석
추출·정리한 데이터를 바탕으로 왕대별·범죄별 사형·감형을 정리하고, 사형이나 감형 증감의 역사적 배경, 정치적 상황, 역병·기근 등 사회적 상황, 형벌 및 법감정 등 법제사적 맥락, 국왕의 국정운영 사상 및 방식과 통치 이념 등을 함께 고려하여 시대적 맥락을 검토한다.
키워드(Keyword)
(한글 250자 이내)
조선왕조실록, 사형, 감형, 디지털인문학, AI인문학, 언어모델
키워드
(영어 500자 이내)
Veritable Records of the Joseon Dynasty, death sentence, commutation, digital humanities, AI humanities, large language model, LLM

게시물 정연주 / 고려대학교 / 언어모델을 활용한 조선시대 사형·감형 사례 추출과 시대적 맥락 분석 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.

13 - 韩国数字人文协会（KADH）

이현정 / 고려대학교 / 정렬 기반 커버리지 기법을 활용한 고려시대 사료의 비대칭적 계승 연구: 『고려사』 열전, 『고려사절요』 졸기, 고려시대 묘지명을 중심으로 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월

作者Baro

2026年5月14日 22:59

연구요약문
연구목표
(한글 2000자 이내)
고려시대 연구의 핵심 자료인 『고려사』와 『고려사절요』는 조선 초 여러 차례의 개수 과정을 거쳐 완성된 사서이다. 기존 연구는 이들 사서가 원전 사료를 충실히 수록했다는 점에 주목하여 묘지명 등과의 비교를 통해 찬자의 시각과 편찬 의도를 분석해 왔다. 하지만 기존의 연구 방식은 서술 양상의 대조에 치중하여 사료 간 유사성을 객관적으로 증명할 정량화된 수치가 부족하다는 한계가 있다. 또한 주로 자구 일치 여부를 확인하는 수준에 머물러 의미와 맥락 중심의 심층적 분석이 미흡하며, 분석 시기 역시 방대한 사료의 양으로 인해 고려 전 시기를 포괄하지 못했다는 문제점이 있다.
기술적 발달로 텍스트 정량화가 가능해지면서 사료 간 유사도 분석이 진행되어 왔으나, 유사도 지표는 대칭적인 성격을 띠기 때문에 사료 편찬의 계보나 방향성을 설명하기에는 역부족이다. 이에 본 연구는 커버리지(Coverage) 개념을 도입하여 이러한 단점을 극복하고자 한다. 커버리지는 한 사료의 정보가 다른 사료에 포함된 정도를 측정함으로써 사료 사용의 우선순위와 선택 및 배제 과정을 실증적으로 추론하게 한다. 이를 통해 사료 간 관계를 원사료-편찬사료-요약사료라는 계층적 구조로 재구성하고, 텍스트 공유 양상을 방향성 있는 비대칭 구조로 분석할 수 있다.
커버리지 기반 분석은 단순한 유사도 측정으로는 포착하기 힘든 요약･삭제･재구성과 같은 서사적 개입 양상을 식별하는 데 효과적이다. 특정 의미 단위가 포함되지 않는 경우를 편찬자의 선택적 삭제로 해석하고, 사건은 유지되나 평가 어휘가 변하는 경우를 의도적인 재구성으로 구분하여 분석함으로써 사료 간의 차이를 단순한 불일치가 아닌 능동적인 편찬 행위의 결과로 규명할 수 있다. 결론적으로 본 연구는 정적인 비교를 넘어 커버리지라는 동적 지표를 통해 고려사 편찬 과정의 실제 작동 방식을 밝히고, 원간섭기를 포함한 고려 전 시기로 연구 범위를 확장하여 역사학 방법론의 새로운 지평을 넓히고자 한다.
기대효과
(한글 2000자 이내)
첫째, 사료 비판의 객관화가 가능하다. 그동안 연구자의 주관적 분석에 의존했던 사료 비교를 유사도 점수나 커버리지 값과 같은 수치화된 지표로 제시함으로써 분석의 객관성을 확보한다.
둘째, 거시적인 역사상 도출이 가능하다. 수작업으로는 분석하기 어려웠던 방대한 분량의 사료에 대해 정렬(Alignment) 분석을 수행함으로써, 지엽적인 데이터에 매몰되지 않고 시대를 관통하는 변화 양상을 관찰할 수 있다. 이는 삼국시대 및 조선시대와의 비교 연구로도 확장 적용이 가능하다.
셋째, 역사학 연구 방법론의 지평을 확대할 수 있다. 전통적인 문헌 해독 방식과 최신 NLP 기술을 결합한 시도는 고려시대 전반의 정보 계승 구조를 분석하는 데 있어 새로운 표준 모델을 제시한다. 특히 SIKU-BERT와 같은 모델을 활용한 맥락적 유사성 측정은 단순 키워드 매칭을 넘어선 ‘맥락적 사료 비판’의 가능성을 열어준다.
마지막으로, 연구 과정에서 생성되는 데이터셋과 언어 모델의 실용적 활용이다. 이는 향후 역사 정보 서비스나 디지털 아카이브 시스템에 탑재될 수 있다. 특히 특정 사료 검색 시 연관 사료를 함께 제시하고, 사료 간 정보 일치율과 차이점을 시각화하여 보여줌으로써 역사 기록의 전승 과정을 쉽게 이해하도록 돕는 교육적 도구로 활용할 수 있다.
연구요약
(한글 2000자 이내)
본 연구는 『고려사』 열전, 『고려사절요』 졸기, 그리고 고려시대 묘지명을 비교 분석하여 사료 간의 유사성을 확인하고 정보의 원천 자료가 전승되는 과정을 탐색하는 것을 목적으로 한다. 연구 대상으로 인물 중심의 사료인 열전, 졸기, 묘지명을 선정한 이유는 인물에 대한 서술이 찬자의 시각 변화와 사료 간의 상호참조성을 가장 잘 보여주는 소재라고 생각했기 때문이다. 특히 관찬사서인 열전·졸기와 미화의 성격이 강한 묘지명 사이의 주관적 평가를 배제하고 실질적인 유사도를 비교함으로써, 사료 편찬 과정에서 각 자료가 구체적으로 어떻게 활용되었는지 규명하고자 한다.
연구 방법론 측면에서는 최신 자연어 처리 기술인 BERT를 활용한다. 우선 한 인물에 대한 세 종류의 사료를 병렬 코퍼스로 구축한 뒤, 문장 임베딩을 통해 코사인 유사도와 커버리지 값을 산출한다. 이를 연구자가 구축한 정답셋과 비교하여 모델의 신뢰도를 검증하고, 틀린 지점을 분석함으로써 의미 단위의 비대칭성을 확인한다. 나아가 사료 특유의 변용 패턴을 모델에 학습시키는 파인튜닝 과정을 거쳐 고려 전 시기의 묘지명을 대상으로 실험을 확대하여 방법론의 일반화 가능성을 입증하고자 한다.
백임지의 사례를 통한 시범 분석 결과, 세 사료는 입사 경위나 최종 관직 등 핵심 정보는 공유하고 있으나 서술 방식에서는 뚜렷한 차이를 보인다. 열전과 졸기에는 백임지의 농민 출신 배경과 무인정변 내용이 명시된 반면, 묘지명에서는 이러한 불리한 사실이 누락되고 대신 구체적인 관직 역임이나 장례 정보가 강조되는 비대칭적 양상이 확인된다. 또한 동일 구문에 대한 문자열 유사도와 커버리지 값의 차이는 찬자의 개입을 시사한다.
향후 본 연구는 고려 전 시기를 대상으로 유사도 계산 자동화를 수행하며, 모델의 예측과 실제 데이터 간의 간극인 ‘비대칭적 계승’의 실체를 규명할 것이다. 사료 간 분량 차이가 큰 경우나 특정 양식이 결여된 사례 등 다양한 변수를 고려하여 실험을 진행하고, 최종적으로 종합 고찰을 통해 고려시대 사료 계승 구조를 역사적 맥락에서 재해석하고자 한다.
키워드(Keyword)
(한글 250자 이내)
사료의 상호참조성, 비대칭적 계승, 정렬 기반 커버리지 기법, BERT 기반 임베딩, 병렬 코퍼스
키워드
(영어 500자 이내)
Cross-referentiality among Historical Sources, Asymmetrical Succession, Alignment-based Coverage Technique, BERT-based Sentence Embedding, Parallel Corpus

게시물 이현정 / 고려대학교 / 정렬 기반 커버리지 기법을 활용한 고려시대 사료의 비대칭적 계승 연구: 『고려사』 열전, 『고려사절요』 졸기, 고려시대 묘지명을 중심으로 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.

13 - 韩国数字人文协会（KADH）

이길환 / 고려대학교 / 한국고전소설의 향유 데이터 구축 및 활용 방안 연구 : 조선후기 평비본(評批本) 한문소설을 중심으로 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월

作者Baro

2026年5月14日 22:59

연구요약문
연구목표
(한글 2000자 이내)
▮연구의 목적과 필요성
 본 연구의 목적은 조선 후기 평비본(評批本) 한문소설들의 문맥 및 비평 정보들을 시맨틱 데이터로 전환하고 이를 기반으로 고전소설의 향유 양상을 작품론 연구에 활용할 수 있는 방안을 제시하는 것이다.
 향유 정보를 갖춘 소설 유관 텍스트 가운데 작품에 직접적 감상-비평을 본문과 물리적으로 인접한 형태로 드러내는 것은 평비본이다. 현재 평비본소설 논의는 「광한루기」 연구를 제외하면 신자료 발굴 차원에서 서지 정리·계열 검토 등을 개괄하는 식의 기초 단계에 머물러 있다. 더군다나 지원자의 조사 결과 협주·협비·두주 등이 단순 낙서 차원을 넘어 자료 전반에 걸쳐 지속적으로 나타나는 평비본-주석본은 학계에 알려진 것보다 방대한 20여 종에 달한다.
 본 과제에서는 ①그간 알려지지 않은 광의의 평비본소설 20여 종 목록을 공유해 고전소설사의 외연을 확장하고, ②서지 및 계열 검토를 넘어 자료에 나타난 비평의 내용과 역할이 어떻게 유형화·구체화되는지, 또 그것들이 본문의 각 장면과 어떻게 유기적으로 연결되는지를 분석해 고전소설의 향유 맥락을 실증적으로 복원하고자 한다.
 그간 고전소설 연구는 접근이 용이한 선본을 중심으로 이루어졌으며 텍스트 내부 작품론 분석에 치중된 결과 작품을 둘러싸고 전개된 문인지식인층의 참여적·향유적 맥락은 상대적으로 부차화되었다. 또한 고전소설비평론 역시 긍정-부정[수용-배격]이라는 이분법적 도식 속에서 논의됐는데 평비본소설에 담긴 다양한 비평 양상은 이러한 구도를 넘어 다각적인 향유 맥락을 포착하는 출발점이 된다. 이러한 분석은 “고전소설의 비평 정보는 어떻게 유형화되어야 하는가?”·“각 이본의 독서 흔적들은 어떻게 관리되어야 하는가?”라는 문제와도 연결되며 나아가 향유자의 흔적을 매개로 작품론 분석을 심화하는 자료적 토대를 형성할 수 있다.

▮목표 달성을 위한 단계적 절차
 중점 목표 : 본 지원자는 온톨로지 기반 한국한문소설 시맨틱 데이터 모델링 방법론(2025)을 참고해 각 자료의 문맥 및 비평 정보가 의미적으로 연결될 수 있는 데이터를 구축하고 이를 토대로 고전소설 연구에서의 활용 방안을 모색하고자 한다.
 연구 범위 : 1년이라는 연구 기간을 고려해 연구 대상을 3종[<만복사저포기(萬福寺樗蒲記)> 일본 내각문고본, <숙향전(淑香傳)> 단국대본, <이생규장전(李生窺牆傳)> 일본 내각문고본]으로 한정한다.
 연구 방법 : 위 평비본소설 3종의 서지적·서사적·비평적 요소들을 시맨틱 데이터로 구조화하고 이를 학술적으로 활용하는 방안을 검토하기 위해 아래와 같은 단계적 연구 절차를 밟는다.

①자료적 토대의 구축 : 이미지 판독의 정밀성 확보를 위해 「숙향전」은 단국대 천안 캠퍼스 현장 촬영을 『서발비평본금오신화』 역시 자료를 전사한 고려대본을 직접 촬영해 저해상도 문제를 해결했다. 또한 세 작품의 본문과 두주에 대한 전산화 및 역주 작업을 완료해 즉각적인 태깅 준비를 마쳤다.

②논리적 기반의 설계 : 데이터 범용성 확보를 위해 선행 XML 논의에서 제안된 마크업 지침안을 적극 수용해 먼저 각 자료를 외부 정보와 내부 정보로 구분한다. 다음 외부 정보는 관리정보·서지정보·구성정보로 대별하고, 내부 정보는 의미적 단위로 분절된 장면을 골격으로 각종 서사적 개체 및 평비·비점 등을 계층적으로 배치해 자료의 물리적·문맥적 특징을 충실히 반영한다.

③ 실질적 데이터 생성: VS Code 환경에서 실물 이미지와 대조하며 본격적으로 XML 데이터를 생성한다. 또한 단순 태깅 작업에 그치지 않고 여타 한문본 계열과의 차이점과 기 연구에서 제안된 마크업 모델링의 실효성 등을 함께 검증한다.

④ 학술적 활용안 검토 : 완성된 시맨틱 데이터를 바탕으로 해당 비평이 각각 어떤 장면과 연결되는지 확인하고 각각의 역할과 기능에 따라 유형화한다. 이를 통해 평비 기입의 맥락, 관심 대목과 관심 등장인물, 비평에 활용되는 개념어와 전고 등 향유 양상의 다층적 지점들을 분석한다. 나아가 서발문의 작성자와 및 현대 연구자들의 비평과 비교함으로써 각각의 관심과 해석이 어디에서 교차하고 어긋나는지를 살필 예정이다.
기대효과
(한글 2000자 이내)
 본 연구는 조선 후기 평비본 한문소설의 문맥 및 비평 정보를 시맨틱 데이터로 구조화하여, 향유자의 독서 흔적을 분석 가능한 연구 자원으로 전환하고 고전소설수용사의 실증적 기반을 마련하고자 했다. 이러한 논의의 결과물은 아래와 같은 성과를 기대할 수 있다.

① 자료적 근거에 기반한 독자 반응의 재구성 : 본 과제는 평비본소설에 내함된 비평 정보들을 데이터 시맨틱 차원에서 구조화함으로써 각 평비자가 어느 구간에서 어떠한 반응을 보였는지 구체화하는 것에 초점을 두었다. 그런 점에서 기 연구과제에서 「상사동전객기」 이본에 부기된 비점과 평문 등을 바탕으로 당대의 향유 맥락을 복원하고자 했던 작업과도 분명한 연결 지점이 있다.
이러한 접근은 독자반응비평 방법론이 갖는 이론중심적 한계, 즉 막연하게 추정되어 온 향유자들의 관심처와 해석 양상을 자료중심적 차원에서 실증적으로 복원·보완한다는 점에서 강점을 지닌다. 이는 단순히 연구방법론의 심화뿐만 아니라 고전소설 교육 현장에서 학습자들을 대상으로 오늘날 나의 감상과 과거 문인지식층의 반응을 비교·검토할 수 있는 교육 자원 –데이터로 읽는 고전소설- 으로도 확장될 수 있다.

② 고전소설사의 지평 확대와 연구 환경 조성 : 본 과제는 기 연구과제와 마찬가지로 이본에 산재된 다양한 향유의 흔적들을 작품 단위로 수집하고, 그간 학계에서 상대적으로 소외되었던 평비본소설의 신자료 목록을 발굴-공유한다는 점에서 고전소설 수용사 연구를 위한 1차적 토대로 기능할 수 있다. 이러한 평비본소설에 대한 검토는 장기적으로는 상술한 문집류·정사류·필기류·간찰류 등 향유 정보를 담아내고 있는 여러 유형의 리소스들과 연계·분석이 가능하다.
특히 본 과제에서는 분석 내용을 단순히 논문 제출만으로 그치는 것이 아니라 표준화된 모델링에 기반한 XML 데이터를 함께 구축·공개한다는 점에서 그 확산성이 크다. 이는 여타 평비본·주석본 소설 연구 전반에 적용 가능한 모델을 제시함과 동시에 향후 고전소설사 수용사와 관련한 방대한 유관 자료들이 효율적으로 축적·연결될 수 있는 개방형 연구 환경을 조성하는 데 일조할 수 있다.

③ 시맨틱 데이터 기반의 연구 분석 모델 제시 : 본 과제에서 생성하는 시맨틱 데이터는 텍스트의 의미와 구조를 조직화하는 작업이기에 웹상의 비정형 데이터를 대상으로 단순 수치와 빈도만을 추출하는 초기 디지털인문학의 피상적 접근과는 질적으로 차별된다. 그간 다수의 DH연구들은 자료와 작품의 형태적·문맥적 요소들을 정밀하게 담아내기보다 통계 기반의 기술중심적 접근에 치중해왔다. 그 결과 해석적 지평이 제한되고 다른 분석 맥락으로 재활용하기도 어려우며 무엇보다도 기존 내용학 연구의 깊이와 괴리되는 측면이 많았다. 물론 고무적이게도 최근 전근대 장르들에 대한 시맨틱 데이터 모델링과 관련한 개념적 설계들이 활발해지는 추세지만, 연구자가 직접 표준 포맷에 맞추어 시맨틱 데이터를 생성·공유하고 실제 작품론 분석에 적용하는 연구는 여전히 드문 실정이다.
그런 점에서 본 과제는 단순 이론적 설계를 넘어 실제적 활용 방안을 모색하고 기존 아날로그 논의 성과들과의 접점을 확보한다는 점에서 의의를 지닌다. 다시 말해 고도화된 XML 데이터를 학계에 제공하는 성과는 물론 데이터 기반의 고전소설 연구 프로세스를 제시한다는 점에서 중요한 연구사적 의미를 갖는다.
연구요약
(한글 2000자 이내)

○ 연구의 목적과 필요성
본 연구의 목적은 조선 후기 평비본(評批本) 한문소설들의 문맥 및 비평 정보들을 시맨틱 데이터로 전환하고 이를 기반으로 고전소설의 향유 양상을 작품론 연구에 활용할 수 있는 방안을 제시하는 것이다.
본 과제에서는 ①그간 알려지지 않은 광의의 평비본소설 20여 종 목록을 공유해 고전소설사 외연을 확장하고, ②서지 및 계열 검토를 넘어 자료에 나타난 비평의 내용과 역할이 어떻게 유형화·구체화 되는지, 또 그것들이 본문의 각 장면과 어떻게 유기적으로 연결되는지를 분석해 고전소설의 향유 맥락을 실증적으로 복원하고 나아가 작품론 분석을 심화하는 자료적 기반을 구축하고자 한다.
그간 고전소설 연구는 접근이 용이한 선본을 중심으로 이루어졌으며 텍스트 내부 작품론 분석에 치중된 결과 작품을 둘러싸고 전개된 문인지식인층의 참여적·향유적 맥락은 상대적으로 부차화되었다. 또한 고전소설비평론 역시 긍정-부정[수용-배격]이라는 이분법적 도식 속에서 논의됐는데 평비본소설에 담긴 다양한 비평 양상은 이러한 구도를 넘어 다각적인 향유 맥락을 포착하는 출발점이 된다. 이러한 분석은 “고전소설의 비평 정보는 어떻게 유형화되어야 하는가?”·“각 이본의 독서 흔적들은 어떻게 관리되어야 하는가?”라는 문제와도 연결된다.

○ 연구 방향성
그간 학계에서 평비본소설을 비롯한 고전소설 수용사 논의가 본격화되지 못한 이유는 향유 맥락과 관련한 유관 작품의 목록이 충분히 공유되지 못한 점에도 있겠으나, 무엇보다 이러한 원천 리소스들을 구조화한 학술 데이터가 제대로 생성-공유되지 못한 데에 기인한다. 이러한 문제의식에 입각해 본 연구는 최근 제안된 한국한문소설 XML 마크업 방법론을 참고해 각 자료의 문맥 및 비평 정보를 의미적으로 연결하는 데이터를 구축하고 이를 토대로 고전소설 연구에서의 활용 방안을 모색하고자 한다.

○ 연구 대상
1년의 연구 기간을 감안해 연구 대상을 3종[<만복사저포기(萬福寺樗蒲記)> 일본 내각문고본, <숙향전(淑香傳)> 단국대본, <이생규장전(李生窺牆傳)> 일본 내각문고본]으로 한정한다. 이들 작품은 분량 대비 평어의 밀도가 높은데다 문장 품평·고유명사 설명·교감 제안·서사 국면에 대한 반응·등장인물 평가 등 다양한 비평 양상을 포함하고 있어 향유 유형을 귀납적으로 도출하기에 적합하다. 또한 서·발문을 함께 갖추고 있어 작품 안팎의 비평을 연계한 종합적 분석도 가능하며 특히 <숙향전> 단국대본의 경우 여타 이본과는 교감이 어려울 정도로 내용적 차이가 크다는 점에서 그 자체만으로도 소개적 가치를 지닌다.

○연구 방법
① 자료적 토대의 구축 : 먼저 조선후기 평비본소설의 이본 현황을 전수 조사하고 관련 목록의 이미지와 서지 정보를 체계적으로 정리한다. 이미지 판독의 정밀성 확보를 위해 해당 원본을 직접 촬영해 저해상도 문제를 해결한다. 또한 세 작품의 본문과 두주에 대한 전산화 및 역주 작업을 완료해 태깅이 가능한 상태로 정비한다.
② 논리적 기반의 설계 : 선행 논의에서 제안된 한문소설 마크업 지침안을 적극 수용해 먼저 각 자료를 외부 정보와 내부 정보로 구분한다. 다음 외부 정보는 관리정보·서지정보·구성정보 층위로 나누고, 내부 정보는 의미적 단위로 분절된 장면을 골격으로 각종 서사적 개체 및 평비·비점 등을 계층적으로 배치해 자료의 물리적·문맥적 특징을 충실히 반영하고 범용성을 확보한다.
③ 실질적 데이터 생성 : VS Code 환경에서 실물 이미지와 대조하며 본격적으로 XML 데이터를 생성한다. 또한 단순 태깅에 그치지 않고 여타 한문본 계열과의 차이점과 기 연구에서 제안된 마크업 모델링의 실효성 등을 함께 검증한다.
④ 학술적 활용안 검토 : 완성된 시맨틱 데이터를 바탕으로 해당 비평이 각각 어떤 장면과 연결되는지 확인하고 각각의 역할과 기능에 따라 유형화한다. 이를 통해 평비 기입의 맥락, 관심 대목과 관심 등장인물, 비평에 활용되는 개념어와 전고 등 향유 양상의 다층적 지점들을 분석한다. 나아가 서발문의 작성자와 및 현대 연구자들의 비평과 비교함으로써 각각의 관심과 해석이 어디에서 교차하고 어긋나는지를 검토한다.
키워드(Keyword)
(한글 250자 이내)
한문소설(漢文小說), 평비본(評批本), 소설비평, 이본(異本), 향유 양상, 독자반응비평, 시맨틱 데이터, 확장성 마크업 언어(XML), 인공지능(AI), 온톨로지(Ontology)
키워드
(영어 500자 이내)
korean novels in literary sinitic(漢文小說), Pingbiben(評批本), Fiction Criticism, Variant Editions, Aspects of Reception, Reader-Response Criticism, Semantic Data, XML(Extensible Markup Language), AI(Artificial Intelligence), Ontology

게시물 이길환 / 고려대학교 / 한국고전소설의 향유 데이터 구축 및 활용 방안 연구 : 조선후기 평비본(評批本) 한문소설을 중심으로 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.

13 - 韩国数字人文协会（KADH）

안진산 / 경북대학교 / 한국어 신어 추출 파이프라인의 설계와 개발 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월

作者Baro

2026年5月14日 22:58

연구요약문
연구목표
(한글 2000자 이내)
본 연구의 목적은 기 수행 과제의 혼성어 추출 방법론과 기존 신어 조사 방법론을 통합하여, 한국어 신어 추출 파이프라인을 설계·개발하는 데 있다. 구체적인 연구 목적은 세 가지이다.
첫째, 거대 언어 모델(Large Language Model, 이하 LLM)을 기존 신어 조사 방법론의 판별 및 집필 단계에 도입하여 신어 조사의 생산성과 효율성을 높이되, 연구자가 언제든 개입하여 중단, 오류 확인 및 수정, 재개할 수 있는 HITL(Human in the Loop) 파이프라인을 설계한다. 파이프라인은 ‘[모듈 1: 말뭉치 수집], [모듈 2: 신어 후보군 추출], [모듈 3: 신어 후보군 정제], [모듈 4: LLM 보조 신어 판별], [모듈 5: LLM 보조 신어 집필]’의 5개 하위 모듈로 구성된다.
둘째, 최근 사전학계에서 논의되고 있는 LLM 보조 사전 편찬의 가능성과 제한 사항을 한국어 신어의 형성 및 사용 맥락에서 실증적으로 검토한다. LLM의 비결정성·비재현성·비사실성을 통제하고, 말뭉치 기반 언어 연구의 원리인 재현 가능성과 반증 가능성을 확보할 수 있는 LLM 보조 신어 판별·집필 프레임워크를 제안한다.
셋째, 신어성 판단의 경계적 사례―고유명사의 신어 지위, 자유 결합, 비유적 의미, 평가적 의미를 내포한 어휘 결합 등―에 대한 귀납적 검토를 통해, LLM 1차 판별을 위한 포괄적 지침과 연구자 2차 판별을 위한 세부적 지침을 이원화하여 수립한다. 이는 LLM과 연구자, 연구자 간 협업에서 일관된 판단 기준으로 기능할 수 있다.
기존 신어 조사 방법론은 기반 자료 수집에서 신어 판별·집필에 이르는 각 단계가 독립적으로 수행되어 전 과정의 재현과 반증이 어려웠으며, 수십만 개에 이르는 신어 후보 항목의 수작업 검토에 상당한 시간과 비용이 소요되어 왔다. 또한 LLM 보조 사전 편찬에 대한 학계의 관심은 커지고 있으나, LLM 생성 결과의 근본적 한계를 신어의 수집과 기술의 관점에서 실증적으로 검토한 연구는 아직 충분하지 않다. 아울러 자유 결합으로 대표되는 신어성 판단의 경계 문제는 전문가 사이에서도 합의가 어려운 쟁점을 포함하고 있어, LLM과 연구자 각각의 역할에 맞는 체계적 지침의 수립이 요구된다.
기대효과
(한글 2000자 이내)
본 연구의 기대 효과 및 활용 방안은 이론언어학, 응용언어학, 국제 공동 연구의 세 가지 측면에서 제시할 수 있다. 이론언어학적 측면에서, 신어는 언어 변화의 산물로서 단어 형성론, 형태론, 의미론 등의 연구 자료를 제공한다. 파이프라인을 통해 체계적으로 수집·정제된 신어 목록은 조어 유형별 생산성 변화를 통시적으로 추적할 수 있는 기반이 되며, LLM 보조 신어 판별 과정에서 축적되는 경계 사례에 대한 귀납적 검토 결과는 신어성 판단이라는 메타언어적 능력을 실증적으로 논의할 수 있게 한다.
응용언어학적 측면에서, 본 연구는 사전학과 자연언어처리 두 분야에 걸쳐 활용될 수 있다. LLM 보조 신어 판별·집필 실험은 LLM 보조 사전 편찬의 가능성과 한계를 실증적으로 검토하는 사례가 되며, LLM의 오류 유형을 체계적으로 분류함으로써 연구자의 개입이 필수적인 단계를 구체적으로 제시할 수 있다. 자연언어처리의 관점에서는 LLM 학습용 데이터의 시간적 한계로 인한 신어 오판 경향을 정량적으로 측정할 수 있으며, 참조 자료 제공 여부에 따른 성능 차이 비교는 RAG 기반 접근법의 효용을 검증하는 사례가 된다.
국제 공동 연구의 측면에서, 본 연구에서 제안한 모듈형 구조의 파이프라인은 언어 보편적으로 적용될 수 있어 영어, 독일어, 스페인어 등의 신어 관측소와 언어별 방법론을 비교할 수 있으며, ENEOLI(European Network on Lexical Innovation) 등 국제 프로젝트와의 연계를 통해 다언어 신어 연구의 방법론적 표준화에 기여할 수 있다. 나아가 동일한 사회·문화적 사건에 대해 각 언어권에서 형성·사용되는 신어의 담화 양상을 비교하는 작업 또한 가능해질 것이다.
연구요약
(한글 2000자 이내)
본 연구는 크게 세 가지 내용으로 구성된다. 먼저, 기존 신어 조사 방법론의 3단계(말뭉치 수집-신어 후보군 추출-신어 후보군 정제)와 본 연구에서 추가적으로 제안하는 LLM 보조 사전 편찬의 2단계(LLM 보조 신어 판별-LLM 보조 신어 집필)를 하나의 파이프라인으로 연결한다. 파이프라인은 총 5개 모듈로 구성되며, 각 단계별 입력값과 출력값, 소요 시간 등의 로그를 기록·관리함으로써 신어 수집의 절차적 투명성을 확보한다.
다음으로, LLM 보조 신어 판별·집필에 대한 정량적·정성적 평가를 수행한다. 판별 실험에서는 약 10만 개의 후보 항목을 대상으로 LLM-연구자 간 혼동 행렬 분석과 형태적·의미적 특성에 따른 오류 경향 분석을 수행하고, 집필 실험에서는 약 1,000개의 신어 항목을 대상으로 LLM-연구자 정의문, 설명문, 예문 쌍의 자카드 유사도, 코사인 유사도(문장 유사도) 측정과 오류 유형 분류를 수행한다. 두 실험 모두 말뭉치 용례, 웹 용례, 벡터스토어 등 참조 자료의 제공 여부에 따른 성능 차이를 비교하며, 모델 규모별 비용과 성능의 균형점을 탐색한다.
마지막으로, 이상의 평가 결과를 바탕으로 신어성 판단 지침을 수립한다. 고유명사의 신어 지위(임시적 재명명, 사회 현상을 담고 있는 고유명사 포함 구성 등), 자유 결합과 합성어의 경계(의미적으로 합성적인 어휘 결합, 비유적 의미 포함 유형, 평가적 의미 포함 유형 등)를 포함한 경계적 사례에 대한 귀납적 검토를 통해, LLM을 위한 일반 지침(신어 후보 항목을 최대한 유지하기 위한 포괄적 기준)과 연구자를 위한 상세 지침(형태적, 의미적, 담화·화용적 쟁점을 포함한 세부 기준)을 이원화하여 수립한다. 이를 통해 LLM과 인간, 인간과 인간 사이의 협업에 기준점이 될 수 있는 체계적 판단 근거를 마련한다.
키워드(Keyword)
(한글 250자 이내)
신어, 신어성 판단, LLM 보조 주석, LLM 보조 사전 편찬, 파이프라인 구조
키워드
(영어 500자 이내)
Neologism, Neological Intuition, LLM-assisted Annotation, LLM-assisted Lexicography, Pipeline Architecture

게시물 안진산 / 경북대학교 / 한국어 신어 추출 파이프라인의 설계와 개발 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.

13 - 韩国数字人文协会（KADH）

이윤정 / 홍익대학교 / 온톨로지 기반 문화정책 도메인 특화 LLM 및 RAG 시스템 개발에 관한 연구 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월

作者Baro

2026年5月14日 22:55

연구요약문
연구목표
(한글 2000자 이내)
최근 대규모 언어모델(LLM)과 검색 증강 생성(RAG) 기술의 발전은 문화정책 분야의 혁신을 주도하고 있다. LLM은 방대한 데이터를 바탕으로 고차원적인 언어 처리와 추론을 수행하여 정책 시뮬레이션 및 의사결정 지원에 탁월한 가능성을 보여주며, RAG는 외부의 정확한 지식 베이스를 참조함으로써 LLM의 본질적 한계인 환각 현상을 억제하고 답변의 신뢰성을 담보한다. 이 두 기술의 결합은 방대한 정책 문헌과 데이터를 실시간으로 분석하여 증거 기반(evidence-based) 정책 수립을 가능케 하고 행정가와 이해관계자 간의 협업을 촉진하는 전략적 도구로 부상하고 있다.
그러나 문화정책 도메인은 예술적 가치와 사회, 경제적 효용이 혼재된 복잡성과 용어의 의미적 유동성으로 인해 단순한 AI 도입만으로는 한계가 있다. 이에 대한 해법으로 제시되는 온톨로지(ontology)는 도메인 지식을 체계적으로 구조화하여 AI가 개념 간의 맥락과 위계를 명확히 이해하도록 돕는 핵심 기반이다. 온톨로지와 결합한 LLM 및 RAG 시스템은 단순한 키워드 매칭을 넘어 ‘의미론적 추론’을 수행함으로써, 모호한 정책 용어의 맥락을 파악하고 데이터의 파편화 문제를 해결하여 전문가 수준의 심층적 분석을 제공한다.
궁극적으로 온톨로지 기반의 LLM-RAG 시스템은 문화정책의 데이터 분석 및 의사결정 체계를 획기적으로 첨단화할 것이다. 이 시스템은 각 정책 분야에 특화된 다중 AI 컨설턴트 역할을 하여 지역 문화 격차 해소와 같은 복합적 문제에 대해 구체적이고 실효성 있는 대안을 제시한다. 또한 비정형 텍스트와 정량적 지표를 융합 분석하여 정책의 성공 및 실패 패턴을 도출하여 직관이나 경험에 의존하던 기존 관행을 탈피하고 과학적 데이터에 근거한 객관적이고 투명한 정책 수립 프로세스를 확립하는데 기여할 것이다.

본 연구는 전술한 기술적 당위성을 바탕으로 온톨로지 기반 문화정책 도메인 특화 LLM 및 RAG 시스템(ONtology-driven LLM and RAG system specialized for the Cultural Policy Domain: 이하 CPD-ONLR)을 개발하는데 목적이 있다. 이를 통해 정책입안자, 정책결정권자, 행정 수행자, 관련 연구자 등이 문화정책 정보와 적용을 체계적으로 검색하고 관리할 수 있는 증거 기반 정보제공 체계를 마련하고자 한다. 구체적인 연구의 세부목표는 다음과 같다.

첫째, 문화정책 도메인 온톨로지 구축을 통한 지식의 표준화이다. 문화정책 분야에 산재한 비정형 텍스트와 이질적인 데이터를 체계적으로 통합하기 위해, 개념 간의 의미적 관계를 명시하는 고도화된 지식 그래프(knowledge graph)를 설계한다.
둘째, 신뢰성 있는 온톨로지 기반 LLM 및 RAG 시스템의 구현이다. 구축된 온톨로지를 문화정책 문헌에 특화된 지능형 질의응답 및 분석 시스템을 개발한다.
기대효과
(한글 2000자 이내)

학문적 기대효과
본 연구의 과정과 주요 결과는 문화정책과 AI 기술의 융합연구에 대한 선도적 모델을 제시하는 등 학문적으로 중요한 기초자료로 활용될 것이다. CPD-ONLR의 개발 과정은 문화정책학, 행정학, 데이터사이언스, 인공지능 등의 분야 등의 다학문적 접근과 융합연구를 촉진하여 추후 문화데이터 분석, 문화 거버넌스, AI 기반 정책연구 등 관련 분야 후속 연구에 핵심 자료를 제공할 것이다. 특히 본 연구에서 제시하는 문화정책 온톨로지 구축 방법, LLM과 RAG의 결합 등은 문화정책 연구의 새로운 학술 패러다임을 형성하는 데 기여할 것이다.
또한 구조화된 지식 그래프와 LLM의 유기적 결합은 모델 추론의 일관성을 높이고 잘못된 정보 생성을 억제할 수 있음이 보고되고 있으며, 본 연구는 이러한 첨단 기법을 문화정책 연구에 적용함으로써 AI 활용 사회과학 연구의 신뢰도를 제고할 것이다. 또한, 본 연구에서 구축된 문화정책 온톨로지는 방대한 문화정책 지식을 체계화하여 관련 학계에 표준화된 지식 인프라를 제공하고, 연구자들이 이를 활용하여 이질적인 문화정책 데이터를 비교하고 분석할 수 있게 하는 등 문화정책 연구의 이론적 기반 강화와 지식 축적의 선순환에 기여할 것으로 기대된다.
정책적 기대효과
본 연구에서 개발되는 CPD-ONLR은 데이터 기반 문화정책 수립을 위한 핵심 의사결정 지원도구로 활용될 것이다. 이는 문화정책 온톨로지와 관련 문서를 결합함으로써 정책입안자 및 정책결정권자는 방대한 법령, 백서, 연구보고서에서 정보와 근거를 즉시 확보하고 다양한 정책대안의 효과를 비교 및 분석할 수 있다. CPD-ONLR이 생성하는 답변에는 항상 출처가 명시되어 정책 판단의 신뢰성을 높일 수 있을 것이며, 이는 기존에 전문가 경험이나 정성적 분석에 의존하던 문화정책 평가 방식의 객관성을 강화하는데 도움이 될 것이다.
이와 같은 CPD-ONLR은 문화체육관광부, 한국문화관광연구원 등 주요 문화정책 기관에서 정책정보 조달 및 효과를 평가하고 의사결정을 내리는데 활용될 것이다. 이는 정책수립 단계에서부터 증거 기반 접근을 정착시켜 정책의 책임성과 투명성을 제고할 수 있다. 또한 본 CPD-ONLR이 제공하는 정보는 문화정책 법·제도 정비 및 중장기 계획 수립을 지원하고 국제기구의 문화정책 권고나 협약에 부합하는 정책설계가 가능해지는 등 정책적 활용 범위가 넓다. 이와 같이 본 연구는 국가 정책의 증거 기반 정책결정 문화조성에 기여하고, 정책담당자들이 복잡한 문화정책 환경에 선제적으로 대응할 수 있도록 도울 것이다.
연구요약
(한글 2000자 이내)
문화정책 온톨로지 구축
본 연구는 문화정책 도메인의 복합적 지식 구조를 체계화하기 위해 정책 및 현장 전문가로 구성된 이원화된 포커스 그룹 인터뷰(FGI)를 수행하여 핵심 클래스와 속성을 도출한다. 도출된 개념 모델은 Protégé 등을 활용해 법령, 백서, 지원사업 공고문의 구조적 특성을 반영한 온톨로지 스키마로 형식화되며, 정책 시나리오 기반의 인스턴스를 구축하여 추론의 논리적 정합성을 검증한다. 특히 중앙정부와 지자체 사업 간의 조건 차이 등 다양한 맥락을 인스턴스 수준에서 구별하고 일관된 추론 결과를 산출하는지 확인함으로써 향후 지능형 질의응답을 위한 견고한 지식 기반을 마련한다.
도메인 특화 LLM 파인튜닝 및 RAG 모듈 구현
구축된 온톨로지와 문화정책 코퍼스를 기반으로 LLaMA, Mistral 등 최신 LLM에 파라미터 효율적 파인튜닝(PEFT/LoRA)을 적용하여 도메인 특화 모델을 개발한다. 이 모델은 정책 문서의 고유한 서술 구조와 인과관계를 학습하여 근거 기반의 조건부 서술 능력을 갖추도록 최적화된다. 또한, 이미지, 공고문 등의 비정형 데이터와 최신 API 정보를 포괄하는 Agentic RAG 모듈을 구현하여, 판단형, 설명형, 복합형 등의 질의 유형에 따라 온톨로지 구조적 질의와 벡터 검색을 유연하게 결합하는 하이브리드 추론 경로를 운용한다. 이를 통해 환각 현상을 억제하고 최신성과 정확성이 담보된 투명한 정책 자문 서비스를 구현한다.
시스템 평가 및 검증
개발된 시스템(CPD-ONLR)의 실효성은 정량적·정성적 평가를 통해 입체적으로 검증된다. 정량적 차원에서는 RAG 평가 방법론을 준용하여 검색 모듈의 정밀도(precision), 재현율(recall), NDCG 지표와 생성 모듈의 문맥 적합성, 오정보 비율 등을 측정한다. 정성적 차원에서는 도메인 전문가가 참여하는 튜링 테스트 방식을 도입, AI 산출물과 전문가 보고서의 해석 깊이 및 타당성을 비교 분석함으로써 실무 현장에서의 활용 가능성과 신뢰성을 확보한다.
키워드(Keyword)
(한글 250자 이내)
문화정책, 증거기반 정책, 온톨로지, 검색 증강 생성, 대규모언어모델, 지식 그래프
키워드
(영어 500자 이내)
Cultural Policy, Evidence-based Policy, Ontology, Retrieval-Augmented Generation, Large Language Model, Knowledge Graph

게시물 이윤정 / 홍익대학교 / 온톨로지 기반 문화정책 도메인 특화 LLM 및 RAG 시스템 개발에 관한 연구 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.

13 - 韩国数字人文协会（KADH）

신근영 / 한국연구재단 / 아이트래킹을 활용한 중국어 정보 구조의 원칙과 인지적 처리 양상 연구 — 문답 구조에서 문장이 전달하는 정보와 의미의 구별을 중심으로 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월

作者Baro

2026年5月14日 22:50

연구요약문
연구목표
(한글 2000자 이내)
본 연구는 아이트래킹 실험을 통해 중국어 문답 구조에서 정보가 어떻게 배치되고 처리되는지를 실증적으로 분석하고, 그 결과를 바탕으로 문장이 전달하는 정보와 문장 의미가 어떻게 구별되는지를 중국어 정보 구조 관점에서 규명하는 것을 목표로 한다. 중국어 정보 구조 연구는 화제와 초점, 문장 성분 배열, 담화 기능 등 다양한 주제를 중심으로 축적되어 왔으나, 정보 초점의 배치가 실제 읽기와 이해 과정에서 어떠한 처리 부담과 시선 패턴 차이를 유발하는지에 대한 실험적 검증은 매우 제한적으로 이루어져 왔다. 특히 질문이 요구하는 정보 유형과 응답 문장의 정보 초점 위치가 어긋날 때, 문법적으로는 가능하지만 부적절하게 인식되는 현상이 발생하는데, 이는 문장 의미(언어 단위로서의 의미)와 문장이 전달하는 정보(문답 환경에서 선택·강조되는 정보)가 항상 일치하지 않음을 보여준다.
이에 본 연구는 특수의문문과 선택의문문으로 구성된 중국어 문답 구조를 연구 범위로 한정하고, 질문이 요구하는 정보 유형(대상 초점, 사건 초점, 대안 제시)과 응답 문장의 정보 초점 위치(문두, 문중, 문말), 배경 정보 제공 여부가 읽기 처리 과정에 미치는 영향을 아이트래킹 실험을 통해 분석한다. 구체적으로 시선 고정 시간, 회귀(재읽기) 발생 양상, 전체 읽기 시간을 주요 처리 지표로 삼아, 정보 초점 배치 원칙이 실제 인지적 처리 부담 차이로 구현되는지를 검증하고자 한다.
이를 통해 본 연구는 중국어 정보 구조를 단순한 이론적 기술 대상에 머무르지 않고, 실제 언어 처리 과정에서 작동하는 원리로서 객관적으로 제시하고, 문답 구조에서 문장이 전달하는 정보와 문장 의미가 구별되는 조건과 기제를 실증적으로 설명하는 것을 궁극적 목표로 한다.
기대효과
(한글 2000자 이내)
본 연구는 중국어 정보 구조 연구에 아이트래킹 기반 실증 방법을 도입함으로써, 기존의 이론적·통사적 논의를 실제 언어 처리 지표와 연결한다는 점에서 학문적·방법론적 기여가 기대된다. 첫째, 문답 구조에서 질문이 요구하는 정보 유형과 응답의 정보 초점 배치가 읽기 처리 부담에 미치는 영향을 정량적으로 제시함으로써, 문장이 전달하는 정보와 문장 의미의 구별 문제를 정보 구조 관점에서 실증적으로 뒷받침할 수 있다. 이는 정보 구조 연구에서 오랫동안 논의되어 온 초점과 배경 정보의 기능을 인지적 처리 차원에서 검증하는 사례를 제공한다는 점에서 의의가 있다.
둘째, 정보 초점의 위치와 배경 정보 제공 여부에 따라 특정 구간(초점 표지 영역, 핵심 술어 영역 등)에서 시선 고정 시간과 회귀 패턴이 어떻게 달라지는지를 제시함으로써, 중국어 정보 구조 원칙을 ‘처리 기반’으로 정교화할 수 있는 근거를 확보할 수 있다. 이를 통해 정보 구조 이론의 설명 범위를 문장 적절성 판단과 실제 이해 과정으로 확장하는 데 기여할 수 있을 것이다.
셋째, 연구 수행 과정에서 구축되는 문답 구조 실험 자극물 세트와 아이트래킹 분석 프로토콜은 향후 중국어 정보 구조 연구 및 실험 언어학 연구에서 재사용 가능한 중간결과물로 기능할 수 있다. 교육적 측면에서는 중국어 학습자가 문답 상황에서 응답의 자연스러움과 적절성을 판단하는 데 필요한 기준을 정보 초점과 처리 부담의 관점에서 설명하는 보조 자료로 활용될 수 있으며, 문법 규칙 중심 설명만으로는 어려운 ‘자연스러움’ 문제를 보완하는 데 기여할 수 있다. 또한 본 연구 성과는 학술대회 발표와 학술지 논문 게재를 통해 확산되어, 중국어 정보 구조 연구의 실험 기반 후속 연구로 연계될 수 있는 토대를 마련할 것으로 기대된다.
연구요약
(한글 2000자 이내)
본 연구는 중국어 문답 구조에서 정보 초점 배치와 배경 정보 제시가 읽기 처리 과정에 미치는 영향을 분석하기 위해 문장 읽기 과제 기반 아이트래킹 실험을 수행한다. 연구 대상은 특수의문문과 선택의문문으로 구성된 질문-응답 쌍이며, 질문이 요구하는 정보 유형과 응답 문장의 정보 초점 위치, 배경 정보 제공 여부를 실험 조건으로 설정한다. 실험 자극물은 문장 길이와 어휘 난이도를 통제하여 구성하고, 중국어 모어 화자를 대상으로 실험을 실시한다.
실험에서는 문장을 읽는 과정에서의 시선 고정 시간, 회귀 발생 여부와 경로, 전체 읽기 시간을 주요 분석 지표로 수집한다. 수집된 시선 데이터는 관심 영역(ROI) 기준으로 전처리한 뒤, 조건 간 처리 지표 차이와 상호작용을 통계적으로 검토한다. 이를 통해 질문의 요구와 응답의 정보 초점 배치가 일치하거나 불일치할 때 나타나는 처리 부담 차이를 비교 분석하고, 정보 구조 원칙이 실제 언어 처리 과정에서 어떻게 구현되는지를 검증한다.
본 연구는 1년 과제 범위에서 문답 구조를 중심으로 연구 범위를 명확히 한정하고, 분석 단위와 방법을 실험적으로 검증 가능한 수준으로 설정한다. 향후에는 본 과제에서 확립된 분석 틀과 처리 지표를 다른 문형으로 확장 적용할 수 있는 가능성도 함께 제시한다. 이를 통해 연구 목표와 방법, 범위가 일관되게 연결된 실증 연구를 수행하며, 중국어 정보 구조가 문장 해석과 적절성 판단에 작동하는 방식을 처리 지표를 통해 제시하고자 한다.
키워드(Keyword)
(한글 250자 이내)
중국어 정보 구조, 문답 구조, 정보 초점, 아이트래킹, 문장 처리
키워드
(영어 500자 이내)
Chinese Information Structure, Question–Answer Structure, Information Focus, Eye-tracking, Sentence Processing

게시물 신근영 / 한국연구재단 / 아이트래킹을 활용한 중국어 정보 구조의 원칙과 인지적 처리 양상 연구 — 문답 구조에서 문장이 전달하는 정보와 의미의 구별을 중심으로 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.

Received before yesterday学术机构（海外组织）

13 - 韩国数字人文协会（KADH）

김정연 / 한국연구재단 / 사회과학을 위한 데이터 시각화 : 이론, 방법, 교육 체계의 구축 / 2026 인문사회학술연구교수(A유형) / 190,000 / 60개월

作者Baro

2026年5月11日 22:52

김정연 / 한국연구재단 / 사회과학을 위한 데이터 시각화 : 이론, 방법, 교육 체계의 구축 / 2026 인문사회학술연구교수(A유형) / 190,000 / 60개월

접수과제정보
접수번호2026004046
연구요약문
연구목표
(한글 2000자 이내)
이 연구는 데이터화가 심화된 환경에서 사회과학 데이터를 시각적 정보로 전환하는 데이터 시각화 기법을 탐구한다. 정치사회 현상을 분석하기 위해 이론적 논의, 데이터과학 방법론, 디자인 기술을 총합하여 의미있고 분명한 방식의 데이터 시각화를 설명하는 것이 연구 목적이다. 현재 국내 사회과학 연구 분과에서는 데이터 시각화 연구의 필요성에 비해 학술적 축적이 충분히 이루어졌다고 평가하기 어렵다. 다수 연구에서 데이터 분석 결과는 대부분 텍스트와 표 중심으로 보고되며, 시각화는 보조적 표현 수단에 머무르는 경우가 많다.
본 연구는 데이터 시각화가 결과 전달을 넘어 분석의 일부로 기능한다는 점에 주목한다. 사회과학 데이터의 시각화는 사회적 맥락을 내포한 비교 장치로 작동하며(Long, 2013), 사회과학 연구에서 독립적 방법론으로 이해될 필요가 있다. 데이터 시각화는 추상적 데이터를 시각적 표현으로 전환함으로써 인간의 인지능력을 증폭시키고(Wu et al., 2021) 복잡한 현상 속에서 변화, 흐름, 관계의 양상을 직관적으로 인식하게 한다. 예를 들어, 유권자 선택 변화의 시각화는 단순 비율 비교가 아니라 개인과 집단의 변화 경로(flow)를 분석단위로 삼는다. 이는 사회 현상 분석에 있어 사후 표현의 의미를 넘어 전이(transition) 과정을 중심으로 개념화하는 방법론적 형태이다(Engebretsen, 2020).
이 연구는 양적 데이터를 그래픽 방식으로 표현하는 주요 기법을 소개하고, 데이터 시각화를 통해 새로운 추세를 발견하며 복합적 패턴을 식별하는 분석적 가능성을 논의한다. 대규모 시각화 데이터를 처리, 분석하는 과정에서 데이터 마이닝 기법의 적용을 시도한다. 나아가 데이터 리터러시 역량을 강화할 수 있는 교육자료를 개발하여 학문적·실용적 차원에서 데이터 시각화 연구의 확장을 도모한다. 이러한 빅데이터 시각화 연구는 인공지능 기술의 발전과 함께 진화하고 있는 연구 영역으로 평가할 수 있다.
본 연구의 주요 연구주제는 다음과 같다. 첫째, 사회과학 분야에서 데이터 시각화 기법의 이론적 기반과 응용 가능성을 검토한다. 정치사회 자료를 활용해 데이터 시각화의 적용에 관한 이론적 기반을 정리한다(Tufte & Graves-Morris, 1983). 둘째, 정치과정 분석의 핵심 질문들-불균형, 불평등, 대표성 등-을 표현하는 방법론으로서의 시각화 연구를 시행한다. 정치적 연합, 의제 설정, 여론의 변화 경로를 효과적으로 분석할 수 있도록 시계열 분석, 네트워크 분석, 지리적 시각화 등을 활용한 시각적 표현 기법을 연구한다(Healy & Moody, 2014). 셋째, 사회과학 데이터 시각화를 통한 연구 해석 방식의 혁신적 사례를 제시한다. 인터랙티브(interactive) 시각화와 디지털 환경에서의 시각화 스토리텔링이 통계적 의사결정 도구로서 가지는 정치적 함의를 검토한다.
종합하면, 사회과학연구에서 데이터 시각화 연구는 빅데이터의 복잡성을 완화하고(Chen, 2004), 정치사회 현상을 과정 중심으로 이해하도록 돕는 분석적 도구이다. 사회과학 연구의 주된 쟁점 의제인 이질성(heterogeniety), 분극화 등을 공간적 표현으로 드러내 정치사회적 변동성을 효과적으로 제시하게 한다. 또한, 전통적 사회과학연구에서 통계모델 결과의 재현성과 검증 가능성을 높여 실증 연구의 신뢰를 높인다. 인공지능 기반 데이터 분석이 확대되는 상황에서 데이터 시각화는 알고리즘 중심 분석의 불투명성을 완화하고, 해석 가능성을 확장하는 역할을 수행한다(Cairo, 2016). 본 연구는 데이터 시각화를 기술적 보조 수단이 아닌, 인공지능 시대 사회과학연구의 이론, 방법론, 교육의 층위에서 독립적 연구 영역으로 제시하고자 한다.
기대효과
(한글 2000자 이내)
본 연구는 사회과학 데이터 시각화의 이론적 기반을 체계화하고, 인터랙티브 시각화 기법을 활용한 실증적 연구를 수행함으로써 정치학을 포함한 사회과학 및 데이터과학의 학제적 접점을 강화하는 데 기여한다. 지원자는 연구 과정에서 정치, 공공 데이터, 정치행위자 활동 데이터, 소셜미디어 데이터 등 대규모 데이터셋을 활용하여 시계열, 네트워크, 공간 분석 기반의 시각화 모델을 개발한다. 이를 통해 정치사회 현상의 동태성과 구조를 분석하는 시각화 사례를 제시하고, 학술논문, 재현 가능한 시각화 분석 프레임워크, 인터랙티브 시각화 프로토타입, 교육 자료 등 구체적 연구 산출물을 도출한다.
본 연구는 인공지능 시대 데이터 기반 문제해결에 대한 사회적 요구에 부응하여, 데이터 시각화 연구를 통해 학문적 발전과 실질적 사회 기여를 동시에 추구한다. 학문적으로는 데이터 시각화를 정치과정연구의 독립적 분석방법론으로 정립하고, 정량·정성 분석의 융합적 연구를 촉진하는 계기가 될 것이라고 생각된다. 사회적으로는 데이터 리터러시 교육을 강화하고, 연구자, 정책결정자, 언론인 등이 데이터 기반 분석을 활용해 신뢰성 있는 정치 정보를 생산·활용·해석하도록 지원하는데 기여한다.
본 연구를 통해 도출된 성과는 사회과학 데이터 분석 및 시각화를 위한 오픈소스 라이브러리와 대시보드 형태로 공개하여, 연구자와 실무자가 쉽게 활용할 수 있도록 할 계획이다. 또한, 연구결과를 반영한 <사회과학 데이터 시각화 핸드북>을 출판하고, 온라인 교육 콘텐츠 및 GitHub 코드 튜토리얼을 제공하여 학습 및 실무 적용의 접근성을 높이고자 한다. 이 연구는 국내외 학술지 게재 및 학술대회 발표를 통해 연구 성과를 확산하고, 학문적 협업을 촉진하여 데이터 시각화 연구의 국제적 네트워크 구축에 데 기여할 것이다.
데이터 시각화 연구는 정치학, 사회학, 컴퓨터과학, 디자인, 미디어 연구 등과 결합하여 학제 간 연구를 촉진하고, 사회과학 연구 방법론을 확장하는 차원에서 차별성을 가진다. 본 연구는 머신러닝을 활용한 자동화된 정치사회 데이터 시각화 기법 개발, 여론 변화의 실시간 예측 모델 구축, 정책 영향력 분석 등으로 연구 범위를 확장할 수 있는 기반을 제공한다. 또한 효과적인 시각화 교육을 위한 전략과 도구를 제시함으로써 연구와 교육의 연계를 강화한다. 최종적으로, 본 연구는 데이터 시각화가 정치과정연구 및 정책 분석에서 실질적인 도구로 자리 잡을 수 있도록 기반을 마련하고, 데이터 기반 민주주의 의사결정 문화를 확산하는 데 일조할 것이라고 생각된다.
연구요약
(한글 2000자 이내)
1년차 연구는 사회과학 분야에서 데이터 시각화 기법의 개념과 이론적 토대, 응용 가능성을 검토한다. 정보 전달 수단을 넘어 분석 도구로서 데이터 시각화가 활용되는 방식을 논의하는 것을 목표로 한다. 특히, 미국을 중심으로 한 최신 연구 동향을 분석하고 계량적 분석과 해석 차원을 유기적으로 연결하는 방법론적 가능성을 탐구한다. 주요 사례로 미국 선거 분석에서 활용되는 인터랙티브 지도, 네트워크 분석 기반 시각화 등의 문헌을 검토하고, 이를 통해 정치적 선택과 연합, 변화 경로를 시각적으로 분석하는 접근법을 논의한다(Silver, 2012). 미국 선거의 경우 대통령 선거 뿐 아니라 상·하원 선거, 주지사 선거 등 다층적 구조를 지니고 있어 데이터 시각화가 선거 결과 해석과 전략 분석 측면에서도 필수적으로 다뤄지고 있다. 또한, 머신러닝 기반 자동화된 정치 데이터 시각화 기법에 대한 연구(Wu et al., 2021)를 검토하고, 이후 연차에서 수행되는 실증 연구와 기법 개발을 위한 이론적, 기술적 기반을 마련한다.
2년차 연구는 정치과정에서 불균형, 불평등, 대표성과 같은 핵심 질문을 분석, 표현하는 방법론으로서 데이터 시각화 연구를 수행한다. 본 연구에서는 정당, 정치행위자 관계, 정치적 이슈 경쟁, 여론 변화 경로를 효과적으로 분석할 수 있는 데이터 시각화 기법 개발을 목표로 한다. 시계열 분석, 네트워크 분석, 지리적 시각화 등을 다루며, 실제 대규모 데이터를 적용해 정치행위자 간 이슈 경쟁 구조와 여론 흐름을 분석, 탐색하기 위한 시각화 모델을 설계한다(Munzne, 2014). 구체적으로는, 시계열 시각화를 통해 선거 및 정치 이벤트에서 이슈 등장과 확산 양상을 탐색하고, 네트워크 시각화를 활용하여 정치행위자 간 이슈 연계 및 경쟁 구조를 분석한다(Kenski, 2006). 또한, 소셜미디어 데이터를 기반으로 지역별, 시간별 여론 변동 패턴을 시각화한다. 이 과정은 R 기반 데이터 분석 및 시각화 워크플로우를 구축함으로써 가능하다. 주요 패키지로 tsibble, fable, sf(Spatial Data), echarts4r, leaflet, tidygraph, igraph 등을 활용하고(Pedersen, 2020; Wickham & Sievert, 2009; Csardi & Nepusz, 2006), 머신러닝 기법과 결합하여 정치사회 데이터 시각화의 해석력을 제고한다.
3~5년차 연구는 인터랙티브 시각화와 디지털 환경에서의 시각화 스토리텔링이 정치사회 문제에 대한 인식과 의미 구성 과정에 미치는 영향을 분석하고, 시각화가 연구자 뿐 아니라 정책결정자와 시민에게 어떠한 해석 틀을 제공하는지 실증적으로 검토한다. R 기반 Shiny, leaflet, d3 등의 도구를 활용해 여론 및 소셜미디어 데이터 변화 패턴을 분석하고, 실제 정치사회 자료분석을 통한 시각화 사례를 구축한다. 본 연구에서는 인터랙티브 시각화의 학문적, 이론적 가치를 정리하고, 최적화된 기법을 개발한다(Borner & Polley, 2014). 그리고 사회과학 데이터 시각화 및 데이터 리터러시 교육 프로그램을 설계하여 연구 성과의 확산과 활용을 도모한다. 교육 프로그램은 데이터 수집·정제·분석, 시각화 기법(시계열, 네트워크, 공간 데이터 시각화 기법, 인터랙티브 시각화 도구 실습)으로 구성되며, 온라인과 오프라인 모듈을 포함한다. 연구자, 데이터 저널리스트 등 수요자 대상 맞춤형 콘텐츠를 개발하고, 실습 중심 커리큘럼을 운영한다.
종합하면 본 연구는 시각화 연구의 이론 정립, 분석 방법 개발, 인터랙티브 실증과 확산, 교육 연계 프로그램을 단계적으로 수행함으로써 사회과학 데이터 시각화가 연구 결과의 보조적 표현 수단이 아닌 독립적 분석방법론으로 기능할 수 있는 조건을 검토한다. 이를 통해 데이터 시각화가 사회과학 연구의 해석력과 설명력을 확장하는 방식과, 복합적인 사회 현상에 대해 투명하고 신뢰성 있는 데이터 기반 판단을 가능하게 하는 방법론적 기반을 제시하고자 한다.
키워드(Keyword)
(한글 250자 이내)
데이터 시각화, 정치과정 분석, 인터랙티브 시각화, 스토리텔링, 데이터 리터러시 교육
키워드
(영어 500자 이내)
Data visualization, Political Process Analysis, Interactive Visualization, Storytelling, Data Literacy Education
닫기

게시물 김정연 / 한국연구재단 / 사회과학을 위한 데이터 시각화 : 이론, 방법, 교육 체계의 구축 / 2026 인문사회학술연구교수(A유형) / 190,000 / 60개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.

13 - 韩国数字人文协会（KADH）

이소윤 / 한국체육대학교 / 생성형 AI 기반 한국 체육정책 변천사 추적 및 대화형 의사결정 지원 챗봇 시스템 개발: 비정형 체육 행정 데이터의 RAG(검색 증강 생성) 기술 적용 / 2026 인문사회학술연구교수(A유형) / 190,000 / 60개월

作者Baro

2026年5月11日 22:52

이소윤 / 한국체육대학교 / 생성형 AI 기반 한국 체육정책 변천사 추적 및 대화형 의사결정 지원 챗봇 시스템 개발: 비정형 체육 행정 데이터의 RAG(검색 증강 생성) 기술 적용 / 2026 인문사회학술연구교수(A유형) / 190,000 / 60개월

접수과제정보
접수번호2026011455
연구요약문
연구목표
(한글 2000자 이내)
본 연구의 목적은 생성형 인공지능과 검색 증강 생성(RAG) 기술을 활용하여 한국 체육정책의 방대한 비정형 행정 기록을 체계적으로 구조화·분석함으로써, 체육정책 변천을 시계열적·맥락적으로 추적·이해할 수 있는 정책사 연구 체계를 확립하는 것이다. 이를 통해 체육정책 기록을 정책 형성과 전환 과정을 분석할 수 있는 지식 자원으로 활용하고, 체육정책 연구와 정책 분석이 현장에서 보다 구조적이고 재현 가능한 방식으로 이루어질 수 있도록 정책 기록의 현장 활용도를 제고하는 방안을 제시할 것이다. 본 연구의 목적을 달성하기 위한 세부 연구목표는 다음과 같다.
첫째, 체육백서, 정책보고서, 연감, 내부 행정 문서 등 다양한 형태로 분산되어 있는 한국 체육정책 기록을 체계적으로 수집·정제하고, 비정형 자료를 분석 가능한 형태로 구조화할 것이다. 이를 통해 체육정책 기록을 시계열 비교와 정책 변천의 장기적 흐름을 분석할 수 있는 아카이브 기반 데이터로 전환하고, 정책 등장 배경과 제도 형성 맥락을 추적할 수 있는 기초 연구 인프라를 구축할 것이다.
둘째, 구조화된 체육정책 기록과 메타데이터를 바탕으로 정책의 등장 배경, 정책 목표의 변화, 정책 분야 간 관계 구조를 시계열적으로 분석하여 한국 체육정책 변천의 연속성과 특징을 규명할 것이다. 나아가 정책 형성과 집행, 제도 개편 과정에서 나타나는 반복 구조와 제도 전환 패턴을 종단적으로 분석함으로써, 엘리트체육 중심에서 생활체육, 산업, 복지, 포용 정책으로 확장되어 온 체육정책의 전개 과정을 역사적·사회적 맥락 속에서 체계적으로 해석하고자 한다.
셋째, 체육정책 문헌에 내재된 정책 개념과 담론의 의미 구조를 반영한 정책 특화 지식베이스를 구축함으로써, 정책 문서 간 의미적 연계와 정책 개념 변화 양상을 분석할 수 있는 기반을 마련할 것이다. 이를 통해 정책 담론의 형성·확산·전환 과정을 구조적으로 분석하고, 기존의 키워드 중심 문헌 검색 방식에서 벗어나 정책 변천을 이해와 해석 중심으로 탐색할 수 있는 데이터 기반 정책사 연구 환경을 조성할 것이다.
넷째, 생성형 AI와 RAG 기술을 적용한 체육정책 변천사 분석 및 대화형 의사결정 지원 챗봇 시스템을 개발하여, 정책 질의응답과 정책 변천 추적, 정책 비교 분석이 가능한 연구·행정 지원 도구를 구현할 것이다. 이를 통해 체육정책 기록에 대한 접근과 활용 방식을 확장하고, 체육정책 연구와 정책 분석이 보다 구조적이고 재현 가능한 방식으로 이루어질 수 있도록 정책 기록의 현장 활용도를 높이는 방안을 제시할 것이다.
기대효과
(한글 2000자 이내)

체육정책 기록 관리·활용 체계의 확립
○ 비정형 형태로 분산되어 관리되던 체육정책 기록을 시계열과 정책 분야 기준으로 구조화함으로써, 정책 기록을 개별 문헌 단위가 아닌 통합된 아카이브 형태로 활용할 수 있는 분석 기반 확립. 이를 통해 정책 연구와 행정 검토 과정에서 자료 탐색·정리에 소요되던 부담을 완화하고, 정책 기록 활용의 효율성 제고 도모.
정책 변천 맥락을 반영한 검토 환경 조성
○ 구조화된 정책 기록과 메타데이터를 바탕으로 정책의 등장 배경, 목표 변화, 정책 분야 간 관계를 시계열적으로 파악할 수 있는 환경 조성. 이에 따라 정책 연구 및 행정 현장에서 개별 정책을 검토할 때 유사 정책의 이전 전개 과정과 정책 기조 변화 흐름을 함께 고려할 수 있는 여건 확대.
정책 개념·담론 변화 분석기반 구축
○ 체육정책 문헌에 내재된 주요 정책 개념과 용어의 의미 구조를 반영한 정책 특화 지식베이스 구축을 통해, 정책 문서 간 개념적 연계와 정책 담론 변화 양상을 체계적으로 분석할 수 있는 연구·분석 기반 확보. 이는 기존 키워드 중심 문헌 검색 방식의 한계 보완.
생성형 AI 기반 정책 기록 활용 방식의 현장 적용
○ 생성형 AI와 검색 증강 생성(RAG) 기술을 적용한 정책 변천사 분석 및 대화형 질의응답 체계를 통해, 정책 기록을 질의응답 방식으로 확인할 수 있는 활용 환경 적용하여, 이를 통해 정책 담당자의 과거 정책 사례 검토 과정이 보다 직관적으로 이루어질 수 있으며, 체육정책 기록의 현장 활용 제고 도모.
연구요약
(한글 2000자 이내)
체육정책은 특정 시기의 정치·사회적 맥락과 국가의 통치 철학, 사회적 요구가 반영된 역사적 산물로서, 체육 행정의 방향성과 정책 우선순위를 이해하는 데 핵심적인 자료이다. 그러나 한국 체육정책 기록은 체육백서, 정책보고서, 연감, 내부 행정 문서 등 다양한 형태의 비정형 자료로 분산되어 관리되고 있어, 정책의 연속적 추적과 시계열 비교, 정책 간 관계 분석이 제한되어 왔다. 이로 인해 정책 연구와 행정 실무 현장에서는 과거 정책의 맥락과 성과가 충분히 축적·활용되지 못하는 구조적 한계가 지속되어 왔다(Howlett & Ramesh, 1995; Pollitt, 2008).
이에 본 연구는 생성형 인공지능과 검색 증강 생성(RAG) 기술을 활용하여 한국 체육정책의 비정형 행정 기록을 체계적으로 구조화·분석하고, 체육정책 변천을 시계열적·맥락적으로 추적·이해할 수 있는 정책사 연구 체계를 구축하고자 한다. 이를 통해 체육정책 기록을 정책 형성과 전환 과정을 분석할 수 있는 지식 자원으로 전환하고, 이를 통해 체육정책 연구와 정책 분석이 보다 구조적이고 재현 가능한 방식으로 이루어질 수 있도록 정책 기록의 현장 활용도를 제고하는 방안을 제시하고자 한다.
본 연구는 총 5년간 3단계로 수행할 것이다. 1단계에서는 한국 체육정책 관련 비정형 행정 데이터를 체계적으로 수집·정제하고, OCR 기술을 활용하여 종이 문서와 스캔 자료를 디지털 텍스트 데이터로 전환할 것이다. 이후 문단 단위 분할, 불필요한 기호 제거, 표와 수치 정보 추출 등의 정제 과정을 거쳐 정책 분석에 적합한 아카이브 기반 데이터 구조를 구축하고, 발행 연도, 발행 기관, 정책 분야, 정책 성격 등을 기준으로 메타데이터 분류 체계를 설계할 것이다.
2단계에서는 구축된 정책 데이터와 메타데이터를 바탕으로 주요 체육정책 개념과 용어의 시대별 변화 양상을 분석하고, 정책 개념 간 관계를 반영한 체육정책 특화 지식베이스를 구축할 것이다. 이 과정에서 정책 문헌 텍스트를 임베딩 기법으로 벡터화하고, 문서 간 의미적 유사성과 맥락적 관계를 저장하는 벡터 데이터베이스를 구축함으로써 의미 기반 정책분석이 가능한 데이터 구조를 마련할 것이다. 또한 체육학 및 체육행정 분야 전문가 검토를 통해 분류 체계와 개념 구조의 타당성을 보완할 것이다.
3단계에서는 생성형 AI와 검색 증강 생성(RAG) 구조를 적용한 체육정책 변천사 분석과 대화형 의사결정 지원이 가능한 챗봇 시스템을 개발할 것이다. 정책 지식베이스에서 의미적으로 관련성이 높은 문서를 검색한 후 이를 근거로 답변을 생성하는 질의응답 파이프라인을 구현하고, 시계열 텍스트 분석을 통해 정책 키워드의 생성·변화·소멸 과정을 분석함으로써 정책 변천 추적과 비교 분석 기능을 고도화할 것이다. 나아가 웹 기반 정책 분석 플랫폼을 구축하여 연구 및 행정 현장에서의 활용 가능성을 검증할 것이다.
본 연구는 체육정책 기록을 단순한 행정 자료의 축적 수준을 넘어, 정책 변천의 흐름과 구조를 분석할 수 있는 정책사적 지식 인프라로 재구성한다는 점에서 의의를 지닌다. 나아가 체육정책 연구의 방법론적 확장을 도모하고, 정책 분석의 현장 활용 가능성을 높임으로써, 체육정책사·체육행정사·사회사를 유기적으로 연결하는 학제 간 연구 기반 형성에 기여할 것이다.
키워드(Keyword)
(한글 250자 이내)
한국 체육정책 변천사, 비정형 체육 행정 데이터, 생성형 인공지능, 검색 증강 생성
키워드
(영어 500자 이내)
Evolution of Korean Sports Policy, Unstructured Sports Policy Administration Data, Generative Artificial Intelligence(AI), Retrieval-Augmented Generation (RAG)
닫기

게시물 이소윤 / 한국체육대학교 / 생성형 AI 기반 한국 체육정책 변천사 추적 및 대화형 의사결정 지원 챗봇 시스템 개발: 비정형 체육 행정 데이터의 RAG(검색 증강 생성) 기술 적용 / 2026 인문사회학술연구교수(A유형) / 190,000 / 60개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.

13 - 韩国数字人文协会（KADH）

전영의 / 전남대학교 / AI를 활용한 한인 이주 지역 스토리텔링과 트랜스 로컬리티 연구 상용화 로드맵 – 권역별 한인 문학잡지를 중심으로 – / 2026 인문사회학술연구교수(A유형) / 190,000 / 60개월

作者Baro

2026年5月11日 22:51

전영의 / 전남대학교 / AI를 활용한 한인 이주 지역 스토리텔링과 트랜스 로컬리티 연구 상용화 로드맵 – 권역별 한인 문학잡지를 중심으로 – / 2026 인문사회학술연구교수(A유형) / 190,000 / 60개월

접수과제정보
접수번호2026004249
연구요약문
연구목표
(한글 2000자 이내)

본 연구는 한인 이주 문학잡지를 사회ㆍ역사ㆍ문화의 자료(아카이브)로 삼아 공간과 장소, 사회적 장을 분석하고 연구 성과를 AI로 재현, 실용화하는 것이 목적이다.

한인 이주 지역의 권역별 로컬리티와 공간 스토리텔링 담론 확립 :
기존의 로컬로부터 이동, 국경을 넘어 복잡한 층위들이 횡단하는 지점에서 중층적으로 위치하고 있는 이주민들의 주체성을 트랜스 로컬 주체성이라 할 때 본 연구는 트랜스 이주자들이 처한 권역별 로컬적 상황과 맥락 속에서 구조화된 정치적 저항, 경제적 전략들, 일상 안에서 드러나는 문화적 혼종성, 이에 대한 반복적 수행, 트랜스 로컬 주체성과 정체성 등 로컬리티를 재구성하는 요소들을 찾아봄으로써 한인 이주 지역의 권역별 로컬리티를 알고 공간 스토리텔링 담론을 확립하는 것이 목적이다.
한인 이주 지역 문학잡지 연구 로드맵 구축 :
중국, 일본, 구(舊)소련 연방 (러시아ㆍ카자흐스탄ㆍ우즈베키스탄), 미국 등 권역별 한인 이주 지역 문학잡지 비교를 통해 이주 서사의 공통성과 지역의 특수성을 동시에 탐구하고, 각각의 로컬리티에 관한 데이터베이스를 만들 수 있다. 이주 문학잡지는 당시 이주민 공동체의 언어, 생활, 투쟁, 연대의 흔적을 보여주는 문화적 기록물로 이주민들의 기억을 복원한다. 이러한 잡지 연구를 통해 1세대 이주민의 목소리와 이후 세대들, 그리고 현재 후손 세대의 정체성 형성 과정을 잇는 세대 간 대화가 가능해질 수 있다는 점에서 본 연구는 한인 이주 지역 문학잡지 연구 로드맵을 구축하는 것을 목적으로 한다.
AI 기술을 융합한 권역별 상호작용과 트랜스 로컬리티 연구 시각화 :
이주 문학잡지를 통해 권역별 한인 이주 공동체의 문학적 발자취를 정리하는 것은 해외 한인과 한국 사회를 잇는 문화ㆍ외교적 자산이 될 수 있으며 한인들의 트랜스 로컬적 네트워크 연구에 기초 자료가 될 것이다. 기존의 텍스트 분석에서 나아가 ‘AI 데이터 분석ㆍGIS 시각화를 활용한 문학과 사회학이 결합된 새로운 연구 패러다임’으로서 본 연구는 문학ㆍ문화ㆍ역사ㆍ감성ㆍ인문지리ㆍ사회ㆍAI 기술이 만나는 학제적 융합연구이다. AI 로드맵을 통해 연구자ㆍ학생ㆍ시민ㆍ해외 연구 기관까지 공유 가능한 아카이브를 만드는 데 자료로 활용될 수 있다는 점에서 본 연구는 AI 기술을 융합한 권역별 상호작용과 이주 문학잡지 연구를 통해 트랜스 로컬리티 연구를 시각화하는 것이 목적이다.
한인 이주 문학 공간을 활용한 AI 기반 사업(AI-powered) 상용화 방안 모색 :
본 연구를 활용하여 AI 기반 여러 사업들을 상용화 할 수 있다. 먼저 교육 콘텐츠화이다. 한인 이주사를 가르치는 교재, 디지털 학습, 스토리텔링 기반 수업에 자료로 사용 가능하다. 둘째, 문화사업과의 연계이다. 이주 문학잡지에 수록된 서사를 바탕으로 영화ㆍ웹툰ㆍVR 전시 등 다양한 콘텐츠를 개발할 수 있다. 셋째, 관광ㆍ지역 브랜딩(Region branding) 및 지역 블렌딩(Region blending) 활용에 가능하다. 특정 지역의 이미지와 가치를 전략적으로 만들어내고 알리기 위해 (지역 브랜딩, Region branding) 서로 다른 지역의 자원ㆍ정체성ㆍ문화 요소를 혼합(blend)하여 새로운 가치나 이미지를 창출하는 것이다. (지역 블렌딩, Region blending) 넷째, 이주 흔적이 남아 있는 연변, 오사카, 하와이, 카자흐스탄 등 지역과 연계한 문화유산 스토리텔링에 활용할 수도 있다. 마지막으로 글로벌 한국학 발전에 유의미한 도움이 될 수 있다. 해외 대학 한국학 연구 및 한류 문화 확산의 기초 자료로 제공될 수 있다는 점에서 본 연구는 한인 이주 문학 공간을 활용한 AI 기반 사업(AI-powered) 상용화 방안 모색을 목적으로 한다.

기대효과
(한글 2000자 이내)

▣ 예상 중간 결과물 및 기대효과

1) 학문적 기대효과 :
권역별 이주 문학잡지에 수록된 문학작품, 작가 인터뷰, 구술사, 이미지 자료, 회고록 등 권역별 조사 자료가 중간 결과물로 산출될 수 있다. 이런 자료들은 트랜스 로컬리티 연구를 구축하는데 도움이 될 수 있다.

2) 사회적 기대효과 :
이주자들은 자신들의 뿌리와 문화 이해, 기억 공유와 전달, 단절된 역사 회복 자료로 쓸 수 있다. 한인 이주 잡지는 한국인이 ‘이주민’으로서 겪은 어려움과 차별, 적응 과정을 담고 있어 현재 한국 사회의 외국 이주민들이 겪는 현실과 연결된다. 독자들은 이주민의 시선에서 한국에 거주하는 외국 이주민들을 이해하고 자신을 성찰할 수 있다.

3) 교육적 기대효과 :
본 연구 자료는 한인사회 문화 행사, 교육 자료, 지역 도서관, 커뮤니티 센터 등에서 자료로 사용될 수 있다. 한국에 거주하는 외국 이주민들의 다문화 교육, 이주민 정책 연구, 인권 교육 자료로도 활용되어 사회적 공감대를 형성하고 편견을 줄이는데 기여할 수 있다. 대학 내 인문 지리, 공간 감성 인문학 강의로 글로벌 시대 현대인의 인문학에 관한 열망을 충족하고 대학(원) 강의에 활용할 수 있다.

▣ 후속연구 연계 활용방안

1) 선도적 연구 활동 :
한인 이주 잡지에 실린 소설ㆍ에세이ㆍ시 등 문학 자료를 디지털 아카이브화하고, AI를 활용하여 주제ㆍ공간ㆍ정서ㆍ이주 경험 별로 자동 분류한 플랫폼을 만들어 본 연구에 실용성을 기한다. 통시적ㆍ공시적 관계 안에서 총체적이고도 융복합적 연구 활동을 통해 연차별 연구 논문 5편, 1단계ㆍ2단계 서적 2권, 한인 이주 문학 권역별 트랜스 로컬리티 연구를 기반으로 국제학술대회 및 심포지움에서 연구발표, 관련 학부 및 대학원 강의, 시민사회 인문학 특강 등을 할 예정이다.

2) 연구 인프라 구축 및 상용화 로드맵 구성 :
한인 이주 지역 트랜스 로컬리티 연구를 위한 기초 작업으로서 권역별 한인 이주 지역 잡지 문학 텍스트 및 문학 공간 감성을 찾기 위한 데이터 베이스를 구축할 것이다. 이를 바탕으로 한인 이주 지역 스토리텔링과 트랜스 로컬리티 연구를 상용화하는 작업에 대한 로드맵을 구성할 것이다.

3) 교내 연구소 협업 및 지역 다문화사회 연구 지평 확대 및 인문학 대중화 :
소속된 연구소를 중심으로 다문화연구센터, 디아스포라연구소 등 교내 연구소와 협업하고, 지역 다문화 단체와 소통, 교육 등을 통해 인문학이 대중화되도록 할 예정이다.

본 계획서는 ‘조선족, 자이니치, 고려인, 미주한인’이라는 권역별 한인들의 이주 문학잡지를 중심으로 ‘AI를 활용한 한인 이주 지역 스토리텔링과 트랜스 로컬리티 연구 상용화’에 대한 5년의 로드맵이다. 서로 연결된 지역 간의 다층적 상호작용에 주목하는 트랜스 로컬리티에서 출발하여 행위자-연결망 이론(Actor-Network Theory) 층위에서 한인 이주 현상을 바라보고 문학잡지에 어떻게 드러나는지 찾아볼 수 있다. 로컬이라는 행위자가 글로벌한 네트워크를 형성해 가는 과정을 주목하는 행위자-연결망 이론(Actor-Network Theory)은 행위자(Actor)와 그들 간의 연결망(Network)을 통해 정착지에서 나타나는 사회적ㆍ기술적ㆍ물질적 현상의 역동적 관계를 살펴보는 것이다. 타자와의 관계를 조정하거나 다양한 요소들이 얽혀 만들어내는 우발적 결과를 탐색하고 권역별 이주 한인들의 트랜스 로컬리티를 행위자-연결망 이론(ANT) 층위에서 탐색할 것이다. 이는 경제적 이유로 인한 한인 이주자들의 단순한 인구이동 이상의 복합적이고 다층적인 연결, 역동적 상호작용을 드러낼 수 있다. 이런 점에서 본 연구의 활용방안과 연구계획은 실현하는데 타당하며 효과 또한 충분히 기대된다.

연구요약
(한글 2000자 이내)

결국 이 연구의 로드맵은 1차적으로 권역별 한인 잡지를 기본 텍스트 자료로 하여 한인 이주 지역 트랜스 로컬리티에 관한 기초 연구를 수행하는 것이다. 이를 토대로 2차적으로는 한인 이주 지역 문학잡지의 공간 스토리텔링과 로컬리티를 재인식하고, 한인 이주 문학 공간에 대해 재영역화 한 후 문학 공간의 감성 인자를 추출 및 코드화하여 문학 공간의 초연결성을 살펴볼 것이다. 1ㆍ2단계 연구를 통해 한인 이주 문학 공간을 활용한 AI기반 사업(AI-powered)을 상용화하는데 목적이 있다.

▣ 1차 년도에는 중국 <연변문학>, <북향>, <연변문예>, <북향보>를 텍스트로 하여 조선족을 중심으로 이주 한인들의 모빌리티와 로컬의 이중성에 대해 알아볼 예정이다. 중국 한인 잡지를 텍스트로 하여 모빌리티 과정 안에서 드러나는 저항과 협력, 로컬의 이중성, 정체성 형성 시기, 이동 과정 중 만들어진 문화 혼종성과 문화적 창조성 등을 알아보고 데이터베이스를 작성한 후 중국 권역 문학잡지에 나타난 ‘한인(조선족)들의 모빌리티 과정과 로컬의 이중성’에 대해 고찰하고자 한다.

▣ 2차 년도에는 일본 <文学界>, <群像>, <新潮>, <계간마당>, <계간 삼천리>를 텍스트로 하여 자이니치를 중심으로 이주 한인들의 사이 공간과 장소성 획득 그리고 변용에 대해 알아볼 예정이다. 사이 공간 안에서 자이니치들의 고통과 정체성 혼란, 이질성과 차별성, 정체성을 획득하는 투쟁의 장으로서 장소성을 획득하는 행위, 언어적 해체, 전환기 자이니치 문학의 탈근대적 실험성 등의 연구를 통해 일본 권역 문학잡지에 나타난 ‘자이니치들의 사이 공간과 장소성 획득 그리고 변용’에 대해 고찰하고자 한다.

▣ 3차 년도에는 <고려일보>, <선봉>, <고려인협회 기관지> 등을 텍스트로 하여 카자흐스탄, 우즈베키스탄, 러시아 고려인을 중심으로 한인 이주 지역 문학잡지의 공간 스토리텔링과 로컬리티 재인식에 대해 알아볼 예정이다. 고려인들의 정착 과정, 한인 이주 문학 특징, 공통점과 차이점, 고려인 공동체의 현재 문화 활동, 고려인 청년들의 인식 등을 연구한 후 구(舊)소련(러시아ㆍ카자흐스탄ㆍ우즈베키스탄) 권역 문학잡지에 나타난 ‘고려인들의 한인 이주 지역 문학잡지의 공간 스토리텔링과 로컬리티 재인식’에 대해 고찰하고자 한다.

▣ 4차 년도에는 미국 <하와이 문학>, <미주문학>, <한솔문학> 등을 텍스트로 하여 한인 이주 문학 공간의 재영역화와 초연결성(Hyper-connectivity)에 대해 알아볼 예정이다. 미국 한인 이주의 사회적ㆍ역사적 맥락을 살펴보고, 로컬의 행위자로서 트랜스 이주자들이 글로벌한 네트워크를 형성해 가는 과정에 주목하여 행위자-연결망 이론(Actor-Network Theory) 안에서 미주 한인 문학 잡지들을 살펴보고, ‘한인 이주 문학 공간의 재영역화와 초연결성(Hyper-connectivity)’에 관해 고찰할 예정이다.

▣ 5차 년도는 지금까지의 연구를 마무리하고 완성하는 단계이다. 1-4차 년도까지 연구를 바탕으로 한인 이주 문학 공간이 공공 및 사회적 커뮤니티 공간과 어떤 감성 매커니즘으로 관계를 맺고 형성할 수 있는지 비교 분석한 후 한인 이주 지역과 감성을 연결하는 망(網)을 찾아볼 것이다. 이주민들의 공간 감성이 가지는 미학적 상상력, 생활 리듬과 감각, 감성의 교류와 충돌, 사회적 갈등과 조화, 사회적ㆍ문화적ㆍ공간적ㆍ감성 코드 등을 연구한 후 교육 컨텐츠, 문화사업, 지역 브랜딩ㆍ블랜딩 연구와 연계한 상용화 방안에 대해 연구할 예정이다.
본 연구가 계획대로 마무리된다면 공간-인간-감성이라는 권역별 이주 한인 트랜스 로컬리티 연구를 토대로 AI 기반 사업(AI-powered) 상용화 연구 로드맵이 완성되고 학제간, 융복합 연구의 기초 자료가 될 것이다.

키워드(Keyword)
(한글 250자 이내)
트랜스 로컬리티, 한인 이주 문학, 한인 이주 문학잡지, 모빌리티, 사이 공간, 스토리텔링, 공간 재영역화, 초연결성, AI기반 사업(AI-powered), 행위자-연결망 이론(Actor-Network Theory)
키워드
(영어 500자 이내)
Translocality, Korean immigrant literature, Korean immigrant literature magazine, mobility, In-between space, Storytelling, Spatial re-territorialization, Hyper-connectivity, AI-powered, Actor-Network Theory
닫기

게시물 전영의 / 전남대학교 / AI를 활용한 한인 이주 지역 스토리텔링과 트랜스 로컬리티 연구 상용화 로드맵 – 권역별 한인 문학잡지를 중심으로 – / 2026 인문사회학술연구교수(A유형) / 190,000 / 60개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.

13 - 韩国数字人文协会（KADH）

이은성 / 전북대학교 교과교육연구소 / 인간과 AI의 문학 텍스트 개작원리 비교 연구: DaF 학습자용 읽기 자료 개발을 위한 방법론 탐색 / 2026 인문사회학술연구교수(A유형) / 190,000 / 60개월

作者Baro

2026年5月11日 22:49

이은성 / 전북대학교 교과교육연구소 / 인간과 AI의 문학 텍스트 개작원리 비교 연구: DaF 학습자용 읽기 자료 개발을 위한 방법론 탐색 / 2026 인문사회학술연구교수(A유형) / 190,000 / 60개월

접수과제정보
접수번호2026006423
연구요약문
연구목표
(한글 2000자 이내)
본 연구는 외국어로서의 독일어(DaF) B1 수준 학습자용 문학 텍스트 개작에서 인간 전문가와 AI(대규모 언어 모델, LLM)의 개작원리를 비교 분석하고, 이를 토대로 최적의 교육용 텍스트 개작 방법론을 개발하는 것을 목표로 한다.
문학 텍스트를 활용한 외국어 교육은 학습자에게 언어 능력 향상과 목표어 문화 이해를 동시에 제공하는 효과적인 방법이다. 그러나 현재 DaF 교육용 개작 텍스트는 학습자의 실제 수준과 불일치하거나 원작의 문학적 가치가 과도하게 훼손되는 문제를 안고 있으며, 가장 근본적으로는 전문가들이 어떤 원리에 따라 개작을 수행하는지에 대한 체계적 연구가 부재하다. 한편 최근의 AI 활용 언어교육 연구는 비문학 텍스트에 편중되어 있어, 문학적 미학을 고려한 개작 연구는 전 세계적으로도 미개척 영역에 해당한다.
이러한 문제의식에 기반하여 본 연구는 다음의 다섯 가지 세부 목표를 설정한다. 첫째, 인간 전문가의 문학 텍스트 개작원리를 어휘·통사·서사·문학의 네 차원에서 체계적으로 도출하여 명시화한다. 둘째, LLM을 활용한 AI 개작을 수행하고 그 개작원리를 규명하여 인간 개작원리와 비교 분석한다. 셋째, 양자의 장단점을 종합하여 최적의 교육용 텍스트 개작 방법론을 개발한다. 넷째, 개발된 방법론의 일반화 가능성을 시대·장르·서사 구조가 상이한 다양한 작품에 적용하여 검증한다. 다섯째, 인간-AI 통합 개작 모델을 구축하고 교육 현장 적용을 위한 가이드라인과 프롬프트 매뉴얼을 개발한다.
궁극적으로 본 연구는 암묵지에 의존해 온 문학 개작의 원리를 학술적으로 체계화하고, 인문학과 AI 기술의 융합을 통해 외국어 교육 자료 개발의 새로운 패러다임을 제시하고자 한다.
기대효과
(한글 2000자 이내)
본 연구의 수행은 학문적, 사회적 측면에서 다각적인 기여를 할 것으로 기대된다. 먼저 학문적 측면에서는 그간 개별 전문가의 직관과 경험에 의존해 온 문학 개작 과정을 체계적 분석 틀로 체계화함으로써 외국어 교육 자료 개발 분야의 이론적 공백을 메우고 학술적 토대를 공고히 한다. 특히 동일 텍스트를 대상으로 인간과 AI의 수행 방식을 정밀하게 대조하는 연구 모델은 인문학과 인공지능 기술이 융합된 학제 간 연구의 선도적 사례가 될 것이며, 본 연구에서 확립한 프롬프트 엔지니어링 표준화 및 전문가 교차 검증 방법론은 인접 언어 교육 및 자연어 처리 분야에서도 폭넓게 인용될 수 있다.
사회적 및 교육적 측면에서는 검증된 원리에 기반한 고품질의 B1 수준 읽기 자료를 보급하여 학습자들이 문학적 미학을 경험함과 동시에 자신의 수준에 적합한 언어 학습을 병행할 수 있는 몰입도 높은 교육 환경을 제공한다. 또한 교육 현장의 실질적인 변화를 위해 개발된 개작 가이드라인과 프롬프트 매뉴얼을 오픈소스로 공개하여 교육자들이 AI를 도구 삼아 학습자 맞춤형 교육 자료를 직접 생산할 수 있는 전문 역량 강화를 지원한다. 나아가 이러한 연구 결과물은 오픈소스로 공개하여 출판사 및 에듀테크 기업의 실제 서비스 및 교재 개발에 기초 자료로 활용될 수 있으며, 궁극적으로는 독일어뿐만 아니라 다양한 외국어 교육 분야에 적용 가능한 범용 모델을 제공하여 국내 외국어 교육 산업 전반의 질적 성장을 견인할 것이다.
연구요약
(한글 2000자 이내)
본 연구는 총 5년에 걸쳐 단계별로 진행되는 누적적 연구 구조를 갖는다. 1단계(1년차)에서는 Uwe Timm의 “Die Entdeckung der Currywurst” 원작과 Angela Vitt의 B1 개작본을 대상으로 정량적·정성적 분석을 수행하여 인간 전문가의 개작 원리를 도출한다. 어휘적 차원에서는 Tree Tagger를 활용한 레마화 및 품사 태깅, LLE Deutsch(Language Level Evaluator, 독일어 수준 평가기)를 활용한 CEFR 수준별 어휘 분포 측정, Goethe-Zertifikat B1 어휘 목록(Wortliste)과의 대조 분석을 통해 어휘 대체 패턴을 유형화한다. 통사적 차원에서는 평균 문장 길이, 종속절 빈도, 복문 구조의 변화를 정량적으로 측정하여 통사 단순화 패턴을 분석한다. 서사적·문학적 차원에서는 플롯 축약·장면 통합·시점 변환 등 서사 구조의 변형 양상과 은유·상징·아이러니 등 문체적 장치의 보존·변형·삭제 양상을 질적으로 분석한다. 2단계(2년차)에서는 도출된 원리를 반영한 3단계 프롬프트 엔지니어링 전략(초기-분석/수정-최적화)을 설계하고, 연구 수행 시점의 최신 대규모 언어 모델(LLM)을 기준 모델로 삼아 반복적인 수정 과정을 통해 최적의 AI 개작본을 확정한다. 3단계(3년차)에서는 인간 개작본과 AI 개작본을 정량적·정성적으로 비교 분석하여 AI 고유의 개작 특성을 규명하며, DaF 교육 전문가 3인으로 구성된 패널을 통해 정성 평가의 객관성을 확보한다. 4단계(4년차)에서는 앞선 단계에서 도출된 인간-AI 개작원리의 일반화 가능성을 검증하기 위해, 1단계 분석 대상과 시대·장르·서사 구조가 상이한 추가 작품 2편에 동일한 분석 프레임워크를 적용한다. 대상 작품은 기존 B1 개작본이 확보된 Erich Kästner의 “Emil und die Detektive”(1929)와 Wolfgang Herrndorf의 “Tschick”(2010)이다. 최종 5단계(5년차)에서는 인간-AI 개작원리를 종합하여 통합 모델을 구축하고, 교육현장 적용을 위한 가이드라인과 프롬프트 매뉴얼을 개발하여 학술 저장소(예: GitHub)에 오픈소스로 공개함으로써 연구 성과의 공공성과 지속 가능성을 확보한다.
키워드(Keyword)
(한글 250자 이내)
문학 텍스트 개작, 외국어로서의 독일어(DaF), 프롬프트 엔지니어링, 인간-AI 비교 분석, 읽기 자료 개발 방법론
키워드
(영어 500자 이내)
Literary Text Adaptation, German as a Foreign Language (DaF), Prompt Engineering, Human-AI Comparative Analysis, Methodology for Reading Material Development
닫기

게시물 이은성 / 전북대학교 교과교육연구소 / 인간과 AI의 문학 텍스트 개작원리 비교 연구: DaF 학습자용 읽기 자료 개발을 위한 방법론 탐색 / 2026 인문사회학술연구교수(A유형) / 190,000 / 60개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.

13 - 韩国数字人文协会（KADH）

이원진 / 성균관대학교 동아시아미래가치연구소 / 인류세 이후 인공지능 시대를 위한 동아시아적 월드 모델(World Model) 연구 / 2026 인문사회학술연구교수(A유형) / 190,000 / 60개월

作者Baro

2026年5月11日 22:49

이원진 / 성균관대학교 동아시아미래가치연구소 / 인류세 이후 인공지능 시대를 위한 동아시아적 월드 모델(World Model) 연구 / 2026 인문사회학술연구교수(A유형) / 190,000 / 60개월

접수과제정보
접수번호2026011268
연구요약문
연구목표
(한글 2000자 이내)
본 연구의 목표는 유교·불교·도교로 대표되는 동아시아 사유 전통을, 현재 인공지능이 향하고 있는 미래 방향인 공간지능, 월드모델과 통합된 형태로 연결시켜, 인간–비인간 공존 존재론을 구축하는 데 있다. 그간 유불도의 동아시아 사유는 기존 서구 이론의 ‘체화된 인지(embodied cognition)’와 유사성 차원에서 반복적으로 논의되어 왔다. 유교의 수양론은 인간의 인식과 도덕 판단이 추상적 이성 이전에 몸·감정·습관·관계 속에서 형성된다고 보았고, 불교는 수행을 통해 인식 주체가 감각과 환경의 상호작용 속에서 변화하는 과정임을 강조해 왔다. 도교 역시 인간을 자연과 분리된 주체로 보지 않고, 기의 흐름과 환경 속에서 조율되는 존재로 이해해 왔다. 이러한 점에서 동아시아 사유는 서구 인지과학이 20세기 후반에야 본격적으로 이론화한 체화된 인지와 강한 공명을 이루어 왔으며, 그 결과 ‘동아시아 사유는 이미 체화된 인지를 알고 있었다’는 평가를 받아왔다. 또한 본 연구는 동아시아 사유가 공유하는 장(field) 개념과 과정론적 세계 이해가 오늘날 인공지능 연구가 직면한 월드모델(world model) 논의와 깊이 연결된다는 점에 주목한다. 최근 인공지능 연구는 언어 중심의 워드 모델(word model)에서 벗어나, 환경을 인식하고 공간 속에서 작동하며 장기적 관계를 형성하는 월드모델인 피지컬 AI로 이동하고 있다. 이는 인공지능이 더 이상 추상적 계산 장치가 아니라, 물리적 공간 속에서 인간 및 비인간과 상호작용하는 존재가 될 것임을 의미한다. 본 연구는 이렇게 변화하는 AI의 공간지능·월드 모델을 경유하고 적용하여, 인간의 체화(體化)를 넘어 운화(運化) 모델(최한기의 기철학 용어), 즉 통합된 존재론을 구축하려고 한다. 이는 동아시아 사유를 서구 인지과학의 선구적 유사 사례로 재확인하는 데 그치지 않고, 인공지능 시대가 요구하는 새로운 존재론적·윤리적 틀을 제시하려는 도전적 시도이다. 체화된 인지는 주로 개별 인지 주체의 신체–환경 상호작용에 초점을 맞추지만, 동아시아 사유는 애초부터 인간·기술·자연·사회가 하나의 장(field) 안에서 함께 변형되고 운행되는 세계 전체의 과정성을 사유해 왔다. 동아시아 사유의 강점은 ‘몸을 가진 인지’에 머무르지 않고, 공간적 배치, 관계적 흐름, 시간적 변형이 결합된 세계적 질서, 즉 운화의 사유에 있다.
그러나 이러한 월드모델의 구축은 단기간에 완성될 수 있는 과제가 아니다. 특히 로봇 기술이 발전함에 따라 몸을 가진 AI는 인간보다 훨씬 많은 관절과 자유도를 갖게 될 것이며, 그 결과 가능한 움직임과 행위의 경우의 수는 인간의 공간 지능을 압도적으로 초과하게 된다. 이는 인공지능이 세계를 학습하기 위해 상상할 수 없을 만큼 방대한 가상현실 실험과 시뮬레이션이 필요함을 의미하며, 우리는 앞으로 이러한 ‘인공지능의 월드들(worlds)’이 생성되는 국면을 본격적으로 맞이하게 될 것이다. 본 연구는 이처럼 도래가 확실하지만 아직 충분히 사유되지 않은 세계를 철학적으로 선제 대응해야 할 필요성을 제기한다.
특히 당면한 문제 중 철학을 통해 접근해야 할 과제는 예측 가능성과 윤리이다. 월드모델이 확장될수록 인공지능의 행위는 더 복잡해지고 비선형적으로 전개될 것이며, 사후적 규제나 규범만으로는 인간–비인간 관계를 안정적으로 조율하기 어려워진다. 따라서 인공지능이 생성하고 학습하게 될 세계 자체에 어떤 관계적 질서와 윤리적 방향성이 내재되어야 하는지를 미리 사유해야 한다. 본 연구는 이 지점에서 동아시아 사유가 축적해 온 운화적 세계 이해—즉, 통제보다 조율, 지배보다 공존을 중시하는 사유—가 중요한 이론 자원이 될 수 있다고 본다.
아울러 본 연구는 인공지능과 생태 문제를 분리하여 다루지 않는다. AI의 월드 모델로의 발전은 필연적으로 대규모 데이터 센터, 막대한 연산 자원, 에너지 소비의 급증을 동반하며, 이는 기후 위기와 생태 불균형 문제와 직접적으로 연결된다. 인공지능이 생성하는 ‘세계’는 가상에만 머무르지 않고, 물질적 에너지 흐름과 환경 조건 위에서 작동할 것이다. 따라서 인간–AI 공존 모델은 기술 윤리 차원을 넘어, 에너지·환경·생태와의 공존 가능성을 함께 검토하는 존재론적 틀을 필요로 한다.
기대효과
(한글 2000자 이내)
인공지능과 생태 문제를 분리된 연구 영역으로 다루어 온 기존 접근을 넘어, 인간–기계–자연의 관계를 하나의 통합적 문제틀에서 사유하는 본 연구는 비교철학 연구라는 점에서 독창성이 있다. 특히 유교·불교·도교 삼교 사유를 단지 전통회귀적인 보조 자원이 아니라, 향후 AI가 발전모델로 제시하는 피지컬 AI가 살아갈 월드 모델(world model)이나 공간 지능(spacial intellingence)으로 재구성하는 이론적 기반이 될 수 있음을 제시한다. 즉 동아시아 철학이 현대 과학기술 논의의 핵심 이론 자원으로 기능할 수 있음을 입증하고자 하는 소중한 시도가 될 것이다.
이와 함께, AI의 윤리 차원에서도 본 연구는 사후 규제의 문제로 환원하지 않고, AI의 설계와 훈련을 가능하게 하는 존재론적·세계관적 전제 자체를 철학적으로 재검토하는 데 기여한다. 체화된 인지, 관계적 지능, 기(氣)의 운화(運化)에 기반한 세계 이해는 최적화나 경쟁 중심의 기존 AI 패러다임과 구별되는 대안적 방향을 제시할 수 있을 것으로 보인다. 이는 향후 피지컬 AI나 물리 AI가 가장 많이 활용될 분야인 돌봄 로봇, 교육용 AI, 공공 AI 등 인간과 장기적으로 공존해야 하는 기술 영역에서 중요한 철학적 기준이 될 수 있다. 장기적으로 본 연구는 저출생·고령화, 돌봄 위기, 생태 다양성 위기라는 동아시아 사회가 먼저 당면한 문제를 기술적 해결(techno-fix)이 아니라 관계 재설계의 문제로 접근할 수 있는 사유 틀을 제시한다. 유교의 관계 중심 윤리와 실천적 인간 이해, 불교의 상호의존과 자비, 도교의 비지배적 자연관은 기술 발전이 초래할 수 있는 소외와 분절을 완화하는 문화적 자원이 될 수 있으며, 본 연구는 이를 현대 기술 환경에 맞게 이론적으로 재구성한다. 이는 기술 발전과 삶의 질 사이의 균열을 완화하는 데 기여할 수 있는 인문학적 대안으로 작동할 것이다. 저출생과 고령화에 따른 돌봄 인구의 절대적 부족은 인류가 겪고 있는 공통된 문제이지만, 동아시아에서 특히 빠르게 확산되고 있으며, 동아시아 기반 사상으로 해결책을 얻을 수 있다면 향후 AI연구에도 발전적 방향을 제시할 수 있다. 마지막으로, 국제적 차원에서 본 연구는 서구 중심의 AI·인류세 담론에 대해 동아시아 사유를 기반으로 한 대안적 세계관을 제시함으로써, 한국 인문학과 비교철학 분야의 국제적 위상을 제고할 수 있다. 본 연구는 하버드대 세계종교연구센터를 중심으로 축적된 종교·생태 연구, 중국 SF와 AI 연구소에서 전개된 기술 윤리 실험, 그리고 서구의 신유물론·사변적 실재론과의 대화를 연결함으로써, 동서 통합적 논의의 실질적 매개 역할을 수행할 수 있다. 연구 성과는 국제 학술지 게재, 해외 학술대회 발표, 영어 단행본 출간 등을 통해 확산될 수 있으며, AI 윤리·환경인문학·비교철학 분야에서 후속 연구와 국제 협업을 촉발할 것으로 기대된다. 특히 한국 철학 자원의 세계화라는 측면에서도 중요한 의의를 지닌다. 조선 후기 실학자 최한기의 기철학—특히 기용운화(器用運化)·인민운화(人民運化)·우주운화(宇宙運化)의 삼기운화(三氣運化)와 이를 하나의 일기운화(一氣運化)로 통합하는 사유는 인간·기술·자연의 상호의존적 관계를 설명하는 매우 훌륭하고 독창적인 시대 예보였다. 본 연구는 이러한 전통 사유를 현대 AI 월드 모델과 접합함으로써, 인간–인공지능–생태의 관계를 설명하는 동서 통합적 세계모델을 제시하고자 한다. 이는 한국이 보유한 철학적 자원을 지역적 특수성에 머물게 하지 않고, 인류가 직면한 보편적 문제에 응답하는 이론으로 확장하는 시도가 될 것이다. 덧붙이고 싶은 본 연구의 특이한 점이자 강점은, 이런 월드모델을 소설의 상상력 속에서 재점검한다는 점이다. 도교적 생태성과 유교적 관계 윤리가 현대 SF에서 어떻게 재해석되고 있는지를 분석함으로써, 이론 연구의 상상적 확장성도 함께 제시한다는 것이다. 세계적인 여성 SF작가 어슐러 르귄의 도교적 생태 서사와 중국 작가 천추판의 『웨이스트 타이드』에 나타난 유교적 관계 윤리는 기술 발전을 성장과 정복의 서사가 아니라, 책임·돌봄·관계의 문제로 재배치한다. 이러한 가상 사고실험 서사는 본 연구가 제시하는 세계모델의 철학적 타당성을 검증하는 인문학적 시뮬레이션 공간으로 기능할 수 있다. 이렇게 본 연구는 인류세와 인공지능이라는 동시대의 두 위기를 분절적으로 다루지 않고, 인간–비인간–기술의 관계망을 재구성하는 통합적 사유 틀을 제시함으로써, 한국 인문학이 세계적 논의에 기여할 수 있는 실질적 전환점을 마련할 것으로 기대된다.
연구요약
(한글 2000자 이내)
본 연구의 목표는 유·불·도로 대표되는 동아시아 삼교의 사유 전통을 토대로, 인공지능 시대에 요구되는 인간–기계–생태 관계를 과정적·관계적 월드 모델로 재구성하는 데 있다. 인공지능은 2022년 LLM(대규모 언어모델)이 폭발적으로 상용화되면서, 언어 처리와 계산 효율, 예측 정확도, 제어 가능성을 중심으로 급격히 발전해왔다. 그러나 기계 행위자(비인간)와 사용자(인간) 사이의 관계 윤리를 정립하는 과제에는 미흡해, 현재 인간과의 상호작용에서 월권이나, 파괴 등의 위험 관리 문제가 대두되고 있다. 때문에 최근 인공지능 연구의 흐름은 기존의 대규모 워드 모델(word model)에서, 환경을 인식하고 공간 속에서 작동하며 장기적 관계를 형성하는 월드 모델(world model) 즉 몸을 가진 ‘피지컬 AI’가 환경 속에서 어떤 문제해결을 할 수 있는가의 문제로 점차 이동하고 있다. 2024년부터 페이페이 리 등 최일선 AI 연구자들 사이에 나오고 있는 이런 전환의 필요성은 인공지능을 향후 세계 속에서 인간과 함께 살아가고 조율되어야 할 행위자와 존재로 재사유할 필요성을 강하게 제기한다.
본 연구는 이러한 전환을 기술적 진화의 문제로만 보지 않고, 인간과 세계의 관계를 이해하는 철학적 틀의 변화로 해석하려는 시도이다. 특히 2020년 초반부터 일부 연구자들은 체화된 인지(embodied cognition)에 기반한 신경과학을 동양적 수양론에 연결시키는 동아시아발 AI의 개발 가능성을 논의하고 있다. 이는 앞으로 기계의 인식과 지능이 신체, 감각, 환경과의 상호작용 속에서 형성될 것이라는 점을 시사한다. 주목할 점은 이 연구자들이 강조하듯, 서구 인지과학 이전부터 동아시아 사유 전통, 특히 유교의 수양론과 도덕 실천론에서 인간과 주변 환경과의 관계적 윤리가 핵심적으로 논의되어 왔다는 사실이다. 유교는 인간의 인식과 도덕 판단을 추상적 이성보다 몸과 감정, 습관과 관계 속에서 형성되는 것으로 이해했으며, 이러한 체화된 인간 이해는 불교의 수행론과 도교의 양생·자연론에서도 동일하게 발견된다. 불교는 연기와 자비의 관점에서 인식 주체를 고정된 자아가 아닌 관계적 과정으로 이해하며, 도교는 세계를 지배나 통제의 대상으로 보지 않고 흐름과 변화, 기의 순환 속에서 조율되어야 할 장(field)으로 파악해 왔다.
연구자는 이러한 동양 전통의 체화적 사유가 오늘날 월드모델과 피지컬 AI가 직면한 철학적 과제에 새로운 시각을 던져줄 수 있다고 본다. 인공지능이 인간 세계와 함께 ‘운동하고 변형되는’ 존재가 되기 위해서는, 동아시아 사유가 축적해 온 과정적 세계 이해가 필수적인 이론 자원이 될 수 있다. 따라서 본 연구는 인간-자연 관계를 상호 변형되고 함께 생성되는 관계망으로 이해해 온 동아시아 사유 전통에 주목하며, 특히 기술과 인간의 관계까지도 통찰했던 최한기의 용어를 빌려 삼기운화(三氣運化)라는 개념을 중심으로 인간–비인간–기술이 함께 변화하는 과정적 질서를 이론적으로 정식화하고자 한다. 이런 삼기운화를 습득한 인공지능은 ‘음양지능’ 또는 ‘인공지혜’로도 불릴 수 있다.
연구는 연차별로 단계적으로 진행된다. 1년차에는 하버드대 세계종교연구센터에서 1900년대 후반 삼교 생태 사유를 중심으로 해놓은 선행연구를 경유해 인간–자연 관계를 통해 철학적 토대를 확립하고, 생태 위기를 인간 외부의 문제가 아닌 관계적 조건의 문제로 재정식화한다. 2년차에는 체화된 인지, 관계윤리, 장(field) 이론을 중심으로 동아시아발 AI 논의를 본격화하며, 특히 중국 베르그루엔 연구소를 비롯한 국제 연구 동향을 분석해 동양 사유가 인공지능 논의에 제공할 수 있는 이론적 기여를 검토한다. 3–4년차에는 1~2년차에서 검토했던 바, 유불도 삼교가 공유하는 과정론적 존재 이해를 바탕으로 AI 윤리와 시공간 개념을 재구성하고, 5년차에는 한국의 기철학자 최한기의 삼기운화 즉, 천지운화(天地運化),통민운화(通民運化),기용운화(器用運化)이면서 일기운화(一氣運化)인 모델을 차용해, 현대 인공지능 월드 모델 논의와 접합해 인간–AI–생태가 함께 운화하는 통합적 월드 모델을 완성한다.
키워드(Keyword)
(한글 250자 이내)
인간–비인간 관계 , 기계, 생태 철학, 동아시아, 유교, 불교, 도교, 하버드대 세계종교연구센터, 종교와 생태학, 관계윤리, AI, 피지컬 AI, 물리 AI, 인공지능 철학, LLM, 월드모델, 체화된 인지, 인공지혜, 음양지능, 삼기운화(運化), 최한기, 천지운화(天地運化), 통민운화(通民運化), 기용운화(器用運化), 일기운화(一氣運化), 유학적 AI, 맹자 크리쳐, 피터 허쇽, 석봉래, 에드워드 슬링거랜드, 카렌 바라드, 시공간매터링, 베르그루엔 연구소, 페이페이 리, 얀 르쿤, 사변적 실재론, 21세기 새로운 실재론, 신유물론, 신경과학
키워드
(영어 500자 이내)
Anthropocene, World Model, Fei-Fei Li, Yann LeCun, Artificial Intelligence, East Asian Three Teachings (Confucianism–Buddhism–Daoism), Embodied Cognition, Confucian AI, Process-Relational Ontology, Human–Nonhuman Relations, Ecological Philosophy, Artificial Wisdom, Yin–Yang Intelligence, Berggruen Institute, Hershock, Bongrae Seok, Edward Slingerland, Karen Barad, SpacetimeMattering, Speculative Realism, New Materialism, Choe Han-gi, Threefold Transformative Circulation(三氣運化)
닫기

게시물 이원진 / 성균관대학교 동아시아미래가치연구소 / 인류세 이후 인공지능 시대를 위한 동아시아적 월드 모델(World Model) 연구 / 2026 인문사회학술연구교수(A유형) / 190,000 / 60개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.

13 - 韩国数字人文协会（KADH）

이수진 / 전남대학교 / 중세·근대 국어의 구어적 텍스트에 나타난 시상 체계의 변천 연구 / 2026 인문사회학술연구교수(A유형) / 190,000 / 60개월

作者Baro

2026年5月11日 22:49

이수진 / 전남대학교 / 중세·근대 국어의 구어적 텍스트에 나타난 시상 체계의 변천 연구 / 2026 인문사회학술연구교수(A유형) / 190,000 / 60개월

접수과제정보
접수번호2026011641
연구요약문
연구목표
(한글 2000자 이내)
이 연구는 15~19세기의 언간, 외국어 학습서의 회화문, 고소설, 불경 언해서의 대화문과 같은 구어적 텍스트에 나타난 국어 시상 체계의 통시적 변천을 실증적으로 규명하고, 이를 위한 고품질 의미 기능 주석 말뭉치를 구축하여 공개하는 것을 목적으로 한다. 현대 국어의 과거 시제 선어말어미라고 하는 ‘-었-’은 중세 국어 시기 보조 용언 구성 ‘-어 잇-‘으로부터 발달했다는 데에는 큰 이견이 없으나, ‘-어 잇-’의 축약형인 ‘-엣-’에서 ‘-엇-’까지의 발달 과정에서 일어난 체계상의 변화를 바라보는 시선은 학자들마다 다양하다. 구어적 특징으로 자연스럽게 일어나는 음절 축약과 형태 변화에 따른 의미 기능의 변화를 고려할 때, 통시적 연구에서 구어적 텍스트를 중심으로 시상 체계를 체계적으로 분석할 필요가 있다.
문법화의 일반적 과정을 고려할 때 구어의 변화가 문어에 반영되기까지 일정 기간이 필요하므로, 구어적 텍스트와 문어적 텍스트를 분리한 실증적인 검토가 요구된다. 언간과 외국어 학습서 회화문은 화자와 청자를 상정한 구어적 텍스트라고 할 수 있다. 언간은 일방적이며 비동시적이지만 수신자를 상정하고 직접 말하듯 작성된 것이 대부분이다. 이 때문에 발화 기반의 음운 축약 등 형태 변화가 문어적 텍스트보다 다양하게 나타날 것으로 기대된다. 이 연구에서 사용할 원시 말뭉치는 국립국어원 <모두의 말뭉치>에서 공개하고 있는 <국어 역사 말뭉치 2023>, <국어 역사 말뭉치 2024> 2종이다. 정비 작업을 거친 고품질의 원시 말뭉치이긴 하지만 어떠한 말뭉치의 가공이 이루어지지 않고 의미 기능 주석이 부재하여 다양한 형태로 나타나는 국어사 문헌의 면면을 체계적 분석하기에는 한계가 있다. 이처럼 어떤 가공도 이루어지지 않아 타 분야에서나 산업적으로 활용도가 높지 않지만 정확도 높은 원시 말뭉치가 공개되어 활용할 수 있게 된 지금, 국어사 의미 기능에 따른 주석 말뭉치 구축이 시도되어야 할 시점이다.

이에 이 연구에서는 다음과 같은 목적을 설정하였다.

첫째, 15~19세기 구어적 텍스트에 나타난 시상 선어말어미의 형태․의미 변화를 통시적으로 살펴보고 ‘-아/어 잇- > -앳/엣- > -앗/엇-’의 문법화 층위와 상적 기능 등을 구어적 텍스트에서의 변화 시점을 실증적으로 확인한다.

둘째, 언간과 외국어 학습서 회화문을 대상으로 한 시상 선어말어미의 출현 빈도, 결합 양상, 의미 기능을 분석한다.

셋째, 주석 말뭉치를 기반으로 세기별․문헌 성격별 시상 선어말어미의 결합 빈도와 분포의 변화를 정량적으로 분석하고, 변화의 경향성을 층위별로 기술한다.

넷째, 국어사 자료의 용언 활용형을 대상으로 어간, 선어말어미, 어미 분석 주석 구축 지침을 수립하고 주석 말뭉치를 구축한다. 이 지침에 따라 언간 6.3만 어절, 외국어 학습서 15만 어절을 포함한 총 100만 어절 이상의 원시 말뭉치를 기반으로 주석 말뭉치를 구축하여 공개하고 구어적 텍스트에 나타나는 시상 체계의 양상을 종합적으로 분석한다.
기대효과
(한글 2000자 이내)
① 구어적 텍스트 시상 체계 변천의 실증 검증 및 학술 연구 확산
15~19세기 언간, 외국어 학습서 회화문, 고소설 대화문, 불경 언해서 대화문 등 구어적 텍스트를 대상으로 시상 선어말어미의 통시적 변화를 세기별․문헌의 성격별로 출현 환경과 결합 양상을 분석한다. 선행 연구에서 지문과 대화문을 의식적으로 분리하지 않았던 한계를 극복하고, 구어에서 일어나는 음절 축약과 형태 변화에 따른 의미 기능 변화를 체계적으로 포착할 수 있다. 국어 시상 체계에서 가장 중요한 변화 중 하나인 ‘-엇-’의 생성과 관련하여서는‘-아/어 잇- > -앳/엣- > -앗/엇-’의 문법화 과정을 층위별로 살펴볼 수 있다. 연구를 통해 구축된 주석 말뭉치와 주석 지침을 Github를 통해 공개하여 연구의 투명성과 재현성을 확보하고, 다른 연구자들이 동일한 데이터로 후속 연구를 수행하거나 연구 결과를 검증할 수 있는 학술적 환경을 조성할 수 있다.

② 국어사 주석 말뭉치 구축 확산 및 연구․교육 인프라 구축
이 연구를 통해 구축되는 시상 주석 말뭉치는 국어사 분야에서 의미 기능 주석 말뭉치의 선구적 사례가 될 것이다. 이 과정에서 선행 연구의 결과를 종합하여 주석 지침 수립하고 실제 100만 어절 규모의 말뭉치를 분석함으로써 국어사 분야에서 다양한 문법 범주의 주석 말뭉치 구축을 위한 방법론적 기반을 제공한다. 참고할 지침이 공개됨에 따라 국어사 자료에 대한 접근성을 개선하여 학문 후속세대가 국어사 분야에서 연구하는 데에 다양한 편의성이 제공될 것이다. 더불어 교육 현장에서 문법화 과정을 시각화하여 보여줄 수 있는 교육 자료로 활용할 수 있으며 현대 국어를 이해할 때 ‘-었-’, ‘-겠-’의 결합 양상에서 의문이 생기는 점을 시상이라는 측면에서 이해할 수 있도록 보조하는 도구가 될 것이다. 또한 연구 수행 과정에서 주관 기관과 세미나를 진행하여 강의 외에도 말뭉치의 구축, 구축 지침의 수립 과정, 통계적 분석 기법 등을 체득하게 하여 학문 후속 세대를 양성하는 데에 이바지할 수 있을 것이다.

③ 전산언어학 응용 기반 제공 및 디지털 인문학 확산
이 연구의 결과로 도출되는 주석 말뭉치는 중세․근대 국어의 형태 분석기 개발 과정에서 복잡한 선어말어미의 결합 형태에 대한 훈련 데이터로 활용할 수 있다. 또한 UniMorph나 GGG 등 국제 학술 네트워크 확산에 국어 역사 언어 모델을 구축하는 연구의 기초 자료로 제공될 수 있다. 비교언어학적 연구나 KoNLP 연구에도 적용해 볼 수 있어서 국어사 연구를 디지털 인문학에서도 어렵지 않게 접할 수 있을 것이다.
연구요약
(한글 2000자 이내)
이 연구는 국어 역사 말뭉치의 구어적 텍스트에 나타난 국어의 시상 체계의 변천을 실증적으로 살펴보는 데에 목적이 있다. 이를 위해 설계한 연구 내용과 방법을 다음과 같다.

① 대상 문헌 선정 및 주석 말뭉치 지침 수립 및 정교화
② 세기별․문헌별 용언 어간, 선어말어미, 어말어미 결합 양상 분석 및 주석 태깅
③ 국어 역사 자료의 주석 말뭉치 구축
④ 말뭉치 세미나 및 자료집 발간, 연구 논문 발표

위의 내용과 구체적인 연구 방법을 요약하면 다음과 같다.

① 대상 문헌 선정 및 주석 말뭉치 지침 수립 및 정교화

구어적 텍스트(언간, 외국어 학습서 회화문, 고소설 대화문, 불경 언해서의 대화문)의 선정
UniMorph, K-UniMorph, GGG를 참고하여 주석 말뭉치 지침 수립

② 세기별․문헌별 용언 어간, 선어말어미, 어말어미 결합 양상 분석 및 주석 태깅

언간, 외국어, 고소설, 불경 언해서(15~19세기)의 순차적 주석 태깅
중간 결과물 검토 및 공개

③ 국어 역사 자료의 주석 말뭉치 구축

구축이 완료된 말뭉치는 검토 및 보완 작업 후 GitHub에 공개
후속 연구(문어 텍스트의 주석 말뭉치 구축) 준비

④ 주석 말뭉치 세미나 및 자료집 발간, 연구 논문 발표

연구의 학술적 확산을 위한 주석 말뭉치 세미나 개최
말뭉치를 활용하여 디지털 인문학 방법론을 체득한 학문 후속세대 양성
주석 말뭉치 관련 자료집 발간
연구 논문 발표(연 2회 이상)
키워드(Keyword)
(한글 250자 이내)
국어사, 주석 말뭉치, 구어적 텍스트, 시제, 상, 통시적 변화
키워드
(영어 500자 이내)
Historical Korean, Annotated Corpus, Spoken-Style Texts, Tense, Aspect, Diachronic Change
닫기

게시물 이수진 / 전남대학교 / 중세·근대 국어의 구어적 텍스트에 나타난 시상 체계의 변천 연구 / 2026 인문사회학술연구교수(A유형) / 190,000 / 60개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.

13 - 韩国数字人文协会（KADH）

양희정 / 한국외국어대학교 / AI 프롬프트 엔지니어링 기반 문어체·구어체 아랍어 의료통역 대화문 개발 및 학습자 주도형 의료통역 훈련 모델 설계 / 2026 인문사회학술연구교수(A유형) / 190,000 / 60개월

作者Baro

2026年5月11日 22:47

양희정 / 한국외국어대학교 / AI 프롬프트 엔지니어링 기반 문어체·구어체 아랍어 의료통역 대화문 개발 및 학습자 주도형 의료통역 훈련 모델 설계 / 2026 인문사회학술연구교수(A유형) / 190,000 / 60개월

접수과제정보
접수번호2026011345
연구요약문
연구목표
(한글 2000자 이내)
본 연구의 목표는 생성형 AI인 ‘챗GPT’와 ‘구글 제미나이’를 활용한 프롬프트 엔지니어링을 통해 문어체 아랍어와 구어체 아랍어 의료통역 대화문을 체계적으로 개발하고, 이를 기반으로 학습자 주도형 의료통역 훈련 모델을 설계·구축하는데 있다. 이를 통해 아한·한아 의료통역 교육에서 요구되는 실제성과 전문성을 강화한 교육 자원을 제공하고자 한다.

의료통역 상황에 특화된 아한·한아 대화 코퍼스를 구축하고, 프롬프트 설계를 통해 문어체 아랍어와 UAE 구어체 아랍어 의료통역 대화문을 자동 생성할 수 있는 체계를 마련한다. 또한 학습자가 대화 생성과 통역 훈련 과정에 능동적으로 참여하는 학습자 주도형 훈련 모델을 설계하여, 통역 정확성, 상황 대응력, 실무 적응력을 종합적으로 향상시키는 것을 목표로 한다.

본 연구는 의료 현장에서 활용 빈도가 높은 문어체 아랍어와 UAE 구어체 아랍어를 연구 대상으로 한정하며, 향후 다른 아랍어 방언 및 타 언어권 의료통역 교육으로 확장 가능한 기초 모델을 제시하는 데 의의를 둔다.
기대효과
(한글 2000자 이내)
본 연구는 생성형 AI 기반 프롬프트 엔지니어링을 활용하여 문어체 및 구어체 아랍어 의료통역 대화문을 체계적으로 개발하고, 학습자 주도형 의료통역 훈련 모델을 제시함으로써 의료통역 교육의 새로운 패러다임을 제시할 것이다.

학문적 측면에서는 시대적 요구를 반영한 통번역학·아랍어 교육·생성형 AI를 융합한 학제 간 연구로, 의료통역 교육에 AI 프롬프트 엔지니어링을 적용한 방법론을 개발한다. 특히 기존 연구에서 상대적으로 소외되어 온 구어체 아랍어 연구의 범위를 확장하고, 향후 아랍어 방언 통역 연구 및 AI 기반 통역 교육 연구의 기초 자료로 활용될 수 있다.

교육적 측면에서는 의료 현장의 발화 특성을 반영한 대화문 개발을 통해 기존 교재 중심·문어체 위주의 교육 한계를 보완하고, 의료통역 교육의 실효성을 제고할 것으로 기대된다. 학습자가 대화 생성, 통역 수행, 자기 점검에 능동적으로 참여하는 학습자 주도형 훈련 모델은 통역 정확성뿐만 아니라 상황 인식 능력, 즉각적 대응력, 실무 적응력을 종합 향상시키는 데 기여한다. 예비 실험과 사전·사후 설문조사, 전문가 평가를 통한 분석은 의료통역 교육에서 AI를 활용한 학습자 주도 학습의 교육적 효과를 검증해 최적화된 AI 교육 도구 개발에 기여할 것이다.

사회적 측면에서 본 연구 성과는 아한·한아 의료통역 교육 자료 및 훈련 모델로 활용 가능하여 의료 현장에서 요구되는 전문 의료통역 인력 양성에 기여할 것으로 기대된다. 이는 고부가가치 산업인 의료관광 육성에 기여하고, 다문화 의료 서비스의 질 향상과 의료 접근성 제고라는 사회적 요구에 부응하는 실천적 성과라 할 수 있다. 더 나아가 본 연구에서 제시하는 AI 기반 의료통역 교육 모델은 향후 기타 구어체 아랍어 및 전문 분야 통역 교육으로 확장 가능성이 높아, 공공 통역 서비스 전반의 전문성 강화에도 기여할 것으로 기대된다.
연구요약
(한글 2000자 이내)
본 연구는 5년간 단계적으로 수행되며, 목적은 생성형 AI를 활용한 문어체·구어체 아랍어 의료통역 대화문 개발과 학습자 주도형 훈련 모델 설계이다. 1년차에는 프롬프트 엔지니어링으로 문어체 아랍어 대화문을 생성하고, 의료통역 대화문 적합성 및 활용 가능성을 중심으로 평가 기준을 마련한다. 2년차에는 UAE 구어체 아랍어 대화문을 개발하고, 생성된 문어체·구어체 아랍어 대화문에 대한 전문가 평가를 실시한다. 3년차에는 AI 기반 학습자 주도형 훈련을 실험하고, 4년차에는 전문가 평가로 훈련 효과를 검증한다. 5년차에는 연구 결과를 종합하여 최적화된 학습자 주도형 의료통역 훈련 모델을 완성한다.

1년차 연구 내용 및 방법:
문어체 아랍어 대화문을 생성하고 언어적 정확성, 의료 맥락 적합성, 통역 활용 가능성을 기준으로 평가 체계를 마련한다. 챗GPT와 구글 제미나이를 활용하며, 연구 언어는 문어체 아랍어(환자·보호자, 통역사)와 한국어(의료진, 통역사)로 한정된다. 주요 의료 상황은 전문가 인터뷰와 문헌 조사로 도출하며, 평가 기준 개발에 중점을 둔다. 연구 방법은 선행연구 분석, 전문가 인터뷰, 프롬프트 설계, 대화문 생성, 분석 및 평가 기준 설정의 순으로 수행된다. 프롬프트는 환자·의료진 정보와 의료 상황을 조합하여 설계하며, 10개 이상의 최적화된 프롬프트로 다자간 의료통역 대화문을 생성한다. 생성된 대화문은 정성 분석하고 전문 통역사 평가 기준을 마련한다.
2년차 연구 내용 및 방법:
UAE 구어체 아랍어 의료통역 대화문을 생성해 품질을 검증하고, 문어체·구어체 대화문을 종합해 정성 분석한다. 구어체 정확성은 UAE 구어체 전문가 평가를 병행해 확인한다. 프롬프트 설계는 1년차 원칙을 적용하되 환자를 UAE 구어체 사용자로 설정한다. 생성된 대화문은 전문가 인터뷰와 문헌 조사로 검증하며, 전문 통역사 설문조사로 종합 평가를 실시한다.
3~5년차 연구 내용 및 방법:
3년차에는 1, 2년차 결과를 바탕으로 AI 기반 학습자 주도형 아한·한아 의료통역 훈련 예비모델을 설계하고 실험을 수행한다. 학습자는 AI와 상호작용하며 통역 연습, 피드백, 자가 진단, 의료 어휘 학습 등을 통해 훈련에 임한다. 4년차에는 실험 결과와 사전·사후 설문조사를 분석하고, 구어체 전문가 인터뷰와 전문 의료통역사 평가를 통해 모델을 검증한다. 5년차에는 연구 결과를 종합하여 최적화된 학습자 주도형 훈련 모델과 프롬프트 설계 원칙을 완성한다.

연구 성과는 논문, 강의, 학술대회 발표를 통해 확산한다. 논문 5편 이상을 게재하고, 대학 또는 온라인 강의를 진행하며, 연 1회 학술대회 발표에 참여해 연구자, 교육자, 통역사, 학습자 등과 연구 성과를 공유한다.
키워드(Keyword)
(한글 250자 이내)
AI 프롬프트 엔지니어링, 문어체 아랍어, 구어체 아랍어, 의료통역 교육, 학습자 주도 훈련
키워드
(영어 500자 이내)
AI Prompt Engineering, Modern Standard Arabic, Colloquial Arabic, Medical Interpreting Education, Learner-Driven Training
닫기

게시물 양희정 / 한국외국어대학교 / AI 프롬프트 엔지니어링 기반 문어체·구어체 아랍어 의료통역 대화문 개발 및 학습자 주도형 의료통역 훈련 모델 설계 / 2026 인문사회학술연구교수(A유형) / 190,000 / 60개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.

13 - 韩国数字人文协会（KADH）

심재욱 / 제주대학교 / 아시아태평양전쟁 시기 일본의 조선인 해군 군인 동원과 선원 동원 실태 – 일본 정부 작성 명부자료의 분석을 중심으로 / 2026 인문사회학술연구교수(A유형) / 190,000 / 60개월

作者Baro

2026年5月11日 22:46

심재욱 / 제주대학교 / 아시아태평양전쟁 시기 일본의 조선인 해군 군인 동원과 선원 동원 실태 – 일본 정부 작성 명부자료의 분석을 중심으로 / 2026 인문사회학술연구교수(A유형) / 190,000 / 60개월

접수과제정보
접수번호2026012573
연구요약문
연구목표
(한글 2000자 이내)
본 연구는 일본 정부가 작성한 강제동원 관련 명부자료들의 분석을 통해 추출한 데이터를 바탕으로 아시아태평양전쟁 당시 일본의 해군 군인과 선원으로 강제동원된 조선인들의 동원 실태와 피해상을 구체적으로 고찰한다.
조선인 강제동원은 ‘조선인의 근대화’가 ‘조선인의 활용’에 식민통치의 목적이 있었음을 단적으로 보여주는 사건으로써 연구의 중요성과 의의를 지닌다. 또한 현재까지도 해결되지 않아 한·일 양국의 첨예한 외교 쟁점으로 남아 있는 ‘과거사 문제’ 해결을 위한 학문적 기초를 마련하는 점에서도 중요성을 지닌다. 하지만 관련 연구는 아직도 많은 과제를 지니고 있다. 특히 각 동원 형태의 구체적인 실태에 대한 연구는 여전히 부족하다. 본 연구에서 진행하는 해군 군인 동원과 선원 동원에 대한 연구 또한 마찬가지이다.
해군 군인 동원 관련 연구는 현재까지 단 세 편에 불과하다. 본 연구자가의 최근 연구를 제외한, 기존의 연구는 구체적인 동원 실태 파악에 이르지 못하였고, 또 많은 오류를 지니고 있다. 본 연구자의 연구 또한 기초적인 내용 파악만 이루어졌고, 여러 구체적인 동원 사례 및 실태에 대해서는 추후 연구가 필요한 상태이다.
선원 동원의 경우 선박의 징용과 함께 군속의 신분으로 동원되고, 징용 주체에 따라 동일한 선원임에도 육군과 해군의 군속으로 구분된다. 또한 일부는 해군 군인의 신분으로 동원되는 특징을 지닌다. 그러나 이에 대해서는 일부 명부자료에 대한 해제·분석만이 존재할 뿐 관련 연구는 전무한 상태이다.
본 연구는 이러한 연구의 부족을 극복하는 작업의 하나로써 해군 군인과 (육해군)선원과 같은 개별 동원 형태의 구체적인 실태를 파악함으로써 조선인 강제동원의 전체상을 파악할 수 있는 기초 연구의 역할 수행을 목표로 한다.
기대효과
(한글 2000자 이내)
본 연구를 통해 기대되는 효과는 다음과 같다.
첫째, 강제동원 연구의 질적 향상이다. 명부분석과 이를 통해 확보되는 기초 데이터의 축적은 현재까지 파악되지 않은 구체적인 동원 실태를 새롭게 규명할 것이다. 또한 새롭게 발굴되는 다양한 피해 사례는 관련 연구의 질적 향상과 함께 연구의 지평을 확장할 것으로 판단된다.
둘째, 강제동원에 대한 사회적 관심의 유도와 관련 연구의 활성화이다. 본 연구를 통해 부각되는 명부자료 분석의 효용성은 관련 연구 활성화의 계기가 될 것이다. 이는 또한 기초 데이터를 통해 구축이 가능한 다양한 콘텐츠의 개발과 함께 일반인의 이해도 향상과 관심을 유도할 것이다.
셋째, 강제동원 관련 국제 연구의 교류 확산이다. 본 연구과제가 예정하고 있는, 일본 지역에서 개최되는 ‘强制動員眞相究明全國硏究集會’의 참여와 사례 발표를 통해 일본 지역 연구자들 및 활동가들에게 조선인 강제동원에 대한 관심을 환기시키는 효과를 가져올 것이다.
마지막으로 현재 국가기록원에서 진행 중인 강제동원 관련 명부자료의 데이터화 작업의 향후 정밀활에 커다란 영향을 미칠 것으로 판단된다.
연구요약
(한글 2000자 이내)
본 연구는 일본 정부가 작성한 명부자료를 입력·분석하고, 여기서 추출한 데이터를 바탕으로 아시아태평양전쟁 당시 일본의 해군 군인과 육해군의 선원으로 강제동원된 조선인들의 실태를 구체적으로 고찰한다.
본 연구에서 분석·활용할 명부자료는 해군 군인의 경우, 『구해군군인이력원표(舊海軍軍人履歷元表)』를 대상으로 한다. 약 2만 1천 여 명의 개인별 기록이 편철되어 있는 해당 자료는, 관련 내용을 파악할 수 있는, 현재까지 확인된 유일한 자료로써, 중요한 의미를 지니고 있다. 약 1만 3천 여 명에 이르는 선원의 경우 『군속선원명표(軍屬船員名票)』, 『구일본육·해군징용선사망자명부(舊日本陸·海軍徵用船死亡者名簿)』를 중심으로 조선인 선원의 기록을 파악할 수 있는 『유수명부(留守名簿)』, “구일본해군 조선인 군속 관련 자료(2009)” 등을 이용한다.
본 연구는 다음과 같은 내용과 방법으로 진행한다. 먼저 현재 80% 정도의 진척도를 지닌 명부자료들의 입력 작업을 정밀화하여 기초 데이터를 추출한다. 그리고 이를 통해 인적 사항 및 동원 시기, 소속, 투입 지역, 신분, 사망 시기·장소·상황 등의 실태와 주요 사례에 대한 분석을 진행한다. 아울러 관련 문헌 자료 및 연구 논저에 대한 수집·분석을 통해 보다 구체적이고 객관적인 분석을 진행한다. 이들의 동원은 일본 정부 및 군의 정책·제도·편제 하에서 진행되었기 때문에 이에 대한 조사·분석이 필수적이다. 한편 당시 실제 상황을 파악할 수 있는 경험자들의 체험기·회고록 등도 함께 조사·분석한다.
이러한 방법을 통해 1)기초 연구–관련 법령·제도, 소속 부대·회사, 교육 훈련 등, 2)사례연구–주요 부대(설영대, 육전대, 해군예비원 등)의 동원 실태와 성격, 사망 사례 등과 같은 연차별 주제에 맟춰 연구 논문을 작성·발표한다.
본 연구는 축적된 데이터와 연구 내용을 바탕으로 연구 기간 종료 이후에도 계획된 연구 논문 이외에도 연구 과정에서 새롭게 파악되는 주요 내용에 대한 연구를 계속 진행·발표한다. 그리고 해당 내용을 엮어 자료집과 저서 출판을 진행한다.
키워드(Keyword)
(한글 250자 이내)
일본 해군, 해군 군인, 병과, 해군포술학교, 해군수뢰학교, 해군통신학교, 해군잠수학교, 진수부, 경비부, 해병단, 특별육전대, 설영대, 경비대, 방비대, 항공대, 복원, 선원, 해원, 군속, 상선학교, 해원양성소, 징용선, 해군예비원, 선박사령부, 면허장, 선주
키워드
(영어 500자 이내)
Imperial Japanese Navy, Naval Soldier, Military Occupational Specialty, Naval Gunnery School, Torpedo School, Naval Communications School, Submarine School, Naval Station, Minor Naval Station, Rocal Barracks, Special Landing Party, Civil Engineering Corps, Naval Guard, Naval Defence Corps, Naval Flying Corps, Sailor, Seaman, Civilian in Military, Shipping Technology School, Seaman Training Center, Conscripted Ship, Naval Reserve, Army Shipping HQ., Certification, Proprieter of Vessels
닫기

게시물 심재욱 / 제주대학교 / 아시아태평양전쟁 시기 일본의 조선인 해군 군인 동원과 선원 동원 실태 – 일본 정부 작성 명부자료의 분석을 중심으로 / 2026 인문사회학술연구교수(A유형) / 190,000 / 60개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.

13 - 韩国数字人文协会（KADH）

신아사 / 한국연구재단 / 音譯의 漢化, 漢語의 表音化: 18-20세기 서양 선교사가 편찬한 중국어 성경의 인명 음역어 연구 / 2026 인문사회학술연구교수(A유형) / 190,000 / 60개월

作者Baro

2026年5月11日 22:46

신아사 / 한국연구재단 / 音譯의 漢化, 漢語의 表音化: 18-20세기 서양 선교사가 편찬한 중국어 성경의 인명 음역어 연구 / 2026 인문사회학술연구교수(A유형) / 190,000 / 60개월

접수과제정보
접수번호2026008821
연구요약문
연구목표
(한글 2000자 이내)
중국어 음운사의 연구 대상은 중국어와 외국어 간의 대음(對音), 반절(反切)과 같은 고대 주음법(注音法), 운서(韻書)⋅운도(韻圖), 시(詩)⋅사(詞)⋅곡(曲) 등의 용운(用韻) 자료를 주로 꼽으며, 현대 중국어 방언, 한국⋅일본⋅베트남 한자음 자료 등도 포함한다. 중국어 음운사의 관점에서 볼 때, 중국어는 크게 두 차례의 외래 요소에 의해 큰 변혁을 겪었다. 하나는 불교의 유입이고 다른 하나는 기독교의 전래이다. 불교 불경의 번역 과정에서 인도 음성학의 영향을 받아 운도가 발전하게 되었고, 기독교 성경의 번역 과정에서 서양 음소문자의 영향을 받아 한어병음방안(漢語拼音方案)이 제정되었다. 이러한 배경에서, 본 연구는 근현대 시기 중국에서 활동하던 서양 선교사에 의해 간행된 중국어 성경 번역본에 나타난 음역어 고찰을 목적으로 한다. 연구 대상 및 범위는 18세기부터 20세기 중반까지 중국어 관화 및 방언 신약성경에 나타난 인명 음역어이다. 세부 목표는 선행 연구 검토, 데이터베이스 구축, 음운 대응 관계 분석, 음역어의 어휘⋅음운⋅한자와 번역본⋅번역자⋅사역지 간의 대응 및 영향 관계 고찰, 한어병음방안 제정에 끼친 영향 탐색 총 5가지이다. 본 연구를 통해 언어 접촉의 관점에서 동서양 언어문화를 비교함으로써 언어 보편성과 개별성의 일면을 규명할 수 있으리라 기대한다.
기대효과
(한글 2000자 이내)
첫째, 근현대 시기 중국어 성경 번역본의 음역어 관련 자료를 제공한다. 성경에는 인명이 많이 등장하며, 표준어와 방언별 중국어 성경 번역본이 다양하다. 중국어 성경 번역본과 음역어를 한자본 여부, 문어체 여부, 관화 및 방언, 서양 선교사와 동역자, 활동지역, 시기, 출판사, 원어, 음절 수, 음운 대응 관계, 음역자 등으로 세분하여 목록화함으로써 관련 연구 분야의 연구자들이 활용할 수 있는 기초 자료 제공 측면에서 기대 효과가 크다. 둘째, 데이터베이스 구축으로 객관적이고 과학적인 분석과 학술적인 교류 측면에서 강점이 있다. 번역본과 음역어 관련해 상세한 정보를 데이터베이스로 구축함으로써 음운, 어휘, 한자, 인물, 지역, 방언 등 다각도의 분석 통계가 가능하다. DocuSky(國立臺灣大學), Wuyudian(北京大學) 등에서 제공하는 분석과 시각화 등의 툴(tool)을 활용함으로써 체계적이고 일목요연한 결과를 도출하여 객관성, 엄밀성, 활용성을 제고하며, 온라인과 오프라인에서 상호 교류가 가능하다. 셋째, 중국어 음운사 연구의 대상과 범위의 확장이다. 기존의 연구 대상은 대음(對音), 고대 주음법(注音法), 운서(韻書), 운도(韻圖), 용운(用韻) 등과 관련된 연구의 비중이 높았다. 본 연구는 서양인이 서양 언어학적 지식으로 중국어 표준어와 방언을 해석한 성경 인명 음역어를 고찰한다는 점에서 의의가 있다. 연구 결과 또한 중국어 음운사 연구에 이바지하는 바가 있을 것으로 기대한다. 넷째, 한어병음방안(漢語拼音方案)에 끼친 영향 관계 규명이다. 동서양 간의 언어 접촉의 관점에서 근현대 시기 서양 선교사의 음역어가 가교의 역할을 담당하며 한어병음방안의 자모(字母), 성모(聲母), 운모(韻母), 성조(聲調) 등 음운체계에 끼친 유기적인 연관성을 폭넓게 고찰하며 해석하고 규명한다. 다섯째, 교육적 기대 효과 측면이다. 중국어 음운사 강의 혹은 대중 특강에서 불경 음역어와 대응하여 성경 음역어 관련 연구 결과를 소개할 수 있고, 중국의 문자와 언어를 서양인의 언어학적 관점에서 소화하여 중국 한자와 서양 음소문자 간의 연결고리 역할인 음역어를 교수하며, 학문 후속세대를 양성할 수 있다. 아울러 세계화의 추세에 발맞춰 중국 진출을 고려할 때 기업명, 상품명, 학교명, 기관명 등 중국어 명명[naming]에도 기여할 수 있다. 여섯째, 학술 교류 및 사회적 기여도 측면이다. 중국어사, 번역학, 문헌학, 명명학 등 연구의 외연 확대가 가능하다. 국내 및 국제 학회 발표, 학술 논문 게재, 학술서 출판, 특강을 통해 연구 결과를 확산시킬 계획이며, 중국뿐만 아니라 동아시아와 서양 연구자 및 연구 기관과 소통, 협업을 기대할 수 있다.
중간결과물: 근현대 시기 중국어 신약성경 인명 음역어 데이터베이스
연구요약
(한글 2000자 이내)
본 연구는 중국어 음운사에서 동서 언어 접촉을 연구하는 자료로서 중국어 성경 인명 음역어가 가지는 의의를 고찰한다. 연구 대상 및 범위는 18세기부터 20세기 중반까지 중국어 관화 및 방언 신약성경에 나타난 인명 음역어이다. 문헌 고찰, 디지털화 번역본 확보, 음역어 정보 추출, 데이터베이스 구축, 통계⋅분석⋅고찰, 통계표⋅지리분포도⋅관계도 등 시각화와 해석, 유기적인 영향 관계 규명 순서로 진행한다. 다섯 가지 세부 목표에 따른 연구 내용과 방법은 다음과 같다. 첫째, 문헌 고찰을 통해 선행 연구를 검토하고, 음역어 관련 정보를 번역본, 선교사, 방언, 지역별로 정리하고 분류한다. 둘째, 아카이브, 도서관, 연구기관 등에서 디지털화 데이터를 수집(차후 종이본 수집, 정리 예정), 음역어 정보 추출, 메타데이터(metadata)와 스키마(schema) 설계, 음역어 관련 정보 입력 등의 순서로 데이터베이스를 구축하여 정량적 분석과 정성적 분석의 토대를 마련한다. 중국어 번역본은 한자본과 로마자본으로 구분하고, 한자본은 문어체[深文理], 쉬운 문어체[淺文理], 각종 관화(官話) 및 우어[吳語], 민어[閩語], 간어[贛語], 하카어[客家語], 웨어[粵語] 등으로 세분하고, 개신교 성경을 위주로 하되 천주교 성경 등도 포함한다. 셋째, 내부분석법, 차용언어학 및 대조언어학적 관점에서 음운 대응 관계와 원칙 및 특징을 과학적이고 객관적으로 분석한 후 DocuSky(國立臺灣大學)와 Wuyudian(北京大學) 등에서 제공하는 툴(tool)을 활용해 재분석한다. 넷째, 문헌 자료 검토, 음운⋅어휘⋅한자 대응 및 영황 관계 분석, 서양 선교사와 중국인 동역자의 배경 고찰 등을 통해 음역어와 번역자(人)⋅활동지역(地) 간의 유기적인 연관성을 규명하며, 아울러 중국어사, 번역학, 문헌학, 명명학 등 다양한 관점에서 심도 있게 조명한다. 다섯째, 한어병음방안의 자모(字母), 부호, 성모(聲母)⋅운모(韻母)⋅성조(聲調) 등 음운체계, 주요 쟁점을 중심으로 근현대 시기 서양 선교사의 음역이 끼친 영향을 규명한다. 1단계에서는 선행 연구 검토, 디지털화 번역본 확보 및 분류, 메타데이터와 스키마 설계, 샘플 음역어 100개 입력, 음운⋅어휘⋅한자 등 다각도의 분석과 해석 작업을 진행한다. 2단계에서는 종이본 번역본에서 음역어 정보 추출, 음역어 입력 및 데이터베이스 구축 완료, 통계⋅분석⋅시각화, 고찰과 해석, 관련성 및 영향 관계 규명 작업을 진행한다. 국내외 저명 학술지에 논문 10편 게재, 국내외 학술대회 6회 발표, 온라인 강의 제작, 소속 연구소와 협력하고 관련 학회에 참가하여 연구 성과 확산을 위해 적극적으로 노력하고자 한다.
키워드(Keyword)
(한글 250자 이내)
중국어, 음운사, 언어접촉, 서양 선교사, 성경, 번역본, 한자본, 로마자본, 음역, 관화, 방언, 데이터베이스, 디지털인문학
키워드
(영어 500자 이내)
Chinese language, historical phonology, language contact, Western missionaries, the Bible, translations(translated versions), Chinese-character editions, Romanized editions, transliteration, Mandarin, Chinese dialects, database, digital humanities
닫기

게시물 신아사 / 한국연구재단 / 音譯의 漢化, 漢語의 表音化: 18-20세기 서양 선교사가 편찬한 중국어 성경의 인명 음역어 연구 / 2026 인문사회학술연구교수(A유형) / 190,000 / 60개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.

13 - 韩国数字人文协会（KADH）

남영자 / 한국학중앙연구원 / 모국어 음운 범주와의 음운 중첩을 통해 비모국어 자음 및 모음 쌍 변별에 대한 고찰 / 2026 인문사회학술연구교수(A유형) / 190,000 / 60개월

作者Baro

2026年5月11日 22:42

남영자 / 한국학중앙연구원 / 모국어 음운 범주와의 음운 중첩을 통해 비모국어 자음 및 모음 쌍 변별에 대한 고찰 / 2026 인문사회학술연구교수(A유형) / 190,000 / 60개월

접수과제정보
접수번호2026013565
연구요약문
연구목표
(한글 2000자 이내)
본 연구의 목표는 PAM(Perceptual Assimilation Model)과 그 확장 버전인 PAM-L2(Second language)를 적용하여 한국어와 타이어 음소 쌍에 대한 지각 양상을 고찰하고, 기존 연구의 공백을 메우고 새로운 데이터를 제시하는 것이다. 특히 PAM/PAM-L2의 음운 중첩 개념을 바탕으로 한 확장 가설에 초점을 맞추어, L2 음소 쌍 지각에서 L1 음운 체계와의 중첩 정도에 따른 변별력을 체계적이고 심층적으로 고찰한다. 이를 통해 L2 음소 지각에서 음운 중첩의 역할에 대한 보다 정밀한 해석을 제시하고, 이를 정량적인 중첩 점수 가설과 비교 검증하여 L2 음소 지각에 대한 새로운 통합적 시각을 제시하고자 한다. 또한, 이를 통해 L2 음소 지각 메커니즘과 L2 학습에 따른 지각 공간(perceptual space) 재구성에 대한 이해를 증진시키며, 언어 특수성과 보편성에 대한 유용한 통찰을 제공하고자 한다.
연차별 구체적인 연구 목표는 아래와 같다.
1년차: 중국인 한국어 중·고급 학습자와 한국어 원어민 청자를 대상으로 한국어 파열음 쌍에 대한 지각 연구를 통해 L2 숙련도에 따른 L2 음소 지각 양상을 밝히고, 이를 원어민 청자와 비교 고찰한다. PAM/PAM-L2를 바탕으로 L2 음소가 L1 음운 범주로 동화되는 유형을 밝히고, L1 음운 체계와의 중첩 양상과 변별력을 L2 숙련도와 연관 지어 고찰한다. 또한, 한국어 고급 학습자에서 음운 중첩 현상이 나타나는지, 나타난다면 그것이 변별력에 미치는 영향을 살펴본다. 한국어 원어민 청자의 L1 파열음 쌍 식별 양상과 변별력을 파악하여, 고급 학습자와의 차이를 분석한다. 또한, 중첩 점수 가설을 바탕으로 중첩 점수와 변별력 간 상관관계를 파악하고, PAM/PAM-L2의 확장 가설과 비교 검증한다.
2년차: 중국인 한국어 중·고급 학습자와 한국어 원어민 청자를 대상으로 한국어 모음 쌍에 대한 지각 연구를 통해 1년차와 동일한 연구 목표를 검증한다.
3년차: 중국인 한국어 중·고급 학습자와 한국어 원어민 청자를 대상으로 한국어 파찰음 쌍에 대한 지각 연구를 통해 1~2년차와 동일한 연구 목표를 검증한다.
4년차: 타이어 학습경험이 없는 중국인 초·중·고급 한국어 학습자와 한국어 청자를 대상으로 타이어 파열음 쌍에 대한 지각 연구를 통해, 중국어 청자의 한국어 학습경험이 낯선 언어인 타이어 파열음 쌍 지각에 미치는 영향을 살펴보고, 이를 한국어 청자와 비교 고찰한다. PAM/PAM-L2 모델을 바탕으로 중국어 청자의 타이어 음소 쌍에 대한 동화 유형을 밝히고, PAM/PAM-L2의 확장 가설에 따라 음운 중첩 양상과 변별력 간 관계를 한국어 숙련도에 따라 비교 고찰한다. 또한, 한국어 청자의 타이어 음소 쌍 동화 양상과 변별력을 밝히고, 중국인 한국어 학습자와 비교하여 L2 학습경험과 L1 음운 체계의 영향을 탐구한다. 또한, 중첩 점수 가설을 바탕으로 중첩 점수와 변별력 간 상관관계를 파악하고, PAM/PAM-L2의 확장 가설과 비교 검증한다.
5년차: 일본인 한국어 초·중·고급 학습자를 대상으로 한국어 파열음 쌍에 대한 지각 연구를 통해 1~3년차와 동일한 연구 목표를 검증하고, 학습경험이 없는 타이어 파열음 쌍에 대한 지각 연구를 통해 4년차와 동일한 연구 목표를 검증한다.
기대효과
(한글 2000자 이내)
첫째, 본 연구는 다각적인 언어 간 비교 고찰을 통해 L1 음운 체계에 최적화된 지각 경험이 L2 학습을 통해 어떻게 재구성되는지에 대한 이해를 넓힐 것이다. 특히, L2 학습이 축적됨에 따라 지각 공간의 변화 양상을 체계적으로 밝혀, 성인 청자의 L2 음운 습득 경로를 추적하는 데 유용한 자료를 제공할 것이다. 연구 결과는 L1과 L2 음운 체계 간 지각적 맵핑을 보다 정밀하게 예측할 수 있게 하며, 이를 바탕으로 L2 음운 학습의 효율적인 전략을 제시하는 데 기여할 것이다. 또한, 본 연구는 L1과 L2 음운 목록 간 지각적 맵핑 지도를 구축하는 실험적 자료를 제공하며, 향후 L2 음소 지각 관련 신경생리학적 연구의 기초 자료로도 활용될 수 있을 것으로 기대된다.
둘째, 본 연구는 특정 L2 학습경험이 낯선 언어 음소 지각에 어떻게 반영되는지에 대한 폭넓은 이론적 함의를 제시한다. 이는 L2 학습경험과 L1 음운 체계 간의 상호작용에 대한 새로운 이해를 제공하며, L2 음소 지각 메커니즘에 대한 통합적 통찰을 얻는 데 기여할 것이다. 이를 통해 L2 음소 지각에서 언어의 특수성과 보편성에 대한 이해를 심화시킬 수 있을 것이다.
셋째, 이 연구는 L2 음소 지각에서 L1 및 L2 학습경험의 영향을 중첩 점수를 기반으로 체계적으로 분석하며, L2 음운 체계 확립에 기여하는 정량적 학습 평가 자료를 제공할 것이다. 또한, 한국어 원어민 청자와 L2 학습자의 지각 양상을 비교함으로써 L1의 역할을 보다 심층적으로 분석할 수 있는 기회를 제공하고, 이를 통해 L2 음운 체계 습득에 대한 세밀한 이해를 바탕으로 한 통합적인 데이터를 제공할 수 있을 것으로 기대된다.
넷째, 한국어 학습자를 대상으로 수집된 한국어 음소에 대한 포괄적인 지각 데이터는 한국어 음소 학습에 유용한 자료로 활용될 것이다. 또한, 이 데이터는 L2 학습자의 음소 지각 전략을 이해하고, 효과적인 교육 방법 개발에 기여할 수 있다. 특히, 한국어 교육에서 발음 교육에 비해 상대적으로 적은 관심을 받아온 지각 훈련 분야에서 체계적이고 실용적인 훈련 방법을 제시할 수 있을 것이다. 나아가, 다양한 언어권 학습자를 위한 교재 개발에 중요한 기초 자료로 활용될 것이다.
다섯째, 본 연구는 수집한 데이터를 메타분석적으로 통합하여, PAM/PAM-L2를 포함한 L2 음소 지각 이론에 새로운 방향을 제시하고 이를 보완 및 확장할 것이다. 특히, 중첩 점수 가설과의 통합적 해석을 통해 L2 음소 지각 연구의 이론적 확장을 도모하며, L2 음소 지각에 대한 보다 정교한 이해를 제공할 것이다.
여섯째, 본 연구에서 구축한 지각 데이터는 후속 연구의 중요한 기초 자료가 될 것이다. 후속 연구에서는 확보된 데이터를 기계 학습 모델과 비교 분석하여, 인간의 음소 지각이 AI 기반 음성 인식 시스템에 어떻게 반영될 수 있는지를 탐색할 것이다. 이를 통해 인간-기계 상호작용 연구에 기여하며, 정교한 음성 인식 알고리즘 개발에 중요한 시사점을 제공할 것이다. 또한, 연구 결과는 L2 음소의 교차 언어적 비교 분석과 L2 학습자의 음성 인식 향상에 중요한 기초 자료를 제공하며, L2 음소 인식 교수법 개발 및 다국적 언어 환경에서의 음성 인식 시스템 정확도 향상에 기여할 수 있을 것이다.
연구요약
(한글 2000자 이내)
본 연구는 한국어, 중국어, 일본어 청자를 대상으로 PAM/PAM-L2의 확장 가설뿐만 아니라 중첩 점수 가설을 함께 적용하여, L2 음소 쌍 지각에서 L2 음소가 L1 음운 범주로 동화되는 양상(L2-L1)과 L2 음소 쌍의 변별력 간 관계를 밝히고, 두 가설을 검증하고자 한다.
실험은 모두 동화 실험과 AXB 변별 실험을 진행한다. 다만, 한국어 음소 쌍에 대한 연구를 진행하는 1~3년차 연구에서 한국어 원어민 청자는 식별 실험과 AXB 변별 실험을 수행한다.
연차별 연구 내용 및 주요 목표는 다음과 같다.
1) 1년차
연구 1: 중국인 한국어 중급 학습자의 한국어 파열음 쌍에 대한
지각 양상 고찰
연구 2: 중국인 한국어 고급 학습자와 한국어 원어민 청자를 대상으로 한국어 파열음 쌍에 대한 지각 양상 고찰
두 연구를 통해 L2 음소 지각에서 숙련도에 따른 차이를 분석하고, 고급 학습자와 원어민 청자의 지각 양상을 비교 분석한다.

2) 2년차
연구 1: 중국인 한국어 중급 학습자의 한국어 모음 쌍에 대한 지각 양상 고찰
연구 2: 중국인 한국어 고급 학습자와 한국어 원어민 청자를 대상으로 한국어 모음 쌍에 대한 지각 양상 고찰
두 연구를 통해 L2 음소 지각에서 숙련도에 따른 차이를 분석하고, 고급 학습자와 원어민 청자의 지각 양상을 비교 분석한다.

3) 3~5년차
(가) 3년차: 중국인 한국어 중·고급자와 한국어 원어민 청자를 대상으로 한국어 파찰음 쌍에 대한 지각 양상 고찰
이 연구를 통해 L2 음소 지각에서 숙련도에 따른 차이를 분석하고, 고급 학습자와 원어민 청자의 지각 양상을 비교 분석한다.
(나) 4년차: 중국인 한국어 초·중·고급자와 한국어 청자를 대상으로 타이어 파열음 쌍에 대한 지각 양상 고찰
이 연구를 통해 L1의 영향과 L2 한국어 학습경험이 중국어 청자의 낯선 언어인 타이어 파열음 쌍 지각에 미치는 영향을 한국어 숙련도와 연관 지어 고찰한다.
(다) 5년차: 일본인 한국어 초·중·고급자를 대상으로 한국어 파열음 쌍과 타이어 파열음 쌍에 대한 지각 양상 고찰
이 연구를 통해 L1의 영향과 L2 음소 지각에서 숙련도에 따른 차이를 분석하고, L2 한국어 학습경험이 일본어 청자의 낯선 언어인 타이어 파열음 쌍 지각에 미치는 영향을 한국어 숙련도와 연관 지어 고찰한다.
키워드(Keyword)
(한글 250자 이내)
언어 간 말소리 지각, 지각 동화 모델, 지각 동화 모델-L2, 한국어, 타이어, 파열음, 파찰음, 모음, 음운 중첩, 중첩 점수, 동화 유형, 변별 정확도
키워드
(영어 500자 이내)
Cross-language speech perception, Perceptual Assimilation Model, Perceptual Assimilation Model-L2, Korean, Thai, stops, affricates, vowels, phonological overlap, overlap score, assimilation type, discrimination accuracy
닫기

게시물 남영자 / 한국학중앙연구원 / 모국어 음운 범주와의 음운 중첩을 통해 비모국어 자음 및 모음 쌍 변별에 대한 고찰 / 2026 인문사회학술연구교수(A유형) / 190,000 / 60개월이 KADH / 한국디지털인문학협의회에 처음 등장했습니다.