普通视图

Received today — 2026年6月10日13 - 韩国数字人文协会(KADH)

Humanitext Reader

作者김병준
2026年6月8日 22:37

Humanitext Reader is a multilingual parallel reader for the Greek and Latin classics. It presents the original text alongside translations in four languages (Japanese, English, Chinese, and Korean), sentence by sentence, with dictionary look-ups and notes on grammar and syntax. More than a reading tool, it is a participatory library where readers improve the texts together through discussion and error reports.

https://humanitext.ai/apps/reader

What is Humanitext Reader?

Humanitext Reader is an online library for reading the classics of ancient Greek and Latin. It is built for readers who cannot read the originals directly: the source text and translations in four languages — Japanese, English, Chinese, and Korean — are displayed side by side, one sentence at a time, with notes on syntax and usage. Beyond reading, it is a participatory library that improves its texts through dialogue among readers and through error reports.

One idea runs through everything: to open the classics to everyone.

  • Bringing you closer to the original words. By setting the source text sentence by sentence beside its translations and notes, with a dictionary and morphological analysis a click away, even readers who have never studied Greek or Latin can engage with the originals themselves. AI is a bridge to the source text, not a replacement for it.
  • Every AI-generated part clearly marked. The translations and notes are a developing text — they begin as an AI-generated draft and are revised over time by curators. They are a starting point, not an authority, and reading them alongside the originals and established translations is encouraged.
  • A new entry point to under-translated classics. Especially in Japanese, Chinese, and Korean, parallel translations cover only a small fraction of the canon. Through translations and notes in four languages, Reader opens a door to works long closed off by the language barrier.
  • A participatory community that grows with its readers. Through error reports and cross-language comments, readers refine the texts together in dialogue — tending the very place where the classics are read as a shared good.

Current Scale

The library currently holds 921 works by 93 authors — roughly 1.8 million sentences across all languages, in four display languages. The originals are Greek (grc) and Latin (lat); the display languages are Japanese, English, Chinese, and Korean.

Reading

  • The original and its translation are shown in sentence-by-sentence correspondence. Switch the display language between Japanese, English, Chinese, and Korean from the header.
  • Dictionary pop-ups: click a word for its definition and morphological analysis (word form).
  • Grammar and usage notes: gathered beneath the parallel text via footnote numbers.
  • Alignment highlighting: hover over the translation and the corresponding part of the original lights up. The alignment is generated by AI across the entire text and is not guaranteed to be perfectly accurate — differences in word order and syntax can cause it to drift.

Dialogue (Comments)

  • Comment on any sentence; commenting highlights the corresponding sentence in the original.
  • Your post is translated by AI into all four languages and gathered into a single cross-language thread. Replies and “likes” are supported. Comments are anchored to the source by span overlap, not sentence id.
  • Type tags: each new top-level comment carries one or more content tags (translation / interpretation / context / intertext / grammar / annotation / other). Replies inherit the thread’s tags automatically.
  • Citable permalinks: every comment has its own ID with ”🔗 link” and ”❝ cite” actions, so it can be referenced individually from papers (/read/<urn>?c=<comment_set_id>).
  • Posting requires a Google sign-in and agreement to the data-handling terms.

Error Reports (objective errors in the original only)

  • Click a sentence → ”⚑ Report an error.” Sign-in and consent are required (anonymous reporting has been removed); the report is credited to the reporter’s display name.
  • Reports are routed to a moderator and never auto-applied. Their status (open / in progress / resolved) is shown, and others can lend support with ”♥ same issue.” Adopted fixes are recorded in a public changelog.
  • Reporters are credited for their contribution, with a +10 score when a report is adopted.

Contribution and Community

  • Your profile shows your record (adopted fixes, reports, comments, likes received), plus badges and a score. Score weights: adopted reports/fixes ×10, reports ×1, comments ×2, likes ×1.
  • A cooperative leaderboard (“Community”) and notifications (a bell, toggleable by type) round out the participatory features.

Original-Text Sources and Licensing

The originals are based on canonical TEI corpora such as the Perseus Digital Library and Open Greek and Latin, with the source and original licence (CC BY-SA 3.0 or 4.0) shown on each work page. In keeping with ShareAlike, the original texts on this site are also provided under CC BY-SA 4.0. The translations and notes in each language are AI-generated artifacts, separate from the original text.

Humanitext Reader is a new way into the world of the classics — read together, one sentence at a time, and made better by the community that reads it.

게시물 Humanitext ReaderKADH / 한국디지털인문학협의회에 처음 등장했습니다.

2027학년도 봄학기 KAIST 디지털인문사회과학부 대학원 신입생 모집

作者김병준
2026年6月8日 22:34

2027학년도 봄학기 KAIST 디지털인문사회과학부 대학원 신입생을 모집합니다.
많은 관심과 참여 바랍니다.

*온라인 입시설명회: 2026.06.18(목) 17:00
→ 사전등록 신청: https://bit.ly/4uCXXUF

* 디지털인문사회과학부 입학안내(지원서 작성 및 전형 관련): https://ghss.kaist.ac.kr/pages/sub/sub05_01

게시물 2027학년도 봄학기 KAIST 디지털인문사회과학부 대학원 신입생 모집KADH / 한국디지털인문학협의회에 처음 등장했습니다.

Received before yesterday13 - 韩国数字人文协会(KADH)

『디지털인문학』 3권 1호 발간 안내 (KJDH Vol.3, No.1)

作者김병준
2026年6月8日 18:50

한국디지털인문학협의회가 발행하는 학술지 <디지털인문학>(Korean Journal of Digital Humanities) 제3권 제1호, 2026년 5월호가 AccessON을 통해 공개되었습니다. 이번 호에는 AI 시대의 역사연구와 디지털 문헌학, 조선 의학 지식의 데이터 모델링, 문학·영화 수용 분석, 신문 텍스트 데이터 수집 워크플로, 디지털 인문학 인터뷰 등 총 5편의 글이 수록되었습니다.
원문목록: AccessON KJDH Vol.3 No.1

<디지털인문학> 3권 1호 논문 목록

  1. AI시대의 역사연구와 ‘디지털 문헌학’ — 도구와 질문은 어떻게 만나는가
    저자: 허수
    수록: <디지털인문학> 3(1), 2026, pp.1-20
    DOI: 10.23287/KJDH.2026.3.1.1
    내용: 저자의 잡지 <개벽> 연구 과정을 세 단계로 되짚으며, 수작업 분석, 토픽모델링·네트워크 분석, LLM과 지식그래프 활용이 역사연구의 질문과 방법을 어떻게 바꾸어 왔는지 논의한다. 전통 문헌학의 계보 추적과 전승 연구를 디지털 기술과 AI로 확장하는 방법론으로서 ‘디지털 문헌학’을 제안한다.
  2. 조선 의학 병문(病門)의 판단 구조 데이터 모델링 연구: 의방유취·동의보감·인제지·역시만필 3축+1 체계를 중심으로
    저자: 전종욱, 유인태
    수록: <디지털인문학> 3(1), 2026, pp.21-66
    DOI: 10.23287/KJDH.2026.3.1.2
    내용: 조선 의학 문헌 속 진단 알고리즘을 복원하기 위한 연구데이터 모델을 제시한다. <의방유취>, <동의보감>, <인제지>와 <역시만필>을 ‘3축+1’ 체계로 삼아 30개 병문의 판단 구조를 층위화하고, 데이터온 등록 데이터와 네트워크 관계를 바탕으로 지식그래프와 AI 연계 가능성을 탐색한다.
  3. Evolving Patriarchy: Two Different Mr. Bennets in Pride and Prejudice (1813) and Pride and Prejudice (2005)
    저자: 박예슬
    수록: <디지털인문학> 3(1), 2026, pp.67-84
    DOI: 10.23287/KJDH.2026.3.1.3
    내용: 제인 오스틴의 <오만과 편견> 원작과 조 라이트의 2005년 영화 각색에서 Mr. Bennet이 어떻게 다르게 재현되는지 분석한다. 한국어 영화 리뷰 3,527건, 도서 리뷰 639건과 IMDb 리뷰를 비교해, 부권적 신화가 문화권별 수용 속에서 어떻게 작동하는지 검토한다.
  4. 중국 상하이도서관 《申報》 텍스트 데이터와 그 수집 및 전처리 절차
    저자: 배건준
    수록: <디지털인문학> 3(1), 2026, pp.85-112
    DOI: 10.23287/KJDH.2026.3.1.4
    내용: 상하이도서관 <신보> 데이터베이스에서 텍스트 데이터를 수집하고 전처리하는 워크플로를 소개한다. AI 코딩 에이전트와 연구자가 함께 요구사항, 오류, 코드 수정을 반복하는 Human-in-the-Loop 방식으로 스크립트를 개발했으며, 관련 프롬프트·코드·샘플 데이터를 GitHub에 공개했다.
  5. 디지털 인문학에 관한 테드 언더우드 교수와의 인터뷰
    영문 제목: An Interview with Professor Ted Underwood on Digital Humanities
    저자/인터뷰이: Ted Underwood
    수록: <디지털인문학> 3(1), 2026, pp.113-132
    DOI: 10.23287/KJDH.2026.3.1.5
    내용: 디지털 인문학, 문학 연구, 계산적 방법론, 인공지능 시대의 인문학 연구 방향을 둘러싼 테드 언더우드 교수와의 인터뷰이다. 이번 호의 연구논문들과 함께 AI 이후 디지털 인문학의 방법론적 전환을 생각하게 하는 글이다.

The Korean Association for Digital Humanities is pleased to announce the publication of Korean Journal of Digital Humanities, Vol. 3, No. 1, May 2026. This issue features five contributions on AI-era historical research, digital philology, data modeling for Joseon medical texts, computational reception analysis, text-data collection workflows, and an interview on digital humanities.

  1. Historical Research in the AI Era and “Digital Philology”: How Tools and Questions Meet
    Author: Soo Hur
    Korean Journal of Digital Humanities, 3(1), 2026, pp.1-20
    DOI: 10.23287/KJDH.2026.3.1.1
  2. Modeling Diagnostic Algorithms in Joseon Medicine: Designing Research Data Modules for 30 Byeongmun (病門) through a Three-Axis-Plus-One Textual Framework
    Authors: Jongwook Jeon, Intae Ryu
    Korean Journal of Digital Humanities, 3(1), 2026, pp.21-66
    DOI: 10.23287/KJDH.2026.3.1.2
  3. Evolving Patriarchy: Two Different Mr. Bennets in Pride and Prejudice (1813) and Pride and Prejudice (2005)
    Author: Yeseul Park
    Korean Journal of Digital Humanities, 3(1), 2026, pp.67-84
    DOI: 10.23287/KJDH.2026.3.1.3
  4. Text data from the Shanghai Library Shun Pao database and the workflow for collecting and preprocessing
    Author: Geonjoon Bae
    Korean Journal of Digital Humanities, 3(1), 2026, pp.85-112
    DOI: 10.23287/KJDH.2026.3.1.4
  5. An Interview with Professor Ted Underwood on Digital Humanities
    Interviewee/Author: Ted Underwood
    Korean Journal of Digital Humanities, 3(1), 2026, pp.113-132
    DOI: 10.23287/KJDH.2026.3.1.5

All articles are available open access through AccessON: https://accesson.kr/kjdh/v.3/1/2026

게시물 『디지털인문학』 3권 1호 발간 안내 (KJDH Vol.3, No.1)KADH / 한국디지털인문학협의회에 처음 등장했습니다.

한국어 역사 말뭉치 DB, ‘ᄎᆞ자쎠’

作者Baro
2026年6月3日 01:07

https://find.xn--gt1b.xyz/search

한국어 역사 말뭉치 DB, ‘ᄎᆞ자쎠’에 오신 것을 환영합니다!

중세 한국어와 근대 한국어, 석독구결을 포함한 텍스트 약 1,000개를 망라한 말뭉치를 검색해보세요.

게시물 한국어 역사 말뭉치 DB, ‘ᄎᆞ자쎠’KADH / 한국디지털인문학협의회에 처음 등장했습니다.

[특강] 중국어교육학회 하계방학 AI 역량 집중 프로그램 2026 @한국중국어교육학회 2026.06.27.-28.

作者Baro
2026年6月2日 19:40

한국중국어교육학회 회원 여러분께

안녕하십니까, 회원 여러분.

항상 한국중국어교육학회에 보내주시는 관심과 성원에 감사드리며, 회원 여러분의 건강과 학문적 발전을 진심으로 기원합니다. 한국중국어교육학회에서는 중국어 교수자의 전문성 강화와 AI 활용 역량 제고를 지원하고자 『2026년 여름방학 특강』을 마련하였습니다.

[특강 개요]

■ 프로그램 안내 링크 : 중국어교육학회 하계방학 AI 역량 집중 프로그램 2026

https://aicourse.up.railway.app/index.html​

■ 프로그램명 : AI 역량 집중 프로그램 – 중국어 교육의 미래를 설계하다

■ 일시 : 2026년 6월 27일(토)~28일(일), 오전 10시~오후 5시

■ 대상 : 한국중국어교육학회 2026 연회비 납부한 회원 혹은 평생회원(선착순 30명)

■ 회원 가입 및 연회비 납부 안내

회원 가입 : https://kacle.jams.or.kr/co/main/jmMain.kci

연회비 : 3만 원

평생회비 : 30만 원(평생회비 납부 회원은 연회비 납부 면제)

입금 계좌 : 토스뱅크 1001-6993-9125 (예금주: 구현아)

※ 입금 시 입금자명을 “홍길동 연회비” 형식으로 기재해 주시기 바랍니다.

■ 수업 방식 : Zoom을 활용한 온라인 실시간 강의

※ 접속 주소는 참가 신청자에 한해 추후 안내 예정

이번 특강은 한국외국어대학교 박정원 교수님을 모시고 「AI 역량 집중 프로그램 – 중국어 교육의 미래를 설계하다」를 주제로 진행됩니다. 2026년 6월 27일(토)과 28일(일) 양일간 운영되며, 급변하는 교육 환경 속에서 중국어 교육의 새로운 방향을 모색하고 교수 역량을 한층 높일 수 있는 뜻깊은 시간이 될 것으로 기대합니다.

특강은 Zoom을 활용한 온라인 방식으로 진행되오니, 여름방학 기간 중에도 회원 여러분의 많은 관심과 적극적인 참여를 부탁드립니다.

[신청 안내]

■ 신청 기간 : 2026년 6월 4일(목) ~ 10일(수)

■ 신청 방법 : 첨부된 참가신청서를 작성하여 chinedu@hanmail.net으로 제출

  • 바로: 참가를 원하시는 분은 참가 신청서 양식을 위 메일로 직접 요청해주시기 바랍니다.

기타 문의사항은 chinedu@hanmail.net으로 연락해 주시면 성심껏 안내해 드리겠습니다.

회원 여러분의 건강과 학문적 성취를 기원하며, 이번 특강에서 뜻깊은 배움과 교류의 시간을 함께 나누기를 기대합니다.

감사합니다.

한국중국어교육학회 드림

게시물 [특강] 중국어교육학회 하계방학 AI 역량 집중 프로그램 2026 @한국중국어교육학회 2026.06.27.-28.KADH / 한국디지털인문학협의회에 처음 등장했습니다.

[학술대회] AI시대 고전번역과 교육 @한국고전번역학회 2026.06.26.

作者Baro
2026年6月1日 10:03

한국고전번역학회 회원 여러분께안녕하십니까? 한국고전번역학회입니다.

오는 6월 26일(금) 한국고전번역학회와 한국고전번역원이 공동 주최하는 제34회 기획학술대회가 열립니다.

▪ 일시 : 2026 6 26(13:00~18:00

▪ 장소 : 한국고전번역원 대강당(지하 1층)

▪ 기획주제 : AI시대 고전번역과 교육

행사의 세부 일정은 다음과 같습니다.

학술대회와 관련하여 궁금하신 점은 본 메일 혹은 아래의 번호로 언제든 연락주시기 바랍니다.

총무이사 이남면 : 010-9193-8252

총무간사 송주영 : 010-9427-2112

회원 여러분의 많은 관심과 참여를 부탁드립니다.

감사합니다.

한국고전번역학회 배상.

게시물 [학술대회] AI시대 고전번역과 교육 @한국고전번역학회 2026.06.26.KADH / 한국디지털인문학협의회에 처음 등장했습니다.

2026 디지털인문학 여름교실 워크숍

作者김병준
2026年5月31日 16:47

한국학중앙연구원 디지털인문학연구소에서 2026년 8월 19일(수)부터 20일(목)까지 이틀간 개최하는 ‘2026 디지털인문학 여름교실’ 워크숍 공지입니다. 관심 있는 분들의 많은 참여를 바랍니다.

자세한 사항은 아래 링크 참고
https://digitalhumanities.kr/2026/05/21/summer-school.html


📌 행사 개요

  • 행사명: 2026 디지털인문학 여름교실
  • 일시: 2026년 8월 19일 (수) ~ 8월 20일 (목)
  • 장소: 한국학중앙연구원 문형관 지하 107호
  • 신청 기간: 2026년 6월 1일 (월) ~ 6월 26일 (금) 오후 7시
  • 선정 안내: 2026년 7월 1일 (수)
  • 수강료: 50,000원 (7월 1일 수강선정 안내를 받으신 후 입금해 주시면 됩니다.)

📝 참가 신청 안내

본 워크숍의 수강 신청은 아래의 구글 폼(Google Forms)을 통해서만 접수를 받습니다.

https://docs.google.com/forms/d/e/1FAIpQLSdY3VyxHv01fvek0UoI9Fatl1HXaHy3P0yaGbBWuZfFnWFELg/viewform?usp=header

⏳ 향후 주요 일정

  • 수강 선정 및 수강료 입금 안내: 2026년 7월 1일 (수) 대상자에게 개별 문자 및 메일 발송
  • 참가 최종 확정 안내: 2026년 7월 3일 (금) 개인 연락처 및 이메일로 최종 전달

게시물 2026 디지털인문학 여름교실 워크숍KADH / 한국디지털인문학협의회에 처음 등장했습니다.

[CFP] Artificial Intelligence and Digital Humanities Pedagogy (DHQ)

作者김병준
2026年5月28日 20:49

Artificial Intelligence and Digital Humanities Pedagogy

Guest editors: Amanda Licastro, Ben Lee, Julia Flanders, Vanesa Cañete Jurado, Nirmala Menon, John Walsh, Haining Wang, Joel Lee, Doreen Chen

Abstracts due: August 1, 2026

Digital Humanities Quarterly invites abstracts for a special issue devoted to the topic of artificial intelligence (AI) in relation to digital humanities pedagogy. Though AI-based approaches to the digital humanities have been a part of the field for decades, recent years have seen an explosion of methodologies utilizing AI, and of critical discussion concerning the implications for digital humanities pedagogy. Abstracts are due August 1, 2026 to editors@digitalhumanities.org. Please use the subject header: “DHQ AI Pedagogy Special Issue.”

We are interested in a wide-ranging view of AI in the digital humanities pedagogical context, including:

  • Critical perspectives on teaching (and teaching with) AI in a digital humanities context, including ethical, political, and cultural critiques.
  • Critical examinations of AI systems themselves, from the perspective of digital humanities pedagogical methods and critical frameworks.
  • Responsible and transparent AI practices and frameworks in DH pedagogical contexts
  • Specific use cases that open the door for new DH-relevant teaching possibilities. This can include the evaluation, adoption, contextualization, resistance, and refusal of AI tools for teaching purposes.
  • Case studies addressing specific sites and scenarios for digital humanities pedagogy (including those that go beyond formal classroom settings), grounded in theory and prior work, and in replicable, scalable data and practices.
  • Examinations of the impact of AI on digital humanities pedagogical methods focused specifically on building/making.
  • Examination of issues of assessment, labor, and motivation in relation to AI integration in the digital humanities classroom.

Submissions should meet the following requirements:

  1. The submission must have a direct connection to the digital humanities.
  2. The submission should focus on pedagogy.
  3. The submission must be human-authored. AI may be used for grammar and spell-checking within the writing process, and for machine translation. Authors should include a statement describing the use of any AI tools.
  4. We are particularly interested in articles that will have continued value for readers over time, rather than those focused on specific technologies that may quickly become dated.

We ask that prospective authors submit 500-word abstracts for review by August 1, 2026. Authors will be notified in November 2026 and invited to submit full papers by March 2027, which will be peer reviewed. A full timeline will be provided to authors upon the invitation to contribute a full paper.

For questions related to this call, please contact the DHQ editors at: editors@digitalhumanities.org. Please use the subject header: “DHQ AI Pedagogy Special Issue.”

Past CFPs can be found in our CFP archive.

https://dhq.digitalhumanities.org/submissions/cfps.html

게시물 [CFP] Artificial Intelligence and Digital Humanities Pedagogy (DHQ)KADH / 한국디지털인문학협의회에 처음 등장했습니다.

[학술대회] 경계를 넘어: AI와 인문학

作者김병준
2026年5月26日 22:09

일시 : 2026.06.04 – 05

장소 : 경북대 인문한국진흥관 학술회의실

기조강연

  1. AI는 인문학이다: 인공지능, 오늘은 기술의 영역이지만 내일은 인문학의 연구 과제이다 (이찬규, 중앙대)
  2. Grammares of Knowledge: Meaning and Style in the Agae of AI (Mark Algee-Hewitt, Stanford University)

게시물 [학술대회] 경계를 넘어: AI와 인문학KADH / 한국디지털인문학협의회에 처음 등장했습니다.

2026년 인문사회 대학기초연구소지원 사업 선정대학(경북대, 전남대, 전북대) 주요 계획

作者Baro
2026年5月21日 00:07

https://www.moe.go.kr/boardCnts/viewRenew.do?boardID=294&boardSeq=106221&lev=0&searchType=null&statusYN=W&page=1&s=moe&m=020402&opType=N

□ 사업 개요

(사업명) 인문사회 대학기초연구소지원 사업

(추진근거) 「고등교육법」제7조, 「학술진흥법」제5조 등

(사업목적) 거점국립대학의 기초학문 보호 역할 등을 고려하여, 지역 내 연구 거점 기반 마련 및 신진 연구인력 양성, 기초·융복합 연구소 육성

(지원대상) 지역 거점국립대학

(지원내용) 대학 내 지역 ‘인문사회 연구원을 설립하여, 연구소 관리체계 구축, 학문후속세대 양성, 지역대학 등과 공동연구 수행

(지원기간) 총 5년(3+2년)

(지원예산/규모) ’26년 총 120억 원 / 총 3개교

– 교당 연간 40억 원 이내(간접비 포함) ※ 대학에 총액으로 교부

□ 주요 추진 내용

(인문사회 연구원 설립·운영) 대학의 자율적 인문사회 분야 연구소 관리·지원 체계 확립 및 지역 내 학술 연구플랫폼 기능 수행

※ ▴연구소의 개편․조정(확대, 통합, 신설 등), ▴현황 조사․공개, ▴연구소 운영 실적 평가 및 운영 지원, ▴지역 내 공동연구 및 협력 확대 등

(지역 정주형 연구 인력 양성) 인문사회 연구원을 통한 안정적인 연구 환경 제공과 연구 지원 강화 등으로 우수 연구 인력 유입 및 양성

※ 전임교원의 연구 몰입 및 성과 창출을 위한 다앙한 학내 제도·방안 마련, 인문사회 연구원당 20명~30명(초과 가능)의 학술연구교수 채용 및 활용 의무를 통해 지역 일자리 확보·지원

(기초·융복합 연구 강화) 연구원 산하 연구소의 기초·융복합(중점 주제) 연구 지원을 통한 기초학문 보호·육성 및 연구 성과의 사회적 기여 강화

※ 대학별 특성화 연구를 수행하기 위한 ‘중점 주제 연구소’를 자율적으로 지정(2개 이내)하고, 연구 인력(지역 내 타 대학 인력 포함하여 지역 공동연구 수행) 및 연구비 지원(사업비 20% 이상)

게시물 2026년 인문사회 대학기초연구소지원 사업 선정대학(경북대, 전남대, 전북대) 주요 계획KADH / 한국디지털인문학협의회에 처음 등장했습니다.

[특강] 스칼라 읽기: Interpreting Quantitative Evidence with Critical Meaning (Mark Algee-Hewitt)

作者김병준
2026年5月15日 16:37

인하-KADH 디지털인문학·AI융합연구 석학 특강

강연자 : Mark Algee-Hewitt (스탠퍼드 리터러리 랩)

“스칼라 읽기: Interpreting Quantitative Evidence with Critical Meaning”

일시 : 2026년 6월 1일 오후 4-6시

장소 : 인하대 60주년 기념관 112호 Creative Space

공동주최 : 인하대 인문AI융합연구소/디지털인문학연구센터/한국학연구소, 한국디지털인문학협의회

문의 : 윤미선 교수(msy207@inha.ac.kr)

참가신청:

https://docs.google.com/forms/d/e/1FAIpQLSemL37nXjEJelOiYTeCfYTzTbD_qxescRoPAozw2_kZ-k-l6g/viewform

ZOOM
https://inha-ac-kr.zoom.us/j/85264681657?pwd=jSWNqkP2HUyL1o2sYQ31tvBw4NHQZD.1

회의 ID: 852 6468 1657
암호: 958578

게시물 [특강] 스칼라 읽기: Interpreting Quantitative Evidence with Critical Meaning (Mark Algee-Hewitt)KADH / 한국디지털인문학협의회에 처음 등장했습니다.

김민정 / 서울대학교 / 생성형 AI 시대의 시가장(詩歌場) 재편 – 샤오빙(小冰), DeepSeek를 중심으로 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월

作者Baro
2026年5月14日 23:07

연구요약문
연구목표
(한글 2000자 이내)
시 창작에서 DeepSeek는 중국 시학(詩學) 코퍼스를 기반으로, 사용자의 지시에 따라 시를 생성하는 창작기제를 무상으로 제공하는 중이다. 이 시스템은 대규모 언어 데이터에 포함된 지역 세대 성별 감정 언어와 어휘 습관을 학습함으로써, 중국 고전시로부터 현당대시에 이르는 다양한 시 양식을 모방해낸다. 나아가 DeepSeek를 비롯한 생성형 AI의 다중모달(multimodal) 기술은 사용자가 제시하는 감각적 정서적 정보와 기계의 연산 판단을 결합시키는 ‘상호작용적 창작(interactive co-creation)’의 조건을 갖추게 되었다.
본 연구는 인간의 전유물로 여겨져 왔던 문학이 AI의 등장으로 ‘인간문학’과 ‘AI문학’으로 분화되어 가는 현실 상황에 주목한다. 인간이 수 천 년에 걸쳐 축적해 온 문학 경험을 AI가 학습하여 생성한 시를 예술로 규정할 수 있는지, 그리고 그것의 예술적 성과는 어떤 기준으로 평가해야 하는지 등을 본격적으로 논의해야 하는 지금이야말로 ‘인간문학’과 ‘AI문학’이 분리되기 이전의 과도기적인 협업 단계라고 보기 때문이다.
중국의 AI 시 창작은 2014년 마이크로소프트 아시아연구소(Microsoft Research Asia)가 개발한 ‘샤오빙(小冰)’으로 말미암는다. 2017년, 마이크로소프트는 샤오빙의 시를 모아 첫 시집 《햇살은 유리창을 잃고(陽光失了玻璃窗)》(이하 《햇살》)을 출간하게 된다. 《햇살》은 샤오빙이 1920년대 이후에 발표된 519명의 중국 현대시 작품을 학습한 뒤 감정 서사와 시적 이미지를 결합해 산출한 결과물로서 작품의 문법적 오류와 의미의 연쇄 논리적 연결의 불완정성 등이 한계로 지적되었다. 일각에서는 이 한계를 샤오빙을 설계한 엔지니어들이 학습 대상인 신시(新詩)의 미학적 특성을 충분히 이해 모델링하지 못한 데서 발생한 알고리즘 설계의 문제로 인식하기도 한다.
이러한 한계는 DeepSeek 이후 일정 부분 보완되는 양상을 보이기도 한다. 훠준밍은 샤오빙을 비롯한 초기 시 생성 AI가 작품 수준이 높지 않아 비판을 받았던 데 비해, DeepSeek는 시 모방 능력과 비평 능력, 그리고 알고리즘 수준 등이 높아서 인간 시 창작의 주요 특징들을 정교하게 인식 구현한다고 주장한다. 반면 시인 위졘(于坚)처럼 AI의 본질은 데이터 분석과 재조합에 있으므로 기존 텍스트를 모방 재배열하는 산출을 진정한 의미의 시 창조로 볼 수 없으며, 그런 의미에서 “딥시크는 시인이 아니라 지식인일 뿐”이라고 규정하는 입장도 있다. 그럼에도 평가의 다양한 갈래 모두는 새로운 도구의 출현이 시가장에 구조의 변화를 유발하고 있음을 긍정하는 바다.
본 연구는 샤오빙과 DeepSeek를 중심으로 AI 시 창작과 비평, 그리고 인간-AI 협업이 중국 시가장에 어떠한 변화를 가져오고 있는지를 분석하고자 한다. 이를 위하여 첫째, 중국 AI 시 창작의 출현과 발전 과정을 정리한다. 둘째, DeepSeek를 비롯한 생성형 AI의 시 생성 메커니즘과 그 시학 특징을 분석한다. 셋째, ‘협업’ 단계의 도래가 창작 주체의 개념, 비평 기준, 문학 권위의 구조, 그리고 작품 판별 및 검증의 장치를 어떻게 재편하는지 살펴본다. 그럼으로써 AI 시대 중국 시의 새로운 창작 질서와 시학 협업의 가능성을 전망하고자 한다.
기대효과
(한글 2000자 이내)
첫째, 본 연구는 AI 창작을 둘러싼 논의를 AI 시의 의의와 문학장 구조 분석의 대상으로 전환시키는 데 기여한다. 샤오빙과 DeepSeek의 사례를 통해 AI가 시의 창작 방식, 비평 주체, 문학 권위의 구조를 재편하는 실질적인 역할을 하고 있음을 입증함으로써 AI 시 연구의 기초를 마련한다.
둘째, 이미지 기반 생성에서 대규모 언어모델 기반 생성으로 이어지는 AI 시 창작 메커니즘과 그 변화를 분석함으로써 AI 시의 특징과 한계를 구명한다. 이를 통해 기존 연구가 주로 지적한 문법 오류나 의미 공백을 신시(新詩) 미학과 알고리즘 설계 사이의 긴장 관계로 재해석할 수 있는 분석의 틀을 마련한다.
셋째, DeepSeek가 시 생성과 함께 시인 선정, 작품 평가, 비평 담론의 생산 등을 수행하고 있는 점에 주목함으로써 AI가 문학장의 비평 주체로 진입하는 현상을 확인한다. 이는 시 창작과 비평을 분리해 온 기존 문학 연구의 관점을 재검토하게 하고, 인간 비평가의 역할 변화와 새로운 협업 모델에 대한 논의의 출발점이 될 것이다.
연구요약
(한글 2000자 이내)
본 연구는 샤오빙과 DeepSeek를 중심으로 AI 시 창작과 비평, 그리고 인간-AI 협업이 중국 시가장에 어떠한 변화를 가져오고 있는지를 분석하고자 한다. 이를 위하여 첫째, 중국 AI 시 창작의 출현과 발전 과정을 정리한다. 둘째, DeepSeek를 비롯한 생성형 AI의 시 생성 메커니즘과 그 시학 특징을 분석한다. 셋째, ‘협업’ 단계의 도래가 창작 주체의 개념, 비평 기준, 문학 권위의 구조, 그리고 작품 판별 및 검증의 장치를 어떻게 재편하는지 살펴본다. 그럼으로써 AI 시대 중국 시의 새로운 창작 질서와 시학 협업의 가능성을 전망하고자 한다.

가. 샤오빙 시의 특징과 언어 결합 양상(샤오빙)
마이크로소프트 아시아연구소는 2017년 《햇살》을 간행한 데 이어, 2019년에는 두 번째 시집 《꽃은 푸른물의 침묵(華是綠水的沈默)》(이후 《꽃은》)을 출판하였다. 《꽃은》은 샤오빙이 이미지를 인식해 생성한 시 초안을 바탕으로 아마추어 시인이 이를 수정 보완한 6천여 편의 응모작 중에서 200편을 선별해 엮은 시집으로, ‘인간-AI’ 협업이라는 창작 방식을 실현한 사례라 할 수 있다. 샤오빙의 시는 인간 언어 형식을 모방하려는 지향을 보인다. 하지만 실제 수행 과정에서는 불완전한 언어 결합 양상을 드러내기도 한다. 현대 중국어의 어법 규범에 부합하지 않을 뿐 아니라, 이미지 간의 연상과 서술 논리를 단절시키는 경우가 다수 발견된다. 이러한 언어적 결함은 샤오빙의 이미지 기반 시 생성 방식과 연관되어 있다. 예를 들어, ‘가을비 속 낙엽’이 담긴 이미지를 입력하면, 시스템은 그 안의 ‘나뭇잎’, ‘빗방울’, ‘시들고 노란색’ 등 시각적 요소를 자동으로 추출하고, 이를 의미 단위로 변환하여 시 생성 모듈에 전달한다. 시 생성 단계에서는 ‘나뭇잎’이 ‘시든 덩굴’, ‘늙은 나무’, ‘졸린 까마귀’로, ‘빗방울’은 ‘폭우로’, ‘시들고 노란색’은 ‘외로움’ 혹은 ‘고독’ 등 어휘로 치환되어 다양한 조합을 생성하게 된다. 이러한 결함은 시 장르의 특수성 속에서 정서의 그럴듯함으로 해석되기도 한다. 샤오빙의 시는 개별 문장의 완결성이나 논리성에서는 한계를 보이지만, 감정 서사에 강하여 독자에게 일정 수준의 정서적 설득력을 제공하기 때문이다.

나. 대규모 언어모델 기반 시 생성과 비판(DeepSeek)
DeepSeek 시의 특징은 다음과 같다. 첫째, 즉시 생성이다. 사용자가 입력을 주는 즉시, AI는 사전에 학습된 언어⦁이미지 패턴을 기반으로 시를 산출해 낸다. 시의 즉시 생성은 창작 과정에서 ‘시간’이 차지하는 의미를 근본적으로 변화시킨다. 이는 장기간의 학습과 해석 과정을 필요로 하는 작업이다. 반면에 AI는 이러한 과정을 생략하고 이미 학습된 대규모 언어모델을 통하여 시간이 압축된 창작을 수행하게 된다. 창작 행위가 더 이상 ‘시간의 예술’이 아니라, ‘지시’와 ‘응답’의 즉각적인 상호작용으로 전환하는 것이다. 둘째, 반복 학습의 가능성이다. 기존의 데이터가 충분히 학습되어 있지 않은 경우에도 사용자가 주제나 형식을 반복적으로 제시하고 그 결과물에 피드백을 제공하면, AI는 이를 반영하여 정제된 결과를 산출하게 된다. 생성형 AI의 시 쓰기는 결과물의 산출에 그치지 않고, 이용자의 지시와 피드백을 계속 반영하면서 시의 질적 수준을 높여가는 창작 과정을 보여주기도 한다. AI의 즉시성과 반복 학습이 질 높은 시 창작에 기여하기 위해서는, 그것의 계속적인 생성 가능성이 이용자 자신의 문학적 기준과 미적 판단에 의지해야만 한다.
그런 의미에서 현시점의 인간-AI 관계는 ‘활용’ 단계로부터 ‘협업’ 단계로 전환중이다. 사용자는 AI 산출 결과에 피드백을 제공하고 수정과 재생성을 반복함으로써 자신의 미적 목적을 향해 나아간다. 이 과정은 인간과 AI가 상호 응답을 거듭하며 작품을 함께 창작해 가는 과정이기 때문에 양자 간의 대화는 질의응답에 머무는 것이 아니라 인간의 창의적 의도와 기계의 계산이 결합된 ‘공동 구성(co-construction)’의 실현이 될 수밖에 없다.
키워드(Keyword)
(한글 250자 이내)
AI, 중국 시, 샤오빙(小冰), DeepSeek, 인간문학, AI문학, 협업, 창작, 비평
키워드
(영어 500자 이내)
AI, Chinese Poetry, XiaoIce, DeepSeek, Human Literature, AI Literature, Collaboration, Creation, Criticism

게시물 김민정 / 서울대학교 / 생성형 AI 시대의 시가장(詩歌場) 재편 – 샤오빙(小冰), DeepSeek를 중심으로 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월KADH / 한국디지털인문학협의회에 처음 등장했습니다.

이다연 / 한국연구재단 / 중국 고전시 비평 언어에 대한 AI 학습 방법론 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월

作者Baro
2026年5月14日 23:05

연구요약문
연구목표
(한글 2000자 이내)
본 연구는 대규모 언어모델(LLM)에게 詩話 지식과 비평문(평어) 데이터를 학습시켜 고전시 비평 언어를 가르치는 방법론을 제시한다. 시화는 시론부터 시인에 대한 평가 등 시와 시인에 대한 정보들을 가지고 있는 문헌이며, 시 비평문은 함축적인 비평어로 작성되어 있어 전문 연구자도 이해하는 데 많은 시간과 노력이 필요한 자료지만, 이는 모두 고전시를 이해하는 데 직접적으로 도움이 되는 정보다. 그러나 현대인들이 이러한 문헌들을 모두 읽는 것이 사실상 불가능하고, 현대 언어를 주로 학습한 LLM을 도움을 받더라도 LLM은 이러한 정보 없이 시를 해석하기 때문에 시를 이해하는 데 어려움을 겪는다.
이를 해결하기 위하여 본 연구는 시화 데이터와 비평문 데이터를 언어모델에 학습시켜 고대 비평 언어를 내재화시켜 고대 비평가의 관점에 보다 가까이 접근하는 방법을 제시한다. 이를 통해 시화 지식이 고전시를 이해하는 데 얼마나 도움이 되는지를 검증하고 비평문이 없는 시 작품에 대하여 비평문을 생성하여 시 감상에 이해를 돕는다.
본 연구는 AI 시대에 고전문학 분야의 구체적인 문제를 기술로 해결하는 방법을 제시한다. 이는 향후 고전시 학습을 위한 AI 보조 도구를 개발하는 데 기반이 되는 연구로서 고전시에 대한 진입장벽을 낮추고 인문학과 AI 기술의 융합 연구의 모범 사례가 될 것이다.
기대효과
(한글 2000자 이내)
(1) 학제 간 협업 촉진
본 연구와 같이 고전시 지식과 AI 기술을 융합한 연구의 성과를 인공지능 관련 분야의 학회에서 발표하게 된다면, 공학 연구자들까지 고전시를 잠재력 있는 연구 분야로 인식하고 학제 간 협업이 활성화될 수 있다. 나아가 기술 분야에서도 고전시 연구자가 자연스럽게 양성되어 연구자가 부족한 현실적인 문제까지 해결할 수 있다.
(2) 기술 방법론의 확장 및 후속 연구 촉발
본 연구는 고대 중국시 비평에 한정하였으나 서양의 작품에도 적용 가능하다. 현대어로 쓰인 문학 작품이라면 LLM의 정교한 임베딩을 활용하여 더 고품질의 결과를 얻을 수 있을 것이다. 본 연구를 재현 가능하도록 만들기 위해 깃허브에 코드를 공개할 예정이므로 다른 연구자들이 이를 자신의 연구에 사용할 수 있다.
(3) 교육 현장 및 인문학 시장에서 선도
본 연구는 현재 기술의 수준을 파악하고 인문학자들의 판단이 필요한 지점을 고찰하여 AI 시대에 인문학을 어떻게 교육하고 학습해야 하는지 논의의 토대를 세운다. 연구 종료 후에는 훈련된 AI 모델을 대학이나 일반인 교육 기관에서도 교육 보조 도구로 사용할 수 있다. 이를 통해 개인 학습자들도 시 감상에 도움을 받아 고전시의 진입장벽이 낮아지는 효과를 거둘 수 있다.
연구요약
(한글 2000자 이내)
(1) 데이터셋 수집 및 전처리
비평문 데이터는 각 시인의 서적에서 직접 추출한다. 詩話 데이터는 중국 고전시 전문 디지털 아카이브인 搜韻에서 제공하는 총 93종을 사용한다. 시–비평문 데이터는 비평문이 함께 수록된 출판물을 대상으로 수집하며, 당송대 주요 시인의 작품 가운데 비평이 확인되는 작품 3,000편을 확보하는 것을 목표로 한다.
(2) 데이터 탐색적 분석(EDA)
전처리를 통해 정제된 비평문 데이터 및 시화 데이터에 대하여 전통적인 텍스트 마이닝 기법을 활용하여 탐색적 분석을 수행한다. 자주 등장하는 비평 용어를 추출하고, 연구자의 검토를 거친다. 추출된 비평 용어들은 전문 비평 서적을 참조하여 그 의미와 용례를 검토한다.
(3) 모델에게 지식 학습
첫 번째 단계는 지속적 사전학습(Continual pre-training. CPT)를 사용하여 시화 데이터의 언어적 특성과 지식을 모델에게 가르치는 것이다. 두 번째 단계에선 시-비평문 데이터를 모델에 지도 미세조정(Supervised Fine-tuning. SFT)시킨다. 이때 테스트 데이터는 별도로 분리하여 이후 진행될 평가 단계에서 사용하고 학습에는 학습 데이터셋만 사용한다. 지도 미세조정은 일반 미세조정(full fine-tuning)과 LoRA 두 가지 방식으로 실험한다. 정량적 평가 지표는 s-bert 기반의 코사인 유사도를 사용한다. 이는 길이에 무관하며 전체 의미를 파악한다는 점에서 본 연구의 데이터의 특성에 적합하다. BERTScore는 핵심 비평어가 포함되어 있는지 확인하기 위해 재현율로 판단할 것이다. 정성적 평가 지표는 LLM-as-a-judge를 활용한다.
(4) 조합 비교(Ablation Study)
본 연구의 가설을 검증하기 위해 방법론을 조합하여 비교 실험을 수행한다. 각 조합에 테스트 데이터셋을 적용하고 평가 지표로 성능을 측정한다. 각 조합은 Baseline, Baseline + CPT, Baseline + SFT, Baseline + CPT + SFT으로 구성된다.
(5) 비평 추론 방법론을 연구한 논문 집필 및 학술 대회 참가 준비
최종 실험 성과는 학술 대회에 참가하여 발표할 예정이다. 무엇보다도 학제 간 연구자들과 학술적인 교류를 통해 인문학과 인공지능의 융합 연구 가능성을 제시하는 것이 학술대회 발표의 가장 중요한 목적이다.
(6) 클라우드 서비스의 활용
모델 학습 단계에서는 안정적인 고성능 GPU 환경이 필수적이다. 고성능 GPU를 직접 구매하기에는 개인 연구자가 감당하기 어려운 수준이기에, 클라우드 서비스를 활용하여 필요한 시점에만 GPU를 사용해서 다소 경제적인 비용으로 실험을 진행하고자 한다.
(7) 연구의 한계점
고대 중국어는 극도로 자원이 부족한 희소 언어로서 가장 좋은 방법론을 찾더라도 완벽한 성능을 기대하기는 어렵다. 그러나 희소 언어 환경을 극복하는 방법들이 활발하게 개발되고 있으므로 본 연구 또한 기술적 발전과 함께 성능이 개선될 가능성이 크다.
키워드(Keyword)
(한글 250자 이내)
중국고전시, 문학 비평, 시화, 지속적(계속적) 사전 학습, 지도학습 미세조정, 희소 언어, 대규모 언어모델
키워드
(영어 500자 이내)
Chinese classical poetry, Literary Criticism, Shi-hua, Continual Pre-training, Supervised Fine-tuning, Low-resource Language, Large Language Model

게시물 이다연 / 한국연구재단 / 중국 고전시 비평 언어에 대한 AI 학습 방법론 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월KADH / 한국디지털인문학협의회에 처음 등장했습니다.

유은순 / 가톨릭대학교 / 트랜스포머 기반 언어 모델을 활용한 문학 사조 혼재 연구 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월

作者Baro
2026年5月14日 23:04

연구요약문
연구목표
(한글 2000자 이내)
본 연구의 목적은 서로 다른 문학 사조가 단일 텍스트 내부에서 어떻게 공존하고 분포하는지를 분석할 수 있는 방법론을 구축하는 데 있다. 이를 위해 트랜스포머 기반 딥러닝 언어 모델인 Sentence-CamemBERT를 활용하여 19세기 프랑스 소설 스탕달(Stendhal)의 『적과 흑』(Le Rouge et le Noir)과 귀스타브 플로베르(Gustave Flaubert)의 『보바리 부인』(Madame Bovary)에 나타난 낭만주의와 사실주의의 혼재 양상을 정량적으로 가시화하고, 그 결과를 질적 해석과 통합하고자 한다.
19세기 프랑스 소설은 낭만주의에서 사실주의와 자연주의로 이어지는 흐름 속에서 전개되었으나, 개별 작품들은 단일 사조로 환원되기 어려운 복합적 미학 구조를 보여준다. 『적과 흑』은 주인공의 열망과 사회 현실에 대한 관찰이 교차하는 서사를 통해 낭만주의적 정념과 사실주의적 인식이 중첩되는 양상을 보여준다. 『보바리 부인』 역시 사실주의적 재현 속에 낭만주의적 욕망을 내면화한 주인공을 제시함으로써 서로 다른 미학적 경향이 공존하는 텍스트로 평가된다. 그러나 기존 연구는 주로 면밀한 텍스트 분석에 기반한 질적 해석에 머물러 있어, 사조적 특징이 텍스트 내부 어느 지점에서 강화되거나 약화되는지, 그리고 어떠한 분포와 변화를 보이는지를 체계적으로 검토하는 데 한계가 있었다. 이에 본 연구는 언어 모델 기반 임베딩을 활용하여 소설 내부에서 서로 다른 사조적 경향이 어떻게 분포하고 이동하는지를 계량적으로 분석하고자 한다. 본 연구의 구체적인 목표는 다음과 같다.
첫째, 낭만주의와 사실주의에 충실한 전형적 텍스트를 선정하고, 언어 모델 기반 임베딩을 통해 문학 사조 앵커 벡터(literary movement anchor vectors)를 구축한다. 이를 통해 『적과 흑』과 『보바리 부인』에 나타난 사조 혼재의 분포와 변화 양상을 분석하기 위한 참조 축(reference axis)을 마련한다.
둘째, 분석 대상인 두 소설을 챕터 단위로 임베딩한 뒤 각 챕터의 벡터와 사조 앵커 벡터 간의 의미적 거리를 코사인 유사도로 측정한다. 그리고 그 결과를 사조 맵(literary movement map)으로 시각화하여 챕터 단위의 사조 경향과 분포, 시계열적 변화 양상을 검토한다.
셋째, 사조 맵을 기반으로 서로 다른 미학적 경향이 강화되거나 약화되는 구간을 식별하고, 챕터 내부 임베딩 벡터의 분산(variance)을 통해 사조적 경향의 변동 정도를 분석한다. 나아가 챕터 간 서사적 전환이 나타나는 구간과 변동성이 높은 챕터를 중심으로 질적 해석을 수행함으로써 정량 분석과 질적 해석을 통합한다.
기대효과
(한글 2000자 이내)

  1. 학문적 기대효과 : 인공지능 기반 문학 연구 방법론 구체화
  • 전통적인 질적 비평에 의존해 왔던 문학 사조 연구에 트랜스포머 기반 딥러닝 언어 모델을 활용한 정량적 분석을 도입함으로써, 문학적 통찰을 데이터에 기반하여 재검토할 수 있는 연구 방법을 마련한다. 특히 질적 연구가 사조의 혼재를 대표적인 장면이나 단락을 중심으로 논의해 온 것과 달리, 본 연구는 텍스트 전체에 걸쳐 나타나는 사조 혼재의 분포와 변화 양상을 계량적으로 분석함으로써 단일 사조로 환원되지 않는 복합적 미학 구조를 보다 체계적으로 조망할 수 있는 분석 틀을 제공한다.
  1. 사회적 기대효과 : 인공지능 시대 인문학의 역할 재정립
  • 본 연구는 기술과 인문학적 해석이 상호 보완적인 관계를 형성할 수 있음을 보여줌으로써, 인공지능 시대에 문학 연구의 역할과 가능성에 대한 인식을 확장하는 데 기여한다. 나아가 문학이 인공지능 모델과 데이터 자원을 통해 지속적으로 연구 지평을 갱신할 수 있는 영역임을 환기시키고 인문학의 사회적 가치에 대한 이해를 심화하는 계기를 제공한다.
  1. 교육적 기대 효과 : 디지털 인문학 교육 모델 설계
  • 최근 대학의 인문학 교육은 인공지능 기술과의 융합을 적극적으로 모색하는 방향으로 빠르게 전환되고 있다. 본 연구에서 구축한 코퍼스와 언어 모델 기반 데이터, 그리고 재현 가능한 분석 절차는 인공지능 시대에 부합하는 교육 자료로 활용될 수 있다. 또한 전통적인 독해와 데이터 분석을 융합한 디지털 문학 교육 모델로 확장될 수 있다.
    연구요약
    (한글 2000자 이내)
    본 연구의 목적은 서로 다른 문학 사조가 단일 텍스트 내부에서 어떻게 공존하고 분포하는지를 정량적으로 분석하기 위한 통합적 방법론을 제안하는 데 있다. 이를 위해 트랜스포머 기반 딥러닝 언어 모델를 활용하여 스탕달의 『적과 흑』과 플로베르의 『보바리 부인』에 나타난 낭만주의와 사실주의의 혼재 양상을 정량적으로 가시화하고, 그 결과를 질적 해석과 결합하는 통합적 분석 절차를 구축한다. 이는 기존 질적 연구가 대표적 장면이나 단락을 중심으로 사조의 혼재를 논의해 온 경향을 보완하고, 텍스트 전체에 걸쳐 나타나는 사조적 경향의 분포와 변화 양상을 체계적으로 파악하기 위한 시도이다. 본 연구는 다음과 같은 절차로 수행된다 : 첫째, 각 사조의 미학적 특성을 대표하는 전형적 작품 10편씩 총 20편으로 앵커 코퍼스를 구축한다. 작품 선정 과정에서는 문학사적 대표성과 작가 간 균형을 고려하여 특정 작가에 편중되는 것을 방지한다. 분석 대상 텍스트는 프로젝트 구텐베르크에서 제공하는 프랑스어 원서를 활용하며, 특수 기호와 주석 등 분석에 불필요한 요소를 제거하는 전처리 과정을 거친다. 둘째, 전처리된 소설은 챕터 단위로 분할한 뒤 중첩 슬라이딩 윈도우(overlapping sliding windows) 방식으로 세분화하여 서사 흐름의 단절을 최소화하고 의미 변화를 연속적으로 포착한다. 그리고 프랑스어 말뭉치를 기반으로 사전 학습된 트랜스포머 언어 모델 Sentence-CamemBERT를 활용하여 슬라이딩 윈도우 단위로 임베딩을 생성하고, 이를 집계하여 챕터별 대표 벡터를 산출한다. 셋째, 사조의 전형적 작품들의 임베딩을 기반으로 낭만주의와 사실주의 앵커 벡터(anchor vector)를 구축한다. 앵커 벡터는 사조의 평균 문체를 도출하기 위한 기준이 아니라 두 소설이 서로 다른 미학적 경향 가운데 어디에 가까운지를 판단하기 위한 참조 축이다. 넷째, 소설의 각 챕터 벡터와 앵커 벡터 간 코사인 유사도를 측정하여 의미적 거리를 산출하고, 그 결과를 사조 맵으로 시각화한다. 사조 맵은 텍스트 내부에 나타나는 미학적 경향의 분포와 서사 전개에 따른 이동을 좌표 공간에 보여줌으로써 사조 혼재를 분포와 변화의 관점에서 조망하게 한다. 마지막으로 정량 분석과 질적 해석을 결합한 통합적 접근을 수행한다. 챕터 간 사조 전환 구간을 식별하고, 해당 지점에서 나타나는 서사적 특징에 대한 질적 해석을 진행한다. 또한 각 챕터를 구성하는 윈도우 벡터와 앵커 간 유사도의 분산을 측정하여 챕터 내부의 사조적 안정성과 변동성을 평가한다.
    키워드(Keyword)
    (한글 250자 이내)
    디지털 인문학, 딥러닝 언어 모델, 문학 사조, 텍스트 임베딩, 정량적 분석
    키워드
    (영어 500자 이내)
    Digital Humanities, Deep Learning Language Models, Literary Movements, Text Embedding, Quantitative Analysis

게시물 유은순 / 가톨릭대학교 / 트랜스포머 기반 언어 모델을 활용한 문학 사조 혼재 연구 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월KADH / 한국디지털인문학협의회에 처음 등장했습니다.

강남오 / 강원대학교 강릉캠퍼스 / 옛한글 자료 번역을 위한 MCP기반 번역가-LLM 협업 번역 모델 연구 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월

作者Baro
2026年5月14日 23:02

연구요약문
연구목표
(한글 2000자 이내)
본 연구의 목표는 최근 급격히 발전하고 있는 거대 언어 모델(Large Language Model, LLM)을 이용하여 옛한글 자료 번역을 효율적이고 일관적으로 수행할 수 있는 “MCP(Model Context Protocol)기반 번역가-LLM 협업 번역 모델”을 제시하고 해당 모델의 성능 평가를 통해 그 효용성을 검증하는 것이다.

최근 급속도로 발전하고 있는 인공지능(Artificial Intelligence, AI) 기술은 다양한 분야와 융합하고 있으며 산업계, 학계 및 일상의 모든 영역에서 혁신적인 변화를 이끌고 있다. 특히 최근 소개된 LLM(ChatGPT, Gemini 등)은 자연어를 이해하고 생성하는 능력을 바탕으로 다양한 분야와 융합 및 활용되고 있다.

옛한글로 기록된 자료는 우리 민족의 역사, 철학, 문학, 그리고 한국어의 원형을 보여주는 중요한 문화유산이다. 그럼에도 옛한글 자료의 현대한글 번역 작업은 다른 분야에 비해서 매우 느리게 진행되고 있다. 그 이유는 옛한글 자료의 번역은 해당 분야에 대한 고도의 지식과 전문성을 요구함으로 인해 소수의 전문가들만이 이를 수행할 수 있기 때문이다.

이러한 상황에서 최근 소개된 LLM(ChatGPT 5.2나 Gemini 3 등)은 방대한 옛한글–현대한글 병렬 자료의 학습을 통해 옛한글 자료를 일정한 수준의 현대한글로 번역할 수 있는 능력을 갖추고 있다. 이는 기존에 전적으로 전문 번역가에 의존해왔던 옛한글 자료의 번역 작업에 큰 변화를 가져올 수 있는 기술적 환경이 마련된 것이다.

하지만 LLM 단독 번역의 결과는 잘못된 표기 변환 혹은 표현 변환, 옛한글 어휘의 잘못된 해석, 문맥에 맞지 않는 번역 등 아직은 부족한 점을 보이고 있다. 이는 전문 번역가가 LLM에 옛한글 자료의 번역에 필요한 적절한 지식을 제공하는 협업구조를 통해 해당 문제를 보완할 수 있다. 그리고 이러한 협업 구조를 구축하는 기술적 방법으로써 MCP(Model Context Protocol)를 활용할 수 있다.

따라서 본 연구에서는 옛한글 자료의 번역에 있어 전문 번역가와 LLM이 가진 한계점을 상호 보완함으로써 옛한글 자료 번역의 속도와 생산성을 향상시킬 수 있는 옛한글 번역을 위한 MCP기반 번역가-LLM 협업 번역 모델을 제시하고 이의 효용을 검증하는 것을 목표로 두고 있다.
기대효과
(한글 2000자 이내)
본 연구를 통해서 기대하는 학문적, 사회적 기대효과는 다음과 같다.

■ 옛한글 자료 번역과 인공지능의 융합을 통한 새로운 번역 모델 제시
기존에 전문 번역가가 전적으로 수행했던 옛한글 자료 번역을 번역가-LLM 협업 모델로 전환함으로써 번역의 속도와 생산성을 향상시키고 오류 감소 및 일관성 있는 번역 결과를 산출하는 새로운 옛한글 자료 번역 모델을 제시한다.

■ 옛한글 번역 지식 자료의 체계화 및 활용성 제고
번역 지식이 개별 연구자의 경험에 머무르지 않고 재사용 가능한 자료로 체계화 및 축적됨으로써 번역의 일관성과 효율성이 향상되며, 향후 옛한글 번역 연구 및 번역 교육에서 활용 가능한 기반 자료로 사용될 수 있다.

■ 고전어 자료 번역에 참조 모델 제공과 번역 작업의 인공지능 융합 촉진
전문 번역가와 LLM의 협업을 체계화한 번역 모델을 제공함으로써, 옛한글 자료의 번역에서 뿐만 아니라 고전어 자료 번역 분야 전반에서 활용 가능한 참조 모델을 제시하고, 고전어 자료 번역 연구에 인공지능의 융합을 촉진한다.

■ 옛한글 자료의 현대한글 번역 자동화를 통한 인문학 대중화 촉진
옛한글 자료의 대규모 현대한글 번역은 일반인들도 쉽게 옛한글 자료를 접근할 수 있는 기회를 제공한다. 이는 인문학의 대중적 확산과 문화유산의 현대적 활용에 기여할 것이다.
연구요약
(한글 2000자 이내)
본 연구에서는 옛한글 자료의 현대한글 번역을 효율적이고 일관성 있게 수행하기 위한 MCP기반 번역가–LLM 협업 번역 모델 및 그 성능의 분석을 수행한다. 이는 전문 번역가 위주로 수행되던 기존 번역 방식의 한계성을 극복하고 거대 언어 모델(Large Language Model, LLM)과의 협업을 통해 대량의 옛한글 자료를 일관성 있게 번역할 수 있는 가능성을 증대하려는 것이 목적이다.

연구 목적을 달성하기 위해 수행할 연구 내용은 다음과 같다.

■ 첫째, 번역 지식 자료의 설계 및 체계화
옛한글–현대한글 번역의 정확성과 일관성 향상에 필요한 번역 지식(표기 변환, 전문용어의 해석, 어조 지침 등) 자료의 유형을 정의하고, 이를 LLM이 활용 가능한 형태의 자원으로 체계화하는 방법을 연구한다.

■ 둘째, MCP기반 번역가–LLM 협업 번역 모델의 설계 및 구축
구축된 번역 지식 자료는 MCP를 활용 LLM에 전달되고, LLM이 이를 참조해 번역을 수행하는 번역가-LLM 협업 번역 모델의 설계 및 구축을 연구한다.

■ 셋째, MCP기반 번역가–LLM 협업 번역 모델의 적용 및 성능 분석
구축된 번역가-LLM 협업 번역 모델을 실제 옛한글 자료 번역에 적용하여 번역의 정확성, 일관성, 그리고 재현 가능성 측면에서의 성능을 분석 연구한다.

연구 목적을 달성하기 위한 연구 방법은 다음과 같다.

■ 첫째, 번역 지식 자료 구축
전문 번역가가 번역한 옛한글–현대한글 자료와 번역가-LLM 번역 협업 과정 중에 파악되는 번역 지식을 체계적으로 표현 및 구축하는 방법을 연구한다. 또한 번역 지식 자료를 대량으로 자동 구축하기 위한 방법의 연구도 수행한다.

■ 둘째, MCP기반 번역가–LLM 협업 번역 모델의 설계 및 구축
번역 지식 자료의 구축, LLM의 번역 생성, 오류 검토 및 수정 사항의 지식 자료화 등의 과정을 순환적으로 적용하는 작업 흐름의 정립을 연구하며, 이를 바탕으로 MCP기반 번역가-LLM 협업 번역 모델의 설계 및 구축을 연구한다.

■ 셋째, 구축된 MCP기반 번역가–LLM 협업 번역 모델의 성능 분석
동일한 옛한글 자료를 대상으로 단순 LLM 번역 결과와 MCP기반 번역가–LLM 협업 번역 결과를 비교하여 정확성, 문맥 일관성, 오류 감소 정도를 분석한다. 그리고 LLM의 처리 과정을 추적하여 정량적 비교를 수행하고, 정성적 분석과 사례 분석을 병행함으로써 제안한 협업 번역 모델의 유효성과 한계점을 분석한다.
키워드(Keyword)
(한글 250자 이내)
옛한글, 번역, 인공지능, 거대 언어 모델, 모델 콘텍스트 프로토콜, 옛한글-현대한글 병렬 자료, 자연어 처리
키워드
(영어 500자 이내)
Pre-Modern Korean, Translation, Artificial Intelligence(AI), Large Language Model(LLM), Model Context Protocol(MCP), Pre-Modern Korean-Modern Korean Parallel Text, Natural Language Processing(NLP)

게시물 강남오 / 강원대학교 강릉캠퍼스 / 옛한글 자료 번역을 위한 MCP기반 번역가-LLM 협업 번역 모델 연구 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월KADH / 한국디지털인문학협의회에 처음 등장했습니다.

정연주 / 고려대학교 / 언어모델을 활용한 조선시대 사형·감형 사례 추출과 시대적 맥락 분석 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월

作者Baro
2026年5月14日 23:00

연구요약문
연구목표
(한글 2000자 이내)
사형은 국가가 보호하려는 최우선 가치 및 질서를 어긴 사람들에게 선고된다. 따라서 사형은 조선의 통치이념과 중요 가치가 무엇인지 알 수 있는 소재이다. 감형 기준을 설명할 때 법학에서는 일정한 기준이 있다고 설명하며, 이를 법치와 연관 짓는다. 역사학에서도 일정한 기준이 있음을 인정하지만 이를 유교적 관점으로 해석하고자한다. 즉 사형과 감형 문제는 예치주의, 법치주의 등 통치 이념 설명과도 연관된다. 또한 사형 감형은 단순히 휼형(恤刑)·애민(愛民)뿐만 아니라 국정 운영 사상 및 방식, 감형의 정당화 논리가 응축되는 지점이기도 하다. 한편 조선의 통치 철학 중 하나인 흠휼에 대해서도 단순한 수사로만 작동했는지 아니면 실제로 통계적으로 유의미한 감형의 논리로 사용되었는지는 실제 사례를 통해 분석해야 한다.
정리하면 사형과 사형 감형의 사례를 분석하는 것은 통치 이념·국정운영 방식 해명, 역모 등 정치 상황 고려 측면에서는 정치사, 법이 실제 적용되는 모습을 검토하는 측면에서는 사회사, 법과 형벌 및 법감정 검토 측면에서는 법제사의 관점에서 바라볼 수 있는 주제이다. 기존에는 특정 왕대나 자료를 중심으로 살펴봤으며, 모든 연구들이 각기 기준이 달라 통합해서 이해하기도 어려워 조선 전시기를 동일한 기준으로 분석할 필요가 있다. 그런데 개인이 모든 기록을 다 검토하기 어렵기 때문에 AI인문학 방법론으로 분석하여 조선 전 시기의 사형 및 감형 사례를 검토한 후 그 안에 담긴 역사적 맥락과 의미를 읽고자 한다. 이는 AI 시대 역사학의 방향과 역사학자의 역할을 제시해주는 기능도 할 것이다.

  1. 사형 및 사형 감형 사례의 인물별·사건별 추출 및 검수
    언어모델을 활용하여 태조~철종실록에서 사형 및 사형 감형 사례를 인물별·사건별로 추출하고 검수하여 정리하고자 한다. 사형 및 사형 감형은 키워드 검색만으로는 해결하기 어렵다. 이 때문에 단순 규칙 기반으로 사료를 추출하는 기존 디지털인문학 방식으로는 한계가 있으므로 AI인문학 방법론을 도입할 것이다.
  2. 왕대별·범죄별 사형 및 사형 감형의 건수·비율·차이 비교를 통한 기준 확보
    추출한 사료를 바탕으로 왕대별·범죄별 사형 및 사형 감형의 건수, 비율, 차이 등을 비교하고자 한다. 멀리서 읽기(distant reading) 방식으로 전체 경향을 조망하여 특정 왕대에서 관찰되는 현상이 일시적이고 특수적인 것인지 혹은 장기적 경향 속에서 반복되는 패턴인지 판별 가능한 기준을 얻을 것이다. 전수 조사를 통해 기준을 세우고 경향성을 확인한 다음 연구를 진행한다면 보다 정밀한 질적 해석이 가능해질 것이다. 이를 통해 다른 연구에서도 참고할 수 있는 비교 기준을 설정하고자 한다.
  3. 사형·감형이 작동되는 논리와 정치·사회적 조건, 역사적 배경 고찰
    이상의 결과를 토대로 변곡점을 찾고 그에 대해 구체적 분석을 진행한다. 사형과 감형이 작동되는 논리와 각 왕대별 정치적·사회적 조건, 역사적 배경 등을 고찰하고 전쟁, 기근, 역병 등과 함께 사회 안정을 위해 감형이 더 늘어났는지 검토하여 사회 안정 기능도 살펴볼 수 있다. 감형시 언급되는 담론의 내용 및 유형, 흠휼의 실제 적용 양상, 감형 판단 기준 역시 검토할 예정이다. 이를 통해 사형과 사형 감형이 단순히 형벌제도가 아니라 국가가 사회 질서를 유지하고 통치를 정당화하는 방식과 긴밀히 연관되어 있음을 밝히고 조선의 국정운영과 통치 이념 등을 장기적 시야에서 재구성하고자 한다.
    기대효과
    (한글 2000자 이내)
  4. 연구결과의 학문적 기대효과 ◾ 사례 전체 분석을 통한 사형·사형 감형 의미의 재검토
    본 연구는 조선 전시기 실록에 나타난 사형 및 사형 감형 사례를 사건 단위로 정리·구조화하여, 특정 왕대·자료 중심 연구가 갖는 한계를 보완한다. 사형·감형의 규모와 추이를 장기 추세로 제시하여 기존 연구와 동일한 결론에 도달하더라도 그 결론이 특정 시기의 우연인지, 반복적으로 나타나는 경향인지 검증 가능한 근거를 제공한다. ◾ 왕대별·범죄별 비교를 통한 기준 제시
    왕대별·범죄별로 사형 사건의 규모와 감형 비율을 비교할 수 있어 특정 왕대 혹은 특정 범죄의 관행이 장기 추세 속에서 예외인지 일반적 경향과 유사한지 판단할 기준을 제공한다. ◾ 통치이념·국정 운영 방식의 실증적 검토
    감형이 적용되는 범죄와 거의 적용되지 않는 범죄가 구분되면 국가가 중요하게 다룬 가치와 용인 범위를 실증적으로 제시할 수 있다. 더 나아가 흠휼이 수사에 머물렀는지 실제 정책으로 작동했는지를 사례 기반으로 검토할 수 있게 되어 조선의 통치 이념과 국정 운영 방식에 대해서도 설명할 수 있게 될 것이다.
  5. 연구결과의 활용방안 ◾ 분석 대상 확대와 후속 연구로의 연결
    본 연구의 방법론을 활용하여 『승정원일기』, 『비변사등록』, 『일성록』, 『추안급국안』, 『심리록』 등으로 분석 범위를 넓혀 사형·감형의 논리와 운영 방식을 더 촘촘히 추적할 수 있다. 또한 장기 추세와 비교 기준을 통해 특정 왕대 또는 특정 범죄군을 더 깊이 있게 해석하는 연구로도 이어질 수 있다. ◾ 형벌 전반을 비롯한 연구 범위 확장
    사형뿐 아니라 유배·장형 등 다른 형벌에도 동일한 사건 단위 정리와 비교 분석을 적용할 수 있으며, 제도와 현실 사이의 간극을 통해 당대 사회상을 해명하는 사회사적 연구로 확장 가능하다. 또한 사료를 연결하고 문맥을 읽어야 하는 모든 연구들에 해당 방법론을 적용할 수 있다. ◾ AI인문학의 방법론 제시
    AI를 역사 해석 주체로 사용하는 것이 아니라 사료를 정리하고 분석하는 도구로 활용할 수 있다. 이 과정에서 인간이 개입하여 더 나은 결과물을 얻도록 검수와 재학습을 진행한다. 이를 통해 AI활용과 관련하여 역사학 연구가 나아갈 방향과 연구자의 역할을 구체적으로 보여주는 연구 사례가 될 것이다.
    연구요약
    (한글 2000자 이내)
    본 연구의 대상은 태조~철종대 실록이며, 고종대부터는 대한제국이 선포되면서 정치체제 및 법제 운영의 기준이 바뀌어 동일한 기준으로 비교하기 어렵기 때문에 제외한다. 조선 전 시기를 유사한 기준으로 분석하기 위해 실록만 활용한다. ◾ 연구 대상
  • 사형 집행 사례와 더불어 율이나 당시의 인식에 따라 사형에 해당하는 범죄를 저질렀으나 감형이 된 사례를 검토·분석한다.
  • 『대명률』과 『경국대전』부터 『대전회통』까지 조문에 감형이 명시되지 않았음에도 감형이 된 경우, 또는 최종 확정 처벌이 더 낮아지거나 석방되는 경우를 포함한다. 사면, 무고로 인한 석방 역시 추출하여 다른 감형 유형과 비교할 것이다. 이후 1년간 기록이 나타나지 않으면 불명으로 처리한다. ◾ 연구 방법 ① 사형 관련 표현을 찾아 사건 후보를 만들고 문맥을 검토하여 사형 집행·감형·불명으로 구분(사건 탐지(Event Detection))
    ② 실록 웹페이지의 인물명 태깅 정보를 활용해 인명을 추출하고, 인물과 기사 후보를 연결해 최초 등장 이후 1년간 관련 기사를 묶어 사건 단위로 재구성(사건 추적(Event Tracking))
    ③ 관계 추출(Relation Extraction)로 인물-율명-형벌 연결을 구조화하고, 일부 사례를 선별해 기준 마련
    ④ 추정 결과는 확정하지 않고 사람의 검수와 오류 수정을 반복하는 HITL(Human In The Loop) 방식으로 기준을 계속 다듬음
    ⑤ 위의 방법을 Few-shot prompting 프롬프트 기반으로 진행함 ◾ 분석 및 해석
  • 추출·정리한 데이터를 바탕으로 왕대별·범죄별 사형·감형을 정리하고, 사형이나 감형 증감의 역사적 배경, 정치적 상황, 역병·기근 등 사회적 상황, 형벌 및 법감정 등 법제사적 맥락, 국왕의 국정운영 사상 및 방식과 통치 이념 등을 함께 고려하여 시대적 맥락을 검토한다.
    키워드(Keyword)
    (한글 250자 이내)
    조선왕조실록, 사형, 감형, 디지털인문학, AI인문학, 언어모델
    키워드
    (영어 500자 이내)
    Veritable Records of the Joseon Dynasty, death sentence, commutation, digital humanities, AI humanities, large language model, LLM

게시물 정연주 / 고려대학교 / 언어모델을 활용한 조선시대 사형·감형 사례 추출과 시대적 맥락 분석 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월KADH / 한국디지털인문학협의회에 처음 등장했습니다.

이현정 / 고려대학교 / 정렬 기반 커버리지 기법을 활용한 고려시대 사료의 비대칭적 계승 연구: 『고려사』 열전, 『고려사절요』 졸기, 고려시대 묘지명을 중심으로 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월

作者Baro
2026年5月14日 22:59

연구요약문
연구목표
(한글 2000자 이내)
고려시대 연구의 핵심 자료인 『고려사』와 『고려사절요』는 조선 초 여러 차례의 개수 과정을 거쳐 완성된 사서이다. 기존 연구는 이들 사서가 원전 사료를 충실히 수록했다는 점에 주목하여 묘지명 등과의 비교를 통해 찬자의 시각과 편찬 의도를 분석해 왔다. 하지만 기존의 연구 방식은 서술 양상의 대조에 치중하여 사료 간 유사성을 객관적으로 증명할 정량화된 수치가 부족하다는 한계가 있다. 또한 주로 자구 일치 여부를 확인하는 수준에 머물러 의미와 맥락 중심의 심층적 분석이 미흡하며, 분석 시기 역시 방대한 사료의 양으로 인해 고려 전 시기를 포괄하지 못했다는 문제점이 있다.
기술적 발달로 텍스트 정량화가 가능해지면서 사료 간 유사도 분석이 진행되어 왔으나, 유사도 지표는 대칭적인 성격을 띠기 때문에 사료 편찬의 계보나 방향성을 설명하기에는 역부족이다. 이에 본 연구는 커버리지(Coverage) 개념을 도입하여 이러한 단점을 극복하고자 한다. 커버리지는 한 사료의 정보가 다른 사료에 포함된 정도를 측정함으로써 사료 사용의 우선순위와 선택 및 배제 과정을 실증적으로 추론하게 한다. 이를 통해 사료 간 관계를 원사료-편찬사료-요약사료라는 계층적 구조로 재구성하고, 텍스트 공유 양상을 방향성 있는 비대칭 구조로 분석할 수 있다.
커버리지 기반 분석은 단순한 유사도 측정으로는 포착하기 힘든 요약・삭제・재구성과 같은 서사적 개입 양상을 식별하는 데 효과적이다. 특정 의미 단위가 포함되지 않는 경우를 편찬자의 선택적 삭제로 해석하고, 사건은 유지되나 평가 어휘가 변하는 경우를 의도적인 재구성으로 구분하여 분석함으로써 사료 간의 차이를 단순한 불일치가 아닌 능동적인 편찬 행위의 결과로 규명할 수 있다. 결론적으로 본 연구는 정적인 비교를 넘어 커버리지라는 동적 지표를 통해 고려사 편찬 과정의 실제 작동 방식을 밝히고, 원간섭기를 포함한 고려 전 시기로 연구 범위를 확장하여 역사학 방법론의 새로운 지평을 넓히고자 한다.
기대효과
(한글 2000자 이내)
첫째, 사료 비판의 객관화가 가능하다. 그동안 연구자의 주관적 분석에 의존했던 사료 비교를 유사도 점수나 커버리지 값과 같은 수치화된 지표로 제시함으로써 분석의 객관성을 확보한다.
둘째, 거시적인 역사상 도출이 가능하다. 수작업으로는 분석하기 어려웠던 방대한 분량의 사료에 대해 정렬(Alignment) 분석을 수행함으로써, 지엽적인 데이터에 매몰되지 않고 시대를 관통하는 변화 양상을 관찰할 수 있다. 이는 삼국시대 및 조선시대와의 비교 연구로도 확장 적용이 가능하다.
셋째, 역사학 연구 방법론의 지평을 확대할 수 있다. 전통적인 문헌 해독 방식과 최신 NLP 기술을 결합한 시도는 고려시대 전반의 정보 계승 구조를 분석하는 데 있어 새로운 표준 모델을 제시한다. 특히 SIKU-BERT와 같은 모델을 활용한 맥락적 유사성 측정은 단순 키워드 매칭을 넘어선 ‘맥락적 사료 비판’의 가능성을 열어준다.
마지막으로, 연구 과정에서 생성되는 데이터셋과 언어 모델의 실용적 활용이다. 이는 향후 역사 정보 서비스나 디지털 아카이브 시스템에 탑재될 수 있다. 특히 특정 사료 검색 시 연관 사료를 함께 제시하고, 사료 간 정보 일치율과 차이점을 시각화하여 보여줌으로써 역사 기록의 전승 과정을 쉽게 이해하도록 돕는 교육적 도구로 활용할 수 있다.
연구요약
(한글 2000자 이내)
본 연구는 『고려사』 열전, 『고려사절요』 졸기, 그리고 고려시대 묘지명을 비교 분석하여 사료 간의 유사성을 확인하고 정보의 원천 자료가 전승되는 과정을 탐색하는 것을 목적으로 한다. 연구 대상으로 인물 중심의 사료인 열전, 졸기, 묘지명을 선정한 이유는 인물에 대한 서술이 찬자의 시각 변화와 사료 간의 상호참조성을 가장 잘 보여주는 소재라고 생각했기 때문이다. 특히 관찬사서인 열전·졸기와 미화의 성격이 강한 묘지명 사이의 주관적 평가를 배제하고 실질적인 유사도를 비교함으로써, 사료 편찬 과정에서 각 자료가 구체적으로 어떻게 활용되었는지 규명하고자 한다.
연구 방법론 측면에서는 최신 자연어 처리 기술인 BERT를 활용한다. 우선 한 인물에 대한 세 종류의 사료를 병렬 코퍼스로 구축한 뒤, 문장 임베딩을 통해 코사인 유사도와 커버리지 값을 산출한다. 이를 연구자가 구축한 정답셋과 비교하여 모델의 신뢰도를 검증하고, 틀린 지점을 분석함으로써 의미 단위의 비대칭성을 확인한다. 나아가 사료 특유의 변용 패턴을 모델에 학습시키는 파인튜닝 과정을 거쳐 고려 전 시기의 묘지명을 대상으로 실험을 확대하여 방법론의 일반화 가능성을 입증하고자 한다.
백임지의 사례를 통한 시범 분석 결과, 세 사료는 입사 경위나 최종 관직 등 핵심 정보는 공유하고 있으나 서술 방식에서는 뚜렷한 차이를 보인다. 열전과 졸기에는 백임지의 농민 출신 배경과 무인정변 내용이 명시된 반면, 묘지명에서는 이러한 불리한 사실이 누락되고 대신 구체적인 관직 역임이나 장례 정보가 강조되는 비대칭적 양상이 확인된다. 또한 동일 구문에 대한 문자열 유사도와 커버리지 값의 차이는 찬자의 개입을 시사한다.
향후 본 연구는 고려 전 시기를 대상으로 유사도 계산 자동화를 수행하며, 모델의 예측과 실제 데이터 간의 간극인 ‘비대칭적 계승’의 실체를 규명할 것이다. 사료 간 분량 차이가 큰 경우나 특정 양식이 결여된 사례 등 다양한 변수를 고려하여 실험을 진행하고, 최종적으로 종합 고찰을 통해 고려시대 사료 계승 구조를 역사적 맥락에서 재해석하고자 한다.
키워드(Keyword)
(한글 250자 이내)
사료의 상호참조성, 비대칭적 계승, 정렬 기반 커버리지 기법, BERT 기반 임베딩, 병렬 코퍼스
키워드
(영어 500자 이내)
Cross-referentiality among Historical Sources, Asymmetrical Succession, Alignment-based Coverage Technique, BERT-based Sentence Embedding, Parallel Corpus

게시물 이현정 / 고려대학교 / 정렬 기반 커버리지 기법을 활용한 고려시대 사료의 비대칭적 계승 연구: 『고려사』 열전, 『고려사절요』 졸기, 고려시대 묘지명을 중심으로 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월KADH / 한국디지털인문학협의회에 처음 등장했습니다.

이길환 / 고려대학교 / 한국고전소설의 향유 데이터 구축 및 활용 방안 연구 : 조선후기 평비본(評批本) 한문소설을 중심으로 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월

作者Baro
2026年5月14日 22:59

연구요약문
연구목표
(한글 2000자 이내)
▮연구의 목적과 필요성
 본 연구의 목적은 조선 후기 평비본(評批本) 한문소설들의 문맥 및 비평 정보들을 시맨틱 데이터로 전환하고 이를 기반으로 고전소설의 향유 양상을 작품론 연구에 활용할 수 있는 방안을 제시하는 것이다.
 향유 정보를 갖춘 소설 유관 텍스트 가운데 작품에 직접적 감상-비평을 본문과 물리적으로 인접한 형태로 드러내는 것은 평비본이다. 현재 평비본소설 논의는 「광한루기」 연구를 제외하면 신자료 발굴 차원에서 서지 정리·계열 검토 등을 개괄하는 식의 기초 단계에 머물러 있다. 더군다나 지원자의 조사 결과 협주·협비·두주 등이 단순 낙서 차원을 넘어 자료 전반에 걸쳐 지속적으로 나타나는 평비본-주석본은 학계에 알려진 것보다 방대한 20여 종에 달한다.
 본 과제에서는 ①그간 알려지지 않은 광의의 평비본소설 20여 종 목록을 공유해 고전소설사의 외연을 확장하고, ②서지 및 계열 검토를 넘어 자료에 나타난 비평의 내용과 역할이 어떻게 유형화·구체화되는지, 또 그것들이 본문의 각 장면과 어떻게 유기적으로 연결되는지를 분석해 고전소설의 향유 맥락을 실증적으로 복원하고자 한다.
 그간 고전소설 연구는 접근이 용이한 선본을 중심으로 이루어졌으며 텍스트 내부 작품론 분석에 치중된 결과 작품을 둘러싸고 전개된 문인지식인층의 참여적·향유적 맥락은 상대적으로 부차화되었다. 또한 고전소설비평론 역시 긍정-부정[수용-배격]이라는 이분법적 도식 속에서 논의됐는데 평비본소설에 담긴 다양한 비평 양상은 이러한 구도를 넘어 다각적인 향유 맥락을 포착하는 출발점이 된다. 이러한 분석은 “고전소설의 비평 정보는 어떻게 유형화되어야 하는가?”·“각 이본의 독서 흔적들은 어떻게 관리되어야 하는가?”라는 문제와도 연결되며 나아가 향유자의 흔적을 매개로 작품론 분석을 심화하는 자료적 토대를 형성할 수 있다.

▮목표 달성을 위한 단계적 절차
 중점 목표 : 본 지원자는 온톨로지 기반 한국한문소설 시맨틱 데이터 모델링 방법론(2025)을 참고해 각 자료의 문맥 및 비평 정보가 의미적으로 연결될 수 있는 데이터를 구축하고 이를 토대로 고전소설 연구에서의 활용 방안을 모색하고자 한다.
 연구 범위 : 1년이라는 연구 기간을 고려해 연구 대상을 3종[<만복사저포기(萬福寺樗蒲記)> 일본 내각문고본, <숙향전(淑香傳)> 단국대본, <이생규장전(李生窺牆傳)> 일본 내각문고본]으로 한정한다.
 연구 방법 : 위 평비본소설 3종의 서지적·서사적·비평적 요소들을 시맨틱 데이터로 구조화하고 이를 학술적으로 활용하는 방안을 검토하기 위해 아래와 같은 단계적 연구 절차를 밟는다.

①자료적 토대의 구축 : 이미지 판독의 정밀성 확보를 위해 「숙향전」은 단국대 천안 캠퍼스 현장 촬영을 『서발비평본금오신화』 역시 자료를 전사한 고려대본을 직접 촬영해 저해상도 문제를 해결했다. 또한 세 작품의 본문과 두주에 대한 전산화 및 역주 작업을 완료해 즉각적인 태깅 준비를 마쳤다.

②논리적 기반의 설계 : 데이터 범용성 확보를 위해 선행 XML 논의에서 제안된 마크업 지침안을 적극 수용해 먼저 각 자료를 외부 정보와 내부 정보로 구분한다. 다음 외부 정보는 관리정보·서지정보·구성정보로 대별하고, 내부 정보는 의미적 단위로 분절된 장면을 골격으로 각종 서사적 개체 및 평비·비점 등을 계층적으로 배치해 자료의 물리적·문맥적 특징을 충실히 반영한다.

③ 실질적 데이터 생성: VS Code 환경에서 실물 이미지와 대조하며 본격적으로 XML 데이터를 생성한다. 또한 단순 태깅 작업에 그치지 않고 여타 한문본 계열과의 차이점과 기 연구에서 제안된 마크업 모델링의 실효성 등을 함께 검증한다.

④ 학술적 활용안 검토 : 완성된 시맨틱 데이터를 바탕으로 해당 비평이 각각 어떤 장면과 연결되는지 확인하고 각각의 역할과 기능에 따라 유형화한다. 이를 통해 평비 기입의 맥락, 관심 대목과 관심 등장인물, 비평에 활용되는 개념어와 전고 등 향유 양상의 다층적 지점들을 분석한다. 나아가 서발문의 작성자와 및 현대 연구자들의 비평과 비교함으로써 각각의 관심과 해석이 어디에서 교차하고 어긋나는지를 살필 예정이다.
기대효과
(한글 2000자 이내)
 본 연구는 조선 후기 평비본 한문소설의 문맥 및 비평 정보를 시맨틱 데이터로 구조화하여, 향유자의 독서 흔적을 분석 가능한 연구 자원으로 전환하고 고전소설수용사의 실증적 기반을 마련하고자 했다. 이러한 논의의 결과물은 아래와 같은 성과를 기대할 수 있다.

① 자료적 근거에 기반한 독자 반응의 재구성 : 본 과제는 평비본소설에 내함된 비평 정보들을 데이터 시맨틱 차원에서 구조화함으로써 각 평비자가 어느 구간에서 어떠한 반응을 보였는지 구체화하는 것에 초점을 두었다. 그런 점에서 기 연구과제에서 「상사동전객기」 이본에 부기된 비점과 평문 등을 바탕으로 당대의 향유 맥락을 복원하고자 했던 작업과도 분명한 연결 지점이 있다.
이러한 접근은 독자반응비평 방법론이 갖는 이론중심적 한계, 즉 막연하게 추정되어 온 향유자들의 관심처와 해석 양상을 자료중심적 차원에서 실증적으로 복원·보완한다는 점에서 강점을 지닌다. 이는 단순히 연구방법론의 심화뿐만 아니라 고전소설 교육 현장에서 학습자들을 대상으로 오늘날 나의 감상과 과거 문인지식층의 반응을 비교·검토할 수 있는 교육 자원 –데이터로 읽는 고전소설- 으로도 확장될 수 있다.

② 고전소설사의 지평 확대와 연구 환경 조성 : 본 과제는 기 연구과제와 마찬가지로 이본에 산재된 다양한 향유의 흔적들을 작품 단위로 수집하고, 그간 학계에서 상대적으로 소외되었던 평비본소설의 신자료 목록을 발굴-공유한다는 점에서 고전소설 수용사 연구를 위한 1차적 토대로 기능할 수 있다. 이러한 평비본소설에 대한 검토는 장기적으로는 상술한 문집류·정사류·필기류·간찰류 등 향유 정보를 담아내고 있는 여러 유형의 리소스들과 연계·분석이 가능하다.
특히 본 과제에서는 분석 내용을 단순히 논문 제출만으로 그치는 것이 아니라 표준화된 모델링에 기반한 XML 데이터를 함께 구축·공개한다는 점에서 그 확산성이 크다. 이는 여타 평비본·주석본 소설 연구 전반에 적용 가능한 모델을 제시함과 동시에 향후 고전소설사 수용사와 관련한 방대한 유관 자료들이 효율적으로 축적·연결될 수 있는 개방형 연구 환경을 조성하는 데 일조할 수 있다.

③ 시맨틱 데이터 기반의 연구 분석 모델 제시 : 본 과제에서 생성하는 시맨틱 데이터는 텍스트의 의미와 구조를 조직화하는 작업이기에 웹상의 비정형 데이터를 대상으로 단순 수치와 빈도만을 추출하는 초기 디지털인문학의 피상적 접근과는 질적으로 차별된다. 그간 다수의 DH연구들은 자료와 작품의 형태적·문맥적 요소들을 정밀하게 담아내기보다 통계 기반의 기술중심적 접근에 치중해왔다. 그 결과 해석적 지평이 제한되고 다른 분석 맥락으로 재활용하기도 어려우며 무엇보다도 기존 내용학 연구의 깊이와 괴리되는 측면이 많았다. 물론 고무적이게도 최근 전근대 장르들에 대한 시맨틱 데이터 모델링과 관련한 개념적 설계들이 활발해지는 추세지만, 연구자가 직접 표준 포맷에 맞추어 시맨틱 데이터를 생성·공유하고 실제 작품론 분석에 적용하는 연구는 여전히 드문 실정이다.
그런 점에서 본 과제는 단순 이론적 설계를 넘어 실제적 활용 방안을 모색하고 기존 아날로그 논의 성과들과의 접점을 확보한다는 점에서 의의를 지닌다. 다시 말해 고도화된 XML 데이터를 학계에 제공하는 성과는 물론 데이터 기반의 고전소설 연구 프로세스를 제시한다는 점에서 중요한 연구사적 의미를 갖는다.
연구요약
(한글 2000자 이내)

○ 연구의 목적과 필요성
본 연구의 목적은 조선 후기 평비본(評批本) 한문소설들의 문맥 및 비평 정보들을 시맨틱 데이터로 전환하고 이를 기반으로 고전소설의 향유 양상을 작품론 연구에 활용할 수 있는 방안을 제시하는 것이다.
본 과제에서는 ①그간 알려지지 않은 광의의 평비본소설 20여 종 목록을 공유해 고전소설사 외연을 확장하고, ②서지 및 계열 검토를 넘어 자료에 나타난 비평의 내용과 역할이 어떻게 유형화·구체화 되는지, 또 그것들이 본문의 각 장면과 어떻게 유기적으로 연결되는지를 분석해 고전소설의 향유 맥락을 실증적으로 복원하고 나아가 작품론 분석을 심화하는 자료적 기반을 구축하고자 한다.
그간 고전소설 연구는 접근이 용이한 선본을 중심으로 이루어졌으며 텍스트 내부 작품론 분석에 치중된 결과 작품을 둘러싸고 전개된 문인지식인층의 참여적·향유적 맥락은 상대적으로 부차화되었다. 또한 고전소설비평론 역시 긍정-부정[수용-배격]이라는 이분법적 도식 속에서 논의됐는데 평비본소설에 담긴 다양한 비평 양상은 이러한 구도를 넘어 다각적인 향유 맥락을 포착하는 출발점이 된다. 이러한 분석은 “고전소설의 비평 정보는 어떻게 유형화되어야 하는가?”·“각 이본의 독서 흔적들은 어떻게 관리되어야 하는가?”라는 문제와도 연결된다.

○ 연구 방향성
그간 학계에서 평비본소설을 비롯한 고전소설 수용사 논의가 본격화되지 못한 이유는 향유 맥락과 관련한 유관 작품의 목록이 충분히 공유되지 못한 점에도 있겠으나, 무엇보다 이러한 원천 리소스들을 구조화한 학술 데이터가 제대로 생성-공유되지 못한 데에 기인한다. 이러한 문제의식에 입각해 본 연구는 최근 제안된 한국한문소설 XML 마크업 방법론을 참고해 각 자료의 문맥 및 비평 정보를 의미적으로 연결하는 데이터를 구축하고 이를 토대로 고전소설 연구에서의 활용 방안을 모색하고자 한다.

○ 연구 대상
1년의 연구 기간을 감안해 연구 대상을 3종[<만복사저포기(萬福寺樗蒲記)> 일본 내각문고본, <숙향전(淑香傳)> 단국대본, <이생규장전(李生窺牆傳)> 일본 내각문고본]으로 한정한다. 이들 작품은 분량 대비 평어의 밀도가 높은데다 문장 품평·고유명사 설명·교감 제안·서사 국면에 대한 반응·등장인물 평가 등 다양한 비평 양상을 포함하고 있어 향유 유형을 귀납적으로 도출하기에 적합하다. 또한 서·발문을 함께 갖추고 있어 작품 안팎의 비평을 연계한 종합적 분석도 가능하며 특히 <숙향전> 단국대본의 경우 여타 이본과는 교감이 어려울 정도로 내용적 차이가 크다는 점에서 그 자체만으로도 소개적 가치를 지닌다.

○연구 방법
① 자료적 토대의 구축 : 먼저 조선후기 평비본소설의 이본 현황을 전수 조사하고 관련 목록의 이미지와 서지 정보를 체계적으로 정리한다. 이미지 판독의 정밀성 확보를 위해 해당 원본을 직접 촬영해 저해상도 문제를 해결한다. 또한 세 작품의 본문과 두주에 대한 전산화 및 역주 작업을 완료해 태깅이 가능한 상태로 정비한다.
② 논리적 기반의 설계 : 선행 논의에서 제안된 한문소설 마크업 지침안을 적극 수용해 먼저 각 자료를 외부 정보와 내부 정보로 구분한다. 다음 외부 정보는 관리정보·서지정보·구성정보 층위로 나누고, 내부 정보는 의미적 단위로 분절된 장면을 골격으로 각종 서사적 개체 및 평비·비점 등을 계층적으로 배치해 자료의 물리적·문맥적 특징을 충실히 반영하고 범용성을 확보한다.
③ 실질적 데이터 생성 : VS Code 환경에서 실물 이미지와 대조하며 본격적으로 XML 데이터를 생성한다. 또한 단순 태깅에 그치지 않고 여타 한문본 계열과의 차이점과 기 연구에서 제안된 마크업 모델링의 실효성 등을 함께 검증한다.
④ 학술적 활용안 검토 : 완성된 시맨틱 데이터를 바탕으로 해당 비평이 각각 어떤 장면과 연결되는지 확인하고 각각의 역할과 기능에 따라 유형화한다. 이를 통해 평비 기입의 맥락, 관심 대목과 관심 등장인물, 비평에 활용되는 개념어와 전고 등 향유 양상의 다층적 지점들을 분석한다. 나아가 서발문의 작성자와 및 현대 연구자들의 비평과 비교함으로써 각각의 관심과 해석이 어디에서 교차하고 어긋나는지를 검토한다.
키워드(Keyword)
(한글 250자 이내)
한문소설(漢文小說), 평비본(評批本), 소설비평, 이본(異本), 향유 양상, 독자반응비평, 시맨틱 데이터, 확장성 마크업 언어(XML), 인공지능(AI), 온톨로지(Ontology)
키워드
(영어 500자 이내)
korean novels in literary sinitic(漢文小說), Pingbiben(評批本), Fiction Criticism, Variant Editions, Aspects of Reception, Reader-Response Criticism, Semantic Data, XML(Extensible Markup Language), AI(Artificial Intelligence), Ontology

게시물 이길환 / 고려대학교 / 한국고전소설의 향유 데이터 구축 및 활용 방안 연구 : 조선후기 평비본(評批本) 한문소설을 중심으로 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월KADH / 한국디지털인문학협의회에 처음 등장했습니다.

❌