디지털인문학 2025 가을호 인터뷰

Vaquita Wiki
Tutor (토론 | 기여)님의 2025년 11월 28일 (금) 21:44 판

JDH 2025 가을호 김현 교수님 인터뷰 내용 정리

  • 초안 작성자: 유인태
  • 질문지 검토 및 진행자: 허수
  • 인터뷰 참석자: 김바로, 김지선
  • 녹취 편집자 및 현장 촬영자: 김지선

【김】 김현 교수
【허】 허수 교수
【바】 김바로 교수
【선】 김지선 교수


【허】 한국에서 디지털 인문학을 개척해 오신 선생님을 이렇게 뵙게 되어 영광입니다. 비록 늦은 감이 있지만, 마침 내년에 디지털 인문학 세계대회가 열리는 시점이기도 해서 더욱 뜻깊은 자리라고 생각합니다. 개인적으로 온톨로지 기반 디지털 인문학에 관심을 가져왔기에, 선생님과 이렇게 대화를 나눌 수 있어 매우 기쁩니다.

I. 개인사와 학문적 여정

질문 01. 특수 이력: 인문학과 정보기술의 융합

【허】 먼저 선생님의 학문적 여정 전반에 관해 여쭙고 싶습니다. 선생님께서는 매우 이른 시기부터 인문학과 정보기술의 융합을 개척해 오셨습니다. 1980년대와 지금의 디지털 인문학 환경을 비교한다면 가장 큰 차이는 무엇인지, 또 당시 인문학자가 정보기술을 만난다는 것이 어떤 의미였는지 편하게 말씀해 주시기 바랍니다.

【김】 제가 여러 글에서 다뤘던 주제 중 하나가 ‘인문학 자료의 정보화’와 ‘디지털 인문학’이 어떻게 다른가 하는 점입니다. 예전에 디지털 인문학을 공부하는 한 학생이 자신의 연구 발표 자리에서 “이 분야의 인문학 지식을 디지털적인 방법으로 탐구할 수 있는 환경이 아직 충분히 구축되어 있지 않아서 자신이 그 환경을 만드는 데 기여하고자 한다”고 말했는데, 이를 들은 기성 연구자가 “이미 다 되어 있는데, 안 돼 있다니 무슨 말이냐”고 반론을 제기한 일이 있었습니다.

그 둘 사이의 어긋남은, ‘디지털’이라는 같은 단어를 사용하고 있음에도 그 의미와 내용이 서로 달랐기 때문이라고 생각합니다. “이미 다 되어 있다”는 말은, 디지털 미디어에서 해당 분야의 중요한 학술 자료들을 검색하고 다운로드해 연구 자료로 사용할 수 있다는 뜻입니다. 디지털라이제이션(digitalization)의 관점에서는 충분히 맞는 지적이지요. 우리나라에서 한때 ‘정보화’라고 불렸던 디지털라이제이션은, 주로 정보기술자의 힘을 빌려 특정 분야의 자료를 디지털 환경에서 접근 가능하도록 만드는 작업이었습니다.

반면, 우리가 ‘디지털 인문학’이라는 이름으로 하는 일은 단순히 연구 자료를 기술자에게 맡겨 디지털 문서로 전환하는 차원이 아닙니다. 이미 디지털화된 자원을 바탕으로, 인문학자가 직접 디지털적 방법으로 연구하고, 교육하고, 새로운 지식을 생산하는 활동 전체를 의미합니다.

아날로그 자료를 디지털상에서 활용할 수 있게 만드는 디지털라이제이션과 혼동되지 않도록, 디지털 환경 안에서 기존에는 불가능했던 새로운 융합적 연구·교육 활동을 수행하도록 하는 노력을 ‘디지털 트랜스포메이션(digital transformation)’이라고 구분하기도 합니다.

  • digitalization: 정보기술자의 도움으로 아날로그 자료를 디지털 환경에서 사용할 수 있도록 만드는 일
  • digital transformation: 인문학 연구자가 디지털 환경 자체를 활용해 연구·교육·실무 활동을 수행하고 이를 통해 지식을 확장하는 일

질문하신 1980년대의 상황에서, 그 시대의 과업은 분명 디지털화(digitalization)였습니다. 당시 연구자들이 도서관에서 어렵게 자료를 찾아 복사해 오던 일을 CD-ROM이나 온라인 환경에서 더 편리하게 할 수 있도록 만든 것이 핵심이었지요.

그런데 요즘은 컴퓨터에서 자료를 찾는 것뿐 아니라, 그 내용을 해석하고 추론하고 새로운 가능성을 생성하는 일까지 할 수 있게 되었습니다. 특히 그 변화를 가속화한 것이 오늘날의 인공지능입니다.

결론적으로, 80년대의 인문학 자료 전산화는 인문학 연구자들에게 연구 편의성과 효율을 높여주는 도구적 활용으로서의 디지털이었고, 수행 주체도 대부분 정보기술자였습니다. 반면 오늘날의 디지털 환경은 그 자체가 연구·교육이 이루어지는 공간, 즉 우리가 “숨 쉬는 공기”와 같은 기반이 되어가고 있습니다. 그 환경 속에서 인문학이 사회가 필요로 하는 역할을 충실히 수행하도록 만드는 것이 현재 우리가 집중하는 과제입니다.

【허】 말씀을 들으니 개념 구분이 훨씬 명확해집니다. 80년대의 작업을 포함해 지금도 두 범주를 구별할 필요가 있는데, 선생님께서 디지털화(digitization/digitalization)와 디지털 전환(digital transformation)의 차이를 명확하게 정리해 주신 것 같습니다. 제가 제대로 이해했는지 확인 차원에서 한 가지 예를 들어 보겠습니다. 국사편찬위원회에서 3·1운동 100주년을 맞아 몇 년 전 3·1운동 데이터베이스를 구축했습니다. 관련 자료를 광범하게 디지털화했는데, 선생님 말씀에 비추어 보면 그것은 ‘디지털화’에 해당하고, ‘디지털 전환’은 연구자들이 그 자료를 활용해 관계를 설정하거나 구조화된 방식으로 연구할 수 있도록 환경을 만드는 작업이라고 할 수 있겠습니다. 그런데 이러한 단계는 아직 충분히 이루어지지 않았고, 개별 연구자들이 각자의 수준에서 활용하는 단계에 머물러 있다고 생각됩니다.

【김】 말씀하신 3·1운동 자료의 경우, 다양한 출처의 사건 기록뿐 아니라 공간 정보, 인물 정보, 이후의 후속 정보―예컨대 관련 인물들이 어떤 죄목으로 어떤 처벌과 감시를 받았는지, 해방 후에는 어떤 상훈을 받았는지, 각 지역의 독립운동 유적지의 사적 지정 현황은 어떠한지 등―상당히 많은 관련 자료가 있을 것으로 예상됩니다.

이처럼 여러 곳에 흩어져 있는 방대한 자료를 망라적으로 수집하고 체계적으로 정리하여 디지털 미디어에서 접근 가능하도록 만드는 디지털라이제이션은 아직도 해야 할 일이 많은 미완의 과제입니다. 이 과제를 완성하는 것이 당면 목표이지만, 디지털 아카이브 구축 이후의 단계에 대해서도 고민해야 합니다. 연구자들은 이 아카이브를 기반으로 기존에 없던 새로운 사실을 발견하려 할 것이고, 학생·유튜버·문화 창작자들은 그 자료 속의 지식을 바탕으로 다양한 대중 콘텐츠를 만들고자 할 것입니다.

1980년대의 디지털라이제이션이 ‘고객이 이용하기 전 단계’까지의 디지털화였다면, 오늘날의 디지털 트랜스포메이션은 고객(연구자·학생·대중)이 그 데이터를 활용해 새로운 지식과 콘텐츠를 창출할 수 있게 하고, 그 결과물도 다시 디지털 자원으로 축적되어 해당 분야의 디지털 생태계가 지속적으로 확장되도록 만드는 체계라고 할 수 있습니다.

물론 말은 쉽지만 실천은 결코 쉽지 않습니다. 두 작업 사이의 가장 큰 차이는 디지털라이제이션은 대부분 정보기술자가 수행했던 반면, 오늘날의 디지털 트랜스포메이션은 인문학자 스스로 수행해야 하는 영역이라는 점입니다. 21세기의 인문학자는 인문 지식의 전문가일 뿐 아니라, 자기 분야의 지식 자원을 디지털적으로 운용·확장할 수 있는 역량을 갖추어야 합니다. 이런 취지에서, 저는 디지털 인문학을 전통적 인문학이 “미래를 위해 갈아입어야 할 옷”이라고 표현한 적이 있습니다.

질문 02. 학문적 정체성: 철학 연구와 디지털 방법론의 연결점

【허】 앞서 디지털화와 디지털 전환을 주체의 관점에서도 명확히 구분해 설명해 주셨습니다. 이어서 두 번째 질문을 드리겠습니다. 이번 질문은 선생님의 학문적 정체성과 관련된 것입니다. 선생님께서 원래 연구하셨던 조선시대 성리학과 한국철학의 학문적 뿌리가, 선생님께서 개척해 오신 백과사전적 아카이브 구축, 시맨틱 데이터 편찬, 디지털 인문학 방법론 정립 등에 구체적으로 어떤 영향을 끼쳤는지 궁금합니다. 같은 맥락에서, 인문학적 사유가 디지털 방법론과 어떻게 상호작용해야 하는지에 대해서도 말씀해 주시면 감사하겠습니다. 앞서 일부 언급해 주신 바도 있지만, 이번엔 그 지점에 좀 더 초점을 맞추어 주시면 좋겠습니다.

【김】 편하게 말씀드리겠습니다. 지난주에 ‘인공지능’을 주제로 강연을 하면서 “내 인생에서 가장 잘한 선택 중 하나는 대학 전공으로 인문학을 택한 것”이라는 이야기를 했습니다.

사실 저는 철학을 전공했지만, 박사 과정 중이던 1985년에 컴퓨터 기술 연구자로 KAIST에 취직했습니다. 이후로는 인문학으로 생계를 유지한 것은 아니죠. 그럼에도 인문학 공부를 통해 인문학적 사고의 기초를 닦은 덕분에, IT 기술 세계에서 마주치는 여러 문제들—특히 요즘 인공지능이 던지는 문제들—을 접했을 때 스스로 문제의식을 분명히 하고, 판단의 기준을 세우고, 행동의 방향을 결정할 수 있었다고 생각합니다.

현대 사회에는 수없이 많은 문화적·기술적 트렌드가 생겨나고, 급속히 변화하고, 폭발적으로 확장되고 있습니다. 그런 것들을 무작정 따라가다 보면 지치고, 어느 순간 스스로 길을 잃은 듯한 느낌을 받을 수도 있지요. 하지만 현상에 즉각 반응하기보다 한 걸음 물러서서 “이 변화가 나와 세계에 어떤 의미를 갖는가”, “내가 무엇을 기준으로 선택해야 하는가”를 고민할 수 있게 하는 것이 바로 인문학적 사고입니다. 이러한 태도를 배울 수 있었던 것이 인문학 공부의 가장 큰 효용이라고 생각합니다. 선생님께서는 저의 철학 전공이 제가 해 온 디지털 기술적 작업에 어떤 영향을 주었는지 물으셨지만, 저는 오히려 디지털 기술을 다루는 과정에서 과거 인문학이 추구해 온 바가 무엇이었는지, 미래 인문학은 어떤 방향으로 나아가야 할지를 더 깊이 성찰할 수 있었다고 말씀드리고 싶습니다. 제가 학생 시절 존경했던 스승님들께 들었던 말이 있습니다.

“인문학이란 정답을 찾는 학문이 아니라, 끊임없이 문제를 발견하는 학문이다. 답을 찾는다고 생각하는 순간 새로운 문제가 드러난다. 그 끝없는 여정이 바로 인문학적 탐구다.”

당시엔 그 말의 깊이를 잘 몰랐습니다. 하지만 컴퓨터를 통해 인문학 지식을 다루는 일을 하면서 그 뜻을 점점 더 공감하게 됩니다. 우리는 어떤 목적을 기대하며 데이터를 정리하고 컴퓨팅 프로세스를 가동합니다. 결과는 나옵니다. 하지만 그 결과가 만족스럽기보다는 오히려 “인풋 데이터가 얼마나 부족하고 편중되어 있었는지”, “문제 정의가 얼마나 모호하고 치밀하지 못했는지”를 보여주는 경우가 훨씬 많습니다. 이것은 실패가 아니라 새로운 문제의 발견이며, 더 의미 있는 인문학적 탐구의 출발점이지요.

몇 번의 컴퓨팅 과정이 원하는 답을 주지 않는다고 포기하거나, 성급히 결론을 내리고 일을 마무리하기보다, 그 과정에서 드러난 문제를 바탕으로 다시 문제를 정의하고 지식 탐구를 이어가는 것—이것이야말로 과거 인문학 선배들이 ‘말’과 ‘글’로 우리에게 가르쳐 주었던 인문학적 탐구의 자세라고 생각합니다.

【허】 선생님 말씀을 들으니 잘 이해가 됩니다. 현재 인문학 연구, 특히 디지털 인문학을 포함한 인문학 연구의 역할은 크게 두 가지로 정리할 수 있을 것 같습니다. 첫째, 판단의 가치 기준을 제시하는 일, 둘째, 끊임없이 질문을 던지고 해답을 추구하는 방법론적 과정입니다. 컴퓨팅 프로세스에서는 문제 정의와 결과의 차이가 더 명확하게 드러나기 때문에, 다음 연구 질문을 지속적으로 제기하는 구조로 자연스럽게 이어질 수 있겠네요. 이 점에서 인문학 연구의 본질은 동일하지만, 디지털 인문학 방법론이 그 과정을 더 투명하게 보여준다고 볼 수 있겠습니다. 그러면 세 번째 질문으로 넘어가겠습니다.

질문 03. 연구 과정의 어려움과 극복

【허】 이번에는 조금 더 구체적인 질문을 드리겠습니다. 연구 과정에서 겪으신 어려움과 그것을 극복한 과정에 관한 질문입니다. 선생님께서는 한국 디지털 인문학의 기반을 닦으신 개척자로, ‘최초의 길’을 걸어오셨다고 해도 과언이 아닙니다. 그 과정에서 당시의 기술적 한계에도 직면하셨을 것 같고, 아까 잠깐 언급하셨듯 전통 인문학계의 회의적 시선도 적지 않았을 것 같습니다. 그런 어려움들을 어떻게 극복하고 주변을 설득해 나가셨는지, 그 과정에 대해 말씀해 주시면 좋겠습니다. 하실 말씀이 많으실 것 같습니다.

【김】 남들이 흔히 하지 않는 일을 한다는 것은 늘 쉽지 않지요. 돌이켜보면, 저는 다른 사람들에게 익숙하지 않은 일들을 꽤 많이 해 왔던 것 같습니다. 인터뷰에서는 늘 “어떤 어려움이 있었는가”, “그 난관을 어떻게 극복했는가”라는 질문이 나오곤 하는데, 사실 제가 기억하는 것은 어려움 그 자체보다는, 제가 하는 일을 충분히 이해하지 못하거나 생소하게 느끼는 상황에서도 저를 믿고 협조해 준 분들 덕분에 성과를 낼 수 있었다는 점입니다. KAIST 연구원으로 처음 들어갈 때, 저는 제출 서류 목록에도 없는 장문의 지원 사유서를 첨부했습니다. “인문학, 그것도 동양철학을 전공한 내가 왜 컴퓨터공학 연구원이 되려 하는가”를 설명하기 위해서였습니다. 1985년 KAIST 시스템공학연구소 연구원 공채 경쟁률은 100:1이 넘었다고 하는데, 제가 최종 합격할 수 있었던 것은 선배 연구자들이 제 이야기에 호기심과 신뢰를 가지고 기회를 주기로 결정했기 때문입니다.

KAIST에서 데이터베이스와 뉴미디어 분야의 전문적 지식을 7년 동안 쌓고, 이후 민간 기업인 ‘서울시스템’으로 옮겨 ‘조선왕조실록 CD-ROM’을 만들었습니다. A4 두 장짜리 사업계획서로 시작한 일이었지만, 서울시스템 이웅근 회장님의 이해와 전폭적 지원이 있었기에 실현될 수 있었습니다. 1997~1999년 IMF 외환위기 당시에는 고학력 실업자 구제 정책의 하나로, 공공기관이 보유한 자료를 디지털화하는 대규모 정보화 사업이 진행되었습니다. 당시 주무부처인 정보통신부의 남궁석 장관께 국사편찬위원회, 민족문화추진회(현 고전번역원), 정신문화연구원(현 한국학중앙연구원), 서울대 규장각 등이 보유한 대규모 한문 고전 자료를 포함시키자고 제안했고, 장관과 관료들이 즉각 호응해 주셔서 이 일이 성사되었습니다. 이것이 2000년대의 역사정보통합시스템, 그리고 현재의 한국학자료통합플랫폼으로 이어지게 된 것이지요. IMF 여파로 서울시스템이 사업을 중단한 뒤에는, KAIST 시스템공학연구소의 후신인 한국과학기술정보연구원(KISTI)에서 인터넷 기반 과학기술 정보 유통체계 구축 연구를 이끌었습니다.

이 과정에서도 틈틈이 인문학과 정보기술을 잇는 작업을 이어 갔습니다. 특히 역사정보통합시스템에 실리는 한문 데이터를 체계적으로 데이터베이스화하고, 구조화하고, 검색할 수 있게 하는 기술을 개발·보급했는데, 이로 인해 우리나라의 한문 고전 데이터 상당수가 XML 기반 데이터로 생산되어 오늘날 인공지능 친화적인 데이터로 활용될 수 있게 되었습니다. 당시 KISTI 조영화 원장과 동료 연구원들은 “과학기술 정보가 아닌 것 같은데?”라고 농담을 하면서도 제 일을 적극적으로 후원해 주었습니다.

2004년 한국학중앙연구원에 오게 된 이후의 여러 사업들도 마찬가지입니다. 한국향토문화전자대전을 당시로서는 최첨단이었던 XML 기반 하이퍼미디어 데이터로 편찬한 일, 민간 포털과 협력해 한국민족문화대백과사전 온라인 서비스를 구축한 일, 전국 각지에 권역별 고문헌 자료센터를 설치하고 자료 공유 네트워크를 구축한 일, 그리고 인문정보학 석·박사 과정 개설까지— 이 모든 일은 당시에는 내용도 생소하고 판단하기 어려운 사업이었음에도, 역대 원장님들과 선배 교수님들이 “미래의 방향일 것 같다”는 막연한 신뢰를 가져 주었기에 가능한 일이었습니다.

새로운 일을 추구하는 사람은 그 일을 시도할 기회가 주어진 것만으로도 충분히 감사할 이유가 있다고 생각해요. 기존의 틀에 없던 일을 할 때 꼭 적극적인 후원이나 격려가 없어도, 그 일을 할 수 있는 ‘상황’이 열린 것 자체가 의미 있는 기반이 되었다고 생각합니다. 그래서인지, 특별히 기억나는 “어려움”이라는 것은 별로 없는 것 같습니다.

【허】 네, 잘 들었습니다. 우문에 현답을 주셨습니다. 김바로 선생님도 여기 계시지만, 저희도 각자의 위치에서 일을 검토하고 결재하거나 승인하는 입장입니다. 선생님 말씀을 들으니 생각이 듭니다. 낯설고 판단하기 어렵고 처음 접하는 일을 ‘허용’하거나 ‘방임’한다는 것은 결국 그 일을 하는 사람에 대한 신뢰가 전제되어야 가능한 것이겠지요. 선생님께서 직접 강조하시진 않았지만, 그런 신뢰를 쌓으며 길을 개척해 오신 과정이 분명 있었던 것 같습니다.

II. 주요 연구 업적과 방법론

질문 04. 대표 업적: 『조선왕조실록』 DB CD-ROM 개발

【허】 이제 두 번째 파트로 넘어가겠습니다. 주요 연구 업적과 방법론에 관한 내용입니다. 앞서 언급하신 대표적 업적 가운데 하나인 조선왕조실록 DB CD-ROM 개발에 대해 여쭙고자 합니다. 이 질문도 난관을 묻는 질문이라 조심스럽긴 합니다만, 조선왕조실록 DB CD-ROM 프로젝트 과정에서 기술적 혹은 인문학적 측면에서 가장 큰 어려움이 무엇이었는지 말씀해 주시면 좋겠습니다. 혹은 난관보다는, 이 성과가 이후 한국학 자료 디지털화에 남긴 유산이 무엇인지 말씀해 주셔도 좋습니다. 언론에서도 많이 다뤄진 이야기이긴 하지만, 이번 인터뷰를 계기로 다시 한번 들려주시면 감사하겠습니다.

【김】 제가 제미나이(Gemini)에게 ‘조선왕조실록 CD-ROM의 사회적 기여’가 무엇이냐고 물어본 적이 있는데, 이렇게 답하더군요:

1) 인문학 정보화의 효시 및 연구 방법의 혁신,
2) 역사 지식의 대중화 및 활용 확대,
3) 후속 디지털 인문학 프로젝트의 기술적 기반 마련

여러 사람이 언급했고 인터넷에도 널리 퍼진 이야기이니, LLM이 저렇게 답하는 것도 자연스러운 일이겠지요. 그래서 오늘 이 자리에서는 전에는 하지 않았던 이야기를 해 보려고 합니다.

저에게 가장 먼저 떠오르는 생각은, “조선왕조실록 CD-ROM의 최대 수혜자는 바로 나 자신이었다”는 점입니다. 제가 제 인생의 첫 번째 DH(Digital Humanities) 프로젝트로 실록 CD-ROM을 선택한 것은, 조선왕조실록의 내용을 깊이 이해해서라기보다는 그 자료가 한국 인문학 정보화에 가장 큰 사회적 임팩트를 줄 수 있는 자원이라고 판단했기 때문입니다.

정작 조선왕조실록에 대한 깊은 이해는 CD-ROM을 만드는 과정에서 얻게 되었습니다.

데이터베이스 구조를 설계하고, 한자 코드와 서체를 개발하고, 풀 텍스트 검색 기능을 구현하고, 번역서의 주석을 모아 용어사전을 만드는 과정에서 실록의 이곳저곳을 들여다볼 수밖에 없었습니다.

그러다 흥미로운 기사를 만나면 그 전후 맥락을 파악하기 위해 본문을 한참 읽기도 했습니다.

또 하나 기억나는 일은, 모든 기사에 대해 ‘한 줄 요약문’을 만드는 작업이었습니다.

이를 위해 당시 전국 대학의 사학·한문학 전공 대학원생들에게 왕대별 실록 텍스트를 보내 요약 작성을 의뢰했고, 결과물이 도착하면 제가 직접 일일이 검수했습니다. 그래서 저는 지금도 조선왕조실록 CD-ROM이 “자료의 내용을 아는 사람이 만든 데이터베이스”, 그리고 “콘텐츠를 공부하면서 만든 데이터베이스”라고 자부합니다.

그 공부의 과정에서 얻은 가장 중요한 소득은 조선시대 역사 지식 자체보다도, “역사서의 기록은 사관(史官)이 사실을 선택해 구성한 하나의 스토리텔링”이라는 이해, 그리고 “그 스토리 속 사실적 소재들을 다시 다른 관점의 이야기로 재구성하는 것이 인문학 연구”라는 통찰을 얻게 된 점입니다.

【허】 오늘 처음 말씀하신 관점이라고 하셨는데, 정말 함축적이고 의미 깊은 말씀입니다. 최대 수혜자가 텍스트를 직접 읽고 작업한 ‘만든 사람 자신’이라는 점, 그리고 그 관점은 디지털 트랜스포메이션 작업에서 대단히 중요한 메시지를 담고 있다고 생각합니다. 후학들도 이런 말씀을 꼭 새겨들면 좋겠습니다.

질문 05+06. 기술적 도전과 해결책 + 핵심 철학: 백과사전적 아카이브 · 시맨틱 데이터 · 디지털 큐레이션

【허】 선생님의 그간 작업을 살펴보면, 선생님의 지향점과 철학을 세 개의 키워드로 정리할 수 있을 것 같습니다.

  • 첫째, 백과사전적 아카이브(encyclopedic archive)
  • 둘째, 시맨틱 데이터(semantic data)
  • 셋째, 디지털 큐레이션(digital curation)

얼마 전 AI 시대 인문학 연구자의 역할을 여쭤보았을 때 선생님께서 ‘인문지식의 디지털 큐레이터’를 말씀하셨는데, 이 용어 역시 세 키워드와 밀접한 관련이 있는 것 같습니다. 또한 앞서 ‘구축’이 아니라 ‘편찬’이라는 용어를 강조하신 이유도 이 키워드들과 연관되어 있을 것 같고요. 이 세 가지 키워드가 어떻게 유기적으로 연결되어 있는지 말씀을 듣고 싶습니다.

【김】 디지털 인문학이라는 이름으로 할 수 있는 일은 많지만, 나 한 사람이 연구자이자 교육자로서 할 수 있는 일에는 분명 한계가 있습니다. 그렇기 때문에 제가 가장 잘할 수 있고, 설득력 있게 공감을 얻어낼 수 있고, 전문성을 가지고 학생들을 지도하며 학계에 기여할 수 있는 분야를 제 스스로 정리한 것이 선생님께서 말씀하신 바로 그 세 가지입니다.

‘백과사전적 아카이브’(Encyve)는 백과사전(encyclopedia)과 아카이브(archive)의 합성어입니다. 이 개념은 제가 한국학중앙연구원에서 경험한 문제의식에서 나온 말입니다.

20여 년 전 정보센터 소장으로 근무할 때 제 업무는 크게 두 가지였습니다: ‘장서각 아카이브의 고문서 자료 디지털화’와 ‘『한국민족문화대백과사전』과 같은 디지털 백과사전 편찬’. 이 두 일은 각각의 영역에서는 큰 문제 없이 잘 수행되고 있었습니다. 장서각의 고문헌과 『고문서집성』 영인 자료는 온라인 접근이 가능해졌고, 민족문화대백과사전도 온라인 검색이 편리한 체계로 구축되었습니다. 그런데 일을 하다 보니, 그동안 미처 보지 못했던 중대한 문제가 보이기 시작했습니다. 두 시스템 사이에 단 하나의 연결고리도 없다는 점이었습니다. 장서각에 수많은 문헌들이 있는데 그 문헌의 저자, 발문 쓴 사람, 편지를 주고받은 사람 등등에 대한 정보를 민족문화대백과사전에서 찾을 수 있는 것이 꽤 있어요. 민족문화대백과사전 안에도 우리나라에서 간행된 문헌들이 항목화돼 있거나 본문 속에서 언급된 경우가 많지요. 그런데 그러한 정보를 상호 참조할 수 있는 장치가 전혀 없는 겁니다.

기술자들은 “그거 왜 안 해요?”라고 말합니다. 하지만 저는 그 일을 깊게 들여다보면서, 이것이 간단한 기술적 문제가 아니라는 점을 깨달았습니다. 두 시스템은 독립된 조직에서, 철저히 분업화된 체계 속에서 만들어졌습니다. 따라서 결과물도 서로 독립적일 수밖에 없었고, 두 체제를 연결하려면 조직의 구조와 업무 방식부터 바뀌어야 했습니다. 이 문제를 인식한 이후 저는 이렇게 생각하게 되었습니다.

  • 자료(data)와 지식(knowledge)을 구분하는 기존의 관점은 한계가 있다.
  • 이를 통합적으로 이해하고 다룰 수 있는 새로운 인식 전환이 필요하다.
  • 그 일을 수행할 융합형 인재 양성이 반드시 필요하다.

한국학중앙연구원 대학원에 인문정보학 전공을 개설한 것과 ‘백과사전적 아카이브’라는 개념을 만든 것은 사실상 한 문제의식에서 시작된 같은 흐름의 일입니다.

‘시맨틱 데이터’는 ‘백과사전적 아카이브’ 안에서 지식과 자료의 조각들이 서로 의미있게 연결될 수 있도록 하는 데이터의 기술 형식이고, ‘디지털 큐레이션’ 지식을 탐구하는 과정에서 의미있는 지식 요소를 발견하고 그것을 시맨틱 데이터로 기술하여 백과사전적 아카이브에 담아내는 행위를 말합니다.

백과사전적 아카이브는 장서각과 민백을 합치려는 시도에서 탄생한 개념이지만, 좀 더 의미를 부여한다면, 지식과 자료를 지식을 이원화하고, 연구와 큐레이션을 분업화한 현대 인문학의 문제점을 디지털 세계에서 극복하려는 ‘디지털 인문학’의 일환이라고 이야기 할 수 있을 것입니다. 시맨틱 데이터는 이러한 취지의 디지털 인문학을 구현하는 기술적 프레임워크이고, 디지털 큐레이션은 그 프레임워크 위에서 인문지식 탐구하는 실천적인 학술활동이라고 할 수 있겠지요.

【허】 세 키워드 간의 관계를 마지막에 선생님께서 간명하게 정리해 주셨습니다. 더 나아가, 이러한 요소들은 아까 말씀하신 디지털 트랜스포메이션의 내용과도 연결되는 것 같습니다. 분리되어 있는 요소들을 통합하고, 지식과 지식인의 상을 유기적 관점에서 재구성해야 한다는 말씀으로 이해됩니다.

【허】 이 질문과 관련해서 조금 더 여쭙겠습니다. 한국학중앙연구원의 김병준 선생님께서 주신 질문이기도 한데요. LLM, 즉 거대 언어 모델이 등장한 이후 시맨틱 데이터, 그래프 데이터, 그래프 DB가 LLM의 ‘환각(hallucination)’을 제어하는 수단으로 주목받고 있습니다. 이런 맥락에서 시맨틱 데이터가 학습 데이터로서 갖는 의미가 무엇인지 말씀해 주시면 좋겠습니다.

【김】 제가 시맨틱 데이터 편찬 기술을 디지털 인문학 교육 프로그램의 주요 과정으로 채택한 이유는, 시맨틱 데이터가 자연어로 표현된 자유로운 형식의 인문학적 지식을 명시적(explicit) 데이터로 구조화하는 데 적합한 방식이라고 판단했기 때문입니다. 자연어 텍스트에 비해 표현의 자유로움은 줄어들지만, 정확한 의미 전달력은 훨씬 강화되는 측면이 있습니다. 따라서 시맨틱 데이터가 인공지능의 학습 데이터로 사용된다면, 자연어 텍스트보다 정확한 지식을 생성하는 데 도움을 줄 것이고, 원천 지식의 모호성에서 비롯되는 환각(hallucination) 현상을 줄이는 데도 기여할 것입니다. 그런데 제가 시맨틱 데이터의 ‘인공지능적 활용’에 대해 더욱 중요하게 생각하는 것은, ChatGPT나 제미나이 같은 LLM 자체의 학습 데이터로서의 기능보다 오히려, 일정한 범위의 인문학적 지식(예: 한국학, 한국 역사·전통문화) 을 안정적으로 제공하고, 더 나아가 AI 교사(AI tutor)로서 교육 기능까지 수행할 수 있는 ‘버티컬 AI(Vertical AI)’의 구현입니다.

요즘 LLM이 워낙 화제가 되다 보니, 많은 사람들이 ‘인공지능은 곧 LLM’이라고 생각합니다. 물론 LLM은 가장 영향력 있고 대중적인 인공지능이며, 특히 인문학 분야에서는 그 역할이 매우 큽니다. LLM이 곧 인공지능이라고 생각하는 사람들은 이러한 파운데이션 모델이 장차 모든 지식과 문화적인 활동 영역을 다 지원해 줄 것으로 생각하지만, 실제로 그러한 일은 각 분야에서 전문성을 강화하는 버티컬 AI가 만들어지고, 그것이 그 파운데이션 모델 위에서 기능하게 되었을 때 가능해질 일이라고 할 수 있지요.

파운데이션 모델의 역할이라고 하는 건 그야말로 인간 두뇌의 사고 방식을 흉내내는 것이지요. 한 인간이 많은 경험을 쌓고 많은 사람을 접하게 되게 되면 자연스럽게 말을 잘하게 되고 아는 것도 많아지듯이, 방대한 데이터를 학습해서 유창한 언어 능력과 종합적인 추론 능력을 습득하고, 그럴듯한 박식함을 자랑할 수 있는 수준에 도달한 것이 것이 파운데이션 모델 AI라고 할 수 있습니다. 반면에, 그렇게 모든 분야에서 박식하지는 않다 하더라도 일정한 범위의 영역에서 체계적으로 정리된 지식을 차분하게 배워가면, 그 방면에서 신뢰할 수 있는 전문가로 인정받을 수 있는데, 그런 전문가의 영역이 버티컬 모델이라고 할 수 있는 거죠. 버티컬 모델은 독립적으로 작동하는 하는 것이 아니고, 언어적 소통 능력은 파운데이션 모델에 의존하고 자기 분야 전문적인 지식의 신뢰도를 강화하는 역할을 전담합니다.

제가 학생들과 같이 추구해 온 그 한국학 분야의 백과사전적 아카이브, 시맨틱 데이터 그리고 그것을 편찬하는 디지털 큐레이션의 성과들은 파운데이션 모델의 학습 데이터로 쓰일 뿐 아니라, 앞으로 세계 각 지역의 한국 문화 수요자들이 한국학을 배우고 이해하는 데 도움을 주는 ‘한국학 전문 버티컬 AI’로 발전하리라 기대하고 있습니다.

【허】 네, 알겠습니다. 그 차이를 분명하게 설명해 주셔서 잘 이해가 되었습니다.

III. 한국의 디지털인문학 학계에 대한 기여

질문 08+09. 환경 조성: 한국디지털인문학협의회(KADH) 창설 + 국제적 협력과 네트워킹

【허】 한국디지털인문학협의회(KADH)와 국제적 협력 네트워크에 관한 질문입니다. 2015년 KADH 창설 당시의 환경과 비전, 그리고 2023년에 박진호 교수님을 포함한 다음 세대에게 회장직을 이양하신 과정과 관련해 여쭙고 싶습니다. 또한 디지털인문학협의회가 내년에 국제대회를 앞두고 있기도 한데요. 초대 회장에서 물러나신 소회와 더불어, 앞으로 해외 디지털 인문학 커뮤니티와의 교류를 어떻게 해 나가야 한다고 보시는지 말씀해 주시면 좋겠습니다.

【김】 2015년에 디지털인문학협의회를 만들 당시, 제가 재직하던 한국학대학원 인문정보학 전공 과정에 유능한 인재들이 많이 들어와 있었습니다. 대학원에서 학생들과 공동연구를 시작하면서, 디지털 인문학 분야에서도 문제의식을 공유하는 사람들이 힘을 모을 수 있는 장치가 필요하다는 생각을 적극적으로 하게 되었습니다. 인문정보학이라는 개념을 만들고, 교육 프로그램을 구상하고, 그 과정에서 ‘디지털 인문학’이라는 조어를 논문에 사용한 것이 1999~2001년경이니, 저의 학술적 디지털 인문학 활동은 훨씬 이전부터 시작된 셈입니다. 그러나 그 활동은 동료를 얻기 어려운 환경에서 저 혼자 추구한 일이 많았습니다. 그런데 2015년 무렵에는 전 세계적으로 DH에 대한 관심이 급증하고 있었고, 한국에서도 디지털 인문학에 대해 배우고 교류하고 싶다는 수요가 일어나기 시작했습니다. 이제는 좀 더 적극적으로 네트워크를 형성해 학생들의 활동 무대를 넓혀야겠다는 확신이 들었습니다.

마침 당시 문화콘텐츠학 분야 교수님들, 인문학 기반의 콘텐츠 활동가 분들이 적극적으로 호응해 주셔서 한국디지털인문학협의회(KADH)라는 조직을 결성할 수 있었습니다.

협의회를 만들 때부터 제가 중요하게 생각한 목표 중 하나는 해외 연구자들과의 네트워크 강화였습니다.

디지털 인문학은 디지털 세계를 무대로 활동하는 만큼, 전통 인문학보다 훨씬 국제적 소통의 폭이 넓습니다. 더구나 한국의 디지털 인문학이 하버드 와그너 교수의 문과방목 연구에서 출발했다는 사실 자체가, 한국 DH는 애초부터 국제적 배경을 갖고 있다는 점을 시사한다고 생각했습니다. 그래서 ADHO(Alliance of Digital Humanities Organizations) 관계자들을 만나 한국 DH를 소개했고, KADH의 ADHO 구성체(Constituent Organization) 가입, DH 세계대회 한국 유치 등의 일을 일들을 추진했습니다.

하지만 어느 순간 “이대로는 안 되겠다”는 판단을 하게 되었습니다. 조직 이름은 생겼지만 활동의 중심이 저와 우리 대학원에만 쏠려 있는 상황에서는, ADHO 멤버가 된다 해도 역할을 지속하기 어렵고, 설령 세계대회를 유치하더라도 한국 사회에 실질적 임팩트를 남기거나 더 발전적인 기반으로 이어지기 어려우리라는 판단이 들었습니다.

그래서 퇴직 2년을 앞둔 2022년 중반, 한국 DH를 대표할 새로운 후속 리더십 체계를 구축하는 계획을 세웠습니다. 먼저 국내 각 대학에서 DH 활동을 하는 학자들을 조사해, 2022년 한국 DH 대회에 발표자·토론자로 초청했습니다. 이 명단은 단순한 학술대회 참여자 리스트가 아니라, 디지털인문학협의회의 미래를 책임질 분들을 발굴하기 위한 명단이었습니다. 학술대회가 끝난 뒤 뒤풀이 자리에서 그분들을 하나의 TF로 묶었고, 우리가 국제적 네트워크 속에서 추진해온 미션을 설명하며 적극적으로 역할을 맡아 달라고 간청했습니다.

그 후속 체제가 빠르게 정착될 수 있도록 저는 회장직을 내려놓았고, KADH가 보다 넓은 학문 공동체의 참여 아래 협동적 조직으로 새 출발을 할 수 있게 되었습니다. 허수 선생님 포함해 박진호 회장님과 KADH 리더 그룹이 헌신적으로 역할을 해 주신 덕분에 KADH는 ADHO의 CO 멤버가 되는 성과를 거두었고, 결국 2026년 디지털 인문학 세계대회가 한국 대전에서 열리게 되었습니다.

【허】 네, 알겠습니다. 저도 그때 일이 생생하게 기억납니다. 개인적으로도 그때 토론자로 참여해 KADH 참여 제의를 받았는데, 지금 생각해도 매우 영광스럽게 여기고 있습니다. 돌이켜보면, 그 과정 자체가 선생님께서 오래 고민해 오신 한국 디지털 인문학의 방향이 구체적 시스템으로 자리 잡기 시작한 계기였던 것 같습니다.


IV. 미래 전망과 제언

질문10. AI 시대 디지털 인문학의 방향 + 질문11. 후학들을 위한 조언

【허】 다음은 디지털 인문학의 전망과 제언에 관해 여쭙고 싶습니다. 아까도 여러 차례 말씀하셨습니다만, 인공지능 시대에 디지털 인문학이 어떻게 나아가야 하는가에 대해 다시 한번 설명해 주시면 좋겠습니다. 현재 각 학문 분야에서 인공지능의 영향에 대해 두려움과 호기심이 공존하고 있습니다. 효율성을 극대화해 적극적으로 활용해야 한다는 입장부터, 두려워하며 배척해야 한다는 태도까지 극단이 공존하는데, 양쪽 모두 바람직하다고 보긴 어렵습니다. 그래서 좀 더 구체적인 방향, 그리고 그 속에서 인문학이 지켜야 할 핵심 가치가 무엇인지에 대해 말씀해 주시면 감사하겠습니다.

【김】 얼마 전 허수 선생님께서 “인공지능 시대에 인문학의 역할이 무엇이라고 생각하느냐”고 물으셨을 때, 저는 “인공지능을 가르치는 인문학”이 당면한 미션이라는 말씀을 드렸습니다.

그러자 선생님께서 “우리가 가르칠 수 있는 것을 인공지능이 모두 배우게 되면, 결국 가르칠 것조차 없어지는 것 아니냐”고 반문하셨지요. 사실 많은 사람들이 이미 그렇게 예상하고 있습니다. 앞으로 일정 기간 동안은 인공지능이 도구인 시대가 계속될 것이고, 그 도구를 활용해 인류가 할 수 있는 일은 매우 많을 것입니다. AI와의 협업은 효과를 높이고, 경제적·예술적 성과도 확대할 것입니다. 그러나 그런 동반자적 관계를 유지하는 동안, 인공지능에 대한 인간의 의존도는 급속히 높아질 것입니다. 지금은 인간의 능력과 노력이 인공지능에 반영되는 단계이지만, 결국은 인공지능이 인간보다 더 많은 것을 더 잘하게 되는 ‘ASI(Artificial Super Intelligence)’ 시대가 올 것입니다.

얼마 전 99세 장모님을 요양원으로 모셨습니다. 시설은 실버타운보다 훨씬 안전하고 쾌적했으며 자녀들도 자주 찾아뵙는데, 장모님은 그곳이 싫다고 하셨어요. 아무리 좋은 시설과 친절한 보살핌이 있더라도, 자율성을 잃고 타인의 통제를 받는 공간이라고 느끼셨던 것 같습니다.

저는 이 경험을 보면서 인공지능 시대의 인간을 떠올렸습니다. AI가 너무 많은 일을 잘해 주는 미래에는, 인간이 스스로 개척해야 할 일이 줄어들고 ‘삶의 이니셔티브(주도권)’를 점점 잃어갈 가능성이 있습니다. 이로 인해 삶의 의욕을 잃고, 궁극적으로 인류가 소멸로 향할 것이라는 비관론도 존재합니다. 저는 비관론자는 아닙니다. 그러나 특이점을 넘어선 AI 시대가 인류 소멸의 방향으로 가지 않도록 노력해야 한다고 생각하며, 그래서 미래 인문학의 역할이 중요하다고 봅니다.

즉, ‘AI 시대에 인간이 자기 삶의 이니셔티브를 유지할 수 있도록 돕는 것’, ‘AI의 지배가 아니라 인간 스스로 주도적 삶을 살아갈 정신적·문화적 역량을 지키는 것’, 이것이 미래 인문학의 핵심적 목표이자 방향입니다. 그 미래 인문학은 AI를 외면하거나 디지털을 거부하는 방식으로 갈 수 없습니다. AI는 이미 시대의 흐름이고, 그 흐름을 배척하는 시각은 더 이상 문제가 되지 않을 것으로 생각합니다. 제가 오히려 걱정하는 것은, AI가 너무 빠르게 제도와 일상을 바꿔 놓는 상황에서 우리가 그 변화를 좇느라 전통 인문학이 지켜온 인간 중심적 사유의 유산을 소홀히 하는 일입니다. AI로 인한 인간 소외가 미래 인류의 문제로 예견된다면, 그 문제에 대응하고 해결책을 모색할 능력을 기르는 것이 미래 인문학의 과제입니다. 저는 전통 인문학이 간직하고 있는 인문주의적 가치·사유·담론이 미래 인문학에서도 중요한 역할을 할 것이라고 믿습니다. 인간의 자존심을 지켜주는 최후의 보루로서 말입니다.

그렇다고 해서 현대 인문학자들의 학술 활동이 미래에도 그대로 이어질 것이라고는 생각하지 않습니다. 요즘의 인문학자들이 학술적이라고 여기는 일 가운데에는 AI에 의해서 무너지거나 대체되기 쉬운 일들이 적지 않습니다. 반면 전통시대에 동서양에서 소위 인문 교양을 함양하기 위해 추구했던 노력이 현대 학술에서는 등한시됐었고 학생들에게도 그 역량을 키우는 교육을 제대로 제공하지 못했는데, 그 전통적인 자유교양적 인문학의 복권이 미래 인문학의 과제일 수 있습니다. 미래의 인문학에 대해 이야기할 때, 디지털과 AI를 도구로 사용하는 것은 더 이상 논란의 여지가 없는 ‘필요 조건’입니다. 그것을 자유롭게 운용할 수 있는 능력 위에서 전통적인 인문학이 추구해 왔던 가치, 인간 스스로 자기 삶을 주도적으로 이끌어가는 인문 정신이 AI 시대에 건강하게 발휘될 수 있도록 하는 것이 미래 인문학으로서 디지털 인문학의 과제라고 생각합니다.

【허】 네, 말씀을 듣고 보니 문제를 정확히 설정하는 차원에서 큰 울림을 주는 말씀인 것 같습니다. 특히 AI 시대의 인간 소외 문제에 대해 인문학이 해법을 모색해야 한다는 점, 그리고 인문 정신과 디지털 마인드를 결합하는 것이 전통과 현대를 조화시키는 길이라는 점이 매우 명확하게 정리가 됩니다. AI 시대의 구체적 방향을 제시해 주셔서 저에게도 분명한 과제로 다가옵니다.

【허】 마지막으로 우리 김바로 선생님하고 김지선 선생님 소감을 듣고 저도 소감 짧게 한마디 하고 마무리하면 어떨까 싶습니다.

【선】 짧게 말씀드리면, 제가 교수님 밑에서 약 10년 동안 공부를 했지만 오늘에서야 교수님께서 해주셨던 여러 말씀의 의미를 이해하게 된 것 같습니다. 사실 요즘 잠이 잘 안 오거든요. AI 시대를 맞아 '과연 내가 뭘 할 수 있을까', '나만이 할 수 있는 일이 무엇일까'에 대한 고민이 깊은데요. 그런데 오늘 교수님께서 말씀하신 것처럼, 인문 데이터를 잘 편찬하는 일이 제가 해야 할 일이라는 점에서 방향성을 다시 확인할 수 있었습니다. 이 자리에 함께할 수 있어서 정말 공부가 많이 되었습니다. 감사합니다.

【바】 네. 저는 교육, 연구, 거버넌스 등 다양한 측면에서 김현 교수님께서 만들어 놓으신 것들이 최소한 위축되지는 않게, 가능한 한 제가 최선을 다해서 발전시킬 수 있게 노력해야겠다는 생각을 했습니다. 감사합니다.

【허】 마지막으로 짧게 소감을 말씀드리겠습니다. 저는 디지털 인문학을 체계적인 제도나 커리큘럼 속에서 배운 것이 아니라, 야전에서 혼자 방황하며 조금씩 익혀온 경우라, 관련 지식과 소양이 비체계적이라는 한계를 늘 느껴왔습니다. 그러다 한국디지털인문학협의회를 인연으로 참여하게 되었고, 오늘 이렇게 인터뷰까지 하게 되었습니다. 그래서 이런 만남이 마치 디지털 인문학이라는 뼈대 있는 집안에 와서 가르침을 받는 느낌마저 듭니다. 한국학중앙연구원 인문정보학 과정의 커리큘럼을 보면서 부러움도 느꼈고요. 오늘 선생님 말씀을 들으면서 참 뜻깊은 시간을 보냈습니다. 특히 오늘 들었던 디지털 인문학이 가진 두 가지 측면에 대한 말씀은 제가 고민하던 지점과 깊이 연결됩니다. 다만 저는 제가 서 있는 구체적인 위치와 장소가 다르고, 제가 만나는 학생들도 현재 짜여져 있는 지배적 제도 아래에서 구체적인 과정을 밟아가고 있는 학생들입니다. 오늘 선생님께 배운 중요한 가르침들을 바탕으로, 이런 학생들에게 어떻게 한 발 더 나아가는 방향을 제시할 수 있을지, 이것이 여전히 제가 풀어야 할 숙제로 남아 있는 것 같습니다. 감사합니다.