소강춘(61·사진) 국립국어원장은 6일 서울 중구 한 식당에서 열린 취임 100일 기자간담회에서 “남북 초·중·고교 교과서를 분석해 양측의 전문용어를 데이터베이스(DB)로 구축하는 작업을 추진 중”이라며 “남북통일은 험난한 길이지만 남북의 언어를 통합하는 작업은 쉽게 할 수 있다”고 말했다. 국립국어원은 이를 위해 내부적으로 7000단어 정도를 추출해 놓은 상태다. 예를 들어 북한은 우리가 ‘삼국시대’라고 부르는 시대를 ‘세 나라 시기’라고 쓴다. 소 원장은 “곧 남북 공동연락사무소를 통해 이 사업에 대한 북한의 의견을 타진할 것”이라고 했다.
소 원장은 인공지능(AI)에 활용될 ‘말뭉치(corpus)’ 구축 프로젝트도 설명했다. 그는 “내년 말까지 신문 기사, 국회 속기록, 문학 작품 등을 바탕으로 10억 어절의 DB를 완성할 것”이라며 “앞으로 10년간 150억 어절의 DB를 마련하겠다”고 했다. 말뭉치란 컴퓨터가 이해할 수 있는 형태로 언어 용례를 모은 자료다. 컴퓨터의 음성 인식 기술 등을 높이는 데 활용할 수 있다. 1989년부터 전주대 국어교육과 교수로 재직한 소 원장은 남북 언어, 국어 정보화 등의 분야를 연구했다.
강주화 기자 rula@kmib.co.kr