[신부용 칼럼] 한글이 오늘 578돌을 맞았다. 요즈음 한글이 세계적으로 인기라는 소식이 자주 들려 우쭐해진다. 그중에서도 파리올림픽 때 선수와 관중들이 보인 한글에 대한 관심과 유튜브를 통해 심심찮게 소개되는 미국 저명 교수들의 한글 찬사, 미국 거대 기업들이 한글을 인공지능(AI) 기술에 접목시켜 만든 다언어 모델 등이 관심을 끈다.
한 유튜버는 ‘테슬라를 삼킨 세종대왕’이란 영상에서 테슬라가 개발해 자율 주행 모형에 접목시킨 한글 기반 언어 인식 기술이 성능을 인정받았다고 전했다. 테슬라가 한글의 자음 생성 원리를 활용해 ‘th’를 ‘ㄸ’과 ‘ㅎ’ 사이에 존재하는 발음으로 정의했다는 것을 보면 유튜버들이 구독자 늘리려고 지어낸 허튼소리만도 아닌 모양이다.
챗GTP 개발사인 오픈AI가 지난달 발표한 ‘o-1(오-원)’ 모델은 아예 한국인 연구원 정형원 씨가 나서서 한글 문장으로 홍보했고, 그 내용이 국내 방송의 뉴스로 소개되기도 했다. 한글이 정말 AI에 접목되고 있음을 실감나게 하는 대목이다.
이런 현상은 수긍을 넘어 필연이란 생각이 든다. ‘커피’를 미국에선 ‘카ᅋᅵ’, 영국에서는 ‘코ᅋᅵ’라고 한다. 또 프랑스는 ‘꺄ᅋᅦ이’, 스페인은 ‘까ᅋᅦ’라고 한다(oㅍ은 필자가 제안하는 f의 표기법). 전 세계를 겨냥해 AI를 만드는 미국 대기업들은 알파벳으로는 이런 발음의 차이를 나타낼 수 없어 큰 고민이었을 게다.
이들은 K-팝과 오징어게임 등 우리나라 문물을 통해 접한 한글에서 해결책을 찾아낸 것으로 보인다. 정밀한 발음 표기는 국제음성기호(IPA)가 더 낫겠지만 언어학자들도 어려워하는 괴물이라 시장성이 생명인 AI 기술에는 부적합하다.
AI가 탐내는 건 비단 한글이란 글자만이 아니다. 한글을 품고 있는 한국어 역시 AI에 다양한 가능성을 제시한다. 우선 한국어 기반 언어 모형은 발음 영역이 넓어 어떤 언어의 어떤 발음이든 구별해 낸다.
한국어는 소리 기반 언어이므로 맞춤법에 크게 구애받지 않는 것도 큰 장점이다. 예를 들어 ‘아버지’를 ‘아바지’나 ‘아부지’라 해도 그냥 ‘사투리이겠거니’ 하고 여길 뿐 못 알아듣거나 틀렸다고 트집 잡는 사람은 없다.
그러나 영어는 ‘father’의 6글자 중 하나만 틀려도 이해가 잘 안 된다. 가령 ‘f’를 ‘p’로 바꿔 ‘pather’라고 한다면 ‘아버지’로 알아듣는 이는 거의 없다. 오픈AI 정 연구원은 일부러 맞춤법이 크게 틀려 읽기도 어렵게 만든 한국어 문장도 o-1 모델이 완벽한 영어로 번역했다고 자랑했다. 한국어가 아니면 상상하기 어려운 일이다.
AI 개발자들이 느끼는 한국어의 매력은 여기서 그치지 않는다. 한국어는 표현이 풍부해 정황을 아주 정교하게 표현할 수 있다. 수돗물 나오는 소리인 ‘졸졸’, ‘콸콸’ 등의 의성어나 눈 내리는 모양인 ‘펄펄’, ‘소록소록’ 등의 의태어가 발달한 것 말고도 표현 자체가 다양하다.
예컨대 남의 옷에 커피를 엎질렀다면 영어로는 “I am sorry” 하는 게 보통이지만 한국어로는 “미안합니다”나 “죄송합니다”뿐만 아니라 상대방과 상황에 따라 ‘아이고 어쩌나’, ‘어머 어머 어떡해’ 등 매우 다양한 표현이 쓰인다.
외국인들은 미묘하게 변하는 한국어의 존대 표현이 어렵다고 한다. 그러나 AI에게 학습시켜 놓으면 상황을 정교하게 묘사할 수 있으므로 존대 표현이 많은 일본어는 물론 다른 언어로도 미묘한 감정을 잘 드러낼 수 있을 것이다.
이처럼 한글과 한국어로 성능을 격상시킨 AI는 어떤 한경에서든 최고 수준의 언어를 구사할 것이다. 그러나 이들 모형이 구글, 테슬라, 오픈AI등 미국 거대 기업에 의해 독자적으로 개발되고 있다는 게 문제다. 이들의 모형이 완성되면 우리는 그 제품을 사서 써야 한다. 가격에는 기술료도 당연히 포함될 것이다. 한글과 한국어가 세계화되는 건 더없이 흐뭇하지만, 한글과 한국어로 만든 제품에 대한 기술료를 그들에게 지불해야 하는 쓰라림은 각오해야 한다는 얘기다.
이제라도 분발해야 한다. 우리가 더 훌륭한 다언어 모형을 만들어 이들에게 공급하고 이들과 함께 AI를 개발해야 한다. 비록 뒤처져 있지만 우리는 얼마든지 할 수 있다. 아무 기반도 없던 전자, 자동차, 방산 등도 끝내 따라잡지 않았던가. 세종대왕의 후손인 우리가 언어 기술에서 이들을 앞서지 못할 이유가 없다.
한글 연구는 그러나 각종 기술 개발과 확연한 차이가 있다. 기술 개발은 정부의 많은 지원을 받아 왔으나 한글 연구는 그렇지 못했다. 한글의 발전을 가로막는 가장 큰 장애는 외래어표기법이다. 외국어 발음을 제대로 표기하려면 글자와 글자를 자유롭게 합쳐 쓰는 훈민정음의 합용 병서 기능이 필수적이지만 외래어표기법에 의해 막혀 있다. 위에서 본 것처럼 ‘f’ 발음을 합자로 표기하지 못하고 ‘ㅍ’으로 적는 것도 그래서다.
이런 문제를 근본적으로 해결하려면 한글을 자랑만 하지 말고 연구·개발하는 정책을 펴야 한다. 이게 바로 우리가 AI 특수를 누리는 길로 가는 첫걸음이다.