일한기계번역시스템 공동개발

일한번역시스템 공동개발
일한기계번역시스템 공동개발

1990년대 외국어 공부는 매우 어려웠습니다. 지금과 같이 교육 시스템부터 교육 자료들이 많지 않았기 때문입니다. 또한 우리나라의 외국어 교육은 일본의 영향을 받아 선진 시스템이 도입되기 전이기도 했습니다. 따라서 번역이라는 작업도 일반인들에게는 매우 어려웠던 작업이고 컴퓨터의 도움을 받기도 쉽지 않았습니다. 그럴 때 번역 시스템을 개발하던 사람들의 이야기입니다.

언어의 다양성을 극복하기 위한 자동번역시스템

모든 생명체 중에서 오직 인간만이 언어를 사용하고 있다고 한다. 하지만 인간들의 언어는 인종과 지역에 따라서 전부 다르기 때문에 이들 간의 의사소통이 큰 문제로 남아 있다. 인간이 각각의 언어를 갖게 된 데에는 2가지 설이 있다. 그중 하나는 태초에 인간은 모두 같은 언어를 사용하였지만 교만한 인간이 바벨탑을 구축하여 하나님의 권위에 도전하자 이에 분노한 하나님이 바벨탑을 무너뜨림과 동시에 다시는 그러한 일이 없도록 모든 인간에게 각기 다른 언어를 사용케 했다는 것이다. 또 다른 설은 인간이 부족 단위의 생활을 하면서 그들 사이의 의사를 전달할 수 있는 매개체로 언어를 사용하게 되었고 그 언어는 발전에 발전을 거듭하여 인도-유럽어족과 우랄-알타이어족 등으로 세분되었다는 것이다. 이유야 어떻든 그로 인해 우리 인간들은 각기 다른 언어를 사용하게 되었고 그것은 서로 다른 문화권을 낳게 하였다. 따라서 국가 또는 민족 간에 문화나 기술 등을 이해하거나 전달하기 위해서는 그 나라의 언어로 바꿔야 하는 불편함을 겪게 되었고 이것은 기술이나 문화 및 의사 전달이 지체되는 원인이 된 것이다. 오랫동안 인간은 이러한 불편을 해소해 보고자 동시통역 시설 등을 비롯하여 많은 장치들을 만들고자 노력을 해왔다. 이러한 끊임없는 노력이 드디어 결실을 맺어 하나의 기계로 탄생하였다. 이것이 바로 일본어를 한국어로 자동으로 번역해 주는 자동번역시스템이다. ATLAS1/JK프로젝트를 통해 세상에 그 모습을 드러낸 일한(일본어를 한국어로) 기계번역시스템은 최소한 과학기술 분야에서 만큼은 한국과 일본의 언어장벽을 무너뜨린 것이다. 그럼 인류의 개발품 가운데 한 획을 그을 수 있는 이 번역 시스템이 탄생하게 된 역정을 살펴봄과 동시에 구체적인 활용 형태를 알아보자.

한국과 일본이 공동 연구한 세계적 과제

일한 기계번역 시스템은 1982년 12월 제3회 한일-일한 경제협회 장기구상 연구위원회 합동회의에서 공동과제로 채택된 이래 1988년 3월까지 약 4년 6개월 간의 연구 끝에 세계 최초로 개발에 성공 및 실용화를 눈앞에 두고 있다. 우리나라에서는 한국 과학기술원 시스템공학센터(SERI) 자동화 연구그룹의 박동인과 황도삼 팀이 일본에서는 후지쯔가 각각 참여하여 개발한 이 일한 기계번역 시스템은 일본어를 한국어로 일괄 또는 대화 번역하는 것으로 약 6만 단어의 기본어와 1만 단어의 전문어를 수록하고 있다. 이 중 전문어의 경우 컴퓨터 관련 단어가 많은 비중을 차지하고 있다고 한다. 시스템 공학센터 소장 성기수 박사를 추진위원장으로 한 일한 기계번역 시스템 개발에 참여한 두 주역은 박동인과 황도삼 연구원이다. 그중 리더인 황도삼 연구원은 어릴 적 검사의 꿈을 갖고 있었으나 친구의 권유로 컴퓨터에 관심을 갖기 시작하여 대학은 홍익대 전자계산 학과를 대학원은 연세대 전자계산 학과를 나와 전자계산학을 전공으로 삼게 되었다고 한다. 그는 “날아다니는 새에서 힌트를 얻어 라이트 형제가 비행기를 만들었을 때 비록 그것은 불완전한 것이었지만 하늘을 날고 싶다는 인간의 욕구를 충적시켜 주기에는 충분하였지요. 물고기를 응용한 잠수함 개발 역시 마찬가지고요. 중요한 것은 그러한 개발이 인간에게 무한한 가능성을 제시했다는 데에 있어요”라고 일한 기계번역 시스템의 의의를 말한다.

세계적인 결과를 만들어가고 있는 일한 기계번역시스템

대개 기계번역의 경우 그 성공률이 80% 정도만 되면 성공적이라고 할 수 있는데 이번의 경우는 성공률이 90%에 이르러 가히 세계적이라고 하겠다. (이 수치는 일본의 세계적인 과학기술정보망인 JICST 초록과 컴퓨터 매뉴얼 그리고 경제잡지인 닛께이 ELECTRONIC을 그 대상으로 한 결과이다.) 개발 초기에 일어를 몰라 애를 먹었다는 황도삼 리더는 “연구과제가 국제 공동개발이었기 때문에 일본 측과의 사고 차이 및 자료 공개 문제로 인한 마찰 그리고 한글에 대한 기본적인 연구의 미숙 등으로 많은 어려움을 겪었습니다. 게다가 철야작업도 많아 모든 것을 포기하고 싶을 정도였어요. 하지만 국가를 대표하는 연구원이라는 자존심과 일종의 오기와 같은 이상야릇한 것이 마음을 잡아끌어 끝까지 연구에 매달리게 되었어요”라고 그간의 어려움을 토로한다. 계속해서 그는 “흔히 우리나라말과 일어는 어순이 비슷해 배우기가 쉽다고 하지요. 물론 일어가 다른 언어에 비해 어순이 비슷한 것만은 분명합니다. 하지만 번역시스템 개발 상에 있어서는 말처럼 간단한 문제가 아닙니다”라고 덧붙인다. 이러한 어려움은 장원 연구원이 농담 삼아 벗어나고프다고 한 말에서도 충분히 엿볼 수 있었다.

기계 번역은 우리가 지금 사용하고 있는 자동 번역 시스템과는 차이가 있는 방식이지만 일본과 한국이 공동 연구를 통해 개발하고 있었다는 소식이 재미있게 보입니다. 이런 노력들이 있었기 때문에 지금의 번역의 기초가 되었고 그로 인해 많은 발전을 이룰 수 있었던 것 같습니다.

Leave a Comment