작성일: 2010년 10월 13일 수요일

사회가 점점 글로벌화 되면서, 국제적인 정보와 전문적인 정보를 습득할 필요성이 날로 커지고 있습니다. 예를 들어서 비즈니스를 위해 중국의 원단 업체들을 알아보거나, 팝스타 비욘세의 최신 소식을 찾아보거나, 심장질환 약물인 와파린의 상세 효능 및 부작용을 알고 싶어 하는 사람들이 늘고 있습니다. 그런데 이런 정보는 국내보다는 해외에 더 정확한 자료가 많이 있습니다. 또한 여러 자료에 따르면 전세계에서 작성된 문서의 반 이상이 영어이며, 전세계 사용자들이 입력하는 검색어의 반 이상이 영어로 되어있다고 합니다. 반면, 한국어 문서 및 검색어 양은 몇 % 수준에 지나지 않습니다. 따라서 영문 문서를 번역하여 한국어 웹 검색 결과에 포함 시킨다면 사용자가 얻을 수 있는 정보의 양은 폭발적으로 늘어날 것으로 보입니다.

이런 사실을 고려해 구글코리아에서는 영어 문서를 자동으로 번역해 구글 (한국어) 검색결과에 통합하여 보여주는 ‘통합 번역 검색’을 소개하게 됐습니다. 이 기술은 구글이 50 개 이상의 언어로 구축한 인덱스와 더불어 첨단 검색 기술과 번역 기술이 결합하여 탄생했습니다.

통합 번역 검색은 다음과 같이 4단계로 이루어 집니다.
1) 사용자의 검색어를 영어 검색어로 자동번역합니다.
2) 번역된 검색어로 영문 웹을 검색합니다.
3) 영문 웹 결과를 한국어로 다시 번역합니다.
4) 번역된 문서 제목과 스니펫을 한국어 웹 검색 결과에 삽입합니다.

영문에서 번역된 검색 결과는 기존 웹 검색 결과와 유사하나, 제목의 오른쪽에 ’[원문보기]’ 링크가 추가적으로 달려있고, 제목 아래에 번역된 영문 검색어와 함께 ‘영어 문서 번역 결과'를 표시해 놓았습니다. [원문보기] 링크를 통하여 영어로 작성된 원본 문서를 보실 수 있으며, 번역된 영문 검색어를 바로 볼 수 있어 해당 영어 문서가 검색된 이유를 알 수 있습니다.


< 그림: 통합 번역 검색 결과 화면>

통합 번역 검색 결과는 특히 과학기술 분야의 전문 지식, 유명 해외 연예인의 홈페이지, 해외 유명 사이트 검색, 건강 및 의학 전문 지식, 국제 정보 등을 검색할 때 유용합니다. 예를 들어 ’중국 폴리에스터 원사 메이커’, ‘조류는 단세포?’, ‘사파리월드', ‘비관세 무역장벽' 등을 검색하면, 한국어로 작성된 문서에서 찾지 못한 정보도, 영문으로 작성된 전문적이고 신뢰성 있는 사이트를 통해 찾을 수 있습니다. 따라서 영어로 어떤 검색어를 입력해야 할지 모르거나, 영어를 아예 모르더라도 언어의 제약 없이 검색이 가능해지기 때문에 구글 검색이 매우 유용해집니다.

통합 번역 검색은 아직도 현재 진행형으로 발전하고 있습니다. 검색어 번역과 영문 자료 검색은 상당히 실용적인 수준에 도달하였지만, 한국어로 번역된 영문 문서는 아직은 다소 어색한게 사실입니다. 하지만 번역 기술이 날로 발전하고 있는 만큼 몇 년 후에는 사용자들이 번역된 문서에서 더욱 정확한 정보를 찾아내실 수 있을 것으로 예상됩니다.

작성자: 소프트웨어 엔지니어 조성정