아마존·MS 음성 인식률 향상 위해 본격적 데이터 확보 나서
LG전자·삼성전자 스마트폰 등에 AI 음성 비서 서비스 도입
[미디어펜=홍샛별 기자]음성을 인식하는 인공지능(AI) 비서의 시대가 활짝 열릴 전망이다.

10일 업계에 따르면 인공지능을 탑재한 음성 인식 비서 서비스를 제공하는 기업들이 음성 인식률을 높이기 위해 본격적인 데이터 확보에 나섰고, 삼성전자·LG전자 등 국내 기업들도 AI 음성 비서 서비스를 잇따라 선보일 계획이다. 

   
▲ 음성 인식 인공 지능 서비스 '알렉사'(Alea)를 탑재한 아마존의 에코(Echo) /아마존


최근 미국에서는 아마존의 음성 인식 인공 지능 서비스 '알렉사'(Alexa)가 뉴스 속 앵커의 발언을 주인의 명령으로 착각, 아마존에 물건을 주문하는 사례가 발생했다.

이처럼 AI 비서들은 아직까지는 TV나 라디오에서 흘러 나오는 사람의 목소리를 주인의 실제 명령과 구분하지 못하는 실정이다. 

이에 서비스 제공 업체들은 비서들의 음성 인식률 향상을 위한 본격적 데이터 확보에 나선다. 가능한 많은 데이터를 수집해 TV 등에서 나오는 소리를 잡음으로 판단할 수 있도록 딥 러닝 기법을 동원해 교육시킨다는 방침이다.

음성 인식 비서 '코타나'를 서비스하는 마이크로소프트(MS)는 소음과 주인의 음성을 보다 정확하게 구분해 내기 위해서 앱을 제작해 배포했다. 이 앱은 사용자들이 게임을 하거나 영화를 볼 때 나누는 대화를 수집한다. 

   
▲ MS의 코타나 /MS


미국 소비자 만족도 최고를 기록하고 있는 알렉사도 진화를 거듭하고 있다. 블루투스 스피커 형태의 에코(Echo)에 탑재된 알렉사는 사용자의 음성을 알아듣고 에코에 연결된 네트워크를 통해 각종 정보를 수집, 해당 결과를 알려준다. 

아마존은 알렉사를 자동차에 적용하기 위해 도로 소음과 차의 창 내리는 소리 등을 분리하는 소음 제거 기술 개발에 공을 들이고 있다. 

중국의 바이두(Baidu) 역시 지난해 9월 AI 기반 음성 인식 시스템 '딥 스피치 2(Deep Speech 2)'를 소개했다. 

바이두는 방언이 활성화된 중국의 특성을 감안, 방언 수집을 하고 있다. 지난해 설날에는 전국 각지에서 사용되는 방언 수집 캠페인을 개최, 2주만에 1000시간 분량의 음성을 녹음했다. 

이런 노력의 결과일까. 딥 스피치 2는 다른 말투나 사투리·시끄러운 환경 속에서도 높은 인식률을 보여 준다. 딥 스피치 2의 음성 인식 정확도는 97%로 알려졌다.

국내 기업들의 AI 음성 비서 서비스 도입도 눈길을 끈다. 

LG전자는 아마존·구글 등 AI 플랫폼을 갖춘 글로벌 업체와 손잡고 AI 음성 비서 서비스를 준비 중이다. 기존 LG전자가 보유하고 있던 '큐보이스'의 음성 비서 기능의 한계점을 극복하기 위함이다.

큐보이스는 음성 인식 이후 필요한 정보를 제공하기는 하지만 AI 음성 비서처럼 자연어를 인식하지는 못한다. 

지난해 AI 플랫폼 개발사 비브랩스를 인수한 삼성전자도 올해 선보일 갤럭시S8에 음성 인식 개인 비서 기능을 탑재할 예정이라고 밝힌 바 있다. 자체적으로 연구해 온 음성 인식 'S 보이스' 등을 비브랩스의 플랫폼에 결합해 경쟁력 있는 AI 서비스를 내놓겠다는 목표다. 

비브랩스의 AI 플랫폼은 자연어 인식이 강점으로 꼽힌다. 비브랩스의 자연어 인지 수준은 인간의 95% 정도로 알려졌다. 단순히 언어를 이해하는게 아니라 자연스러운 문장의 맥락을 이해하는 것을 목표로 끊임없는 연구 개발이 진행 중이다.
[미디어펜=홍샛별 기자] ▶다른기사보기