AI 시대에 귀와 입…스마트 스피커의 다양한 기능
AI 시대에 귀와 입…스마트 스피커의 다양한 기능
  • 아틀라스
  • 승인 2019.04.08 17:41
  • 댓글 0
이 기사를 공유합니다

식당 주문, 사무실 예약, 환자들의 호출버튼, 시각장애자들의 인터넷 접근 등

 

최근 미국의 한 가정에서는 초등학생이 수학 숙제를 인공지능 스피커에 묻고 답을 얻는 모습이 유튜브에 공개되어 화제가 되었다.

한 꼬마아이가 부모를 흉내 내 AI 스피커에 장난감을 주문해 배달 받았다. 이 내용이 뉴스로 전해지면서 수천 명의 시청자들이 AI 스피커를 통해 동일한 제품을 주문하는 일이 벌어졌다.

 

사람의 말을 인지하는 AI 스피커가 확산되고 있다.

회계·자문 회사인 딜로이트 글로벌은 디지털 비서를 갖춘 스마트 스피커 산업이 2019년에 70억 달러의 가치로 커질 것으로 예측했다. 이는 평균 대당 가격을 43달러로 칠 때 16,400만 대가 판매될 것으로 전망한 수치다. 20182분기에 스마트 스피커 판매는 전년 동기 대비 187%가 증가했다.

스마트 스피커 시장은 영어권에서 비영어권으로 확산되는 추세다.

딜로이트 글로벌에 따르면, 2017년 말까지 스마트 스피커 판매는 주로 영어권 시장에 국한되었고, 95% 이상의 매출이 미국과 영국에서 이뤄졌다.

하지만 올해초부터 언어 역량이 영어뿐 아니라 중국어(북경어 혹은 광동어), 프랑스어, 스페인어, 이탈리아어, 일본어 등으로 확장되면서 스마트 스피커 매출이 비영어권에서도 본격적으로 늘어날 것으로 전망된다. 이미 전세계적으로 스마트 스피커의 설치 사용자 기반이 올해 초에 1억대를 초과했다.

지난해 중반 시점에서 스마트 스피커의 침투율은 중국 도시지역 성인의 22%로 확대되었으며, 그 다음으로 미국 성인의 19%가 사용하고 있다.

스마트 스피커의 언어인식도 빠른 속도로 개선되고 있다. 구글의 영어 음성인식 오류율은 20167월의 8.5%에서 20175월의 4.9%로 꾸준하게 하락했다.

게다가 스마트 스피커의 억양 인식수준도 높아지고 있다. 초창기 스마트 스피커는 표준 영어만 잘 이해하고, 지역적 방언 또는 외국인이 사용하는 영어 인식에는 혼란을 일으키곤 해, 정확도가 최대 30%까지 떨어졌었다.

스마트 스피커의 복잡성도 단순화하고 있다. 이는 부분적으로 기기 당 필요한 마이크 숫자의 감소에 따른 것이다. 구글은 자사의 홈(Home) 스마트 스피커를 당초 계획한 8개의 마이크 대신에 2개의 마이크만을 사용하고도 정확도를 떨어뜨리지 않고 출하할 수 있었다. 이같은 인식률의 증가는 사용처를 다양화할 것으로 예상된다.

 

 

스마트 스피커는 무수한 활용처를 발견하고 있다. 딜로이트 컨설팅의 정성일 부사장은 최근 회사 사이트에 게제한 똑똑한 스피커, 귀와 입을 대신할까라는 기고문에서 음성 인식은 드라이브인 식당에서 주문을 받거나 혹은 공유 사무실에서 공간을 예약하는 일과 같은 반복적인 프로세스를 기계화하는 역할을 하게 된다고 설명하고, 다음과 같은 예시를 들었다.

메리어트 인터내셔널 그룹은 자사 호텔 일부에 스마트 스피커(아마존, 알리바바)를 배치할 계획이다. 중국에서만 10만대를 배치할 예정이다. (Wynn) 라스베가스 호텔은 전체 4,748개 객실에 스마트 스피커를 설치했다.

시드니의 한 병원은 침상 곁의 호출 버튼을 업그레이드 하기 위해 스마트 버튼의 사용을 시험해 왔다. 호출 버튼과 달리 환자들이 스마트 스피커를 통해 구체적인 요청을 할 수 있게 했다. 스마트 스피커는 환자의 음성 명령을 통해 TV를 켜고, 블라인드를 내리며, 조명을 끄는 일 등 간단한 과업을 처리할 수 있어 시간과 노동력을 절약한다.

미국에서는 연간 120억 건의 주문이 드라이브스루(DriveThru)를 통해 이루어지는데, 스마트폰이 여기에 적용할수 있다.

전 세계에 시각 장애인이 25,000만명으로 추산되는데, 스마트 스피커는 장애인 또는 문맹인들을 웹에 접속하도록 도와줄수 있다.

 

자료: 딜로이트 컨설팅
자료: 딜로이트 컨설팅

 

가격 하락이 스마트 스피커의 성장을 북돋울 것을 보인다. 최근 80%까지 할인된 스피커가 등장하고 있다. 아직은 스마트 스피커가 일종의 사치품이지만, 가격이 하락하면 저소득층에게도 필수품이 될 것이다.

음성 인식은 다양한 계층에게 혜택을 주게 된다. 사람들이 지금보다 더 스피커에 대고 주문할 것이다. 특히 키보드나 작은 버튼을 다루기 어려운 시각장애자들에겐 큰 도움이 된다.

1997카스파로프라는 세계 최고의 체스 선수는 IBMDeep Blue에게 패배한 이후, 컴퓨터와 팀을 이뤄 최강의 체스팀을 구성해 대회에 참석했다. 하지만 아마추어 선수와 저성능 컴퓨터 조에 패배하고 말았다. 정성일 부사장은 우리가 기술을 적절한 곳에 활용할 수 있도록 배치하고 인간의 역량을 보완해 줄 영역을 찾는 다면, 지금보다 더 나은 세상을 구현할 것이라고 말했다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.