딥러닝, 사랑하는 사람의 목소리로 말하다

 In Cloud, Machine Learning/AI

지난해 12월 AIA 생명이 갑작스러운 사고로 사랑하는 가족을 잃은 사람들이 겪는 심리적 스트레스를 치유하는 과정을 담은 캠페인 동영상 마지막 인사를 선보였습니다. 캠페인은 갑작스러운 사고로 가족을 잃은 아픔을 가진 동영상 주인공들의 심리 치료과정을 보여줍니다. AIA 생명은 치료 마지막 날 이들의 치료를 위해 세상을 떠난 가족의 음성을 재현하는 캠페인을 진행했습니다.

AI 생명은 심리상담센터와의 협업을 통해 4주간 심리치료를 제공하고,  치료 마지막 날 가족에게 편지를 써 읽음으로써 하지 못한 말을 할 기회를 마련했습니다.  편지를 읽은 후 이별한 가족으로부터 답장을 받을 수 있도록, 최첨단 이미지 복원 기술을 이용해 떠난 가족의 얼굴을 움직이는 것처럼 만들고 딥러닝 기술을 기반으로 한 음성합성기술을 활용해 가족의 목소리를 구현했습니다. 하늘에 있는 가족과의 ‘마지막 영상통화’를 가능하게 한 것입니다.

AIA 생명의 캠페인을 가능하게 한 음성 합성 기술의 기본적인 원리는 문자를 음성으로 변환하는 문자 음성 자동변환(Text to Speech, TTS)기술 입니다. 사람의 목소리를 녹음해 문자로 변환하는 것이 음성 인식이라면, 음성 합성은 반대로 문자를 음성으로 바꾸는 것이라 할 수 있습니다.

음성 합성 기술이 이미 존재했던 기술 임에도 불구하고 최근에서야 과거와 다르게 자연스러운 기계음을 낼 수 있게 된 이유는 무엇일까요?  답은 딥러닝기술에 있습니다. 음성 합성을 통해 목소리를 자연스럽게 하는 데에는 충분한 양의 데이터가 필요합니다. 컴퓨터가 더 많은 사람의 목소리를 듣고 학습하여, 문맥에 따라 높낮이, 강세, 길이를 다양하게 발음하는 방법을 터득하게 된 것입니다.

2016년 알파고의 등장으로 인공지능에 대한 관심이 커지며 머신러닝과 딥러닝 기술에 대한 관심도 함께 높아지고 있습니다. 이에 “머신러닝과 딥러닝 같은 거 아니야?” 하시는 분들을 위해 두 기술의 차이를 소개해 드리려 합니다.

머신러닝이나 딥러닝 모두 크게는 학습 모델을 제공해 데이터를 분류하는 데 사용되는 기술입니다. 하지만 두 기술 사이에는 정확한 차이가 존재합니다. 머신러닝은 인간이 먼저 데이터를 처리한 후 알맞게 분류하여 컴퓨터가 인식할 수 있게 합니다. 이를 바탕으로 컴퓨터는 분류된 데이터를 분석하여 인사이트를 제공합니다 하지만 딥러닝의 경우 인간의 작업이 제외됩니다.  분류되지 않은 기존의 데이터를 컴퓨터가 스스로 분석한 후 답을 찾습니다.

따라서, 딥러닝은 방대한 양의 데이터를 처리할 수 있으며 사용자의 많은 지식과 노력 없이도 높은 수준의 결과를 얻을 수 있다는 장점이 있습니다. 이에 반해 머신러닝은 사용자의 목적에 따라 접근 방식을 선택할 수 있다는 장점이 있습니다. 즉, 머신러닝은 인공지능을 구현하는 구체적인 접근 방식이며, 딥 러닝은 완전하게 머신 러닝을 실현하는 기술이라 말 할 수 있습니다(nvidia).

4차 산업혁명의 영향 속에서 음성 합성 기술, 머신러닝과 딥러닝 기술의 중요성은 나날이 높아지고 있습니다.  이제 우리는 딥러닝 기술의 발전으로 누구나 개인이 원하는 목소리를 만들 수 있게 되었습니다. 아마존 ‘에코'나 SK텔레콤'누구’와 같은 인공지능 스피커, 네이버의 통역앱 ‘파파고’에도 음성 합성 기술을 확인할 수 있습니다. SM 엔터테인먼트는 소속 연예인들의 음성에 기반한 인공지능 AI 비서 서비스를 만들겠다는 계획을 발표해 화제가 되기도 했습니다.

SAP의 솔루션에서도  머신러닝 딥러닝 기술을 찾을 수 있습니다. 그 중에 하나는 SAP Cloud Platform에서 제공하는 다양한 SaaS 형태의  앱입니다. 대표적인 SaaS앱은 재무 부서를 위한 SAP Cash Application, 고객 서비스 센터를 위한 SAP Service Ticket 마케팅 부서를 위한 SAP Brand Impact입니다. 이 외에도 SAP는 14년 이후 머신러닝 조직을 만들어 머신러닝 앱 상용화 기술을 더욱 발전 시킬 계획임을 밝혔습니다.

SAP 딥러닝/머신러닝 어플리케이션 한 눈에 보기>

또한 SAP는 엔디비아와 전략적 파트너십을 통해 엔디비아의 딥러닝 전용 GPU 하드웨어를 활용하고, 구글과 협업하여 머신러닝 백엔드 프레임워크로 텐서플로우를 활용하고 있습니다. 이 밖에도 SAP는 머신러닝/딥러닝 기술을 기반으로 다양한 솔루션 SaaS을 통해 대량의 데이터를 학습시켜 업무의 효율성을 높이는 솔루션을 확보할 전망입니다.

[Reference]

SAP 공식 홈페이지 – 머신러닝 Application

시사프레스-이젠 누구나 문재인 대통령의 ‘랩’을 들을 수 있다

뉴스 비전 – “텍스트만으로도 인공지능은 감동적인 연설을 한다”…떠오르는 AI음성합성기술

조선비즈-소녀시대,엑소목소리 AI비서는 꿈이 아니라 현실

지디넷 코리아 – SAP “기업용 SW에 쉽게 AI 통합 가능”

지디넷코리아 – 머신러닝,딥러닝 뭐가 다를까

NVIDIA Korea – 인공 지능과 머신 러닝, 딥 러닝의 차이점을 알아보자

Multi-Speaker Tacotron in TensorFlow

[Image Reference]

AIA 생명 /  carped 20 / steemit / Towarddatascience / 구글 스토어 파파고 / Epickonic

Recommended Posts

댓글 남기기

Start typing and press Enter to search