음성합성은 실제 사람 목소리를 활용해 인공음성을 만들어 내는 기술이다. 이용자가 녹음한 음성 파일을 기계가 딥러닝 방식으로 학습해 문장을 따라읽는다. 음소 단위로 학습하는 것이 아니라 어절 단위로 기계가 문장을 통째로 학습하기 때문에 억양도 익힐 수 있다. KT 관계자는 "딥러닝 방식이 적용돼 적은 문장으로도 음성합성이 가능하고 문장 맥락에 따라 억양을 자연스럽게 만들 수 있다"고 말했다. 

이미 많은 정보가 있는 연예인뿐만 아니라 일반인의 목소리도 구현해낼 수 있다는 것이 큰 메리트인 것 같다. 딥러닝 방식으로 소량의 데이터로도 일상 회화가 가능한 정도로 학습할 수 있는 것이다.

부모님이 돌아가시기 전에 일상 생활을 '영상으로 찍어놔라, 전화를 녹음해놔라' 이런 조언을 많이 들을 수 있는데 이러한 음성합성 기술을 통해 학습을 미리 해놓으면 좋을 것 같다.

 

 

 

원문 보기:

https://www.mk.co.kr/news/business/view/2019/05/354975/

 

"어, AI스피커에서 엄마 목소리가 나네?" - 매일경제

짧은 문장 목소리 녹음하면 인공지능이 스스로 음성합성 `내 목소리처럼` 책 읽어줘 가상 앵커·낭독 서비스까지

www.mk.co.kr

 

+ Recent posts