음성합성은 실제 사람 목소리를 활용해 인공음성을 만들어 내는 기술이다. 이용자가 녹음한 음성 파일을 기계가 딥러닝 방식으로 학습해 문장을 따라읽는다. 음소 단위로 학습하는 것이 아니라 어절 단위로 기계가 문장을 통째로 학습하기 때문에 억양도 익힐 수 있다. KT 관계자는 "딥러닝 방식이 적용돼 적은 문장으로도 음성합성이 가능하고 문장 맥락에 따라 억양을 자연스럽게 만들 수 있다"고 말했다. 

이미 많은 정보가 있는 연예인뿐만 아니라 일반인의 목소리도 구현해낼 수 있다는 것이 큰 메리트인 것 같다. 딥러닝 방식으로 소량의 데이터로도 일상 회화가 가능한 정도로 학습할 수 있는 것이다.

부모님이 돌아가시기 전에 일상 생활을 '영상으로 찍어놔라, 전화를 녹음해놔라' 이런 조언을 많이 들을 수 있는데 이러한 음성합성 기술을 통해 학습을 미리 해놓으면 좋을 것 같다.

 

 

 

원문 보기:

https://www.mk.co.kr/news/business/view/2019/05/354975/

 

"어, AI스피커에서 엄마 목소리가 나네?" - 매일경제

짧은 문장 목소리 녹음하면 인공지능이 스스로 음성합성 `내 목소리처럼` 책 읽어줘 가상 앵커·낭독 서비스까지

www.mk.co.kr

 

빅데이터 활용을 떠올리면 '사생활 침해'가 자연스럽게 우려된다.

빅데이터 기술이 발전하면서, 특정 데이터를 수정 및 가공처리하여 본래 목적 외에 2차, 3차 목적으로 활용될 가능성이 증가했다.

 

기사 내용 중

"지금까지 개인 프라이버시 보호와 인공지능 기술 활용은 서로 긴장 관계에 있었다. 좋은 인공지능 모델을 개발하기 위해선 많은 데이터가 필요하다. 하지만 개인정보를 보호를 위해선 데이터를 기업 등이 마음껏 수집하지 못하게 하는 규제가 필요하다. 둘이 서로 대립하는 것은 당연해 보인다. 대표적인 것이 의료 데이터다. 질병 기록이나 디엔에이(DNA) 자료 등은 개인의 민감한 개인 정보이면서, 동시에 질병을 퇴치하고 신약 개발 등을 위한 연구에 귀중한 데이터이기도 하다. 프라이버시와 인공지능, 양립할 방법은 없을까?
둘이 양립하게 도울 수 있는 새 인공지능 기술이 최근 주목을 받고 있다. 바로 연합학습(FL·Fedreated Learning)이다. 미국 매사추세츠공대에서 발간하는 <엠아이티 테크놀로지 리뷰>(MIT Technology Review)는 지난 11일 이 기술이 “프라이버시 위협 없이 의료 데이터를 활용할 수 있는” 새로운 가능성을 열고 있다고 소개했다. 스타트업 관련 매체 <벤처비트>는 이달 초 열린 ‘텐서플로 개발자 대회’에서 이 기술이 단연 주목을 받았다고 소개했다. 텐서플로는 구글이 공개한 오픈소스 기계학습 플랫폼이다."

대표적인 예로 '의료 데이터'를 말하고 있어 이 기사에 눈길이 갔다.

내가 현재 하고 있는 프로젝트가 의료 데이터와 밀접한 관계를 맺고 있다. 의료 데이터는 현재 각 의료 기관에 분산되어 있으며 수집 및 활용이 굉장히 어렵다. 의료 데이터 소유자가 병원처럼 되어 있는데, 환자의 의료 데이터는 환자 본인 소유이다. 따라서 환자가 자신의 의료데이터 수집과 활용을 동의한다면 데이터들을 수집 가능하다고 보았다. 그리고 나는 그것을 '블록체인'을 활용해야 한다고 생각했다.

하지만 이 기사를 읽어보면 각 환자의 데이터를 다른 곳으로 이동시키지 않고 연합학습 모델이 찾아가서 배우는 식이라고 되어있다. 데이터를 하나의 서버로 모으는 것이 아니라 모델을 각 데이터가 저장된 곳으로 전송시킨다는 것이 흥미로웠다.

이 기술이 발전된다면 특정 데이터를 가져올 필요 없이 간단하게 각자의 스마트폰에서 인공지능 모델을 학습시킬 수 있는 것이다. 개개인의 인공지능 모델을 개발할 기회가 생긴다고 해석할 수 있을 것 같다.

 

 

원문보기: 
http://www.hani.co.kr/arti/science/science_general/887030.html#csidxc62a620113ab739a600dd22c5b66642 

+ Recent posts