VALL E는 마이크로소프트의 인공지능 모델인 안드로이드 애플리케이션입니다. AI는 놀라운 정확도로 사람의 말을 모방할 수 있습니다. 3초 동안만 지속되는 음성 녹음 샘플은 훈련에 충분합니다.
작동 방식
ChatGPT와 유사하게, 이 플랫폼은 인공지능 기반 알고리즘입니다. 개발하는 동안 6만 시간 이상의 영어 음성을 포함하는 LibriLight 모음이 사용되었습니다.
그 외에도, 이 모델은 표준 음성 합성 방법과 달리 음파와 함께 작동이 안 됩니다. 신경망은 사람의 말을 특별한 토큰으로 나누면서 그 특색을 드러냅니다. 따라서 사용자는 3초 샘플 이상의 음성을 시뮬레이션할 수 있습니다.
앱은 분노, 기쁨, 혐오 등 다양한 감정을 시뮬레이션할 수 있다는 점에 주목할 필요가 있습니다. 주위의 소리 재생이 가능합니다.
유용성
마이크로소프트는 이 후기 작성 시점에 실험을 위해 알고리즘을 공개하지 않습니다. 이는 공격자가 신경망을 이용할 위험성이 크다는 점과 관련이 있습니다. 사용자는 공식 사이트에서 음성 모방과 시연 샘플을 보고 신경망의 기능을 평가할 기회가 있습니다.
특징
- 알고리즘은 높은 정확도로 사람의 말을 모방할 수 있습니다;
- 주위와 정서적 색채 재현하기가 가능합니다;
- 도구를 만드는 데 EnCodec 기술이 사용되었습니다;
- 최신 안드로이드 버전과 호환됩니다;
- 앱은 무료로 다운을 받아 사용할 수 있습니다.