其中VALL E是Android应用程序,是Microsoft Corporation提供的人工智能模型。算法能够非常精确地模拟人类语音。与此同时,只持续3秒的语音记录样本就足以用于训练。
操作原则
与ChatGPT一样,该平台也是基于AI的算法。开发过程中使用了LibriLight库,该库包含6万多小时的英语演讲。
另外,这种模型不像标准的语音合成方法那样适用于声波。这个神经网络揭示了人说话的特点,将其分解为特殊的令牌。这允许您模拟声音的声音,超出三秒的样本。
该算法能够模拟各种情绪,如愤怒、喜悦、厌恶等。播放环境的声音是可能的。
可用性
Microsoft在撰写评论时,不会将该算法发布到公共领域进行实验。这涉及一个事实,即攻击者使用神经网络具有很高的风险。在官方网站上,用户可以查看语音仿真的演示样本,并对神经网络的能力进行评估。
功能
- 算法能高精度地模拟人类语音;
- 再现环境和情感色彩是可能的;
- 在模型创建时使用了EnCodec技术;
- 兼容当前的Android版本;
- 下载和使用免费。