VALL E est une application pour Android qui est un modèle d’intelligence artificielle de Microsoft Corporation. L’algorithme est capable d’imiter la voix humaine avec une précision étonnante. Par ailleurs, il ne suffit qu’un échantillon d’enregistrement audio qui ne dure que trois secondes pour entraîner l’algorithme.
Principe de fonctionnement
Tout comme ChatGPT, cette plateforme est un algorithme basé sur l’IA. Lors du processus de développement, l’on utilise la bibliothèque LibriLight, laquelle bibliothèque comprend plus de 60 mille heures d’expressions anglaises.
En plus, ce modèle ne fonctionne pas avec des ondes sonores contrairement aux procédés standard de synthèse vocale. Le réseau neuronal révèle les caractéristiques du discours humain, en le décomposant en signes uniques. Cette décomposition vous permet de simuler le son d’une voix au-delà d’un échantillon de trois secondes.
Il convient de noter que l’algorithme peut également simuler plusieurs émotions. Par exemple : la colère, la joie, l’écœurement, etc. Vous avez la possibilité de produire le son de votre milieu environnant.
Accessibilité
Au moment de rédiger une revue, Microsoft ne publie pas l’algorithme dans le domain public à des fins expérimentales. Cela tient au fait que le risque, pour les pirates d’utiliser le réseau neuronal, est élevé. Les utilisateurs ont la possibilité de consulter les échantillons de démonstration de la simulation vocale et d’évaluer les capacités du réseau neuronal sur le site internet officiel.
Fonctionnalités
- L’algorithme est capable d’imiter une voix humaine de manière très précise ;
- il est possible de reproduire le milieu environnant et la coloration émotionnelle ;
- la technologie EnCodec a été utilisée lors de la création du modèle ;
- l’application est compatible avec les versions actuelles d’Android ;
- l’application est téléchargeable et peut être utilisée gratuitement.