VALL E è un’applicazione per Android. Praticamente si tratta di un modello di IA della Microsoft Corporation. L’algoritmo è in grado di imitare il linguaggio umano con una precisione sorprendente. Difatti per l’apprendimento di una voce è sufficiente un campione vocale della durata di soli tre secondi.
Modalità di funzionamento
L’algoritmo è basato sull’intelligenza artificiale, proprio come ChatGPT. Durante il processo di sviluppo è stata utilizzata la banca dati LibriLight che include oltre 60 mila ore di discorsi in inglese.
A differenza dei metodi standard di sintesi vocale, questo strumento non parte dalle onde sonore. La rete neurale è piuttosto in grado di rivelare le caratteristiche discorsive di una persona suddividendole in dei token speciali. In questo modo è in grado di simulare il suono di una voce a partire da un solo campione di tre secondi.
L’algoritmo può anche simulare varie emozioni come rabbia, gioia, disgusto ecc. In più è in grado di riprodurre i suoni ambientali.
Disponibilità
Al momento della scrittura di questa recensione, Microsoft non ha distribuito pubblicamente l’algoritmo. Ciò è legato al fatto che esiste un alto rischio di utilizzo da parte di potenziali criminali. Sul sito web ufficiale, gli utenti possono visualizzare degli esempi di questa simulazione vocale e valutare dunque le capacità della rete neurale.
Funzioni
- l’algoritmo può imitare il linguaggio umano con elevata precisione;
- riproduce l’ambiente e le emozioni;
- per la creazione del modello è stata utilizzata la tecnologia EnCodec;
- compatibile con le versioni recenti di Android;
- scaricabile e utilizzabile gratuitamente.