Ein Modell der künstlichen Intelligenz der Microsoft Corporation namens VALL E ist als Android-App verfügbar. Das System ist in der Lage, die menschliche Sprache genau zu imitieren. Dabei reicht eine dreisekündige Probe einer Sprachaufnahme für das Training aus.
Funktionsprinzipien
Diese Plattform verwendet einen KI-basierten Algorithmus, genau wie ChatGPT. Bei der Entwicklung wurde die LibriLight-Sammlung verwendet, die mehr als 60.000 Stunden englischer Sprache enthält.
Darüber hinaus verwendet dieses Modell keine Schallwellen wie herkömmliche Sprachsynthesetechniken. Das neuronale Netzwerk dekodiert die Sprache eines Sprechers in einzelne Token, um die Qualitäten seiner Sprache zu erkennen. Dies ermöglicht die Simulation von Stimmklängen, die länger als eine drei Sekunden lange Probe sind.
Es ist wichtig zu wissen, dass der Algorithmus eine Vielzahl von Emotionen imitieren kann, darunter Wut, Freude, Ekel und so weiter. Die Geräusche der Umgebung können abgespielt werden.
Verfügbarkeit
Zum Zeitpunkt des Verfassens dieses Beitrags stellt Microsoft den Algorithmus nicht öffentlich zum Testen zur Verfügung. Das hat mit dem erheblichen Risiko zu tun, dass Angreifer das neuronale Netzwerk nutzen könnten. Auf der offiziellen Website können Benutzer Demonstrationsbeispiele der Sprachsimulation ansehen und die Fähigkeiten des neuronalen Netzwerks beurteilen.
Leistungsmerkmale
- das Programm ist hervorragend in der Lage, die menschliche Stimme genau zu imitieren;
- die Umgebung und die emotionale Färbung können nachgebildet werden;
- das Modell wurde mit der EnCodec-Technologie erstellt;
- kompatibel mit den neuesten Versionen von Android;
- kostenlos zu benutzen und herunterzuladen.