VALL E, Microsoft’un yapay zeka modelini inceleyebileceğiniz bir Android uygulamasıdır. Algoritma, insan konuşmasını yüksek doğrulukla taklit edebilmektedir. Belki de en çarpıcı detay ise taklit etmek için yalnızca üç saniyelik ses kaydı örnekleri kullanmasıdır.
Çalışma prensibi
Tıpkı ChatGPT gibi bu platform da yapay zeka tabanlı bir algoritmadır. Geliştirme sürecinde 60 bin saatten fazla İngilizce konuşma içeren LibriLight kütüphanesi kullanılmıştır.
Üstelik bu model standart konuşma sentezleme yöntemleri gibi ses dalgaları ile çalışmamaktadır. Yapay sinir ağı, bir kişinin konuşma biçimindeki özellikleri belirleyerek bunları özel token’lara ayırır. Bu sayede üç saniyelik bir ses örneğinden bile konuşma sentezi oluşturabilmektedir.
Üstelik algoritma öfke, neşe, tiksinti duyma gibi çeşitli duyguları da yansıtabilmektedir. Konuşma eşliğinde çevredeki sesleri de oynatır.
Kullanılabilirlik
Microsoft henüz algoritmasını herkese açık şekilde paylaşmış değildir. Bu yapay sinir ağı teknolojisinin paylaşılması durumunda art niyetli kullanıcıların kötü amaçlarla bu teknolojiyi kullanması riski doğmaktadır. Bu sinir ağı herkes ile paylaşılana dek resmi web siteleri üzerinden yapay zekanın neler üretebildiğinizi görebilir ve inceleyebilirsiniz.
Özellikler
- İnsan konuşmasını yüksek doğrulukla taklit edebilen bir algoritmadır.
- Çevresel sesleri ve duygusal tonlamayı üretebilir.
- Model, EnCodec teknolojisi kullanılarak geliştirilmiştir.
- Güncel Android sürümleriyle uyumlu.
- Programı indirmek ve kullanmak ücretsiz.