VALL E คือแอปพลิเคชันแอนดรอยด์ซึ่งเป็นโมเดลปัญญาประดิษฐ์จาก Microsoft Corporation อัลกอริธึมดังกล่าวสามารถเลียนแบบเสียงพูดของมนุษย์ด้วยความแม่นยำอันน่าทึ่ง ในขณะเดียวกัน เสียงที่บันทึกตัวอย่างนั้นยาวแค่สามวินาทีก็เพียงพอแก่การนำไปฝึก
หลักของการปฏิบัติการ
เช่นเดียวกับ ChatGPT แพลตฟอร์มนี้เป็นอัลกอริธึมที่ทำงานด้วย AI ระหว่างขั้นตอนการพัฒนาใช้ มีการใช้ LibriLight library ที่รวมถึงคำพูดเป็นภาษาอังกฤษมากกว่า 6 หมื่นชั่วโมง
นอกจากนี้ โมเดลนี้ไม่ทำงานกับคลื่นเสียงแตกต่างจากวิธีสังเคราะห์คำพูดมาตรฐานอื่น ๆ โครงข่ายประสาทเผยฟีเจอร์ของการพูดของบุคคล ที่แตกย่อยออกเป็นเครื่องหมายพิเศษต่าง ๆ สิ่งนี้ทำให้คุณจำลองเสียงของเสียงพูดนอกเหนือจากตัวอย่างสามวินาทีได้
เป็นเรื่องที่ควรสังเกตว่าอัลกอริธึมยังสามารถจำลองอารมณ์ที่หลากหลาย ตัวอย่างเช่น โกรธ มีความสุข ขยะแขยง และอื่น ๆ อีกมาก โปรแกรมสามารถเล่นเสียงของสิ่งแวดล้อม
การเปิดให้ใช้งานได้
Microsoft ไม่ได้เผยแพร่อัลกอรึธึมดังกล่าวแบบเผยแพร่สู่สาธารณะสำหรับการทดลองในขณะที่เขียนรีวิวนี้ สิ่งนี้เกี่ยวข้องกับประเด็นเรื่องความเสี่ยงของการใช้โครงข่ายประสาทในการทำอาชญากรรม ผู้ใช้ดูตัวอย่างการสาธิตของการจำลองคำพูดและประเมินขีดความสามารถของโครงข่ายประสาทได้ที่เว็บไซต์ทางการ
คุณสมบัติ
- อัลกอริธึมมีความสามารถในการเลียนเสียงพูดของมนุษย์ด้วยความแม่นยำที่สูง;
- สามารถสร้างเสียงสิ่งแวดล้อมและการแต่งเติมอารมณ์ให้เสียง;
- ใช้เทคโนโลยี EnCodec ตอนสร้างโมเดล;
- สามารถใช้กับแอนดรอยด์เวอร์ชันปัจจุบัน;
- ดาวน์โหลดและใช้งานได้ฟรี