Meta โชว์ Voicebox ปัญญาประดิษฐ์สร้างเสียงจากข้อความ, เลียนแบบเสียงใครก็ได้โดยใช้ตัวอย่างแค่สองวินาที – SMS Marketing ราคาถูกที่สุด
ทีมวิจัย Meta AI รายงานถึงปัญญาประดิษฐ์ Voicebox ที่แปลงข้อความเป็นเสียง (text-to-speech – TTS) ด้วยความแม่นยำสูง มีอัตราความผิดพลาดของคำต่ำ และยังสามารถเลียนแบบเสียงใครก็ได้ โดยต้องการตัวอย่างเสียงเพียงสั้นๆ เท่านั้น
ทีมงานสร้าง Voicebox จากหนังสือเสียงภาษาอังกฤษ, ฝรั่งเศส, สเปน, เยอรมนี, และโปรตุเกส รวมข้อมูล 50,000 ชั่วโมง ความสามารถของ Voicebox สามารถเลียนแบบเสียงจากตัวอย่างเสียงสั้นๆ เท่านั้น, สามารถเลียนแบบสไตล์การพูดข้ามภาษาได้ ด้วยการใส่ข้อความภาษาอื่นๆ เข้าไปแม้ว่าตัวอย่างเสียงจะพูดอีกภาษา, ใช้ลบเสียงรบกวนและตัดต่อข้อความได้ โดยการตัดช่วงเวลาที่ไม่ต้องการออกจากตัวอย่าง แล้วใส่แต่ข้อความเข้าไป
Voicebox มีประโยชน์หลายอย่าง เช่น การสร้างเสียงเพื่อทดแทนสำหรับผู้ป่วยที่พูดไม่ได้แล้วให้สามารถสื่อสารด้วยเสียงเดิมของตัวเอง แต่ Meta AI ก็ยอมรับว่ามันมีอันตรายมาก เพราะสามารถใช้สร้างข่าวปลอมได้หลากหลาย ในอนาคตทีมงานจะสร้างโมเดลที่สมจริงแต่ตรวจสอบได้ง่ายว่าเป็นเสียงที่สังเคราะห์ขึ้นมา
ที่มา – Meta AI