NVIDIA สาธิตปัญญาประดิษฐ์แปลงข้อความเป็นเสียง RAD-TTS ที่เคยเปิดตัวในงาน SIGGRAPH’s Real-Time Live จากเดิมที่เคยระบุว่า RAD-TTS สามารถแปลงข้อความเป็นเสียงโดยควบคุมได้อย่างละเอียดทั้งน้ำเสียง, ระยะเวลาเปล่งเสียง, และพลังในการเปล่งเสียง
การสาธิตรอบนี้แสดงให้เห็นว่าปัญญาประดิษฐ์สามารถแปลงเสียงจากโปรดิวเซอร์ให้กลายเป็นเสียงสังเคราะห์โดยยังเก็บน้ำหนักเสียง, อารมณ์ไว้ได้ครบ แม้เสียงที่สังเคราะห์ออกมาจะเป็นคนละเพศกับผู้พูดก็ตามที และเนื่องจากตัวปัญญาประดิษฐ์สร้างเสียงจากข้อความ ทำให้ก่อนสังเคราะห์เสียงเราสามารถปรับแต่งน้ำโทนเสียงให้ต่างจากตอนบันทึกได้ตามต้องการ
การใช้งานปัญญาประดิษฐ์เช่นนี้อาจใช้สำหรับคนพิการ (แบบเดียวกับกูเกิล) หรือใช้สังเคราะห์เสียงในเกมที่ตัวละครสามารถพูดตามบทพูดตามเนื้อเรื่องได้โดยไม่ต้องอาศัยนักแสดงอัดเสียงไว้ล่วงหน้าทุกบทสนทนา
ที่มา - NVIDIA
Comments
รอ มิกุ ver.ใหม่ เลย ?
ถ้าทำให้ sub เวลาดูหนังมีเสียงได้จะ ดีมาก
ภาษาไทยรอยาวไปสินะ
??
จะทำถึงขั้นสร้างเสียงให้อนิเมชั่นได้ไหมนะ
พอทำอนิเมชั่นมา ก็แค่เขียนบท แล้วสร้างเสียงออกมาแล้วระบุอารมณ์ต่างๆ มิกซ์อัพเข้าไป
CEO CG มีแล้ว
เปลี่ยน text เป็นเสียงก็มีแล้ว
เหลือคนเขียนบทกับ Motion capture ทำหนังได้ละ
ต่อไปอาจะเห็น credit หนังจบใน 1 นาที
ไม่แน่นะ อนาคตอาจจะแค่กำหนดรูปร่างหน้าตา เพศ อายุ กำหนดโลเคชั่นเข้าไป ใส่บท ใส่คำอธิบายแอคติ้ง แล้วก็สร้างออกมาเป็นฉากฉากนึงด้วย AI ทั้งหมดเลยก็ได้
ใช้กับ screen reader #รอเลย
@ Virusfowl
I'm not a dev. not yet a user.