Tags:
Node Thumbnail

กูเกิลเปิดตัวปัญญาประดิษฐ์ Lyra สำหรับการบีบอัดเสียงพูด โดยอาศัยโมเดลดึงเอาคุณลักษณะของเสียงในห้วง 40ms ออกมาเป็นข้อมูลขนาดเล็กส่งไปยังปลายทาง และที่ปลายทางจะมีปัญญาประดิษฐ์แบบ generative สร้างเสียงกลับออกมาอีกครั้ง ทำให้ใช้งานได้แม้แบนวิดท์จะต่ำเหลือเพียง 3kbps เท่านั้น (เสียงโทรศัพท์ปกติใช้แบนวิดท์ 64kbps)

แนวทางของ Lyra คล้ายกับกระบวนการแปลงเสียงเป็นข้อความแล้วเอาข้อความไปอ่านออกเสียงที่ปลายทาง โดยทั่วไปแล้วแนวทางเช่นนี้จะทำให้เสียงที่ปลายทางไม่เป็นธรรมชาติ และฟังออกทันทีว่าเป็นเสียงสังเคราะห์ แต่กูเกิลยืนยันว่า Lyra นั้นให้เสียงที่เป็นธรรมชาติกว่ามาก โดยกูเกิลอาศัยข้อมูลฝึกปัญญาประดิษฐ์จากผู้พูดกว่า 70 ภาษาเพื่อให้แน่ใจว่าโมเดลปัญญาประดิษฐ์สามารถถอดเสียงพูดได้ทุกภาษาเท่าเทียมกัน

ตัวเข้ารหัสเสียงตัวอื่นๆ ที่ทำงานที่แบนวิดท์ต่ำเท่า Lyra มักมีเสียงแทรกจนฟังได้ลำบาก ขณะที่ Lyra นั้นสามารถส่งพูดได้อย่างชัดเจนแม้ในภาวะที่มีเสียงรบกวนสูงๆ

กูเกิลเริ่มใช้ Lyra ในแอป Duo สำหรับการโทรศัพท์ในกรณีที่พบว่าผู้ใช้มีแบนด์วิดท์ต่ำมากๆ แล้วและในอนาคตจะพัฒนาต่อเพื่อใช้งานกับกรณีอื่นๆ เช่น ดนตรีหรือเสียงที่ไม่ใช่เสียงพูด

ที่มา - Google AI Blog

No Description

Get latest news from Blognone

Comments

By: tanersirakorn
ContributorAndroidUbuntuIn Love
on 1 March 2021 - 20:27 #1201231
tanersirakorn's picture
By: hisoft
ContributorWindows PhoneWindows
on 1 March 2021 - 21:42 #1201233
hisoft's picture

เก็บข้อมูลได้มหาศาลแบบคนไม่ค่อยบ่นแล้ว

By: Hoo
AndroidWindows
on 1 March 2021 - 22:01 #1201236

ถ้า speech recognize ผิดที่ต้นทาง
ปลายทางก็ออกทะเลเลยสินะ 🤔

By: -Rookies-
ContributorAndroidWindowsIn Love
on 1 March 2021 - 23:36 #1201238 Reply to:1201236

คิดเหมือนกันเลย เริ่มต้นก็จะมีมีมออกมาล้อเหมือน Auto Correction ที่ปรับแก้ผิด ๆ ซักพักจะเริ่มไม่ขำกันละเพราะทำให้คนเข้าใจผิดกันได้ง่าย ๆ หวังว่าจะไม่มีกรณีที่ว่าเกิดขึ้นนะ


เทคโนโลยีไม่ผิด คนใช้มันในทางที่ผิดนั่นแหละที่ผิด!?!

By: modernelf on 2 March 2021 - 08:46 #1201255

นอกจากร้องเพลงแล้วยังมาทำ AI อีกหรอเนี่ย

By: zerost
AndroidWindows
on 2 March 2021 - 09:18 #1201262
zerost's picture

ถ้ามีเทคโนโลยี​นี้เมื่อ 30ปีก่อน เราคงไม่รู้จัก อะบู๊กิด ผัดเผ็ดพะโล้เป็ด หรือ อะเหนกบุม

By: osmiumwo1f
ContributorWindows PhoneWindows
on 2 March 2021 - 09:41 #1201269 Reply to:1201262
osmiumwo1f's picture

ใครรู้จักไอ้ที่ว่ามานี่ โปรดยอมรับว่าตัวเองอยู่วัยกลางคนนะครับ :)

By: johnny.sayasane
ContributorWindows PhoneSymbianWindows
on 2 March 2021 - 14:43 #1201340 Reply to:1201262
johnny.sayasane's picture

5555555


ສະບາຍດີ :)

By: tg-thaigamer
ContributoriPhoneAndroidBlackberry
on 2 March 2021 - 20:59 #1201387 Reply to:1201262
tg-thaigamer's picture

คืออะไรหรอครับ


มือใหม่!! ใหม่จริงๆนะ

By: mr_tawan
ContributoriPhoneAndroidWindows
on 2 March 2021 - 09:44 #1201271
mr_tawan's picture

ถ้าทำ tts นี่ผมว่าน่าจะลงไปต่ำกว่า 3kbps ได้อีกไกลเลยนะ


  • 9tawan.net บล็อกส่วนตัวฮับ
By: SilentHeal
AndroidUbuntuWindowsIn Love
on 2 March 2021 - 14:59 #1201342
SilentHeal's picture

ล้อคำกะ liar เปล่าหว่า แบบแปลงกลับออกมา ได้อีกคำเฉยเลย ไรงี้