Tags:
Node Thumbnail

เรื่องเสียงพูดจากคอมพิวเตอร์ก็เป็นอีกประเด็นที่หลายเจ้าพยายามทำให้เหมือนเสียงมนุษย์มากที่สุด ล่าสุดวิศวกรของกูเกิลทีมหนึ่งได้ตีพิมพ์เอกสารนำเสนอระบบสร้างเสียงพูดตัวใหม่ในชื่อ Tacotron 2 ที่ฟังแล้วแยกแทบไม่ออกว่าเป็นเสียงมนุษย์หรือเสียงจากระบบนี้

Tacotron 2 จะสร้าง spectrogram หรือรูปที่แสดงให้เห็นว่าคำพูดควรจะมีเสียงอย่างไร แล้วเอารูปนี้ไปผ่านอัลกอริทึม WaveNet ของกูเกิลเอง ทำให้ได้เสียงพูดที่เหมือนมนุษย์มาก

นักวิจัยระบุว่าเสียงพูดจาก Tacotron 2 ได้คะแนน Mean Opinion Score (MOS) ที่ 4.53 ในขณะที่เสียงพูดของมนุษย์ที่อัดมาอย่างดีได้คะแนน 4.58 โดย MOS คือคะแนนที่วัดว่าเสียงใดๆ มีความเป็นธรรมชาติแค่ไหน

ตัวอย่างของกูเกิลแสดงให้เห็นว่า Tacotron 2 อ่านข้อความและเข้าใจความแตกต่างระหว่างคำว่า "desert" ที่เป็นคำนาม และ "desert" ที่เป็นคำกริยา หรือคำว่า "present" ที่เป็นคำนาม และ "present" ที่เป็นกริยา ทำให้มันออกเสียงแต่ละคำไม่เหมือนกัน

นักวิจัยได้เปิดหน้าเว็บให้คนมาลองฟังประโยคสั้นๆ เทียบระหว่างเสียงจาก Tacotron 2 กับเสียงมนุษย์ ถ้าสนใจลองกดเข้าไปฟังกันได้ เลื่อนลงมาล่างสุดตรงหัวข้อ Tacotron 2 or Human? และดูเฉลยได้จากที่มา ว่าทายถูกกันบ้างหรือไม่ รวมถึงเข้าไปดูเปเปอร์ฉบับเต็มได้ที่นี่

ที่มา - Inc.

Get latest news from Blognone

Comments

By: mr_tawan
ContributoriPhoneAndroidWindows
on 1 January 2018 - 02:41 #1026209
mr_tawan's picture

ใส่เสียง Miku ด้วยสิครับ


  • 9tawan.net บล็อกส่วนตัวฮับ
By: Witna
ContributoriPhoneAndroidWindows
on 1 January 2018 - 12:23 #1026245 Reply to:1026209

มิกุก็ไม่ใช่เสียงสังเคราะห์ 100% นักครับ มีคนที่ให้เสียงอยู่อีกต่อ

By: mr_tawan
ContributoriPhoneAndroidWindows
on 1 January 2018 - 16:37 #1026263 Reply to:1026245
mr_tawan's picture

ผมคิดว่า น่าจะมีตัวแปรเริ่มต้นบางตัวที่สามารถเปลี่ยนเสียงให้เป็นเสียงของคนอื่นอยู่น่ะครับ

อีกอย่างคือ Vocaloid มันแย่มากเกินกว่าจะเอาไปใช้งานจริงจัง ถ้าเอามาทำตรงนี้ได้ด้วยก็น่าสนใจมาก


  • 9tawan.net บล็อกส่วนตัวฮับ
By: EsaOsy
ContributorAndroid
on 1 January 2018 - 10:51 #1026233

อนาคตจะให้มีเลือกเสียงคนโปรดได้ด้วย อยากได้เสียงหวานๆ จ่ายตัง

By: tg-thaigamer
ContributoriPhoneAndroidBlackberry
on 1 January 2018 - 12:21 #1026243
tg-thaigamer's picture

ถ้าเป็นได้จริงก็ดีเลย อยากให้เสียงผู้ล่วงลับไป ยังอยุ่ไรงี้


มือใหม่!! ใหม่จริงๆนะ

By: winit_a on 1 January 2018 - 15:35 #1026258

อยากได้เครื่องแปลภาษา เรียวไทมเลย เสียงดีแล้ว
กำแพงภาษา จะได้หมดสักที

By: Configuleto
AndroidWindows
on 1 January 2018 - 15:48 #1026260 Reply to:1026258
Configuleto's picture

มาแน่ครับ คำถามคือเมื่อไหร่

อย่างเสียงสังเคราะห์ที่เป็นธรรมชาติแบบนี้ ผมเดาว่าจะมาซักช่วง 2020 แต่ก็ปรากฏในต้นปี 2018 นี่เอง ความรู้สึกผม 'มาเร็วกว่าที่คิดแหะ'

By: zyzzyva
Blackberry
on 1 January 2018 - 16:38 #1026264 Reply to:1026258

มันคือ Pixel Buds ไหม

By: A_Hawkins on 1 January 2018 - 17:58 #1026267

อยากให้ภาษาไทยมีบ้างเร็วๆ เบื่อฟังเสียงกระจกหกด้านแล้ว

By: PowerBerry
Android
on 1 January 2018 - 18:24 #1026269

ต่อไปเราจะเห็น AI ร้องเพลง

By: darkleonic
ContributorAndroidWindowsIn Love
on 1 January 2018 - 19:38 #1026274 Reply to:1026269
darkleonic's picture

อาจจะเป็นวง Claris ก็ได้ครับ


I need healing.

By: iStyle
ContributoriPhoneAndroidSymbian
on 1 January 2018 - 20:06 #1026276
iStyle's picture

แยกไม่ออกจริงด้วย..


May the Force Close be with you. || @nuttyi

By: Jirawat
Android
on 2 January 2018 - 00:22 #1026296
Jirawat's picture

เลียนเสียงนักร้องvitasทีครับ อะอ๊ะอาา

By: impascetic
Android
on 3 January 2018 - 11:42 #1026481

ขอเสียงแบบ Scarlett Johansson