Tags:
Node Thumbnail

หลังจากที่ผมเขียนมาร่วมกันบริจาคเสียงพูดภาษาไทยด้วย Mozilla Common Voice ลง Blognone ครบ 1 ปี บทความนี้ผมจะมาเขียนบทความว่าเกิดอะไรขึ้นบ้าง เมื่อได้รับเสียงภาษาไทยบริจาคจำนวนมากถึง 300 กว่าชั่วโมง แต่ก็ยังคงต้องการรับบริจาคเสียงกับตรวจเสียงเพิ่มเติม

หลังจากที่ทาง Mozilla ปล่อยชุดข้อมูล Common Voice รุ่นที่ 7 ออกมา ทางสถาบันวิจัยปัญญาประดิษฐ์ประเทศไทย ได้เทรนโมเดล Automatic Speech Recognition ภาษาไทยโดยวัดประสิทธิภาพจาก Common Voice ที่แบ่งใหม่พบว่า มีความแม่นยำทัดเทียมกูเกิลแล้ว ซึ่งถือเป็นโมเดล Automatic Speech Recognition ภาษาไทยที่มีประสิทธิภาพมากตัวหนึ่ง

นอกจากนั้น เสียงภาษาไทยที่เพิ่มเข้ายังช่วยให้เกิดโมเดล Automatic Speech Recognition ภาษาไทยบน Hugging Face ให้เลือกใช้งานมากขึ้น (ตอนนี้มีถึง 3 โมเดล) รวมถึงมี open source ของต่างประเทศอย่าง Coqui เอาไปเทรนโมเดลภาษาไทยอีกด้วย https://coqui.ai/thai/itml/v0.1.0

No Description

กลับมาที่จำนวนชั่วโมงเสียงภาษาไทยใน Common Voice ปัจจุบันเสียง Mozilla Common Voice รุ่นที่ 8 มีจำนวนชั่วโมงเสียงภาษาไทยทั้งหมด 340 ชั่วโมง แต่ยังมีจำนวนชั่วโมงตรวจสอบเสียงเพียง 142 ชั่วโมง ยังห่างไกลจากเป้าหมายที่จะได้ชุดข้อมูลที่นำไปเทรนโมเดล Automatic Speech Recognition ภาษาไทยให้ได้เข้าใจทุกคนได้ในระดับผลิตภัณฑ์

เป้าหมายของ Common Voice คือต้องมีจำนวนชั่วโมงตรวจสอบ 10,000 ชั่วโมงขึ้นไปต่อภาษา ซึ่งทาง Common Voice ให้เหตุผลว่า “เป็นจำนวนชั่วโมงสำหรับทำโมเดลถอดเสียงเป็นข้อความได้ในระดับผลิตภัณฑ์” ด้วยเหตุนี้ทำให้แม้แต่ ภาษาอังกฤษใน Common Voice ยังไม่ถึงเป้าหมายดังกล่าว (ภาษาอังกฤษใน Common Voice ตอนนี้มีจำนวนชั่วโมงที่ตรวจสอบแล้วกว่า 2,185 ชั่วโมง)

จากจำนวนชั่วโมงการตรวจสอบเสียงที่น้อยกว่าจำนวนชั่วโมงเสียงทั้งหมดของภาษาไทย ทำให้ตอนนี้ Common Voice ภาษาไทยต้องการคนตรวจสอบเสียงภาษาไทยจำนวนมากกว่าการบริจาคเสียง การตรวจสอบเสียงแต่ละเสียงต้องมีผู้ตรวจสอบอย่างน้อย 2 คน ดังนั้นผมจึงขอเชิญชวนทุก ๆ ท่านมาร่วมกันตรวจสอบเสียงภาษาไทยกันครับ

สามารถเข้าไปร่วมตรวจเสียงภาษาไทยใน Common Voice ได้ที่ https://commonvoice.mozilla.org/th/listen

ดูวิธีตรวจสอบเสียงภาษาไทยใน Common Voice ได้ตามวิดีโอข้างล่างนี้ ของคุณ Vee Satayamas

สามารถเข้าไปบริจาคเสียงได้ที่ https://commonvoice.mozilla.org/th/speak

ดาวน์โหลดชุดข้อมูลเสียงภาษาไทย Common Voice รุ่นที่ 8 ได้ที่ https://commonvoice.mozilla.org/th/datasets

กำหนดการปล่อยชุดข้อมูล Common Voice รุ่นถัดไป ทาง Mozilla จะปล่อยทุก 3 เดือน แทน 6 เดือนจากเดิม ซึ่งจะตรงกับวันที่ 24 เมษายนนี้ !!!

อ้างอิง

Get latest news from Blognone

Comments

By: max212
AndroidRed HatSUSEUbuntu
on 9 April 2022 - 10:30 #1245587
max212's picture

555+ ผมเจอประโยคเน็บรัฐด้วย 3 บรรทัดยาวมาก อ่านยังไงก็ไม่ผ่าน ผมแคปจอเก็บไว้ด้วย
"กองทับ กับ สงฆ์ เป็น........."

By: tontan
ContributorAndroidSymbianUbuntu
on 9 April 2022 - 11:21 #1245592 Reply to:1245587
tontan's picture

เจอประโยคไหนไม่เหมาะสมหรือพิมพ์ผิด กด รายงาน ได้ครับ เพราะใช้ระบบ Crowdsourcing ประโยคที่มีในระบบมาจากการบริจาคครับ


บล็อก: wannaphong.com และ Python 3

By: jaideejung007
ContributorWindows PhoneWindows
on 9 April 2022 - 10:28 #1245589
jaideejung007's picture

ผมลองเอามือถือไอโฟนอัดเสียง มีบางประโยคเวลาผมกดฟัง เสียงมันหายไปช่วงท้าย แบบเงียบไปเลย เพราะอะไรนะครับ แต่ประโยคอื่นที่อัดก็เสียงมาครบ แปลกดี

By: tontan
ContributorAndroidSymbianUbuntu
on 9 April 2022 - 14:58 #1245607 Reply to:1245589
tontan's picture

ได้เปิดแยกเสียงไหมครับ น่าจะเพราะเป็นฟังก์ชันแยกเสียงของ iOS ครับ ผมใช้วิธีพูดอัดแล้วเว้นสัก 3 วินาทีค่อยกดหยุดอัด ได้ผลอยู่ครับ


บล็อก: wannaphong.com และ Python 3

By: -Rookies-
ContributorAndroidWindowsIn Love
on 9 April 2022 - 12:22 #1245599

คราวก่อนผมทำอยู่ประมาณเกือบสิบวัน 2-3 วันแรกคนช่วยกันเอยะมาก ๆ ๆ แต่พอผ่าน 2-3 วันแรกเท่านั้นแหละ หายเกือบหมดเลย (ผมก็ค่อย ๆ ลดลง) TT^TT


เทคโนโลยีไม่ผิด คนใช้มันในทางที่ผิดนั่นแหละที่ผิด!?!

By: tontan
ContributorAndroidSymbianUbuntu
on 9 April 2022 - 15:02 #1245608 Reply to:1245599
tontan's picture

TT^TT เป็นโปรเจคที่ต้องการความสม่ำเสมอพอควรครับ แม้แต่ผมยังทำได้แบบมากสุดรายสัปดาห์ ที่เหลือ แบบพอว่าง ๆ ถึงมาช่วยครับ ส่วนตัวผมว่าอัดเสียงง่ายและสะดวกกว่าตรวจสอบเสียงพอควรครับ


บล็อก: wannaphong.com และ Python 3

By: veer
Windows PhoneUbuntu
on 9 April 2022 - 19:52 #1245619 Reply to:1245599
veer's picture

ถ้าช่วยกันทำ 10 ล้านคนแค่ 3 วันก็ได้เยอะครับ ?

By: ปาโมกข์
iPhoneAndroidWindows
on 9 April 2022 - 19:08 #1245615
ปาโมกข์'s picture

อยากให้ได้ตามเป้าหมายไวๆ คงเป็นประโยชน์อีกเยอะเลย

By: veer
Windows PhoneUbuntu
on 9 April 2022 - 19:51 #1245618 Reply to:1245615
veer's picture

แชร์แล้วใช่ไหมครับ ??

By: rattananen
AndroidWindows
on 10 April 2022 - 10:01 #1245632

มันได้เอาไปใช้กับอันนี้หรือเปล่าครับ https://developer.mozilla.org/en-US/docs/Web/API/Web_Speech_API

By: Virusfowl
ContributorAndroidSymbianWindows
on 12 April 2022 - 19:39 #1245779

อันนี้สามารถออกมาเป็น TTS ได้ด้วยไหมครับ เห็นเนื้อข่าวอ้างอิงแต่ Speech Recognition
บ้านเราไม่มี Thai TTS ที่ใช้งานบน Windows เพิ่มเติมมานานมากแล้ว T_T
ล่าสุดก็ต้องรอ Microsoft เพิ่มคุณเปรมวดี เข้ามาใน One Core Voice ซึ่งก็ยังไม่รู้ว่าเมื่อไหร่


@ Virusfowl

I'm not a dev. not yet a user.