วันนี้ทางสถาบันวิจัยปัญญาประดิษฐ์ประเทศไทย (AIResearch) และทีม PyThaiNLP ปล่อยโมเดลถอดความจากเสียงพูดภาษาไทย (Automatic Speech Recognition) ที่มีความแม่นยำทัดเทียมกับกูเกิล และบริษัทชั้นนำอื่น ๆ
โมเดลดังกล่าวฝึกฝนบนชุดข้อมูล Mozilla Common Voice 7.0 ที่ได้รับการบริจาคเสียงภาษาไทย จำนวน 133 ชั่วโมง ผู้พูด 7,212 คน (อ่านเพิ่มเติม ร่วมบริจาคเสียงพูดภาษาไทยด้วย Mozilla Common Voice) โดยฝึกกับโมเดล XLSR-Wav2Vec2 ของ Facebook
ทางสถาบันวิจัยได้ปล่อยโมเดลมาในรูปแบบลิขสิทธิ์ CC-BY-SA 4.0 และได้อัปโหลดขึ้น Hugging Face โดยสามารถใช้งานได้ผ่านไลบรารี transformers ในภาษาไพธอนได้
ท่านที่สนใจสามารถอ่านวิธีการใช้งานได้ที่ Hugging Face
ที่มา: สถาบันวิจัยปัญญาประดิษฐ์ประเทศไทย - Medium

on
จากตารางบอกว่า WEP และ CER
mindphp Mon, 06/09/2021 - 20:51
จากตารางบอกว่า WEP และ CER น้อยจะดีนะ
แต่ของ NECTEC ยังสูงที่สุดอยู่นะ
ตัวในข่าวน่าจะเป็น ours ทั้ง
hisoft Mon, 06/09/2021 - 21:48
In reply to จากตารางบอกว่า WEP และ CER by mindphp
ตัวในข่าวน่าจะเป็น ours ทั้ง 2 ข้อนะครับไม่ใช่ NECTEC
งานนี้ทำโดย "AIResearch
SpeedEX Tue, 07/09/2021 - 13:15
In reply to จากตารางบอกว่า WEP และ CER by mindphp
งานนี้ทำโดย "AIResearch และทีม PyThaiNLP" ครับ ไม่ได้ทำโดย NECTEC
ดี ๆ แจ่ม ๆ
Mr.EYE Tue, 07/09/2021 - 10:32
ดี ๆ แจ่ม ๆ