Tags:
Node Thumbnail

ทีม AI ของ Google เขียนบล็อคเผยว่าระบบ speech recognition ใน GBoard (พูดแล้วแปลงเป็นคำ) บน Google Pixel จะรองรับการประมวลผลในเครื่องแทนที่จะประมวลผลจากเซิร์ฟเวอร์ในแบบเดิม ช่วยลด latency ในการประมวลผลเสียงเป็นคำลง รวมถึงสามารถใช้ได้แบบออฟไลน์ด้วย

การเปลี่ยนแปลงนี้เกิดขึ้นได้ ส่วนหนึ่งก็จากบน Pixel 2 และ 3 มี Pixel Visual Core ที่รองรับการประมวลผล ML ในเครื่องเลย อีกส่วนคือการเปลี่ยนแปลงโมเดลของระบบ speech recognition จากเดิมที่เป็นแบบ sequence-to-sequence ประมวลผลเสียงพูดออกมาเป็นคำหรือประโยค ซึ่งกระบวนการนี้มีข้อจำกัดเรื่องความหน่วง ไม่รองรับการประมวลผลทั้งขา input (พูด) และ output (แสดงคำ/ประโยค) ในเวลาเดียวกัน

โมเดลใหม่ที่ทีม AI นำมาใช้ใน GBoard คือ RNN-T (Recurrent Neural Network Transducer) ช่วยให้สามารถแปลงจากเสียงเป็นคำได้แบบเรียลไทม์ ซึ่ง Google บอกไม่เพียงแต่ลดความหน่วงลง แต่ยังแม่นยำขึ้นราว 5% รวมถึงตัวโมเดลก็มีขนาดเล็กลง (250MB เมื่อเทียบกับโมเดลเดิมที่ 2GB ก่อนที่ทีม AI จะลดขนาดลงไปอีกให้เหลือเพียง 80MB เพื่อให้เหมาะสมกับการประมวลผลบนมือถือ) รายละเอียดเพิ่มเติมสามารถอ่านได้จากที่มา

No Description

ทั้งนี้ระบบ speech recognition ใหม่บน GBoard นี้รองรับเฉพาะภาษาอังกฤษแบบอเมริกันอย่างเดียวก่อนเท่านั้น

ที่มา - Google AI Blog via Venturebeat

Get latest news from Blognone

Comments

By: hisoft
ContributorWindows PhoneWindows
on 13 March 2019 - 10:35 #1101037
hisoft's picture

อ้าว จำกัดเฉพาะ GBoard อีก น่าจะฝังลงระบบของเครื่องไปเลย

นี่ Android Pie ผมก็ต้องย้ายจาก Microsoft Launcher ไปอยู่กับ Pixel Launcher ไปอย่างนึงละนะ ไม่งั้นเวลาสลับแอปแล้วบั๊กเพียบ (เพราะหน้าสลับแอปมันต้องเรียก Pixel Launcher มาทำงาน คนบ่นกันเพียบ)

By: ripzery
AndroidWindows
on 13 March 2019 - 11:36 #1101069

ลองแล้วเร็วขึ้นมาก แทบจะ real-time เลย

By: hisoft
ContributorWindows PhoneWindows
on 15 March 2019 - 00:15 #1101208 Reply to:1101069
hisoft's picture

ทำไมผมยังไม่ได้อัปเดตเลยครับ T-T

edit - อ้อ มันต้องไปตั้งค่าเพิ่ม ดาวน์โหลดเพิ่มอีกนิดนึง

By: orchidkit on 13 March 2019 - 12:59 #1101097

นอกจาก Pixel มีเจ้าไหนอีกที่มีชิบตัวนี้บ้างครับ

By: willwill
ContributorAndroid
on 14 March 2019 - 16:32 #1101391 Reply to:1101097
willwill's picture

น่าจะยากครับ ชิพนี้ออกแบบโดย Google

By: hisoft
ContributorWindows PhoneWindows
on 26 March 2019 - 00:27 #1103179
hisoft's picture

เร็วมากครับ