Tags:
Node Thumbnail

กูเกิลออกมาโชว์ผลงานการแปลงเสียงพูดเป็นข้อความ (transcription) ที่ใช้กับบริการ Voice Mail ใน Google Voice และ Project Fi ว่ามีความแม่นยำเพิ่มขึ้น ข้อผิดพลาดลดลงจากเดิม 49%

เทคนิคที่กูเกิลใช้คือ long short-term memory deep recurrent neural network โดยขอไฟล์ตัวอย่าง Voice Mail จากผู้ใช้งานมาเป็นข้อมูลจริงสำหรับการวิเคราะห์

กูเกิลไม่ได้อธิบายรายละเอียดของเทคนิคดังกล่าว แต่ก็ถือเป็นผลดีสำหรับผู้ใช้ที่ได้ระบบแปลงเสียงพูดที่แม่นยำยิ่งขึ้นครับ

ที่มา - Google Blog

Get latest news from Blognone

Comments

By: sonkub
AndroidWindows
on 24 July 2015 - 13:24 #829512

ทุกวันนี้ที่พูดใส่ google now และ androidwear นี่เก็บ log ไปด้วยหมดเลยมั้ง

By: 100dej
AndroidWindows
on 24 July 2015 - 14:48 #829546

อีกหน่อยระบบดักฟังทางโทรศัพท์ก็ไม่ต้องใช้คนแล้วซินะ
ดักฟังเสร็จก็ search เฉพาะ key word ที่ต้องการได้ทันที

รวดเร็วมาก ๆ