Tags:
Topics: 
Node Thumbnail

Baidu เสิร์ชเอนจินรายใหญ่จากจีนได้เปิดตัว SwiftScribe เว็บแอพที่ใช้ในการถอดความเสียงที่อัดโดยใช้ AI ช่วยในการถอดความ

เทคโนโลยีหลักของ SwiftScribe นั้นคือ Deep Speech 2 ซึ่งเป็นเอนจินด้านการจำแนกเสียง โดยเป็น neural network ที่ถูกเทรนโดยใช้ข้อมูลเสียงนับพันชั่วโมง

วิธีใช้ SwiftScribe เพียงแค่ผู้ใช้อัพโหลดไฟล์เสียงในรูปแบบไฟล์ wav หรือ mp3 ระบบก็จะประมวลผลให้โดยอัตโนมัติ ซึ่งระบบของ Baidu รองรับไฟล์ได้ถึง 1 ชั่วโมง และใช้เวลาเพียง 20 นาทีในการถอดความ แต่การถอดความก็ยังไม่ค่อยสมบูรณ์นัก ผู้ใช้ยังจำเป็นต้องใส่เครื่องหมายวรรคตอน, เปลี่ยนตัวอักษรตัวเล็ก/ใหญ่ และต้องแก้บางคำที่ซับซ้อนด้วย

SwiftScribe ของ Baidu เป็นบริการเปิดให้ใช้งานฟรี แต่ Wu บอกในอนาคตหวังว่าจะเปลี่ยนเป็นธุรกิจ ส่วนฟีเจอร์อื่น ๆ เช่น การรองรับไฟล์หลากหลายฟอร์แมต, เพิ่มเครื่องหมายวรรคตอน จะตามมาในอนาคต

ที่มา - Baidu Research, VentureBeat

No Description

Get latest news from Blognone

Comments

By: whitebigbird
Contributor
on 14 March 2017 - 09:07 #975058
whitebigbird's picture

หัวข่าว ถอดความเสียง?

By: nutmos
WriteriPhoneUbuntuWindows
on 21 March 2017 - 12:14 #976227 Reply to:975058

ถ้าคิดว่าคำนี้ไม่เหมาะสม ควรจะใช้คำอะไรหรือครับ? ถอดเสียง หรือถอดความ หรืออย่างอื่นครับ

By: whitebigbird
Contributor
on 21 March 2017 - 18:02 #976327 Reply to:976227
whitebigbird's picture

อ้าว ผมนึกว่าตกคำว่า ถอด "ข้อ" ความ ครับ ไม่นึกว่าตั้งใจใช้คำนี้ ถ้าตั้งใจใช้คำนี้ผมว่าก็โอเคนะครับ

ตอนแรกรู้สึกว่ามันแปลกๆ เพราะ ถอด + ความเสียง ซึ่งปกติแล้ว ความ + คุณศัพท์,กริยา,วิเศษณ์ เช่น ความใหญ่ ความขาว ความบึ้ม อะไรแบบนี้ครับ พอเจอ ความ + คำนาม มันเลยรู้สึกพิกล

แต่พออธิบายว่าเป็น ถอดความ + เสียง แล้วก็โอเคครับ

ถ้าให้แนะนำลดความกำกวมก็ "ถอดข้อความเสียง" ครับ

By: bodinmon
AndroidWindows
on 20 March 2017 - 20:24 #976064
bodinmon's picture

น่าสน มีรองรับภาษาอะไรแล้วบ้างครับนี่