ปัจจุบันระบบจดจำใบหน้ามีการใช้งานทั้งในแง่ความสะดวกสบายอย่างการสแกนใบหน้าเพื่อทำธุรกรรมและการยืนยันตัวตนเพื่อความปลอดภัยในการทำกิจกรรมต่างๆ บนออนไลน์ ระบบจดจำใบหน้ายังถูกใช้งานในแง่ความมั่นคงและสอดส่องประชาชนด้วย
ล่าสุดเว็บไซต์ Motherbord ออกรายงานพบว่าตอนนี้หลายๆ บริษัทเทคโนโลยีกำลังวิจัยพัฒนาระบบอ่านริมฝีปาก เริ่มจาก Liopa เป็นสตาร์ทอัพในไอร์แลนด์ พัฒนาแอปพลิเคชั่น SRAVI (Speech Recognition App for the Voice Impaired) เป็นแอปอ่านปากเพื่อประโยชน์ทางการแพทย์ ในกรณีที่คนไข้ต้องการอะไรบางอย่างแต่ไม่สามารถเปล่งเสียงพูดออกมาได้ ก็สามารถใช้แอป SRAVI ช่วยอ่านริมฝีปากคนไข้ โดยขณะนี้ SRAVI กำลังอยู่ในขั้นตอนขอใบรับรองเป็นหนึ่งในอุปกรณ์การแพทย์
อย่างไรก็ตาม ระบบอ่านริมฝีปากจะสร้างความกังวลเมื่อมันถูกนำไปใช้ในวัตถุประสงค์อื่นที่คุกคามสิทธิพลเมืองและความเป็นส่วนตัว ซึ่ง Motherbord พบว่ามีหลายบริษัทกำลังพัฒนาระบบนี้โดยยังไม่เผยจุดประสงค์ว่าจะใช้งานกับใครบ้าง ไม่ว่าจะเป็น Google, Huawei, Samsung และ Sony ต่างกำลังค้นคว้าเกี่ยวกับระบบ VSR (visual speech recognition) และดูเหมือนว่าจะมีความก้าวหน้าอย่างรวดเร็ว

ภาพจาก [SRAVI](https://www.sravi.ai/)
ตัวแอป SRAVI ก็ไม่ใช่แอปพลิเคชั่นเดียวที่ Liopa ทำ ทางบริษัทกำลังพัฒนาระบบเดียวกันร่วมกับกับหน่วยงานวิจัยด้านการป้องกันประเทศของสหราชอาณาจักรเพื่อพัฒนาเครื่องมือที่จะช่วยอ่านปากจากฟุตเทจกล้องวงจรปิด
Motherbord ยังพบบริษัทอีกแห่งหนึ่งที่อ้างว่าขายระบบ AI สำหรับการอ่านริมฝีปาก และได้การตอบรับอย่างเต็มที่ Amarjot Singh ผู้ก่อตั้งและซีอีโอ ของ Skylark Labs บอกกับ Motherboard ว่าบริษัทได้นำเสนอชุดเทคโนโลยี ซึ่งรวมถึงการจดจำใบหน้าและอัลกอริธึมการตรวจจับความรุนแรงและอาวุธให้กับหน่วยงานตำรวจในอินเดีย

ภาพจาก [Skylark Labs](https://skylarklabs.ai/)
เมื่อพูดถึงประสิทธิภาพของระบบอ่านริมฝีปาก ระบบสามารถจับคีย์เวิร์ดจากการพูดเป็นคำได้ แต่ยังจับคำจากการพูดยาวๆ แบบต่อเนื่องไม่ได้ดีเท่าที่ควร งานวิจัยล่าสุดเกี่ยวกับระบบอ่านริมฝีปากที่ Google Deepmind ตีพิมพ์ออกมา ต้องย้อนไปตั้งแต่ปี 2018 พบว่า AI ยังมีความผิดพลาดในการตรวจจับคำถึง 41% การอ่านปากจากคลิปวิดีโอที่ไม่ระบุหัวข้อและบริบท มีอัตราความแม่นยำ 93% และ 86% เมื่อระบุหัวข้อ
ในการใช้ระบบอ่านริมฝีปากจับคีย์เวิร์ดจากคำพูดเป็นคำๆ พบว่าระบบประเภทเดียวกันกับที่บริษัท Liopa และ Skylark Labs ใช้มีความแม่นยำสูง จากเว็บไซต์ paperswithcode.com พบอัตราความแม่นยำตั้งแต่ 83-88%
แม้ระบบอ่านริมผีปากกำลังอยู่ในช่วงเริ่มต้นของการพัฒนา แต่ในขณะที่โลกได้รับบทเรียนจากระบบจดจำใบหน้าแล้ว นักวิชาการหลายคนจึงออกความเห็นว่า การพัฒนาเทคโนโลยีไม่ควรส่งผลเสียต่อผู้ใช้งาน และหากพัฒนาต้องมีการเฝ้าระวังและให้คนจากหลายภาคส่วนเข้ามามีส่วนร่วมตั้งแต่ระยะแรก เพื่อพิจารณาผลกระทบที่เกิดขึ้น
ที่มา - VICE
on
นึกถึงช่องบนยูทูบที่ทำ bad
whitebigbird Thu, 17/06/2021 - 11:17
นึกถึงช่องบนยูทูบที่ทำ bad lips reading
ต่างกำลังค้นคว้าเกี่ยวกับระบบ
hisoft Thu, 17/06/2021 - 11:50
VSR คืออะไรนะครับ
ขออนุญาตต่อตรงนี้นะครับ
Golflaw Thu, 17/06/2021 - 14:30
In reply to ต่างกำลังค้นคว้าเกี่ยวกับระบบ by hisoft
ขออนุญาตต่อตรงนี้นะครับ
กล่าวถึง VSR ครั้งแรกน่าจะระบุด้วยนะครับว่า VSR คืออะไร
จากต้นทาง visual speech recognition (VSR) น่าจะหมายถึงระบบตรวจจับเสียงด้วยภาพ
Google Deepmind ตีพิมพ์ออกมา
tekkasit Thu, 17/06/2021 - 13:14
ผมว่าต้องแปล accuracy เป็นอัตราความแม่นยำ/อัตราความถูกต้อง นะครับ มีอย่างที่ไหน บอกหัวข้อแล้วผิดหนักกว่าเดิม !?!
ผมอ่านแล้วเอ๊ะเหมือนกันเลยครั
sapjunior Thu, 17/06/2021 - 13:52
In reply to Google Deepmind ตีพิมพ์ออกมา by tekkasit
ผมอ่านแล้วเอ๊ะเหมือนกันเลยครับ ข้อความมันกลับกัน
เปฃ่งเสียง > เปล่งเสียง
sian Thu, 17/06/2021 - 14:02
เปฃ่งเสียง > เปล่งเสียง
เหนคอมเม้นเยอะเลยรีบเข้ามาดูเ
gosol Thu, 17/06/2021 - 14:46
เหนคอมเม้นเยอะเลยรีบเข้ามาดูเจอแต่แก้งาน..
(No subject)
nessuchan Thu, 17/06/2021 - 15:50
In reply to เหนคอมเม้นเยอะเลยรีบเข้ามาดูเ by gosol
555
Jonathan_Job Fri, 18/06/2021 - 04:08
In reply to (No subject) by nessuchan
555
โต๋ศักดิ์สิทธิ์ถูกใจสิ่งนี้
phenocalypse Thu, 17/06/2021 - 15:52
โต๋ศักดิ์สิทธิ์ถูกใจสิ่งนี้
อ่านปากของฉันนะ...
Azymik Thu, 17/06/2021 - 16:51
In reply to โต๋ศักดิ์สิทธิ์ถูกใจสิ่งนี้ by phenocalypse
อ่านปากของฉันนะ...
ว่า f-ck her
jakapong Fri, 18/06/2021 - 09:22
In reply to อ่านปากของฉันนะ... by Azymik
ว่า f-ck her มันจะอ่านพลาดเป็นคำนี้ไหม
เอ่อ
impascetic Fri, 18/06/2021 - 09:58
In reply to ว่า f-ck her by jakapong
เอ่อ รูปปากต่างกันเยอะนะครับทั้งพยางค์หน้าและพยางค์หลัง ทำไมดูหมกมุ่นแปลกๆ
ต่อไป
gift099 Thu, 17/06/2021 - 16:53
ต่อไป
สายลับ ถ่ายวิดิโอ คนร้ายในระยะไกล แล้วให้ AI แปล ว่าคุยอะไรกันอยู่
I'm sorry, Dave.
Rapier Sat, 19/06/2021 - 01:51
I'm sorry, Dave.