By mk Founder on Tag: Google Docs, Google, Voice Recognition
Google Docs

ปีที่แล้ว Google Docs รองรับการพิมพ์งานด้วยเสียงหรือ Voice Typing แต่ยังมีข้อจำกัดที่เป็นการพิมพ์งานไปข้างหน้าอย่างเดียวเท่านั้น

ปีนี้ Google Docs พัฒนาฟีเจอร์พิมพ์งานด้วยเสียงเพิ่มเติม เราสามารถสั่งให้เลือกคำที่พิมพ์ไปแล้วเพื่อเปลี่ยนเป็นคำอื่นได้ และรองรับการจัดฟอร์แมตเอกสารด้วยเสียงพูดได้อีกด้วย ("apply heading 1") ดูคลิปประกอบน่าจะเข้าใจง่ายขึ้นครับ

By magnamonkun on Tag: Apple, Voice Recognition, Operating System, Rumor, Siri, OS X
Apple

มีรายงานจากเว็บไซต์ 9to5mac ระบุว่าแอปเปิลกำลังทดสอบฟังก์ชัน Siri บน OS X 10.12 อยู่ในขั้นตอนสุดท้ายก่อนเปิดตัวจริงแล้ว

รายงานเผยว่า Siri บน OS X จะอยู่ในรูปแบบของปุ่มลัดบนเมนูบาร์ด้านบน พร้อมเปิดให้ผู้ใช้สามารถตั้งคีย์ลัดเพิ่มเติมได้ และเมื่อเรียกใช้งาน ก็จะปรากฎกล่องสีดำเทาพื้นโปร่ง พร้อมใช้ลักษณะการเล่นคำ และเล่นสีบาร์เหมือนกับใน tvOS ทุกอย่าง พร้อมรองรับคำสั่ง Hey, Siri เมื่อต่อสายชาร์จไว้กับเครื่องด้วย

อย่างไรเสียรูปแบบ UI ของ Siri ยังไม่มีการลงล็อกว่าจะอยู่ในรูปแบบใด และคาดว่าจะสามารถปรับเปลี่ยนได้จนกว่าจะถึงงานเปิดตัวในช่วงกลางปีนี้

By mk Founder on Tag: Voice Recognition, SoundHound
Voice Recognition

SoundHound บริการค้นหาเพลงด้วยเสียง ที่ภายหลังหันมาลุยตลาดซอฟต์แวร์สั่งงานด้วยเสียงลักษณะเดียวกับ Siri/Google Now ใต้แบรนด์ Hound ประกาศขยายผลิตภัณฑ์ของตัวเองจาก Hound มาเป็นแพลตฟอร์ม Houndify ที่เป็นอินเทอร์เฟซรับคำสั่งเสียงให้กับแอพทุกประเภท

By Blltz Writer on Tag: Voice Recognition, Mobile App, Nuance, Internet of Things
Voice Recognition

การสั่งงานด้วยเสียงบนสมาร์ทโฟน หรืออุปกรณ์ไอทีใดๆ ไม่ใช่เรื่องแปลกในปัจจุบัน แต่ในขณะเดียวกันก็ไม่ใช่เรื่องง่ายถึงขนาดที่ใครก็ได้จะสามารถพัฒนาระบบดังกล่าวขึ้นมาด้วยตัวเอง แม้แต่แอปเปิล หรือซัมซุงยังได้รับความช่วยเหลือจาก Nuance ผู้เชี่ยวชาญด้านซอฟต์แวร์วิเคราะห์เสียงที่วันนี้ออกมาเปิดตัว Nuance Mix ชุดเครื่องมือสำหรับให้นักพัฒนาทำแอพรองรับคำสั่งเสียงได้สะดวกขึ้นแล้ว

By mk Founder on Tag: Android, Voice Recognition, Microsoft, Cortana
Android

ไมโครซอฟท์ทดสอบ Cortana for Android มาได้สักพักแล้ว ฟีเจอร์ใหม่ล่าสุดที่เพิ่มเข้ามาคือการสั่งงานด้วยเสียงแบบไม่ต้องแตะอุปกรณ์ เพียงพูดว่า "Hey Cortana" (แบบเดียวกับ OK Google) ก็จะเรียก Cortana ขึ้นมาได้เลย

ข้อจำกัดของฟีเจอร์นี้คือมันใช้งานได้ต่อเมื่อเราปลดล็อคหน้าจอแล้วเท่านั้น เหตุเพราะ Android เพียงบางรุ่นเท่านั้นที่มีฮาร์ดแวร์รองรับคำสั่งเสียงตลอดเวลา (ซึ่งเป็นปัญหาเดียวกับ OK Google)

ฟีเจอร์นี้มีใน Windows Phone มาตั้งแต่ปี 2014

By mk Founder on Tag: Google, Browser, Chrome, Voice Recognition
Google

ข่าวช้าไปนิดหน่อยครับ Chrome 46 ออกรุ่นจริงแล้ว ของใหม่ในรุ่นนี้ได้แก่

By Blltz Writer on Tag: Apple, Voice Recognition, Acquisition, Siri
Apple

นอกจากจะขยายบริการผู้ช่วยอัจฉริยะให้สามารถใช้งานได้หลายอุปกรณ์ขึ้นแล้ว อีกภารกิจสำคัญของแอปเปิลคือการพัฒนา Siri ให้ประสิทธิภาพดีขึ้น ล่าสุดมีรายงานว่าแอปเปิลเข้าซื้อบริษัทหน้าใหม่ผู้พัฒนาซอฟต์แวร์ด้านการรับคำสั่งเสียงมาเสริมทัพ Siri แล้ว

By Blltz Writer on Tag: Baidu, Voice Recognition, Mobile App
Baidu

ดูเหมือนบริษัทไอทีรายใหญ่ของโลกจะอยากมีผู้ช่วยส่วนตัวให้ผู้ใช้สมาร์ทโฟนกันทุกราย ไม่ว่าจะเป็นกูเกิล แอปเปิล ไมโครซอฟท์ หรือแม้แต่ Facebook ล่าสุดยักษ์ใหญ่จากจีนอย่าง Baidu ไม่ยอมแพ้ ส่งผู้ช่วยบนสมาร์ทโฟนมาบ้างแล้วในชื่อ Du Secretary

By mk Founder on Tag: Google, Web Application, Voice Recognition, Google Docs
Google

Google Docs เวอร์ชันเว็บเพิ่มฟีเจอร์ชุดใหญ่ แยกรายละเอียดได้ดังนี้

By Blltz Writer on Tag: Voice Recognition, Nuance, Dragon, Mobile
Voice Recognition

Nuance ผู้พัฒนาซอฟต์แวร์สั่งงานด้วยเสียงรายใหญ่ของโลก เปิดตัวแอพใหม่ Dragon Anywhere สำหรับลูกค้าองค์กรให้สามารถถอดความจากเสียงสู่เอกสารได้อย่างรวดเร็ว แม่นยำ

Dragon Anywhere เป็นภาคต่อที่เหนือขึ้นไปกว่าระบบถอดความจากเสียงที่มีอยู่บนคีย์บอร์ด โดยตัวแอพทำหน้าที่เป็นตัวจัดการเอกสาร ซึ่งสามารถใช้เสียงในการพิมพ์ จัดหน้า และแก้ไขเอกสารได้เบ็ดเสร็จ พร้อมแชร์จากอุปกรณ์พกพาสู่พีซีได้ในตัว

By mk Founder on Tag: Google, Voice Recognition, Google Voice, Google Fi
Google

กูเกิลออกมาโชว์ผลงานการแปลงเสียงพูดเป็นข้อความ (transcription) ที่ใช้กับบริการ Voice Mail ใน Google Voice และ Project Fi ว่ามีความแม่นยำเพิ่มขึ้น ข้อผิดพลาดลดลงจากเดิม 49%

เทคนิคที่กูเกิลใช้คือ long short-term memory deep recurrent neural network โดยขอไฟล์ตัวอย่าง Voice Mail จากผู้ใช้งานมาเป็นข้อมูลจริงสำหรับการวิเคราะห์

กูเกิลไม่ได้อธิบายรายละเอียดของเทคนิคดังกล่าว แต่ก็ถือเป็นผลดีสำหรับผู้ใช้ที่ได้ระบบแปลงเสียงพูดที่แม่นยำยิ่งขึ้นครับ

ที่มา - Google Blog

By Blltz Writer on Tag: Amazon, Voice Recognition
Amazon

เพิ่งวางขาย Amazon Echo ลำโพงอัจฉริยะที่เป็นผู้ช่วยที่ตอบข้อสงสัยได้ด้วยเสียงจริงๆ ไปไม่นาน วันนี้ Amazon ออกมาเปิดตัวโครงการต่อยอดของ Alexa เบื้องหลังฟีเจอร์สั่งงานด้วยเสียงที่ใช้กับ Echo มาหลายอย่าง

By ampaipp on Tag: Amazon, Voice Recognition, Amazon Echo
Amazon

หลังจาก Amazon เปิดตัว Amazon Echo, Siri/Google Now ประจำบ้าน ที่ควบคุมด้วยเสียงเป็นหลักและ สามารถควบคุมอุปกรณ์เครื่องใช้ในบ้านได้ ในวันนี้ก็เปิดให้สั่งจองแล้วสำหรับลูกค้าในประเทศอเมริกา

Amazon Echo ได้ถูกเปิดตัวในเดือนพฤศจิกายนที่ผ่านมา ซึ่งก่อนหน้านี้ต้องได้รับเชิญก่อนถึงจะสามารถซื้อได้ แต่ในวันนี้ได้เปิดให้ผู้สนใจที่จะซื้อสามารถสั่งจองได้อย่างเป็นทางการ โดยราคาลดลงมาอยู่ที่ 180 ดอลลาร์จากเดิมที่เปิดตัวราคา 199 ดอลลาร์ และจะจัดส่งในวันที่ 14 เดือนกรกฎาคม แต่ยังคงจำกัดพื้นที่ในการจองอยู่ที่ประเทศอเมริกาเท่านั้น

By SainTKK on Tag: Social Network, Voice Recognition, WeChat
Social Network

WeChat แนะนำฟีเจอร์ใหม่ Voiceprint ในวงการโซเชียลแอปพลิเคชั่นเป็นครั้งแรก ช่วยให้ผู้ใช้งานสามารถเข้าใช้งานบัญชีได้อย่างสะดวกรวดเร็ว และปลอดภัย ผ่านทางเสียงของผู้ใช้ที่มีเอกลักษณ์เฉพาะคล้ายๆ กับลายนิ้วมือ

By mk Founder on Tag: Google, Voice Recognition, Mobile Payment
Google

กูเกิลเพิ่งเปิดตัว Android Pay ระบบจ่ายเงินด้วยสมาร์ทโฟนผ่าน NFC แต่ในงาน Google I/O 2015 กูเกิลก็ยังมีระบบจ่ายเงินอีกตัวหนึ่งชื่อว่า Hands Free มาโชว์ด้วย

แนวคิดของ Hands Free คือการตั้งคำถามว่าเราสามารถจ่ายเงินอย่างไรโดยไม่จำเป็นต้องหยิบมือถือออกมาจากกระเป๋า ซึ่งคำตอบของกูเกิลก็คือยืนยันตัวตนด้วยเสียง เช่น พูดคีย์เวิร์ดที่กำหนดไว้อย่าง "I want to pay with Google" ที่หน้าเคาเตอร์จ่ายเงิน เท่านี้ก็เรียบร้อยแล้ว

By mk Founder on Tag: Google, Android, Voice Recognition
Google

กูเกิลเพิ่มความสามารถให้ฟีเจอร์ Voice Actions บน Android โดยสามารถใช้กับแอพบางตัวที่ไม่ใช่ของกูเกิลได้แล้ว (ชื่ออย่างเป็นทางการคือ Custom Voice Actions) ตัวอย่างที่กูเกิลนำมาโชว์ได้แก่

  • “Ok Google, listen to NPR”
  • “Ok Google, show attractions near me on TripAdvisor”

ตอนนี้กูเกิลยังเปิดรับแอพจากผู้พัฒนาบางรายเท่านั้น เช่น Shazam, Instacart, Wink, Walmart, TuneIn Radio ส่วนนักพัฒนาที่อยากเข้าร่วมโครงการ ต้องสมัครเข้าไปให้กูเกิลคัดเลือกอีกทีครับ

By lew Founder on Tag: Privacy, Samsung, Voice Recognition, Smart TV
Privacy

หลังโทรทัศน์ซัมซุงเป็นข่าวว่าส่งข้อมูลเสียงของลูกค้าไปผ่านอินเทอร์เน็ตไปยังบริษัทภายนอก ตอนนี้ David Lodge นักวิจัยความปลอดภัยจากบริษัท Pen Test Partners รายงานว่าข้อมูลเสียงที่ส่งออกไปจากตัวโทรทัศน์โดยไม่ได้เข้ารหัส

Google

ในยุคที่ระบบค้นหาด้วยเสียงและผู้ช่วยส่วนตัว แข่งกันสร้างบุคลิกหรือตัวตน (personality) เพื่อเพิ่มความเป็นมิตรต่อผู้ใช้ หลายคนอาจสังเกตว่าระบบค้นหาด้วยเสียงของกูเกิล ทั้งจาก Google Search และ Google Now กลับไม่มีบุคลิกที่ชัดเจนแบบเดียวกับ Siri หรือ Cortana

By Blltz Writer on Tag: Baidu, Voice Recognition
Baidu

Baidu ยักษ์ใหญ่แห่งวงการค้นหาจากประเทศจีน เปิดตัวเทคโนโลยีใหม่จากแผนกพัฒนาของตัวเองในชื่อ "Deep Speech" ที่เคลมว่าสามารถพลิกโฉมการสั่งด้วยเสียงในปัจจุบันได้เลย

Deep Speech เป็นระบบสั่งงานด้วยเสียงที่ออกแบบมาเพื่อใช้งานในสภาพแวดล้อมจริง ที่สามารถใช้งานได้แม้ว่าจะมีเสียงดังรบกวน เช่นในร้านอาหาร บนรถโดยสาร หรือการใช้งานที่ผู้พูดอยู่ห่างจากไมโครโฟน เป็นต้น โดยคีย์ของเทคโนโลยีนี้คือการใช้จีพียูมาช่วยประมวลผล ร่วมกับฐานข้อมูลขนาดใหญ่ของ Baidu เองที่เก็บมามากกว่า 100,000 ชั่วโมงด้วยกัน

By mk Founder on Tag: Development, Voice Recognition, Acquisition, Facebook
Development

Facebook เข้าซื้อกิจการ Wit.ai บริษัทสตาร์ตอัพด้านระบบแยกแยะเสียง (voice recognition) ที่เปิด API ด้านการแยกแยะเสียงให้นักพัฒนาภายนอกใช้งาน (ส่งไฟล์เสียงเข้ามาให้ Wit.ai ประมวลผลให้)

Wit.ai เพิ่งก่อตั้งได้เพียง 18 เดือนแต่ก็มีนักพัฒนาเข้ามาใช้บริการ API แล้วกว่า 6,000 ราย หลังไปอยู่กับ Facebook แล้ว ตัวแพลตฟอร์มและซอฟต์แวร์จะยังแจกฟรี-เปิดซอร์สต่อไป

ใครอยากทดสอบระบบแยกแยะเสียงของ Wit.ai ลองเล่นได้ที่หน้าเดโม

ที่มา - Wit.ai

Subscribe to Voice Recognition