Voice Recognition

Google Docs ปรับปรุงฟีเจอร์พิมพ์งานด้วยเสียง แก้ไขข้อความ-จัดฟอร์แมตด้วยเสียงพูดได้แล้ว

By mk

on 25 February 2016 - 09:05 Tag: Google Docs, Google, Voice Recognition

Google Docs

ปีที่แล้ว Google Docs รองรับการพิมพ์งานด้วยเสียงหรือ Voice Typing แต่ยังมีข้อจำกัดที่เป็นการพิมพ์งานไปข้างหน้าอย่างเดียวเท่านั้น

ปีนี้ Google Docs พัฒนาฟีเจอร์พิมพ์งานด้วยเสียงเพิ่มเติม เราสามารถสั่งให้เลือกคำที่พิมพ์ไปแล้วเพื่อเปลี่ยนเป็นคำอื่นได้ และรองรับการจัดฟอร์แมตเอกสารด้วยเสียงพูดได้อีกด้วย ("apply heading 1") ดูคลิปประกอบน่าจะเข้าใจง่ายขึ้นครับ

[ข่าวลือ] แอปเปิลกำลังทดสอบ Siri บน OS X 10.12 และจะชูเป็นฟังก์ชันใหญ่ประจำรุ่น

By magnamonkun on 25 February 2016 - 02:17 Tag: Apple, Voice Recognition, Operating System, Rumor, Siri, OS X

Apple

มีรายงานจากเว็บไซต์ 9to5mac ระบุว่าแอปเปิลกำลังทดสอบฟังก์ชัน Siri บน OS X 10.12 อยู่ในขั้นตอนสุดท้ายก่อนเปิดตัวจริงแล้ว

รายงานเผยว่า Siri บน OS X จะอยู่ในรูปแบบของปุ่มลัดบนเมนูบาร์ด้านบน พร้อมเปิดให้ผู้ใช้สามารถตั้งคีย์ลัดเพิ่มเติมได้ และเมื่อเรียกใช้งาน ก็จะปรากฎกล่องสีดำเทาพื้นโปร่ง พร้อมใช้ลักษณะการเล่นคำ และเล่นสีบาร์เหมือนกับใน tvOS ทุกอย่าง พร้อมรองรับคำสั่ง Hey, Siri เมื่อต่อสายชาร์จไว้กับเครื่องด้วย

อย่างไรเสียรูปแบบ UI ของ Siri ยังไม่มีการลงล็อกว่าจะอยู่ในรูปแบบใด และคาดว่าจะสามารถปรับเปลี่ยนได้จนกว่าจะถึงงานเปิดตัวในช่วงกลางปีนี้

SoundHound เปิดตัว Houndify แพลตฟอร์มวิเคราะห์เสียงพูด ตัวกลางเชื่อมอุปกรณ์ทุกประเภท

By mk

on 17 December 2015 - 17:34 Tag: Voice Recognition, SoundHound

Voice Recognition

SoundHound บริการค้นหาเพลงด้วยเสียง ที่ภายหลังหันมาลุยตลาดซอฟต์แวร์สั่งงานด้วยเสียงลักษณะเดียวกับ Siri/Google Now ใต้แบรนด์ Hound ประกาศขยายผลิตภัณฑ์ของตัวเองจาก Hound มาเป็นแพลตฟอร์ม Houndify ที่เป็นอินเทอร์เฟซรับคำสั่งเสียงให้กับแอพทุกประเภท

Nuance เปิดตัว Mix เครื่องมือผนวกฟีเจอร์สั่งงานด้วยเสียงลงแอพและ IoT

By Blltz

on 16 December 2015 - 17:00 Tag: Voice Recognition, Mobile App, Nuance, Internet of Things

Voice Recognition

การสั่งงานด้วยเสียงบนสมาร์ทโฟน หรืออุปกรณ์ไอทีใดๆ ไม่ใช่เรื่องแปลกในปัจจุบัน แต่ในขณะเดียวกันก็ไม่ใช่เรื่องง่ายถึงขนาดที่ใครก็ได้จะสามารถพัฒนาระบบดังกล่าวขึ้นมาด้วยตัวเอง แม้แต่แอปเปิล หรือซัมซุงยังได้รับความช่วยเหลือจาก Nuance ผู้เชี่ยวชาญด้านซอฟต์แวร์วิเคราะห์เสียงที่วันนี้ออกมาเปิดตัว Nuance Mix ชุดเครื่องมือสำหรับให้นักพัฒนาทำแอพรองรับคำสั่งเสียงได้สะดวกขึ้นแล้ว

Cortana for Android รองรับฟีเจอร์สั่งงานด้วยเสียง Hey Cortana

By mk

on 26 October 2015 - 09:01 Tag: Android, Voice Recognition, Microsoft, Cortana

Android

ไมโครซอฟท์ทดสอบ Cortana for Android มาได้สักพักแล้ว ฟีเจอร์ใหม่ล่าสุดที่เพิ่มเข้ามาคือการสั่งงานด้วยเสียงแบบไม่ต้องแตะอุปกรณ์ เพียงพูดว่า "Hey Cortana" (แบบเดียวกับ OK Google) ก็จะเรียก Cortana ขึ้นมาได้เลย

ข้อจำกัดของฟีเจอร์นี้คือมันใช้งานได้ต่อเมื่อเราปลดล็อคหน้าจอแล้วเท่านั้น เหตุเพราะ Android เพียงบางรุ่นเท่านั้นที่มีฮาร์ดแวร์รองรับคำสั่งเสียงตลอดเวลา (ซึ่งเป็นปัญหาเดียวกับ OK Google)

ฟีเจอร์นี้มีใน Windows Phone มาตั้งแต่ปี 2014

Chrome 46 ออกแล้ว ถอดฟีเจอร์สั่งงานด้วยเสียง OK Google ออก

By mk

on 19 October 2015 - 13:27 Tag: Google, Browser, Chrome, Voice Recognition

Google

ข่าวช้าไปนิดหน่อยครับ Chrome 46 ออกรุ่นจริงแล้ว ของใหม่ในรุ่นนี้ได้แก่

แอปเปิลเข้าซื้อสตาร์ทอัพด้านการรับคำสั่งเสียง สู่อนาคต Siri ที่เข้าใจมนุษย์มากขึ้น

By Blltz

on 5 October 2015 - 13:54 Tag: Apple, Voice Recognition, Acquisition, Siri

Apple

นอกจากจะขยายบริการผู้ช่วยอัจฉริยะให้สามารถใช้งานได้หลายอุปกรณ์ขึ้นแล้ว อีกภารกิจสำคัญของแอปเปิลคือการพัฒนา Siri ให้ประสิทธิภาพดีขึ้น ล่าสุดมีรายงานว่าแอปเปิลเข้าซื้อบริษัทหน้าใหม่ผู้พัฒนาซอฟต์แวร์ด้านการรับคำสั่งเสียงมาเสริมทัพ Siri แล้ว

Baidu เปิดตัว Du Secretary ผู้ช่วยส่วนตัวบนอุปกรณ์พกพา

By Blltz

on 8 September 2015 - 17:26 Tag: Baidu, Voice Recognition, Mobile App

Baidu

ดูเหมือนบริษัทไอทีรายใหญ่ของโลกจะอยากมีผู้ช่วยส่วนตัวให้ผู้ใช้สมาร์ทโฟนกันทุกราย ไม่ว่าจะเป็นกูเกิล แอปเปิล ไมโครซอฟท์ หรือแม้แต่ Facebook ล่าสุดยักษ์ใหญ่จากจีนอย่าง Baidu ไม่ยอมแพ้ ส่งผู้ช่วยบนสมาร์ทโฟนมาบ้างแล้วในชื่อ Du Secretary

Google Docs เพิ่มฟีเจอร์ชุดใหญ่ สั่งพิมพ์ด้วยเสียงพูดได้แล้ว

By mk

on 3 September 2015 - 08:42 Tag: Google, Web Application, Voice Recognition, Google Docs

Google

Google Docs เวอร์ชันเว็บเพิ่มฟีเจอร์ชุดใหญ่ แยกรายละเอียดได้ดังนี้

Nuance เปิดตัว Dragon Anywhere: สั่งงาน-พิมพ์ด้วยเสียงระดับมืออาชีพบนอุปกรณ์พกพา

By Blltz

on 19 August 2015 - 17:18 Tag: Voice Recognition, Nuance, Dragon, Mobile

Voice Recognition

Nuance ผู้พัฒนาซอฟต์แวร์สั่งงานด้วยเสียงรายใหญ่ของโลก เปิดตัวแอพใหม่ Dragon Anywhere สำหรับลูกค้าองค์กรให้สามารถถอดความจากเสียงสู่เอกสารได้อย่างรวดเร็ว แม่นยำ

Dragon Anywhere เป็นภาคต่อที่เหนือขึ้นไปกว่าระบบถอดความจากเสียงที่มีอยู่บนคีย์บอร์ด โดยตัวแอพทำหน้าที่เป็นตัวจัดการเอกสาร ซึ่งสามารถใช้เสียงในการพิมพ์ จัดหน้า และแก้ไขเอกสารได้เบ็ดเสร็จ พร้อมแชร์จากอุปกรณ์พกพาสู่พีซีได้ในตัว

ระบบแปลงเสียงพูดเป็นข้อความของ Google Voice แม่นยำขึ้นอีก 49%

By mk

on 24 July 2015 - 12:57 Tag: Google, Voice Recognition, Google Voice, Google Fi

Google

กูเกิลออกมาโชว์ผลงานการแปลงเสียงพูดเป็นข้อความ (transcription) ที่ใช้กับบริการ Voice Mail ใน Google Voice และ Project Fi ว่ามีความแม่นยำเพิ่มขึ้น ข้อผิดพลาดลดลงจากเดิม 49%

เทคนิคที่กูเกิลใช้คือ long short-term memory deep recurrent neural network โดยขอไฟล์ตัวอย่าง Voice Mail จากผู้ใช้งานมาเป็นข้อมูลจริงสำหรับการวิเคราะห์

กูเกิลไม่ได้อธิบายรายละเอียดของเทคนิคดังกล่าว แต่ก็ถือเป็นผลดีสำหรับผู้ใช้ที่ได้ระบบแปลงเสียงพูดที่แม่นยำยิ่งขึ้นครับ

ที่มา - Google Blog

Amazon เปิดตัวกองทุน Alexa Fund สนับสนุนให้สร้างประสบการณ์ใหม่บนการสั่งงานด้วยเสียง

By Blltz

on 26 June 2015 - 18:08 Tag: Amazon, Voice Recognition

Amazon

เพิ่งวางขาย Amazon Echo ลำโพงอัจฉริยะที่เป็นผู้ช่วยที่ตอบข้อสงสัยได้ด้วยเสียงจริงๆ ไปไม่นาน วันนี้ Amazon ออกมาเปิดตัวโครงการต่อยอดของ Alexa เบื้องหลังฟีเจอร์สั่งงานด้วยเสียงที่ใช้กับ Echo มาหลายอย่าง

Amazon เปิดให้สั่งจอง Echo ในอเมริกาแล้ว ราคาอยู่ที่ 180 ดอลลาร์

By ampaipp on 24 June 2015 - 11:48 Tag: Amazon, Voice Recognition, Amazon Echo

Amazon

หลังจาก Amazon เปิดตัว Amazon Echo, Siri/Google Now ประจำบ้าน ที่ควบคุมด้วยเสียงเป็นหลักและ สามารถควบคุมอุปกรณ์เครื่องใช้ในบ้านได้ ในวันนี้ก็เปิดให้สั่งจองแล้วสำหรับลูกค้าในประเทศอเมริกา

Amazon Echo ได้ถูกเปิดตัวในเดือนพฤศจิกายนที่ผ่านมา ซึ่งก่อนหน้านี้ต้องได้รับเชิญก่อนถึงจะสามารถซื้อได้ แต่ในวันนี้ได้เปิดให้ผู้สนใจที่จะซื้อสามารถสั่งจองได้อย่างเป็นทางการ โดยราคาลดลงมาอยู่ที่ 180 ดอลลาร์จากเดิมที่เปิดตัวราคา 199 ดอลลาร์ และจะจัดส่งในวันที่ 14 เดือนกรกฎาคม แต่ยังคงจำกัดพื้นที่ในการจองอยู่ที่ประเทศอเมริกาเท่านั้น

กูเกิลโชว์ Hands Free ระบบจ่ายเงินที่ยืนยันตัวตนด้วยเสียงพูด ไม่ต้องหยิบมือถือออกมาจากกระเป๋า

By mk

on 31 May 2015 - 18:13 Tag: Google, Voice Recognition, Mobile Payment

Google

กูเกิลเพิ่งเปิดตัว Android Pay ระบบจ่ายเงินด้วยสมาร์ทโฟนผ่าน NFC แต่ในงาน Google I/O 2015 กูเกิลก็ยังมีระบบจ่ายเงินอีกตัวหนึ่งชื่อว่า Hands Free มาโชว์ด้วย

แนวคิดของ Hands Free คือการตั้งคำถามว่าเราสามารถจ่ายเงินอย่างไรโดยไม่จำเป็นต้องหยิบมือถือออกมาจากกระเป๋า ซึ่งคำตอบของกูเกิลก็คือยืนยันตัวตนด้วยเสียง เช่น พูดคีย์เวิร์ดที่กำหนดไว้อย่าง "I want to pay with Google" ที่หน้าเคาเตอร์จ่ายเงิน เท่านี้ก็เรียบร้อยแล้ว

กูเกิลเปิด Voice Actions ให้สั่งงานแอพจากผู้พัฒนารายอื่นได้แล้ว

By mk

on 1 May 2015 - 22:26 Tag: Google, Android, Voice Recognition

Google

กูเกิลเพิ่มความสามารถให้ฟีเจอร์ Voice Actions บน Android โดยสามารถใช้กับแอพบางตัวที่ไม่ใช่ของกูเกิลได้แล้ว (ชื่ออย่างเป็นทางการคือ Custom Voice Actions) ตัวอย่างที่กูเกิลนำมาโชว์ได้แก่

“Ok Google, listen to NPR”
“Ok Google, show attractions near me on TripAdvisor”

ตอนนี้กูเกิลยังเปิดรับแอพจากผู้พัฒนาบางรายเท่านั้น เช่น Shazam, Instacart, Wink, Walmart, TuneIn Radio ส่วนนักพัฒนาที่อยากเข้าร่วมโครงการ ต้องสมัครเข้าไปให้กูเกิลคัดเลือกอีกทีครับ

นักวิจัยความปลอดภัยพบโทรทัศน์ซัมซุงส่งข้อมูลเสียงไม่เข้ารหัส

By lew

on 18 February 2015 - 13:38 Tag: Privacy, Samsung, Voice Recognition, Smart TV

Privacy

หลังโทรทัศน์ซัมซุงเป็นข่าวว่าส่งข้อมูลเสียงของลูกค้าไปผ่านอินเทอร์เน็ตไปยังบริษัทภายนอก ตอนนี้ David Lodge นักวิจัยความปลอดภัยจากบริษัท Pen Test Partners รายงานว่าข้อมูลเสียงที่ส่งออกไปจากตัวโทรทัศน์โดยไม่ได้เข้ารหัส

กูเกิลตั้งใจไม่ใส่ "บุคลิก" ให้ระบบค้นหาด้วยเสียง เพราะยังทำได้ไม่ดีพอ

By mk

on 2 February 2015 - 22:00 Tag: Google, Search Engine, Voice Recognition, Google Search, Artificial Intelligence

Google

ในยุคที่ระบบค้นหาด้วยเสียงและผู้ช่วยส่วนตัว แข่งกันสร้างบุคลิกหรือตัวตน (personality) เพื่อเพิ่มความเป็นมิตรต่อผู้ใช้ หลายคนอาจสังเกตว่าระบบค้นหาด้วยเสียงของกูเกิล ทั้งจาก Google Search และ Google Now กลับไม่มีบุคลิกที่ชัดเจนแบบเดียวกับ Siri หรือ Cortana

พลิกวงการ! Baidu โชว์ Deep Speech ระบบสั่งงานด้วยเสียงที่ใช้งานได้จริงแม้มีเสียงรบกวน

By Blltz

on 14 January 2015 - 15:01 Tag: Baidu, Voice Recognition

Baidu

Baidu ยักษ์ใหญ่แห่งวงการค้นหาจากประเทศจีน เปิดตัวเทคโนโลยีใหม่จากแผนกพัฒนาของตัวเองในชื่อ "Deep Speech" ที่เคลมว่าสามารถพลิกโฉมการสั่งด้วยเสียงในปัจจุบันได้เลย

Deep Speech เป็นระบบสั่งงานด้วยเสียงที่ออกแบบมาเพื่อใช้งานในสภาพแวดล้อมจริง ที่สามารถใช้งานได้แม้ว่าจะมีเสียงดังรบกวน เช่นในร้านอาหาร บนรถโดยสาร หรือการใช้งานที่ผู้พูดอยู่ห่างจากไมโครโฟน เป็นต้น โดยคีย์ของเทคโนโลยีนี้คือการใช้จีพียูมาช่วยประมวลผล ร่วมกับฐานข้อมูลขนาดใหญ่ของ Baidu เองที่เก็บมามากกว่า 100,000 ชั่วโมงด้วยกัน

Facebook ซื้อ Wit.ai บริษัทสตาร์ตอัพด้านการแยกแยะเสียงพูด

By mk

on 6 January 2015 - 19:02 Tag: Development, Voice Recognition, Acquisition, Facebook

Development

Facebook เข้าซื้อกิจการ Wit.ai บริษัทสตาร์ตอัพด้านระบบแยกแยะเสียง (voice recognition) ที่เปิด API ด้านการแยกแยะเสียงให้นักพัฒนาภายนอกใช้งาน (ส่งไฟล์เสียงเข้ามาให้ Wit.ai ประมวลผลให้)

Wit.ai เพิ่งก่อตั้งได้เพียง 18 เดือนแต่ก็มีนักพัฒนาเข้ามาใช้บริการ API แล้วกว่า 6,000 ราย หลังไปอยู่กับ Facebook แล้ว ตัวแพลตฟอร์มและซอฟต์แวร์จะยังแจกฟรี-เปิดซอร์สต่อไป

ใครอยากทดสอบระบบแยกแยะเสียงของ Wit.ai ลองเล่นได้ที่หน้าเดโม

ที่มา - Wit.ai

Subscribe to Voice Recognition