Tags:
Google Voice

กูเกิลออกมาโชว์ผลงานการแปลงเสียงพูดเป็นข้อความ (transcription) ที่ใช้กับบริการ Voice Mail ใน Google Voice และ Project Fi ว่ามีความแม่นยำเพิ่มขึ้น ข้อผิดพลาดลดลงจากเดิม 49%

เทคนิคที่กูเกิลใช้คือ long short-term memory deep recurrent neural network โดยขอไฟล์ตัวอย่าง Voice Mail จากผู้ใช้งานมาเป็นข้อมูลจริงสำหรับการวิเคราะห์

กูเกิลไม่ได้อธิบายรายละเอียดของเทคนิคดังกล่าว แต่ก็ถือเป็นผลดีสำหรับผู้ใช้ที่ได้ระบบแปลงเสียงพูดที่แม่นยำยิ่งขึ้นครับ

ที่มา - Google Blog

Tags:
Amazon

เพิ่งวางขาย Amazon Echo ลำโพงอัจฉริยะที่เป็นผู้ช่วยที่ตอบข้อสงสัยได้ด้วยเสียงจริงๆ ไปไม่นาน วันนี้ Amazon ออกมาเปิดตัวโครงการต่อยอดของ Alexa เบื้องหลังฟีเจอร์สั่งงานด้วยเสียงที่ใช้กับ Echo มาหลายอย่าง

อย่างแรกคือการเปิดกองทุน Alexa Fund มูลค่ากว่า 100 ล้านเหรียญเพื่อสนับสนุนให้นักพัฒนา ผู้ผลิต และสตาร์ทอัพมาร่วมออกแบบประสบการณ์ใหม่ที่สร้างด้วย Alexa โดยเน้นไปที่สามกลุ่มใหญ่ๆ คือพัฒนาฮาร์ดแวร์ที่ใช้งาน Alexa, การใช้งานรูปแบบใหม่ๆ ที่ใช้งานร่วมกับ Alexa และฟีเจอร์ใหม่ที่น่าจะใส่เข้าไปใน Alexa ได้ โดยเริ่มลงทุนไปแล้วทั้งสิ้น 7 บริษัท

ต่อมาคือการเปิดตัว Alexa Voice Service (AVS) บริการสั่งงานด้วยเสียงแบบเดียวกับที่ใช้ Echo ให้นักพัฒนาฮาร์ดแวร์ภายนอกสามารถนำไปใช้ได้ฟรีๆ ปิดท้ายด้วย Alexa Skills Kit (ASK) ชุดพัฒนา (SDK) สำหรับนักพัฒนาซอฟต์แวร์ที่สนใจทำฟีเจอร์ใหม่เอี่ยมด้วย Alexa แจกฟรีเช่นกัน

ที่มา - Amazon

Tags:
Amazon

หลังจาก Amazon เปิดตัว Amazon Echo, Siri/Google Now ประจำบ้าน ที่ควบคุมด้วยเสียงเป็นหลักและ สามารถควบคุมอุปกรณ์เครื่องใช้ในบ้านได้ ในวันนี้ก็เปิดให้สั่งจองแล้วสำหรับลูกค้าในประเทศอเมริกา

Amazon Echo ได้ถูกเปิดตัวในเดือนพฤศจิกายนที่ผ่านมา ซึ่งก่อนหน้านี้ต้องได้รับเชิญก่อนถึงจะสามารถซื้อได้ แต่ในวันนี้ได้เปิดให้ผู้สนใจที่จะซื้อสามารถสั่งจองได้อย่างเป็นทางการ โดยราคาลดลงมาอยู่ที่ 180 ดอลลาร์จากเดิมที่เปิดตัวราคา 199 ดอลลาร์ และจะจัดส่งในวันที่ 14 เดือนกรกฎาคม แต่ยังคงจำกัดพื้นที่ในการจองอยู่ที่ประเทศอเมริกาเท่านั้น

สำหรับเจ้าแท่งนี้ทำงานผ่านการเชื่อมต่ออินเทอร์เน็ต ซึ่งคอนเซปต์ในการปฏิบัติงานของมันคือการอำนวยความสะดวกให้กับทุกคนในบ้าน ทำงานเป็นระบบแฮนด์ฟรีเปรียบเสมือนผู้ช่วยส่วนตัวที่ตอบคำถามของคุณในสิ่งที่ต้องการ เช่น การจราจร, สภาพอากาศและข้อมูลอื่นๆ ที่สามารถเข้าถึงได้ผ่านอินเทอร์เน็ต และยังสามารถทำงานร่วมกับอุปกรณ์จำพวกเครื่องใช้ไฟฟ้าภายในบ้านได้ด้วย

นอกจากนี้ Echo ยังรองรับการให้บริการเพลงเช่น Pandora, Audible และ Amazon Prime Music ให้คุณได้ฟังเพลงได้อย่างสะดวกสบาย ทั้งสามารถเชื่อมต่อกับปฏิทินของ Google Calendar เพื่อบอกนัดหมายต่อไปให้ผู้ใช้ด้วยเสียงอีกด้วย

ที่มา : VentureBeat

Tags:
WeChat

WeChat แนะนำฟีเจอร์ใหม่ Voiceprint ในวงการโซเชียลแอปพลิเคชั่นเป็นครั้งแรก ช่วยให้ผู้ใช้งานสามารถเข้าใช้งานบัญชีได้อย่างสะดวกรวดเร็ว และปลอดภัย ผ่านทางเสียงของผู้ใช้ที่มีเอกลักษณ์เฉพาะคล้ายๆ กับลายนิ้วมือ

การใช้งาน Voiceprint ช่วยให้ไม่จำเป็นต้องกรอกรหัสผ่านอีกต่อไปในการล็อกอินเข้าสู่บัญชี ระบบจดจำเสียงจะจดจำเอกลักษณ์ของเสียงเพื่อใช้ยืนยันตัวตนของผู้ใช้งาน โดยต้องเข้าไปตั้งค่าที่ ฉัน > ตั้งค่า > บัญชีของฉัน > Voiceprint จะมีชุดตัวเลขแสดงออกมา โดยผู้ใช้ต้องกดปุ่มสีเขียวค้างไว้ขณะอ่านชุดตัวเลข 2 ครั้ง ระบบจะเริ่มทำงานและเมื่อเข้า WeChat จะสามารถเลือกเข้าสู่ระบบผ่าน Voiceprint ได้

Tags:
Google

กูเกิลเพิ่งเปิดตัว Android Pay ระบบจ่ายเงินด้วยสมาร์ทโฟนผ่าน NFC แต่ในงาน Google I/O 2015 กูเกิลก็ยังมีระบบจ่ายเงินอีกตัวหนึ่งชื่อว่า Hands Free มาโชว์ด้วย

แนวคิดของ Hands Free คือการตั้งคำถามว่าเราสามารถจ่ายเงินอย่างไรโดยไม่จำเป็นต้องหยิบมือถือออกมาจากกระเป๋า ซึ่งคำตอบของกูเกิลก็คือยืนยันตัวตนด้วยเสียง เช่น พูดคีย์เวิร์ดที่กำหนดไว้อย่าง "I want to pay with Google" ที่หน้าเคาเตอร์จ่ายเงิน เท่านี้ก็เรียบร้อยแล้ว

ตอนนี้กูเกิลกำลังทดสอบ Hands Free กับร้าน McDonald's และ PaPa John's บางสาขาในพื้นที่แถบซานฟรานซิสโก และยังต้องทดสอบอีกมากกว่าจะพร้อมให้ใช้งานจริง

ที่มา - Digits

Tags:
Google

กูเกิลเพิ่มความสามารถให้ฟีเจอร์ Voice Actions บน Android โดยสามารถใช้กับแอพบางตัวที่ไม่ใช่ของกูเกิลได้แล้ว (ชื่ออย่างเป็นทางการคือ Custom Voice Actions) ตัวอย่างที่กูเกิลนำมาโชว์ได้แก่

  • “Ok Google, listen to NPR”
  • “Ok Google, show attractions near me on TripAdvisor”

ตอนนี้กูเกิลยังเปิดรับแอพจากผู้พัฒนาบางรายเท่านั้น เช่น Shazam, Instacart, Wink, Walmart, TuneIn Radio ส่วนนักพัฒนาที่อยากเข้าร่วมโครงการ ต้องสมัครเข้าไปให้กูเกิลคัดเลือกอีกทีครับ

ที่มา - +Android Developers

Tags:
Samsung

หลังโทรทัศน์ซัมซุงเป็นข่าวว่าส่งข้อมูลเสียงของลูกค้าไปผ่านอินเทอร์เน็ตไปยังบริษัทภายนอก ตอนนี้ David Lodge นักวิจัยความปลอดภัยจากบริษัท Pen Test Partners รายงานว่าข้อมูลเสียงที่ส่งออกไปจากตัวโทรทัศน์โดยไม่ได้เข้ารหัส

ตัวโทรทัศน์จะเชื่อมต่อไปยัง av.nvc.enGB.nuancemobility.net ทางพอร์ต 443 ที่ปกติแล้วเป็นพอร์ต HTTPS อย่างไรก็ดีตัวโทรทัศน์ไม่ได้เชื่อมต่อเป็น HTTPS แต่เป็นโปรโตคอลเฉพาะที่ส่งข้อมูลเป็น XML และไบนารี โดยข้อมูลเหล่านี้ไม่ได้เข้ารหัสเอาไว้ จากนั้นข้อมูลที่ส่งกลับมาจากบริษัท Nuance จะส่งข้อความเป็นตัวอักษรว่าเสียงที่เราพูดไปนั้นน่าจะเป็นคำว่าอะไร ข้อมูลที่ส่งกลับมานั้นก็ไม่ได้เข้ารหัสเช่นกัน ดังนั้นหากแฮกเกอร์ดักข้อมูลได้ก็จะรู้ได้ง่ายๆ ว่าเราพูดอะไรหน้าทีวีบ้าง

อย่างไรก็ดี ทีวีไม่ได้ส่งข้อมูลออกไปตลอดเวลา แต่ต้องพูดว่า "Hi TV" เพื่อเริ่มระบบจดจำเสียงเสียก่อน

ที่มา - Pen Test Partners

Google Search

ในยุคที่ระบบค้นหาด้วยเสียงและผู้ช่วยส่วนตัว แข่งกันสร้างบุคลิกหรือตัวตน (personality) เพื่อเพิ่มความเป็นมิตรต่อผู้ใช้ หลายคนอาจสังเกตว่าระบบค้นหาด้วยเสียงของกูเกิล ทั้งจาก Google Search และ Google Now กลับไม่มีบุคลิกที่ชัดเจนแบบเดียวกับ Siri หรือ Cortana

เรื่องนี้ถูกเฉลยในบทความเจาะลึก Google Search ของ Medium Backchannel ว่ากูเกิลเคยคิดจะใส่บุคลิกลงไปเช่นกัน แต่สุดท้ายเลือกไม่ทำ เพราะคิดว่ายังไม่สามารถสร้างบุคลิกและบทสนทนาได้ดีพอ โดย Jon Wiley หัวหน้าทีมออกแบบประสบการณ์การค้นหา (search design) บอกว่าโลกเราทุกวันนี้ยังห่างไกลกับการที่คอมพิวเตอร์จะสร้างบุคลิกได้สมจริงพอ ในระดับที่คนรู้สึกคุ้นเคยและสะดวกใจที่จะคุยด้วย

อย่างไรก็ตาม กูเกิลบอกว่าวงการนี้กำลังพัฒนาไปอย่างรวดเร็ว ทั้งหน่วยประมวลผลบนอุปกรณ์พกพาที่มีประสิทธิภาพมากขึ้น ไมโครโฟนที่ดีขึ้น อัลกอริทึมของซอฟต์แวร์ที่ดีขึ้น และศาสตร์ของการประมวลผลภาษาก็พัฒนาขึ้นเรื่อยๆ

ที่มา - Medium Backchannel

Tags:

Baidu ยักษ์ใหญ่แห่งวงการค้นหาจากประเทศจีน เปิดตัวเทคโนโลยีใหม่จากแผนกพัฒนาของตัวเองในชื่อ "Deep Speech" ที่เคลมว่าสามารถพลิกโฉมการสั่งด้วยเสียงในปัจจุบันได้เลย

Deep Speech เป็นระบบสั่งงานด้วยเสียงที่ออกแบบมาเพื่อใช้งานในสภาพแวดล้อมจริง ที่สามารถใช้งานได้แม้ว่าจะมีเสียงดังรบกวน เช่นในร้านอาหาร บนรถโดยสาร หรือการใช้งานที่ผู้พูดอยู่ห่างจากไมโครโฟน เป็นต้น โดยคีย์ของเทคโนโลยีนี้คือการใช้จีพียูมาช่วยประมวลผล ร่วมกับฐานข้อมูลขนาดใหญ่ของ Baidu เองที่เก็บมามากกว่า 100,000 ชั่วโมงด้วยกัน

Baidu ได้ทดสอบ Deep Speech ในสถานการณ์จริงและพบว่ามีความผิดพลาดของคำเพียงแค่ 16.5% เท่านั้น รวมถึงให้ผลลัพธ์ที่แม่นยำกว่าคู่แข่งมากกว่า 10% ในสภาวะที่มีเสียงรบกวนมาก (แต่ไม่ได้บอกว่าทดสอบด้วยภาษาอะไร)

หัวหน้านักวิทยาศาสตร์ของ Baidu บอกว่า Deep Speech จะเป็นตัวแปรสำคัญสำหรับพลิกโฉมอุปกรณ์พกพาในอนาคต และเป็นก้าวแรกสู่ความพยายามพูดคุยกับอุปกรณ์อัจฉริยะอื่นๆ ในอนาคต รวมถึงหุ่นยนต์ในสภาพแวดล้อมจริงไปอีกขั้น

ใครที่สนใจรายละเอียดของ Deep Speech สามารถหาอ่านได้จากงานวิจัย Deep Speech: Scaling Up End-to-End Speech Recognition ครับ

Tags:

Facebook เข้าซื้อกิจการ Wit.ai บริษัทสตาร์ตอัพด้านระบบแยกแยะเสียง (voice recognition) ที่เปิด API ด้านการแยกแยะเสียงให้นักพัฒนาภายนอกใช้งาน (ส่งไฟล์เสียงเข้ามาให้ Wit.ai ประมวลผลให้)

Wit.ai เพิ่งก่อตั้งได้เพียง 18 เดือนแต่ก็มีนักพัฒนาเข้ามาใช้บริการ API แล้วกว่า 6,000 ราย หลังไปอยู่กับ Facebook แล้ว ตัวแพลตฟอร์มและซอฟต์แวร์จะยังแจกฟรี-เปิดซอร์สต่อไป

ใครอยากทดสอบระบบแยกแยะเสียงของ Wit.ai ลองเล่นได้ที่หน้าเดโม

ที่มา - Wit.ai

Tags:
Chromebook

หลังจากที่ Chrome รองรับคำสั่งเสียง OK Google โดยไม่ต้องแตะเมาส์มาตั้งแต่รุ่น 35 ที่ออกเมื่อช่วงกลางปีที่ผ่านมา ตอนนี้ก็ถึงเวลาของ Chromebook บ้าง โดยในฝั่งของ Chromebook นั้นผู้ใช้สามารถพูดคำสั่ง OK Google เพื่อเริ่มการทำงานได้ตลอดเวลาที่หน้าจอติดและเครื่องถูกปลดล็อกอยู่ แต่ในตอนนี้จะสามารถใช้งานได้เฉพาะ Chrome OS Dev Channel เท่านั้น

สำหรับคนที่อยู่ใน Chrome OS Dev Channel แล้ว สามารถใช้งานได้ด้วยการเปลี่ยนตัวเลือกใน chrome://flags/#enable-hotword-hardware จากนั้นให้รีสตาร์ทเครื่อง กลับมาเข้าหน้าตั้งค่าของระบบและเลือก Enable "OK Google" และทำตามขั้นตอนการฝึกตามที่เครื่องแจ้ง

ที่มา - +François Beaufort ผ่าน The Verge

ถ้ายังจำกันได้ เมื่อไม่นานมานี้ ไมโครซอฟท์เพิ่งออกแอพสั่งงานด้วยเสียง Torque สำหรับนาฬิกา Android Wear โดยเป็นส่วนหนึ่งของโครงการ Microsoft Garage ที่ส่งเสริมให้พนักงานสร้างแอพเล่นๆ นอกเวลางาน

ล่าสุดไมโครซอฟท์อัพเดต Torque เวอร์ชัน 2.0 ที่ปรับปรุงให้มันใช้กับสมาร์ทโฟน Android ได้ด้วย ขั้นตอนการใช้งานคือเขย่ามือถือ (หรือพลิกข้อมือถ้าเป็น Android Wear) เพื่อเรียก Torque จากนั้นก็พูดคำที่ต้องการค้นหาได้เลย

Torque ใช้ระบบแยกแยะเสียงของไมโครซอฟท์เอง และค้นหาข้อมูลด้วย Bing ครับ ทดลองเล่นได้ที่ Play Store

ที่มา - TechCrunch

Tags:

แม้ Fire Phone จะล้มเหลวไม่เป็นท่า แต่ Amazon ก็ยังคงไม่ละความพยายามในการสร้างฮาร์ดแวร์ออกสู่ท้องตลาด และครั้งนี้ Amazon ได้เปิดตัวอุปกรณ์เพื่อใช้งานภายในที่พักอาศัย มันคือ Echo ลำโพงพูดได้ที่พร้อมจะคุยและตอบคำถามทุกคนในบ้าน

Echo คือลำโพงที่สามารถเข้าใจคำพูดของคนได้โดยอาศัยซอฟต์แวร์รู้จำคำพูดของมนุษย์ มันสามารถสามารถแจ้งข้อมูลทั่วไปอย่างวันและเวลา, สภาพอากาศได้ ทั้งยังสามารถตอบคำถามของผู้ใช้งานได้โดยการค้นหาข้อมูลจากฐานข้อมูลอันมหาศาลในกลุ่มเมฆของ Amazon

Echo นั้นสามารถทำงานเหมือนซอฟต์แวร์ผู้ช่วยส่วนตัวในอุปกรณ์พกพาได้ ผู้ใช้สามารถสั่งงานให้ Echo เพิ่มการนัดหมายในตารางเวลา, ตั้งเวลาปลุก, จดบันทึกรายการต่างๆ หรือจับเวลาก็ได้เช่นกัน โดยมันจะสามารถทำงานเชื่อมต่อกับอุปกรณ์พกพาได้ผ่าน Wi-Fi และแน่นอนว่าในฐานะที่เป็นลำโพง Echo สามารถเล่นเพลงที่ส่งผ่านมาทางบลูทูธ หรือค้นหาและเล่นเพลงในรายชื่อที่บันทึกไว้ก็ย่อมได้ ซึ่งเมื่อยิ่งใช้งานบ่อยเข้า Echo ก็จะยิ่งเรียนรุ้จากผู้ใช้มากขึ้น

Tags:

อเมซอนเปิดตัว Amazon Echo คอมพิวเตอร์ที่ควบคุมด้วยเสียงเป็นหลัก รอรับคำสั่งตลอดเวลาโดยสั่งว่า "Alexa" เพื่อเริ่มต้นการทำงาน สามารถถามตอบคำถามทั่วไป, ตั้งนาฬิกาปลุก, เล่นเพลง, ค้นหา Wikipedia, จัดการรายการซื้อสินค้า, จัดการรายการสิ่งที่ต้องทำ (to-do list)

เทคโนโลยีรูปแบบเดียวกันคนทั่วไปน่าจะเคยเห็นในภาพยนตร์อย่าง Jarvis ใน Iron Man, หรือใกล้ตัวขึ้นมาก็เป็น Siri และ Google Now สิ่งที่ทำให้ Echo ใกล้เคียง Jarvis คือมันรองรับการฟังเสียงจากระยะไกล ทำให้ไม่ต้องพูดจ่อกับตัวเครื่องแต่สามารถสั่งงานจากที่ใดก็ได้ในห้อง

ผู้ซื้อต้องเป็นผู้ที่ได้รับเชิญเท่านั้น เบื้องต้นราคา 199 ดอลลาร์สำหรับคนทั่วไป และ 99 ดอลลาร์สำหรับสมาชิก Amazon Prime กระบวนการเชิญใช้เวลาสองสามสัปดาห์ แต่ไม่ระบุว่าจะส่งของได้เมื่อไหร่

ที่มา - Amazon Echo, Gizmodo

Google Search

กูเกิลเปิดให้แอพ Android ใดๆ ที่อยากรองรับการค้นหาข้อมูลด้วยเสียงพูด สามารถฝังโค้ดของกูเกิลเพียง 6 บรรทัด เพื่อเรียกใช้ฟีเจอร์ค้นหาด้วยเสียงของ Google Now ได้แล้ว

วิธีการใช้งานคือผู้ใช้เรียก Google Now ขึ้นมาด้วยวลี "Ok Google" ตามปกติ แล้วสั่งงานด้วยคำว่า "search keyword on appname" ตัวอย่างเช่น "Ok Google, search for hotels in Maui on TripAdvisor" คำค้นว่า "hotels in Maui" จะถูกส่งต่อไปยังระบบค้นหาของแอพ TripAdvisor ให้อัตโนมัติ

ฟีเจอร์นี้ใช้ได้กับ Android Jelly Bean ขึ้นไป โดยจะต้องลงแอพ Google/Google Search เวอร์ชัน 3.5 ขึ้นไป ผู้ใช้งานจะต้องตั้งค่า locale ของเครื่องเป็นภาษาอังกฤษเท่านั้นถึงจะใช้งานได้ ใครเป็นนักพัฒนาตามไปอ่านวิธีการกันเอาเองตามลิงก์ครับ

ที่มา - Android Developers Blog

Tags:
INSTEON

จากข่าว ไมโครซอฟท์จับมือ Insteon สร้างพันธมิตรอุปกรณ์สมาร์ทโฟนสั่งงานได้ด้วย Cortana วันนี้แอพเปิดให้โหลดบน Windows Phone Store เรียบร้อยแล้ว

จากนี้ไปผู้ที่มีระบบบ้านอัจฉริยะของ Insteon จะสามารถสั่งปิดไฟ ล็อคประตูด้วยเสียงได้ผ่าน Cortana โดยใช้คำสั่งขึ้นต้นด้วยคำว่า Insteon เช่น

  • สั่งว่า "Insteon, it's hot in here" เราจะได้รับคำตอบว่า “Nobody likes being hot, want to adjust your thermostat?” เป็นต้น
  • สามารถกำหนดให้รับคำสั่งว่า "Insteon, leaving the house" แล้วทำงานเป็นชุด ปิดไฟ ล็อคประตู ปิดระบบทำความร้อน

นึกภาพตามไม่ออก ลองดูได้จากคลิปท้ายข่าวครับ

ที่มา - Insteon

Tags:
Google Search

ถ้ายังจำกันได้ เราสามารถใช้ Google Search ค้นหาด้วยเสียงภาษาไทยได้แล้ว แต่ปัญหาในการใช้งานคือเราต้องสลับภาษาเอาว่าจะค้นด้วยเสียงไทยหรืออังกฤษ ซึ่งยุ่งยากพอสมควร

วันนี้ปัญหาข้างต้นหมดไปแล้ว เพราะกูเกิลปรับปรุงแอพ Google Search for Android ให้รองรับเสียงพูดหลายภาษาในตัว (สูงสุด 5 ภาษาพร้อมกัน)

วิธีใช้งานคือเข้าแอพ Google Search (เวอร์ชัน 3.6 ขึ้นไป) เลือก Settings > Voice > Languages แล้วเลือกภาษาที่ต้องการใช้งาน เช่น ไทย+อังกฤษ

จากนั้นก็พูดสิ่งที่ต้องการค้นหาได้เลยครับ ระบบจะดักให้เองว่าเป็นเสียงภาษาอะไร (ข้อจำกัดคือการค้นแต่ละครั้งต้องเป็นภาษาเดียวกัน เช่น "สวัสดี" ตามด้วย "Hello" ไม่สามารถ "สวัสดี Hello" ได้)

ที่มา - Inside Search

Tags:
Siri

แอปเปิลจดสิทธิบัตร "ผู้ช่วยดิจิทัลบนระบบเดสก์ท็อป" (Intelligent digital assistant in a desktop environment) หรืออธิบายง่ายๆ ว่ามันคือ Siri for Mac ก็พอได้

ข้อมูลจากเอกสารสิทธิบัตรแสดงให้เห็นไอคอนไมโครโฟนแบบเดียวกับ Siri บนหน้าจอ OS X ที่สามารถพูดคุยกับผู้ใช้ด้วยเสียงได้ ตัวไอคอนสามารถวางไว้บน Dock หรือจะวางลอยอยู่ที่ตำแหน่งอื่นก็ได้

ที่พิเศษกว่าเวอร์ชัน iOS คือระบบผู้ช่วยส่วนตัวบนเดสก์ท็อปจะดู "บริบท" (context) ของการใช้งานจากตำแหน่งของเมาส์ เช่น วางเมาส์ไว้บนไอคอนไฟล์ แล้วสั่ง "copy" ด้วยเสียงพูด เป็นต้น

ที่มา - AppleInsider

Tags:
Google Now

ปกติ Google Now ถือได้ว่ารับคำสั่งเสียงค่อนข้างแม่นยำอยู่พอสมควร แต่ทั้งนี้ทั้งนั้นก็ขึ้นอยู่กับปัจจัยภายนอกด้วยเช่นเสียงรบกวน และความชัดถ้อยชัดคำของผู้พูด กรณีเกิดความผิดพลาดในการรับคำสั่งเสียงขึ้น ล่าสุดกูเกิลอัพเดตให้ Google Now สามารถรับคำสั่งแก้เฉพาะคำที่ฟังผิดพลาดได้แล้ว โดยไม่ต้องสั่งคำสั่งใหม่ทั้งประโยค

เพียงแค่พูดว่า "No, I said ..." ทันทีหลังจากที่ Google แสดงผลการรับคำสั่ง เพื่อแก้คำที่ผิด เช่น "No, I said Savannah" ระบบก็จะแก้คำว่า Savannah แทนคำว่า banana ให้โดยอัตโนมัติ โดยไม่ต้องสั่งคำสั่งใหม่ทั้งประโยค

ที่มา - Droid Life

Tags:
Siri

เมื่อปี 2012 บริษัทจีน Zhizhen Network Technology จากเซี่ยงไฮ้ เคยยื่นฟ้องแอปเปิลว่า Siri ละเมิดสิทธิบัตรด้านการสั่งงานด้วยเสียงของตัวเองในภาษาจีนกลางและกวางตุ้ง (ยื่นขอสิทธิบัตรปี 2004 และได้รับในปี 2006) โดยขอให้ศาลสั่งห้ามไม่ให้แอปเปิลขายสินค้าที่มี Siri ติดตั้งอยู่

แอปเปิลยืนยันว่าไม่รู้จักสิทธิบัตรของ Zhizhen และไม่ได้ใช้เทคนิคตามสิทธิบัตรชิ้นนี้ ทนายความของแอปเปิลใช้วิธีขอให้สำนักงานทรัพย์สินทางปัญญาของจีน (State Intellectual Property Office) ยกเลิกสิทธิบัตรฉบับนี้แต่ก็ถูกปฏิเสธ แอปเปิลจึงใช้วิธีฟ้องทั้ง Zhizhen และสำนักงานทรัพย์สินทางปัญญา แต่ก็แพ้คดีในศาลปักกิ่งอีกเช่นกัน

แอปเปิลระบุว่าจะยื่นอุทธรณ์ แต่ก็เปิดกว้างในการเจรจายอมความกับ Zhizhen ซึ่งกลุ่มอุตสาหกรรมอินเทอร์เน็ตจีนก็ให้ความเห็นว่าคดีนี้น่าจะจบด้วยการจ่ายเงินยอมความ และแอปเปิลจะยังขายสินค้าในจีนได้ต่อไป

ที่มา - BBC