Voice Recognition

ความฝันของแฟน Star Trek เป็นจริง Amazon Alexa ตั้งคำเรียกเป็น "Computer" ได้แล้ว

By mk

on 24 January 2017 - 23:12 Tag: Star Trek, Voice Recognition, Alexa

Star Trek

ผู้ช่วยส่วนตัว Amazon Alexa จะมีคำที่ใช้เรียกหา (wake word เป็นคำที่ลำโพงคอยดักจับตลอดเวลา) ว่า "Alexa" แต่เราก็สามารถเปลี่ยนเป็น "Amazon" หรือ "Echo" ได้ถ้าต้องการ

ล่าสุด Amazon เพิ่มคำ wake word ไปอีกหนึ่งคำคือ "Computer"

คำว่า "Computer" เป็นคำที่ตัวละครในซีรีส์ Star Trek ใช้คุยกับระบบคอมพิวเตอร์ของยานอวกาศ ซึ่งจะตอบกลับมาด้วยเสียงพูดแบบเดียวกับมนุษย์ ถือเป็นต้นแบบหนึ่งของผู้ช่วยส่วนตัวในปัจจุบัน

ฟีเจอร์นี้สามารถใช้ได้กับอุปกรณ์ทุกตัวที่ฝัง Alexa ซึ่งก็รวมไปถึงตู้เย็นหรือเครื่องซักผ้าด้วย

ผู้บริหาร LG เผย ปีหน้าเครื่องปรับอากาศทุกเครื่องจะมาพร้อบระบบ Voice Recognition

By nismod

on 16 January 2017 - 16:08 Tag: LG, Smart Home, Internet of Things, Voice Recognition

Song Dae-hyun ผู้บริหาร LG Electronics ฝ่ายเครื่องใช้ไฟฟ้าภายในบ้านและเครื่องปรับอากาศเผยว่า ปีหน้าเป็นต้นไป เครื่องปรับอากาศที่ LG เปิดตัวทุกเครื่องจะมาพร้อมกับระบบ Voice Recognition โดยตอนนี้ LG กำลังพิจารณาเป็นพาร์ทเนอร์กับบริษัทที่ครอบครองเทคโนโลยีเหล่านี้อย่างแอปเปิลและ Amazon

ผู้ก่อตั้งและซีอีโอ Sonos ประกาศลาออก ท่ามกลางการปรับตัวของลำโพงไร้สายต่อ Voice Recognition

By nismod

on 16 January 2017 - 12:13 Tag: Sonos, Speaker, Voice Recognition, Amazon Echo

Sonos

John MacFarlane ผู้ก่อตั้งและซีอีโอ Sonos บริษัทผลิตลำโพงไร้สายชื่อดังประกาศลาออกจากทุกตำแหน่งบริหารในบริษัท ทั้งซีอีโอและคณะกรรมการบริหาร (Board of Directors) โดยเหลือเพียงตำแหน่งพนักงานบริษัทเท่านั้น สำหรับการสอนงานและทำงาน 2 โปรเจ็คที่เจ้าตัวสนเท่านั้น และคนที่มารับช่วงต่อคือ Patrick Spence ท่ามกลางความร้อนแรงในการแข่งขันของตลาดลำโพงไร้สายในขณะนี้

Hyundai เชื่อมระบบควบคุมรถยนต์กับ Google Assistant สั่งงานด้วยเสียงจากระยะไกลได้

By mk

on 4 January 2017 - 22:49 Tag: Hyundai, Google Assistant, Google, Voice Recognition

Hyundai

งาน CES 2017 ปีนี้ เราเห็น Amazon ขยายแพลตฟอร์ม Alexa ไปยังอุปกรณ์ของคู่ค้าหลายตัว (Lenovo, Whirlpool, Dish) ฝั่งคู่แข่ง Google Assistant ก็ไม่ยอมน้อยหน้า ก่อนหน้านี้เคยจับมือกับ Sony สำหรับตลาดทีวีและเครื่องเสียงไปแล้ว คราวนี้เป็นบริษัทรถยนต์ Hyundai บ้าง

Vinclu เปิดให้จอง Gatebox AI ควบคุมบ้านสำหรับคนเหงาเดียวดาย

By osmiumwo1f

on 19 December 2016 - 12:01 Tag: Gatebox, Voice Recognition

Gatebox

ในขณะที่ทั้ง Amazon และ Google ต่างมีผลิตภัณฑ์ AI ผู้ช่วยประจำบ้านที่สั่งงานได้ด้วยเสียง ล่าสุด Vinclu บริษัทจากญี่ปุ่นเปิดให้จอง Gatebox waifu ประจำบ้าน AI ผู้ช่วยประจำบ้านที่มาพร้อมกับการสั่งงานด้วยเสียงและส่วนแสดงผลแบบ holographic สำหรับแสดงตัว avatar ของ AI ในราคา 321,840 เยน (ประมาณ 99,000 บาท และจัดส่งเฉพาะในญี่ปุ่นและสหรัฐอเมริกา)

Vinclu บอกว่านอกจากจะสามารถควบคุมและสั่งงานอุปกรณ์ต่างๆ ภายในบ้านได้แล้ว ตัว AI ยังมีปฏิสัมพันธ์กับ "นายท่าน" ผ่านทางเสียงและภาพ hologram ได้ และมีแผนเพิ่มบุคลิกของ AI หลากหลายตามความต้องการอีกด้วย โดย avatar ตัวแรกชื่อ อะสึมะ ฮิคาริ ซึ่งเป็น AI หญิงที่เหมาะสำหรับคนที่อยู่คนเดียว และพากษ์โดยยูกะ ฮิยะมิสึ

ไมโครซอฟท์จับมือ Harman Kardon ทำลำโพงอัจฉริยะ, เปิด Cortana SDK ให้ผู้ผลิตฮาร์ดแวร์

By mk

on 14 December 2016 - 08:29 Tag: Harman, Development, Internet of Things, Voice Recognition, Microsoft, Cortana

Harman

เราเห็น Amazon Echo เริ่มบุกเบิกตลาด "เครื่องใช้ไฟฟ้าพูดได้" จากนั้นตามมาด้วย Google Home ที่อยู่บนแนวคิดแบบเดียวกัน ล่าสุดไมโครซอฟท์ลงสู่ตลาดนี้ด้วย Cortana

แนวทางของไมโครซอฟท์คือไม่ได้ทำฮาร์ดแวร์เอง แต่เปิด Cortana Devices SDK ให้ผู้ผลิตฮาร์ดแวร์รายอื่นเข้ามาเชื่อมต่อกันได้ โดยผู้ผลิตฮาร์ดแวร์รายแรกที่เปิดตัวเป็นพันธมิตรกันคือ Harman Kardon (ที่ตอนนี้กลายเป็นบริษัทของซัมซุงไปแล้ว) ที่นำลำโพงอัจฉริยะแบบเดียวกับ Amazon Echo ออกมาโชว์บ้างแล้ว (วางขายจริงปี 2017)

Project VoCo โดย Adobe แก้ไขไฟล์เสียงง่ายเหมือนแก้ไข text โดยใช้อัลกอริทึม

By sunnywalker

on 4 November 2016 - 13:02 Tag: Voice Recognition, Adobe

Voice Recognition

ความน่าสนใจจากงาน Max Conference โดย Adobe ยังคงมีอยู่อย่างต่อเนื่อง ในงานนี้ Adobe ยังเปิดตัวเครื่องมือทำงานด้านไฟล์เสียงใหม่ ซึ่งก็คือ Project VoCo ให้ผู้ใช้แก้ไขไฟล์เสียงง่ายเหมือแก้ไขข้อความ และยังสร้างไฟล์เสียงขึ้นมาใหม่ได้โดยใช้อัลกอริทึม

Project VoCo สามารถวิเคราะห์และแปลงไฟล์เสียงออกมาเป็น phoneme หรือหน่วยพื้นฐานของเสียง หลังจากวิเคราะห์แล้วจะสามารถสร้างโมเดลเสียงขึ้นมาใหม่ได้ นอกจากนี้ยังแก้ไขเสียงได้ด้วยการพิมพ์คำที่ต้องการแก้ลงในโปรแกรม คำพูดต่างๆ จะถูกถอดเป็นข้อความโดยโปรแกรมอยู่แล้ว

แม้จะใช้งานง่าย และมีฟีเจอร์สร้างเสียง แต่ตัวโปรแกรมอาจถูกตั้งคำถามว่าจะมีปัญหาเกี่ยวกับการสร้างเสียงปลอมของบุคคล ซึ่งอาจส่งผลกระทบในเรื่องใดเรื่องหนึ่งหรือไม่

ไมโครซอฟท์พัฒนาระบบ Speech Recognition ที่แม่นยำทัดเทียมกับมนุษย์ได้แล้ว

By mk

on 20 October 2016 - 01:30 Tag: Research, Speech Recognition, Voice Recognition, Microsoft

Research

ทีม Microsoft Artificial Intelligence and Research (ที่เพิ่งก่อตั้ง) ประสบความสำเร็จกับระบบแยกแยะเสียงพูด (speech recognition) ที่มีความผิดพลาดน้อยเทียบเท่ากับมนุษย์ผู้เชี่ยวชาญด้านการถอดเสียงพูดแล้ว

ไมโครซอฟท์สามารถพัฒนาระบบถอดเสียงพูดที่มีอัตราความผิดพลาด (word error rate หรือ WER) ที่ 5.9% ซึ่งใกล้เคียงกับการถอดเสียงโดยมนุษย์ และถือเป็นระบบแยกแยกเสียงตัวแรกที่มีความแม่นยำถึงระดับนี้

หลุดข้อมูล GoPro Hero 5 เผยฟีเจอร์เชื่อมต่อกลุ่มเมฆและรองรับการสั่งงานด้วยเสียง

By ตะโร่งโต้ง

on 28 August 2016 - 23:39 Tag: GoPro, Voice Recognition, Cloud, Rumors

GoPro

มีข้อมูลของกล้อง GoPro 5 หลุดออกมา ทั้งภาพเครื่องและภาพคู่มือของกล้อง โดยภาพคู่มือนั้นยังเผยรายละเอียดฟีเจอร์ใหม่ที่สำคัญ 2 อย่าง คือการเชื่อมต่อพื้นที่เก็บไฟล์ภาพบนกลุ่มเมฆ และฟีเจอร์รองรับการสั่งงานด้วยเสียง

ข้อมูลที่หลุดออกมานั้น ปรากฏจากต้นทาง 2 แห่ง คือ ภาพหลุดเครื่องต้นแบบและข้อมูลสเป็กเบื้องต้นจากเว็บไซต์ญี่ปุ่นที่ชื่อ Nokishita (ซึ่งแม้ว่าต้นทางจะลบข้อมูลไปแล้ว แต่เว็บข่าววงการกล้อง Mirrorless Rumors ก็เก็บภาพและข้อมูลไว้ได้ทันและทำการเผยแพร่ต่อ) อีกส่วนหนึ่งเป็นภาพคู่มือการใช้งาน GoPro Hero 5 ซึ่งโพสต์โดยผู้ใช้ Reddit รายหนึ่ง (ซึ่งปัจจุบันโพสต์ดังกล่าวก็ถูกลบไปแล้วเช่นกัน)

ซัมซุงยื่นจดทะเบียน Scoop ลำโพงอัจฉริยะแบบ Echo และ Google Home

By nismod

on 23 August 2016 - 10:37 Tag: Samsung, Voice Recognition, FCC

Samsung

ซัมซุงได้นำอุปกรณ์ชิ้นใหม่ไปจดทะเบียนกับ FCC หรือหน่วยงานด้านการสื่อสารของรัฐบาลกลางสหรัฐฯ (คล้าย กสทช.) ซึ่งอุปกรณ์นี้ที่มีชื่อตามเอกสารว่า Scoop เป็นลำโพงบลูทูธที่รองรับการสั่งงานด้วยเสียงแบบ Amazon Echo และ Google Home

รูปทรงของ Scoop ก็ไม่แตกต่างจากทั้งสองเจ้ามากนัก เพียงแต่มีความเตี้ยกว่า ด้านบนเป็นลำโพง ปุ่มเพิ่มลดเสียง ปุ่ม playและบลูทูธ และไฟแสดงสถานะ ด้านข้างมีปุ่ม power พอร์ต USB และพอร์ตชาร์จไฟ

สิ่งที่น่าสนใจคือระบบ Voice Assistant ที่ซัมซุงนำมาใช้เป็นการพัฒนาขึ้นมาเอง หรือนำเข้าซอฟต์แวร์จากกูเกิล และมันจะดีเหมือน Siri, Google Now หรือแม้แต่ Alexa มากน้อยแค่ไหน

Amazon ปรับปรุงสโตร์สอนความสามารถใหม่ให้กับ Alexa

By nismod

on 1 July 2016 - 12:44 Tag: Amazon, Voice Recognition, Alexa, Amazon Echo

Amazon

Amazon ได้ปรับปรุงแอพสโตร์ของ Alexa ผู้ช่วยเสมือนจริงใหม่ทั้งหมด มีการจัดเป็นหมวดหมู่และระบบการค้นหาใหม่ ทำให้ผู้ใช้สามารถค้นหาแอพที่จะเพิ่มความสามารถให้กับ Alexa ได้ง่ายยิ่งขึ้น รวมถึงสามารถสั่งให้ Alexa ค้นหาและเพิ่มแอพได้ด้วยตัวเอง ผ่านการสั่งงานผ่านเสียงแล้ว

Amazon ระบุด้วยว่ากลุ่มแอพบนสโตร์ที่เติบโตมากเป็นอันดับต้นๆ คือกลุ่ม Smart Home โดยระยะเวลาเพียงไม่ถึงปี จากแอพที่มีแอพอยู่เพียงประมาณ 130 แอพ ปัจจุบันเพิ่มขึ้นมาอยู่ที่มากกว่า 1,400 แอพแล้ว ซึ่งนับว่าเป็น ecosystem ใหม่ที่เติบโตเร็วมาก หากมองว่า Alexa เพิ่งเปิด APIs ให้กับนักพัฒนาเพียงปีเดียวเท่านั้น

ผลสำรวจชี้ผู้ใช้ Voice Assistant ส่วนใหญ่เลือกใช้ในที่ส่วนตัว

By nismod

on 7 June 2016 - 15:51 Tag: Voice Recognition, Siri, Google Now, Alexa, Cortana

Voice Recognition

Creative Strategies ได้จัดทำแบบสำรวจเกี่ยวกับผู้ใช้ Voice Assistant บนสมาร์ทโฟนทั้ง Siri และ Google Now ในสหรัฐพบว่าผู้ใช้ iPhone เพียง 2% ไม่เคยใช้งาน Siri และผู้ใช้แอนดรอยด์ 4% ไม่เคยใช้งาน Google Now

ขณะที่ผู้ใช้ iPhone กว่า 70% ระบุใช้งาน Siri เป็นบางครั้งบางคราว ส่วนฝั่งผู้ใช้งานแอนดรอยด์มี 62% ที่ใช้งาน Google Now บ้างเป็นบางครั้ง โดยกว่า 39% ของผู้ตอบแบบสอบถามระบุว่าใช้งานที่บ้านเป็นส่วนใหญ่ และอีกกว่า 51% ใช้งานภายในรถ มีเพียง 1.3% และ 3% เท่านั้นที่เลือกใช้งานในที่ทำงานและในที่สาธารณะตามลำดับ

ไมโครซอฟท์จดสิทธิบัตร เช็กว่าอุปกรณ์ใดควรรับคำสั่งเสียงปลุกขึ้นมาให้ทำงานหากอยู่ใกล้กัน

By nuntawat

on 5 June 2016 - 15:34 Tag: Patent, Voice Recognition, Microsoft

Patent

ปัจจุบันอุปกรณ์หลายตัวรอบตัวผู้ใช้รองรับการสั่งการด้วยเสียงเพื่อปลุกเครื่องขึ้นมาทำงาน (voice activation) แต่ก็เป็นไปได้ที่อุปกรณ์เหล่านั้นหากอยู่ใกล้กันจะทำงานพร้อมกันเมื่อรับคำสั่งเสียงเดียวกัน

ล่าสุด ไมโครซอฟท์จดสิทธิบัตร Device Arbitration for Listening Devices ที่กล่าวถึงวิธีการที่อุปกรณ์จะสื่อสารกับอุปกรณ์อื่นในเครือข่ายก่อนที่จะตื่นขึ้นอย่างสมบูรณ์ และตัดสินใจว่าอุปกรณ์ใดจะตื่นขึ้นจากเสียงสั่งการ อาทิ มีการกำหนดค่าอุปกรณ์หลักไว้ หรือตามกิจกรรมที่ถูกตรวจจับโดยอุปกรณ์

ดูรายละเอียดสิทธิบัตรทั้งหมดได้จากที่มาของข่าว

ที่มา: WIPO ผ่าน MSPoweruser

[Google I/O] Google เปิดตัว Google Home ผู้ช่วยสั่งงานด้วยเสียงประจำบ้าน

By nismod

on 19 May 2016 - 00:56 Tag: Google Home, Google, Voice Recognition, Google I/O

Google Home

ไม่ผิดจากที่ลือก่อนหน้านี้ Google ได้เปิดตัว Google Home อุปกรณ์ที่รองรับการสั่งงานด้วยเสียงตลอดเวลา ออกมาท้าชน Amazon Echo โดยตรง

รูปทรงของ Google Home ไม่แตกต่างจากเราท์เตอร์ OnHub มากนัก โดยฐานของตัวเครื่องจะมีตัวเลือกให้ผู้ใช้เปลี่ยนได้หลากหลายทังสีและวัสดุ

กูเกิลออกแอพ Voice Access ควบคุม Android ด้วยเสียงพูดได้ทุกกรณี

By mk

on 12 April 2016 - 07:14 Tag: Google, Voice Recognition, Android, Accessibility

Google

ระบบปฏิบัติการ Android มีฟีเจอร์ Voice Command มาได้หลายปีแล้ว แต่ข้อจำกัดของมันคือรองรับการสั่งงาน "บางอย่าง" เท่าที่กูเกิลเตรียมไว้ให้

ล่าสุดกูเกิลออกแอพอีกตัวชื่อ Voice Access สามารถควบคุม Android ทั้งเครื่องด้วยเสียงพูดเพียงอย่างเดียว แอพตัวนี้ออกแบบมาสำหรับผู้พิการหรือมีข้อจำกัดในการใช้งาน (เช่น พิการทางสายตาหรือการเคลื่อนไหวของมือ) ช่วยให้สั่งงานโทรศัพท์ด้วยเสียงได้ง่ายขึ้นมาก (ตัวอย่างคำสั่งอย่างเช่น open chrome, go home, scroll down)

Voice Access ยังกำหนดหมายเลขให้ปุ่มทั้งหมดบนหน้าจอ เราสามารถสั่ง "tap" ตามด้วยหมายเลขที่ต้องการ แทนการเอานิ้วแตะที่ปุ่มได้ด้วย

แอพ Voice Access ยังมีสถานะเป็น Beta และต้องสมัครเข้าร่วมโครงการทดสอบก่อนใช้งาน (ตอนที่เขียนข่าว ปิดรับลงทะเบียนแล้ว)

เปิดตัว Microsoft Cognitive Services บริการวิเคราะห์ข้อมูลด้วย Machine Learning

By mk

on 31 March 2016 - 12:27 Tag: Machine Learning, Cloud Computing, Image Recognition, Voice Recognition, Microsoft

Machine Learning

ถ้ายังจำกันได้ ปีที่แล้วไมโครซอฟท์มีเว็บแอพวิเคราะห์ข้อมูลภาพให้เล่นกันสนุกๆ หลายตัว เช่น How-Old.net ทายอายุ, TwinOrNot.net เทียบคนหน้าเหมือน

เว็บแอพเหล่านี้อยู่ภายใต้ Project Oxford โครงการพัฒนา API ด้านการแยกแยะภาพและเสียงพูด ซึ่งวันนี้ได้ชื่อเรียกอย่างเป็นทางการว่า Microsoft Cognitive Services

ไมโครซอฟท์เปิด API ให้แอพภายนอกเชื่อมต่อ Cortana, ทำงานบน Android ได้ด้วย

By mk

on 31 March 2016 - 10:29 Tag: Android, Development, Voice Recognition, Microsoft, Cortana, Microsoft Build

Android

ไมโครซอฟท์ประกาศเพิ่มฟีเจอร์ชุดใหญ่ให้ Cortana และวางตัว Cortana เป็น "บริการข้ามแพลตฟอร์ม" ไม่ได้ผูกเฉพาะกับ Windows แต่สามารถใช้บน iOS/Android ได้ด้วย ซิงก์ข้อมูลทุกอย่างของเราได้อัตโนมัติ

นอกจากนี้ ไมโครซอฟท์ยังเปิด API ของ Cortana ให้เชื่อมโยงกับแอพตัวอื่นๆ ได้แล้ว (ใช้ได้กับทุกแพลตฟอร์ม ไม่ใช่แค่บน Windows)

จ่ายบัตรเครดิตด้วยเสียงพูด Amazon Alexa เพิ่มฟีเจอร์ด้านธุรกรรมการเงิน

By mk

on 13 March 2016 - 10:58 Tag: Voice Recognition, FinTech, Finance, Alexa, Amazon Echo

Voice Recognition

ผู้ช่วยส่วนตัว Amazon Alexa ที่มาพร้อมกับลำโพง Amazon Echo พัฒนาตัวเองไปอีกขั้น ล่าสุดมันสามารถจ่ายบัตรเครดิตให้เราได้แล้ว

งานนี้ Amazon จับมือกับ Capital One สถาบันการเงินรายใหญ่ของสหรัฐอเมริกา ลูกค้าที่มีบัญชี Capital One สามารถทำธุรกรรมต่างๆ ได้ด้วยเสียงพูด ไม่ว่าจะเป็นการถามยอดเงินในบัญชี เช็คการโอนเงินล่าสุด ไปจนถึงขั้นจ่ายหนี้บัตรเครดิตได้ด้วย

ตัวอย่างการใช้งานก็สามารถพูดประโยคเหล่านี้ได้เลย

“Alexa, ask Capital One for my Quicksilver Card balance”
“Alexa, ask Capital One when is my credit card payment due?”
“Alexa, ask Capital One to pay my credit card bill”

Amazon เปิดตัวลำโพงรุ่นเล็ก Amazon Tap และ Echo Dot รองรับการสั่งงานด้วยเสียง Alexa

By mk

on 3 March 2016 - 23:06 Tag: Voice Recognition, Speaker, Alexa, Amazon Echo

Voice Recognition

เราเห็นลำโพงพูดได้ Amazon Echo กันมาได้สักพักใหญ่ๆ แล้ว วันนี้ Amazon เปิดตัวลำโพงรุ่นเล็กลงมาอีกสองรุ่นครับ

ตัวแรกคือ Amazon Tap เป็นลำโพงแบบเดียวกับ Echo แต่ขนาดเล็กลงมาหน่อย มีฟีเจอร์สั่งงานด้วยเสียง Alexa เหมือนกัน จุดต่างคือมันออกแบบมาให้พกพาไปนอกสถานที่ได้ เป็น portable speaker ที่มีแบตเตอรี่ใช้เล่นเพลงได้นาน 9 ชั่วโมง และสามารถซื้อเคส Amazon Tap Sling ช่วยปกป้องเวลาเดินถือออกไปนอกบ้านได้

Amazon Tap ออกแบบมาเพื่อแข่งกับลำโพง Bluetooth ในท้องตลาด ชูจุดเด่นเหนือกว่าเรื่องการเล่นเพลงแบบสตรีมมิ่งได้ในตัว และสั่งงานด้วยเสียงได้ด้วย ราคาขายเครื่องละ 129.99 ดอลลาร์ (Echo รุ่นใหญ่ขาย 179.99 ดอลลาร์)

กูเกิลเริ่มเปิดระบบจ่ายเงินด้วยเสียง Hands Free ไม่ต้องหยิบมือถือออกมายืนยันตัวตน

By mk

on 3 March 2016 - 10:28 Tag: Google, Voice Recognition, Mobile Payment

Google

กูเกิลเคยโชว์ Hands Free ระบบจ่ายเงินที่ยืนยันตัวตนด้วยเสียงพูด ไม่ต้องหยิบมือถือออกมาจากกระเป๋า มาแล้วครั้งหนึ่ง ตอนนี้ระบบ Hands Free เริ่มเปิดบริการแล้วแบบจำกัดพื้นที่ โดยใช้ได้กับร้าน McDonald’s และ Papa John’s ในย่าน South Bay ของรัฐแคลิฟอร์เนีย (ใกล้ๆ กับสำนักงานใหญ่ของกูเกิล)

Subscribe to Voice Recognition