By mk Founder on Tag: Star Trek, Voice Recognition, Alexa
Star Trek

ผู้ช่วยส่วนตัว Amazon Alexa จะมีคำที่ใช้เรียกหา (wake word เป็นคำที่ลำโพงคอยดักจับตลอดเวลา) ว่า "Alexa" แต่เราก็สามารถเปลี่ยนเป็น "Amazon" หรือ "Echo" ได้ถ้าต้องการ

ล่าสุด Amazon เพิ่มคำ wake word ไปอีกหนึ่งคำคือ "Computer"

คำว่า "Computer" เป็นคำที่ตัวละครในซีรีส์ Star Trek ใช้คุยกับระบบคอมพิวเตอร์ของยานอวกาศ ซึ่งจะตอบกลับมาด้วยเสียงพูดแบบเดียวกับมนุษย์ ถือเป็นต้นแบบหนึ่งของผู้ช่วยส่วนตัวในปัจจุบัน

ฟีเจอร์นี้สามารถใช้ได้กับอุปกรณ์ทุกตัวที่ฝัง Alexa ซึ่งก็รวมไปถึงตู้เย็นหรือเครื่องซักผ้าด้วย

By nismod Writer on Tag: LG, Smart Home, Internet of Things, Voice Recognition
LG

Song Dae-hyun ผู้บริหาร LG Electronics ฝ่ายเครื่องใช้ไฟฟ้าภายในบ้านและเครื่องปรับอากาศเผยว่า ปีหน้าเป็นต้นไป เครื่องปรับอากาศที่ LG เปิดตัวทุกเครื่องจะมาพร้อมกับระบบ Voice Recognition โดยตอนนี้ LG กำลังพิจารณาเป็นพาร์ทเนอร์กับบริษัทที่ครอบครองเทคโนโลยีเหล่านี้อย่างแอปเปิลและ Amazon

By nismod Writer on Tag: Sonos, Speaker, Voice Recognition, Amazon Echo
Sonos

John MacFarlane ผู้ก่อตั้งและซีอีโอ Sonos บริษัทผลิตลำโพงไร้สายชื่อดังประกาศลาออกจากทุกตำแหน่งบริหารในบริษัท ทั้งซีอีโอและคณะกรรมการบริหาร (Board of Directors) โดยเหลือเพียงตำแหน่งพนักงานบริษัทเท่านั้น สำหรับการสอนงานและทำงาน 2 โปรเจ็คที่เจ้าตัวสนเท่านั้น และคนที่มารับช่วงต่อคือ Patrick Spence ท่ามกลางความร้อนแรงในการแข่งขันของตลาดลำโพงไร้สายในขณะนี้

By mk Founder on Tag: Hyundai, Google Assistant, Google, Voice Recognition
Hyundai

งาน CES 2017 ปีนี้ เราเห็น Amazon ขยายแพลตฟอร์ม Alexa ไปยังอุปกรณ์ของคู่ค้าหลายตัว (Lenovo, Whirlpool, Dish) ฝั่งคู่แข่ง Google Assistant ก็ไม่ยอมน้อยหน้า ก่อนหน้านี้เคยจับมือกับ Sony สำหรับตลาดทีวีและเครื่องเสียงไปแล้ว คราวนี้เป็นบริษัทรถยนต์ Hyundai บ้าง

By osmiumwo1f Contributor on Tag: Gatebox, Voice Recognition
Gatebox

ในขณะที่ทั้ง Amazon และ Google ต่างมีผลิตภัณฑ์ AI ผู้ช่วยประจำบ้านที่สั่งงานได้ด้วยเสียง ล่าสุด Vinclu บริษัทจากญี่ปุ่นเปิดให้จอง Gatebox waifu ประจำบ้าน AI ผู้ช่วยประจำบ้านที่มาพร้อมกับการสั่งงานด้วยเสียงและส่วนแสดงผลแบบ holographic สำหรับแสดงตัว avatar ของ AI ในราคา 321,840 เยน (ประมาณ 99,000 บาท และจัดส่งเฉพาะในญี่ปุ่นและสหรัฐอเมริกา)

Vinclu บอกว่านอกจากจะสามารถควบคุมและสั่งงานอุปกรณ์ต่างๆ ภายในบ้านได้แล้ว ตัว AI ยังมีปฏิสัมพันธ์กับ "นายท่าน" ผ่านทางเสียงและภาพ hologram ได้ และมีแผนเพิ่มบุคลิกของ AI หลากหลายตามความต้องการอีกด้วย โดย avatar ตัวแรกชื่อ อะสึมะ ฮิคาริ ซึ่งเป็น AI หญิงที่เหมาะสำหรับคนที่อยู่คนเดียว และพากษ์โดยยูกะ ฮิยะมิสึ

By mk Founder on Tag: Harman, Development, Internet of Things, Voice Recognition, Microsoft, Cortana
Harman

เราเห็น Amazon Echo เริ่มบุกเบิกตลาด "เครื่องใช้ไฟฟ้าพูดได้" จากนั้นตามมาด้วย Google Home ที่อยู่บนแนวคิดแบบเดียวกัน ล่าสุดไมโครซอฟท์ลงสู่ตลาดนี้ด้วย Cortana

แนวทางของไมโครซอฟท์คือไม่ได้ทำฮาร์ดแวร์เอง แต่เปิด Cortana Devices SDK ให้ผู้ผลิตฮาร์ดแวร์รายอื่นเข้ามาเชื่อมต่อกันได้ โดยผู้ผลิตฮาร์ดแวร์รายแรกที่เปิดตัวเป็นพันธมิตรกันคือ Harman Kardon (ที่ตอนนี้กลายเป็นบริษัทของซัมซุงไปแล้ว) ที่นำลำโพงอัจฉริยะแบบเดียวกับ Amazon Echo ออกมาโชว์บ้างแล้ว (วางขายจริงปี 2017)

By sunnywalker Writer on Tag: Voice Recognition, Adobe
Voice Recognition

ความน่าสนใจจากงาน Max Conference โดย Adobe ยังคงมีอยู่อย่างต่อเนื่อง ในงานนี้ Adobe ยังเปิดตัวเครื่องมือทำงานด้านไฟล์เสียงใหม่ ซึ่งก็คือ Project VoCo ให้ผู้ใช้แก้ไขไฟล์เสียงง่ายเหมือแก้ไขข้อความ และยังสร้างไฟล์เสียงขึ้นมาใหม่ได้โดยใช้อัลกอริทึม

Project VoCo สามารถวิเคราะห์และแปลงไฟล์เสียงออกมาเป็น phoneme หรือหน่วยพื้นฐานของเสียง หลังจากวิเคราะห์แล้วจะสามารถสร้างโมเดลเสียงขึ้นมาใหม่ได้ นอกจากนี้ยังแก้ไขเสียงได้ด้วยการพิมพ์คำที่ต้องการแก้ลงในโปรแกรม คำพูดต่างๆ จะถูกถอดเป็นข้อความโดยโปรแกรมอยู่แล้ว

แม้จะใช้งานง่าย และมีฟีเจอร์สร้างเสียง แต่ตัวโปรแกรมอาจถูกตั้งคำถามว่าจะมีปัญหาเกี่ยวกับการสร้างเสียงปลอมของบุคคล ซึ่งอาจส่งผลกระทบในเรื่องใดเรื่องหนึ่งหรือไม่

By mk Founder on Tag: Research, Speech Recognition, Voice Recognition, Microsoft
Research

ทีม Microsoft Artificial Intelligence and Research (ที่เพิ่งก่อตั้ง) ประสบความสำเร็จกับระบบแยกแยะเสียงพูด (speech recognition) ที่มีความผิดพลาดน้อยเทียบเท่ากับมนุษย์ผู้เชี่ยวชาญด้านการถอดเสียงพูดแล้ว

ไมโครซอฟท์สามารถพัฒนาระบบถอดเสียงพูดที่มีอัตราความผิดพลาด (word error rate หรือ WER) ที่ 5.9% ซึ่งใกล้เคียงกับการถอดเสียงโดยมนุษย์ และถือเป็นระบบแยกแยกเสียงตัวแรกที่มีความแม่นยำถึงระดับนี้

By ตะโร่งโต้ง Writer on Tag: GoPro, Voice Recognition, Cloud, Rumors
GoPro

มีข้อมูลของกล้อง GoPro 5 หลุดออกมา ทั้งภาพเครื่องและภาพคู่มือของกล้อง โดยภาพคู่มือนั้นยังเผยรายละเอียดฟีเจอร์ใหม่ที่สำคัญ 2 อย่าง คือการเชื่อมต่อพื้นที่เก็บไฟล์ภาพบนกลุ่มเมฆ และฟีเจอร์รองรับการสั่งงานด้วยเสียง

ข้อมูลที่หลุดออกมานั้น ปรากฏจากต้นทาง 2 แห่ง คือ ภาพหลุดเครื่องต้นแบบและข้อมูลสเป็กเบื้องต้นจากเว็บไซต์ญี่ปุ่นที่ชื่อ Nokishita (ซึ่งแม้ว่าต้นทางจะลบข้อมูลไปแล้ว แต่เว็บข่าววงการกล้อง Mirrorless Rumors ก็เก็บภาพและข้อมูลไว้ได้ทันและทำการเผยแพร่ต่อ) อีกส่วนหนึ่งเป็นภาพคู่มือการใช้งาน GoPro Hero 5 ซึ่งโพสต์โดยผู้ใช้ Reddit รายหนึ่ง (ซึ่งปัจจุบันโพสต์ดังกล่าวก็ถูกลบไปแล้วเช่นกัน)

By nismod Writer on Tag: Samsung, Voice Recognition, FCC
Samsung

ซัมซุงได้นำอุปกรณ์ชิ้นใหม่ไปจดทะเบียนกับ FCC หรือหน่วยงานด้านการสื่อสารของรัฐบาลกลางสหรัฐฯ (คล้าย กสทช.) ซึ่งอุปกรณ์นี้ที่มีชื่อตามเอกสารว่า Scoop เป็นลำโพงบลูทูธที่รองรับการสั่งงานด้วยเสียงแบบ Amazon Echo และ Google Home

รูปทรงของ Scoop ก็ไม่แตกต่างจากทั้งสองเจ้ามากนัก เพียงแต่มีความเตี้ยกว่า ด้านบนเป็นลำโพง ปุ่มเพิ่มลดเสียง ปุ่ม playและบลูทูธ และไฟแสดงสถานะ ด้านข้างมีปุ่ม power พอร์ต USB และพอร์ตชาร์จไฟ

สิ่งที่น่าสนใจคือระบบ Voice Assistant ที่ซัมซุงนำมาใช้เป็นการพัฒนาขึ้นมาเอง หรือนำเข้าซอฟต์แวร์จากกูเกิล และมันจะดีเหมือน Siri, Google Now หรือแม้แต่ Alexa มากน้อยแค่ไหน

By nismod Writer on Tag: Amazon, Voice Recognition, Alexa, Amazon Echo
Amazon

Amazon ได้ปรับปรุงแอพสโตร์ของ Alexa ผู้ช่วยเสมือนจริงใหม่ทั้งหมด มีการจัดเป็นหมวดหมู่และระบบการค้นหาใหม่ ทำให้ผู้ใช้สามารถค้นหาแอพที่จะเพิ่มความสามารถให้กับ Alexa ได้ง่ายยิ่งขึ้น รวมถึงสามารถสั่งให้ Alexa ค้นหาและเพิ่มแอพได้ด้วยตัวเอง ผ่านการสั่งงานผ่านเสียงแล้ว

Amazon ระบุด้วยว่ากลุ่มแอพบนสโตร์ที่เติบโตมากเป็นอันดับต้นๆ คือกลุ่ม Smart Home โดยระยะเวลาเพียงไม่ถึงปี จากแอพที่มีแอพอยู่เพียงประมาณ 130 แอพ ปัจจุบันเพิ่มขึ้นมาอยู่ที่มากกว่า 1,400 แอพแล้ว ซึ่งนับว่าเป็น ecosystem ใหม่ที่เติบโตเร็วมาก หากมองว่า Alexa เพิ่งเปิด APIs ให้กับนักพัฒนาเพียงปีเดียวเท่านั้น

By nismod Writer on Tag: Voice Recognition, Siri, Google Now, Alexa, Cortana
Voice Recognition

Creative Strategies ได้จัดทำแบบสำรวจเกี่ยวกับผู้ใช้ Voice Assistant บนสมาร์ทโฟนทั้ง Siri และ Google Now ในสหรัฐพบว่าผู้ใช้ iPhone เพียง 2% ไม่เคยใช้งาน Siri และผู้ใช้แอนดรอยด์ 4% ไม่เคยใช้งาน Google Now

ขณะที่ผู้ใช้ iPhone กว่า 70% ระบุใช้งาน Siri เป็นบางครั้งบางคราว ส่วนฝั่งผู้ใช้งานแอนดรอยด์มี 62% ที่ใช้งาน Google Now บ้างเป็นบางครั้ง โดยกว่า 39% ของผู้ตอบแบบสอบถามระบุว่าใช้งานที่บ้านเป็นส่วนใหญ่ และอีกกว่า 51% ใช้งานภายในรถ มีเพียง 1.3% และ 3% เท่านั้นที่เลือกใช้งานในที่ทำงานและในที่สาธารณะตามลำดับ

By nuntawat Writer on Tag: Patent, Voice Recognition, Microsoft
Patent

​ปัจจุบันอุปกรณ์หลายตัวรอบตัวผู้ใช้รองรับการสั่งการด้วยเสียงเพื่อปลุกเครื่องขึ้นมาทำงาน (voice activation) แต่ก็เป็นไปได้ที่อุปกรณ์เหล่านั้นหากอยู่ใกล้กันจะทำงานพร้อมกันเมื่อรับคำสั่งเสียงเดียวกัน

ล่าสุด ไมโครซอฟท์จดสิทธิบัตร Device Arbitration for Listening Devices ที่กล่าวถึงวิธีการที่อุปกรณ์จะสื่อสารกับอุปกรณ์อื่นในเครือข่ายก่อนที่จะตื่นขึ้นอย่างสมบูรณ์ และตัดสินใจว่าอุปกรณ์ใดจะตื่นขึ้นจากเสียงสั่งการ อาทิ มีการกำหนดค่าอุปกรณ์หลักไว้ หรือตามกิจกรรมที่ถูกตรวจจับโดยอุปกรณ์

ดูรายละเอียดสิทธิบัตรทั้งหมดได้จากที่มาของข่าว

ที่มา: WIPO ผ่าน MSPoweruser

By nismod Writer on Tag: Google Home, Google, Voice Recognition, Google I/O
Google Home

ไม่ผิดจากที่ลือก่อนหน้านี้ Google ได้เปิดตัว Google Home อุปกรณ์ที่รองรับการสั่งงานด้วยเสียงตลอดเวลา ออกมาท้าชน Amazon Echo โดยตรง

รูปทรงของ Google Home ไม่แตกต่างจากเราท์เตอร์ OnHub มากนัก โดยฐานของตัวเครื่องจะมีตัวเลือกให้ผู้ใช้เปลี่ยนได้หลากหลายทังสีและวัสดุ

By mk Founder on Tag: Google, Voice Recognition, Android, Accessibility
Google

ระบบปฏิบัติการ Android มีฟีเจอร์ Voice Command มาได้หลายปีแล้ว แต่ข้อจำกัดของมันคือรองรับการสั่งงาน "บางอย่าง" เท่าที่กูเกิลเตรียมไว้ให้

ล่าสุดกูเกิลออกแอพอีกตัวชื่อ Voice Access สามารถควบคุม Android ทั้งเครื่องด้วยเสียงพูดเพียงอย่างเดียว แอพตัวนี้ออกแบบมาสำหรับผู้พิการหรือมีข้อจำกัดในการใช้งาน (เช่น พิการทางสายตาหรือการเคลื่อนไหวของมือ) ช่วยให้สั่งงานโทรศัพท์ด้วยเสียงได้ง่ายขึ้นมาก (ตัวอย่างคำสั่งอย่างเช่น open chrome, go home, scroll down)

Voice Access ยังกำหนดหมายเลขให้ปุ่มทั้งหมดบนหน้าจอ เราสามารถสั่ง "tap" ตามด้วยหมายเลขที่ต้องการ แทนการเอานิ้วแตะที่ปุ่มได้ด้วย

แอพ Voice Access ยังมีสถานะเป็น Beta และต้องสมัครเข้าร่วมโครงการทดสอบก่อนใช้งาน (ตอนที่เขียนข่าว ปิดรับลงทะเบียนแล้ว)

Machine Learning

ถ้ายังจำกันได้ ปีที่แล้วไมโครซอฟท์มีเว็บแอพวิเคราะห์ข้อมูลภาพให้เล่นกันสนุกๆ หลายตัว เช่น How-Old.net ทายอายุ, TwinOrNot.net เทียบคนหน้าเหมือน

เว็บแอพเหล่านี้อยู่ภายใต้ Project Oxford โครงการพัฒนา API ด้านการแยกแยะภาพและเสียงพูด ซึ่งวันนี้ได้ชื่อเรียกอย่างเป็นทางการว่า Microsoft Cognitive Services

By mk Founder on Tag: Android, Development, Voice Recognition, Microsoft, Cortana, Microsoft Build
Android

ไมโครซอฟท์ประกาศเพิ่มฟีเจอร์ชุดใหญ่ให้ Cortana และวางตัว Cortana เป็น "บริการข้ามแพลตฟอร์ม" ไม่ได้ผูกเฉพาะกับ Windows แต่สามารถใช้บน iOS/Android ได้ด้วย ซิงก์ข้อมูลทุกอย่างของเราได้อัตโนมัติ

นอกจากนี้ ไมโครซอฟท์ยังเปิด API ของ Cortana ให้เชื่อมโยงกับแอพตัวอื่นๆ ได้แล้ว (ใช้ได้กับทุกแพลตฟอร์ม ไม่ใช่แค่บน Windows)

By mk Founder on Tag: Voice Recognition, FinTech, Finance, Alexa, Amazon Echo
Voice Recognition

ผู้ช่วยส่วนตัว Amazon Alexa ที่มาพร้อมกับลำโพง Amazon Echo พัฒนาตัวเองไปอีกขั้น ล่าสุดมันสามารถจ่ายบัตรเครดิตให้เราได้แล้ว

งานนี้ Amazon จับมือกับ Capital One สถาบันการเงินรายใหญ่ของสหรัฐอเมริกา ลูกค้าที่มีบัญชี Capital One สามารถทำธุรกรรมต่างๆ ได้ด้วยเสียงพูด ไม่ว่าจะเป็นการถามยอดเงินในบัญชี เช็คการโอนเงินล่าสุด ไปจนถึงขั้นจ่ายหนี้บัตรเครดิตได้ด้วย

ตัวอย่างการใช้งานก็สามารถพูดประโยคเหล่านี้ได้เลย

  • “Alexa, ask Capital One for my Quicksilver Card balance”
  • “Alexa, ask Capital One when is my credit card payment due?”
  • “Alexa, ask Capital One to pay my credit card bill”
By mk Founder on Tag: Voice Recognition, Speaker, Alexa, Amazon Echo
Voice Recognition

เราเห็นลำโพงพูดได้ Amazon Echo กันมาได้สักพักใหญ่ๆ แล้ว วันนี้ Amazon เปิดตัวลำโพงรุ่นเล็กลงมาอีกสองรุ่นครับ

ตัวแรกคือ Amazon Tap เป็นลำโพงแบบเดียวกับ Echo แต่ขนาดเล็กลงมาหน่อย มีฟีเจอร์สั่งงานด้วยเสียง Alexa เหมือนกัน จุดต่างคือมันออกแบบมาให้พกพาไปนอกสถานที่ได้ เป็น portable speaker ที่มีแบตเตอรี่ใช้เล่นเพลงได้นาน 9 ชั่วโมง และสามารถซื้อเคส Amazon Tap Sling ช่วยปกป้องเวลาเดินถือออกไปนอกบ้านได้

Amazon Tap ออกแบบมาเพื่อแข่งกับลำโพง Bluetooth ในท้องตลาด ชูจุดเด่นเหนือกว่าเรื่องการเล่นเพลงแบบสตรีมมิ่งได้ในตัว และสั่งงานด้วยเสียงได้ด้วย ราคาขายเครื่องละ 129.99 ดอลลาร์ (Echo รุ่นใหญ่ขาย 179.99 ดอลลาร์)

By mk Founder on Tag: Google, Voice Recognition, Mobile Payment
Google

กูเกิลเคยโชว์ Hands Free ระบบจ่ายเงินที่ยืนยันตัวตนด้วยเสียงพูด ไม่ต้องหยิบมือถือออกมาจากกระเป๋า มาแล้วครั้งหนึ่ง ตอนนี้ระบบ Hands Free เริ่มเปิดบริการแล้วแบบจำกัดพื้นที่ โดยใช้ได้กับร้าน McDonald’s และ Papa John’s ในย่าน South Bay ของรัฐแคลิฟอร์เนีย (ใกล้ๆ กับสำนักงานใหญ่ของกูเกิล)

Subscribe to Voice Recognition