Tags:
Node Thumbnail

แมคโดนัลด์ประกาศบรรลุข้อตกลง เพื่อซื้อกิจการ Apprente สตาร์ทอัพที่พัฒนาเทคโนโลยีด้านเสียงและบทสนทนา โดยไม่ได้เปิดเผยมูลค่าของดีล ซึ่งเป็นอีกครั้งที่แมคโดนัลด์เข้าซื้อกิจการด้านเทคโนโลยี เพื่อนำมาปรับใช้กับธุรกิจฟาสต์ฟู้ด

เทคโนโลยีของ Apprente มีการทดสอบใช้งานในร้านแมคโดนัลด์บางสาขาอยู่แล้ว โดยนำมาใช้กับการสั่งอาหารแบบไดรฟ์ทรู ช่วยให้การทำงานง่ายและเร็วมากขึ้น แมคโดนัลด์ยังคาดหวังจะนำเทคโนโลยีนี้มาใช้กับการสั่งอาหารที่ตู้คีออสและแอปมือถือด้วย

ก่อนหน้านี้แมคโดนัลด์ก็ซื้อกิจการ Dynamic Yield เพื่อนำเทคโนโลยีมาใช้ปรับแต่งหน้าแสดงผลเมนูสำหรับลูกค้าไดรฟ์ทรู ให้แสดงรายการอาหารตามช่วงเวลา สภาพอากาศ ทำให้ยอดขายเพิ่มสูงขึ้น

Tags:
Node Thumbnail

Espressif เปิดตัวเฟรมเวิร์ค ESP-Skainet สำหรับการพัฒนาอุปกรณ์รับคำสั่งด้วยเสียง เปิดทางให้นักพัฒนาสร้างอุปกรณ์รับคำสั่งโดยไม่ต้องเชื่อมต่ออินเทอร์เน็ต

เฟรมเวิร์คประกอบด้วยโมดูลจดจำเสียงสองส่วน คือ WakeNet สำหรับจับคำสำคัญเพื่อเริ่มต้นทำงาน โดยส่วนนี้ใช้แรมเพียง 20 กิโลไบต์และยังได้ความแม่นยำที่ค่อนข้างสูง ประมาณ 88% ที่ระยะ 1 เมตร โดยตอนนี้รับคำสำคัญเป็นภาษาจีนเท่านั้น

อีกส่วนคือการรรับคำสั่ง ที่ชื่อว่า MultiNet เป็นโมเดล deep learning ที่แยกคำได้สูงสุด 100 คำในภาษาจีน พร้อมความสามารถในการรับคำสั่งจากผู้ใช้เพิ่มเติม

Tags:
Node Thumbnail

Cisco ประกาศซื้อกิจการ Voicea เจ้าของเทคโนโลยีแปลงเสียงพูดเป็นข้อความแบบเรียลไทม์ เพื่อนำมาใช้กับโซลูชันการประชุม WebEx ให้สามารถสรุปข้อความจากเสียงสนทนาระหว่างการประชุม ไฮไลท์ประเด็นสำคัญ และค้นหาในภายหลังได้

เป้าหมายของ Cisco คือแปลงการประชุมในระบบ WebEx ให้เป็นบันทึกการประชุมดิจิทัล เพื่อให้ผู้เข้าร่วมประชุมสามารถต่อยอดงานต่างๆ จากการประชุมได้ทันที

Cisco ไม่ได้เปิดเผยมูลค่าการซื้อกิจการครั้งนี้ แต่หลังจากเสร็จสิ้นกระบวนการซื้อกิจการแล้ว พนักงานของ Voicea จะเข้ามาทำงานในทีม WebEx

ที่มา - Cisco

Tags:
Node Thumbnail

หลังจาก ไมโครซอฟท์จับแยก Cortana ออกจาก Search บน Windows 10 ล่าสุดก็ออก Windows 10 Insider Preview Build 18945 (20H1) ที่มี Cortana เวอร์ชันยกเครื่องใหม่ เน้นการแชทมากกว่าการสนทนาด้วยเสียง

หน้าตา UI ของ Cortana ตัวใหม่จะคล้ายๆ Google Assistant บนสมาร์ทโฟน ที่เน้นการแชทคุยด้วยข้อความเป็นหลัก แต่ก็ยังรองรับการสนทนาด้วยเสียงเช่นเดิม

ไมโครซอฟท์ยอมรับว่า Cortana เวอร์ชันใหม่ยังมีฟีเจอร์บางอย่างน้อยกว่า Cortana ตัวเดิม (แต่ฟีเจอร์หลักๆ อย่างการสั่งงานด้วยเสียงเพื่อเปิดแอพ ถามคำถาม ตั้งเวลา ยังอยู่กันครบ) และจะค่อยๆ เพิ่มฟีเจอร์อื่นเข้ามาในอนาคต โดยจะเป็นการอัพเดตผ่าน Microsoft Store ไม่ต้องรอรอบการอัพเดตของ Windows อีกต่อไป

Tags:
Node Thumbnail

Alibaba ประกาศความร่วมมือกับบริษัทผู้ผลิตรถยนต์ 3 รายคือ Audi, Renault, Honda เพื่อนำระบบสั่งงานด้วยเสียงของ Alibaba ไปใช้กับรถยนต์ยี่ห้อเหล่านี้ที่วางขายในประเทศจีน

Alibaba มีแพลตฟอร์มสั่งงานด้วยเสียงชื่อ Tmall Genie ใช้กับลำโพงอัจฉริยะเพื่อทำตลาดในประเทศจีนมาตั้งแต่ปี 2017 (ลักษณะเดียวกับ Amazon Alexa หรือ Google Assistant) ส่วนคู่แข่งของ Tmall Genie ในประเทศจีนคือ Baidu DuerOS

Tags:
Node Thumbnail

Sony ประกาศปรับปรุงฟีเจอร์ Party ของ PS4 โดยขยายจำนวนสมาชิกสูงสุดในปาร์ตี้จาก 8 คนเป็น 16 คน, ปรับปรุงเรื่องคุณภาพเสียงของ voice chat และปรับปรุงการเชื่อมต่อกับเครือข่าย

นอกจากนี้ Sony ยังทดสอบฟีเจอร์ chat transcription หรือแปลงเสียงพูดเป็นข้อความ รวมถึงอ่านข้อความออกมาเป็นเสียงพูดให้เพื่อนร่วมปาร์ตี้คนอื่นๆ ฟังโดยอัตโนมัติ (ยังรองรับเฉพาะภาษาอังกฤษ) ซึ่งใช้ได้กับทั้ง Party ของ PS4 และแอพ PS4 Second Screen บนสมาร์ทโฟน

Sony เปิดทดสอบฟีเจอร์ Party เวอร์ชันใหม่ให้กับผู้สมัครเข้าโครงการ PS4 System Software Beta แล้ว โดยยังไม่ระบุว่าจะออกเวอร์ชันจริงเมื่อไร

Tags:
Node Thumbnail

เมื่อไม่นานมานี้ กูเกิลได้เพิ่มฟีเจอร์สั่งงาน Assistant ได้สองภาษา โดยเบื้องต้นรองรับแค่ อังกฤษ, เยอรมัน, สเปน, อิตาลี และญี่ปุ่น

ตอนนี้ภาษาไทยได้เข้าสู่สถานะ beta และเพิ่มเป็นภาษาที่สองได้แล้ว ผลที่ได้คือผู้ใช้สามารถสั่ง ok, hey google ได้จากทุกแอพ หรือตั้ง UI เป็นภาษาอังกฤษแต่คุยกับ Assistant เป็นภาษาไทยได้

อ้างอิง - ค้นพบด้วยตนเอง

Tags:
Node Thumbnail

Google ทำ Voice Access แอพพลิเคชั่นสำหรับแอนดรอยด์ที่ให้ผู้พอการใช้งานมือถือสั่งการด้วยเสียงได้แบบไม่ต้องจับมือถือเลย โดย Voice Access เป็นโปรเจกต์ทดลองใช้มา 2-3 ปี ล่าสุดพร้อมใช้งานทั่วไปแล้วแต่ยังจำกัดเฉพาะโทรศัพท์แอนดรอยด์เท่านั้น

Tags:
Node Thumbnail

Mercedes-Benz ประกาศนำแพลตฟอร์ม Houndify จากบริษัท SoundHound ไปใช้กับรถยนต์รุ่นใหม่ เป็นผู้ช่วยส่วนตัวประจำรถยนต์ รองรับสั่งงานด้วยเสียง สามารถเข้าใจคำพูดที่เป็นธรรมชาติได้

แพลตฟอร์ม Houndify เป็นส่วนหนึ่งของระบบอินโฟเทนเมนต์แบบใหม่ที่เรียกว่า MBUX เปิดตัวครั้งแรกในงาน CES 2018 สามารถพูดว่า Hey Mercedes เพื่อเรียกใช้บริการต่างๆ เช่น ผลการแข่งขันกีฬา, ราคาหุ้น, ตำแหน่งปั๊มน้ำมัน, ร้านอาหารในบริเวณใกล้เคียง, ค้นหาเพลง, รายงานสภาพอากาศ หรือระบบภายในรถยนต์ เป็นต้น

ระบบ MBUX แบบใหม่ จะมากับรถยนต์ A-Class ที่จะวางขายในอเมริกาเหนือปี 2019

Tags:
Node Thumbnail

กูเกิลอัพเดต Google Assistant ให้สนทนาต่อเนื่องอย่างเป็นธรรมชาติ โดยไม่ต้องพูดคำว่า Hey Google หรือ Ok Google ทุกประโยคอีกแล้ว

ฟีเจอร์นี้เรียกว่า Continued Conversation ซึ่งกูเกิลโชว์ในงาน Google I/O 2018 มาก่อนแล้ว ผู้ใช้จำเป็นต้องตั้งค่าเปิดใช้ Continued Conversation ในแอพก่อนจึงจะใช้งานได้ ตอนนี้ยังใช้ได้เฉพาะบนลำโพง Google Home, Google Home Mini, Google Home Max เท่านั้น

การเรียกใช้ครั้งแรกเราต้องพูด Ok Google หรือ Hey Google ก่อน แต่ในประโยคถัดๆ ไป Google Assistant จะรอฟังคำพูดของเรานานขึ้นอีกหน่อย ทำให้เราไม่ต้องเรียกใหม่ทุกครั้งไป

ที่มา - Google

Tags:
Node Thumbnail

SoundHoud ผู้ให้บริการค้นหาเพลงด้วยเสียงที่ตอนหลังเริ่มมาทำซอฟต์แวร์สั่งงานด้วยเสียงบนแพลตฟอร์มของตัวเองในชื่อ Houndify ได้ปิดการระดมทุนรอบล่าสุดเป็นที่เรียบร้อยแล้ว โดยการระดมทุนครั้งนี้มีมูลค่า 100 ล้านดอลลาร์ มีผู้ลงทุนรายใหญ่หลายราย เช่น Tencent, Hyundai, Orange และ Daimler

Tags:
Node Thumbnail

งานพัฒนาปัญญาประดิษฐ์ใหม่ของ Google เกี่ยวกับการวิเคราะห์เสียงก้าวล้ำไปอีกระดับ เมื่อมันสามารถแยกแยะเสียงพูดของคนได้ แม้ว่าคนผู้นั้นจะกำลังพูดพร้อมกับคนอื่นจนแม้แต่คนธรรมดายังฟังเนื้อหาจับใจความได้ยาก และแน่นอนว่าในบรรดา 2 คน เจ้าของ 2 เสียงที่พูดแข่งกันอยู่นั้น ปัญญาประดิษฐ์ของ Google สามารถแยกแยะเสียงพูดออกมาได้แบบรายคนอย่างชัดเจน

อันที่จริงงานวิจัยนี้ จำกัดว่าปัญญาประดิษฐ์จะต้องไม่เพียง "ได้ยินเสียง" แต่มันจะต้อง "มองเห็น" คนที่กำลังพูดด้วย เพราะมันใช้การวิเคราะห์ภาพควบคู่ไปกับการวิเคราะห์เสียง

Tags:
Node Thumbnail

Logitech เปิดตัวระบบซอฟต์แวร์ใหม่สุดล้ำ BS Detection อาศัยปัญญาประดิษฐ์วิเคราะห์ภาพใบหน้าและน้ำเสียงในการพูดเพื่อประเมินความจริงใจในระหว่างการสนทนา

BS Detection ถูกใส่มาในชุดอุปกรณ์สำหรับการประชุมวิดีโอคอนเฟอเรนซ์ ซึ่งประกอบไปด้วยกล้องเว็บแคม Logitech Brio ที่บันทึกวิดีโอได้ด้วยความละเอียด 4K และอุปกรณ์เพื่อการสนทนาออนไลน์แบบตั้งโต๊ะ Logitech MeetUp ที่มีทั้งกล้องบันทึกภาพความละเอียดระดับ 4K เช่นกัน ควบคุมการปรับมุมกล้องด้วยมอเตอร์ไฟฟ้า พร้อมไมโครโฟนฝังในลำโพงอีก 3 ชุด ติดตั้งมาเป็นอุปกรณ์ชิ้นเดียว

Tags:
Node Thumbnail

ความเชื่ออย่างหนึ่งเกี่ยวกับหุ่นยนต์และปัญญาประดิษฐ์ที่มีมานานคือ แม้ว่ามันจะทรงประสิทธิภาพแค่ไหน ทำงานรวดเร็ว แม่นยำ และฉลาดเพียงใด แต่พวกมันก็คงไม่อาจเข้าใจความรู้สึกและอารมณ์ของมนุษย์ได้อย่างที่พวกเราเองเข้าใจอารมณ์ของมนุษย์ด้วยกัน ทว่าบางทีข่าวนี้อาจเป็นอีกหนึ่งตัวอย่างที่เราควรนำมาใช้ทบทวนความเชื่อนี้ใหม่

Tags:
Node Thumbnail

กูเกิลจัดงาน 2018 Digital News Initiative Summit ในยุโรป และเผยแผนการขยาย Google Assistant เพิ่มเติมในปีนี้เป็น 25 ภาษา จากปัจจุบันที่มีเพียง 8 ภาษา

กูเกิลไม่ได้ประกาศเรื่องนี้บนหน้าเว็บ และยังไม่มีข้อมูลละเอียดในเรื่องนี้ แต่จากภาพถ่ายที่ผู้ร่วมงานโพสต์ขึ้นทวิตเตอร์ ก็มีประเทศไทยอยู่ในแผนที่ด้วย และมีโอกาสสูงที่เราจะได้เห็น Google Assistant รองรับภาษาไทยเต็มรูปแบบในปีนี้

ปัจจุบัน Google Assistant สามารถค้นหาเว็บด้วยเสียงภาษาไทยได้ แต่ยังขาดฟีเจอร์โต้ตอบหรือสนทนาเป็นภาษาไทย

ที่มา - 9to5google

Tags:
Node Thumbnail

Qualcomm ประกาศความร่วมมือกับ Baidu ผนึกกำลังพัฒนาด้าน AI ร่วมกัน

Baidu ถือเป็นยักษ์ใหญ่ของวงการ AI จีน มีระบบปฏิบัติการ DuerOS รองรับการสั่งงานด้วยเสียง (แน่นอนว่าเน้นภาษาจีน) และที่ผ่านมาก็มีบริษัทยักษ์ใหญ่หลายแห่งจับมือกับ Baidu เพื่อใช้งาน DuerOS ที่ว่านี้ เช่น NVIDIA และ Xiaomi

Tags:
Node Thumbnail

อินเทลจับมือกับ Amazon ออกชุดฮาร์ดแวร์สำหรับการสั่งงานด้วยเสียง เพื่อให้อุปกรณ์อิเล็กทรอนิกส์หรือเครื่องใช้ไฟฟ้า เชื่อมต่อกับ Alexa ได้ง่ายขึ้น

ชุดฮาร์ดแวร์ของอินเทลชื่อว่า Intel Speech Enabling Developer Kit ประกอบด้วยชุดไมโครโฟน 8 ตัว, หน่วยประมวลผลสัญญาณ DSP, และซอฟต์แวร์ประมวลผลเสียง เพื่อแก้ปัญหาเสียงสะท้อน เสียงรบกวน และดักจับคีย์เวิร์ดของผู้ใช้งานเพื่อเรียกใช้ Alexa

ชุดคิตอันนี้เปิดให้สั่งซื้อล่วงหน้าแล้ว ในราคาลด 399 ดอลลาร์ช่วงเปิดตัว (ราคาเต็ม 499 ดอลลาร์) การเปิดตัวชุดคิตนี้ทำให้เรามีโอกาสเห็นอุปกรณ์อีกมากที่จะเชื่อมต่อกับ Alexa ในอนาคตอันใกล้นี้

Tags:
Node Thumbnail

จากที่เคยประกาศไว้เมื่อต้นปี กูเกิลเริ่มอัพเกรดอุปกรณ์ Android TV ให้รองรับฟีเจอร์สั่งงานด้วยเสียง Google Assistant แล้ว

อุปกรณ์ตัวแรกที่ได้อัพเกรดคือ NVIDIA Shield TV จากนั้นจะเป็นคิวของอุปกรณ์อื่นๆ อย่าง Sony Bravia 4K ที่เคยประกาศไว้แล้วเช่นกัน

ตัวอย่างการสั่งงานด้วยเสียงบน Android TV ก็อย่างเช่น “Play Game of Thrones” “Order more popcorn” “play 4K videos on YouTube” รวมถึง “Turn off”

ที่มา - Google

Tags:
Node Thumbnail

นอกจากลำโพง Harman Kardon รุ่นที่ใช้ Cortana และ Alexa บริษัท Harman International ยังมีลำโพงอัจฉริยะที่ใช้ Google Assistant เปิดตัวไล่เลี่ยกัน โดยเป็นสินค้าของแบรนด์ลูก JBL

ลำโพงซีรีส์นี้ชื่อว่า JBL LINK แบ่งออกเป็น 3 รุ่นย่อยตามระดับราคา ฟีเจอร์ และกำลังขับของเสียง คือ LINK 10 (169 ยูโร), LINK 20 (199 ยูโร), LINK 300 (299 ยูโร) ทุกรุ่นผนวกเอา Google Assistant มาให้ในตัว

ลำโพงรุ่น LINK 10/20 ออกแบบให้เป็นลำโพงพกพา มีแบตเตอรี่ในตัว กันน้ำมาตรฐาน IPX7 ส่วนรุ่น LINK 300 เน้นกำลังเสียง 50 วัตต์สำหรับใช้งานในห้องนั่งเล่น สินค้าจะเริ่มขายในฤดูใบไม้ร่วงปีนี้

Tags:
Node Thumbnail

Harman International เคยเปิดตัวลำโพงอัจฉริยะ Harman Kardon Invoke ที่เชื่อมต่อกับ Cortana ของไมโครซอฟท์

ล่าสุด Harman เปิดตัวลำโพงอีกรุ่นชื่อ Harman Kardon Allure ที่เชื่อมต่อกับระบบ Alexa ของ Amazon แทน

ลำโพง Allure มีขนาดใหญ่กว่า Invoke โดยเน้นดีไซน์ที่สามารถส่องแสง ambient lighting รอบทิศทาง 360 องศา ช่วยเน้นคุณประโยชน์ในแง่การตกแต่งห้องได้ด้วย ตัวลำโพงตั้งราคา 249.95 ดอลลาร์ วางขายช่วงปลายปีนี้

ปัจจุบัน Harman เป็นบริษัทลูกของซัมซุง ที่มีระบบผู้ช่วยส่วนตัว Bixby ของตัวเอง และกำลังทำลำโพงอัจฉริยะอยู่เช่นกัน

Tags:
Node Thumbnail

Bixby เป็นระบบผู้ช่วยส่วนตัวของซัมซุง ที่เริ่มใช้ใน Galaxy S8 แต่ฟีเจอร์ส่วนของ Bixby Voice ที่สั่งงานด้วยเสียงกลับล่าช้ากว่ากำหนด และเพิ่งเปิดให้ผู้ใช้ Galaxy S8 ทั่วโลกใช้งานเมื่อไม่กี่วันที่ผ่านมา (ก่อน Note 8 เปิดตัวแค่ไม่กี่วัน)

ต้องบอกว่าซัมซุง "คิดการใหญ่" กับ Bixby ถึงขนาดใส่ปุ่มเรียกมันเข้ามาโดยเฉพาะ และเราคงเดากันได้ว่าจะได้เห็นสารพัดผลิตภัณฑ์ตระกูล Bixby ตามมาอีกมากในอนาคต

Tags:
Node Thumbnail

Google เผยอัพเดทการพิมพ์ด้วยเสียงรองรับภาษาท้องถิ่นต่างๆ ทั่วโลกเป็น 30 ภาษาท้องถิ่น จนตอนนี้สามารถรองรับพิมพ์ด้วยเสียง 119 ภาษาแล้ว นอกจากนี้ยังอัพเดทให้พูดภาษาอังกฤษและพิมพ์ออกมาเป็นอีโมจิได้ด้วย

Tags:
Node Thumbnail

Mozilla เปิดตัว Common Voice โครงการเก็บตัวอย่างเสียงแบบ crowdsource โดยเป้าหมายคือการเก็บเสียงให้ได้ครบ 1 หมื่นชั่วโมงในลักษณะเสียงหลายรูปแบบ และเปิดให้บุคคลทั่วไปใช้งานได้

สำหรับการสร้างฐานข้อมูลเสียงเพื่อทำการรู้จำเสียง สามารถนำไปใช้ประโยชน์ได้ไม่ว่าจะเป็นแอพอย่างผู้ช่วยส่วนตัว หรือ speech-to-text ซึ่งทาง Mozilla หวังว่าจะมอบข้อมูลสาธารณะนี้ให้กับนักพัฒนาอิสระที่สามารถนำข้อมูลเหล่านี้ไปใช้ในการสร้างแอพได้ และในอนาคตมีแผนจะพัฒนาฐานข้อมูลให้ครอบคลุมสำเนียงและภาษาที่หลากหลายมากยิ่งขึ้น

Tags:
Node Thumbnail

Facebook ทำปัญญาประดิษฐ์ช่วยการใช้งานใน Facebook Messenger มีชื่อเรียกว่า M ทำตามคำสั่งของผู้ใช้เช่นเรียกรถ โอนเงินให้เพื่อน เป็นต้น อย่างไรก็ตามผู้ใช้สามารถสั่งงาน M ได้ด้วยการพิมพ์เท่านั้น ไม่สามารถใช้คำสั่งเสียงเหมือน Alexa ของ Amazon และ Siri ของ Apple ได้

ทำไมถึงเป็นเช่นนั้น Stan Chudnovsky หัวหน้างานในส่วน Messenger มีคำตอบ

Node Thumbnail

จากที่เคยมีข่าวปลายปีที่แล้วว่า Harman Kardon จับมือกับไมโครซอฟท์ทำลำโพงอัจฉริยะ โดยมี Cortana ทำงานอยู่เบื้องหลัง วันนี้ Invoke คู่แข่ง Amazon Echo และ Google Home ได้ถูกเผยโฉมออกมาบนหน้าเว็บไซต์แล้ว

ถึงแม้ Harman Kardon จะเอาหน้าเว็บที่มีรายละเอียด Invoke ลง แต่จากข้อมูลที่ขึ้นก่อนหน้านี้ ตัว Invoke มีลักษณะทรงกระบอกสูงแบบเดียวกับ Amazon Echo และรองรับคำสั่งเสียงในการสั่งงานไม่แตกต่างจากทั้ง Echo และ Google Home มีสองสีคือสีเงินและสีดำ โดย Harman Kardon ระบุว่าจะวางขายภายในปลายปีนี้ (coming fall 2017) และไม่มีการระบุราคาครับ

Pages