By mk Founder on Tag: Google Assistant, Google Workspace, Voice Recognition, Google
Google Assistant

หลังจากทดสอบมาได้สักระยะ วันนี้กูเกิลเปิดตัว Google Workspace with Google Assistant อย่างเป็นทางการ

วิธีการใช้งานคือใช้ Google Assistant บนอุปกรณ์พกพา (รวมถึงอุปกรณ์กลุ่ม Smart Display) เข้าถึงข้อมูลหรือสั่งงานในบัญชี Google Workspace ของเราด้วยเสียงพูดได้ เช่น สร้างนัดหมายในปฏิทิน, โทรเข้าห้องประชุม Meet, เขียนอีเมลถึงเพื่อนร่วมงาน

ฟีเจอร์นี้ยังรองรับเฉพาะภาษาอังกฤษเท่านั้น และต้องให้แอดมินองค์กรเปิดใช้ให้ก่อนด้วย

By mk Founder on Tag: Google Assistant, Android, Voice Recognition, Google
Google Assistant

Google Assistant รองรับคำสั่งเสียงเพื่อสั่งงานแอพ Android บนสมาร์ทโฟนแล้ว ตัวอย่างเช่น “Hey Google, open Selena Gomez on Snapchat”

กูเกิลบอกว่าเบื้องต้น ฟีเจอร์นี้ใช้ได้กับแอพยอดนิยมประมาณ 30 ตัวของ Google Play ภาคภาษาอังกฤษ ที่ระบุชื่อได้แก่ Etsy, Snapchat, Nike Run, Postmates, Spotify, Twitter, Walmart, Discord, Mint, MyFitnessPal และจะทยอยเพิ่มแอพที่รองรับให้มากขึ้นในระยะถัดไป

By mk Founder on Tag: Windows 10, Microsoft, Voice Recognition, Keyboard
Windows 10

นอกจาก Windows 10 ปรับหน้าจอ Emoji Picker ใหม่ ยังปรับปรุงอินพุตแบบอื่นๆ ได้แก่ Touch Keyboard และ Voice Typing ด้วย

Touch Keyboard หรือคีย์บอร์ดสำหรับอุปกรณ์จอสัมผัส ปรับหน้าตาให้เข้าชุด Fluent Design และเพิ่มฟีเจอร์การค้นหา Emoji/GIF เข้ามาที่ตัวคีย์บอร์ดเลย (ลักษณะเดียวกับ Gboard ของ Android) นอกจากนี้ยังเพิ่มฟีเจอร์เล็กๆ น้อยอย่างการกดปุ่มตัวอักษรบางตัว (เช่น e) ค้างไว้เพื่อดูตัวอักษรย่อยของบางภาษา เป็นต้น

By arjin Writer on Tag: Apple, Acquisition, Siri, Voice Recognition
Apple

มีรายงานว่าแอปเปิลได้เข้าซื้อกิจการ Voysis สตาร์ทอัพที่พัฒนาด้าน AI จากการสั่งงานด้วยเสียง ด้วยมูลค่าที่ไม่เปิดเผย

Voysis ให้บริการแพลตฟอร์มสำหรับการสั่งงานด้วยเสียง เน้นไปที่แอปช้อปปิ้ง โดยมีจุดขายคือการใช้ฐานข้อมูลลูกค้าทำงานร่วมกับ AI เพื่อให้เข้าใจรายละเอียดผลิตภัณฑ์ที่สั่งซื้อ หรือบริการที่ต้องการได้เชิงลึก เป็นการเพิ่มประสบการณ์ให้กับลูกค้า ซึ่งคาดว่าแอปเปิลจะนำเทคโนโลยีของ Voysis มาผนวกกับ Siri

แอปเปิลยืนยันการซื้อกิจการนี้ด้วยคำตอบมาตรฐานว่าบริษัทมีการซื้อกิจการขนาดเล็กอยู่ตลอด

By mk Founder on Tag: Cortana, Microsoft, Microsoft 365, Voice Recognition, Enterprise
Cortana

ไมโครซอฟท์ประกาศทิศทางใหม่ของ Cortana ที่หันไปเน้นลูกค้าองค์กร (ผูกกับ Microsoft 365) แทนตลาดคอนซูเมอร์เดิมที่เข็นไม่ขึ้น

Cortana เวอร์ชันใหม่ใช้ฐานจากแอพเวอร์ชันใหม่ที่เน้นพิมพ์คุยมากกว่าใช้เสียงพูด ฟีเจอร์เน้นไปที่การใช้งานเชิงธุรกิจ เช่น นัดหมาย อีเมล ตารางงานที่ต้องทำ

ฟีเจอร์เดิมของ Cortana ที่ถูกตัดออกไปเป็นด้านคอนซูเมอร์ เช่น เปิดเพลง, เชื่อมต่ออุปกรณ์สมาร์ทโฮม หรือ skill ของนักพัฒนาภายนอก ส่วนฟีเจอร์เดิมที่ยังคงใช้ได้อยู่คือฟีเจอร์สายข้อมูล เช่น หาข้อมูลจาก Bing, เปิดแอพ ตั้งค่าแอพ เป็นต้น

By mk Founder on Tag: LINE, Voice Recognition, Artificial Intelligence
LINE

เราเห็นกูเกิลโชว์ Google Duplex ฟีเจอร์ที่ใช้ AI คุยโทรศัพท์นัดหมายได้แทนมนุษย์ มาตั้งแต่ปี 2018 (รายละเอียดในเชิงเทคนิค) ฝั่งบริษัทฟากเอเชียอย่าง LINE ที่มีฝ่ายพัฒนา AI ชื่อ LINE Brain ก็มีโครงการบ็อตคุยโทรศัพท์ลักษณะเดียวกันชื่อว่า LINE Duet (ชื่อในการค้าคือ LINE AiCall ส่วน LINE Duet คือชื่อโครงการ)

By arjin Writer on Tag: McDonalds, Acquisition, Voice Recognition
McDonalds

แมคโดนัลด์ประกาศบรรลุข้อตกลง เพื่อซื้อกิจการ Apprente สตาร์ทอัพที่พัฒนาเทคโนโลยีด้านเสียงและบทสนทนา โดยไม่ได้เปิดเผยมูลค่าของดีล ซึ่งเป็นอีกครั้งที่แมคโดนัลด์เข้าซื้อกิจการด้านเทคโนโลยี เพื่อนำมาปรับใช้กับธุรกิจฟาสต์ฟู้ด

เทคโนโลยีของ Apprente มีการทดสอบใช้งานในร้านแมคโดนัลด์บางสาขาอยู่แล้ว โดยนำมาใช้กับการสั่งอาหารแบบไดรฟ์ทรู ช่วยให้การทำงานง่ายและเร็วมากขึ้น แมคโดนัลด์ยังคาดหวังจะนำเทคโนโลยีนี้มาใช้กับการสั่งอาหารที่ตู้คีออสและแอปมือถือด้วย

By lew Founder on Tag: Espressif, ESP32, Voice Recognition
Espressif

Espressif เปิดตัวเฟรมเวิร์ค ESP-Skainet สำหรับการพัฒนาอุปกรณ์รับคำสั่งด้วยเสียง เปิดทางให้นักพัฒนาสร้างอุปกรณ์รับคำสั่งโดยไม่ต้องเชื่อมต่ออินเทอร์เน็ต

เฟรมเวิร์คประกอบด้วยโมดูลจดจำเสียงสองส่วน คือ WakeNet สำหรับจับคำสำคัญเพื่อเริ่มต้นทำงาน โดยส่วนนี้ใช้แรมเพียง 20 กิโลไบต์และยังได้ความแม่นยำที่ค่อนข้างสูง ประมาณ 88% ที่ระยะ 1 เมตร โดยตอนนี้รับคำสำคัญเป็นภาษาจีนเท่านั้น

อีกส่วนคือการรรับคำสั่ง ที่ชื่อว่า MultiNet เป็นโมเดล deep learning ที่แยกคำได้สูงสุด 100 คำในภาษาจีน พร้อมความสามารถในการรับคำสั่งจากผู้ใช้เพิ่มเติม

By mk Founder on Tag: Cisco, Acquisition, Webex, Voice Recognition
Cisco

Cisco ประกาศซื้อกิจการ Voicea เจ้าของเทคโนโลยีแปลงเสียงพูดเป็นข้อความแบบเรียลไทม์ เพื่อนำมาใช้กับโซลูชันการประชุม WebEx ให้สามารถสรุปข้อความจากเสียงสนทนาระหว่างการประชุม ไฮไลท์ประเด็นสำคัญ และค้นหาในภายหลังได้

เป้าหมายของ Cisco คือแปลงการประชุมในระบบ WebEx ให้เป็นบันทึกการประชุมดิจิทัล เพื่อให้ผู้เข้าร่วมประชุมสามารถต่อยอดงานต่างๆ จากการประชุมได้ทันที

Cisco ไม่ได้เปิดเผยมูลค่าการซื้อกิจการครั้งนี้ แต่หลังจากเสร็จสิ้นกระบวนการซื้อกิจการแล้ว พนักงานของ Voicea จะเข้ามาทำงานในทีม WebEx

By mk Founder on Tag: Cortana, Microsoft, Voice Recognition, Windows 10
Cortana

หลังจาก ไมโครซอฟท์จับแยก Cortana ออกจาก Search บน Windows 10 ล่าสุดก็ออก Windows 10 Insider Preview Build 18945 (20H1) ที่มี Cortana เวอร์ชันยกเครื่องใหม่ เน้นการแชทมากกว่าการสนทนาด้วยเสียง

หน้าตา UI ของ Cortana ตัวใหม่จะคล้ายๆ Google Assistant บนสมาร์ทโฟน ที่เน้นการแชทคุยด้วยข้อความเป็นหลัก แต่ก็ยังรองรับการสนทนาด้วยเสียงเช่นเดิม

By mk Founder on Tag: Tmall, Alibaba, Voice Recognition, Audi, Renault, Honda, Automobile
Tmall

Alibaba ประกาศความร่วมมือกับบริษัทผู้ผลิตรถยนต์ 3 รายคือ Audi, Renault, Honda เพื่อนำระบบสั่งงานด้วยเสียงของ Alibaba ไปใช้กับรถยนต์ยี่ห้อเหล่านี้ที่วางขายในประเทศจีน

Alibaba มีแพลตฟอร์มสั่งงานด้วยเสียงชื่อ Tmall Genie ใช้กับลำโพงอัจฉริยะเพื่อทำตลาดในประเทศจีนมาตั้งแต่ปี 2017 (ลักษณะเดียวกับ Amazon Alexa หรือ Google Assistant) ส่วนคู่แข่งของ Tmall Genie ในประเทศจีนคือ Baidu DuerOS

By mk Founder on Tag: PS4, PlayStation, Games, Sony, Voice Recognition, Text-to-Speech
PS4

Sony ประกาศปรับปรุงฟีเจอร์ Party ของ PS4 โดยขยายจำนวนสมาชิกสูงสุดในปาร์ตี้จาก 8 คนเป็น 16 คน, ปรับปรุงเรื่องคุณภาพเสียงของ voice chat และปรับปรุงการเชื่อมต่อกับเครือข่าย

นอกจากนี้ Sony ยังทดสอบฟีเจอร์ chat transcription หรือแปลงเสียงพูดเป็นข้อความ รวมถึงอ่านข้อความออกมาเป็นเสียงพูดให้เพื่อนร่วมปาร์ตี้คนอื่นๆ ฟังโดยอัตโนมัติ (ยังรองรับเฉพาะภาษาอังกฤษ) ซึ่งใช้ได้กับทั้ง Party ของ PS4 และแอพ PS4 Second Screen บนสมาร์ทโฟน

Sony เปิดทดสอบฟีเจอร์ Party เวอร์ชันใหม่ให้กับผู้สมัครเข้าโครงการ PS4 System Software Beta แล้ว โดยยังไม่ระบุว่าจะออกเวอร์ชันจริงเมื่อไร

By checkmate95 Contributor on Tag: Google Assistant, Voice Recognition, Thailand
Google Assistant

เมื่อไม่นานมานี้ กูเกิลได้เพิ่มฟีเจอร์สั่งงาน Assistant ได้สองภาษา โดยเบื้องต้นรองรับแค่ อังกฤษ, เยอรมัน, สเปน, อิตาลี และญี่ปุ่น

ตอนนี้ภาษาไทยได้เข้าสู่สถานะ beta และเพิ่มเป็นภาษาที่สองได้แล้ว ผลที่ได้คือผู้ใช้สามารถสั่ง ok, hey google ได้จากทุกแอพ หรือตั้ง UI เป็นภาษาอังกฤษแต่คุยกับ Assistant เป็นภาษาไทยได้

อ้างอิง - ค้นพบด้วยตนเอง

By sunnywalker Writer on Tag: Google, Voice Recognition, Accessibility
Google

Google ทำ Voice Access แอพพลิเคชั่นสำหรับแอนดรอยด์ที่ให้ผู้พอการใช้งานมือถือสั่งการด้วยเสียงได้แบบไม่ต้องจับมือถือเลย โดย Voice Access เป็นโปรเจกต์ทดลองใช้มา 2-3 ปี ล่าสุดพร้อมใช้งานทั่วไปแล้วแต่ยังจำกัดเฉพาะโทรศัพท์แอนดรอยด์เท่านั้น

Mercedes-Benz

Mercedes-Benz ประกาศนำแพลตฟอร์ม Houndify จากบริษัท SoundHound ไปใช้กับรถยนต์รุ่นใหม่ เป็นผู้ช่วยส่วนตัวประจำรถยนต์ รองรับสั่งงานด้วยเสียง สามารถเข้าใจคำพูดที่เป็นธรรมชาติได้

แพลตฟอร์ม Houndify เป็นส่วนหนึ่งของระบบอินโฟเทนเมนต์แบบใหม่ที่เรียกว่า MBUX เปิดตัวครั้งแรกในงาน CES 2018 สามารถพูดว่า Hey Mercedes เพื่อเรียกใช้บริการต่างๆ เช่น ผลการแข่งขันกีฬา, ราคาหุ้น, ตำแหน่งปั๊มน้ำมัน, ร้านอาหารในบริเวณใกล้เคียง, ค้นหาเพลง, รายงานสภาพอากาศ หรือระบบภายในรถยนต์ เป็นต้น

By mk Founder on Tag: Google Assistant, Google Home, Google, Voice Recognition
Google Assistant

กูเกิลอัพเดต Google Assistant ให้สนทนาต่อเนื่องอย่างเป็นธรรมชาติ โดยไม่ต้องพูดคำว่า Hey Google หรือ Ok Google ทุกประโยคอีกแล้ว

ฟีเจอร์นี้เรียกว่า Continued Conversation ซึ่งกูเกิลโชว์ในงาน Google I/O 2018 มาก่อนแล้ว ผู้ใช้จำเป็นต้องตั้งค่าเปิดใช้ Continued Conversation ในแอพก่อนจึงจะใช้งานได้ ตอนนี้ยังใช้ได้เฉพาะบนลำโพง Google Home, Google Home Mini, Google Home Max เท่านั้น

การเรียกใช้ครั้งแรกเราต้องพูด Ok Google หรือ Hey Google ก่อน แต่ในประโยคถัดๆ ไป Google Assistant จะรอฟังคำพูดของเรานานขึ้นอีกหน่อย ทำให้เราไม่ต้องเรียกใหม่ทุกครั้งไป

ที่มา - Google

By nutmos Writer on Tag: SoundHound, Voice Recognition
SoundHound

SoundHoud ผู้ให้บริการค้นหาเพลงด้วยเสียงที่ตอนหลังเริ่มมาทำซอฟต์แวร์สั่งงานด้วยเสียงบนแพลตฟอร์มของตัวเองในชื่อ Houndify ได้ปิดการระดมทุนรอบล่าสุดเป็นที่เรียบร้อยแล้ว โดยการระดมทุนครั้งนี้มีมูลค่า 100 ล้านดอลลาร์ มีผู้ลงทุนรายใหญ่หลายราย เช่น Tencent, Hyundai, Orange และ Daimler

Google

งานพัฒนาปัญญาประดิษฐ์ใหม่ของ Google เกี่ยวกับการวิเคราะห์เสียงก้าวล้ำไปอีกระดับ เมื่อมันสามารถแยกแยะเสียงพูดของคนได้ แม้ว่าคนผู้นั้นจะกำลังพูดพร้อมกับคนอื่นจนแม้แต่คนธรรมดายังฟังเนื้อหาจับใจความได้ยาก และแน่นอนว่าในบรรดา 2 คน เจ้าของ 2 เสียงที่พูดแข่งกันอยู่นั้น ปัญญาประดิษฐ์ของ Google สามารถแยกแยะเสียงพูดออกมาได้แบบรายคนอย่างชัดเจน

อันที่จริงงานวิจัยนี้ จำกัดว่าปัญญาประดิษฐ์จะต้องไม่เพียง "ได้ยินเสียง" แต่มันจะต้อง "มองเห็น" คนที่กำลังพูดด้วย เพราะมันใช้การวิเคราะห์ภาพควบคู่ไปกับการวิเคราะห์เสียง

Logitech

Logitech เปิดตัวระบบซอฟต์แวร์ใหม่สุดล้ำ BS Detection อาศัยปัญญาประดิษฐ์วิเคราะห์ภาพใบหน้าและน้ำเสียงในการพูดเพื่อประเมินความจริงใจในระหว่างการสนทนา

BS Detection ถูกใส่มาในชุดอุปกรณ์สำหรับการประชุมวิดีโอคอนเฟอเรนซ์ ซึ่งประกอบไปด้วยกล้องเว็บแคม Logitech Brio ที่บันทึกวิดีโอได้ด้วยความละเอียด 4K และอุปกรณ์เพื่อการสนทนาออนไลน์แบบตั้งโต๊ะ Logitech MeetUp ที่มีทั้งกล้องบันทึกภาพความละเอียดระดับ 4K เช่นกัน ควบคุมการปรับมุมกล้องด้วยมอเตอร์ไฟฟ้า พร้อมไมโครโฟนฝังในลำโพงอีก 3 ชุด ติดตั้งมาเป็นอุปกรณ์ชิ้นเดียว

Artificial Intelligence

ความเชื่ออย่างหนึ่งเกี่ยวกับหุ่นยนต์และปัญญาประดิษฐ์ที่มีมานานคือ แม้ว่ามันจะทรงประสิทธิภาพแค่ไหน ทำงานรวดเร็ว แม่นยำ และฉลาดเพียงใด แต่พวกมันก็คงไม่อาจเข้าใจความรู้สึกและอารมณ์ของมนุษย์ได้อย่างที่พวกเราเองเข้าใจอารมณ์ของมนุษย์ด้วยกัน ทว่าบางทีข่าวนี้อาจเป็นอีกหนึ่งตัวอย่างที่เราควรนำมาใช้ทบทวนความเชื่อนี้ใหม่

Subscribe to Voice Recognition