Voice Recognition

MKBHD รีวิวผู้ช่วยสั่งงานด้วยเสียง แชมป์คือ Google Assistant ส่วน Alexa แย่ที่สุด

By: mk

on 27 December 2022 - 20:12 Tags:

Topics:

Marques Brownlee หรือ MKBHD ยูทูบเบอร์คนดัง รีวิวแอพผู้ช่วยส่วนตัวผ่านการสั่งงานด้วยเสียง (voice assistant) บนสมาร์ทโฟน 4 ตัวคือ Google Assistant, Siri, Bixby, Alexa เปรียบเทียบกันอีกครั้งในเวอร์ชันปลายปี 2022 ผลคือ Google Assistant ยังเป็นอันดับหนึ่งเช่นเดิม

แอพทั้ง 4 ตัวทำงานพื้นฐาน เช่น ตั้งเวลา รายงานสภาพอากาศ ตอบคำถามข้อมูลทั่วไปได้ค่อนข้างดี (ยกเว้น Siri ตั้งเวลาได้ทีละอัน) ความเด่นในด้านอื่นคือ Google Assistant และ Bixby ควบคุมการทำงานของมือถือด้วยเสียงได้ดีที่สุด สามารถสั่งถ่ายภาพได้ และเปิดซีรีส์ตอนที่ระบุจากแอพ Netflix แล้วเล่นได้ทันที (Siri ทำได้แค่เปิดแอพ Netflix เท่านั้น)

Home Assistant จะสร้างระบบสั่งงานด้วยเสียงของตัวเอง ประมวลผลแบบโลคัล

By: mk

on 25 December 2022 - 21:52 Tags:

Topics:

Home Assistant โครงการโอเพนซอร์สระบบสั่งงานบ้านอัตโนมัติชื่อดัง ประกาศเริ่มทำฟีเจอร์สั่งงานด้วยเสียงของตัวเองในปี 2023

โครงการ Home Assistant บอกว่าที่ผ่านมาระบบสั่งงานด้วยเสียงมักต้องพึ่งพาเทคโนโลยีของบริษัทใหญ่ๆ เช่น Google Assistant หรือ Amazon Alexa ซึ่งข้อมูลต้องวิ่งผ่านคลาวด์ของบริษัทเหล่านี้ ในขณะที่ผู้ใช้เองมักใช้แค่สั่งงานเปิดไฟในบ้านเท่านั้น งานเหล่านี้สามารถประมวลผลได้ในบ้าน โดยไม่ต้องเสียความเป็นส่วนตัวไป

เขียนโปรแกรมแบบไม่ต้องแตะคีย์บอร์ด "Hey, GitHub" สั่งให้ GitHub เขียนโค้ดด้วยเสียงพูด

By: mk

on 11 November 2022 - 20:04 Tags:

Topics:

GitHub

Artificial Intelligence

Programming

Voice Recognition

GitHub เปิดตัวโปรเจคทดลอง “Hey, GitHub!” เป็นการสั่งงานด้วยเสียงคู่กับฟีเจอร์ Copilot ที่ใช้ AI ช่วยเขียนโปรแกรม ทำให้เราแทบไม่ต้องใช้คีย์บอร์ดในการเขียนโปรแกรมอีกเลย

ตัวอย่างการใช้งานเช่น พูดว่า "import Pandas" ก็จะเป็นการเขียนโค้ดที่นำเข้าไลบรารีวิเคราะห์ข้อมูล Pandas ของ Python ให้อัตโนมัติ (ดูตัวอย่างได้จากเว็บ GitHub Next)

คำสั่งเสียง Hey, GitHub รองรับทั้งการเขียนตัวโค้ด, การเลื่อนตำแหน่ง, การสั่งงานตัว IDE (VS Code) และการสั่งให้ GitHub Copilot อธิบายการทำงานของโค้ดที่เขียนมาให้เรา

ซัมซุงโชว์ฟีเจอร์ Bixby Text Call ถอดเสียงโทรศัพท์เป็นข้อความ พิมพ์ตอบแล้วอ่านกลับเป็นเสียง

By: mk

on 15 October 2022 - 17:57 Tags:

Topics:

ซัมซุงโชว์ฟีเจอร์ใหม่ของรอม One UI 5.0 ที่จะออกตัวจริงในเร็วๆ นี้ ฟีเจอร์ที่ว่าคือ Bixby Text Call เป็นการใช้ผู้ช่วยอัจฉริยะ Bixby (ที่หลายคนลืมชื่อนี้ไปแล้ว) ช่วยคุยโทรศัพท์แทนเรา

หากมีคนโทรมา แล้วเราไม่สะดวกรับสาย เราสามารถกดเลือก Text Call แล้ว Bixby จะถอดเสียงพูดของคู่สายมาเป็นข้อความ ให้เราพิมพ์ตอบเป็นข้อความได้ จากนั้น Bixby จะอ่านออกเสียงให้คู่สนทนาฟังเอง

ซัมซุงบอกว่าฟีเจอร์นี้เหมาะกับสถานการณ์ที่ส่งเสียงได้ยาก เช่น ในรถบัสหรือรถไฟที่มีคนมากๆ หรือในงานคอนเสิร์ตที่เสียงดังมาก ตอนนี้ฟีเจอร์นี้ใช้งานได้แล้วในภาษาเกาหลี ส่วนภาษาอังกฤษจะตามมาในช่วงต้นปี 2023

JR East ติดตั้งระบบแสดงข้อความถอดคำพูดพร้อมแปลภาษาเจ้าหน้าที่ได้แบบเรียลไทม์

By: ตะโร่งโต้ง

on 8 October 2022 - 13:06 Tags:

Topics:

JR East บริษัทเดินรถไฟโดยสารสายตะวันออกของญี่ปุ่นได้อุปกรณ์แสดงผล HUD (ย่อมาจาก Head-Up Display) บริเวณโต๊ะของเจ้าหน้าที่ผู้ให้บริการ โดยระบบจะถอดคำพูดเจ้าหน้าที่เป็นข้อความแสดงผลแบบเรียลไทม์และสามารถแปลข้อความจากภาษาญี่ปุ่นเป็นภาษาอังกฤษ, จีน หรือเกาหลีได้ด้วย

ระบบนี้พัฒนาโดย Kyocera อุปกรณ์ HUD ที่จะฉายภาพให้ปรากฎบนแผ่นกระจกกั้นหน้าโต๊ะปฏิบัติงานของเจ้าหน้าที่ ตัวมันมีช่องรับสัญญาณเสียงจากไมโครโฟนและช่องเชื่อมต่อกับอุปกรณ์ควบคุมอื่น (อาจเป็นแท็บเล็ตหรือแผงควบคุมที่มีปุ่มกดเพื่อใช้เลือกคำสั่งที่มีการตั้งโปรแกรมไว้ล่วงหน้าเป็นการเฉพาะ) ภายในมีระบบซอฟต์แวร์ถอดข้อความเสียงเป็นคำพูดและระบบแปลภาษา โดย Kyocera ระบุว่านอกเหนือจาก 3 ภาษาที่กล่าวไปข้างต้นแล้ว สามารถตั้งโปรแกรมเพิ่มเติมแปลเป็นภาษายูเครนและภาษาเวียตนามได้ด้วย

Amazon เปิดตัว Alexa Game Control สั่งงานเกมด้วยเสียงพูด ใช้เอนจินเดียวกับ Alexa

By: mk

on 24 August 2022 - 19:31 Tags:

Topics:

Amazon ประกาศฟีเจอร์ Alexa Game Control ที่ให้เราสั่งงานเกมด้วยเสียงได้ เช่น พูดว่า "swap to my best weapon" เพื่อเปลี่ยนมาสวมใส่อาวุธที่ดีที่สุดของตัวละครนั้น

ฟีเจอร์นี้ใช้เอนจินวิเคราะห์เสียงตัวเดียวกับ Alexa เป็นการทำงานที่ระดับซอฟต์แวร์ล้วนๆ ไม่จำเป็นต้องผ่านลำโพง Echo และไม่ต้องสั่งคำว่า Alexa นำหน้า แต่จำเป็นต้องต่อเน็ตตลอดเวลา และฝั่งนักพัฒนาเกมต้องรองรับด้วย โดย Amazon ระบุว่ามี SDK/plugin ให้กับเกมที่สร้างด้วย UE4, Unity และเอนจินอื่นที่เป็น C++ เบื้องต้นยังใช้ได้เฉพาะเกมพีซีและ Xbox เท่านั้น

PS5 เพิ่มฟีเจอร์สั่งงานด้วยเสียง Hey PlayStation

By: mk

on 9 February 2022 - 06:53 Tags:

Topics:

โซนี่ออกเฟิร์มแวร์ใหม่ของทั้ง PS4 และ PS5 (สถานะยังเป็น Beta) ฟีเจอร์เด่นที่สุดคือ PS5 จะได้ฟีเจอร์ฟังคำสั่งเสียง Voice Command โดยสั่งว่า "Hey PlayStation" แล้วสั่งเปิดเกม แอพ ตั้งค่า ปรับระดับเสียง ฯลฯ ด้วยคำพูดได้ แบบเดียวกับที่เราคุ้นเคยใน virtual assistant ค่ายอื่นๆ

ฟีเจอร์ Hey PlayStation ยังใช้งานได้เฉพาะภาษาอังกฤษ และเปิดใช้กับบัญชีผู้เล่นในสหรัฐ-สหราชอาณาจักรเท่านั้น

ส่วนฟีเจอร์อื่นของเฟิร์มแวร์เวอร์ชันนี้เป็นการอัพเดตระบบปาร์ตี้, voice chat, Share Play, UI เป็นต้น

Windows 11 ย้ายไอคอน Widget ชิดซ้ายในทาสก์บาร์, เพิ่มฟีเจอร์ Voice Access สั่งงานด้วยเสียง

By: mk

on 9 December 2021 - 09:07 Tags:

Topics:

ไมโครซอฟท์ออก Windows 11 Insider Preview Build 22518 มีการเปลี่ยนแปลงในระดับ UI หลายอย่างดังนี้

ย้ายตำแหน่งปุ่ม Widgets มาไว้ด้านซ้ายสุดของทาสก์บาร์ (กรณีจัดไอคอนตรงกลาง) และเปลี่ยนเป็นไอคอนแสดงสภาพอากาศแทน (คล้ายกับของ Windows 10 ที่อยู่ชิดขวา)

SoundHound เตรียมเข้าตลาดหุ้นด้วยวิธี SPAC มูลค่ากิจการ 2.1 พันล้านดอลลาร์

By: arjin

on 20 November 2021 - 23:24 Tags:

Topics:

SoundHound

SPAC

Voice Recognition

SoundHound แพลตฟอร์มสั่งงานด้วยเสียง ประกาศเตรียมนำบริษัทเข้าตลาดหุ้น Nasdaq ด้วยวิธีการ SPAC ใช้ชื่อย่อในการซื้อขาย SOUN โดยบริษัทที่จะเข้ามาซื้อกิจการคือ Archimedes ซึ่งจะทำให้ SoundHound ได้เงินเพิ่ม 244 ล้านดอลลาร์ ผ่านการขายหุ้นเพิ่มทุนแบบเฉพาะเจาะจง 111 ล้านดอลลาร์ และอีก 133 ล้านดอลลาร์จากบริษัท Archimedes เอง มูลค่ากิจการของ SoundHound จากดีลนี้อยู่ที่ราว 2.1 พันล้านดอลลาร์

รายชื่อผู้ลงทุนในรอบเพิ่มทุนแบบเฉพาะเจาะจงได้แก่ Oracle, Koch Industries และ MKaNN Ventures

เมนูกี่ชั้นก่อนเจอคนก็ไม่หวั่น Pixel 6 ฟังเสียงเบอร์อัตโนมัติ แปลงเป็นข้อความ-ปุ่มบนจอ

By: mk

on 20 October 2021 - 14:32 Tags:

Topics:

Google Pixel 6

Artificial Intelligence

Voice Recognition

นอกจากฟีเจอร์ด้านกล้องและการแปลภาษาพูดแบบเรียลไทม์แล้ว กูเกิลยังโชว์ฟีเจอร์ใหม่ของ Pixel 6 อีกอย่างคือ Direct My Call ที่ช่วยให้การติดต่อคอลล์เซ็นเตอร์เสียงอัตโนมัติง่ายขึ้น

คนที่เคยโทรไปคอลล์เซ็นเตอร์คงคุ้นเคยกับการฟัง "กด 1 เพื่อฟังข้อมูล กด 2 เพื่อแจ้งปัญหา" ที่ต้องใช้เวลาฟังนาน ถือสายนาน กว่าจะเจอเมนูที่ต้องการ

ฟีเจอร์ Direct My Call ใช้เทคโนโลยี Google Duplex ตัวเดียวกับที่เคยโชว์คุยโทรศัพท์แทนคน มาฟังเสียงพูดจากปลายทาง แล้วถอดเป็นข้อความแสดงขึ้นบนจอ พร้อมขึ้นปุ่มกดจริงๆ เป็นเลข 1-2-3 ให้ด้วยเลย

Unity ซื้อบริษัท OTO ใช้ AI วิเคราะห์น้ำเสียงใน Voice Chat แก้ปัญหา Toxic ในหมู่เกมเมอร์

By: mk

on 24 August 2021 - 22:19 Tags:

Topics:

Unity

Acquisition

Voice Recognition

Unity ยังเดินหน้าซื้อกิจการอย่างต่อเนื่อง หลังซื้อซอฟต์แวร์สร้างต้นไม้ SpeedTree และรีโมทเดสก์ท็อป Parsec ล่าสุดประกาศซื้อ OTO บริษัทวิเคราะห์เสียงคุยแชทด้วย AI เพื่อแก้ปัญหาการกลั่นแกล้ง ดูถูกเหยียดหยามในหมู่เกมเมอร์

[ลือ] Microsoft เตรียมซื้อกิจการ Nuance ที่มูลค่า 16,000 ล้านดอลลาร์

By: arjin

on 12 April 2021 - 06:46 Tags:

Topics:

มีรายงานว่าไมโครซอฟท์ใกล้ปิดการเจรจา เพื่อเข้าซื้อกิจการทั้งหมดของ Nuance หรือ Nuance Communications บริษัทผู้พัฒนาซอฟต์แวร์สั่งงานด้วยเสียง ด้วยมูลค่าดีล 16,000 ล้านดอลลาร์ ซึ่งดีลอาจประกาศเป็นทางการภายในวันนี้

ทั้งนี้ Nuance เป็นบริษัทอยู่ในตลาดหุ้น และราคาที่มีรายงานว่าไมโครซอฟท์เสนอซื้อคือ 56 ดอลลาร์ต่อหุ้น จึงเป็นที่มาของตัวเลข 16,000 ล้านดอลลาร์นั่นเอง

Nuance เป็นผู้พัฒนาซอฟต์แวร์สั่งงานด้วยเสียง ซึ่งมีส่วนร่วมสนับสนุนเทคโนโลยีใน Siri ช่วงเปิดตัว ขณะที่บริการสั่งงานด้วยเสียงของบริษัทมีฐานลูกค้าในหลายอุตสาหกรรมตั้งแต่กลุ่มสุขภาพ ไปจนถึงยานยนต์

Siri เลิกตั้งค่าเสียงผู้หญิงเป็นดีฟอลต์ ให้ผู้ใช้เป็นฝ่ายเลือกเอง, เพิ่มเสียงใหม่อีก 2 เสียง

By: mk

on 1 April 2021 - 22:23 Tags:

Topics:

แอปเปิลประกาศการเปลี่ยนแปลงสำคัญของ Siri ใน iOS 14.5 (ปัจจุบันยังเป็น Beta) นั่นคือสำหรับภาษาที่เป็น English (United States) จะไม่เลือกเสียงผู้หญิงให้เป็นค่าดีฟอลต์แล้ว ผู้ใช้จะต้องเป็นฝ่ายกำหนดเองว่าจะเลือกเสียงแบบไหน

ปัจจุบัน Siri ในภาษา English (United States) มีให้เลือกสองเสียงคือ Male และ Female แต่การเลือก Female เป็นดีฟอลต์อาจชี้นำเรื่องเพศ (gender bias) ได้ แอปเปิลจึงเปลี่ยนวิธีมาให้ผู้ใช้เลือกเอง เพื่อสะท้อนมุมมองเรื่องความหลากหลาย (diversity) ของแอปเปิล

iOS 14.5 ยังจะเพิ่มเสียง Siri มาอีก 2 เสียง รวมเป็น 4 เสียง และจะเปลี่ยนชื่อเสียงจาก Male/Female เป็น Voice 1-4 แทน

Google Workspace รองรับการสั่งงานด้วยเสียงจาก Google Assistant แล้ว

By: mk

on 2 March 2021 - 10:29 Tags:

Topics:

หลังจากทดสอบมาได้สักระยะ วันนี้กูเกิลเปิดตัว Google Workspace with Google Assistant อย่างเป็นทางการ

วิธีการใช้งานคือใช้ Google Assistant บนอุปกรณ์พกพา (รวมถึงอุปกรณ์กลุ่ม Smart Display) เข้าถึงข้อมูลหรือสั่งงานในบัญชี Google Workspace ของเราด้วยเสียงพูดได้ เช่น สร้างนัดหมายในปฏิทิน, โทรเข้าห้องประชุม Meet, เขียนอีเมลถึงเพื่อนร่วมงาน

ฟีเจอร์นี้ยังรองรับเฉพาะภาษาอังกฤษเท่านั้น และต้องให้แอดมินองค์กรเปิดใช้ให้ก่อนด้วย

Google Assistant สั่งงานแอพ Android ด้วยเสียงได้แล้ว ยังใช้ได้แค่แอพยอดนิยมบางตัว

By: mk

on 9 October 2020 - 09:41 Tags:

Topics:

Google Assistant รองรับคำสั่งเสียงเพื่อสั่งงานแอพ Android บนสมาร์ทโฟนแล้ว ตัวอย่างเช่น “Hey Google, open Selena Gomez on Snapchat”

กูเกิลบอกว่าเบื้องต้น ฟีเจอร์นี้ใช้ได้กับแอพยอดนิยมประมาณ 30 ตัวของ Google Play ภาคภาษาอังกฤษ ที่ระบุชื่อได้แก่ Etsy, Snapchat, Nike Run, Postmates, Spotify, Twitter, Walmart, Discord, Mint, MyFitnessPal และจะทยอยเพิ่มแอพที่รองรับให้มากขึ้นในระยะถัดไป

Windows 10 ปรับหน้าตา Touch Keyboard ใหม่, ยกเครื่อง Voice Typing

By: mk

on 3 September 2020 - 21:19 Tags:

Topics:

นอกจาก Windows 10 ปรับหน้าจอ Emoji Picker ใหม่ ยังปรับปรุงอินพุตแบบอื่นๆ ได้แก่ Touch Keyboard และ Voice Typing ด้วย

Touch Keyboard หรือคีย์บอร์ดสำหรับอุปกรณ์จอสัมผัส ปรับหน้าตาให้เข้าชุด Fluent Design และเพิ่มฟีเจอร์การค้นหา Emoji/GIF เข้ามาที่ตัวคีย์บอร์ดเลย (ลักษณะเดียวกับ Gboard ของ Android) นอกจากนี้ยังเพิ่มฟีเจอร์เล็กๆ น้อยอย่างการกดปุ่มตัวอักษรบางตัว (เช่น e) ค้างไว้เพื่อดูตัวอักษรย่อยของบางภาษา เป็นต้น

Apple ซื้อกิจการ Voysis สตาร์ทอัพเทคโนโลยีรู้จำเสียง เน้นรองรับการ Shopping

By: arjin

on 4 April 2020 - 09:11 Tags:

Topics:

มีรายงานว่าแอปเปิลได้เข้าซื้อกิจการ Voysis สตาร์ทอัพที่พัฒนาด้าน AI จากการสั่งงานด้วยเสียง ด้วยมูลค่าที่ไม่เปิดเผย

Voysis ให้บริการแพลตฟอร์มสำหรับการสั่งงานด้วยเสียง เน้นไปที่แอปช้อปปิ้ง โดยมีจุดขายคือการใช้ฐานข้อมูลลูกค้าทำงานร่วมกับ AI เพื่อให้เข้าใจรายละเอียดผลิตภัณฑ์ที่สั่งซื้อ หรือบริการที่ต้องการได้เชิงลึก เป็นการเพิ่มประสบการณ์ให้กับลูกค้า ซึ่งคาดว่าแอปเปิลจะนำเทคโนโลยีของ Voysis มาผนวกกับ Siri

แอปเปิลยืนยันการซื้อกิจการนี้ด้วยคำตอบมาตรฐานว่าบริษัทมีการซื้อกิจการขนาดเล็กอยู่ตลอด

ที่มา: MacRumors

เผยทิศทางใหม่ Cortana เน้นงานเชิงธุรกิจ, ตัดฟีเจอร์ฟังเพลง-เชื่อมสมาร์ทโฮมออก

By: mk

on 29 February 2020 - 14:59 Tags:

Topics:

ไมโครซอฟท์ประกาศทิศทางใหม่ของ Cortana ที่หันไปเน้นลูกค้าองค์กร (ผูกกับ Microsoft 365) แทนตลาดคอนซูเมอร์เดิมที่เข็นไม่ขึ้น

Cortana เวอร์ชันใหม่ใช้ฐานจากแอพเวอร์ชันใหม่ที่เน้นพิมพ์คุยมากกว่าใช้เสียงพูด ฟีเจอร์เน้นไปที่การใช้งานเชิงธุรกิจ เช่น นัดหมาย อีเมล ตารางงานที่ต้องทำ

ฟีเจอร์เดิมของ Cortana ที่ถูกตัดออกไปเป็นด้านคอนซูเมอร์ เช่น เปิดเพลง, เชื่อมต่ออุปกรณ์สมาร์ทโฮม หรือ skill ของนักพัฒนาภายนอก ส่วนฟีเจอร์เดิมที่ยังคงใช้ได้อยู่คือฟีเจอร์สายข้อมูล เช่น หาข้อมูลจาก Bing, เปิดแอพ ตั้งค่าแอพ เป็นต้น

รู้จัก LINE Duet บ็อต AI รับสายโทรศัพท์จองโต๊ะร้านอาหารแทนมนุษย์ เริ่มใช้แล้วในญี่ปุ่น

By: mk

on 23 November 2019 - 10:40 Tags:

Topics:

LINE

Voice Recognition

Artificial Intelligence

เราเห็นกูเกิลโชว์ Google Duplex ฟีเจอร์ที่ใช้ AI คุยโทรศัพท์นัดหมายได้แทนมนุษย์ มาตั้งแต่ปี 2018 (รายละเอียดในเชิงเทคนิค) ฝั่งบริษัทฟากเอเชียอย่าง LINE ที่มีฝ่ายพัฒนา AI ชื่อ LINE Brain ก็มีโครงการบ็อตคุยโทรศัพท์ลักษณะเดียวกันชื่อว่า LINE Duet (ชื่อในการค้าคือ LINE AiCall ส่วน LINE Duet คือชื่อโครงการ)

McDonald's ซื้อกิจการ Apprente สตาร์ทอัพด้านเทคโนโลยีเสียง เพื่อนำมาใช้กับบริการ Drive-Thru

By: arjin

on 13 September 2019 - 13:03 Tags:

Topics:

McDonalds

Acquisition

Voice Recognition

แมคโดนัลด์ประกาศบรรลุข้อตกลง เพื่อซื้อกิจการ Apprente สตาร์ทอัพที่พัฒนาเทคโนโลยีด้านเสียงและบทสนทนา โดยไม่ได้เปิดเผยมูลค่าของดีล ซึ่งเป็นอีกครั้งที่แมคโดนัลด์เข้าซื้อกิจการด้านเทคโนโลยี เพื่อนำมาปรับใช้กับธุรกิจฟาสต์ฟู้ด

เทคโนโลยีของ Apprente มีการทดสอบใช้งานในร้านแมคโดนัลด์บางสาขาอยู่แล้ว โดยนำมาใช้กับการสั่งอาหารแบบไดรฟ์ทรู ช่วยให้การทำงานง่ายและเร็วมากขึ้น แมคโดนัลด์ยังคาดหวังจะนำเทคโนโลยีนี้มาใช้กับการสั่งอาหารที่ตู้คีออสและแอปมือถือด้วย

ก่อนหน้านี้แมคโดนัลด์ก็ซื้อกิจการ Dynamic Yield เพื่อนำเทคโนโลยีมาใช้ปรับแต่งหน้าแสดงผลเมนูสำหรับลูกค้าไดรฟ์ทรู ให้แสดงรายการอาหารตามช่วงเวลา สภาพอากาศ ทำให้ยอดขายเพิ่มสูงขึ้น

Espressif ปล่อยเฟรมเวิร์ค ESP-Skainet สำหรับรับคำสั่งด้วยเสียง รันบน ESP32

By: lew

on 2 September 2019 - 19:05 Tags:

Topics:

Espressif

ESP32

Voice Recognition

Espressif เปิดตัวเฟรมเวิร์ค ESP-Skainet สำหรับการพัฒนาอุปกรณ์รับคำสั่งด้วยเสียง เปิดทางให้นักพัฒนาสร้างอุปกรณ์รับคำสั่งโดยไม่ต้องเชื่อมต่ออินเทอร์เน็ต

เฟรมเวิร์คประกอบด้วยโมดูลจดจำเสียงสองส่วน คือ WakeNet สำหรับจับคำสำคัญเพื่อเริ่มต้นทำงาน โดยส่วนนี้ใช้แรมเพียง 20 กิโลไบต์และยังได้ความแม่นยำที่ค่อนข้างสูง ประมาณ 88% ที่ระยะ 1 เมตร โดยตอนนี้รับคำสำคัญเป็นภาษาจีนเท่านั้น

อีกส่วนคือการรรับคำสั่ง ที่ชื่อว่า MultiNet เป็นโมเดล deep learning ที่แยกคำได้สูงสุด 100 คำในภาษาจีน พร้อมความสามารถในการรับคำสั่งจากผู้ใช้เพิ่มเติม

Cisco ซื้อ Voicea บริษัท AI แปลงเสียงพูดเป็นบันทึกการประชุม, ดึงเข้าทีม WebEx

By: mk

on 12 August 2019 - 14:16 Tags:

Topics:

Cisco ประกาศซื้อกิจการ Voicea เจ้าของเทคโนโลยีแปลงเสียงพูดเป็นข้อความแบบเรียลไทม์ เพื่อนำมาใช้กับโซลูชันการประชุม WebEx ให้สามารถสรุปข้อความจากเสียงสนทนาระหว่างการประชุม ไฮไลท์ประเด็นสำคัญ และค้นหาในภายหลังได้

เป้าหมายของ Cisco คือแปลงการประชุมในระบบ WebEx ให้เป็นบันทึกการประชุมดิจิทัล เพื่อให้ผู้เข้าร่วมประชุมสามารถต่อยอดงานต่างๆ จากการประชุมได้ทันที

Cisco ไม่ได้เปิดเผยมูลค่าการซื้อกิจการครั้งนี้ แต่หลังจากเสร็จสิ้นกระบวนการซื้อกิจการแล้ว พนักงานของ Voicea จะเข้ามาทำงานในทีม WebEx

ที่มา - Cisco

ไมโครซอฟท์เผย Cortana เวอร์ชันใหม่ เน้นแชทมากกว่าเสียง เป็นแอพแยกไม่ผูกติด OS

By: mk

on 27 July 2019 - 08:55 Tags:

Topics:

หลังจาก ไมโครซอฟท์จับแยก Cortana ออกจาก Search บน Windows 10 ล่าสุดก็ออก Windows 10 Insider Preview Build 18945 (20H1) ที่มี Cortana เวอร์ชันยกเครื่องใหม่ เน้นการแชทมากกว่าการสนทนาด้วยเสียง

หน้าตา UI ของ Cortana ตัวใหม่จะคล้ายๆ Google Assistant บนสมาร์ทโฟน ที่เน้นการแชทคุยด้วยข้อความเป็นหลัก แต่ก็ยังรองรับการสนทนาด้วยเสียงเช่นเดิม

ไมโครซอฟท์ยอมรับว่า Cortana เวอร์ชันใหม่ยังมีฟีเจอร์บางอย่างน้อยกว่า Cortana ตัวเดิม (แต่ฟีเจอร์หลักๆ อย่างการสั่งงานด้วยเสียงเพื่อเปิดแอพ ถามคำถาม ตั้งเวลา ยังอยู่กันครบ) และจะค่อยๆ เพิ่มฟีเจอร์อื่นเข้ามาในอนาคต โดยจะเป็นการอัพเดตผ่าน Microsoft Store ไม่ต้องรอรอบการอัพเดตของ Windows อีกต่อไป

Alibaba นำระบบสั่งงานด้วยเสียง Tmall Genie ไปใช้กับรถยนต์ Audi, Renault, Honda

By: mk

on 18 June 2019 - 10:20 Tags:

Topics:

Alibaba ประกาศความร่วมมือกับบริษัทผู้ผลิตรถยนต์ 3 รายคือ Audi, Renault, Honda เพื่อนำระบบสั่งงานด้วยเสียงของ Alibaba ไปใช้กับรถยนต์ยี่ห้อเหล่านี้ที่วางขายในประเทศจีน

Alibaba มีแพลตฟอร์มสั่งงานด้วยเสียงชื่อ Tmall Genie ใช้กับลำโพงอัจฉริยะเพื่อทำตลาดในประเทศจีนมาตั้งแต่ปี 2017 (ลักษณะเดียวกับ Amazon Alexa หรือ Google Assistant) ส่วนคู่แข่งของ Tmall Genie ในประเทศจีนคือ Baidu DuerOS

PS4 ขยายจำนวนสมาชิก Party จาก 8 เป็น 16 คน, แปลงเสียงพูดเป็นข้อความแชทได้

By: mk

on 4 June 2019 - 22:57 Tags:

Topics:

Sony ประกาศปรับปรุงฟีเจอร์ Party ของ PS4 โดยขยายจำนวนสมาชิกสูงสุดในปาร์ตี้จาก 8 คนเป็น 16 คน, ปรับปรุงเรื่องคุณภาพเสียงของ voice chat และปรับปรุงการเชื่อมต่อกับเครือข่าย

นอกจากนี้ Sony ยังทดสอบฟีเจอร์ chat transcription หรือแปลงเสียงพูดเป็นข้อความ รวมถึงอ่านข้อความออกมาเป็นเสียงพูดให้เพื่อนร่วมปาร์ตี้คนอื่นๆ ฟังโดยอัตโนมัติ (ยังรองรับเฉพาะภาษาอังกฤษ) ซึ่งใช้ได้กับทั้ง Party ของ PS4 และแอพ PS4 Second Screen บนสมาร์ทโฟน

Sony เปิดทดสอบฟีเจอร์ Party เวอร์ชันใหม่ให้กับผู้สมัครเข้าโครงการ PS4 System Software Beta แล้ว โดยยังไม่ระบุว่าจะออกเวอร์ชันจริงเมื่อไร

Main menu

MKBHD รีวิวผู้ช่วยสั่งงานด้วยเสียง แชมป์คือ Google Assistant ส่วน Alexa แย่ที่สุด

Home Assistant จะสร้างระบบสั่งงานด้วยเสียงของตัวเอง ประมวลผลแบบโลคัล

เขียนโปรแกรมแบบไม่ต้องแตะคีย์บอร์ด "Hey, GitHub" สั่งให้ GitHub เขียนโค้ดด้วยเสียงพูด

ซัมซุงโชว์ฟีเจอร์ Bixby Text Call ถอดเสียงโทรศัพท์เป็นข้อความ พิมพ์ตอบแล้วอ่านกลับเป็นเสียง

JR East ติดตั้งระบบแสดงข้อความถอดคำพูดพร้อมแปลภาษาเจ้าหน้าที่ได้แบบเรียลไทม์

Amazon เปิดตัว Alexa Game Control สั่งงานเกมด้วยเสียงพูด ใช้เอนจินเดียวกับ Alexa

PS5 เพิ่มฟีเจอร์สั่งงานด้วยเสียง Hey PlayStation

Windows 11 ย้ายไอคอน Widget ชิดซ้ายในทาสก์บาร์, เพิ่มฟีเจอร์ Voice Access สั่งงานด้วยเสียง

SoundHound เตรียมเข้าตลาดหุ้นด้วยวิธี SPAC มูลค่ากิจการ 2.1 พันล้านดอลลาร์

เมนูกี่ชั้นก่อนเจอคนก็ไม่หวั่น Pixel 6 ฟังเสียงเบอร์อัตโนมัติ แปลงเป็นข้อความ-ปุ่มบนจอ

Unity ซื้อบริษัท OTO ใช้ AI วิเคราะห์น้ำเสียงใน Voice Chat แก้ปัญหา Toxic ในหมู่เกมเมอร์

[ลือ] Microsoft เตรียมซื้อกิจการ Nuance ที่มูลค่า 16,000 ล้านดอลลาร์

Siri เลิกตั้งค่าเสียงผู้หญิงเป็นดีฟอลต์ ให้ผู้ใช้เป็นฝ่ายเลือกเอง, เพิ่มเสียงใหม่อีก 2 เสียง

Google Workspace รองรับการสั่งงานด้วยเสียงจาก Google Assistant แล้ว

Google Assistant สั่งงานแอพ Android ด้วยเสียงได้แล้ว ยังใช้ได้แค่แอพยอดนิยมบางตัว

Windows 10 ปรับหน้าตา Touch Keyboard ใหม่, ยกเครื่อง Voice Typing

Apple ซื้อกิจการ Voysis สตาร์ทอัพเทคโนโลยีรู้จำเสียง เน้นรองรับการ Shopping

เผยทิศทางใหม่ Cortana เน้นงานเชิงธุรกิจ, ตัดฟีเจอร์ฟังเพลง-เชื่อมสมาร์ทโฮมออก

รู้จัก LINE Duet บ็อต AI รับสายโทรศัพท์จองโต๊ะร้านอาหารแทนมนุษย์ เริ่มใช้แล้วในญี่ปุ่น

McDonald's ซื้อกิจการ Apprente สตาร์ทอัพด้านเทคโนโลยีเสียง เพื่อนำมาใช้กับบริการ Drive-Thru

Espressif ปล่อยเฟรมเวิร์ค ESP-Skainet สำหรับรับคำสั่งด้วยเสียง รันบน ESP32

Cisco ซื้อ Voicea บริษัท AI แปลงเสียงพูดเป็นบันทึกการประชุม, ดึงเข้าทีม WebEx

ไมโครซอฟท์เผย Cortana เวอร์ชันใหม่ เน้นแชทมากกว่าเสียง เป็นแอพแยกไม่ผูกติด OS

Alibaba นำระบบสั่งงานด้วยเสียง Tmall Genie ไปใช้กับรถยนต์ Audi, Renault, Honda

PS4 ขยายจำนวนสมาชิก Party จาก 8 เป็น 16 คน, แปลงเสียงพูดเป็นข้อความแชทได้

Pages

Blognone Jobs Premium

About Blognone

Other Version

Copyright Notice

Main menu

You are here

Pages

sign in

Blognone Jobs Premium

About Blognone

Other Version

Copyright Notice