By mk Founder on Tag: Voice Recognition, Kinect, Image Processing, Xbox One, Microsoft
Voice Recognition

ข่าวสั้นของ Kinect ครับ ผู้บริหารไมโครซอฟท์ Phil Harrison ไปพูดที่งาน Eurogamer Expo และให้ข้อมูลว่าเซ็นเซอร์ Kinect รุ่นใหม่ที่มาพร้อมกับ Xbox One จะเพิ่มความสามารถด้านการแยกแยะเสียงพูดจากรุ่นเดิม โดยของใหม่นี้สามารถแยกแยะเสียงจากผู้เล่น 2 คนที่พูดพร้อมๆ กันได้

นอกจากนี้ Kinect ยังแยกแยะการขยับของ "ปาก" ของผู้เล่นได้, ตรวจจับความเคลื่อนไหวของผู้เล่นได้ 6 คนพร้อมกัน (นับเป็นความเคลื่อนไหวของข้อต่อได้สูงสุด 25 จุด), ประเมินอัตราการเต้นของหัวใจ และตรวจสอบรูปร่างของใบหน้าได้สูงสุด 1,400 จุด

By mk Founder on Tag: Voice Recognition, Windows Phone, Microsoft, Artificial Intelligence, Cortana
Voice Recognition

ZDNet เผยข้อมูลของ "Cortana" ระบบผู้ช่วยส่วนตัวของไมโครซอฟท์บน Windows Phone รุ่นหน้ารหัส Blue ซึ่งอธิบายง่ายๆ ว่ามันคือคู่แข่งของ Apple Siri และ Google Now

ชื่อ Cortana มาจากตัวละครชื่อเดียวกันในเกมตระกูล Halo ซึ่งเป็น AI ที่สามารถเรียนรู้และปรับตัวได้เรื่อยๆ

ตามข่าวบอกว่า Cortana เป็นมากกว่าแอพสั่งงานด้วยเสียง แต่มันคือแกนหลักของแผนการยกเครื่อง "shell" ของทั้ง Windows, Windows Phone และ Xbox ในอนาคต ซึ่งเป็นมากกว่าการปรับหน้าอินเทอร์เฟซให้ทันสมัยขึ้น

By mk Founder on Tag: Sony, Voice Recognition, PS4, Games
Sony

โฆษกของ Sony Computer Entertainment ยืนยันกับเว็บไซต์ Polygon ว่า PS4 จะรองรับการสั่งงานด้วยเสียงพูด ผ่านกล้อง PlayStation Camera ที่เป็นอุปกรณ์เสริมขายแยก 59 ดอลลาร์ (ลักษณะเดียวกับ Xbox มี Kinect)

โซนี่พูดถึงฟีเจอร์นี้ในงานสัมมนาแห่งหนึ่ง โดยบอกว่า PlayStation Camera จะมีความสามารถทั้งด้านการแยกแยะใบหน้า (facial recognition) และการสั่งงานส่วนต่างๆ ด้วยเสียงพูด (navigational voice command)

โซนี่บอกว่าจะเปิดเผยข้อมูลเพิ่มเติมของฟีเจอร์นี้ ในช่วงใกล้ๆ วางขาย PS4 วันที่ 29 พฤศจิกายนนี้

By Blltz Writer on Tag: Qualcomm, Voice Recognition, Snapdragon, SoC
Qualcomm

หนึ่งในฟีเจอร์เด่นของ Moto X ที่เหนือกว่าคู่แข่งตอนนี้คงหนีไม่พ้นการรอรับคำสั่งด้วยเสียงตลอดเวลา (always listening) อันเป็นผลมาจากหน่วยประมวลผลภาษาธรรมชาติที่รวมมาในชิป X8

ดูเหมือนว่าในอนาคตนี้ฟีเจอร์รับฟังที่ว่านี้คงจะได้ไปอยู่ในสมาร์ทโฟนรุ่นท็อปๆ หลังจาก Qualcomm ออกมาเผยข้อมูลว่าชิปรุ่นท็อปของตัวเองอย่าง Snapdragon 800 จะมาพร้อมกับชิปกินไฟต่ำที่สามารถรับคำสั่งด้วยเสียงตลอดเวลาได้เช่นกัน โดยเจ้าชิปตัวนี้ชื่อว่า Hexagon Qualcomm Digital Signal Processor 6 (Hexagon QDSP6)

By mk Founder on Tag: Motorola, Voice Recognition, Leak, Google Now, Moto X
Motorola

Moto X ถือเป็นมือถือที่มีข่าวหลุด-ภาพหลุดออกมามากมาย ล่าสุดเป็นคลิปหลุดสาธิตฟีเจอร์ Open Mic หรือการสั่งงานด้วยเสียงแม้ตอนนั้นมือถือจะไม่ได้ทำงานอยู่

จากวิดีโอเราจะเห็นว่า Moto X อยู่ในสภาพปิดหน้าจอ จากนั้นผู้สาธิตพูดคำว่า OK Moto Magic ตามด้วยคำสั่งงานด้วยเสียงที่ Google Now รู้จักและแยกแยะได้ เมื่อตัวเครื่องได้ยินคำว่า OK Moto Magic จะเปิดหน้าจอขึ้นมาและส่งประโยคหลังจากนั้นไปให้ Google Now จัดการต่ออีกทีหนึ่ง

วิดีโอนี้ตรงกับข่าวก่อนหน้านี้ของ Moto X ที่ว่ามีไมโครโฟนเปิดทำงานรอรับคำสั่งอยู่ตลอดเวลา

By mk Founder on Tag: Research, Voice Recognition, Algorithm, Bing, Windows Phone, Microsoft
Research

ไมโครซอฟท์ประกาศปรับปรุงระบบแยกแยะและวิเคราะห์เสียงของ Windows Phone (ที่ใช้เอนจินของ Bing) ให้มีความแม่นยำมากขึ้นกว่าเดิมแม้ในสภาพที่มีเสียงรบกวนมากๆ และทำงานแยกแยะเสียงได้เร็วกว่ารุ่นก่อน 15%

เบื้องหลังการปรับปรุงฟีเจอร์นี้มาจากผลงานของทีม Microsoft Research ในปักกิ่งและสหรัฐ ที่ใช้เทคนิค deep neural networks (DNNs) จำลองการทำงานของเส้นประสาทในสมอง ผนวกกับฐานข้อมูลขนาดใหญ่ของ Bing ทำให้เทคนิคการวิเคราะห์เสียงพูดของค่ายไมโครซอฟท์พัฒนาขึ้นอีกมาก

By mk Founder on Tag: Google, Search Engine, Chrome, Voice Recognition, Google Search
Google

ฟีเจอร์ที่กูเกิลโชว์ในงาน Google I/O ตอนนี้สามารถใช้งานบน Chrome 27 ได้แล้ว

วิธีการใช้งานคืออัพเกรดเป็น Chrome 27 ก่อน แล้วเข้าไปที่หน้าแรกของกูเกิล (google.co.th ก็ใช้งานได้ครับ) คลิกที่รูปไมโครโฟนในกล่องข้อความ หน้าจอจะเปลี่ยนเป็นไมโครโฟนสีแดงขนาดใหญ่ พร้อมกับคำค้นที่เราพูดออกไป

จากนั้นกูเกิลจะแสดงหน้าผลการค้นหา พร้อมเสียงพูดเป็นภาษาอังกฤษครับ (กรณีของคำค้นที่เกี่ยวกับ population ก็แสดงกราฟข้อมูลย้อนหลังแบบใน I/O แล้วด้วย)

By mk Founder on Tag: Banking, Voice Recognition, Nuance, Barclays
Banking

Barclays Wealth บริการธนาคารส่วนตัวของเครือธนาคาร Barclays ของอังกฤษ เริ่มเปลี่ยนวิธีตรวจสอบตัวตนลูกค้าทางโทรศัพท์ จากเดิมที่ใช้วิธีถามรหัสผ่าน-คำถามข้อมูลส่วนตัว มาเป็นการแยกแยะเสียงพูด (voice recognition) แทน

การตรวจสอบเสียง (voiceprint) ใช้เวลาไม่ถึงหนึ่งนาทีหลังลูกค้าพูดจบ และกรณีที่ระบบตรวจสอบเสียงผิดพลาด ลูกค้ายังสามารถยืนยันตัวตนด้วยวิธีเดิมได้

ระบบแยกแยะเสียงพูดของ Barclays มาจาก Nuance FreeSpeech ของบริษัท Nuance เจ้าพ่อซอฟต์แวร์ด้านเสียงนั่นเอง

By Blltz Writer on Tag: Research, Safety, Voice Recognition
Research

แม้จะไม่ค่อยได้ใช้งาน แต่หลายคนก็คงมีความเชื่อว่าการสั่งงานด้วยเสียงแบบไร้สายขณะขับขี่ยานพาหนะน่าจะเป็นวิธีที่ช่วยลดอุบัติเหตุบนท้องถนนได้ดีวิธีหนึ่ง ทว่าผลการศึกษาจากองค์การขนส่งประจำรัฐเทกซัสกลับได้ผลออกมาตรงกันข้ามเสียงั้น

นาง Christian Yager เจ้าของผลการศึกษาบอกว่าเมื่อเปรียบเทียบระหว่างการส่งข้อความแบบเดิมๆ (ซึ่งเป็นหนึ่งในสาเหตุหลักของอุบัติเหตุมาตลอด) กับการส่งข้อความด้วยเสียง ผลปรากฏว่าผู้ขับขี่ก็ยังมีปฏิกิริยาตอบสนองช้ากว่าเมื่อไม่ได้ใช้งานมากพอๆ กันคือเท่าตัวจากปกติ

By nuntawat Writer on Tag: Apple, Voice Recognition, Steve Wozniak, Computer
Apple

Steve Wozniak ได้กล่าวที่งานสัมมนาแห่งหนึ่งเกี่ยวกับแอปเปิลว่า การที่ราคาหุ้นของแอปเปิลลดต่ำสุดในรอบ 16 สัปดาห์นั้นเป็นเรื่องที่น่าผิดหวัง แต่บริษัทมีแนวโน้มที่จะออกผลิตภัณฑ์ใหม่ กระทั่งผลิตภัณฑ์ที่ไม่เคยมีมาก่อน และผลิตภัณฑ์เหล่านั้นจะไปได้ดี ไม่เหมือนกับเอาของเก่ามาเล่าใหม่ที่ในที่สุดเราจะรู้สึกเบื่อหน่ายกับมัน ("not re-making the same thing, as eventually that just gets a little bit stale") เขายังเดาว่าแอปเปิลเตรียมตัวมาดี และกำลังดำเนินการบางอย่างที่จะสร้างความประหลาดใจและทำให้พวกเราช

By 0rmsin Contributor on Tag: Ubuntu, Voice Recognition
Ubuntu

หลังจาก Ubuntu ได้ถูกเพิ่มวิธีสั่งงานแบบ HUD ไปแล้ว วันนี้นักพัฒนาอิสระได้สาธิตวิธีการสั่งงานแบบใหม่คือการสั่งงานผ่านเสียง (voice recognition) ที่มีความสามารถหลากหลาย เช่น เริ่มโปรแกรมเบราว์เซอร์, เล่นเพลงที่ต้องการ, จัดการไฟล์แบบพื้นฐาน, พิมพ์ข้อความตามคำบอก หรือกระทั่งสามารถเปิดเว็บเพจใดๆ เพียงแค่บอกชื่อเท่านั้น

By Blltz Writer on Tag: Voice Recognition, Microsoft, Games, Xbox
Voice Recognition

ไม่ใช่แค่ฝั่ง PS4 ที่มีข่าวลือฟีเจอร์ใหม่ๆ เพราะคู่แข่งอย่าง Xbox รุ่นใหม่ที่คาดว่าจะเปิดตัวในปีนี้ก็มีข่าวลือฟีเจอร์ใหม่ๆ ออกมาเช่นกัน และเป็นฟีเจอร์สั่งงานด้วยเสียงแบบเต็มรูปแบบที่จะถูกรวมเข้ามาใน Xbox รุ่นใหม่นี้

ข้อมูลดังกล่าวเว็บไซต์ The Verge อ้างจากแหล่งข่าวที่ใกล้ชิดกับไมโครซอฟท์ โดยระบุว่าการสั่งงานด้วยเสียงของ Xbox รุ่นใหม่นี้จะรองรับตั้งแต่การเปิดเครื่องด้วยเสียง การสั่งงานด้วยภาษาธรรมชาติ (ตรงนี้ที่มาบอกว่าคล้ายกับ Siri) และสามารถแปลงเสียงเป็นข้อความได้

By Blltz Writer on Tag: Cloud Computing, Voice Recognition, Nuance
Cloud Computing

เมื่อช่วงปีที่ผ่านมาเราเห็นหลายบริษัทพยายามทำระบบผู้ช่วยสำหรับตอบคำถามผู้ใช้ด้วยภาษามนุษย์อย่าง Siri จากแอปเปิล หรือ Google Now จากกูเกิล ซึ่งทั้งสองบริการที่ว่ามีจุดด้อยตรงที่ผูกอยู่กับอุปกรณ์ของค่ายตัวเองเท่านั้น ซึ่งเป็นสิ่งที่ Nuance เห็นว่าสามารถทำได้ดีกว่านั้นด้วย Project Wintermute

By mk Founder on Tag: China, Lenovo, Baidu, Voice Recognition, Mobile
China

Lenovo เปิดตัวมือถือรุ่นใหม่ A586 ในประเทศจีน สเปกเครื่องไม่หวือหวาคือหน้าจอ 4.5" 480x854, ซีพียู 1.2GHz ดูอัลคอร์

จุดเด่นของมันกลับเป็นเทคโนโลยี Voice Unlock หรือจดจำเสียงเฉพาะตัวของผู้ใช้เพื่อปลดล็อคเครื่อง โดยเทคโนโลยีนี้พัฒนาโดย Institute for Infocomm Research (I2R) ของประเทศสิงคโปร์ ร่วมกับศูนย์วิจัยของ Baidu แล้ว Lenovo ซื้อสิทธิบัตรมาใช้งานอีกทอดหนึ่ง

I2R เรียกเทคโนโลยีนี้ว่า Speaker Verification และมี Lenovo A586 เป็นผลิตภัณฑ์ในตลาดตัวแรกที่นำไปใช้งาน ตัวโทรศัพท์วางขายในประเทศจีนเมื่อวันที่ 30 พฤศจิกายนที่ผ่านมา

By mk Founder on Tag: TV, Voice Recognition, Google TV
TV

กูเกิลประกาศอัพเดต Google TV โดยมีของใหม่ 3 อย่างดังนี้

By mk Founder on Tag: Google, Search Engine, Voice Recognition, Mobile App, iOS, Google Search
Google

กูเกิลอัพเดตแอพ Google Search บน iOS (iPad, iPhone, iPod touch) โดยปรับปรุงฟีเจอร์การค้นหาด้วยเสียงหรือ voice search แบบเดียวกับฝั่ง Android

หน้าตาของแอพจะคล้ายกับ Google Now บน Android ส่วนวิธีการใช้งานก็คล้ายกันคือกดปุ่มไมโครโฟนบนกล่องค้นหาแล้วพูดได้เลย เราสามารถถามกูเกิลเป็นประโยคภาษาอังกฤษธรรมดา เช่น Play me a trailer of the upcoming James Bond movie ซึ่งเอนจิน Knowledge Graph ของกูเกิลจะเข้าใจและตอบคำถามให้เราเอง

ที่มา - Google Official Blog

By mk Founder on Tag: Google, TV, Voice Recognition, Google TV
Google

กูเกิลเผลอโพสต์วิดีโอแนะนำความสามารถของ Google TV รุ่นที่สามขึ้น YouTube แล้วเอาลงในเวลาต่อมา แต่ก็มีคนตามไปดูกันทันและได้ข้อมูลมาดังนี้

By Blltz Writer on Tag: Voice Recognition, Mobile App, Nuance, Mobile
Voice Recognition

หลายคนคงคุ้นชื่อของ Nuance (อ่านว่านูออนซ์) จากคีย์บอร์ด Swype และแอพสั่งงานด้วยเสียง หรือช่วยพิมพ์ข้อความด้วยเสียงอย่าง Dragon Dictation และ Dragon Search ที่ปัจจุบันรองรับภาษาทั่วโลก รวมถึงภาษาท้องถิ่นไปแล้วมากถึง 52 ภาษา การเปิดตัวในเมืองไทยครั้งนี้ เพื่อแนะนำแอพพลิเคชันของ Nuance อย่าง Dragon Dictation และ Dragon Search ที่รองรับภาษาไทยเป็นที่เรียบร้อยเป็นลำดับที่ 39 จากประเทศที่เปิดตัวทั้งหมด

พูดถึงรายละเอียดของแอพทั้งสองตัว Dragon Dictation คือแอพที่สามารถจดจำเสียงของผู้ใช้ แล้วแปลงเป็นข้อความ เพื่อใช้ส่งข้อความ อีเมล รวมถึงโพสต์ขึ้นโซเชียลเน็ตเวิร์คได้

By mk Founder on Tag: Google, Voice Recognition, Google Glass, Gadget
Google

Wall Street Journal มีโอกาสได้ทดสอบ Google Glass รุ่นทดสอบกับ Sergey Brin ทำให้เรารู้ความสามารถของมันเพิ่มมาอีก 2 อย่าง

  • สั่งงานด้วยเสียงได้ เช่น พูดว่า OK Glass แล้วบนจอภาพจะขึ้นไอคอนกล้องถ่ายภาพมาบอกว่าถ่ายเรียบร้อยแล้ว
  • time-lapse ถ่ายภาพอัตโนมัติตามระยะเวลาที่กำหนด เช่น ทุก 10 วินาที ตัวของ Brin บอกว่าฟีเจอร์นี้ช่วยให้เขาถ่ายภาพลูกๆ ได้โดยไม่ต้องพะวงถึงการหยิบสมาร์ทโฟนออกมาจากกระเป๋าอีกต่อไป

ซอฟต์แวร์ของ Google Glass ยังไม่เสร็จเรียบร้อยดี ยังขาดฟีเจอร์ที่เคยประกาศไว้อย่างระบบนำทาง การโทรศัพท์และส่งข้อความ เป็นต้น

By Blltz Writer on Tag: China, Voice Recognition, Xiaomi
China

ช่วงหลังการเปิดตัว Xiaomi MI-2 สมาร์ทโฟนควอดคอร์ราคาย่อมเยา มีข่าวต่อเนื่องมาพอสมควร จับรวมเขียนเป็นข่าวเดียวกันเลย

ข่าวแรกคือต้นทุนการผลิต MI-2 นั้นจริงๆ อยู่ที่ราว 2,350 หยวน เมื่อเทียบกับราคาขายจริงที่ประกาศไว้ 1,999 หยวน หมายความว่า Xiaomi ยอมขายในราคาขาดทุน โดยคาดว่าต้นทุนการผลิต MI-2 จะลดลงไปในอนาคต (ยิ่งไปยืนยันข่าวที่จะเปิดตลาดเพิ่มได้ในตัว)

Subscribe to Voice Recognition