Tags:
Node Thumbnail

กูเกิลเผยข้อมูลว่า เข้าไปช่วย NASA แยกภาพจากกล้องโทรทรรศน์บนยานอวกาศ Kepler ที่มีภารกิจในการค้นหา "ดาวเคราะห์" ลักษณะเดียวกับโลกในระบบสุริยะจักรวาลอื่น (exoplanet)

ยาน Kepler ถูกส่งออกไปยังอวกาศตั้งแต่ปี 2009 และถ่ายภาพทางช้างเผือกส่งกลับมาทุก 30 นาที มีภาพถ่ายดาวฤกษ์กว่า 200,000 ดวงที่ต้องมาวิเคราะห์ ถือเป็นข้อมูลมหาศาลที่ NASA ต้องทุ่มทรัพยากรมาประมวลผล

ปัญหานี้แก้ได้ด้วย machine learning และทีม AI ของกูเกิลก็เข้าไปช่วยสร้างโมเดล TensorFlow เพื่อแยกแยะดาวเคราะห์ออกจากวัตถุอื่นๆ ด้วยเทคนิค pattern recognition ผลการทดสอบโมเดลของกูเกิลกับข้อมูลที่ตรวจสอบแล้ว พบว่ามีความแม่นยำ 96%

Tags:
Node Thumbnail

ไมโครซอฟท์มีระบบปฏิบัติการ Windows 10 IoT Core สำหรับอุปกรณ์ฝังตัวหลากหลายประเภท ล่าสุดไมโครซอฟท์สาธิตการใช้งานของ Windows 10 IoT Core ที่น่าสนใจ นั่นคือใช้ "แยกแยะใบหน้าแมว"

โครงการนี้เป็นตัวอย่างการพัฒนาอุปกรณ์ฝังตัว โดยไมโครซอฟท์นำบอร์ด MinnowBoard MAX ร่วมกับกล้องเว็บแคมและเซ็นเซอร์อีกจำนวนหนึ่ง มาทำเป็นประตูกั้นแมว ที่มีฟีเจอร์อนุญาตให้แมวที่รู้จักเท่านั้นผ่านเข้ามาในประตูได้

ฝั่งของซอฟต์แวร์ใช้ OpenCV ประมวลผลภาพจากกล้องเว็บแคม เทียบกับภาพแมวในระบบว่าตรงกันหรือไม่ ถ้าหากเป็นแมวที่ถูกต้อง ประตูก็จะเปิดให้แมวเข้าได้นั่นเอง

Tags:
Node Thumbnail

Snapchat มีฟีเจอร์ geofilters แสดงฟิลเตอร์อิงตามโลเคชั่น และมีฟีเจอร์ใหม่ระบบสามารถเรียนรู้วัตถุที่ถ่ายว่าเป็นวัตถุชนิดไหน เช่น สัตว์ อาหาร เป็นต้น โดยระบบจะแสดงฟิลเตอร์ตามวัตถุที่ถ่าย เช่น หากถ่ายคลิปสัตว์เลี้ยงก็จะแสดงฟิลเตอร์รอยเท้าน้องหมา ถ่ายอาหารก็จะแสดงฟิลเตอร์เกี่ยวกับการไดเอท เป็นต้น

ฟีเจอร์ใหม่นี้เป็นโอกาสให้แบรนด์เข้ามาทำโฆษณาต่อได้ เช่น อาจขึ้นโลโก้แบรนด์ขายผลิตภัณฑ์สัตว์เลี้ยง หรือโลโก้แบรนด์อาหาร เป็นโอกาสสร้างรายได้โฆษณาได้อีกช่องทางสำหรับบริษัท Snap

รอดูว่าโซเชียล "เจ้าอื่น" จะมีฟีเจอร์คล้ายๆ กันนี้เมื่อไร

Tags:
Node Thumbnail

ข้อดีของห้องเรียนขนาดใหญ่คือนักเรียนแอบนั่งหลับหรือไม่สนใจต่อบทเรียนได้โดยอาจารย์ไม่สังเกตเห็น แต่อาจารย์ Wei Xiaoyong แห่งมหาวิทยาลัยเสฉวนไม่ยอมปล่อยให้นักเรียนหลุดลอดสายตาด้วยการสร้างระบบตรวจจับใบหน้ามาจับความสนใจของนักเรียนในห้อง

อาจารย์ Wei เขาสร้างระบบจดจำใบหน้ามาใช้งานในห้องเรียนเมื่อห้าปีก่อน เพื่อทดแทนการเช็คชื่อเข้าเรียนของนักเรียน จนล่าสุดพัฒนามาเป็นการจับความรู้สึกของผู้เรียนว่ามีความสุขดีหรือเบื่อหน่ายกันแล้ว

เขาระบุว่าข้อมูลเหล่านี้สามารถนำมาประเมินการสอนได้ว่าดึงความสนใจนักเรียนได้ดีแค่ไหน

Tags:
Node Thumbnail

เราคงได้เห็นบริษัทหลายแห่งพัฒนา AI สำหรับรู้จำองค์ประกอบต่างๆ ในรูปภาพกันบ้าง ในวันนี้ Mark Zuckerberg ซีีอีโอ Facebook ประกาศว่าจะใช้เทคโนโลยีนี้เพื่อเสริมสร้างประสบการณ์การใช้งานให้กับผู้ใช้ Facebook ที่มีความบกพร่องทางการมองเห็น

แนวคิดของการใช้ระบบรู้จำองค์ประกอบในรูปภาพ คือการที่ระบบสามารถแยกแยะองค์ประกอบต่างๆ ในภาพได้ ก่อนนำมาสังเคราะห์เป็น "ข้อความบรรยายภาพ" (Alt text) เพื่อส่งให้โปรแกรมจำพวก screen reader อ่านเป็นเสียงให้ผู้ที่บกพร่องทางการมองเห็นได้ยิน และทำความเข้าใจองค์ประกอบภาพต่อไป

ดูวิดีโอเปิดตัวได้ท้ายข่าว

Node Thumbnail

ถ้ายังจำกันได้ ปีที่แล้วไมโครซอฟท์มีเว็บแอพวิเคราะห์ข้อมูลภาพให้เล่นกันสนุกๆ หลายตัว เช่น How-Old.net ทายอายุ, TwinOrNot.net เทียบคนหน้าเหมือน

เว็บแอพเหล่านี้อยู่ภายใต้ Project Oxford โครงการพัฒนา API ด้านการแยกแยะภาพและเสียงพูด ซึ่งวันนี้ได้ชื่อเรียกอย่างเป็นทางการว่า Microsoft Cognitive Services

Tags:
Node Thumbnail

ปลายปีที่แล้ว กูเกิลเปิดให้นักพัฒนาภายนอกบริษัทเข้าถึงฟีเจอร์การแยกแยะรูปภาพแบบเดียวกับใน Google Photos โดยใช้ชื่อว่า Cloud Vision API แต่ยังจำกัดการทดสอบเฉพาะกลุ่มอยู่

วันนี้กูเกิลเปิดให้ใครก็ได้ที่สนใจ สามารถเขียนโปรแกรมส่งภาพผ่าน API เพื่อให้ระบบปัญญาประดิษฐ์แยกแยะภาพได้แล้ว รวมถึงประกาศราคาค่าใช้งาน โดยคนที่ใช้ต่ำกว่า 1,000 ภาพต่อเดือนสามารถใช้ได้ฟรี ถ้าใช้มากกว่านั้นเริ่มต้นที่ 2.5 ดอลลาร์ต่อ 1,000 ภาพต่อเดือน (ราคาขึ้นกับว่าแยกแยะหาข้อมูลอะไรในภาพ)

Tags:
Node Thumbnail

กูเกิลเปิดให้นักพัฒนาภายนอกบริษัทเข้าถึงฟีเจอร์การแยกแยะรูปภาพแบบเดียวกับใน Google Photos โดยใช้ชื่อว่า Cloud Vision API

Cloud Vision API เป็นบริการตัวใหม่ใน Google Cloud Platform ที่เรียกใช้งาน TensorFlow ไลบรารีสำหรับงาน machine learning อีกต่อหนึ่ง นักพัฒนาสามารถส่งภาพให้ Cloud Vision แยกแยะรูปภาพในแง่มุมต่างๆ ได้ดังนี้

Tags:
Node Thumbnail

Omron เปิดตัวโครงการ Sensing Egg ชุดกล้องวงจรปิดที่มี API ระดับสูงให้นักพัฒนาภายนอกสามารถพัฒนาแอพพลิเคชั่นใหม่ๆ ลงไปได้

API ที่มีในกล้องชุดนี้ได้แก่ ตรวจจับใบหน้า, จดจำใบหน้า, คาดเดาเพศ, คาดเดาอายุ, วัดอารมณ์จากใบหน้า, ทิศทางการหัน, ทิศทางสายตา, ตำแหน่งของตา, ตรวจจับมือ, ตรวจจับร่างกายคนในภาพ, ตรวจจับสัตว์เลี้ยงและจดจำใบหน้าสัตว์เลี้ยง

ตัวกล้องมาพร้อมกับ SDK ให้นักพัฒนาภายนอกช่วยกันคิดว่าจะใช้ความสามารถเหล่านี้ทำอะไรได้บ้าง โดยทาง Omron พัฒนาแอพพลิเคชั่นสองตัวมาพร้อมกับกล้อง ได้แก่

Node Thumbnail

กูเกิลและไมโครซอฟท์ออกมาแสดงระบบสร้างคำบรรยายรูปอัตโนมัติในงาน Microsoft COCO (Microsoft CommonObjects in Context (COCO) Captioning Challenge) งานนี้เป็นหนึ่งในงานสำหรับผู้วิจัยที่ทำงานในสายงานระบบรับรู้หรือแยกแยะรูปภาพ