Google AI โชว์ทักษะสืบจากภาพ ถึงไม่ติดแท็กสถานที่ก็รู้ได้ว่าถ่ายจากที่ไหน

on 25 February 2016 - 15:57 Tag: Google, Image Processing, Geolocation, Deep Learning

Google

Google พัฒนา PlaNet ปัญญาประดิษฐ์ที่สามารถเดาได้ว่าภาพถ่ายที่มันเห็นถูกถ่ายจากที่ไหนบนโลก โดยอาศัยข้อมูลจากสิ่งที่ปรากฏในภาพเท่านั้น ไม่ต้องใช้ข้อมูลแท็กสถานที่ (geotag) ของภาพถ่าย

Tobias Weyand ผู้เชี่ยวชาญด้านคอมพิวเตอร์วิทัศน์ของ Google คือผู้นำทีมในการพัฒนา PlaNet พวกเขาสอนให้มันรู้จักภาพถ่ายจากสารพัดสถานที่กระจายกันรอบโลกถึง 126 ล้านภาพ ซึ่งผลลัพธ์ที่ได้ก็ทำให้ PlaNet สามารถระบุสถานที่ที่แต่ละภาพถูกถ่ายมาได้แม่นยำกว่าคนมาก

สำหรับการสอน PlaNet นั้น ทีมพัฒนาทำการแบ่งพื้นที่แผ่นดินของโลกออกเป็น "ช่องตาราง" ยิบย่อยมากกว่า 26,000 ช่อง ซึ่งมีขนาดเล็กใหญ่ต่างกัน (พื้นที่ไหนคนนิยมถ่ายภาพก็ช่องเล็กหน่อย พื้นที่ห่างไกลคนถ่ายรูปน้อยก็ช่องใหญ่ขึ้น) โดยเว้นแต่เขตขั้วโลกที่มีคนไปถ่ายภาพน้อยมาก จากนั้นก็ใช้ภาพถ่าย 126 ล้านภาพเพื่อสอนให้ PlaNet รู้ว่าแต่ละภาพถูกถ่ายมาจาก "ช่องตาราง" ช่องไหน ก่อนเข้าสู่กระบวนการทดสอบความสามารถต่อไป

ทีมของ Weyand ทำการทดสอบ PlaNet ด้วยการให้มันระบุภาพจาก Flickr จำนวน 2.3 ล้านภาพ โดยภาพเหล่านั้นมีการติดแท็กสถานที่ถ่ายภาพไว้แล้ว ทีมของ Weyand พบว่า PlanNet สามารถระบุสถานที่ถ่ายภาพถูกต้องระดับที่ว่าระบุชื่อถนนได้ราว 3.6% แต่หากให้ PlaNet ระบุชื่อเมืองที่แต่ละภาพถูกถ่ายมาจะสามารถตอบได้ถูกต้อง 10.1% หากนับเป็นคำตอบระดับประเทศว่าภาพนี้ถ่ายจากประเทศอะไร PlaNet สามารถตอบได้ถูก 28.4% และถ้าต้องการคำตอบเป็นทวีปแล้ว PlaNet สามารถระบุทวีปที่มาของภาพได้ถูกต้อง 48%

ทีมพัฒนายังเอา PlaNet ไปทดสอบด้วยการแข่งขันเล่นเกมบนเว็บ GeoGuesser แข่งกับคนที่รอบรู้เรื่องการเดินทางทั่วโลกเป็นอย่างดีจำนวน 10 คน เกมดังกล่าวจะแสดงภาพแบบ street view ขึ้นมาบนหน้าจอ แล้วให้ผู้เล่นปักหมุดบนแผนที่โลกเพื่อทายว่าภาพเหล่านั้นเป็นมุมมองจากส่วนไหนของโลก คะแนนของผู้เล่นจะมาจากการปักหมุดบนแผนที่โลกว่าอยู่ห่างจากตำแหน่งจริงของภาพถ่าย street view นั้นกี่กิโลเมตร ผลการแข่งขันคือ PlaNet สามารถเอาชนะไปได้ 28 ครั้งจากการแข่งขัน 50 รอบ ซึ่งค่าเฉลี่ยระยะทางที่ PlaNet ตอบผิดคลาดเคลื่อนไปราว 1,131.7 กิโลเมตร ในขณะผู้เล่นที่เป็นคนมีค่าเฉลี่ยระยะทางที่ตอบผิดคลาดเคลื่อนไป 2,320.75 กิโลเมตร

ไม่เพียงแต่สิ่งปลูกสร้างหรือสถานที่โด่งดังอย่าง หอไอเฟล, พระราชวังต้องห้าม หรือเทพีเสรีภาพเท่านั้น ที่ช่วยให้ PlaNet สามารถระบุสถานที่ถ่ายภาพได้ถูกต้องแม่นยำ แต่ PlaNet เรียนรู้ที่จะจำแนกภาพถ่ายจากรูปแบบของสถาปัตยกรรมของสิ่งปลูกสร้าง, ลักษณะเด่นของสภาพภูมิประเทศ กระทั่งลักษณะเฉพาะของสัตว์และพืชพรรณต่างๆ ซึ่งมีความแตกต่างกันไปในแต่ละท้องถิ่น หรือหน้าตาของอาหาร สิ่งเหล่านี้ที่ปรากฏอยู่ในภาพถ่ายล้วนแล้วแต่มีส่วนช่วยให้ PlaNet ฉลาดขึ้นทั้งนั้น

ทีมของ Weyand กำลังปรับปรุง PlaNet ให้ฉลาดยิ่งขึ้นไปอีก ด้วยการสอนให้มันรู้จักวิธีการทายสถานที่ถ่ายภาพได้แม่นยำขึ้น แม้ว่าภาพนั้นจะถูกถ่ายในร่ม หรือเป็นภาพของวัตถุสิ่งของหรือสัตว์เลี้ยงทั่วไป (ซึ่งสามารถพบเห็นที่ไหนก็ได้ในนานาประเทศคล้ายคลึงกัน) โดย PlaNet จะเรียนรู้ว่าภาพดังกล่าวเป็นส่วนหนึ่งของอัลบั้มไหน จากนั้นก็จะศึกษาจากภาพถ่ายอื่นในอัลบั้มเดียวกันว่าสามารถระบุสถานที่ถ่ายภาพได้หรือไม่ ซึ่งจะช่วยให้ PlaNet พอจะเดาสถานที่ถ่ายภาพทุกภาพในอัลบั้มนั้นได้ว่ามาจากที่เดียวกันนั่นเอง

หากทั้งหมดนี้ยังไม่ "ว้าว!" พอ ทีมพัฒนา PlaNet ระบุว่าสมองกลของพวกเขานั้นเล็กกว่าผลงานพัฒนาอื่นๆ หลายรายมาก ด้วยขนาดแค่ 377MB นั่นทำให้การติดตั้ง PlaNet ลงในอุปกรณ์พกพานั้นไม่ใช่เรื่องยากเลย

ใครสนใจรายละเอียดเพิ่มเติมของงานพัฒนา PlaNet นี้ก็สามารถเข้าไปดูหรือดาวน์โหลดเอกสารได้ที่นี่

ที่มา - MIT Technology Review via Gizmodo

Hiring! บริษัทที่น่าสนใจ

Carmen Software

Hotel Financial Solutions

Next Innovation (Thailand) Co., Ltd.

We are web design with consulting & engineering services driven the future stronger and flexibility.

KKP Dime

KKP Dime บริษัทในเครือเกียรตินาคินภัทร

Kiatnakin Phatra Financial Group

Financial Service

Fastwork Technologies

Fastwork.co เว็บไซต์ที่รวบรวม ฟรีแลนซ์ มืออาชีพจากหลากหลายสายงานไว้ในที่เดียวกัน

Thoughtworks Thailand

Thoughtworks เป็นบริษัทที่ปรึกษาด้านเทคโนโยลีระดับโลกที่คว้า Great Place to Work 3 ปีซ้อน

Iron Software

Iron Software is an American company providing a suite of .NET libraries by engineer for engineers.

CLEVERSE

Cleverse is a Venture Builder. Our team builds several tech companies.

Nipa Cloud

#1 OpenStack cloud provider in Thailand with our own data center and software platform.

Bangmod Enterprise

The leader in Cloud Server and Hosting in Thailand.

CIMB THAI Bank

MOVING FORWARD WITH YOU - CIMB is the leading ASEAN Bank

Bangkok Bank

Bangkok Bank is one of Southeast Asia's largest regional banks, a market leader in business banking

MuvMi (Urban Mobility Tech Co.,Ltd.)

Shape the future of urban mobility towards affordable, clean, and safe solutions

T.N. Digital Solution Co., Ltd.

TNDS has been involving in every first move of banking’s major digital transformation.

KBTG - KASIKORN Business-Technology Group

KBTG - "The Technology Company for Digital Business Innovation"

Siam Commercial Bank Public Company Limited

"Let's start a brighter career future together"

Icon Framework co.,Ltd.

Global Standard Platform for Real Estate แพลตฟอร์มสำหรับธุรกิจอสังหาริมทรัพย์ครบวงจร มาตรฐานระดับโลก

REFINITIV

The Financial and Risk business of Thomson Reuters is now Refinitiv

H LAB

Re-engineering healthcare systems through intelligent platforms and system design.

The Gang Technology Co., Ltd.

We're a Digital Agency that helps our customers transform their business into digital with ease.

LTMH

LTMH มุ่งเน้นการพัฒนาผลิตภัณฑ์ที่สามารถช่วยพันธมิตรของเราให้บรรลุเป้าหมาย

Seven Peaks

We Drive Digital Transformation

Wisesight (Thailand) Co., Ltd.

The Best Choice For Handling Social Media · High Expertise in Social Data · Most Advanced and Secure

MOLOG Tech

We are Modern Logistic Platform, Specialize in WMS, OMS and TMS.

Data Wow Co.,Ltd

We enable our clients to realize increased productivity by solving their most complex issues by Data

LINE Company Thailand

LINE, the world's hottest mobile messaging platform, offers free text and voice messaging + Call

LINE MAN Wongnai

Join our journey to becoming No.1 food platform in Thailand

สงสัย จังว่า

tuttap Thu, 25/02/2016 - 16:10

สงสัย จังว่า ระบบนี้จะใช้ในการตรวจสอบ แบบออฟไลน์ไหม

ต้องใช้พื้นที่เก็บข้อมูลมหาศา

Polwath Thu, 25/02/2016 - 16:14

ต้องใช้พื้นที่เก็บข้อมูลมหาศาลเลยครับ ถึงจะทำแบบ Offline ได้

อาจทำได้รึป่าว,

tontpong Sun, 28/02/2016 - 16:50

อาจทำได้รึป่าว, ถ้าแค่ตอบว่าอยุ่ไหน ?

"หากทั้งหมดนี้ยังไม่ "ว้าว!" พอ ทีมพัฒนา PlaNet ระบุว่าสมองกลของพวกเขานั้นเล็กกว่าผลงานพัฒนาอื่นๆ หลายรายมาก ด้วยขนาดแค่ 377MB นั่นทำให้การติดตั้ง PlaNet ลงในอุปกรณ์พกพานั้นไม่ใช่เรื่องยากเลย"

โดยอาศัยข้อมูลจากสิ่งที่ปรากฎ

panurat2000 Thu, 25/02/2016 - 16:24

โดยอาศัยข้อมูลจากสิ่งที่ปรากฎ

ปรากฎ => ปรากฏ

Tobias Weyand ผู้เชี่ยวชาญด้านสื่อทัศนะคอมพิวเตอร์ของ Google

สื่อทัศนะคอมพิวเตอร์ => คอมพิวเตอร์วิทัศน์

ok ครับ

ตะโร่งโต้ง Thu, 25/02/2016 - 16:37

ok ครับ ผมเปลี่ยนตามที่แนะนำแหละ

แต่ถามหน่อยครับว่าไปได้คำว่า "คอมพิวเตอร์วิทัศน์" มาจากไหนหรอ? ผมนี่ทึ่งจริงๆ

ปกติจะเรียก Computer Vision

Aixasz Thu, 25/02/2016 - 17:00

ปกติจะเรียก Computer Vision กันนะครับ

ต่อไปคงเห็นอยู่ใน Google

Psykocinezys Thu, 25/02/2016 - 17:05

ต่อไปคงเห็นอยู่ใน Google Photo

ต่อไปให้มันดูวิดีโอแล้วเลือกค

maoIndie Thu, 25/02/2016 - 17:20

ต่อไปให้มันดูวิดีโอแล้วเลือกคลิปที่เราชอบมาให้ด้วยได้ป่ะ

นักสืบPantipทำได้ก่อนมานานแล้

MaxxIE Thu, 25/02/2016 - 18:12

นักสืบPantipทำได้ก่อนมานานแล้วครับ

http://pantip.com/topic/32136389