Tags:
Node Thumbnail

การฝึกระบบปัญญาประดิษฐ์โดยเฉพาะในกลุ่ม deep learning ต้องการข้อมูลที่มีความแม่นยำสูงจำนวนมากแต่ชุดข้อมูลที่ใช้ในวงการวิจัยมักมีปริมาณไม่มากนัก ตอนนี้กูเกิลก็เปิดชุดข้อมูลของตัวเองขนาดใหญ่ถึง 5 ล้านรายการ ต่อจากปีที่แล้วที่กูเกิลเปิดชุดข้อมูลภาพ 9 ล้านรายการ

ชุดข้อมูล YouTube-BoundingBoxes (YT-BB) เป็นข้อมูลจากวิดีโอที่มีวัตถุในภาพ 23 ชนิด เช่น แมว, หมา, วัว, รถไฟ, เครื่องบิน, รถ, ม้าลาย, ม้า, หมี, ต้นไม้กระถาง รวมทั้งหมด 5 ล้านรายการ โดยแต่ละภาพจะถูกล้อมกรอบสี่เหลี่ยมตำแหน่งของวัตถุเหล่านั้นเอาไว้ (ตามชื่อ bounding boxes)

ชุดข้อมูลนี้มีขนาดใหญ่กว่าชุดข้อมูลสำหรับทดสอบการหาวัตถุ (object detection) ชุดอื่นๆ มาก ข้อมูลเช่น ImageNet มีขนาดข้อมูล 1.03 ล้านรายการ, ชุดข้อมูล COCO มีขนาด 2.53 ล้านรายการ, หรือ PASCAL VOC ที่นิยมในงานวิจัยมีเพียง 27,400 รายการเท่านั้น

ภาพทั้งหมดนำมาจากวิดีโอ 210,000 รายการ และถูกล้อมกรอบอย่างพอดีกับวัตถุโดยมีความแม่นยำไม่ต่ำกว่า 95%

ดาวน์โหลดได้ฟรีวันนี้ โดยสัญญาอนุญาตเป็น Creative Commons (BY) 4.0

ที่มา - Google Research

alt="upic.me"

Get latest news from Blognone

Comments

By: sapjunior
AndroidUbuntuWindows
on 8 February 2017 - 00:11 #968945

ชุดข้อมูล CUCO น่าจะเป็น COCO รึเปล่าครับ? http://mscoco.org/

By: sushi4040 on 8 February 2017 - 01:45 #968952
sushi4040's picture

AI Robot Starter kit