Tags:
Node Thumbnail

ปัญหาอย่างหนึ่งในวงการ AI คือการหาชุดข้อมูล (dataset) ขนาดใหญ่พอเพื่อใช้เทรน AI ให้สามารถเรียนรู้จากชุดข้อมูลตัวอย่างได้ ในวงการประมวลผลภาพ มีโครงการ ImageNet คอยทำหน้าที่นี้ให้ แต่พอเป็นการประมวลผลวิดีโอกลับไม่มีชุดข้อมูลในลักษณะเดียวกัน

Google Research จึงเปิดโครงการ YouTube-8M ที่มีฐานข้อมูลวิดีโอ YouTube ถึง 8 ล้าน URL, มีความยาววิดีโอรวมกัน 5 แสนชั่วโมง และมาพร้อมกับป้ายคำ label ของวิดีโอที่ครบถ้วนและหลากหลาย เพื่อให้ระบบ AI สามารถประมวลผลวิดีโอแล้วทดสอบการแยกแยะวิดีโอ เทียบกับป้ายคำที่มีอยู่แล้วได้ ในชุดข้อมูลของกูเกิลยังแคปหน้าจอทุก 1 วินาทีด้วยเทคนิค machine learning เพื่อให้ง่ายต่อการนำไปประมวลผลต่อ และช่วยให้ไฟล์รวมมีขนาดเล็กลง (จากวิดีโอทั้งหมดมีขนาดระดับ petabyte ลงมาเหลือ 1.5 TB)

กูเกิลเลือกวิดีโอที่มีสถานะเป็น public และมีคนดูมากกว่า 1,000 ครั้ง นอกจากนี้ยังเน้นความหลากหลายของวิดีโอ เพื่อให้กระจายครอบคลุมหัวข้อต่างๆ ผู้ที่นำไปใช้ต่อในงานเฉพาะด้าน (เช่น ประมวลผลวิดีโอกีฬาเพียงอย่างเดียว) จะได้มีขนาดข้อมูลที่ใหญ่มากพอ

ที่มา - Google Research Blog

No Description

Get latest news from Blognone

Comments

By: MrThursday
ContributorRed HatUbuntuWindows
on 29 September 2016 - 23:52 #943498

อยากได้ image processing algolithm ใหม่ๆละสิ ถึงได้แจกทองคำขนาดนี้ แต่ทำถูกต้องแล้วละครับ สุดยอดจริงๆ Google

By: KuLiKo
ContributoriPhoneWindows PhoneAndroid
on 30 September 2016 - 08:29 #943523
KuLiKo's picture

ใจดีจุง

By: darthvader
Windows PhoneWindows
on 30 September 2016 - 10:14 #943558
darthvader's picture

เจอ PPAP เข้าไปคงงงเลย

By: thailinet on 30 September 2016 - 15:19 #943647 Reply to:943558
thailinet's picture

5 5 5 มีแต่ปากกา แอปเปิล สับปะรด เอาไปไว้ในหมวดผลไม้เลยคลิปนี้

By: indyend
AndroidUbuntu
on 1 October 2016 - 11:38 #943751
indyend's picture

หลงเข้ามาแชนแนลผมหละก็ อย่าลืมคลิ๊กแอดให้ด้วยน้าาาา

By: indyend
AndroidUbuntu
on 1 October 2016 - 11:39 #943752
indyend's picture

ขออภัยครับ ซ้ำเฉยเลย แค่ขอให้ AI กดแอดเอง หะหะหะ