เฟซบุ๊กประกาศความสำเร็จในการสร้างปัญญาประดิษฐ์เพื่อจัดหมวดหมู่ภาพ (image labelling) และทดสอบความแม่นยำด้วยชุดข้อมูล ImageNet ได้ความแม่นยำสูงสุด 85.4% สูงกว่าโมเดลที่ทำคะแนนดีที่สุดอยู่ 2%
ความพิเศษของโมเดลใหม่นี้คือการใช้ชุดข้อมูลขนาดใหญ่มหึมาสำหรับการฝึกโมเดล เฟซบุ๊กอาศัยภาพจากอินสตาแกรมจำนวน 3.5 พันล้านภาพ ที่มีแฮชแท็กในกลุ่มที่เฟซบุ๊กสนใจ จำนวน 17,000 แฮชแท็ก
การใช้ข้อมูลจากภาพที่โพสสาธารณะเช่นนี้ไม่สามารถนำมาใช้ได้ตรงๆ โดยเฟซบุ๊กต้องรวบแฮชแท็กที่เป็นคำใกล้เคียงกันเข้าด้วยกัน จัดความสมดุลแฮชแท็กบางคำที่มีการแท็กสูงมาก ทำให้เหลือภาพที่ใช้งานได้จริงพันล้านภาพ และแฮชแท็ก 1,500 แท็ก
โมเดลที่ใช้งานคือ ResNeXt-101 ที่ตัวโมเดลมีขนาดใหญ่และด้วยปริมาณข้อมูลมหาศาลเช่นนี้ต้องอาศัยชิปกราฟิกถึง 336 ชุด และเวลาฝึกโมเดลหลายสัปดาห์
ที่มา - Facebook Code
Comments
"ที่ตัวโมเดลมีขนาดใหญ่อและด้วยปริมาณข้อมูลมหา"
ขนาดใหญ่อและ --> อ เกิน