กูเกิลเปิดตัว AutoML มาตั้งแต่งาน Google I/O ปีที่แล้ว และเปิดเป็นบริการ Cloud AutoML ในภายหลัง โดยที่ยังไม่มีใครรู้ถึงศักยภาพของมันนัก แต่ล่าสุดกูเกิลก็ยกตัวอย่างงานของ Kenji Doi นักวิทยาศาสตร์ข้อมูลจากบริษัท NTT ที่สร้างโมเดล deep learning สำหรับแยก "สาขา" ของร้าน Jiro Ramen ในญี่ปุ่นที่มีถึง 41 สาขาทั่วประเทศ
เขาดูดภาพจาก Twitter และ Instagram สร้างชุดข้อมูลชุดแรก 33,130 ภาพ โดย ไม่มีข้อมูลว่าเขาสร้างชุดข้อมูลที่เหลืออย่างไร
Kenji รวบรวมภาพชามราเมนจากสาขาต่างๆ ได้ถึง 48,000 ภาพ และเมื่ออัพโหลดภาพเข้าไปยัง AutoML และใช้เวลาฝึกโมเดลอีก 24 ชั่วโมง ก็ได้โมเดลที่ได้ความแม่นยำถึง 94.5%
อย่างไรก็ดี โมเดลที่ได้จาก AutoML ไม่ใช่โมเดลที่แม่นยำที่สุด เพราะ Kenji เคยสร้างโมเดลจาก ResNet-152 ได้ความแม่นยำ 96% และ ResNeXt-101 ได้ความแม่นยำ 97% มาก่อนแล้ว แต่เขาระบุกับกูเกิลว่า AutoML ช่วยให้องค์กรไม่ต้องเสียเวลาไปกับการปรับแต่งโมเดลมากนัก และองค์กรที่มีทรัพยากรบุคคลจำกัดก็ยังสร้างโมเดลที่ดีได้ โดยโมเดลแรกที่ Kenji สร้างขึ้นมาจาก ResNet-50 ก็มีความแม่นยำเพียง 83% เท่านั้น
ตัว Kenji เป็นวิศวกรของบริษัท NTT ที่สร้างโมเดล deep learning สำหรับการหาความเสียหายบนพื้นถนนมาตั้งแต่ปี 2016 และโมเดล deep learning ที่เขาสร้างมาได้ก็สาธิตการทำงานด้วย บอตทวิตเตอร์ @jirou_deep ที่จะตอบทวีตที่ไปถามว่าราเมนชามนี้เป็นสาขาใด
ความประหลาดของ deep learning คือ Kenji เองก็ไม่ทราบว่าโมเดลแม่นยำได้ขนาดนี้ เพราะมันดูจากอะไร ตอนแรกเขาคิดว่าโมเดลอาจจะดูจากสภาพแวดล้อมนอกชาม เช่นโต๊ะหรือภาพด้านหลัง แต่ทุกสาขาก็ใช้ชามและโต๊ะที่เหมือนกัน ความเป็นไปได้อีกอย่างคือมันอาจจะหารูปแบบการตัดเนื้อและจัดชามของแต่ละสาขาก็เป็นได้
ที่มา - Google Blog
Comments
เมพ!
น่าจะใช้กับการรีวิวอาหาร
เอามาใช้ QC พนักงานแต่ละสาขาก็น่าจะได้
"ถ้าทำแล้วอาหารออกมาหน้าตาที่คอมพิวเตอร์จำไม่ได้ว่าเป็นเมนูร้านเรา...คุณสอบตก"
หรือไม่ก็เอาไว้ตรวจรีวิวของพวกนักชิมอีกที
"รอบนี้รีวิวแบบ SR ใช่มั้ยฮะ นี่คอมพิวเตอร์ดูก็รู้ว่าคุณได้เยอะกว่าปกติ ผักก็สดกว่าทุกที เนื้อก็ชิ้นใหญ่กว่า"
ช่างไฟสมัครเล่น (- -")
คนทุกคนมีความเคยชินถ้าข้อมูลมากพอก็จะพอจำแนกได้ โดยที่่บางทีเจ้าตัวเองยังไม่รู้เลยก็มีว่ามีลักษณะเฉพาะนี้ซ่อนอยู่ในตัว ถ้าจะให้เดาว่าจำแนกอย่างไรจากภาพ อัตราส่วนสีบอกปริมาณอาหารได้ ตำแหน่งการจัดวางอาหาร บอกความเคยชินของเชพ การจัดโต๊ะ เช่น ความเข้มของสีผ้าปูโต๊ะบอกลักษณะเฉพาะของร้านได้ แต่ละร้านใช้ผ้าปูคนละผืน ถึงจะแบบเดียวกัน แต่ก็มีความซีดจางแตกต่างกันแน่
เหมือนเวลาไปกินก๋วยเตียวร้านประจำแล้วรู้สึกว่ารสชาติมันไม่เหมือนเดิม
น่ากลัวไม่รู้ว่ามันแยกยังไงเหมือนไม่รู้การทำงาน ของมัน
ผมความความแม่นอาจจะไม่ใช่คำตอบอาจต้องดู F Score ด้วยหรือเปล่าครับ?
เอาไว้แยกแยะพฤติกรนมคนเข้าใช้บริการของแต่ละสาขาได้เลน
อีกหน่อยคงแยกสาขาของ Jiro Sushi ได้ด้วย :)
ย่อหน้าสุดท้ายนี่มันประลาดจริงๆ - -"
อาจมีวิญญาณซ่อนอยู่ก็เป็นได้
จริงๆ มันก็ไม่ได้ประหลาดขนาดนั้นล่ะครับ มันประหลาดสำหรับคนนอกสายสักหน่อย
deep learning เอาเข้าจริงมันก็ระบบหา pattern ของข้อมูล (ในรูปแบบที่ซับซ้อนมากๆ) อยู่แล้ว บางครั้งเราก็ไม่แน่ใจว่าหา pattern อย่างไรจึงได้ผลดีที่สุดแต่ระบบมันก็ทำออกมาให้เอง
เราไปนั่งผ่าตัดโมเดลออกมาดูได้ว่าจริงๆ แล้วมันดูที่อะไร
lewcpe.com, @wasonliw