DeepMind เผยผลงานวิจัยล่าสุด พัฒนา AI ให้เล่นเกม Quake III Arena โหมดชิงธง (Capture the Flag) โดยใช้ AI หลายตัวเล่นร่วมกันเป็นทีมได้เหนือกว่ามนุษย์
Quake III Arena เป็นเกม FPS คลาสสิคของบริษัท id Software ที่ออกขายในปี 1999 และเปิดซอร์สในปี 2005 ทำให้ทีม DeepMind สามารถนำเกมมาปรับแต่งให้เหมาะกับการเรียนรู้ของ AI
บ็อตของ DeepMind ชื่อว่า FTW (For The Win) อ่านภาพบนจอแบบเดียวกับมนุษย์ (ไม่ได้รับข้อมูลพิเศษเหมือนกับบ็อตปกติของเกม) ทีมงานเลือกใช้โหมด Capture the Flag เพราะมีกฎเรียบง่าย (ชิงธงฝ่ายตรงข้ามแล้ววิ่งกลับฐาน แต่ต้องรักษาธงของตัวเองไว้ด้วย) แต่มีไดนามิกของเกมสูง และต้องใช้การเล่นร่วมกันเป็นทีมอย่างมาก เหมาะแก่การใช้บ็อตหลายตัว (multi-agent) เล่นร่วมกัน

เกมเวอร์ชันของ DeepMind ปรับแต่งให้แผนที่ในเกมเกิดขึ้นแบบสุ่ม (procedurally generated environments) เพื่อให้บ็อตที่เป็นกลาง ไม่อิงกับแผนที่ใดๆ บ็อตทุกตัวไม่ถูกสอนกฎของเกม Capture the Flag มาก่อน และให้เรียนรู้ด้วยตัวเองแบบ unsupervised learning
ทางทีมงานยังสร้างบ็อตขึ้นมาจำนวนมาก และให้เล่นร่วมกับมนุษย์ 40 คน (ทั้งจับคู่กันและแข่งขันกัน) ผลลัพธ์ออกมาเป็นว่า FTW มีความสามารถสูงกว่ามนุษย์เมื่อเทรนไปจนถึงระดับหนึ่ง บ็อตยังพัฒนากลยุทธ์ขึ้นมาแบบเดียวกับมนุษย์ เช่น รักษาฐานของตัวเอง, คอยดักรอที่ฐานของคู่แข่ง, วิ่งติดตามเพื่อนร่วมทีมไปด้วยกัน

ที่มา - DeepMind
on
สงสัยว่าตอนเทรน
Holy Wed, 04/07/2018 - 22:09
สงสัยว่าตอนเทรน รวมถึงตอนแข่งกับมนุษย์ AI 1 ตัวบังคับตัวเล่นทั้งหมดพร้อมกัน หรือแยกกันบังคับ
คือมนุษย์ที่เล่นเป็นทีมเอง ก็ยังต้องอาศัยการสื่อสารด้วยคำพูดเพื่อคิวจังหวะ หรือต่อให้เทพๆ ก็ต้องดูเพื่อนขยับว่าตอนนี้จะบุกนะ แล้วค่อยไปตาม แต่ถ้าเป็น AI ตัวเดียวสั่งขยับพร้อมกันหมด แม้จะเห็นภาพแค่บนจอก็เถอะ ยังไงมนุษย์ก็สู้ไม่ได้นะ
แยกกันครับ
mk Wed, 04/07/2018 - 22:32
In reply to สงสัยว่าตอนเทรน by Holy
แยกกันครับ ในต้นทางมีรายละเอียดตามไปดูได้ครับ
อยากเห็นการเล่นบน Map ของ
Perl Wed, 04/07/2018 - 22:17
อยากเห็นการเล่นบน Map ของ Quake 3 Areana
วงการนี้ชักมันขึ้นเรื่อยๆ
puriwat Wed, 04/07/2018 - 23:19
วงการนี้ชักมันขึ้นเรื่อยๆ อีกสัก 2 ปีข้างหน้าจะมันขนาดไหนเนี่ย
น่ากลัวขึ้นทุกวัน
Hoo Thu, 05/07/2018 - 00:40
น่ากลัวขึ้นทุกวัน
เอาหุ่นยนต์ Boston Dynamics มาติดปืนเป็นฝูง แล้วใส่ AI FTW ให้มันนี่ โหดแน่ๆ
เก่งแล้วก็มาสอนคนบ้าง
Sxton Thu, 05/07/2018 - 01:29
เก่งแล้วก็มาสอนคนบ้าง
อัลกอริทึมประเภทนี้ใช้ทำระบบซ
akira Thu, 05/07/2018 - 01:34
อัลกอริทึมประเภทนี้ใช้ทำระบบซิมมูเลเตอร์ทางการทหารได้สบาย ทำให้ทหารได้ฝึกวิธีการในพื้้นที่ตึกแบบไม่จำกัดรูปแบบได้เลย โดยให้ AI จำลองเป็นศัตรู
ถ้าเอา AI ตัวนี้ + AR Core บนสภาพแวดล้อมจริง ทำเป็นเกมส์ 1 Person แบบเล่นเป็นทีมได้คงมันส์พิลึก หรือเล่นผ่าน Google Cardboard ก็ได้
AI ศัตรู
loptar Thu, 05/07/2018 - 09:37
In reply to อัลกอริทึมประเภทนี้ใช้ทำระบบซ by akira
AI ศัตรู ถ้าหลุดไปถึงสายลับฝ่ายตรงข้านได้นี่ เป็นเรื่องแน่
ถ้ากลับ ตัวอักษร จาก FTW
Auftrag Thu, 05/07/2018 - 09:10
ถ้ากลับ ตัวอักษร จาก FTW มันก็จะกลายเป็น WTF แน่ๆเลย ฮ่าๆ
คิดไปว่าถ้าเป็นหุ่นยนต์ติดอาว
zipper Thu, 05/07/2018 - 11:02
คิดไปว่าถ้าเป็นหุ่นยนต์ติดอาวุธแล้วมี AI อย่างนี้มันจะทำได้ขนาดไหนนะ มนุษย์เราจะสู้ได้หรือเปล่าทั้งในแง่กำลังและแผนการณ์ ภาพที่ติดอยู่ในหัวจากในหนังคือหุ่นยนต์แข็งแรงกว่ามนุษย์และก็อาจจะฉลาดกว่ามนุษย์หน่อยๆ แต่ดูจากการทดลองอันนี้แล้ว ทั้งคิดแผนการณ์เองได้ ทั้งพัฒนาไปได้เรื่อยๆ จนเหนือกว่ามนุษย์มาก ดูแล้วขีดความสามารถมันสูงจริงๆ
ไม่หรอกครับมันยังมีจุดอ่อน
akira Thu, 05/07/2018 - 11:19
In reply to คิดไปว่าถ้าเป็นหุ่นยนต์ติดอาว by zipper
ไม่หรอกครับมันยังมีจุดอ่อน เดียวกับมนุษย์ คือ ต้องเรียนรู้ก่อน ถ้าเราแสดงพฤติกรรมที่ ไม่มีรูปแบบ มันไม่เคยพบมาก่อน ก็จัดการได้ เพียงแต่พัฒนาการของมันที่ต่างจาก AI ตัวอื่น ตอนนี้มันเริ่มมี AI Network ของตัวเอง เมื่อตัวนึงได้เรียนรู้ ตัวอื่นก็จะเรียนรู้ไปด้วย ถ้าเป็นหุ่นยนต์ถ้าเรากำจัดมันก่อนที่มันจะเรียนรู้ก็พอไหว แต่ถ้าเป็นเกมส์ หรือ Simulator คงยาก เพราะถึงจะต่าง Object แต่แม่ข่าย AI มันก็ตัวเดียวกัน
ในโลกความเป็นจริง
Holy Thu, 05/07/2018 - 13:19
In reply to คิดไปว่าถ้าเป็นหุ่นยนต์ติดอาว by zipper
ในโลกความเป็นจริง ทางเลือกมันเยอะกว่ามากครับ ในเกมหุ่นยนต์ตัวนึงโดนคนไล่ยิง สามารถไปหลบหลังกำแพงที่ไม่มีวันพัง พยายามยืนในจุดที่ Splash Damage จากขอบกำแพงมาไม่ถึง เรียกเพื่อนให้มาช่วย เท่านั้นก็เพียงพอ
แต่ในความเป็นจริง ถึงหลบหลังกำแพงก็อาจโดนอาวุธหนักยิงจนทะลุกำแพงได้ หรือค่อยๆ กลิ้งระเบิดมือเข้าไป หรือปีนไปยิงจากบนเพดาน ฯลฯ ซึ่งการจะคาดการณ์ได้คือต้องผ่านสมรภูมิจริงอีกเยอะมากเพื่อเก็บข้อมูลครับ
ไม่ก็ให้ AI ไปเล่น Arma.....
และให้เรียนรู้ด้วยตัวเองแบบ
MilestoneKo Thu, 05/07/2018 - 16:41
ตามที่ผมเข้าใจ เหมือนบ็อตเรียนรู้แบบ reinforcement learning มากกว่านะครับ แล้วใช้ unsupervised learning ในการสำรวจพฤติกรรมของบ็อตมากกว่า