OpenAI

หลังจากที่ฝั่ง Deepmind ได้ออกมาประกาศการร่วมมือกับ Blizzard เพื่อพัฒนา AI ของเกม StarCraft ล่าสุด บอทจาก OpenAI โปรเจ็คท์ AI ที่ไม่แสวงหาผลกำไรของ Elon Musk จาก Tesla และ Sam Altman จาก Y Combinator ได้เอาชนะผู้เล่นมืออาชีพในการแข่งขันเกม Dota 2 แบบ 1 ต่อ 1 กลางงาน The International 2017

การแข่งขันดังกล่าวเป็นการพบกันระหว่าง OpenAI กับ Danylo "Dendi" Ishutin ผู้เล่นมืออาชีพจากทีม Natus Vincere โดยแข่งขันกับแบบ 1 ต่อ 1 ด้วยฮีโร่ Shadow Fiend ซึ่งฝ่าย OpenAI เอาชนะไปได้ในเกมที่ 1 ฝ่ายมนุษย์ขอยอมแพ้ในเกมที่ 2 และ ปฏิเสธที่จะเล่นในเกมที่ 3

upic.me

Greg Brockman CTO ของ OpenAI กล่าวผ่านวิดีโอแนะนำบอทตัวนี้ว่า บอทตัวนี้ถูกฝึกให้แข่งกับตัวเองเป็นเวลากว่า “หนึ่งพันชั่วอายุคน”​ พร้อมการโค้ช นอกจากนี้ Brockman ยังได้กล่าวผ่าน Blog ของ OpenAI เพิ่มเติมว่า ในช่วงอาทิตย์ที่ผ่านมา OpenAI ไม่แพ้ใครเลยในการเจอกันกับผู้เล่นระดับโลกคนอื่นๆ อย่าง Syed Sumail "SumaiL" Hassan และ Artour "Arteezy" Babaev และ ภายใน Blog ยังมีวิดีโอนำเสนอถึงพฤติกรรมที่ให้บอท OpenAI ได้เรียนรู้เกี่ยวกับเกม Dota 2 อีกด้วย

สุดท้าย Brockman มองว่า OpenAI ยังไม่พร้อมสำหรับการแข่งขันแบบปกติของ Dota 2 คือ 5 ต่อ 5 และเขาหวังว่าจะสามารถพัฒนาบอทตัวนี้ให้พร้อมสำหรับการแข่งขันได้ภายในปีหน้า

สามารถรับชมคลิปการแข่งขันแบบเต็มๆ ได้ ที่นี่

ที่มา: Business Insider, NoobFromUA

Hiring! บริษัทที่น่าสนใจ

Carmen Software company cover
Carmen Software
Hotel Financial Solutions
Next Innovation (Thailand) Co., Ltd. company cover
Next Innovation (Thailand) Co., Ltd.
We are web design with consulting & engineering services driven the future stronger and flexibility.
KKP Dime company cover
KKP Dime
KKP Dime บริษัทในเครือเกียรตินาคินภัทร
Kiatnakin Phatra Financial Group company cover
Kiatnakin Phatra Financial Group
Financial Service
Fastwork Technologies company cover
Fastwork Technologies
Fastwork.co เว็บไซต์ที่รวบรวม ฟรีแลนซ์ มืออาชีพจากหลากหลายสายงานไว้ในที่เดียวกัน
Thoughtworks Thailand company cover
Thoughtworks Thailand
Thoughtworks เป็นบริษัทที่ปรึกษาด้านเทคโนโยลีระดับโลกที่คว้า Great Place to Work 3 ปีซ้อน
Iron Software company cover
Iron Software
Iron Software is an American company providing a suite of .NET libraries by engineer for engineers.
CLEVERSE company cover
CLEVERSE
Cleverse is a Venture Builder. Our team builds several tech companies.
Nipa Cloud company cover
Nipa Cloud
#1 OpenStack cloud provider in Thailand with our own data center and software platform.
Bangmod Enterprise company cover
Bangmod Enterprise
The leader in Cloud Server and Hosting in Thailand.
CIMB THAI Bank company cover
CIMB THAI Bank
MOVING FORWARD WITH YOU - CIMB is the leading ASEAN Bank
Bangkok Bank company cover
Bangkok Bank
Bangkok Bank is one of Southeast Asia's largest regional banks, a market leader in business banking
MuvMi (Urban Mobility Tech Co.,Ltd.) company cover
MuvMi (Urban Mobility Tech Co.,Ltd.)
Shape the future of urban mobility towards affordable, clean, and safe solutions
T.N. Digital Solution Co., Ltd. company cover
T.N. Digital Solution Co., Ltd.
TNDS has been involving in every first move of banking’s major digital transformation.
KBTG - KASIKORN Business-Technology Group company cover
KBTG - KASIKORN Business-Technology Group
KBTG - "The Technology Company for Digital Business Innovation"
Siam Commercial Bank Public Company Limited company cover
Siam Commercial Bank Public Company Limited
"Let's start a brighter career future together"
Icon Framework co.,Ltd. company cover
Icon Framework co.,Ltd.
Global Standard Platform for Real Estate แพลตฟอร์มสำหรับธุรกิจอสังหาริมทรัพย์ครบวงจร มาตรฐานระดับโลก
REFINITIV company cover
REFINITIV
The Financial and Risk business of Thomson Reuters is now Refinitiv
H LAB company cover
H LAB
Re-engineering healthcare systems through intelligent platforms and system design.
The Gang Technology Co., Ltd. company cover
The Gang Technology Co., Ltd.
We're a Digital Agency that helps our customers transform their business into digital with ease.
LTMH company cover
LTMH
LTMH มุ่งเน้นการพัฒนาผลิตภัณฑ์ที่สามารถช่วยพันธมิตรของเราให้บรรลุเป้าหมาย
Seven Peaks company cover
Seven Peaks
We Drive Digital Transformation
Wisesight (Thailand) Co., Ltd. company cover
Wisesight (Thailand) Co., Ltd.
The Best Choice For Handling Social Media · High Expertise in Social Data · Most Advanced and Secure
MOLOG Tech company cover
MOLOG Tech
We are Modern Logistic Platform, Specialize in WMS, OMS and TMS.
Data Wow Co.,Ltd company cover
Data Wow Co.,Ltd
We enable our clients to realize increased productivity by solving their most complex issues by Data
LINE Company Thailand company cover
LINE Company Thailand
LINE, the world's hottest mobile messaging platform, offers free text and voice messaging + Call
LINE MAN Wongnai company cover
LINE MAN Wongnai
Join our journey to becoming No.1 food platform in Thailand

ผมนั่งดูสดๆ บน twitch มันหลอนนะครับบอกเลย
เหมือนอะไรสักอย่างที่มีพลัง ความสามารถที่ ข้ามมนุษย์ไปไกล

และที่สุดเลยต้องที่เขาบอกไว้ว่า เขาให้บอทเรียนรู้จากตัวมันเอง
ไม่ได้ใช้ความรู้จากที่มนุษย์สะสมไว้เลย และสะสมความรู้จากการสู้กับตนเอง
จนสามารถก้าวข้าวโปรเพลเยอร์ไปได้

ซึ่งถ้าเทียบกับ alpha go นั่นยังใช้ pattern จากที่คนเล่นกันมาเอามาเทรนตอนเริ่มต้น
แต่นี่ไม่ใช่ AI สร้างทักษะ และความชำนาญจากด้วยมันเอง from scratch กันเลยทีเดียว

ซึ่งถ้าจริงอย่างที่เขาบอก นีั่หน่ะมันหลอนเลยหล่ะครับ
และก็ไวมาก จริงอย่างที่ Elon ว่าไว้ มนุษย์ต้องเริ่มกังวล AI บ้างแล้ว

ซึ่งไม่ใช่เรื่องแปลก มนุษย์จะกลัวอะไรที่เกินกว่าความสามารถของตัวเอง
จนกว่ามนุษย์จะมั่นใจได้ว่า มันถูกคุมอยูู่

ทำไมรู้สึกไปเองว่า... มันก็น่าชนะแหง่ๆ อยู่แล้ว

คือรู้สึกว่าทั้งส่งคำสั่งเร็วกว่า ตำแหน่งคู่แข่ง/ไอเทม/ตัวละครในทีมอะไรต่างๆ AI จำได้ดีกว่าคนอยู่แล้ว
แถมเกมก็เน้นตัดสินใจเร็วอีก AI ย่อมตัดสินใจดีกว่าแม่นยำกว่าอยู่แล้ว

ผมไม่มองแบบนั้นเลยนะ ผมมองว่าการตัดสินใจนี่แหละ ที่มนุษย์เรามั่นใจมากกว่า
และเกมส์นี้มันวัดการตัดสินใจ ณ เวลาหนึ่งๆ สามารถจะเลือกทำอะไรได้เยอะมาก เดินซ้ายขวา deny หรือว่าจะ last hit จะบุก จะหนี เดินเข้าไป ตัดขวดศัตรูดีมั้ย สกิล ใกล้ กลาง ไกล จะใช้อะไรก่อน
มันเหมือนมีข้อมูล ประดังเข้ามาแล้วต้องตัดสินใจจากประสบการณ์
ซึ่งนั่น ไม่เคยมีบอทไหนทำได้มาก่อน คุณลองคิดดูถ้าให้คุณเขียน if then else มันจะทำได้ยังไง

ถ้าไม่เชื่อที่ผมว่า ก็ลองดูปฏิกิริยาของโปรเพลเยอร์ได้ ก่อนเล่นมั่นใจกันทั้งนั้น

การตัดสินใจคิดจากอะไร เลือดที่เหลืออยู่ เกราะ แล้วก็เดเมจที่ตัวเองมี เพลเยอร์ทุกคนก็ตัดสินใจอย่างนี้ ยิ่ง 1v1 ไม่ใช่ team play ยิ่งใช้การคำนวณเยอะ เพราะไม่มีปัจจัยอื่นๆ มาเกี่ยวข้อง มันก็ไม่เห็นจะแปลกที่ Bot จะชนะ Esports 1-1 เป็นอะไรที่ bot ชนะง่ายที่สุดแล้ว แถมมนุษย์ก็มีปัจจัยด้านอารมณ์ หัวร้อน Tilted ง่ายๆอีกต่างหาก

ปล. ถ้าเกิดก่อนเล่นไม่มั่นใจ มันก็แพ้ไปค่อนตัวแล้วปะครับ?

ปลล. ในกฎห้ามใช้ Bottle runes ลดปัจจัยได้อีกเยอะ

คือ ผมเข้าใจว่า ไอกติกานี่หน่ะ มันชนะได้ง่ายที่สุดแล้ว (คำที่น่าจะเหมาะกว่าคือ ยากน้อยที่สุด)
แต่มันก็ยังไม่ง่ายอยู่ดี ที่จะเขียนบอทให้ชนะ เพราะบอทมันไม่ได้ใช้ ข้อมูลกลยุทธิ์จากประสบการณ์คน

มันแข่งของมันเอง มันให้รางวัลตัวเองเมื่อผลดี มันลงโทษตัวเองเมื่อแพ้ แล้วจากนั้นก็สร้างความรู้ ข้อมูลของมันเอง
ตรงนี้ต่างหาก ที่มันยาก

ถึงยังไงผมจะรออ่านเปเปอร์อีกที ว่าเขาป้อนอะไรบ้างเป็น input และ output ของบอทนั่นทำอย่างไร

ซึ่งอะไรที่มาถึงวันนี้ได้ ไม่แน่ใจว่าในอนาคตอาจจะมี 5v5 พร้อมกับใส่ดีเลย์ ใน input ของมันก็ได้
และจุดนั้นแหละ คือจุดที่บอกได้ หุ่นยนต์ได้ไปไกลกว่ามนุษย์แล้ว ในการคิดค้นกลยุทธ์ต่างๆ ในสถานการณ์ที่ซับซ้อน

คิดเหมือนกัน เป็นเกมส์ที่ใช้ความเร็วของปฏิกิริยาตอบสนองสูง ในขณะที่กลยุทธไม่ได้เยอะหรือซับซ้อนเท่าไหร่
บอทได้เปรียบ

5-5 น่าจะซับซ้อนสุดๆ
เพราะนอกจากตัวมัน ยังต้องคิดถึงตัวอื่นอีก 9 ตัว
และถ้าไม่ใช่ AI ตัวเดียว คุมทั้ง5ตัวในฝ่ายเดียวกันอาจต้องมีการ chat บอกเพื่อนร่วมทีมได้
เช่น +++, bbb, sad noob wa //เอร๊ยแมวพิมพ์

อยากอ่านเปเปอร์แล้ว มีใครพอจะทราบมั้ยว่า input ของบอทตัวนี้คือ raw pixel หรืออะไร ถ้าเป็น raw pixel ก็น่าประทับใจมาก

ผมสงสัยว่า “หนึ่งพันชั่วอายุคน” ทำได้ยังไงอะ คือบอทโคลนตัวเองเป็นล้านๆตัวแล้ว เก็บข้อมูลไปเรื่อยๆ เหรอครับ

สิ่งที่ผมอยากเห็นอีกอย่างคือ บอท คลิ๊กเม้าส์ยังไง

เอาจริงๆ มันเป็นไปไม่ได้อยู่แล้ว ที่จะชนะ perfect blocking creep แบบนั้น คนไม่มีทางทำได้ มันไม่ใช่สมอง แต่เป็น skill

ไม่ว่าจะ agro creep หรืออะไร คนก็ไม่มีทางที่จะขยับได้ดีกว่าบอท

ผมว่าเกมแรก Dendi สู้ได้ดีมากๆ ดีแบบเหลือเชื่อเลย คือบอทตายพร้อมกับ Dendi แต่ Dendi ตายไปแล้ว 1 ก็คือ บอทมันก็จะจบเกม ก็คือยอมตายด้วย ไม่อย่างนั้นผมเชื่อว่า บอทไม่ตายแน่ๆ

ส่วนตัวผมว่านี่มันเรื่องบ้าๆ จริงๆนะ แค่ perfect blocking creep ได้แบบนั้นก็จบแล้ว

ก็คงให้บอทเล่นแบบ "ความเร็วสูงสุด" มั้งครับ

เล่นจบ เริ่มใหม่ วนไปเรื่อยๆ คิดเวลาได้เทียบเท่ากับ คนเล่นในเวลาหนึ่งพันชั่วอายุ

ปล. ผมเดา

ผมว่า 1-1 แบบนี้ alphaGo ยังดูน่าตื่นเต้นกว่าอีก
เกมส์ Dota2 ยังไง bot ก็ได้เปรียบคนเล่นมากกว่ากระดาน go
ุถ้าเอา bot ไปเล่นกับ team คนจริงได้แล้วโหด ยังน่าตื่นเต้นมากกว่า

เอาจริงดิ ทำไมผมคิดว่า dota2 มันซับซ้อนกว่าเกมส์โก๊ะหว่า
ถ้าดูคลิบจะเห็นว่าเล่นเหมือนคนมาก ไม่ได้มีจุดที่เรียกว่าโกง รอ 5-5 เมื่อไรสนุกแน่

tekkasit Sat, 12/08/2017 - 17:54

คือเกม DOTA2 พวกนี้เป็นอีกระดับจากโกะหรือหมากรุก ซึ่งเกมกระดานจะเป็น perfect information คือข้อมูลผู้เล่นทุกคนเห็นบนกระดานเท่ากันหมดและเป็นลักษณะผลัดกันเดิน

ส่วนเกมอย่าง DOTA, SC จัดเป็นพวก RTS ซึ่งทางเลือกที่เป็นไปได้แต่ละ move ก็เยอะกว่าเกมกระดาน แถมเป็น real-time อีกต่างหาก AI คิดนานไปก็เสียโอกาสในการทำเกมอีก ยิ่งกว่านั้นพวกนี้จะมี fog of war เข้ามาทำให้ AI ไม่เห็นข้อมูลทุกๆอย่าง ซึ่งข้อมูลส่วนที่มองไม่เห็นสามารถทำให้เกมพลิกผันได้

แต่เหมือนแมตช์นี้ยังมีข้อห้าม เหมือนไม่เห็นการซื้ออาวุธ อัพสกิล ฯลฯ เหมือนเกมปกติ กลายเป็นเดินหน้าลุยตรงๆ ขาดความลุ่มลึกไปเยอะ ซึ่งเข้าใจว่า AI ยังไม่เข้าใจตรงนี้

แต่ที่ประทับใจคือ มันพบแทคติคต่างๆด้วยตนเอง ไล่ตามฮีโร่ที่เจ็บ, ตีเป็นตัวสุดท้ายจะได้เครดิตมากกว่า, ไม่เด๋อเข้าลุยเดี่ยวๆ รู้จักหลบหลัง creep, ฯลฯ แต่ถ้าเป็นแบบนี้ อีกไม่กี่ปีคงได้เจอ AI รุ่นที่สามารถสู้กับผู้เล่นแนวหน้าในเกมปกติได้

แต่ส่วนตัวคิดว่า ต่อให้เป็นเกมแบบปกติ DOTA2 ยังซับซ้อนน้อยกว่า SC2 รายนั้นไหนจะมีเรื่องการบริหารทรัพยากร, ขยายฐาน, ไต่ tech-tree, ในช่วงนี้จะผลิต unit ไหนดี (rock-paper-scissors), การแพ้ทางระหว่างเผ่า, หรือจะกลยุทธ์ลักไก่ (cheese)

ป.ล. AI ที่แข่งเค้าล็อค APM ให้อยู่ระดับผู้เล่นที่เป็นมนุษย์ครับ

คือผมไม่แน่ใจว่าแทคติค (พฤติกรรมบอท) ที่ว่าหนิเขากำหนดให้มันเรียนรู้ หรือมันเรียนรู้เอง

ซึ่งถ้าทีมพัฒนากำหนดให้ป็นพฤติกรรมที่ต้องเรียนรู้ ผมว่าธรรมดามากครับที่บอทจะชนะ

แต่ถ้าเขากำหนดแค่เรื่องพื้นฐานของเกมส์แบบไม่กำหนดพฤติกรรม แต่บอทดันเรียนรู้พฤติกรรมเหล่านี้เองได้เอง

  • Creep Aggro
  • Creep Blocking
  • Zoning
  • Raze Dodgin
  • Raze Faking
    ผมว่าน่าเหลือเชื่อมากครับ

ตอนนี้อยากเห็นเปเปอร์หรือโค้ดอธิบายครับ

เอาตรงๆ ผมเองยังไม่อยากเชื่อนะครับว่ามันจะเรียนรู้เรื่องเหล่านี้ได้เองโดยไม่กำหนด

ผมเดาว่าต้องมีโปรฯหรือคนที่เข้าใจเกมส์กำหนดพฤติกรรมเหล่านี้เป็นเป้าหมายให้บอทเรียนรู้ครับ

คือถ้าไม่กำหนดเป้าหมายแต่มันเข้าใจเรื่องนี้ได้เองนี่ เตรียมเข้าสู่ยุคของ AI ครองเมืองได้เลยครับผม :)

ลองบลอคครีพ แบบ ai แล้ว มันระดับกด ไม่พลาด 0.001 เลยนะ ถึงจะทำได้แบบนั้น dendi ทำได้สุดยอดแล้วเกมส์แรก