AlphaGo Zero สอนตัวเองให้เล่นหมากรุก ใช้เวลา 4 ชั่วโมงก็ล้มโปรแกรมแชมป์เก่าได้

By mk

on 12 December 2017 - 06:54 Tag: AlphaGo, DeepMind, Artificial Intelligence

AlphaGo

เราเพิ่งเห็นข่าว DeepMind พัฒนา AlphaGo Zero ไม่ต้องใช้ข้อมูลการเล่นของมนุษย์ สามารถเทรนตัวเองได้จากการเล่นแข่งกับตัวเองเพียงอย่างเดียว

แนวคิดของ AlphaGo Zero ไม่ได้ใช้แค่การเล่นโกะเท่านั้น เพราะทาง DeepMind นำมันไปใช้กับหมากรุกด้วย

ชื่อของ AI เปลี่ยนมาเป็น AlphaZero (ตัดคำว่า Go ออกไป) และใช้เวลาหัดเล่นหมากรุกด้วยตัวเองเพียง 4 ชั่วโมง ก็สามารถเอาชนะโปรแกรมเล่นหมากรุกที่เก่งที่สุดคือ Stockfish ได้ ทางทีม DeepMind ยังเอามันไปฝึกเล่นหมากรุกญี่ปุ่น (โชงิ) และใช้เวลาฝึกเพียง 2 ชั่วโมงก็เอาชนะบ็อตโชงิได้

เป้าหมายของ DeepMind คือสร้าง AI ที่ทำงานทั่วไป (more generic) มากกว่างานเฉพาะทางอย่างการเล่นโกะเพียงอย่างเดียว

ที่มา - Ars Technica, ภาพจาก Pexels

Hiring! บริษัทที่น่าสนใจ

Carmen Software

Hotel Financial Solutions

Next Innovation (Thailand) Co., Ltd.

We are web design with consulting & engineering services driven the future stronger and flexibility.

KKP Dime

KKP Dime บริษัทในเครือเกียรตินาคินภัทร

Kiatnakin Phatra Financial Group

Financial Service

Fastwork Technologies

Fastwork.co เว็บไซต์ที่รวบรวม ฟรีแลนซ์ มืออาชีพจากหลากหลายสายงานไว้ในที่เดียวกัน

Thoughtworks Thailand

Thoughtworks เป็นบริษัทที่ปรึกษาด้านเทคโนโยลีระดับโลกที่คว้า Great Place to Work 3 ปีซ้อน

Iron Software

Iron Software is an American company providing a suite of .NET libraries by engineer for engineers.

CLEVERSE

Cleverse is a Venture Builder. Our team builds several tech companies.

Nipa Cloud

#1 OpenStack cloud provider in Thailand with our own data center and software platform.

Bangmod Enterprise

The leader in Cloud Server and Hosting in Thailand.

CIMB THAI Bank

MOVING FORWARD WITH YOU - CIMB is the leading ASEAN Bank

Bangkok Bank

Bangkok Bank is one of Southeast Asia's largest regional banks, a market leader in business banking

MuvMi (Urban Mobility Tech Co.,Ltd.)

Shape the future of urban mobility towards affordable, clean, and safe solutions

T.N. Digital Solution Co., Ltd.

TNDS has been involving in every first move of banking’s major digital transformation.

KBTG - KASIKORN Business-Technology Group

KBTG - "The Technology Company for Digital Business Innovation"

Siam Commercial Bank Public Company Limited

"Let's start a brighter career future together"

Icon Framework co.,Ltd.

Global Standard Platform for Real Estate แพลตฟอร์มสำหรับธุรกิจอสังหาริมทรัพย์ครบวงจร มาตรฐานระดับโลก

REFINITIV

The Financial and Risk business of Thomson Reuters is now Refinitiv

H LAB

Re-engineering healthcare systems through intelligent platforms and system design.

The Gang Technology Co., Ltd.

We're a Digital Agency that helps our customers transform their business into digital with ease.

LTMH

LTMH มุ่งเน้นการพัฒนาผลิตภัณฑ์ที่สามารถช่วยพันธมิตรของเราให้บรรลุเป้าหมาย

Seven Peaks

We Drive Digital Transformation

Wisesight (Thailand) Co., Ltd.

The Best Choice For Handling Social Media · High Expertise in Social Data · Most Advanced and Secure

MOLOG Tech

We are Modern Logistic Platform, Specialize in WMS, OMS and TMS.

Data Wow Co.,Ltd

We enable our clients to realize increased productivity by solving their most complex issues by Data

LINE Company Thailand

LINE, the world's hottest mobile messaging platform, offers free text and voice messaging + Call

LINE MAN Wongnai

Join our journey to becoming No.1 food platform in Thailand

ถ้าให้ AI

stan Tue, 12/12/2017 - 07:27

ถ้าให้ AI หาวิธีช่วยโลกจากหายนะทางสิ่งแวดล้อมที่อาจเกิดขึ้นในอนาคต แล้ว คำตอบที่ได้คือกำจัดมนุษย์ออกไป นี่หนาวเลยนะ

ใจลึกๆผมก็คิดแบบ AI

adente Tue, 12/12/2017 - 08:14

ใจลึกๆผมก็คิดแบบ AI เลยแต่มันทำจริงๆไม่ได้

ก็ตั้เงื่อนไขก่อนได้ครับ

Hadakung Tue, 12/12/2017 - 08:42

ก็ตั้เงื่อนไขก่อนได้ครับ แล้วปกติเทรน ML มันต้องเอาโมเดลมาตรวจสอบก่อนใช้งานจริงด้วย ถ้าคนมันเพี้ยนจนทำแบบนั้นเอง AI ไม่น่าจะถูกปล่อยให้คิดเอง

คิดน่ะคิดได้

TheOrbital Tue, 12/12/2017 - 09:11

คิดน่ะคิดได้ แต่มันยังไม่มีระบบที่จะทำให้หนาวได้ คือ มันยังไม่สามารถเร่งแอร์ได้
เอ้ย..ไม่ใช่ มันยังไม่สามารถติดต่อกับ AI อื่นๆที่จะยิงขีปนาวุธ สั่งกองทัพ หรือปิดคอมทั้งโลกได้ มันก็คิดออกมา แล้วก็ให้คำตอบ แค่นั้น

ย้อนเวลากลับมา kill Deepmind

Neroroms Tue, 12/12/2017 - 09:41

ย้อนเวลากลับมา kill Deepmind ทิ้ง

งะะะะะะ

diewland Tue, 12/12/2017 - 11:32

งะะะะะะ

แต่เหตุผลมันคงถูก เหอๆๆ

adirak Tue, 12/12/2017 - 09:48

แต่เหตุผลมันคงถูก เหอๆๆ

แบบนั้นไม่ต้องเป็น AI

Holy Tue, 12/12/2017 - 11:05

แบบนั้นไม่ต้องเป็น AI ก็ตอบได้ครับ ใครก็ตามที่เชื่อเรื่อง Global Warming ก็รู้อยู่แล้วว่ามนุษย์เป็นต้นเหตุ

ถ้าจะให้ AI ช่วยคงต้องการคำตอบแบบที่ใช้การคำนวณลึกซึ้งกว่านั้นมาก เช่น คำนวณจากปัจจัยการเคลื่อนที่ของโลกรอบดวงอาทิตย์ กระแสน้ำ กระแสลม สภาพอากาศ แล้ว ได้คำตอบว่าควรนำสาร X ปริมาณ Y ตันไปปล่อยที่ความสูง Z เหนือพื้นดิน ที่พิกัด Lat/Long เท่านี้ๆ เพื่อให้สารกระจายตัวไปสะท้อนแสงอาทิตย์ออก ช่วยชะลอปรากฎการณ์โลกร้อนได้ โดยมีผลกระทบต่อสิ่งแวดล้อมน้อยที่สุด อะไรแบบนี้

แต่กว่าจะคำนวณได้อาจจะไม่ทันการณ์แล้ว....

นั่นมัน The 100 เลยคับ

sarajung Tue, 12/12/2017 - 11:33

นั่นมัน The 100 เลยคับ

เล่นไพ่ป๊อกก็ดีนะครับ

waroonh Tue, 12/12/2017 - 11:23

ฝึกให้มันเล่นไพ่ป๊อกก็ดีนะครับ ตั้งชื่อว่า project เกาจิ๊งโกโฮม หมายเลข 1

เข้าใจว่าหัวข้อข่าวใช้คำว่า

zyzzyva Tue, 12/12/2017 - 11:42

เข้าใจว่าหัวข้อข่าวใช้คำว่า AlphaGo Zero เพื่อให้คนเชื่อมโยงกับข่าวเก่า แต่จริงๆแล้วมันคือ AlphaZero ที่สามารถเล่นได้ทั้งหมากรุก,หมากรุกญี่ปุ่น,โกะ

ผมเข้าใจว่า AlphaGo Zero เป็น

tontpong Tue, 12/12/2017 - 16:49

ผมเข้าใจว่า AlphaGo Zero เป็น hardware configuration ใหม่ด้วยรึป่าว, แล้วทีแรกใช้ชื่อ software เดียวกัน ตอนนี้ค่อยมาตัด go ออก?

เป็นคนละ software กันครับ

zyzzyva Tue, 12/12/2017 - 18:13

เป็นคนละ software กันครับ

ให้มันมาคุมไฟแดงในกรุงเทพ

wichate Tue, 12/12/2017 - 12:40

ให้มันมาคุมไฟแดงในกรุงเทพ เพื่อแก้ปัญหารถติดได้ไหม

ถ้าใส่ Input

Mikamura Tue, 12/12/2017 - 12:59

ถ้าใส่ Input เข้าไปเยอะมากพอผมว่า AlphaZero สามารถคำนวณเวลาที่เหมาะสมในการเปิดปิดไฟแดง / เขียวทั้ง กทม ได้ครับ

ผมว่ามันทำได้

Lennon Tue, 12/12/2017 - 13:23

ผมว่ามันทำได้ เพีียงแต่คนต้องปฏิบัติตามที่มันสั่งนะ

ผมเคยเล่นเกมส์ control traffic อันนึงในไอแพ่ด เสียดายผมจำชื่อไม่ได้ กติกาคือ ห้ามให้แยกใดแยกหนึ่งรถติดนานเกินไป ตัวเกมส์มีอยู่ Map เดียว Level เดียว ซึ่งเป็นเมืองใหญ่อย่างปารีส หรือ ลอนดอน แล้วแต่เราจะเลือก Map มีถนนพันกันเหมือนเส้นก๋วยเตี๋ยว จัดว่าเล่นยากมากสำหรับคนที่แยกประสาทไม่ได้ รวมถึงทำอะไรหลายๆอย่างพร้อมกันไม่เก่งเช่นผม

สำหรับคนทำอะไรได้ทีละอย่างเช่นผม ตอนแรกผมลองทำแบบที่ตำรวจไทยทำ คือ กั้นไว้ทางแล้วเคลียร์อีกทางให้หมด (ลองแก้ปัญหาเป็นจุดๆไป) ปากดว่าไม่ว่าจะยังไงมันเกิดสภาวะงูกินหางกันไปหมด ไม่นานก็รถติดจากแยกนึงไปแยกนึงจนเราไม่รุจะทำไงดี game over จนรู้สึกว่าเกมส์นี้มันทำมาให้ใครเล่นวะนี่ และก็เริ่มเข้าใจตำรวจไทยในยามเร่งด่วน ว่าจะหัวหมุนขนาดไหน

แต่ตอนหลังลองเล่นแบบเปิดไฟเขียวสลับไฟแดงสั้นๆ แต่เปิดๆปิดๆไปเรื่อยๆโดยมี ลำดับการเปิดแบบวนเข็มหรือทวนเข็มอย่าง Consistencyไปเรื่อยๆ สำคัญว่าต้องไม่มีแยกไหนโดนทอดทิ้งทั้วทั้ง Map ปากดว่าสามารถเล่นได้นานเท่าไหร่ก็ได้ ไม่มีวันจบ เพราะท้ายแถวไม่มีสะสม และไม่ได้ต้องใช้การแยกประสาทอะไรมากมายแค่ทำไปอย่าให้ตกหล่นก็พอ ที่สำคัญคนปฏิบัติต้องเห็นภาพรวมของสภาพถนนตลอดเวลาและเป็นคนเดียวกันหมดที่ควบคุมทั้งเมือง ซึ่งเงื่อนไขทั้งหมดทั้งปวงที่ว่านี่ คงมีแต่หุ่นยนต์ที่จะทำได้ดี

เห็นด้วยเลยครับ มันต้องเป็น

wichate Tue, 12/12/2017 - 14:26

เห็นด้วยเลยครับ มันต้องเป็น AI ที่เห็นภาพรวมทั้งเมือง ถ้าแยกกันทำพอเราเปิดเขียวให้แยกแรกไปได้เยอะๆ เร็วๆ สุดท้ายมันก็ไปกระจุกตัวเพื่อเป็นปัญหารถติดในแยกถัดไป โอ้ยากอ่ะที่จะแก้ได้ถ้าไม่ใช้ระบบที่มองเห็นข้อมมูลได้ทั้งเมือง

ถึงจุดนึงมันอาจจะ Predict

foizy Tue, 12/12/2017 - 20:29

ถึงจุดนึงมันอาจจะ Predict การฝ่าฝืนกฎจราจรที่กระทบต่อสัญญาณไฟและรถติด แล้วคำนวณการเปิดปิดไฟให้สมเหตุสมผลใหม่ก็ได้นะครับ 555

ถ้าให้ Machine Learning

Holy Tue, 12/12/2017 - 21:41

ถ้าให้ Machine Learning เก็บข้อมูลไปสักระยะ มันก็น่าจะ Predict ได้และนำมาคำนวณได้นะครับ เช่น ถ้าเปิดไฟเขียวสั้นไปไม่กี่วิแดงแล้ว หรือปล่อยให้คนรอนานๆ ก็มีแนวโน้มที่คนจะฝ่าฝืนกฎ ขอ"แถม"มากขึ้น จนส่งผลให้ท้ายแถวเลยเข้ามาในแยก รถอีกฝั่งไปไม่ได้อยู่ดี อะไรแบบนี้

หรือไม่ อาจจะต้องมี ai

Lennon Wed, 13/12/2017 - 06:44

หรือไม่ อาจจะต้องมี ai อีกตัวจับคนทำผิดกฏจราจร (ถ่ายรูป ส่งไปที่บ้าน) สำคัญว่ากล้องตรงนั้นอย่าซื้อมาแสนแพงแต่เผอิญ”เสียพอดี”ก็ละกัน

เคยมี Expat มะกันคนนึงมาไทย

pepporony Wed, 13/12/2017 - 10:59

เคยมี Expat มะกันคนนึงมาไทย พอมาเห็นการปล่อยไฟของไทยแล้วแปลกใจ บอกที่เมืองเค้าปล่อย 1 นาทีเท่ากันหมด ไม่ใช่ฝั่งนึงไฟเขียว 30 วิ อีกฝั่งนึงเขียว 2 นาทีแบบไทย

คาสิโน

max212 Tue, 12/12/2017 - 13:01

ผิดมั๊ยที่มีคำว่า "แดง ดำ ดอก หลาม ป๊อก....." ขึ้นมาในหัว

ป๊อกมันต้องคิดด้วยเหรอ

dangsystem Tue, 12/12/2017 - 13:20

ป๊อกมันต้องคิดด้วยเหรอ ถ้าดำมี่ ผสมสิบ นี่ จำได้แม่นๆเลย

https://www.monomaxxx.com

100dej Tue, 12/12/2017 - 14:37

https://www.monomaxxx.com/review/detail/twentyone

ป๊อก 21 ก็คล้าย ๆ ป๊อกเด้งของไทยแหล่ะครับ ระดับหัวกะทิ MIT

ถ้ารัมมี่นี่ AI ชนะไม่ยากเลย

TheOrbital Wed, 13/12/2017 - 09:18

ถ้ารัมมี่นี่ AI ชนะไม่ยากเลย พื้นฐานก็จดจำไพ่ในมือตัวเองบวกที่ทิ้งลงมาของแต่ละคนในแต่ละตา รวมถึงวิเคราะห์จากไพ่ที่ทิ้งลงมาด้วยว่าบนมือแต่ละคนน่าจะมี/ไม่มีไพ่อะไร
ตาแรก AI จะรู้แน่นอนแล้ว 8 ใบคือ ไพ่ในมือตัวเอง 7 ใบ ที่หัวอีก 1
ถักไปแต่ละตา อย่างน้อยๆ ต้องทิ้งลงคนละ 1 ใบคือเผยออกมาอีก 4 ใบในแต่ละตา
รวมๆกับการเกิดของผู้เล่นคนใดคนหนึ่งในระหว่างรอบตา ดังนั้นผ่านไปประมาณ 3 ตาก็เห็นไพ่เกินครึ่งสำรับ พร้อมๆกับวิเคราะห์การเกิดการทิ้งในแต่ละตาของแต่ละคน AI ก็รู้หมดแล้วว่าใครถืออะไรและเหลือไพ่อะไรบ้าง

พวกเซียนๆ

poa Tue, 12/12/2017 - 14:33

พวกเซียนๆ ก็น่าจะประมาณความน่าจะเป็นได้ไม่หนีกับ AI เท่าไหร่
แต่จะ AI จะได้เปรียบตรงที่ไม่โดนจิตวิทยาเล่นงาน

ถ้าต่อไป ชิป NN แพร่หลาย

Hoo Tue, 12/12/2017 - 21:56

ถ้าต่อไป ชิป NN แพร่หลาย
จะมี AlphaLite มาให้เล่นgo/หมากรุกในมือถือมั๊ยนะ