AlphaGo

เดินทางมาถึงกระดานที่ 4 สำหรับการแข่งขันหมากล้อมระหว่าง AlphaGo และ Lee Sedol โดยผลการแข่งขันวันนี้ Lee Sedol เอาชนะ AlphaGo ไปได้อย่างสวยงาม

Lee ใช้เวลา 2 ชั่วโมงจนหมด ในขณะที่ตอนนั้น AlphaGo ยังเหลือเวลาอยู่ถึง 1 ชั่วโมงกว่าๆ ทั้งคู่แข่งกันไปมาจนฝั่ง AlphaGo เหลือเวลา 54 วินาที ก่อนจะยอมแพ้ในที่สุด

ด้าน Demis Hassabis ผู้ก่อตั้ง DeepMind ทวีตว่า AlphaGo เดินพลาดตอนตาที่ 79 แต่เพิ่งจะรู้ตัวตอนตาที่ 87 ทำให้ความมั่นใจว่าจะชนะของ AlphaGo ดิ่งลงจาก 70% เหลือต่ำมาก (แต่ไม่ได้บอกว่าเท่าไหร่)

จังหวะที่ AlphaGo ยอมแพ้ บนหน้าจอคอมพิวเตอร์ขึ้นว่า "AlphaGo resigns: The result "W+Resign" was added to the game information"

ที่มา - YouTube: DeepMind

Hiring! บริษัทที่น่าสนใจ

Carmen Software company cover
Carmen Software
Hotel Financial Solutions
Next Innovation (Thailand) Co., Ltd. company cover
Next Innovation (Thailand) Co., Ltd.
We are web design with consulting & engineering services driven the future stronger and flexibility.
KKP Dime company cover
KKP Dime
KKP Dime บริษัทในเครือเกียรตินาคินภัทร
Kiatnakin Phatra Financial Group company cover
Kiatnakin Phatra Financial Group
Financial Service
Fastwork Technologies company cover
Fastwork Technologies
Fastwork.co เว็บไซต์ที่รวบรวม ฟรีแลนซ์ มืออาชีพจากหลากหลายสายงานไว้ในที่เดียวกัน
Thoughtworks Thailand company cover
Thoughtworks Thailand
Thoughtworks เป็นบริษัทที่ปรึกษาด้านเทคโนโยลีระดับโลกที่คว้า Great Place to Work 3 ปีซ้อน
Iron Software company cover
Iron Software
Iron Software is an American company providing a suite of .NET libraries by engineer for engineers.
CLEVERSE company cover
CLEVERSE
Cleverse is a Venture Builder. Our team builds several tech companies.
Nipa Cloud company cover
Nipa Cloud
#1 OpenStack cloud provider in Thailand with our own data center and software platform.
Bangmod Enterprise company cover
Bangmod Enterprise
The leader in Cloud Server and Hosting in Thailand.
CIMB THAI Bank company cover
CIMB THAI Bank
MOVING FORWARD WITH YOU - CIMB is the leading ASEAN Bank
Bangkok Bank company cover
Bangkok Bank
Bangkok Bank is one of Southeast Asia's largest regional banks, a market leader in business banking
MuvMi (Urban Mobility Tech Co.,Ltd.) company cover
MuvMi (Urban Mobility Tech Co.,Ltd.)
Shape the future of urban mobility towards affordable, clean, and safe solutions
T.N. Digital Solution Co., Ltd. company cover
T.N. Digital Solution Co., Ltd.
TNDS has been involving in every first move of banking’s major digital transformation.
KBTG - KASIKORN Business-Technology Group company cover
KBTG - KASIKORN Business-Technology Group
KBTG - "The Technology Company for Digital Business Innovation"
Siam Commercial Bank Public Company Limited company cover
Siam Commercial Bank Public Company Limited
"Let's start a brighter career future together"
Icon Framework co.,Ltd. company cover
Icon Framework co.,Ltd.
Global Standard Platform for Real Estate แพลตฟอร์มสำหรับธุรกิจอสังหาริมทรัพย์ครบวงจร มาตรฐานระดับโลก
REFINITIV company cover
REFINITIV
The Financial and Risk business of Thomson Reuters is now Refinitiv
H LAB company cover
H LAB
Re-engineering healthcare systems through intelligent platforms and system design.
The Gang Technology Co., Ltd. company cover
The Gang Technology Co., Ltd.
We're a Digital Agency that helps our customers transform their business into digital with ease.
LTMH company cover
LTMH
LTMH มุ่งเน้นการพัฒนาผลิตภัณฑ์ที่สามารถช่วยพันธมิตรของเราให้บรรลุเป้าหมาย
Seven Peaks company cover
Seven Peaks
We Drive Digital Transformation
Wisesight (Thailand) Co., Ltd. company cover
Wisesight (Thailand) Co., Ltd.
The Best Choice For Handling Social Media · High Expertise in Social Data · Most Advanced and Secure
MOLOG Tech company cover
MOLOG Tech
We are Modern Logistic Platform, Specialize in WMS, OMS and TMS.
Data Wow Co.,Ltd company cover
Data Wow Co.,Ltd
We enable our clients to realize increased productivity by solving their most complex issues by Data
LINE Company Thailand company cover
LINE Company Thailand
LINE, the world's hottest mobile messaging platform, offers free text and voice messaging + Call
LINE MAN Wongnai company cover
LINE MAN Wongnai
Join our journey to becoming No.1 food platform in Thailand

Eddz Sun, 13/03/2016 - 15:59

AlphaGo วันนี้จงใจวางหมากฆ่าตัวตาย 2-3 หมากเลย

ปล. หน้าต่างนั่นใช่ Ubuntu รึเปล่า

แม้เวลาปกติ 2 ชม ของเขาหมดไปนานแล้ว ต้องเดินจำกัดเวลา 1 นาทีในแต่ละหมาก จนชนะได้ แกก็สมกับระดับ 9 ดั้งจริงๆ
ยินดีด้วย

จะไม่มีการแก้ไขตัวโปรแกรมใดๆระหว่างแข่งทั้งสิ้นครับ คือ freeze เอาไว้เลย และส่วนตัวคิดว่า DeepMind ไม่พัฒนามากไปกว่านี้เพราะแมทช์โดยรวมนี้ก็ชนะไปแล้ว และยังมีเกมอื่นอีกเยอะรอเข้าคิวอยู่ (ล่าสุดโปรเฟสชั่นเนลเกมเมอร์ StarCraft สองคน flash กับ boxer ออกมาพูดท้าทาย DeepMind แล้วครับว่าเอาชนะเค้าไม่ได้หรอก)

hononbier Sun, 13/03/2016 - 16:16

ยินดีด้วย อย่างน้อยก็กู้หน้ามาได้สวยงามสมเป็น Lee Sedol จริงๆ กำลังสงสัยว่าถ้า ช่วงหลัง alphago ลงตามที่คนปกติเดิน คงชนะแหละ แต่ยังไงก็สุดยอดสมเป็นแชมป์โลกจริงๆ

ตาลีคิดนานช่วงเกมแรกๆเพราะแกเคยบอกว่าแกเล่นไม่เก่งตอนเปิดเกม เลยขอคิดนานหน่อย พอเกมมากลางเกมถึงปลายเกม หมากลงไปเยอะ ก็เริ่มใช้เวลาคิดไม่ต้องนานมากแล้ว

ขอแสดงความยินดีด้วยกับคุณ Lee Sedol ครับ

ปล.
หลังจบเกมทาง AlphaGo ได้ตัดพ้อกับทางผู้สร้าง
ว่ารู้สึกกดดันจากการที่ถูกมนุษย์ส่วนหนึ่งขู่ฆ่า...อันนำมาสู่การแกล้งแพ้ในหมากตานี้และตาหน้า

เป็นไปไม่ได้ครับที่ให้สัมภาษณ์ว่า “อันนำมาสู่การแกล้งแพ้ในหมากตานี้และตาหน้า”
เพราะถ้าประกาศว่าแกล้งแพ้คือการไม่ให้เกียรติคู่แข่งครับ
อีกอย่างหมากตาที่78ของลีต่างหากที่เป็นหมากสุดยอดพลิกเกม ลองฟังคนสัมภาษณ์คนสุดท้ายหลังเกมครับนักข่าวจากจีนบอกว่า กู่ลี่(โปร 9ดั้งของจีน)ยังชมเลยว่าเป็น 'It's a God play'

ว้าวสุดยอดเป็นไปได้ยังไงเนี่ย ส่วนตัวแปลกใจมาก คนชนะหุ่นยนต์ที่เรียนรู้มากกว่ามนุษย์ได้ แถมหุ่นยนต์เดินพลาดคืออะไร? ตา5ลีน่าจะทำได้ดีกว่านี้นะ

ยินดีด้วยครับ แกวางหมากได้ใจเย็นมาก จนเวลาของคอมเหลือนิดเดียวแล้วก็ขอยอมแพ้ไปเลย

แต่ตาหลังๆผมก็เห็นด้วยกับข้างบนนะว่าเริ่มเดินแปลกๆแล้ว

100dej Sun, 13/03/2016 - 17:08

Alpha คงเจอรูปแบบหมากที่ยังไม่เคยเรียนรู้ กระดานต่อไปคงไม่พลาดกับการแก้เกมแบบนี้แล้ว

ท่าไม้ตายใช้กับเซนต์ซ้ำสองไม่ได้หรอกนะ
AlphaGo​ไม่ได้กล่าวไว้

Configuleto Sun, 13/03/2016 - 18:40

In reply to by 100dej

AlphaGo ที่ใช้แข่งรอบนี้เป็นเวอร์ชั่นที่ freeze ไว้ครับ จนกว่าจะจบ 5 กระดาน หมายความว่ากระดานที่ 5 ก็ยังเป็น AlphaGo ตัวเดียวกับที่แข่งกระดานแรก

checkmate95 Sun, 13/03/2016 - 22:06

In reply to by Configuleto

ถ้าโดน Freeze ไว้ถ้างั้นผมว่าก็ค่อนข้างเสียเปรียบคนนะครับ ลีเล่นจบเกมแพ้แล้วยังสามารถกลับไปทบทวนและวางกลยุทธ์พัฒนาฝีใหม่ใหม่ที่ AlphaGo ใช้ได้ แต่ AlphaGo จะไม่ได้ทำการวิเคราะห์วิธีเล่นของคู่ต่อสู้เพื่ม ราวกับว่าเพิ่งเคยเจอกันเป็นครั้งแรก

ขนาดว่าเสียเปรียบ Lee Sedol ยังแพ้สามกระดานรวดเลยครับ lol

อย่าเพิ่งลืมจุดประสงค์ของ AlphaGo ด้วยสิครับ นั่นคือเก็บข้อมูลจากการเล่นครั้งนี้เพื่อเอาไปพัฒนาอัลกอริทึ่มต่อ

ถ้าไปดูวิธีที่สร้าง AlphaGo ขึ้นมาจะเห็นภาพ คร่าวๆที่ผมนึกออกคือ Engineer กำหนดอัลกิริทึมอะไรต่างๆให้จนเสร็จ จากนั้นให้มันไปพัฒนาตัวเอง ด้วยการเอาข้อมูลมหาศาลยัดเข้าไป ป้อนข้อมูลเสร็จจับมันเล่นกับตัวเองไปเรื่อยๆอีก

ทีนี้นึกภาพถ้า Engineer ต้องการเห็นว่า AlphaGo พัฒนาไปถึงไหนแค่ไหน ก็ต้องหยุดไว้ซักจุดเพื่อใช้อ้างอิงทางวิทยศาสตร์ได้ หาก AlphaGo พัฒนาตัวเองไปด้วยขณะที่แข่ง 5 รอบ ผมว่า engineer ที่นั่ง debug.. เอ๊ย ผมหมายถึงนั่น monitor อยู่คงไม่รู้จะเอาอะไรเป็นเกณฑ์ คงหาผลลัพท์ไม่ได้เลยว่าอัลกอริทึ่มที่คิดไว้มันใช้ได้จริงไหม (ไม่สิ มันก็ใช้ได้แหละ แต่ใช้ได้ผลแค่ไหนต่างหาก)

และผมเสริม fact ให้อีกว่า จากข้อมูลคุณ Demis Hassabis ให้สัมพาษณ์ท้าย match 4 ว่า AlphaGo ต้องศึกษาหมากเป็นล้านๆกระดานเลย ถึงจะเพียงพอต่อ AlphaGo ในการปรับเปลื่ยนวิธีเล่น จำนวนแค่ไม่กี่พันกระดานไม่ส่งผลอะไร หรือพูดอีกนัยคือค่อพันกระดานยังไม่พอ

อ้างอิงจาก https://youtu.be/yCALyQRN3hw?t=6h9m34s นาทีที่ 6:9:34 - 6:11:18 (และใช่ครับ ในคำให้สัมพาษณ์เราได้รู้ว่า AlphaGo ไม่ได้ศึกษาหมากของ Lee Sedol มาก่อนเลย ข้อมูลที่ AG ใช้ฝึกกับตัวเองทั้งหมดมาจาก strong amateur player บน IGS)

วันนี้ทีมงานให้สัมภาษณ์ครับว่าโมเดลที่ได้มาจากข้อมูลจำนวนเยอะมาก ข้อมูลไม่กี่เกมก็ไม่น่าเปลี่ยนอะไรได้อยู่ดี

100dej Mon, 14/03/2016 - 07:51

In reply to by Configuleto

แบบนี้กระดาน 5 ก็ไม่มีความหมายแล้วซิ

Lee คงรู้วิธีเล่นแล้ว ว่าแบบไหนที่จะทำให้ชนะ AlphaGo ได้ (จุดอ่อน ก็ยังเป็นจุดอ่อนอยู่)

alphago คำนวณ ความเป็นไปได้ที่จะชนะ ได้ครับ
หมายความว่าถ้ามันลงต่ำสุดกู่ ก็ยอมแพ้ได้เหมือนกัน

ถ้าคำนวณไม่ได้จะมีปัญหาเรื่องตอน self training ที่แข่งกับตัวเองครับ

เห็นมีคนเคยบอกว่าเป็นมารยาทในการเล่นโกะครับ การเล่นต่อทั้งๆ ที่รู้ว่าแพ้มันเหมือนกับการไม่เคารพคู่ต่อสู้เท่าไหร่

ปล.ผมมั่วครับ รอท่านอื่นมายืนยัน

เคยอ่านแต่จากฮิคารุ ประมาณนั้นแหละครับ

คนที่รู้ตัวว่าถึงทางตันแล้วเล่นต่อก็พลิกเกมไม่ได้ ถึงจะยังเล่นไม่จบก็จะขอยอมแพ้เองไป

เข้าใจว่าวงการนี้มีวัฒนธรรมและจารีตเก่าแก่สืบทอดมาเยอะ โดยเฉพาะเรื่องมารยาท

ตัว AI มันประมาณการณ์ได้ฮะว่ามีโอกาสชนะกี่ %

ซึ่งตามในข่าว % มันต่ำมาก ซึ่งผู้สร้างอาจจะตั้งค่าไว้ก็ได้

ว่าต่ำกว่า 10% ให้ยอมแพ้อะไรแบบนี้

หรือไม่ถ้า Deepmind จริงคงประเมินสถานการณ์ได้เองว่าคงไม่ชนะแล้ว

ซึ่งการในการเล่นโกะปกติถ้ารู้ว่าตัวเองแพ้แน่ๆ ส่วนมากเค้าไม่เดินต่อกันจนจบเกมครับ ยอมแพ้กันไปเลย

ตาที่เล่นกันจนจบกระดานคือยังมองเห็นช่องที่บุกได้อีก หรือมองยากมากว่าอาจจะต่างกันแค่ 5 แต้มหรือแค่ครึ่งแต้ม อะไรแบบนั้น

สงสัย AlphaGo ยอมแพ้ทำไม
ทำไมไม่คิดว่ามนุษย์จะพลาดบ้าง
เพราะถ้ามนุษย์พลาด ก็มีโอกาสพลิกกลับมาชนะได้เหมือนกัน

สงสัย สอบถามหน่อยครับ
3 match ก่อนหน้า ที่ Lee Sedol แพ้ เพราะแกเดินหมากพลาดรึเปล่าครับ เลยทำให้ต้องยอมแพ้ในตอนท้ายๆ

ปล.ผมเล่นโก๊ะไม่เป็น ไม่รู้ว่าเดินพลาดคือเดินให้เขากินใช่ไหม(อันนี้มโนเอาเอง)

รู้สึกกระดานที่สองหรือสาม Leeเดินจนไม่เหลือเวลาให้คิดแล้ว เก่งแค่ไหนโดนเวลาบีบก็ไปไม่เป็นเหมือนกัน

ถ้าท่านจะมอง AG (AlphaGo) ให้มันต้องมีอารมณ์ใจสู้ ซึ่งเป็นข้อวินิฉัยผิดจุดเพราะ AG ไม่มีอารมณ์ใดๆตั้งแต่แรก ผมคงไม่มีข้อแย้งอะไรครับ

แต่หากอยากจะวิเคราะห์จริงๆว่าทำไม AG ท้ายเกมจึงเดินพลาดหรือทำไมจึงยอมแพ้ ผมชี้ว่าต้องไปดู AG ทำงานยังไง สาเหตุอะไรให้ทำให้ AG เลือกเดินหมากจุดนั้น

Lee Sedol ต้องยอมแพ้เพราะเดินหมากพลาดใช่ไหม?

ไม่ใช่ครับ

ที่ยอมแพ้เพราะ Lee Sedol ยอมรับว่าถึงจะเดินไปจนตาสุดท้าย ตัวเองก็ไม่สามารถมีแต้มนำอีกฝ่ายได้ จึงขอยอมแพ้

นอกจากประเด็นมารยาทของผู้เล่นที่สุภาพกว่าเมื่อยอมแพ้หากรู้ว่าสู้ไม่ได้ เหตุผลหลักจริงๆคือ ถึงจะดื้อดึงเดินจนหมดตาเดิน มันก็ไม่ชนะอยู่ดีอ่ะ ไม่รู้จะเดินต่อไปทำไมให้อายตัวเอง

(บางครั้งคนเล่นมีอารมณ์นำถึงจะรู้ว่าตัวเองแพ้ก็ไม่ยอมรับเดินต่อไปเรื่อยๆจนต้องให้อีกฝ่ายตอนจนมุมอับอายกันไปข้ามจนยอมก็มี น้อยครั้งจะเห็นอะไรแบบนั้นในการแข่งระดับมืออาชีพ อันนี้ยกตัวอย่างให้เห็นภาพเฉยๆ)

ปล. แต้มที่นับกันท้ายเกมคือการนับ 'พื้นที่' ที่แต่ล่ะฝ่ายครองอยู่ครับ การครองพื้นที่ใดๆคือ หมากฝ่ายนั้นต้องล้อมรอบพื้นที่ว่างๆที่เหลืออยู่ ใครมีพื้นที่ว่างมากสุดก็จะชนะ ดังนั้นการกินหมากแต่ละเม็ดไม่ใช่สิ่งจำเป็น มันเป็นแค่วิธีการนำไปสู่ผลลัพท์(ครองพื้นที่) ซึ่งกระดานโก๊ะ 19x19 มีจุดให้วางมากมาย จะวางจุดไหนก็ได้โดยไม่ขัดกติกา ดังนั้นที่ว่าพลาดไม่ใช่พลาดเพราะโดนกิน แต่พลาดปล่อยให้อีกฝั่งยึดพื้นที่ว่างไปครอบครองได้

นักเล่นโกะระดับ 1 ดั้ง(ธรรมดา) ก็สามารถจำตาที่ตัวเองเดินได้ทุกหมากในแต่ละกระดานแล้ว กว่าจะขึ้นระดับได้แต่ละดั้ง ทั้งโหด และก็ใช้เวลามาก
Lee Sedol ระดับ 9 ดั้ง โปร คนระดับนี้ไม่มีทางพลาดครับ เหมือนคนที่ปั่นจักรยานเป็น การเดินพลาดคือการแกล้งปั่นจักรยานไม่เป็นครับ มันเป็นไปไม่ได้

ส่วนในข่าวนี้ผมคิดว่าบอทก็ไม่ได้พลาดหรอกครับ เรียกว่าพลาดคงไม่ถูก แต่มันคงประเมินแล้วต้องเดินแบบนั้น

kiva Sun, 13/03/2016 - 17:40

AlphaGo เหมือนจะดีไปหมดขาดอย่างเดียว ใจ ครับ ถ้าเป็นคนถึงจะรู้ว่าโอกาสชนะน้อยก็ยังสู้ แต่คอมยอมแพ้เลย

put4558350 Sun, 13/03/2016 - 18:14

In reply to by kiva

เป็นมารยาทครับ ถ้าสู้ยังไงก็ไม่ชนะคนเล่นโกะจะยอมรับว่าแพ้ แล้วเอาเวลากลับไปศึกษาว่าพลาดตรงใหน ซึ่งดีกว่าฝืนเล่นต่อไป

คนที่เขียนโปรแกรมก็เข้าใจนะ

AlphaGo resigns: The result "W+Resign" was added to the game information"

Pingz Sun, 13/03/2016 - 18:14

In reply to by kiva

ถ้ารู้ตัวว่าจะแพ้ ตามมารยาทการเล่นโกะคือให้ยอมแพ้ครับ เพราะเสียเวลาอีกฝ่าย
3 กระดานแรกพี่ลีก็เป็นฝ่ายยอมแพ้นะครับ

เป็นมารยาทของการเล่นโกะ ถ้าประเมินแล้วว่าแพ้แน่นอน (ซึ่งผู้เล่นสามารถคำนวณได้) ควรจะโยนหมากยอมแพ้ ลีที่แพ้สามตาก่อนหน้าก็เป็นฝ่ายยอมแพ้ทั้งนั้น และยอมแพ้ทั้งสามกระดาน

ใจสู้ไม่สู้ เขาวัดกันจนถึงจุดที่รู้ผลแพ้ชนะครับ (ไม่ว่าจะเดินจบกระดานหรือไม่ก็ตาม) ถ้าถึงจุดนี้แล้วยังดื้อเล่นต่อ นั่นคือดันทุรัง

นี่เป็นวิถีที่ "มนุษย์" เล่นเกมนี้ครับ

ผม Skype ไปขู่มันเองครับ
บอกว่า อัลฟ่าถ้าเธอชนะอีกรอบ เราจะแกล้งเดินไปเตะปลั๊ก
เอาให้ Hard disk เธอเจ๊งกะบ๊งไปเลย
ได้ผลฮะ กลางกระดาน เดินพลาดเลย เย๊ๆ