Tags:
Node Thumbnail

กูเกิลเผยแพร่รายงานวิจัยการพัฒนาแชตบอทที่เหมือนมนุษย์โดยไม่ระบุหัวข้อ (Towards a Human-like Open-Domain Chatbot) ที่นำเสนอปัญญาประดิษฐ์ที่ชื่อว่า Meena เป็นโมเดลปัญญาประดิษฐ์ขนาดใหญ่ 2.6 พันล้านพารามิเตอร์ ฝึกด้วยชุดข้อมูลขนาด 341 กิกะไบต์ เพื่อให้ได้แชตบอตที่คุยเรื่องอะไรก็ได้ (open domain)

Meena คือปัญญาประดิษฐ์ที่อ่านข้อความก่อนหน้า แล้วพยายามคาดเดาประโยคที่ควรตอบกลับถัดไป ภายในของ Meena เป็นบล็อคปัญญาประดิษฐ์สถาปัตยกรรม Evolved Transformer ที่กูเกิลเสนอไว้เมื่อปีที่แล้ว แบ่งเป็นบล็อค encoder หนึ่งบล็อค และบล็อค decoder อีก 13 ชั้น ด้วยความที่พารามิเตอร์มีจำนวนมากทำให้ Meena มีความสามารถสูง

No Description

บทสนทนาระหว่าง Meena และมนุษย์ที่ Meena เล่นมุกตลก

ข้อมูลที่ใช้ฝึก Meena เป็นข้อมูลที่กวาดมาจากเว็บสังคมออนไลน์ทั้งหลายที่มีการโต้ตอบกันในโพสสาธารณะ ปริมาณ 341 กิกะไบต์ หากเทียบกับ GPT-2 ของ OpenAI นั้นมีขนาด 1.5 พันล้านพารามิเตอร์ และฝึกด้วยข้อมูลขนาด 40 กิกะไบต์ก็นับว่า Meena ใหญ่กว่ามาก ทีมงานกูเกิลไม่ได้เ้ทียบกับ GPT-2 ตรงๆ แต่ไปเทียบกับ DialoGPT ที่ไมโครซอฟท์นำ GPT-2 มาพัฒนาต่อเป็นแชตบอต

No Description

เกณฑ์การเปรียบเทียบปัญญาประดิษฐ์ที่คุยเรื่องอะไรก็ได้เช่นนี้ยังไม่มีมาตรฐานกลางนัก กูเกิลนำเสนอมาตรวัดใหม่ที่ชื่อว่า Sensibleness and Specificity Average (SSA) วัดความสมเหตุสมผล (sensible) โดยใช้คนจำนวนมากนับพันคนมามองแชตโต้ตอบระหว่างคนและแชตบอตจำนวน 100 บทสนทนา และเลือกว่าบทสนทนานี้สมเหตุสมผลหรือไม่ ผลที่ได้คือ Meena นั้นมีบทสนทนาที่สมเหตุสมผลถึง 79% เริ่มใกล้เคียงกับคนที่แชตกันจริงๆ ที่ได้คะแนน 86% ส่วนแชตบอตอื่นๆ นั้นได้คะแนนสูงสุด 56% เท่านั้น

การใช้ SSA มีปัญหาคือไม่สามารถใช้คอมพิวเตอร์มาวัดโดยอัตโนมัติได้ แต่กูเกิลพบว่าการวัด perplexity (ความงุนงง) ที่วัดความไม่แน่นอนของโมเดลภาษามีค่าสัมพันธ์กับค่า SSA อย่างมาก (R2=0.93) โดยทีมงานวัดค่า SSA ของโมเดล Meena จำนวน 8 รุ่นระหว่างการพัฒนา มาเทียบกับค่า perplexity จึงเห็นความสัมพันธ์นี้ ทำให้เป็นไปได้ว่าเราสามารถตั้งเป้าหมายลด perplexity ของโมเดลปัญญาประดิษฐ์โดยอัตโนมัติ ก่อนจะใช้วัด SSA ซึ่งต้องใช้แรงงานคนจำนวนมากและมีค่าใช้จ่ายสูงในภายหลัง

กูเกิลไม่เปิดเผยโมเดลของ Meena ออกสู่สาธารณะเนื่องจากกังวลว่าอาจจะมีความเสี่ยง แต่กำลังพิจารณาว่าจะเปิดเผยออกมาหรือไม่ในอนาคต

ที่มา - Google AI Blog

Get latest news from Blognone

Comments

By: A4
iPhoneAndroidRed HatSUSE
on 29 January 2020 - 03:09 #1145603
A4's picture

กินข้าวยัง

By: big50000
AndroidSUSEUbuntu
on 29 January 2020 - 04:02 #1145604
big50000's picture

อยากให้ทำได้ระดับนี้
alt="Siri ลำดวน"

By: skycreeper
iPhoneBlackberryUbuntu
on 29 January 2020 - 05:01 #1145607

แป๊ก -> แป้ก (เสียงโท)

By: dtobelisk
AndroidWindows
on 29 January 2020 - 07:14 #1145610 Reply to:1145607
dtobelisk's picture

จะเข้ามาแก้คำนี้เหมือนกัน

By: TheOrbital
iPhoneWindows PhoneAndroidSymbian
on 29 January 2020 - 08:14 #1145615
TheOrbital's picture

ความสมเหตุสมผลระหว่างคนกับคน 86% ^ ^"

Bovine Science กะ Hayward นี่ตบมุกกันโบ๊ะบ๊ะๆ เลยทีเดียว 5555
แล้วในกรณีนี้ Mena มันเปิดมุกให้ด้วยนะ ไม่รู้เตี๊ยมกันแล้วเมคมาหรือเปล่า
ว่าแต่ว่า มีภาษาไทยและมุกภาษาไทยไหม

By: AlninlA
ContributorAndroidUbuntu
on 29 January 2020 - 11:11 #1145662
AlninlA's picture

Honesty 95% Humor 75%

By: lew
FounderJusci's WriterMEconomicsAndroid
on 29 January 2020 - 11:17 #1145664 Reply to:1145662
lew's picture

Self Destruction Initiated 9.. 8.. 7...


lewcpe.com, @wasonliw

By: -Rookies-
ContributorAndroidWindowsIn Love
on 29 January 2020 - 22:35 #1145749 Reply to:1145664

โว้ยยยย ๕๕๕๕๕๕๕๕ เกือบตกเก้าอี้!!


เทคโนโลยีไม่ผิด คนใช้มันในทางที่ผิดนั่นแหละที่ผิด!?!

By: impascetic
Android
on 29 January 2020 - 11:57 #1145672

แป้กมาตั้งแต่หัวข่าว...

By: artiya4u
AndroidUbuntu
on 30 January 2020 - 11:00 #1145803
artiya4u's picture

หัวข้อข่าวนี้ใช้ Meena หรือเปล่าครับ