Tags:
Node Thumbnail

DeedMind สร้างปัญญาประดิษฐ์ Ithaca สำหรับอ่านบันทึกภาษากรีกจากศิลาจารึกที่มักมีส่วนที่ขาดหายไป แล้วเติมข้อความที่ขาดหาย, ทำนายแหล่งกำเนิดของบันทึก, และทำนายช่วงเวลาบันทึก

การสร้างปัญญาประดิษฐ์อาศัยชุดข้อมูล Packard Humanities Institute (PHI) ที่บันทึกข้อความจากจารึกต่างๆ ถึง 178,551 ชุด โดยมีหมายเลขประจำข้อความ, ช่วงเวลา, และสถานที่ที่บันทึก โดยมีข้อความที่ใช้ฝึกปัญญาประดิษฐ์ได้ 78,608 ชุด

Ithaca แบ่งออกเป็นสองชั้น คือส่วนลำตัว (torso) สำหรับอ่านข้อความ โดยภายในเป็นสถาปัตยกรรมแบบ transformer ที่มักใช้ในการประมวลผลภาษา ในชั้นที่สองจะมีหัวสามหัวเป็นโมเดลปัญญาประดิษฐ์สำหรับทำนายค่าต่างๆ ทั้งข้อความที่หายไป, พื้นที่ที่บันทึกข้อความ, และช่วงเวลาที่บันทึก

ตัว Ithaca ถูกออกแบบให้ช่วยเหลือนักโบราณคดี การทำนายจึงแจกแจงความมั่นใจของค่าต่างๆ ที่เป็นไปได้ หากดูการทำนายข้อความหายจาก Ithaca จะให้ความแม่นยำ 62% แต่หากทำงานร่วมกับนักโบราณคดีจะได้ความแม่นยำถึง 72% ขณะที่ การทำนายแหล่งที่มาแม่นยำ 71% และการทำนายช่วงเวลาได้ช่วงเวลาใกล้เคียงข้อมูลห่างกันน้อยกว่า 30 ปี

ทาง DeepMind หวังว่าจะมีการทำ Ithaca ไปใช้กับงานวิจัยหรือพิพิธภัณฑ์ต่อไปในอนาคต โดยตอนนี้เปิดปัญญาประดิษฐ์ให้ใช้งานฟรี และมีเวอร์ชั่นโอเพนซอร์สให้ไปพัฒนาต่อ

ที่มา - DeepMind

No Description

Get latest news from Blognone

Comments

By: akira on 13 March 2022 - 09:10 #1243240

จริงๆ แล้วโมเดลนี้น่าจะยังต่อยอดได้อีกเยอะ ถ้าออกแบบมาดีก็เพียงปรับสมการ ก็น่าจะทำนายข้อความที่คนรุ่นใหม่มักย่อความในการพิมพ์ Chat ทำให้ปัญญาประดิษฐ์ทราบเป้าหมายที่แท้จริงของผู้ส่งสาร รวมถึงประยุกค์ใช้ในการจดบันทึกย่อ เพื่อให้ปัญญาประดิษฐ์เก็บเป็นค่า Exp สำหรับเรียนรู้ได้ เพราะถ้าต่อไปจำเป็นต้องบันทึกลงหน่วยความจำที่ไม่ได้ต่อเข้ากับ internet ก็จำเป็นต้องมีวิธีเพื่อให้บันทึกให้ได้มากที่สุด เพื่อให้เป็น knowledge สำหรับระบบที่ต้องทำงานแบบอิสระ เท่าที่เคยอ่านผ่านๆ NLP มันเรียนรู้จากโครงสร้างภาษา ไม่ได้ยึดติดกับภาษาใดภาษาหนึ่ง