Tags:
Node Thumbnail

ในการทดลองนี้ได้ใช้ neural networks แบบ LSTM มาเรียนรู้แบบจำลองภาษาระดับอักขระจากวรรณคดีเรื่องพระอภัยมณีที่มีประมาณสองล้านตัวอักษร โดยเมื่อเรียนรู้แล้วแบบจำลองภาษาให้ค่า bit per character ในชุดข้อมูลทดสอบเท่ากับ 2.0631

เมื่อให้แบบจำลองนี้ทำการผลิตลำดับของตัวอักษรตามความน่าจะเป็นที่ได้จากการเรียนรู้มา พบว่าผลลัพธ์ที่ได้มีความละม้ายคล้ายคลึงกับบทกลอนที่อยู่ในวรรณคดีเรื่องพระอภัยมณีอยู่พอสมควร ในด้านฉันทลักษณ์มีการจัดวรรคตอนได้ถูกต้อง จำนวนพยางค์ในแต่ละวรรคตรงตามข้อกำหนด และมีสัมผัสใน

ผู้สนใจสามารถดูข้อมูลที่แบบจำลองผลิตมาจำนวนหนึ่งล้านตัวอักษรได้ที่นี่ และสามารถเทียบกับวรรณคดีของจริงได้ที่นี่

ที่มา - Medium

Get latest news from Blognone

Comments

By: lew
FounderJusci's WriterMEconomicsAndroid
on 26 June 2018 - 15:04 #1057451
lew's picture
  • ใครเป็นคนทำครับ (หลักการเขียน ใคร ทำอะไร อย่างไร) ท้าวความสักหน่อยว่าใครเป็นคนทำ
  • "bit per character ในชุดข้อมูลทดสอบเท่ากับ 2.0631" อันนี้ไม่แน่ใจว่าแปลว่าอะไรครับ
  • "ความละม้ายคล้ายคลึงกับบทกลอนที่อยู่ในวรรณคดีเรื่องพระอภัยมณีอยู่พอสมควร" การฝึกโมเดลปกติคงมีฟังก์ชั่นการวัดอยู่แล้ว ก็ควรบอกได้ว่าความคล้ายนี่หมายถึงอย่างไร หรือยกตัวอย่างที่ generate ออกมาแล้วได้

lewcpe.com, @public_lewcpe

By: kasemrut on 26 June 2018 - 23:45 #1057541

น่าสนใจ ขอบคุณสำหรับข้อมูล