Tags:
Node Thumbnail

วันที่ 10 ธันวาคม พ.ศ.2562 ไลบรารี PyThaiNLP ซึ่งเป็นไลบรารีประมวลผลภาษาไทยแบบโอเพนซอร์สในภาษาไพธอน ได้ออกรุ่น 2.1 โดยสรุปความสามารถใหม่ดังนี้

  • เพิ่ม AttaCut ตัวตัดคำที่เร็วและแม่นยำ เรียกใช้ผ่าน engine="attacut" ใน pythainlp.tokenize.word_tokenize สามารถอ่านวิธีการทำงานของ AttaCut ตามที่นำเสนอที่ New in ML Workshop, NeurIPS 2019 ได้ที่ arxiv.org/abs/1911.07056
  • เพิ่ม ssg ตัวตัดพยางค์แบบ CRF
  • เพิ่มตัววัดประสิทธิภาพตัวตัดคำ
  • เพิ่มคลังข้อมูลชื่อผู้หญิงและผู้ชาย
  • เพิ่ม tag ทำนอง HTML สำหรับ NER ครอบข้อความที่มีชื่อ
  • เพิ่ม pythainlp.util.thai_time สำหรับแปลงเวลาเป็นคำอ่านภาษาไทย

สามารถอ่านรายละเอียดได้ที่ github.com/PyThaiNLP/pythainlp/issues/181

ที่มา : PyThaiNLP 2.1 : PyThaiNLP GitHub

No Description

Get latest news from Blognone

Comments

By: lew
FounderJusci's WriterMEconomicsAndroid
on 10 December 2019 - 21:56 #1140005
lew's picture

ขอปรับหัวข่าวกับเพิ่มภาพตัวอย่างโค้ดนะครับ


lewcpe.com, @wasonliw

By: tontan
ContributorAndroidSymbianUbuntu
on 10 December 2019 - 22:05 #1140006 Reply to:1140005

ขอบคุณครับคุณลิ่ว


บล็อก:wannaphong.com บล็อก Python 3

By: btoy
ContributorAndroidWindows
on 11 December 2019 - 10:35 #1140049
btoy's picture

เยี่ยมครับ


..: เรื่อยไป

By: nawaphon2539
iPhoneWindows PhoneAndroidSymbian
on 11 December 2019 - 16:20 #1140125

ยินดีด้วยครับ ผมใช้ library นี้เป็น 1 library ในโปรเจคจบผมเลยครับ