By mk Founder on Tag: DeepMind, LLM, Archeology, Google, Natural Language
DeepMind

DeepMind เปิดตัว Aeneas โมเดลทำความเข้าใจภาษาละตินโบราณ ช่วยงานเวลานักโบราณคดีค้นพบโบราณวัตถุ ที่มีข้อความโบราณซึ่งอาจอ่านไม่ออก หรือมีข้อความบางส่วนขาดหายไป

ก่อนหน้านี้ DeepMind มีโมเดลชื่อ Ithaca สำหรับอ่านข้อความภาษากรีกโบราณ และนำมาพัฒนาต่อจนเป็น Aeneas สำหรับภาษาละตินในยุคโรมัน

จุดเด่นของ Aeneas คือการพยากรณ์ข้อความที่ขาดหายไปได้ โดยไม่รู้แม้กระทั่งความยาวของข้อความที่หายไปว่ายาวเท่าไร โมเดลยังรองรับอินพุตแบบ multimodal คือใช้ได้ทั้งภาพและข้อความพร้อมกัน, รองรับ parallel search ค้นหาข้อความลักษณะคล้ายๆ กันในคลังข้อความภาษาละตินโบราณอื่น

By pythainlp on Tag: PyThaiNLP, Natural Language, Python
PyThaiNLP

วันนี้ 10 กุมภาพันธ์ พ.ศ.2567 ทาง PyThaiNLP ชุดคำสั่งเครื่องมือประมวลข้อความภาษาไทยสำหรับงานวิเคราะห์ข้อมูล ภาษาศาสตร์ งานปัญญาประดิษฐ์ แบบโอเพ่นซอร์ส ได้ปล่อย PyThaiNLP รุ่น 5.0 หลังจากที่ปล่อย PyThaiNLP 4.0 ไปเมื่อปีก่อน โดย PyThaiNLP 5.0 มีการเปลี่ยนแปลงสรุปได้ดังนี้

By pythainlp on Tag: PyThaiNLP, Natural Language, Python
PyThaiNLP

วันนี้ทาง PyThaiNLP ได้ปล่อย PyThaiNLP รุ่น 4.0 (Real) เป็นที่เรียบร้อย โดย PyThaiNLP เป็นชุดคำสั่งสำหรับงานประมวลผลภาษาไทย เพื่อใช้งานในการวิเคราะห์ข้อมูลภาษาไทย

สำหรับรุ่น 4.0 นี้เน้นไปเรื่องการปรับปรุงประสิทธิภาพเป็นหลัก ปรับปรุงการตัดคำ แก้ไขปัญหาด้านโมเดล

ส่วนความสามารถใหม่กับโมเดลใหม่ของ PyThaiNLP 4.0 มีดังนี้

By tontan Contributor on Tag: PyThaiNLP, Natural Language, Python
PyThaiNLP

วันนี้ 24 กันยายน ค.ศ.2022 ทางทีมพัฒนา PyThaiNLP ได้ปล่อยแพ็กเกจประมวลผลภาษาไทย PyThaiNLP รุ่น 3.1 บนภาษาไพธอนอย่างเป็นทางการ

สำหรับ PyThaiNLP 3.1 สรุปการเปลี่ยนแปลงได้ดังนี้

By tontan Contributor on Tag: PyThaiNLP, Natural Language, Python
PyThaiNLP

วันนี้ 30 มกราคม พ.ศ.2565 ทางทีมพัฒนา PyThaiNLP ได้ปล่อยแพ็กเกจประมวลผลภาษาธรรมชาติ PyThaiNLP รุ่น 3.0 หลังจากที่ปล่อย PyThaiNLP 2.3 ไปเมื่อปีก่อน

PyThaiNLP 3.0 มีความเปลี่ยนแปลงสรุปได้ดังนี้

Google Assistant

Google Assistant เพิ่มฟังก์ชั่นใหม่หลายอย่าง อย่างแรกคือให้ผู้ใช้งานสอน AI อ่านออกเสียงคำที่ออกเสียงยากโดยเฉพาะชื่อคน ผู้ใช้งานสามารถกดอัดเสียงตัวเองเข้าไปเพื่อสอนให้ Google Assistant อ่านออกเสียงตามได้ถูกต้องในภายหลัง เมื่อแอปอัพเดตแล้วจะมองเห็นช่องทางให้สอนอ่านออกเสียง กดที่ Record your own เพื่ออัดเสียงของตัวเองเข้าไป กูเกิลบอกด้วยว่า ระบบไม่บันทึกเสียงของผู้ใช้ และเริ่มใช้งานในภาษาอังกฤษก่อน

ฟังก์ชั่นถัดมาคือการตั้งเวลา ปัจจุบันผู้ใช้งานมักใช้ Google Assistant ในการตั้งเวลาหรือตั้งปลุกเพื่อทำอะไรบางอย่าง ล่าสุดกูเกิลพัฒนาการรับรู้ Google Assistant ให้ฉลาดมากขึ้นเมื่อเปลี่ยนคำสั่งกลางคัน

By tontan Contributor on Tag: Python, Natural Language, PyThaiNLP
Python

วันที่ 31 มีนาคม พ.ศ.2564 ไลบรารีภาษาไพธอนสำหรับประมวลผลภาษาไทย PyThaiNLP ได้ปล่อยเวอร์ชัน 2.3 โดยสรุปความเปลี่ยนแปลงได้ดังนี้

By tontan Contributor on Tag: Thailand, Artificial Intelligence, Natural Language
Thailand

วันนี้ทางสถาบันวิจัยปัญญาประดิษฐ์ประเทศไทยเปิดตัวชุดข้อมูลจำแนกอารมณ์จากเสียงพูดภาษาไทย (Thai Speech Emotion Recognition) หลังจากใช้เวลาพัฒนา 2 ปี ภายใต้ความร่วมมือของจุฬาลงกรณ์มหาวิทยาลัย และได้รับการสนับสนุนโดยบริษัท แอดวานซ์ อินโฟร์ เซอร์วิส จำกัด

ชุดข้อมูลจำแนกอารมณ์จากเสียงพูดภาษาไทยประกอบไปด้วย 5 อารมณ์ ได้แก่ โกรธ เศร้า สุข หงุดหงิด ปกติ นักแสดง 200 คน (ชาย 87 และหญิง 113) จำนวน 36 ชม. (23,797 ประโยค) ถือเป็นชุดข้อมูลจำแนกอารมณ์จากเสียงพูดภาษาไทยที่ใหญ่ที่สุด ณ ปัจจุบัน

By tontan Contributor on Tag: Thailand, Artificial Intelligence, Natural Language
Thailand

สถาบันวิจัยปัญญาประดิษฐ์ประเทศไทย (VISTEC-depa Thailand Artificial Intelligence Research Institute) ปล่อยโมเดล WangchanBERTa ซึ่งเป็นโมเดลทางภาษาไทยสำหรับงานประมวลผลภาษาธรรมชาติโดยฝึกฝนบนสถาปัตยกรรม RoBERTa

โมเดล WangchanBERTa ถูกฝึกฝนด้วยชุดข้อมูลกว่า 78.48 GB ใช้ตัวตัดคำย่อย SentencePiece ในการแบ่งคำและ ใช้เวลาฝึกฝนโมเดล 3 เดือน

ทำให้โมเดล WangchanBERTa ถือเป็นโมเดลภาษาไทยที่ใหญ่ที่สุด ณ ขณะนี้ ซึ่งในการฝึกฝนใช้ไฟฟ้าทั้งหมด 10,566.5 kWh หรือคิดเป็นรอยเท้าคาร์บอน 7.5 ตัน เทียบเท่าการใช้รถ 1.6 คันในหนึ่งปี

By tontan Contributor on Tag: Python, Thailand, Natural Language, PyThaiNLP
Python

วันที่ 24 มิถุนายน พ.ศ.2563 ไลบรารี PyThaiNLP ซึ่งเป็นไลบรารีประมวลผลภาษาไทยแบบโอเพนซอร์สในภาษาไพธอน ได้ออกรุ่น 2.2 โดยเน้นปรับปรุงประสิทธิภาพการทำงานของไลบรารี โดยสรุปความเปลี่ยนแปลงได้ดังนี้

By lew Founder on Tag: Artificial Intelligence, Google, Natural Language
Artificial Intelligence

ทุกวันนี้ระบบปัญญาประดิษฐ์สำหรับประมวลผลภาษา (natural language processing - NLP) ตัวที่ดีที่สุดคือ BERT เสนอโดยกูเกิลเมื่อปลายปี 2018 แม้ประสิทธิภาพจะค่อนข้างดีจนกูเกิลนำมาใช้ในบริการค้นหาแล้ว แต่ปัญหาของ BERT คือมีขนาดใหญ่มาก โมเดลเริ่มต้นมีขนาด 108 ล้านพารามิเตอร์และขนาด xlarge นั้นขึ้นไปถึง 1,270 ล้านพารามิเตอร์ ปีนี้ทีมวิจัยกูเกิลเสนอโมเดล ALBERT ที่เป็นโมเดลขนาดเล็กลง แต่ยังคงประสิทธิภาพที่ใกล้เคียงกัน โดยเฉพาะ ALBERT ในขนาดใหญ่สุด 235 ล้านพารามิเต

Kasikorn Bank

KBTG หรือ KASIKORN Business-Technology Group ประกาศความร่วมมือกับ ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (NECTEC ในสังกัด สวทช.) และจุฬาลงกรณ์มหาวิทยาลัยเปิดตัวโครงการ Thai NLP ร่วมพัฒนาเทคโนโลยีประมวลผลภาษาธรรมชาติของภาษาไทย โดยเปิดเป็น Open API และตั้งเป้าสร้างและพัฒนาระบบนิเวศน์ ไปจนถึงชุมชนของ NLP ภาษาไทยขึ้นมาเอง โดยมีคุณขัตติยา อินทรวิชัย กรรมการผู้จัดการ ธนาคารกสิกรไทยมาเป็นประธานในการเปิดตัว NLP

Excel

ไมโครซอฟท์ทยอยเพิ่มฟีเจอร์ด้าน AI ให้กับแอพในกลุ่ม Office อยู่เรื่อยๆ รอบนี้เป็นคิวของ Excel ที่ได้ฟีเจอร์สำคัญคือรองรับการค้นหาด้วยภาษาธรรมชาติ (natural language query) เพื่อเราสามารถดูสรุปข้อมูลในตาราง โดยไม่ต้องใส่สูตร!

ตัวอย่างการใช้งานเช่น เรามีข้อมูลยอดขายสินค้าประเภทต่างๆ อยู่ในตารางอยู่แล้ว เราสามารถพิมพ์ what were the sales for clothing products? ในช่องค้นหา จากนั้น Excel จะสรุปยอดขายของสินค้าหมวดเสื้อผ้าออกมาเป็นชาร์ทให้ทันที

Google

กูเกิลประกาศเริ่มใช้งานโมเดลประมวลภาษาธรรมชาติ (natural language processing - NLP) แบบ deep learning ที่บริษัทโอเพนซอร์สออกมาเมื่อปีที่แล้วที่ชื่อว่า BERT ในการทำความเข้าใจคำค้นใน Google Search เพื่อให้เข้าใจความหมายของวลีที่ผู้ใช้กำลังค้นหาได้ดีขึ้น

ก่อนหน้านี้ผู้ใช้มักพยายามเพิ่มคำสำคัญที่ถูกต้อง เพราะเว็บค้นหามักใช้คำเหล่านี้ค้นฐานข้อมูล โดยไม่ได้ใช้คำขยายหรือคำบุพบทมาเป็นส่วนสำคัญ แต่การประมวลผลแบบ NLP ทำให้กูเกิลเข้าใจคำค้นได้ตรงความต้องการแม้จะค้นเหมือนพูดคุยกับคนอยู่ก็ตาม

By nutmos Writer on Tag: Facebook, Natural Language, Open Source
Facebook

Facebook AI Research ประกาศโอเพ่นซอร์ส PyText เฟรมเวิร์คการประมวลผลภาษาธรรมชาติหรือ NLP ให้นักพัฒนาและผู้ที่สนใจทั่วไปนำไปใช้งานได้แล้ว

PyText นั้นเป็นเครื่องมือการทำโมเดล NLP ที่ใช้ deep learning โดยตัวเฟรมเวิร์คนั้นถูกพัฒนาขึ้นมาจาก PyTorch ซึ่งปัจจุบัน Facebook ใช้ PyText กับหน้าจออัจฉริยะ Portal และระบบผู้ช่วยส่วนตัวบน Messenger ที่ชื่อว่า M โดยเฟรมเวิร์คนี้พัฒนาขึ้นเพื่อตอบโจทย์ของ Facebook ที่ต้องการเครื่องมือ NLP แบบเรียลไทม์ และมี latency ต่ำ รวมถึงทำงานได้แบบไร้รอยต่อกับเวิร์คโฟลวในการวิจัยและโปรดักชั่น

By arjin Writer on Tag: Google Assistant, Google, Google Home, Natural Language
Google Assistant

กูเกิลประกาศเพิ่มคุณสมบัติใหม่ให้กับ Google Assistant โดยผู้ใช้งานสามารถตั้งค่าภาษาที่รองรับได้เพิ่มเป็น 2 ภาษา ผ่านแอป Google Home ทำให้อุปกรณ์ Google Home สามารถรับฟังคำสั่งและโต้ตอบได้ถึง 2 ภาษา จากเดิมที่ต้องเลือกภาษาเดียว

ฟีเจอร์นี้กูเกิลเคยพูดถึงในงาน Google I/O ที่ผ่านมาว่าอยู่ในขั้นตอนการพัฒนา ทั้งนี้ภาษาที่รองรับการจับคู่ 2 ภาษา ยังมีจำกัดอยู่ ได้แก่ อังกฤษ, เยอรมัน, สเปน, อิตาลี และญี่ปุ่น นอกจากนี้ในอนาคตกูเกิลบอกว่าจะเพิ่มการรองรับให้เป็น 3 ภาษา

By arjin Writer on Tag: Google Translate, Deep Learning, Natural Language
Google Translate

Google Translate ประกาศอัพเดต โดยเพิ่มการแปลภาษาแบบออฟไลน์สำหรับแอปมือถือด้วย Neural Machine Translation ใน 59 ภาษา ที่ทำให้การแปลระดับประโยคถูกต้องมากขึ้น (จากที่แปลเป็นคำ) ซึ่งปัจจุบันวิธีการนี้มีใช้แล้วอยู่ในแบบออนไลน์ แต่ในระดับออฟไลน์ยังไม่มี

By lew Founder on Tag: AWS, Natural Language, Artificial Intelligence
AWS

AWS เปิดตัว API ด้านภาษาชุดใหม่ทำให้ความสามารถด้านภาษาเริ่มมีฟีเจอร์เทียบเท่ากูเกิลมากขึ้น โดย API ที่เพิ่มมาได้แก่

By nutmos Writer on Tag: Google, Natural Language, G Suite
Google

Google เพิ่มฟีเจอร์ใหม่ด้านความเข้าใจภาษาธรรมชาติให้กับ Google Cloud Search ซึ่งเป็นบริการเสิร์ชเอนจินสำหรับบริษัทเพื่อช่วยในการค้นหาไฟล์หรือรายละเอียดต่าง ๆ ตามที่ต้องการ

การเพิ่มฟีเจอร์ภาษาธรรมชาติบน Google Cloud Search นี้จะช่วยให้ผู้ใช้สามารถถามรายละเอียดอย่างเช่น "Docs shared by Mary," "Who’s Bob’s manager?" หรือ "What docs need my attention?" จากนั้น Cloud Search จะแสดงคำตอบเป็นการ์ดให้

By mk Founder on Tag: Facebook Messenger, Chat Bot, Natural Language, Facebook, Facebook
Facebook Messenger

Facebook เปิดตัว Messenger Platform เวอร์ชัน 2.0 ในงาน f8 เมื่อเดือนเมษายน เพื่อเปิดให้องค์กรภายนอกเข้ามาเชื่อมต่อระบบกับ Messenger ผ่านแชทบ็อตได้

ล่าสุด Facebook ออก Messenger Platform เวอร์ชัน 2.1 ที่มีความสามารถมากขึ้นดังนี้

Subscribe to Natural Language