SCB 10X เปิดตัว Typhoon-7b เป็นโมเดลสร้างข้อความ หรือ LLM ภาษาไทยที่เอาชนะโมเดลทุกตัวในภาษาไทยตอนนี้ และมีประสิทธิภาพเทียบเท่ากับ GPT-3.5 ในภาษาไทย
การวัดผลประสิทธิภาพของโมเดลในภาษาไทย ทาง SCB 10X ได้พัฒนาชุดทดสอบวัดผลประสิทธิภาพโมเดล LLM ภาษาไทยชื่อ ThaiExam โดยวัดด้วยข้อสอบสำหรับเด็กมัธยมศึกษาตอนปลายและข้อมูลด้านการลงทุนจากผู้เชี่ยวชาญด้านการลงทุนในประเทศไทย พบว่าประสิทธิภาพโมเดล Typhoon-7b เหนือกว่าทุกโมเดลที่ปล่อยฟรีในภาษาไทยและมีคะแนนเทียบเท่ากับ GPT-3.5

นอกจากนี้ ทาง SCB 10X ได้ปล่อยโมเดลให้ใช้งานฟรี (Apache License 2.0) เป็นโมเดลพื้นฐานที่ยังไม่ผ่านการ fine tuning ใด ๆ หากใครต้องการนำไปใช้งาน แนะนำให้ fine tuning ด้วยข้อมูลที่ต้องการก่อนนำไปใช้งานจริง
รายละเอียดเชิงลึก โมเดลพัฒนาต่อมาจาก Mistral-7B โดยใส่ภาษาไทยเข้าไป 5 พันคำ แล้วเทรนโมเดลต่อจากเดิมด้วย LoRA ผลการทดลองพบว่า โมเดล Typhoon-7b สามารถประหยัดจำนวนคำ (token) ภาษาไทยได้มากกว่า GPT-4 ถึง 2.62 เท่า

โมเดลบน HF: https://huggingface.co/scb10x/typhoon-7b
on
เจ๋งเลยอ่ะ
Mr.EYE Sat, 23/12/2023 - 10:55
เจ๋งเลยอ่ะ
มันคืออะไรนะอันนีั
langisser Mon, 25/12/2023 - 09:28
มันคืออะไรนะอันนีั มันทำให้เราถามตอบด้วยภาษาไทยได้ดีขึ้นใช่มะ
ถ้ารวมๆ ก็ใช่ครับ
LuvStry Tue, 26/12/2023 - 09:54
In reply to มันคืออะไรนะอันนีั by langisser
ถ้ารวมๆ ก็ใช่ครับ
เยี่ยม เลย
tom789 Mon, 25/12/2023 - 12:17
เยี่ยม เลย