Alibaba ออกโมเดลปัญญาประดิษฐ์ใหม่ชุดใหญ่ในซีรีส์ Qwen3 ซึ่งทั้งหมดเป็นโมเดลโอเพนซอร์ส มีรายละเอียดดังนี้
Qwen3-VL โมเดลที่สามารถเข้าใจรูปภาพ-ข้อความ โมเดลหลักคือ Qwen3-VL-235B-A22B ทำงานได้ทั้งโหมด Instruct และ Thinking ผลทดสอบคะแนนดีกว่า Gemini 2.5 Pro
จุดเด่นของ Qwen3-VL คือทำงานบนสมาร์ทโฟนได้ดี, สามารถแปลงภาพจับหน้าจอ เขียนออกมาเป็นโค้ดได้, OCR รองรับ 32 ภาษา, context 256K สเกลได้ถึง 1M, ทำความเข้าใจภาพได้ทั้ง 2D และ 3D ฯลฯ
โมเดลอื่นที่ประกาศพร้อมกันโดยกลุ่มนี้เปิดให้ใช้งานผ่าน API เท่านั้นได้แก่ Qwen3-Coder รุ่นอัปเกรด ทำคะแนนทดสอบ SWE-Bench สูงขึ้นเป็น 69.6, Qwen3-LiveTranslate-Flash โมเดลสำหรับการแปลภาษา ทำงานเร็ว แปลภาษาจากภาพหรือข้อความบนจอได้ รองรับถึง 18 ภาษา และ Qwen3-Max ระบุว่าเป็นโมเดลขนาดใหญ่ที่สุดที่เคยมีมา พารามิเตอร์มากกว่า 1T ฝึกฝนมากกว่า 36T โทเค็น
นอกจากนี้ Alibaba ยังออก Qwen3Guard โมเดลสำหรับปรับการสนทนาให้มีความปลอดภัย คล้ายกับ Llama Guard ของ Meta
ที่มา: Simon Willison Blog
on