Qwen
Alibaba เปิดตัว Qwen3-Omni โมเดลโอเพนซอร์สในตระกูล Qwen3 ที่รองรับอินพุทผสมผสานทั้งข้อความ ภาพ เสียง วิดีโอ รุ่นถัดจาก Qwen2.5-Omni โดยสามารถสร้างเอาท์พุตได้ทั้งข้อความและเสียง โมเดลทำงานบนสถาปัตยกรรมที่เรียกว่า Thinker–Talker โดยส่วน Thinker สามารถทำความเข้าใจอินพุทที่หลากหลาย ส่วน Talker มีความสามารถการสร้างเสียงโต้ตอบที่เป็นธรรมชาติ
จุดเด่นของ Qwen3-Omni มีหลายอย่าง ทั้งการทำคะแนนสูงสุดในการทดสอบผลลัพธ์เสียง 22 จาก 36 หัวข้อ, รองรับการสร้างเอาท์พุทข้อความ 119 ภาษา, เข้าใจเสียงได้ 19 ภาษา (ไม่มีไทย) และสร้างเสียงโต้ตอบได้ 10 ภาษา (ไม่มีไทย), ความหน่วงต่ำถึง 211ms กรณีอินพุทแบบเสียง, รับอินพุทไฟล์เสียงสูงสุด 30 นาที ฯลฯ