Mistral บริษัทปัญญาประดิษฐ์จากฝรั่งเศส เปิดตัวโมเดลชุดใหม่ Mistral 3 เป็นโมเดลแบบเปิด (open weight) ที่ประกอบด้วยโมเดล 2 กลุ่มคือ
Mistral Large 3 โมเดลรุ่นใหญ่ขนาดพารามิเตอร์ 675B ที่เบนช์มาร์คชนะ DeepSeek-V3.1 และ Kimi K2 (ชนะแบบเฉียดๆ แต่ก็ชนะ แพ้ในเรื่องเขียนโค้ด) ถือเป็นโมเดลแบบเปิด กลุ่ม non-reasoning ที่มีผลงานดีเป็นอันดับสองร่วมบน LMArena (ที่หนึ่งตอนนี้คือ DeepSeek-V3.2 แบบ non-reasoning)
ความสามารถของ Mistral Large 3 ย่อมทำให้มันกลายเป็นโมเดลกลุ่มเปิดระดับท็อปๆ ในตอนนี้ อยู่ในลีกเดียวกับ DeepSeek-V3.1, Kimi K2 และ Z.ai GLM 4.6
Mistral ยังร่วมมือกับ NVIDIA พัฒนาการบีบอัดโมเดลให้รันบน Blackwell NV72 ได้มีประสิทธิภาพมากขึ้น หรือถ้าเครื่องเล็กลงหน่อยก็สามารถยัดลงเครื่องที่มี NVIDIA A100 จำนวน 8 ตัวได้ด้วย


Ministral 3 โมเดลไซส์เล็กสำหรับรันในเครื่อง edge machine มีให้เลือก 3 ขนาดคือ 3B, 8B, 14B แต่ละขนาดมี 3 เวอร์ชันย่อยคือ base, instruct, reasoning (รวมเป็น 9 โมเดลย่อย) ให้ประสิทธิภาพดีกว่าโมเดลขนาดใกล้เคียงกันคือ Gemma 3 4B/12B ของกูเกิล และประหยัดโทเคนกว่า Qwen3-VL ของ Alibaba

โมเดลทุกตัวในตระกูล Mistral 3 ใช้สัญญาอนุญาตแบบเปิด Apache 2.0 เปิดให้ใช้งานแล้วบนแพลตฟอร์มคลาวด์ต่างๆ และดาวน์โหลดได้จาก Hugging Face
ที่มา - Mistral
on
Mistral จะรอดไหมนี่…
tontan Wed, 03/12/2025 - 12:49
Mistral จะรอดไหมนี่ ทำตัวใหญ่ออกมายังสู้ deepseek ไม่ได้ และในหน้าโมเดลเขียนอีกว่า
ทั้ง ๆ ที่ผ่านมาทำส่ง huggingface transformers ตลอด มาคราวนี้กลับไม่ได้โค้ดให้รองรับ
เหมือนเคยพยายามเอา mamba…
tontpong Wed, 03/12/2025 - 19:46
In reply to Mistral จะรอดไหมนี่… by tontan
เหมือนเคยพยายามเอา mamba มาใช้ด้วยอยู่ , ตอนนี้ยังพยายามอยู่มั้ย ? .. เกี่ยวกันรึป่าว , ทำให้ต้องใช้ effort เพิ่มมั้ย ?
mamba ถ้าเอามาใช้งานได้จริง…
tontan Wed, 03/12/2025 - 20:43
In reply to เหมือนเคยพยายามเอา mamba… by tontpong
mamba ถ้าเอามาใช้งานได้จริง จะ work มากเลยนะครับ ลด cost การรันได้มหาศาลจากประโยชน์ของ RNN แก้ปัญหาข้อจำกัดโมเดล transformer ที่พวก RNN พยายามแก้ แต่มีปัญหาคือเทรนยากเท่าที่เคยลองแบบ pretraining กับพยายามจูนมัน
ปล. huggingface transformers อันนี้ไม่เกี่ยวกับโมเดล transformer (BERT, GPT) นะครับ huggingface transformers เป็นชุดคำสั่งรวมโมเดล AI ที่ตอนแรกทำให้รองรับเฉพาะโมเดล NLP transformer ครับ
แต่ก็ชนะ…
Mediumrare Wed, 03/12/2025 - 17:14
?
ชนะแบบเฉียดๆ แต่ก็ชนะ …
tontpong Wed, 03/12/2025 - 19:32
In reply to แต่ก็ชนะ… by Mediumrare
ชนะแบบเฉียดๆ แต่ก็ชนะ .. เกือบจะไม่ชนะแล้ว เกือบจะแพ้แล้ว , แต่ก็ชนะ ในท้ายที่สุด
คำฮิตๆ ที่ใกล้ๆ , ก็ .. เกือบหลับ แต่กลับมาได้
เขียนถูกแล้วครับ ใส่ comma…
mk Thu, 04/12/2025 - 08:47
In reply to แต่ก็ชนะ… by Mediumrare
เขียนถูกแล้วครับ ใส่ comma คั่นกลางดูครับ