กูเกิลปล่อยโมเดล Gemma 3n ที่เปิดตัวในงาน Google I/O ที่ผ่านมา โดยโชว์ว่าเป็นโมเดลขนาดเล็กแต่มีความสามารถสูง แข่งขันกับโมเดลขนาดใหญ่กว่า เช่น Llama 4 Marverick 17B 128BE ได้
ตัวโมเดลสามารถนำไปรันบนแพลตฟอร์มหลักๆ ได้ทั้งหมด ทั้ง HuggingFace Transformers, llama.cpp, Google AI Edge, Ollama, และ MLX
ความสามารถ multimodal ของ Gemma 3n ทำให้สามารถแปลงเสียงเป็นข้อความ และแปลภาษาได้ในตัว ทีมงานพบว่าการใช้งานกับภาษาอังกฤษ, สเปน, ฝรั่งเศส, อิตาลี, และโปรตุเกส นั้นใช้งานได้ดี ตอนนี้ยังจำกัดการใส่เสียงไม่เกิน 30 วินาทีแต่มีโอกาสเพิ่มนอนาคต
นอกจากโมเดล LLM แล้ว รอบนี้กูเกิลยังปล่อยโมเดลเข้าใจภาพ MobileNet-V5 รองรับภาพขนาดใหญ่ถึง 768x768 ทำงานได้เร็ว สูงสุดประมวลผลภาพได้ 60 เฟรมต่อวินาทีด้วย Google Pixel
ที่มา - Google Developers
on
อันนี้โหดของจริง…
dheerapat Sat, 28/06/2025 - 00:53
อันนี้โหดของจริง เพราะตัวมันเองเล็กมาก google ตั้งใจไว้รันบน edge device ด้วยซ้ำ แต่ตีโมเดลเรือธง meta ได้สบายๆ