Cerebras ผู้พัฒนาชิปที่ผันตัวมาให้บริการ LLM เปิดบริการ Cerebras Code ด้วยโมเดล Qwen3-Coder ที่เริ่มใกล้เคียงกับ Claude 4 Sonnet อย่างไรก็ดี Cerebras ให้บริการโมเดลย่อแบบ FP8 ทำให้ประสิทธิภาพลดลง
จุดขายของ Cerebras Code คือ ความเร็วที่สูงมาก ระดับ 2,000 token/s ทำให้ระยะเวลารอโค้ดสั้นลง นอกจากนี้ยังมีข้อจำกัดเฉพาะโควต้าข้อความรายวันเท่านั้น
แพ็กเกจมีสองระดับ ได้แก่
- Cerebras Code Pro: ส่งข้อความ 1,000 ข้อความต่อวัน อย่างไรก็ดี Cerebras นับข้อความด้วยปริมาณโทเค็นด้วย ทำให้อยู่ที่ประมาณ 8 ล้านโทเค็นต่อวัน
- Cerebras Code Max: ส่งข้อความได้ 5,000 ข้อความต่อวัน หรือประมาณ 40 ล้านโทเค็น
ความพิเศษของ Cerebras คือแม้จะเป็นบริการผู้ช่วยเขียนโค้ด แต่ที่จริงแล้วผู้ใช้ยังคงได้รับ API key ไปใช้งานแอปภายนอกได้อยู่ดี
ที่มา - @CerebrasSystems
on