ทีมวิจัย Meituan LongCat เปิดตัวโมเดล LongCat-2.0 ที่มีความสามารถระดับใกล้เคียงกับโมเดลชั้นนำ เช่น Gemini 3.1 Pro, GPT-5.5, หรือ Claude Opus 4.6 แต่จุดต่างสำคัญคือทีมงานฝึกโมเดลนี้ด้วยชิปจีนทั้งหมด
คลัสเตอร์ที่ใช้ฝึกโมเดลนี้เป็นชิปไม่ระบุชื่อ (อาจจะเป็น Huawei Ascend 910C) แต่บอกว่าชิปที่ใช้มีหน่วยความจำน้อยกว่าชิปเดิมคือ NVIDIA H800 ที่มีหน่วยความจำ 80GB (Ascend 910C มีแรม 64GB แต่วางเป็นคู่เชื่อมกันทำให้มีแรมรวม 128GB) ทำให้เป็นข้อจำกัดสำคัญในการฝึกโมเดลขนาดใหญ่ถึง 1.6T อย่าง LongCat-2.0 ตัวคลัสเตอร์จริงเป็น Superpod ที่เชื่อมเซิร์ฟเวอร์ 48 เครื่องแบบ all-to-all แม้หน่วยความจำชิปจะน้อยแต่อัตราการส่งข้อมูลระหว่างชิปค่อนข้างสูง ทำให้อัตราการฝึกทำได้ดีขึ้น 30%
นอกจากประเด็นแรมน้อยกว่าชิป NVIDIA แล้ว ทีมงานยังระบุว่าแบนด์วิดท์ของหน่วยความจำก็น้อยกว่า แต่มีข้อดีที่แคช L2 มีขนาดใหญ่ทำให้สามารถโหลดโมเดลเตรียมไว้ก่อนได้
Meituan ได้ปล่อย LongCat-2.0 ให้คนทั่วไปทดลองมาเป็นเวลานานแล้วภายใต้ชื่อ Owl Alpha และที่ผ่านมาก็เป็นโมเดลที่ได้รับความนิยมสูงมีอัตราการให้บริการวันละหลายแสนล้านโทเค็น
ที่มา - LongCat
on