รายงานนี้มาจาก The Wall Street Journal อ้างแหล่งข่าวที่เกี่ยวข้องว่าในงานสัมมนา GTC ของ NVIDIA ที่จะจัดขึ้นในเดือนมีนาคม บริษัทจะเปิดตัวชิปและระบบประมวลผลใหม่ เพื่อใช้สำหรับงาน Inference ของ AI โดยเฉพาะ
ชิปสำหรับงาน Inference เป็นความร่วมมือระหว่าง NVIDIA กับบริษัทพัฒนาชิป Groq ที่บริษัททำข้อตกลงก่อนหน้านี้ โดยมีตัวเลขไม่เป็นทางการว่ามูลค่าดีลนั้นสูงถึง 2 หมื่นล้านดอลลาร์
ปัจจุบันเวิร์กโหลด AI เริ่มเป็นขั้นตอน Inference ที่เป็นส่วนการเรียกใช้งานโมเดลที่ผ่านการฝึกฝน (Training) มาแล้วมากขึ้น ปัจจัยหนึ่งก็มาจากการใช้ AI ช่วยเขียนโค้ด จากสถานการณ์นี้เลยทำให้หลายบริษัท หันพัฒนาชิปขึ้นมาเองเพื่อใช้งานในขั้นตอนนี้เพราะมีประสิทธิภาพ เร็ว และใช้พลังงานน้อยกว่าการใช้จีพียูของ NVIDIA ทำให้ NVIDIA ก็ต้องพัฒนาชิปสำหรับเวิร์กโหลดประเภทนี้โดยเฉพาะ
รายงานบอกว่า NVIDIA ไม่ต้องลุ้นนานว่าชิปใหม่ที่เตรียมเปิดตัวนี้จะมีลูกค้าหรือไม่ เพราะรายแรกที่ทำข้อตกลงใช้งานแล้วก็คือ OpenAI นั่นเอง
ที่มา: The Wall Street Journal
on