อินเทลเริ่มวางขายชิปเร่งความเร็วปัญญาประดิษฐ์ Gaudi 3 ที่เปิดตัวมาตั้งแต่เดือนเมษายน โดยวางขายพร้อมกับซีพียู Xeon 6 P-core ที่ออกแบบมาให้ใช้งานคู่กัน
Gaudi 3 วางตัวออกมาสู้กับ NVIDIA H100 สเปกคร่าวๆ คือมี 64 Tensor core, 8 matrix multiplication engines (MME), แรม HBM2e ขนาด 128GB, พอร์ต Ethernet 200 Gb จำนวน 24 พอร์ต
อินเทลเปิดราคาของชิปเร่งความเร็วปัญญาประดิษฐ์ Gaudi 3 ที่เปิดตัวเมื่อเดือนเมษายน โดยคิดราคา 125,000 ดอลลาร์ (4.6 ล้านบาท) ต่อบอร์ดหนึ่งตัวที่มีชิป Guadi 3 แรม 128GB จำนวน 8 ตัว (หารมาแล้วก็เหลือตัวละประมาณ 16,000 ดอลลาร์ หรือ 5.8 แสนบาท)
ราคานี้มีผลต่อการแข่งขันไม่น้อย เพราะคู่แข่งที่เป็นเจ้าตลาด NVIDIA H100 รุ่นแรม 80GB ราคาขายบอร์ดอยู่ที่ 30,000 ดอลลาร์ (1 บอร์ด = 1 จีพียู) เทียบราคาต่อชิปแล้วแพงกว่ากันเท่าตัว แถมอินเทลยังโฆษณาว่า Gaudi 3 มีประสิทธิภาพดีกว่า H100 ราว 50%
อินเทลเปิดตัวชิปเร่งการประมวลผลปัญญาประดิษฐ์รุ่นใหม่ Intel Gaudi 3 ที่เคยโชว์แผนเมื่อปีที่แล้ว ใช้กระบวนการผลิตระดับ 5 นาโนเมตร
ชิป Gaudi มาจากการซื้อบริษัท Habana Labs ในปี 2019 และอัพเกรดเป็น Gaudi 2 เมื่อปี 2022 โดยเป็นชิปที่อินเทลวางตัวมาแข่งกับชิประดับสูงของ NVIDIA โดยตรง
สถาปัตยกรรมของ Gaudi 3 ประกอบด้วยหน่วยประมวลผลย่อย 3 ตัวในชิปเดียว ได้แก่
ทีมงาน Stability.AI รายงานถึงผลทดสอบประสิทธิภาพของชิปฝึกโมเดลปัญญาประดิษฐ์ โดยเทียบระหว่างชิป Intel Gaudi 2, NVIDIA H100, และ NVIDIA A100 พบว่าชิปฝั่งอินเทลนั้นประสิทธิภาพดีกว่ามาก เมื่อรันที่พารามิเตอร์การฝึกใกล้เคียงกัน Gaudi 2 ฝึกภาพได้ถึง 927 ภาพต่อวินาที เทียบกับ H100 ที่ได้ 595 ภาพต่อวินาที คิดเป็น 1.5 เท่าตัว แถมแรมใน Gaudi 2 ยังสูงกว่าอยู่ที่ 96GB ทำให้ปรับพารามิเตอร์เพื่อเร่งความเร็วขึ้นไปอีกได้
อินเทลประกาศวางขายซีพียูฝั่งเซิร์ฟเวอร์ 5th Gen Xeon Scalable โค้ดเนม Emerald Rapids ในวันที่ 14 ธันวาคม 2023 (พร้อมกับ Core Ultra ของฝั่งโน้ตบุ๊ก)
การออก Xeon 5th Gen ช่วงปลายปี ทำให้ปีนี้อินเทลออก Xeon ได้ถึง 2 รุ่นคือ 4th Gen Xeon Sapphire Rapids เมื่อเดือนมกราคม หลังจากล่าช้ามานานหลายปี และออก 5th Gen ตามต่อทันทีได้ตอนปลายปี ถือเป็นสัญญาณอันดีว่าอินเทลเริ่มกลับเข้ามาอยู่ในร่องในรอยมากขึ้นแล้ว
อินเทลเปิดตัวชิปฝึกโมเดลปัญญาประดิษฐ์ Habana Gaudi2 หลังจาก Gaudi รุ่นแรกชูจุดแข็งว่าต้นทุนการฝึกปัญญาประดิษฐ์ถูกกว่าคู่แข่ง ตอนนี้ Gaudi2 ปรับมาใช้เทคโนโลยีการผลิต 7nm จากเดิม 16nm แรมในตัวมากถึง 96GB และแคชแบบ SRAM 48MB
การปรับเทคโนโลยีรอบนี้ทำให้อินเทลโชว์ทรูพุตการฝึกโมเดลปัญญาประดิษฐ์สำคัญ เช่น ResNet50 สำหรับการจัดหมวดหมู่ภาพ และ BERT สำหรับการประมวลผลภาษาว่าเร็วกว่าชิป NVIDIA A100 สองเท่าตัว อย่างไรก็ดี NVIDIA A100 นั้นวางตลาดมานานแล้ว และรุ่นล่าสุดคือ H100 เพิ่งเปิดตัวไปเมื่อเดือนมีนาคม
AWS เริ่มให้บริการเครื่อง EC2 DL1 สำหรับฝึกปัญญาประดิษฐ์ โดยตัวเร่งความเร็วเป็นชิป Habana Gaudi ที่อินเทลซื้อบริษัทมาตั้งแต่ปี 2019 ความได้เปรียบสำคัญคือการฝึกปัญญาประดิษฐ์ราคารวมถูกกว่าเครื่องที่ใช้ชิปกราฟิกของ NVIDIA เช่น A100 หรือ V100
ทางฝั่ง AWS ระบุว่าเครื่อง DL1 ถูกกว่าประมาณ 40% แต่ทาง Habana แสดงผลทดสอบพบว่าการฝึก ResNet50 ถูกกว่า 44% แต่การฝึก BERT ถูกกว่าเพียง 10% โดยเครื่อง DL1.24xlarge ราคาอยู่ที่ 13.11 ดอลลาร์ต่อชั่วโมง (ชิป Gaudi 8 ชุดพร้อมแรม HBM 32 GB พร้อมแรมระบบ 768GiB)
อินเทลประกาศเข้าซื้อกิจการบริษัท Habana Labs ผู้ผลิตชิปทั้งสำหรับการฝึกโมเดลปัญญาประดิษฐ์และการรันโมเดล มูลค่าการซื้อขาย 2,000 ล้านดอลลาร์หรือ 60,000 ล้านบาท
Habana Labs มีสินค้าหลักสองตัว คือ Gaudi ชิปฝึกโมเดลปัญญาประดิษฐ์ที่ขยายระบบได้มาก และบริษัทระบุว่าประสิทธิภาพดีกว่าการใช้ชิปกราฟิกถึง 4 เท่าตัว อีกตัวคือ Goya ชิปรันโมเดล (inference) ประสิทธิภาพสูง รันโมเดล ResNet-50 ได้ที่ 15,453 ภาพต่อวินาที