AMD วางขายชิปเร่งความเร็วปัญญาประดิษฐ์ MI300X และ MI300A อย่างเป็นทางการ ชิปทั้งสองรุ่นถือเป็นอาวุธหลักของ AMD ออกมาสู้กับ NVIDIA Hopper (H100/H200) ที่กำลังกวาดลูกค้าทั่วโลกในตอนนี้
ชิปซีรีส์ MI300 เปิดตัวครั้งแรกในเดือนมกราคม แล้วประกาศรายละเอียดอีกครั้งในเดือนมิถุนายน แบ่งออกเป็น 2 รุ่นย่อยที่ต่างกันคือ
AMD เริ่มส่งมอบชิปตระกูล Instinct MI300 ตามที่เปิดตัวไปเมื่อต้นปีที่ผ่านมา โดยแบ่งออกเป็นสองรุ่นย่อย คือ MI300A ที่เป็น APU มีซีพียูในตัว และ MI300X ที่เป็นชิปเร่งความเร็วอย่างเดียว
MI300A มาพร้อมแรม HBM3 ขนาด 128GB เน้นปรับปรุงประสิทธิภาพต่อพลังงานดีขึ้น 1.9 เท่าเทียบกับ MI250X รุ่นก่อนหน้า
MI300X เป็นชิปเร่งความเร็วสถาปัตยกรรม CDNA 3 เพิ่มหน่วยประมวลผล 40% ขยายแบนวิดท์หน่วยความจำ 1.7 เท่า ใส่แรม HBM3 192GB และรองรับข้อมูลแบบ FP8 หน่วยความจำที่สูงขึ้นทำให้สามารถรันโมเดล LLaMA-2 70B ได้ในชิปเดียว สำหรับองค์กรที่ต้องการรัน LLM อยู่ภายในองค์กรเอง
รัฐบาลสิงคโปร์ ประกาศแผนยุทธศาสตร์ปัญญาประดิษฐ์แห่งชาติ (Singapore National AI Strategy หรือ NAIS) ฉบับที่สอง หลังจากออกแผนฉบับแรกมาตั้งแต่ปี 2019
แผนยุทธศาสตร์ฉบับนี้มองว่า AI เปลี่ยนสถานะจากสิ่งที่ควรมีมาสู่สิ่งที่จำเป็น (From Opportunity
to Necessity) เปลี่ยนจากโครงการแยกย่อยมาเป็นระบบ (From Projects to Systems) และเปลี่ยนจากเรื่องเฉพาะประเทศมาเป็นเรื่องระดับโลก (From Local to Global)
จากที่สหรัฐฯ มีคำสั่งแบนการส่งออกชิป AI ไปขายในจีน และ NVIDIA เลื่อนเปิดตัวชิป AI ที่ผลิตเพื่อขายที่จีน ล่าสุดพบว่าตลาดจีนปรับตัวด้วยการนำการ์ดจอ NVIDIA RTX 4090 มาดัดแปลงเป็นการ์ดฝึก AI แถมขายราคาแพงกว่าปกติ
ผู้ใช้รายหนึ่งจากฟอรัมของเว็บไซต์ Tieba Baidu ไปเยี่ยมชมโรงงานในจีนที่เชี่ยวชาญด้านรีไซเคิลการ์ดจอ แล้วพบว่ามีการแยกชิปAD102 และโมดูลหน่วยความจำ GDDR6X ออกมาจากการ์ด RTX 4090 ไปวางบน PCB แบบพิเศษ พร้อมด้วยพัดลมทำความเย็นแบบโบลเวอร์
ASUS เปิดตัวการ์ดจอแนวคิดใหม่ที่ยัดสล็อตสำหรับเสียบ SSD ลงมาในตัวการ์ดจอด้วย เพื่อใช้ประโยชน์จากฮีทซิงก์ของตัวจีพียู ช่วยระบายความร้อนให้ SSD ไปพร้อมกัน
การ์ดจอรุ่นนี้มีชื่อเต็มๆ ว่า ASUS Dual GeForce RTX 4060 Ti SSD โดยในฝั่งจีพียูเป็นการ์ด 4060 Ti 8GB ปกติทั่วไป แต่ด้านหลังของการ์ด (อีกฝั่งที่ไม่มีพัดลม) มีช่องเสียบ SSD แบบสล็อต M.2 NVMe เพิ่มมาให้ด้วย ผู้ใช้สามารถซื้อ SSD มาเสียบเพิ่มเองได้ รองรับความเร็วสูงสุดระดับ PCIe 5.0
ประโยชน์ของดีไซน์แบบนี้มีทั้งการประหยัดพื้นที่ ประหยัดสล็อต PCIe สำหรับ SSD ไปหนึ่งสล็อต (โดยเฉพาะเคสขนาดเล็ก) และการใช้ระบบระบายความร้อนของการ์ดจอร่วมด้วย ช่วยลดอุณหภูมิของ SSD ลงได้ 40% หรือ 6 องศา เมื่อเทียบกับการเสียบ SSD ลงบอร์ดตามปกติ
สำนักข่าว Reuters อ้างแหล่งข่าวที่เกี่ยวข้องสองราย ระบุว่า NVIDIA ได้แจ้งลูกค้าในประเทศจีน ว่าจะเลื่อนการเปิดตัวชิป AI ใหม่ ที่ออกแบบเพื่อให้เป็นไปตามเงื่อนไขการส่งออกชิปที่สหรัฐอเมริกากำหนด ไปอย่างน้อยถึงไตรมาส 1 ในปีหน้า จากแผนเดิมที่จะเปิดตัวในเดือนนี้
ชิปรุ่นดังกล่าวมีชื่อเรียกว่า H20 ซึ่งตามแผนนั้น NVIDIA จะออกชิป 3 รุ่น สำหรับประเทศจีนเป็นหลัก เพื่อแข่งขันกับ Huawei ที่ตอนนี้พัฒนาชิป AI ออกมาเช่นกัน
รายงานบอกว่าสาเหตุที่ H20 เลื่อนเปิดตัวนั้น มาจากปัญหาจากผู้ผลิตเซิร์ฟเวอร์ที่จะขายร่วมกับชิปนี้
มีข้อมูลจากแวดวงผู้ผลิตการ์ดจอว่า NVIDIA ส่งสัญญาณให้ผู้ผลิตการ์ดจอเริ่มระบายสต๊อก GeForce RTX 4080 และ 4070 Ti แล้ว เพื่อเคลียร์ทางสำหรับการ์ดจอรุ่นใหม่พลัง SUPER ที่น่าจะเปิดตัวช่วงต้นเดือนมกราคม 2024 (น่าจะเปิดตัวในงาน CES 2024 หลังปีใหม่)
ตามข่าวบอกว่า การ์ดจอใหม่จะมีด้วยกัน 3 รุ่นย่อยคือ 4080 SUPER, 4070 Ti SUPER, 4070 SUPER โดยรุ่น 4080 SUPER จะเป็นการอัพเดตเล็ก ใช้ชิป AD103-400 ที่เพิ่มจำนวนคอร์-คล็อคขึ้นจาก AD103-300 ที่ใช้อยู่ในปัจจุบัน ส่วนรุ่น 4070 Ti SUPER จะเพิ่มแรมขึ้นจาก 4070 Ti (12GB) ในปัจจุบัน
NVIDIA เปิดตัวจีพียูศูนย์ข้อมูล Hopper H200 ที่อัพเกรดขึ้นจาก H100 ที่เปิดตัวตั้งแต่ปี 2022
จุดเด่นของ NVIDIA H200 คือใช้แรมแบบใหม่ HBM3e ที่เร็วขึ้นกว่าเดิม สามารถส่งข้อมูลในหน่วยความจำขนาด 141GB ด้วยอัตรา 4.8 TBps แบนด์วิดท์เพิ่มขึ้น 2.4 เท่าเทียบกับแรมใน NVIDIA A100 ของเจนก่อน
จีพียู H200 จะถูกนำไปใช้กับบอร์ด NVIDIA HGX H200 รองรับทั้งการคอนฟิกแบบ 4/8 จีพียู ฮาร์ดแวร์เข้ากันได้กับระบบที่เป็น HGX H100 เดิม ทำให้หน่วยงานที่มีของเดิมอยู่แล้วอัพเกรดได้ง่าย
อินเทลยังเดินหน้าปรับปรุงไดรเวอร์ของจีพียู Intel Arc ต่อไป หลังช่วงแรกๆ มีปัญหาประสิทธิภาพกับเกม DirectX 11 แต่ก็ปรับปรุงให้ดีขึ้นเรื่อยๆ
ไดรเวอร์เวอร์ชันล่าสุด 31.0.101.4952 ออกมารองรับเกมใหม่ๆ ที่วางขายช่วงนี้ เช่น RoboCop: Rogue City, StarOcean The Second Story R, Like a Dragon Gaiden: The Man Who Erased His Name, The Talos Principle 2 รวมถึง Call of Duty: Modern Warfare III
มีข่าวลือจากเว็บไซต์ Benchlife ของจีนว่า NVIDIA จะออก GeForce RTX 4070 และ 4080 เวอร์ชัน SUPER
ตอนนี้ยังไม่มีข้อมูลสเปกชัดเจนนัก ความแตกต่างระหว่างรุ่นธรรมดากับรุ่น SUPER ที่หลุดออกมาคือ อัพเกรดตัวชิปจีพียูมาใช้รุ่นที่สูงขึ้น, เพิ่มแรม และเพิ่มความกว้างของบัส
AMD เปิดตัว Radeon RX 7900M จีพียูโน้ตบุ๊กตัวแรงสุดของ AMD ที่เป็นสถาปัตยกรรม RDNA 3 ตัวล่าสุด โดยเป็นการขยับขึ้นจากตัวแรงสุดบนโน้ตบุ๊กก่อนหน้านี้คือ Radeon RX 7600M XT อีกเยอะพอสมควร (ข้าม 7700M/7800M มาเลย)
Radeon RX 7900M ให้จีพียูมาจำนวน 72 CU (compute unit) เพิ่มขึ้นจาก 32 CU ใน 7600M XT, แรม 16GB, คล็อค 1825MHz บูสต์ขึ้นได้สูงสุดถึง 2090MHz, Infinity Cache 64MB, TDP 180W
ฟีเจอร์มาตรฐานของ RDNA 3 มาครบถ้วน ทั้ง ray tracing, ตัวเร่งประมวลผล AI, การเข้ารหัส AV1 โดยกลุ่มเป้าหมายคือการเล่นเกมความละเอียด 1440p บนโน้ตบุ๊ก ที่แรม 16GB รองรับได้เหลือเฟือ
Valve ประกาศเตือนว่าฟีเจอร์ Anti-Lag และ Anti-Lag+ ที่มีในจีพียู AMD Radeon ส่งผลกระทบต่อระบบป้องกันโกงของ Counter-Strike 2 และอาจส่งผลให้ผู้เล่นโดนแบนได้
ฟีเจอร์ Anti-Lag เริ่มใช้มาตั้งแต่ยุค Radeon Polaris เป็นการควบคุมจังหวะการทำงานของซีพียู ไม่ให้ล้ำหน้าจีพียูมากเกินไป ส่งผลให้ latency ของเกมลดลง เกมตอบสนองไวขึ้น ส่วน Anti-Lag+ เพิ่งมีในจีพียูกลุ่ม RDNA 3 (Radeon RX 7000) พัฒนาไปอีกขั้นคือเข้าไปปรับตัวเกมแต่ละเกมให้ซิงก์เฟรม
AMD ปล่อยอัพเดต FidelityFX Super Resolution 3 หรือ FSR 3.0 ที่เปิดตัวเมื่อเดือนสิงหาคม ตอนนี้มีเกมรองรับแล้ว 2 เกมคือ Forspoken และ Immortals of Aveum ที่ออกแพตช์มารองรับแล้วเรียบร้อย
FSR 3 อัพเกรดจาก FSR 2 โดยเพิ่มฟีเจอร์ Frame Generation สร้างเฟรมใหม่เพื่อเพิ่มเฟรมเรต แบบเดียวกับ DLSS 3 ของฝั่ง NVIDIA แต่เทคนิคของ AMD ไม่อิงกับฮาร์ดแวร์จีพียูแบบเดียวกับ DLSS 3 ทำให้สามารถใช้กับการ์ดจอได้ทั่วไป
Scott Herkelman ผู้จัดการหน่วยธุรกิจกราฟิกของ AMD ประกาศลาออกจากตำแหน่ง หลังอยู่กับ AMD มานาน 7 ปี โดยจะมีผลในช่วงสิ้นปี 2023
เราอาจคุ้นหน้ากับ Herkelman ในวาระการเปิดตัวจีพียู Radeon อยู่บ่อยครั้ง เช่น การขึ้นเวทีชูการ์ดเรือธง Radeon RX 7900 XTX เมื่อปลายปี 2022
Herkelman เคยเป็นซีอีโอของบริษัทผู้ผลิตการ์ดจอ BFG Tech ในช่วงปี 2002-2010 หลังจาก BFG Tech ล้มละลาย เขาย้ายมาเป็นผู้จัดการฝ่าย GeForce ของ NVIDIA ระหว่างปี 2012-2015 ก่อนย้ายข้ามห้วยมาเป็นผู้จัดการฝ่าย Radeon ในปี 2016
NVIDIA เริ่มลดราคาการ์ดจอบางรุ่นลงอย่างเงียบๆ โดย GeForce 4060 Ti รุ่นแรม 16GB ราคาเปิดตัว 499 ดอลลาร์ ลดลงเหลือ 449 ดอลลาร์ (ลด 50 ดอลลาร์) ราคานี้เป็นราคาแนะนำให้ขายปลีก (MSRP) ที่ NVIDIA ตั้งไว้ แต่ผู้ผลิตสินค้าอาจเลือกขายในราคาอื่นได้
Google Cloud เปิดตัวชิปประมวลผลปัญญาประดิษฐ์ Cloud TPU v5e เวอร์ชันใหม่ที่อัพเกรดจาก TPU v4 ซึ่งเริ่มใช้มาตั้งแต่ปี 2020
ตอนนี้ยังมีรายละเอียดของ TPU v5e ออกมาไม่มากนัก แต่มันเป็น TPU เวอร์ชันคัสตอม (ตัวท้าย e) ที่เน้นประสิทธิผลเรื่องต้นทุน (cost-efficiency) กว่า TPU รุ่นปกติ จากตัวเลขของกูเกิลระบุว่ามีประสิทธิภาพต่อดอลลาร์ในการเทรนโมเดล LLM ดีกว่า TPU v4 สูงสุดราว 2 เท่า และประสิทธิภาพต่อดอลลาร์ในการรันโมเดลดีกว่าสูงสุด 2.5 เท่า
Scott Herkleman รองประธานาอาวุโสและผู้จัดการฝ่ายธุรกิจกราฟิกของ AMD ยืนยันกับเว็บไซต์ Videocardz ว่าการเปิดตัว Radeon RX 7800 XT และ 7700 XT เมื่อวันก่อน ถือเป็นการออกจีพียูครบไลน์ทั้งหมดของ Radeon RX ซีรีส์ 7000 (RDNA 3) แล้ว ไม่มีแผนออกสินค้าเพิ่มเติมอีก
ตอนนี้ AMD มีสินค้า Radeon RX 7000 ทั้งหมด 5+1 รุ่น ได้แก่
AMD เปิดตัวเทคโนโลยีอัพสเกลภาพ FidelityFX Super Resolution 3 (FSR 3.0) เวอร์ชันอัพเกรดจาก FSR 2.0 ที่เปิดตัวช่วงต้นปี 2022
ของใหม่ใน FSR 3.0 คือเทคนิคการสร้างเฟรม AMD Fluid Motion Frames (AFMF) เวอร์ชันใหม่ โดยนำข้อมูลจากเกม เช่น motion vector มาสร้างเฟรมเพิ่มเติมเพื่อให้ได้เฟรมเรตที่สูงขึ้นอีกขั้น (เทียบกับ FSR 2.0 ที่ใช้เทคนิคสร้างเฟรมอีกแบบอยู่แล้ว) เทคนิคของ FSR 3.0 ออกแบบมาให้สร้างเฟรมได้โดยไม่กระทบกับ UI ของเกมด้วย (แยกส่วน UI overlay ออกมาต่างหาก ไม่เกิดปัญหาสร้างเฟรมใหม่แล้ว UI เพี้ยน)
มาตามสัญญากับ Radeon RX 7000 Series สถาปัตยกรรม RDNA 3 ตัวกลาง หลังจากเปิดตัวรุ่นบน Radeon RX 7900 ตั้งแต่ปลายปีที่แล้ว, รุ่นล่าง Radeon RX 7600 เมื่อต้นปีนี้ และ Radeon RX 7900 ตัวรอง เมื่อเดือนกรกฎาคม
จีพียูใหม่รอบนี้มี 2 รุ่นคือ
NVIDIA เปิดตัวเทคโนโลยี DLSS เวอร์ชัน 3.5 มีของใหม่คือ Ray Reconstruction (RR) ช่วยให้ภาพที่อัพสเกลด้วย AI สมจริงกว่าเดิม ไม่ขาดรายละเอียดของภาพบางจุดที่เคยเกิดปัญหากับการทำ Ray Tracing ใน DLSS เวอร์ชันเก่าๆ
หลักการทำ Ray Tracing คือนำลำแสง (ray) ลองยิงเข้าไปในฉากที่สร้างโดยเอนจินเกม เพื่อดูว่าแสงสะท้อนกลับมาอย่างไร แต่ในพิกเซลที่ยิงแสงไปได้ไม่ครบถ้วนจะไม่มีข้อมูลว่าพิกเซลนั้นควรแสดงผลอย่างไร
เทคนิคที่ใช้กันในปัจจุบันคือนำภาพจากหลายเฟรม (ยิงแสงคนละรอบ) มาผสานกัน (accumulate) หรือนำข้อมูลพิกเซลใกล้เคียงกันในเฟรมเดียวกันมารวมเข้าด้วยกันกัน (interpolate) เพื่อคาดเดาข้อมูลของพิกเซลที่ขาดไป วิธีการเหล่านี้เรียกว่า denoiser ซึ่งมีข้อบกพร่องอยู่บ้าง อาจมีรายละเอียดบางจุดผิดเพี้ยน เช่น ขอบภาพบางส่วนขาด หรือ วัตถุบางอย่างปรากฏซ้ำกันในภาพ เมื่อภาพต้นฉบับแย่ นำไปอัพสเกลต่อด้วย AI ยิ่งแย่ซ้ำเข้าไปอีก
เมื่อประมาณ 1 ปีที่แล้วพอดี อินเทลเปิดตัวจีพียู Intel Arc ชุดแรก ที่รันเกมยุคใหม่ DirectX 12 ออกมาประสิทธิภาพดี แต่มีปัญหากับเกมเก่าๆ ที่เป็น DirectX 11 ลงไป ซึ่งอินเทลยอมรับปัญหาและสัญญาว่าจะแก้ผ่านไดรเวอร์
ในรอบปีที่ผ่านมา อินเทลทยอยอัพเดตไดรเวอร์และปรับปรุงประสิทธิภาพของเกม DirectX 9 (เช่น Counter-Strike หรือ League of Legends) ให้ดีขึ้นกว่าเดิมแล้ว ล่าสุดอินเทลออกไดรเวอร์เวอร์ชันใหม่ ปรับปรุงเกม DirectX 11 ให้เฟรมเรตเพิ่มขึ้นเฉลี่ย 19% และในกรณีที่ดีที่สุดเพิ่มขึ้นถึง 33%
NVIDIA เปิดตัวการ์ด RTX สำหรับเดสก์ท็อปเวิร์คสเตชัน ที่ใช้สถาปัตยกรรม Ada Lovelace เพิ่มเติม หลังจากเปิดตัวรุ่นท็อป RTX 6000 และรุ่นเล็ก RTX 4000 Small Form Factor (SFF) ไปก่อนแล้ว
การ์ดที่เป็นสถาปัตยกรรม Ada Lovelace จะได้ฟีเจอร์ชุดเดียวกันคือ 3rd Gen RT Core, 4th Gen Tensor Core, DLSS 3 โดยจุดต่างสำคัญจากการ์ดคอนซูเมอร์ตระกูล GeForce คือมีแรมเยอะกว่า (อย่าง RTX 6000 ให้แรม 48GB) เหมาะกับงานประมวลผลขนาดใหญ่มากกว่า
การ์ดรอบนี้มีด้วยกัน 3 รุ่นย่อยได้แก่
NVIDIA เปิดตัวโมดูล NVIDIA GH200 Grace Hopper รุ่นต่อไป หลังจากปีนี้วางตลาดรุ่นแรกไปแล้ว ความเปลี่ยนแปลงสำคัญของรุ่นต่อไปคือการใช้แรม HBM3e ทำให้ใส่แรมได้มากขึ้นมาก เครื่องขนาด 2 โมดูล สามารถใส่แรมได้สูงสุด 282GB ซีพียู 144 คอร์ และพลังประมวลผล AI รวม 8 เพตาฟลอบ (ไม่ระบุว่าที่ความละเอียดระดับใด)
HBM3e เป็นหน่วยความจำประสิทธิภาพสูงที่พัฒนาต่อมาจาก HBM3 โดยก่อนหน้านี้อาจจะเรียกว่า HBM3+ หรือ HBM3 Gen 2 ตอนนี้โรงงานที่ผลิต HBM3 หลักๆ ได้แก่ SK hynix, Samsung, และ Micro และน่าจะเตรียมสายการผลิต HBM3e กันอยู่ โดยรวมแล้วแรม HBM3e บน GH200 รุ่นต่อไปรองรับแบนวิดท์ 10TB/s
AMD เปิดตัวจีพียูเวิร์คสเตชันแบรนด์ Radeon Pro ใหม่สองรุ่นย่อยคือ Radeon Pro W7600 และ W7500 ซึ่งเป็นรุ่นรองลงมาจาก Radeon Pro W7900 และ W7800 ที่เปิดตัวในเดือนเมษายน
Radeon Pro ชุดนี้ใช้สถาปัตยกรรม RDNA 3 เช่นเดียวกับรุ่นพี่ แต่ลดแรมลงมาเหลือ 8GB (รุ่น W7900 ให้แรมมากถึง 48GB, W7800 ให้แรม 32Gb) และใช้ชิป Navi 33 เหมือนกัน จุดต่างสำคัญคือ W7600 มีหน่วยประมวลผล 32 CU ส่วน W7500 ลดลงเหลือ 28CU
การ์ดทั้งสองตัวออกแบบมาใช้แทน Radeon Pro W6600 (RDNA 2) และ W5500 (RDNA 1) สองเจนก่อนหน้าที่เป็นการ์ดเวิร์คสเตชันระดับกลาง ราคาขายอยู่ที่ 599 ดอลลาร์ (W7900) และ 429 ดอลลาร์ (W7800) เริ่มวางขายภายในไตรมาส 3/2023
บัญชีทวิตเตอร์ @kopite7kimi นักปล่อยข่าวสายฮาร์ดแวร์ เผยข้อมูลว่าเราจะไม่ได้เห็น GeForce RTX 4090 Ti ตัวแรงที่สุดแล้ว (เจนก่อนมี GeForce RTX 3090 Ti แต่คราวนี้จะสุดที่ 4090 ตัวธรรมดา)
เว็บไซต์ Notebookcheck คาดว่าเหตุผลคือไม่มีจีพียูคู่แข่งจากค่าย AMD มาทาบรัศมี ทำให้ NVIDIA ไม่จำเป็นต้องออกสินค้ามาเพิ่ม
ยุทธศาสตร์ของ NVIDIA อาจเป็นการออกการ์ดระดับกลาง เช่น RTX 4070/4060 ตัวอัพเกรด (ถ้าในยุค RTX 20 เรียก Super) มาเพิ่มแทน