NVIDIA เปิดตัวโมดูล NVIDIA GH200 Grace Hopper รุ่นต่อไป หลังจากปีนี้วางตลาดรุ่นแรกไปแล้ว ความเปลี่ยนแปลงสำคัญของรุ่นต่อไปคือการใช้แรม HBM3e ทำให้ใส่แรมได้มากขึ้นมาก เครื่องขนาด 2 โมดูล สามารถใส่แรมได้สูงสุด 282GB ซีพียู 144 คอร์ และพลังประมวลผล AI รวม 8 เพตาฟลอบ (ไม่ระบุว่าที่ความละเอียดระดับใด)
HBM3e เป็นหน่วยความจำประสิทธิภาพสูงที่พัฒนาต่อมาจาก HBM3 โดยก่อนหน้านี้อาจจะเรียกว่า HBM3+ หรือ HBM3 Gen 2 ตอนนี้โรงงานที่ผลิต HBM3 หลักๆ ได้แก่ SK hynix, Samsung, และ Micro และน่าจะเตรียมสายการผลิต HBM3e กันอยู่ โดยรวมแล้วแรม HBM3e บน GH200 รุ่นต่อไปรองรับแบนวิดท์ 10TB/s
Linux Foundation ประกาศเป็นตั้งโครงการใหม่ Ultra Ethernet Consortium (UEC) เพื่อให้บริษัทและหน่วยงาน ร่วมกับพัฒนาการเชื่อมต่อบนพื้นฐานอีเธอร์เน็ต ให้รองรับการประมวลผลสมรรถะสูงได้ดีขึ้น เนื่องจากปัจจุบันงานทั้ง AI และ HPC มีรูปแบบเวิร์กโหลดที่แตกต่างไป ต้องการประสิทธิภาพการทำงานที่สูง การทำงานร่วมกันข้ามอุปกรณ์ และต้นทุนที่เหมาะสมที่สุด
บริษัทที่เข้าร่วมกลุ่ม UEC ในฐานะผู้ร่วมก่อตั้งได้แก่ AMD, Arista, Broadcom, Cisco, Eviden, HPE, Intel, Meta และ Microsoft ซึ่งต่างเป็นบริษัทที่มีประสบการณ์มายาวนานด้านเน็ตเวิร์ก AI คลาวด์ และ HPC
NVIDIA เปิดตัวเซิร์ฟเวอร์รุ่นใหม่ NVIDIA DGX GH200 ชูจุดเด่นที่รองรับแรมสูงถึง 144TB เป็นก้าวกระโดดจาก DGX H100 ที่เคยรองรับแรม 640GB ต่อเครื่อง
ภายในตัวเครื่อง ใช้ชิป NVIDIA Grace Hopper Superchip พร้อมแรมแบบ LPDDR5 480GB เซิร์ฟเวอร์แต่ละเครื่องมีซีพียู 8 ชุด และสามารถต่อข้ามเครื่องผ่าน NVLink Switches อีกถึง 256 ซีพียูในแต่ละคลัสเตอร์ ตัวชิปกราฟิกบนแต่ละโมดูลสามารถข้ามไปใช้แรมฝั่งซีพียูด้วยแบนวิดท์ 900GB/s
TOP500 ประกาศอันดับซูเปอร์คอมพิวเตอร์โลกประจำรอบเดือนมิถุนายน 2023 (ประกาศทุกครึ่งปี) อันดับหนึ่งยังเป็นเครื่อง Frontier ของห้องวิจัย Oak Ridge National Laboratory ที่ครองแชมป์มาตั้งแต่รอบเดือนมิถุนายน 2022 โดยมีตัวเลขสมรรถนะเพิ่มขึ้นเล็กน้อยเป็น 1.194 exaflop/s จากการปรับแต่งประสิทธิภาพโดยไม่ได้เพิ่มฮาร์ดแวร์ (เดิม 1.102 Exaflop/s)
NVIDIA เปิดตัวซูเปอร์คอมพิวเตอร์ Isambard 3 ที่มหาวิทยาลัย Bristol เป็นผู้สั่งซื้อ โดยความพิเศษคือมันเป็นซูเปอร์คอมพิวเตอร์ที่ใช้ชิป Grace CPU Superchip ล้วน ไม่มีชิปกราฟิกในระบบ
ระบบรวมของ Isambard 3 ใช้ Grace CPU Superchip จำนวน 384 ชุด พลังประมวลผลรวม 2.7 petaflops ที่ FP64 จุดเด่นคือกินพลังงานเพียง 270kW เท่านั้นทำให้เป็นซูเปอร์คอมพิวเตอร์ที่ไม่มีชิปเร่งความเร็วที่ประสิทธิภาพพลังงานดีที่สุดหนึ่งในสามอันดับแรกของโลก
ศูนย์วิจัยแห่งชาติ Argonne National Laboratory (ANL) ประกาศเตรียมพัฒนาปัญญาสร้างดิษฐ์สร้างคอนเทนต์ (generative AI) ด้านวิทยาศาสตร์โดยเฉพาะ ที่มีขนาดใหญ่มากถึง 1 ล้านล้านพารามิเตอร์
ปัญญาประดิษฐ์ใหม่นี้จะฝึกด้วยข้อมูลทางวิทยาศาสตร์ทั้งหมด โดยมีข้อมูลหลายรูปแบบ ทั้งข้อความ, โค้ด, รายงานวิทยาศาสตร์ รวมถึงข้อมูลการทดลองด้านชีววิทยา, เคมี, วัสดุสาสตร์, ฟิสิกส์, การแพทย์, และข้อมูลอื่นๆ ผลที่ได้น่าจะช่วยในการออกแบบโมเลกุล สามารถแนะนำการทดลองใหม่ๆ ตั้งแต่การทดลองทางชีววิทยา, เคมี, ไปจนถึงการออกแบบยา
Meta ประกาศความสำเร็จในการสร้างซูเปอร์คอมพิวเตอร์ Research SuperCluster (RSC) เฟสที่สอง ที่เปิดตัวครั้งแรกต้นปี 2022 ตอนนี้มีสมรรถนะเกือบ 5 exaflops ถือเป็นซูเปอร์คอมพิวเตอร์อันดับหนึ่งของโลก (แชมป์ปัจจุบัน Frontier มีสมรรถนะ 1 exaflops)
สเปกเครื่องของ Research SuperCluster (RSC) ใช้เครื่อง NVIDIA DGX A100 จำนวน 2,000 เครื่อง นับจำนวน Tensor Core รวม 16,000 คอร์ เชื่อมต่อกันด้วย Quantum InfiniBand 16 Tb/s
กูเกิลเผยรายละเอียดของซูเปอร์คอมพิวเตอร์ที่ใช้ชิปออกแบบเอง Tensor Processing Unit (TPU) v4 ซึ่งเริ่มใช้ในโปรดักชันมาตั้งแต่ปี 2020 (แต่เพิ่งเผยรายละเอียดปี 2023) ว่าสามารถยกระดับประสิทธิภาพ machine learning ได้เกือบ 10 เท่าจากเครื่อง TPU v3 และสามารถเอาชนะเครื่องที่ใช้จีพียู NVIDIA A100 ได้ด้วย
TPU v4 เปิดตัวต่อสาธารณะเมื่อปี 2021 และทำผลงานเบนช์มาร์คด้าน AI ได้ดี เรื่องใหม่ที่กูเกิลเปิดเผยเพิ่มเติมในรอบนี้คือเครื่อง TPU v4 มีฟีเจอร์สำคัญ 2 ประการ
อินเทลยกเลิกโครงการจีพียูศูนย์ข้อมูล Rialto Bridge ที่เปิดตัวในปี 2022 และมีกำหนดขายปี 2023+ โดยจะข้ามไปออกจีพียูรุ่นถัดไป Falcon Shores ในปี 2025 เลยทีเดียว
Rialto Bridge เป็นจีพียูระดับสูงของอินเทลตัวที่สอง ถัดจาก Ponte Vecchio (ชื่อทางการคือ Data Center GPU Max) ที่เพิ่งออกขายเมื่อต้นปี 2023 จับตลาดซูเปอร์คอมพิวเตอร์และคอมพิวเตอร์สมรรถนะสูง (HPC)
ท่ามกลางสงคราม AI ระหว่างบริษัทยักษ์ใหญ่ เช่น Google, Meta, Microsoft+OpenAI รวมถึงรายย่อยลงมาอย่าง Stable Diffusion ถึงแม้ยังไม่เห็นผลแพ้ชนะในเร็ววัน แต่ผู้ชนะตัวจริงอาจเป็น NVIDIA ผู้ขายจีพียูรุ่นท็อปสำหรับเทรนโมเดลขนาดใหญ่ ที่ทุกบริษัทต้องซื้อหามาใช้งาน
จีพียูยอดนิยมของวงการ AI คือ NVIDIA A100 ที่เปิดตัวในปี 2020 ราคาตัวละเกือบ 10,000 ดอลลาร์ เซิร์ฟเวอร์ทั้งชุด DGX A100 มีจีพียู 8 ตัว มีราคาขายราว 200,000 ดอลลาร์ คาดกันว่า NVIDIA ครองตลาดจีพียู AI ถึง 95% เรียกได้ว่าแทบไร้คู่แข่ง
มหาวิทยาลัย Tsukuba เริ่มทดสอบเครื่องซูเปอร์คอมพิวเตอร์ Pegasus ที่อาจจะเป็นซูเปอร์คอมพิวเตอร์ที่ประหยัดพลังงานที่สุดในตอนนี้เพราะใช้ซีพียูและกราฟิกรุ่นใหม่ ร่วมกับหน่วยความจำแบบ Intel Optane ที่ก่อนหน้านี้ไม่ค่อยประสบความสำเร็จนักจนอินเทลต้องถอยออกจากตลาดไป
Pegasus ผลิตเครื่องโดย NEC ใช้ซีพียู Xeon Platinum 8468 (Sapphire Rapids) ร่วมกับ NVIDIA H100 พร้อมกับแรม DDR5-4800 อีก 128GB ที่น่าสนใจคือตัวเครื่องใส่ Intel Optane มาด้วยอีก 2TB แยกออกจาก SSD ขนาด 3.2TB อีกสองชุด เชื่อมต่อเน็ตเวิร์คด้วย NVIDIA Quantum-2 Infiniband (200Gbps)
อินเทลเปิดตัวแบรนด์ซีพียูและจีพียูฝั่งศูนย์ข้อมูลคือ Intel Xeon CPU Max และ Data Center GPU Max
สินค้าทั้งสองตัวเปิดตัวมาก่อนแล้ว เพียงแต่เรียกเป็นโค้ดเนมเท่านั้นคือ ซีพียู Xeon "Sapphire Rapids" (เวอร์ชัน Max ใช้แรมแบบ HBM) และจีพียู Ponte Vecchio ชิปทั้งสองรุ่นจะเริ่มวางขายในเดือนมกราคม 2023
ทั้ง Xeon CPU Max และ Data Center GPU Max ถูกใช้ในซูเปอร์คอมพิวเตอร์ Aurora ของศูนย์วิจัยแห่งชาติ Argonne National Laboratory ที่กำลังสร้างอยู่ มีสมรรถนะรวม 2 exaflops และกำหนดเสร็จในปี 2023
Tesla อัพเดตความคืบหน้าของ Dojo ซูเปอร์คอมพิวเตอร์ที่บริษัทออกแบบเองเพื่อเทรน AI ที่ใช้ในระบบขับขี่อัตโนมัติ และเปิดตัวต่อสาธารณะครั้งแรกช่วงกลางปี 2021
Tesla บอกว่าเมื่อขนาดของโมเดลใหญ่ขึ้นเรื่อยๆ จนไม่มีเครื่องขนาดใหญ่มากพอที่จะรัน ทางออกเดียวคือการสร้างเครื่องคอมพิวเตอร์ที่ใหญ่มากพอขึ้นมาเอง
ซูเปอร์คอมพิวเตอร์ Dojo ถูกออกแบบมาใหม่ทั้งหมด ภายใต้วิสัยทัศน์ว่าต้องเป็นตัวเร่งการประมวลผล (accelerator) ผืนใหญ่ผืนเดียว (single scalable compute plane) ใช้ชิปออกแบบเองที่เรียกว่า D1 นำมาต่อกับ I/O + Power + Cooling กลายเป็น Training Tile ซึ่งบอกว่ามีพลังเท่ากับจีพียู 6 ชุดเลยทีเดียว
การวัดประสิทธิภาพการฝึกโมเดลปัญญาประดิษฐ์ MLPerf ประกาศผลรอบใหม่ ทำให้ผู้ผลิตรายหลักๆ ก็ออกมาเคลมชัยชนะในมุมของตัวเองกัน
Google Cloud นั้นส่งผลทดสอบของ TPU v4 เข้าร่วม และโชว์ว่าแรงกว่าเซิร์ฟเวอร์ "ที่หาซื้อได้" (available on-prem) อย่างชัดเจน โดยเครื่องที่ Google Cloud ส่งผลทดสอบนั้นสามารถเปิดใช้งานได้จริงผ่านบริการ ML hub
อินเทลมีจีพียูสำหรับคอมพิวเตอร์สมรรถนะสูงชื่อ Ponte Vecchio ที่เปิดตัวครั้งแรกในปี 2019 โดยจะใช้กับซูเปอร์คอมพิวเตอร์ Aurora ของกระทรวงพลังงานสหรัฐ มีกำหนดเสร็จช่วงปลายปี 2022
จีพียู Ponte Vecchio (นำชื่อมาจากสะพานโบราณในเมืองฟลอเรนซ์ ประเทศอิตาลี) มีแนวคิดใหม่ๆ หลายอย่าง นอกจากใช้สถาปัตยกรรม Xe ตามแนวทางจีพียูอินเทลสมัยใหม่ ยังนำแนวคิดเรื่อง tile หรือชิปย่อยๆ ที่ทำงานหน้าที่ต่างกัน ผลิตคนละโรงงานกัน (บาง tile ผลิตโดย TSMC) นำมาประกบกันแบบแนวตั้ง เป็นแพ็กเกจชิปที่อินเทลเรียกว่า Foveros รายละเอียดสามารถอ่านได้จากบทความเรื่อง Ponte Vecchio
ถึงแม้ Ponte Vecchio ที่ใช้ในเครื่อง Aurora ยังไม่เสร็จสมบูรณ์ดี ล่าสุดอินเทลเปิดตัวจีพียูรุ่นที่สองแล้ว ใช้ชื่อว่า Rialto Bridge ซึ่งเป็นสะพานโบราณในเมืองเวนิส
อันดับซูเปอร์คอมพิวเตอร์โลก TOP500 ประจำรอบเดือนมิถุนายน 2022 (จัดปีละ 2 ครั้งทุกเดือนมิถุนายนและพฤศจิกายน) มีการเปลี่ยนแปลงสำคัญคือมีแชมป์ใหม่ ซูเปอร์คอมพิวเตอร์ Frontier ของห้องวิจัย Oak Ridge National Laboratory (ORNL) ของสหรัฐ แถมยังเป็นซูเปอร์คอมพิวเตอร์เครื่องแรกของโลกที่มีสมรรถนะ 1.102 Exaflop/s ทะลุกำแพง Exaflop ได้เป็นครั้งแรก
NVIDIA เปิดตัวชุดเซิร์ฟเวอร์ DGX H100 ที่ใช้ชิป H100 สถาปัตยกรรม Hopper โดยเปิดตัวทั้งแบบเซิร์ฟเวอร์เดี่ยว DGX H100, ชุดระดับตู้เซิร์ฟเวอร์ DGX POD, และระบบขนาดศูนย์ข้อมูล DGX SuperPOD
ชุดใหญ่สุดคือ DGX SuperPOD นั้นรองรับโหนดรวม 32 โหนด มีชิป H100 ทั้งหมด 256 ชุด พลังประมวลผลรวม 1 exaflops ที่ FP8
เพื่อแสดงพลังของเซิร์ฟเวอร์ชุดใหม่ ทาง NVIDIA จะสร้างซูเปอร์คอมพิวเตอร์ Eos ใช้ DGX H100 รวม 576 เครื่อง มีชิปกราฟิก H100 ทั้งหมด 4,608 ชุด คาดว่าจะมีพลังประมวลผลปัญญาประดิษฐ์รวม 18.4 exaflops และพลังประมวลผลวิทยาศาสตร์ 275 petaflops คาดว่าจะรันเครื่อง Eos โชว์ได้ในปีนี้
สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ (สวทช.) ประกาศข่าวการซื้อซูเปอร์คอมพิวเตอร์เครื่องใหม่ของไทย โดยคัดเลือก Hewlett Packard Enterprise (HPE) เป็นผู้สร้างระบบซูเปอร์คอมพิวเตอร์ มีสมรรถนะ 13 petaflops จะถือเป็นซูเปอร์คอมพิวเตอร์สมรรถนะสูงที่สุดในเอเชียตะวันออกเฉียงใต้
HPE จะใช้ซูเปอร์คอมพิวเตอร์รุ่น HPE Cray EX ซึ่งเป็นรุ่นล่าสุดของบริษัท สเปกใช้ซีพียู AMD EPYC 3rd Gen จำนวน 496 ตัว, จีพียู NVIDIA A100 จำนวน 704 ตัว, ระบบเครือข่าย HPE Slingshot และระบบสตอเรจ Cray Cluterstor E1000
TOP500.org ประกาศรายชื่อซูเปอร์คอมพิวเตอร์ 500 อันดับแรกประจำรอบเดือนพฤศจิกายน 2021 (ประกาศทุกครึ่งปี) อันดับในกลุ่ม Top 10 ยังแทบไม่เปลี่ยนแปลง โดยแชมป์ยังเป็นเครื่อง Fugaku ของญี่ปุ่น (พัฒนาโดย Fujitsu) เช่นเดิม ถือเป็นการครองอันดับติดต่อกันมา 4 สมัยนับจากรอบเดือนมิถุนายน 2020
อันดับสองและสามคือ IBM Summit อดีตแชมป์เก่า และ Sierra ตามลำดับ ทั้งสองเครื่องใช้สเปกคล้ายๆ กันคือ ซีพียู IBM Power9, จีพียู NVIDIA Volta GV100, เครือข่าย Mellanox
NVIDIA ประกาศสร้างซูเปอร์คอมพิวเตอร์เครื่องใหม่ชื่อ Earth-2 หรือ E-2 เพื่อประมวลผลการเปลี่ยนแปลงภูมิอากาศของโลก โดยยังไม่เปิดเผยรายละเอียดอื่นๆ มากนัก ไม่ว่าจะเป็นสเปก กรอบเวลา หรือพาร์ทเนอร์
Jensen Huang ซีอีโอของ NVIDIA ระบุแค่ว่า Earth-2 เป็นการสร้าง "แฝดดิจิทัล" (digital twin) ของโลกขึ้นมาใน omniverse (metaverse ในภาษาของ NVIDIA) เพื่อจำลองสภาพแวดล้อมของโลกอย่างละเอียดมากๆ มาสร้างโมเดลการเปลี่ยนแปลงภูมิอากาศได้ลงลึก (ultra-high-resolution climate modeling) กว่าโมเดลในปัจจุบันที่ทำได้ระดับ 10-100 กิโลเมตร
ห้องวิจัยแห่งชาติ Argonne National Laboratory ของกระทรวงพลังงานสหรัฐ เปิดตัวซูเปอร์คอมพิวเตอร์รุ่นใหม่ Polaris ที่สร้างโดย HPE
เป้าหมายของ Polaris เป็น "ซูเปอร์คอมพิวเตอร์ทดสอบ" สำหรับงานประมวลผลระดับ exascale ในอนาคตอันใกล้นี้ ซึ่งกระทรวงพลังงานสหรัฐ กำลังอยู่ระหว่างการสร้างซูเปอร์คอมพิวเตอร์ระดับ exaflops ทั้งหมด 3 ตัวในห้องวิจัยแห่งชาติ 3 แห่งคือ Aurora (Argonne), Frontier (Oak Ridge), El Capitan (Lawrence Livermore)
ในงาน Intel Architecture Day ที่ผ่านมา Raja M. Koduri แสดงถึงข้อมูลในงานว่าที่ผ่านมาอินเทลนั้นตามหลังอุตสาหกรรมซูเปอร์คอมพิวเตอร์ (หรือ high performance computing - HPC) ค่อนข้างมาก โดยยกตัวเลขประสิทธิภาพสามด้าน ได้แก่ ประสิทธิ์ภาพการประมวลผลเลขทศนิยม (floating point 64), ประสิทธิภาพด้านปัญญาประดิษฐ์ (bfloat16), และแบนวิดท์หน่วยความจำ ที่ชิปเฉพาะทางสามารถทำได้ดีขึ้นเรื่อยๆ ทิ้งห่างอินเทลไปไกล ทำให้ปีที่ผ่านมาอินเทลทุ่มพัฒนาชิปสำหรับตลาดซูเปอร์คอมพิวเตอร์ในชื่อ Ponte Vecchio
ทีมวิจัยจาก University of Applied Sciences Graubünden ในสวิตเซอร์แลนด์ประกาศความสำเร็จใจการคำนวณค่า Pi เป็นทศนิยมจำนวน 62.8 ล้านล้านหลัก ทำลายสถิติเดิมของ Timothy Mullican ที่คำนวณไว้ 50 ล้านล้านหลักเมื่อต้นปี 2020 ที่ผ่านมา
นอกจากการทำลายสถิติโลกแล้ว ทีมวิจัยยังแสดงถึงประสิทธิภาพของอัลกอริธึม โดยการทำลายสถิติการคำนวณค่า Pi เมื่อปี 2019 กูเกิลทำไว้ที่ 31.4 ล้านล้านตำแหน่ง แต่ใช้คลัสเตอร์เครื่อง n1-standard-16 ถึง 24 เครื่อง ร่วมกับเครื่องแม่ n1-megamem-96 อีกหนึ่งเครื่อง รันนาน 112 วัน ขณะที่ Mullican นั้นรันนานกว่า 300 วันแต่ไม่มีข้อมูลว่าใช้ฮาร์ดแวร์อะไรบ้าง
อินเทลประกาศปรับโครงสร้างองค์กรใหม่ แยกฝ่ายศูนย์ข้อมูล (Data Platform Group) ออกเป็น 2 ส่วน และตั้งหน่วยธุรกิจใหม่อีก 2 หน่วย
Data Platform Group (DPG) ที่เป็นธุรกิจฝั่งเซิร์ฟเวอร์ จะแยกออกเป็นหน่วย Datacenter and AI ที่ครอบคลุม Xeon, FPGA, AI และหน่วย Network and Edge Group ครอบคลุมด้านชิปสื่อสารและ IoT
อินเทลยังตั้งหน่วยธุรกิจใหม่อีก 2 หน่วยคือ Software and Advanced Technology Group เน้นการพัฒนาซอฟต์แวร์โดยเฉพาะ และ Accelerated Computing Systems and Graphics Group (AXG) เน้นคอมพิวเตอร์สมรรถนะสูง ซูเปอร์คอมพิวเตอร์ กราฟิก โดยหน่วยหลังสุดได้ Raja Koduri ที่เราคุ้นหน้าจากวงการจีพียูมาเป็นหัวหน้า
NVIDIA เปิดตัวซีพียู Grace เป็นซีพียู Arm Neoverse ที่ออกแบบมาเพื่อทำงานร่วมกับชิปกราฟิกอย่างแนบแน่นเพื่อให้ได้ประสิทธิภาพสูงสุด โดย NVIDIA ระบุว่าสถาปัตยกรรมของ Grace จะทำให้รันงานด้านปัญญาประดิษฐ์เร็วกว่าเดิมถึงสิบเท่า
Grace เชื่อมต่อกับชิปกราฟิกผ่าน NVLink รุ่นที่ 4 มีแบนวิดท์ระหว่างสองชิป 900GB/s และใช้แรม LPDDR5x สถาปัตยกรรมใหม่ใช่หน่วยความจำเป็น address space ร่วมกันกับกราฟิก
Swiss National Computing Center (CSCS) กำลังสร้างซูเปอร์คอมพิวเตอร์ ALPS โดยใช้ซีพียู Grace สร้างโดย HPE คาดว่าเปิดใช้งานปี 2023 และ Los Alamos National Laboratory ศูนย์วิจัยกระทรวงพลังงานสหรัฐฯ ผู้ใช้ซูเปอร์คอมพิวเตอร์อันดับต้นๆ ของโลกก็วางแผนสร้างซูเปอร์คอมพิวเตอร์ใหม่โดยใช้ Grace เช่นกัน