TPU | Blognone

ที่งาน Google Cloud Next 2025 กูเกิลเปิดตัวชิป TPU Ironwood ชิปปัญญาประดิษฐ์ของกูเกิลเองรุ่นถัดจาก TPU v5p โดยชูประเด็นการเชื่อมต่อระหว่างชิป Inter-Chip Interconnect (ICI) ที่เปิดทางให้สร้างคลัสเตอร์ขนาดใหญ่ระดับเกือบหมื่นชิป

ตัวชิป TPU Ironwood เองมีพลังประมวลผล 4,614 TeraFLOPS แรงกว่า TPU v5p เกินสิบเท่าตัว (ชาร์ตข้าม Trillium ที่ดีกว่า v5e อยู่ 4.7 เท่าตัว) แต่ละชิปมาพร้อมแรม HBM ขนาด 192GB แบนวิดท์ 7.4TB/s ประสิทธิภาพต่อพลังงานดีขึ้นกว่า TPU Trillium สองเท่าตัว

ลูกค้า Google Cloud สามารถเลือกใช้ Ironwood เป็นคลัสเตอร์ได้สองขนาด คือ 256 ชิป และ 9,216 ชิป อัดเต็มไปถึง 42.5 ExaFLOPS

Google Cloud มีบริการ Hypercompute Cluster เช่า VM พลังสูงต่อเป็นคลัสเตอร์สูงสุด 65,000 ตัว

By: mk

on 17 January 2025 - 19:40 Tags:

Topics:

Cloud Computing

Google Cloud โชว์บริการ Hypercompute Cluster การให้เช่า VM ขนาดใหญ่กำลังสูงๆ สำหรับประมวลผล AI เพื่อมาต่อเป็นคลัสเตอร์ขนาดใหญ่ เสมือนเป็นการเช่า "ซูเปอร์คอมพิวเตอร์" ที่รันอยู่บนคลาวด์ของกูเกิลอีกที

แกนหลักของ Hypercompute Cluster คือ VM ที่ออกแบบมาสำหรับประมวลผล AI โดยเฉพาะ ซึ่งเลือกได้ระหว่างเครื่องสาย TPU ของกูเกิลเอง (มีเครื่องที่รัน Trillium หรือ TPU v6 แล้ว) กับเครื่องรุ่น A3 Ultra ที่ใช้จีพียู NVIDIA H200 จากนั้นนำเครื่องเหล่านี้มาต่อเป็นคลัสเตอร์ภายใต้บริการ Google Kubernetes Engine (GKE) บวกกับซอฟต์แวร์ด้านการจัดการของกูเกิลอีกจำนวนหนึ่ง

DeepMind โชว์ AlphaChip ปัญญาประดิษฐ์ออกแบบชิป ใช้งานจริงแล้วกับชิป TPU

By: mk

on 29 September 2024 - 19:31 Tags:

Topics:

DeepMind เผยแพร่งานวิจัยของ AlphaChip โมเดลปัญญาประดิษฐ์ช่วยออกแบบวงจรในชิป ซึ่งใช้งานจริงมาเงียบๆ สักระยะหนึ่งแล้วกับชิป TPU สามรุ่นหลังสุด, ซีพียู Google Axion รวมถึงชิปของบริษัทอื่นอย่าง MediaTek Dimensity 5G ด้วย

DeepMind บอกว่าการออกแบบชิปในปัจจุบันมีความซับซ้อนสูงมาก จึงนำแนวคิด reinforcement learning ให้ปัญญาประดิษฐ์เรียนรู้ด้วยตัวเองผ่านการ "เล่นเกม" แบบเดียวกับ AlphaGo และ AlphaZero แต่แทนที่จะเป็นโกะหรือหมากรุก ก็เป็นเกมออกแบบผังวงจรอิเล็กทรอนิกส์แทน

Apple เผยแพร่เอกสาร ระบุใช้ TPU ของ Google ในการเทรน Apple Intelligence

By: arjin

on 31 July 2024 - 08:42 Tags:

Topics:

แอปเปิลเผยแพร่เอกสาร รายละเอียดของโมเดลปัญญาประดิษฐ์ที่พัฒนาขึ้นซึ่งเรียกว่า Apple Intelligence Foundation Language Models (AFM) โดยมีประเด็นน่าสนใจคือเทคโนโลยีที่แอปเปิลเลือกใช้ในการเทรนโมเดล AI เพราะแอปเปิลไม่ได้ใช้จีพียูของ NVIDIA

Google เปิดตัวชิป TPU รุ่นที่ 6 Trillium ประสิทธิภาพประมวลผลสูงกว่ารุ่นก่อนหน้า 4.7 เท่า

By: arjin

on 15 May 2024 - 14:04 Tags:

Topics:

Semiconductor

กูเกิลเปิดตัวชิป TPU รุ่นที่ 6 เรียกชื่อว่า Trillium ซึ่งมีการปรับปรุงทั้งประสิทธิภาพการทำงาน และอัตราการสิ้นเปลืองพลังงาน โดย Trillium สามารถประมวลผลได้มากถึง 4.7 เท่า ที่ระดับพีคเมื่อเทียบกับ TPU v5e รุ่นก่อนหน้านี้ มีอัตราการใช้พลังงานที่ดีกว่า 67%

Trillium ได้เพิ่มขนาด HBM สองเท่า เพิ่ม ICI ที่เชื่อมต่อหากันระหว่าง TPU เพิ่มสองเท่า และใช้ตัวเร่งการประมวลผล SparseCore รุ่นที่ 3 จึงมีค่าความหน่วงที่ลดลง รองรับการประมวลผลโมเดลรุ่นใหม่ได้มากกว่า เร็วกว่า ด้วยต้นทุนที่น้อยลง

TPU Trillium จะเริ่มมีให้ใช้งานภายในปีนี้

Google พัฒนาซีพียูใหม่ใช้เอง Axion รองรับงาน AI ในศูนย์ข้อมูลโดยเฉพาะ

By: arjin

on 9 April 2024 - 19:00 Tags:

Topics:

CPU

กูเกิลเปิดเผยว่าบริษัทได้พัฒนาชิปประมวลผลใหม่ เรียกชื่อว่า Axion เพื่อรองรับงานด้าน AI เป็นหลัก ซึ่งกูเกิลมีแผนการพัฒนาซีพียูส่วนนี้มาหลายปีแล้ว แต่มาเร่งมากขึ้นหลัง ChatGPT เปิดตัวช่วงปลายปี 2022

การที่กูเกิลลงทุนพัฒนาชิปสำหรับใช้งาน AI บนคลาวด์ของตนเองไม่ใช่เรื่องแปลก เพราะทั้งอเมซอนและไมโครซอฟท์ ก็พัฒนาชิปสำหรับงานด้าน AI ของตนเองเช่นกัน กูเกิลเองก็มีหน่วยประมวลผลที่พัฒนาเองเรียกว่า TPU ซึ่งมีใช้งานมาตั้งแต่ปี 2016 แต่กรณีของ Axion นั้นทำงานเป็นหน่วยประมวลผลกลางหรือเป็นซีพียู

Google เปิดตัวชิป TPU v5p อัดชิปได้ 8,960 ชิปต่อตู้, อัดแรม 3 เท่า เน้นงาน Generative AI

By: lew

on 6 December 2023 - 23:01 Tags:

Topics:

Semiconductor

กูเกิลเปิดตัวชิป TPU v5p รุ่นใหม่ล่าสุดที่เตรียมจะใช้เร่งความเร็วในการพัฒนา Generative AI โดยเฉพาะ

พลังประมวลผลต่อชิปของ TPU v5p นั้นสูงกว่ารุ่นก่อนหน้ามาก แต่จุดเด่นเป็นพิเศษคือ จำนวนชิปต่อตู้ (pod) นั้นสูงถึง 8,960 ชิป มากกว่าสองเท่าตัวของ TPU v4 และแรมต่อชิปนั้นสูงถึง 95GB เทียบกับ TPU v4 ที่เคยรับแรม 32GB แนวทางนี้ NVIDIA ก็เคยออกการ์ดรุ่นพิเศษเพื่องานกลุ่ม LLM ที่ต้องการแรมปริมาณสูงมาก

Google Cloud เปิดตัว TPU v5e รุ่นใหม่ เน้นประสิทธิภาพต่อราคาดีกว่า TPU v4 สองเท่า

By: mk

on 30 August 2023 - 18:52 Tags:

Topics:

GPU

Cloud Computing

Google Cloud เปิดตัวชิปประมวลผลปัญญาประดิษฐ์ Cloud TPU v5e เวอร์ชันใหม่ที่อัพเกรดจาก TPU v4 ซึ่งเริ่มใช้มาตั้งแต่ปี 2020

ตอนนี้ยังมีรายละเอียดของ TPU v5e ออกมาไม่มากนัก แต่มันเป็น TPU เวอร์ชันคัสตอม (ตัวท้าย e) ที่เน้นประสิทธิผลเรื่องต้นทุน (cost-efficiency) กว่า TPU รุ่นปกติ จากตัวเลขของกูเกิลระบุว่ามีประสิทธิภาพต่อดอลลาร์ในการเทรนโมเดล LLM ดีกว่า TPU v4 สูงสุดราว 2 เท่า และประสิทธิภาพต่อดอลลาร์ในการรันโมเดลดีกว่าสูงสุด 2.5 เท่า

กูเกิลเผยรายละเอียดเครื่อง TPU v4 ใช้สวิตช์แสงเชื่อมต่อชิป, แรงกว่า NVIDIA A100

By: mk

on 9 April 2023 - 15:24 Tags:

Topics:

High Performance Computing

Supercomputer

กูเกิลเผยรายละเอียดของซูเปอร์คอมพิวเตอร์ที่ใช้ชิปออกแบบเอง Tensor Processing Unit (TPU) v4 ซึ่งเริ่มใช้ในโปรดักชันมาตั้งแต่ปี 2020 (แต่เพิ่งเผยรายละเอียดปี 2023) ว่าสามารถยกระดับประสิทธิภาพ machine learning ได้เกือบ 10 เท่าจากเครื่อง TPU v3 และสามารถเอาชนะเครื่องที่ใช้จีพียู NVIDIA A100 ได้ด้วย

TPU v4 เปิดตัวต่อสาธารณะเมื่อปี 2021 และทำผลงานเบนช์มาร์คด้าน AI ได้ดี เรื่องใหม่ที่กูเกิลเปิดเผยเพิ่มเติมในรอบนี้คือเครื่อง TPU v4 มีฟีเจอร์สำคัญ 2 ประการ

SiFive เผย กูเกิลนำซีพียู RISC-V ไปใช้คู่กับ TPU เพื่อเร่งความเร็ว AI/ML ในศูนย์ข้อมูล

By: mk

on 26 September 2022 - 10:25 Tags:

Topics:

Machine Learning

SiFive บริษัทผู้ผลิตซีพียู RISC-V ชื่อดัง เปิดเผยว่าซีพียูของตัวเองรุ่น SiFive Intelligence X280 ถูกนำไปใช้ในศูนย์ข้อมูลของกูเกิล เพื่อช่วยเร่งการประมวลผล AI/ML แล้ว

สิ่งที่กูเกิลทำคือนำ X280 ไปรันคู่กับหน่วยประมวลผล Tensor Processing Unit (TPU) ของตัวเอง เพื่อแบ่งเบาภาระงานบางอย่างออกจากหน่วยประมวลผลหลัก

ซีพียู SiFive X280 มีส่วนขยายชุดคำสั่งแบบเวกเตอร์ และรองรับการรวมรีจิสเตอร์เวกเตอร์เข้าด้วยกัน (รีจิสเตอร์ 512-bit x 32 ตัว) เพื่อให้ได้เวกเตอร์ยาวขึ้น (สูงสุดเป็น 4096 บิต) รวมถึงมีชุดคำสั่งคัสตอมสำหรับงาน AI/ML โดยเฉพาะด้วย จึงช่วยให้งานประมวลผล AI/ML มีประสิทธิภาพดีขึ้น

ประกาศผล MLPerf 2.0 วัดความแรงชิป AI: Google TPU โชว์เครื่องแรงสุด, NVIDIA ระบุนับต่อชิปยังชนะ, Intel เริ่มชนะบางหมวด

By: lew

on 30 June 2022 - 02:22 Tags:

Topics:

High Performance Computing

การวัดประสิทธิภาพการฝึกโมเดลปัญญาประดิษฐ์ MLPerf ประกาศผลรอบใหม่ ทำให้ผู้ผลิตรายหลักๆ ก็ออกมาเคลมชัยชนะในมุมของตัวเองกัน

Google Cloud นั้นส่งผลทดสอบของ TPU v4 เข้าร่วม และโชว์ว่าแรงกว่าเซิร์ฟเวอร์ "ที่หาซื้อได้" (available on-prem) อย่างชัดเจน โดยเครื่องที่ Google Cloud ส่งผลทดสอบนั้นสามารถเปิดใช้งานได้จริงผ่านบริการ ML hub

Google Cloud เปิดบริการ Cloud TPU VM เช่าใช้ชิป TPU ของกูเกิลรัน ML ได้ดีกว่าเดิม

By: mk

on 10 May 2022 - 10:18 Tags:

Topics:

Google Cloud ประกาศบริการ Cloud TPU VMs เข้าสถานะเสถียร general availability (GA)

กูเกิลมีหน่วยประมวลผล TPU (Tensor Processing Unit) ที่ออกแบบเองสำหรับเร่งความเร็ว AI มาตั้งแต่ปี 2017 และเปิดให้คนทั่วไปเช่ารัน-เทรนโมเดล machine learning ผ่าน Google Cloud มาตั้งแต่ปี 2018 ในชื่อบริการ Cloud TPU

แต่ที่ผ่านมา การเช่า TPU ยังเป็นการเช่า VM บนเครื่องอื่นแล้วรีโมทเข้าไปเรียก TPU ผ่านโปรโตคอล gRPC เท่านั้น ผู้ใช้ไม่สามารถเข้าถึงเครื่อง TPU โดยตรงได้ (ดูภาพประกอบ)

MLPerf ออกผลทดสอบรุ่น 1.0: NVIDIA เร็วสุดที่ซื้อได้, Graphcore โชว์ประสิทธิภาพต่อราคา, Google โชว์ TPUv4

By: lew

on 5 July 2021 - 11:24 Tags:

Topics:

MLCommons หน่วยงานกลางสำรวจประสิทธิภาพคอมพิวเตอร์ด้าน machine learning และปัญญาประดิษฐ์ออกรายงานเวอร์ชั่น 1.0 โดยมีผู้เข้าร่วมน่าสนใจได้แก่ NVIDIA ที่ส่งเครื่อง DGX-A100 เข้าทดสอบ, อินเทลส่ง Xeon Platinum 8380, กูเกิลส่ง TPUv4 ที่ยังไม่เปิดให้บริการทั่วไป, และ Graphcore สตาร์ตอัพปัญญาประดิษฐ์ส่งเครื่อง IPU-POD เข้าจัดอันดับ

ชิป Edge TPU ของกูเกิลเริ่มวางขายแล้ว รุ่น USB-C ราคา 74.99 ดอลลาร์

By: lew

on 5 March 2019 - 22:55 Tags:

Topics:

Coral

กูเกิลเปิดตัว Edge TPU ชิปประมวลผลปัญญาประดิษฐ์สำหรับอุปกรณ์ขนาดเล็กมาตั้งแต่กลางปีที่แล้ว โดยบอกว่าจะขายทปลายปี 2018 แต่หลังจากเลยกำหนดมาพักใหญ่ ตอนนี้บอร์ดพัฒนา และตัวเร่งแบบ USB-C ก็วางขายแล้วทั้งคู่ ในแบรนด์ Coral

ตัว Coral Dev Board ใช้ชิป NXP i.MX 8M ภายในเป็น Cortex-A53 สี่คอร์ และไมโครคอนโทรลเลอร์ Cortex-M4F แรม 1GB และหน่วยความจำ eMMC 8GB รองรับ Wi-Fi 802.11ac และ Bluetooth 4.1 พอร์ตแลนกิกะบิต, USB-C, USB-A 3.0, และ micro USB สำหรับคอนโซล ต่อจอภาพด้วย HDMI 2.0a, MIPI-DSI 24 pin, และต่อกล้องด้วย MIPI-CSI2 และชิป Edge TPU ราคา 149.99 ดอลลาร์

เฟซบุ๊กประกาศฟีเจอร์เพิ่มเติมใน PyTorch 1.0 กูเกิลกำลังช่วยพัฒนาให้รองรับ TPU ด้วย

By: lew

on 4 October 2018 - 08:02 Tags:

Topics:

เฟซบุ๊กเปิดตัว PyTorch 1.0 ตั้งแต่เดือนพฤษภาคมที่ผ่านมา โดยตอนนี้ก็ยังเป็นเพียงรุ่นพรีวิวอยู่ อย่างไรก็ตามที่งาน PyTorch Developer Conference เมื่อวานนี้ก็มีการประกาศความก้าวหน้าของโครงการเพิ่มเติม

ฟีเจอร์ที่เพิ่มมาคือการทำงานในโหมด eager ที่ช่วยให้นักพัฒนาสามารถทดลองกับกราฟประมวลผลได้ง่ายขึ้น และมีการปรับปรุงไลบรารี torch.distributed โดยตอนนี้รองรับทั้ง Python และ C++

กูเกิลเปิดตัวชิป Edge TPU รันโมเดลปัญญาประดิษฐ์ได้ในคอมพิวเตอร์ขนาดเล็ก พร้อมซอฟต์แวร์ Cloud IoT Edge

By: lew

on 26 July 2018 - 01:13 Tags:

Topics:

กูเกิลเปิดตัวชิป Edge TPU สำหรับการพัฒนาปัญญาประดิษฐ์ในอุปกรณ์ IoT ขนาดเล็กเช่นกล้องวงจรปิด สำหรับการตรวจจับการจราจรโดยไม่ต้องส่งภาพกลับไปยังศูนย์กลาง

สำหรับฝั่งซอฟต์แวร์ Cloud IoT Edge เป็นชุดซอฟต์แวร์ที่สามารถรันได้บน Android Things หรือลินุกซ์อื่นๆ โดยมันมาพร้อมกับ Edge ML รันไทม์สำหรับรัน TensorFlow Lite มันสามารถรันบนซีพียู หรือเร่งความเร็วด้วยกราฟิกหรือ TPU ก็ได้

ตัวชิปจะมาพร้อมกับบอร์ดจาก NXP ให้สั่งได้ภายในเดือนตุลาคมนี้

ที่มา - Google Blog

กูเกิลเปิดตัวหน่วยประมวลผล TPU v3 สมรรถนะดีขึ้นกว่ารุ่นก่อนถึง 8 เท่า

By: mk

on 9 May 2018 - 13:41 Tags:

Topics:

Processor

CPU

เก็บตกประกาศข่าวจากงาน Google I/O 2018 กูเกิลเปิดตัวหน่วยประมวลผล Tensor Processing Unit (TPU) รุ่นที่สาม รุ่นอัพเกรดจาก TPU v2 ที่เปิดตัวในช่วงเดือนนี้ของปีที่แล้ว

TPU v3 มีสมรรถนะดีขึ้นกว่า v2 ถึง 8 เท่า และ TPU หนึ่งชุด (64 ตัวเรียกเป็น 1 pod) มีพลังประมวลผลถึง 100 petaFLOPS เพิ่มขึ้นจาก 1 pod ของ TPU v2 ที่ทำได้เพียง 11.5 petaFLOPS tops

อีกประเด็นที่น่าสนใจคือ TPU v3 ใช้ระบบระบายความร้อนด้วยของเหลวด้วย ซึ่งเป็นครั้งแรกที่กูเกิลนำระบบแบบนี้มาใช้งานกับ TPU

Cloud TPU หน่วยประมวลผล AI ของกูเกิล เปิดให้คนทั่วไปเช่าใช้งานผ่านคลาวด์แล้ว

By: mk

on 12 February 2018 - 21:45 Tags:

Topics:

เมื่อกลางปีที่แล้ว กูเกิลเปิดตัว TPU (Tensor Processing Unit) ชิปสำหรับประมวลผล deep learning รุ่นที่สอง พร้อมจับขึ้นคลาวด์เพื่อให้คนทั่วไปใช้งาน โดยช่วงแรกยังจำกัดเฉพาะนักวิจัยเท่านั้น

เวลาผ่านมาเกือบปี Cloud TPU เปิดบริการรุ่นเบต้าบน Google Cloud Platform (GCP) สักที คนทั่วไปสามารถนำงานด้าน machine learning มาเทรนโมเดลบน Cloud TPU เพื่อเร่งความเร็วให้ได้มากขึ้น (Cloud TPU หนึ่งตัวมีสมรรถนะสูงสุด 180 tflops และแรม 64GB)

กูเกิลเปิดตัว TPU รุ่นที่ 2 ให้บริการบน Google Cloud แล้ว

By: lew

on 18 May 2017 - 00:33 Tags:

Topics:

กูเกิลเปิดตัว TPU (Tensor Processing Unit) ชิปสำหรับประมวลผล deep learning รุ่นที่สอง พัฒนาจากรุ่นแรกที่ใช้เพื่อการคำนวณผลลัพธ์จากเครือข่ายนิวรอนเป็นหลัก รุ่นใหม่นี้จะมีความสามารถในการฝึกเครือข่ายนิวรอน (inference) ได้ด้วย พร้อมกับเปิดบริการ Cloud TPU รุ่น Alpha (ต้องขอเข้าร่วมทดสอบ)

TPU แต่ละชุดจะมีพลังประมวลผล 180 TFLOPS กูเกิลออกแบบระบบเป็นตู้ (pod) แต่ละตู้มี TPU 64 ชุด รวมพลังประมวลผล 11.5 PFLOPS โค้ด TensorFlow สามารถรันบนเซิร์ฟเวอร์ได้โดยเปลี่ยนโค้ดเล็กน้อย

กูเกิลเปิดข้อมูลชิป Tensor Processing Unit เร็วกว่า 15 เท่า ประหยัดไฟกว่า 29 เท่า

By: lew

on 6 April 2017 - 23:20 Tags:

Topics:

TensorFlow