Image
By lew Founder on Tag: ROCm, AMD, CUDA, GPGPU, Interview
ROCm

การแข่งขันกันระหว่างผู้ผลิตชิปกราฟิกรุนแรงขึ้นมาในช่วงหลังๆ โดยหลายปีที่ผ่านมา NVIDIA มีชุดซอฟต์แวร์ CUDA ที่ได้รับความนิยมในวงการปัญญาประดิษฐ์อย่างมาก ส่งผลให้ NVIDIA กลายเป็นมาตรฐานในการพัฒนาปัญญาประดิษฐ์เป็นส่วนใหญ่ แต่บริษัทพัฒนาปัญญาประดิษฐ์ก็เริ่มให้ความสนใจกับชิปจากผู้ผลิตอื่นๆ มากขึ้น เช่น OpenAI ประกาศใช้ชิป AMD หรือ Anthropic ประกาศใช้ชิป TPU ก็แสดงให้เห็นว่าตลาดอาจจะต้องการตัวเลือกเพิ่มเติม

By mk Founder on Tag: Red Hat, RHEL, CUDA, OpenShift, NVIDIA
Red Hat

Red Hat ประกาศเซ็นสัญญากับ NVIDIA ในการผนวกซอฟต์แวร์ CUDA เข้ามาบนแพลตฟอร์มของตัวเอง ทั้ง Red Hat Enterprise Linux (RHEL), Red Hat OpenShift, Red Hat AI

ซอฟต์แวร์ CUDA นั้นไม่ได้โอเพนซอร์ส และการติดตั้ง CUDA ต้องดาวน์โหลดตัวไฟล์ไบนารีกันแยกเองจากเว็บไซต์ NVIDIA เพราะดิสโทรลินุกซ์ไม่สามารถผนวกเข้าเป็นส่วนหนึ่งของแพ็กเกจได้ แต่เมื่อ CUDA ได้รับความนิยมมากขึ้นเรื่อยๆ ตามกระแส AI ทำให้กระบวนการติดตั้ง CUDA กลายเป็นปัญหาเมื่อต้องติดตั้งบนเครื่องจำนวนมากๆ ช่วงหลังเราจึงเห็น NVIDIA ทำสัญญากับดิสโทรลินุกซ์ยอดนิยมเพื่อให้สามารถผนวก CUDA ไปกับตัวระบบปฏิบัติการได้

By mk Founder on Tag: CUDA, GPU, Open Source, Machine Learning
CUDA

ZLUDA โครงการแปลง CUDA ของ NVIDIA ให้รันบนจีพียูค่ายอื่นได้ ที่เริ่มโอเพนซอร์สช่วงต้นปี 2024 เริ่มมีความคืบหน้า โดยออกซอฟต์แวร์ ZLUDA เวอร์ชัน 5 มีการเปลี่ยนแปลงดังนี้

By mk Founder on Tag: CUDA, Ubuntu, Canonical, NVIDIA, Linux
CUDA

บริษัท Canonical ประกาศออกแพ็กเกจ NVIDIA CUDA ผ่านระบบ repository ของ Ubuntu ให้ติดตั้งกันง่ายๆ

เดิมทีนักพัฒนาที่ต้องการเรียกใช้ CUDA ต้องดาวน์โหลดแพ็กเกจ .deb จากเว็บไซต์ NVIDIA มาติดตั้งเอง ซึ่งยุ่งยากพอสมควร การแก้ปัญหานี้โดยรวม CUDA เข้ามาอยู่บนระบบแพ็กเกจของ Ubuntu โดยตรง พิมพ์คำสั่งเดียวได้เลย ย่อมช่วยอำนวยความสะดวกได้อีกมาก

นอกจากนี้ แอพอื่นที่ต้องการเรียกใช้ CUDA ยังสามารถคาดหวังได้เลยว่าระบบแพ็กเกจของ Ubuntu จะสามารถติดตั้ง CUDA ให้ตามต้องการเสมอ (เพราะเรียกจาก official repository) ไม่ต้องไปหาวิธีแจ้งเตือนผู้ใช้และสอนวิธีติดตั้ง CUDA อีกที

By mk Founder on Tag: CUDA, RISC-V, NVIDIA
CUDA

ตัวแทนของ NVIDIA ประกาศในงานสัมมนา RISC-V Summit China ว่ากำลังพัฒนา CUDA ให้รองรับสถาปัตยกรรมซีพียู RISC-V ซึ่งจะเป็นสถาปัตยกรรมที่สามที่ CUDA รองรับ ถัดจาก x86 และ Arm

การที่ CUDA ซึ่งเป็นแพลตฟอร์มประมวลผลแบบขนานที่รองรับทั้งซีพียูและจีพียู รองรับซีพียูสถาปัตยกรรมหลากหลายขึ้น ย่อมส่งผลให้เรามีโอกาสเห็นเซิร์ฟเวอร์ที่ใช้ซีพียู RISC-V ผสมกับจีพียู NVIDIA ออกสู่ตลาดมากขึ้น เหมือนกับที่ตอนนี้เราเห็นเซิร์ฟเวอร์ซีพียู Arm + จีพียู NVIDIA ออกสู่ตลาดกัน (เช่น Grace Hopper หรือ Grace Blackwell ของ NVIDIA เอง)

By lew Founder on Tag: MLX, Apple Silicon, CUDA
MLX

โครงการ MLX ของแอปเปิลเริ่ม merge ฟีเจอร์ CUDA backend ชุดใหญ่ หลังจาก Cheng Zhao ผู้สร้าง Electron ส่งแพตช์เข้าโครงการ เปิดทางให้แอปพลิเคชั่นจำนวนมากที่ใช้งาน MLX อยู่สามารถนำไปใช้งานแพลตฟอร์มอื่นๆ รวมถึงพีซีที่ใช้ชิป NVIDIA ได้ด้วย

MLX เป็นไลบรารีระดับสูง คล้ายกับ PyTorch แต่ MLX สร้างขึ้นมาโดยมุ่งรองรับชิป Apple Silicon เป็นหลัก โดยแอปพลิเคชั่นด้านปัญญาประดิษฐ์ต่างๆ ที่รองรับ Apple Silicon ก็มักใช้งานผ่านไลรารี MLX ตัวนี้

By mk Founder on Tag: Moore Threads, CUDA, GPU, China, Hardware
Moore Threads

Moore Threads เป็นบริษัทผู้ผลิตจีพียูสัญชาติจีน ที่ก่อตั้งในปี 2020 โดย Zhang Jianzhong อดีตผู้จัดการของ NVIDIA China

จีพียูของ Moore Threads เริ่มวางขายในปี 2022 โดยใช้ชื่อแบรนด์ MTT และล่าสุดบริษัทเริ่มออกชุดพัฒนา MUSA SDK (MUSA ย่อมาจาก MT Unified System Architecture) ซึ่งเทียบเคียงได้กับ CUDA SDK ของ NVIDIA

หน้าที่ของ MUSA คือการนำจีพียู MTT ไปรันงาน AI โดยอาศัยรันไทม์ชื่อคุ้นๆ อย่าง MUSA Runtime หรือ muDNN แบบเดียวกับที่มีในจีพียูค่ายตะวันตกอื่นๆ ประเด็นที่น่าสนใจคือ Moore Threads ยังออกเครื่องมือชื่อ MUSIFY tool สำหรับแปลงโค้ดที่เขียนด้วย CUDA มารันบน MUSA ด้วย

By boompw Contributor on Tag: China, Artificial Intelligence, CUDA, NVIDIA
China

Li Guojie นักวิทยาศาสตร์คอมพิวเตอร์ชาวจีน มองว่าจีนต้องพัฒนาเทคโนโลยีซอฟต์แวร์ AI ของตัวเอง แทนที่พึ่งพาเทคโนโลยีจากตะวันตก โดยเฉพาะ CUDA ของ NVIDIA ที่ครองตลาดอยู่ในตอนนี้ แม้ว่าชิป AI จากบริษัทของจีน เช่น Huawei, Hygon และ, Cambricon มีความสามารถใกล้เคียงกับของ NVIDIA

By mk Founder on Tag: PhysX, NVIDIA, CUDA, GPU, Blackwell
PhysX

NVIDIA ยืนยันว่าเอนจินฟิสิกส์ PhysX (อ่านว่า ฟิสิกซ์) ไม่สามารถรันบน GeForce RTX ซีรีส์ 50 (Blackwell) ได้แล้ว เนื่องจากแอพพลิเคชันที่รันบน CUDA แบบ 32 บิตจะไม่ซัพพอร์ตบน Blackwell อีกต่อไป (มีผลกับแอพพลิเคชันอื่นๆ ด้วย ไม่ใช่แค่ PhysX อย่างเดียว)

จีพียูรุ่นเก่าตั้งแต่ GeForce RTX ซีรีส์ 40 ลงไปยังรองรับการรันแอพ CUDA แบบ 32 บิต แต่จีพียูใหม่ตั้งแต่ Blackwell เป็นต้นไป (CUDA 12.0 ขึ้นไป) จะไม่สามารถใช้งานได้แล้ว

By mk Founder on Tag: CUDA, NVIDIA, NVIDIA Pascal, NVIDIA Volta, Maxwell, GPU
CUDA

NVIDIA ออกซอฟต์แวร์​ CUDA เวอร์ชัน 12.8 มีประกาศที่น่าสนใจคือ เตรียมหยุดซัพพอร์ตจีพียูสถาปัตยกรรมเก่าๆ 3 รุ่น ได้แก่

By lew Founder on Tag: PyTorch, CUDA, Artificial Intelligence
PyTorch

ทีมวิศวกรจาก IBM และ Meta รายงานถึงการทดลองเปลี่ยนเคอร์เนลการรัน LLM ใน PyTorch จากเดิมที่ใช้ CUDA เป็นหลัก มาเป็นภาษา Triton ของ OpenAI โดยพบว่าประสิทธิภาพเริ่มใกล้เคียงกับ CUDA

OpenAI เปิดตัวโครงการ Triton มาตั้งแต่ปี 2021 โดยมุ่งจะพัฒนาภาษาที่ทำให้โปรแกรมเมอร์เขียนโปรแกรมโดยตรงบนชิปกราฟิกได้ง่ายขึ้น นอกจากการถอด CUDA แล้วยังต้องเลือกเอนจิน Flash Attention มาแทน cuDNN Flash Attention เพื่อรันโมเดล LLM พบว่า AMD Flash Attention ทำงานได้ครบถ้วนทุกโหมด

By lew Founder on Tag: CUDA, GPU
CUDA

Spectral Compute บริษัทด้านปัญญาประดิษฐ์จากสหราชอาณาจักรเปิดตัว SCALE ชุดเครื่องมือคอมไพล์โค้ดจากเดิมที่ใช้ CUDA ไปรันบนชิปตัวอื่นๆ โดยตอนนี้รองรับเฉพาะการ์ดจอของ AMD

SCALE ถูกออกแบบให้เป็นชุดเครื่องมือครบชุด เช่น คำสั่งที่ใช้แทน nvcc ได้ในตัว ทำให้สคริปต์ cmake ในโครงการต่างๆ สามารถรันได้ทันที ตอนนี้มีโครงการที่ทดสอบผ่านแล้วหลายโครงการ เช่น NVIDIA Thrust, llama-cpp, faiss, xgboost, หรือ hashcat

ทางโครงการ SCALE พยายามอิมพลีเมนต์ API ของ CUDA ให้ครบ โดยบางส่วนทำเอง บางส่วนเป็น wrapper ห่อไลบรารี ROCm ของ AMD ให้มีอินเทอร์เฟซเหมือนกับ CUDA

By nismod Writer on Tag: NVIDIA, CUDA, In-Depth
NVIDIA

ราคาคุ้น NVIDIA ทำนิวไฮ”, “หุ้น NVIDIA พุ่ง 200%”, “มูลค่า NVIDIA แซง Apple แล้ว” พาดหัวลักษณะนี้น่าจะเป็นที่ชาชินในช่วง 1-2 ปีที่ผ่านมา หลังกระแส AI บูมมากขึ้น

หลายๆ คนน่าจะรู้อยู่แล้วว่าปัจจัยที่ทำให้ NVIDIA ขึ้นมาสู่ระดับนี้ได้ คือการครองตลาด GPU ที่ถูกนำไปใช้ในการเทรนด์ AI จนถึงขนาดที่ว่า บริษัทไอทีใหญ่ๆ หรือบริษัทวิจัยที่ต้องการ GPU ของ NVIDIA ไปใช้งาน มีแต่เงินอย่างเดียว ก็ใช่ว่าจะได้ของไป แต่ยังต้องรอคิวหลักหลายเดือน จนถึงปีเลยด้วยซ้ำไป

แต่คำถามคืออะไรที่ทำให้การ์ดจอ NVIDIA เข้าไปเป็นตัวเลือกหลัก (และอาจจะตัวเลือกเดียว) ของบริษัทที่ต้องการเทรน AI ทั้งที่คู่แข่ง GPU ใหญ่ๆ อย่าง AMD ก็มี? เป็นเพราะ GPU ของ NVIDIA ดีกว่าอย่างเดียวเหรอ? บทความนี้พาจะไขเหตุผลเบื้องลึกกว่านั้น

By mk Founder on Tag: CUDA, Artificial Intelligence, OpenAI, Programming
CUDA

Financial Times รายงานว่าบริษัทไอทียักษ์ใหญ่หลายราย เริ่มเข้ามาสนับสนุนซอฟต์แวร์เทรน AI ที่ไม่ต้องพึ่งพา CUDA ของ NVIDIA เพียงอย่างเดียวอีกต่อไป

CUDA ถือเป็นอาวุธลับของ NVIDIA ที่ช่วยให้ครองความยิ่งใหญ่ในโลกชิป AI มายาวนาน เพราะซอฟต์แวร์ยอดนิยมส่วนใหญ่จำเป็นต้องรันบน CUDA อีกที ส่งผลให้ NVIDIA ผูกขาดตลาดชิป AI ไปกลายๆ และกลายเป็นต้นทุนก้อนมหึมาของบริษัทเทคโนโลยีที่ต้องการใช้ชิปลักษณะนี้

By mk Founder on Tag: Intel, GPU, Standard, Linux Foundation, Open Source, CUDA, NVIDIA
Intel

กลุ่มบริษัทไอทีที่ประกอบด้วย Intel, Arm, Google, Samsung, Qualcomm, Fujitsu, Imagination, VMware ร่วมกับ Linux Foundation ก่อตั้งกลุ่ม Unified Acceleration (UXL) Foundation พยายามสร้างมาตรฐานเปิดสำหรับชิปเร่งการประมวลผล (accelerator) ที่มีหลากหลายยี่ห้อในท้องตลาด

By lew Founder on Tag: AMD, CUDA, GPGPU, ROCm
AMD

ZLUDA โครงการโอเพนซอร์สที่พยายามอิมพลีเมนต์ไลบรารี CUDA ของ NVIDIA ปล่อยเวอร์ชั่นทดสอบที่อาศัยไลบรารี HIP/ROCm ของ AMD เป็นคัวเอนจินเบื้องหลังทำให้สามารถใช้ชิปกราฟิกของ AMD มารันโปรแกรมที่คอมไพล์สำหรับ CUDA ได้

Andrzej Janik ผู้พัฒนา ZLUDA พัฒนาไลบรารีนี้มาแล้วหลายปี แต่ช่วงแรกนั้นทำมาเพื่อซีพียูอินเทล ต่อมาในปี 2022 AMD ติดต่อเขาให้พัฒนาไลบรารีให้รองรับชิปกราฟิกของ AMD หลังจากพัฒนามาเกือนสองปี ทาง AMD ตัดสินในยุติโครงการนี้ ทำให้ Janik ตัดสินใจปล่อยโครงการออกมาเป็นโอเพนซอร์ส

By lew Founder on Tag: Intel, NVIDIA, Artificial Intelligence, CUDA
Intel

สัปดาห์ที่แล้วอินเทลเปิดตัวชิป Core Ultra และ Xeon รุ่นที่ 5 โดยชูจุดขายด้าน AI เต็มรูปแบบ หลังงานในช่วงถามตอบนักข่าว Pat Gelsinger ก็ออกมาพูดถึง NVIDIA ว่ามีความได้เปรียบจาก CUDA ไม่มากนัก และทั้งอุตสาหกรรมก็กำลังย้ายการพัฒนาไปอยู่บน layer ที่สูงขึ้นเป็นภาษา Python เพื่อให้พอร์ตโมเดลไปมาได้

เขาระบุว่าในตอนนี้หากโมเดลฝึกเสร็จแล้วก็มีทางเลือกในการรันที่ต่างๆ และระบบการรันนั้นก็มักไม่ต้องการ CUDA อีกแล้ว และเขาเชื่อว่าชิปฝั่งรันโมเดลนั้นเป็นตลาดกระแสหลักในอนาคต (where the game will be)

By mk Founder on Tag: DirectX, Microsoft, Graphic, Linux, GPU, CUDA, WSL
DirectX

ในข่าว Windows Terminal 1.0 ไมโครซอฟท์ประกาศว่าจะเรนเดอร์กราฟิกของแอพจากลินุกซ์ด้วย GPU ด้วย เบื้องหลังของมันคือสิ่งที่อาจจินตนาการไม่ถึงเมื่อหลายปีก่อนอย่าง DirectX บนลินุกซ์ (ในความหมายนี้คือลินุกซ์ที่ติดตั้งบน Windows Subsystem for Linux 2 หรือ WSL 2)

ไมโครซอฟท์อธิบายว่าพัฒนาเทคนิค GPU paravirtualization (GPU-PV) บนวินโดวส์มาหลายปีแล้ว และใช้งานในโปรแกรมฝั่งวินโดวส์หลายตัว เช่น Windows Defender Application Guard, Windows Sandbox และอีมูเลเตอร์ของ Hololens

By hinatasenjou Contributor on Tag: NVIDIA, CUDA, Apple, macOS, Adobe
NVIDIA

NVIDIA ประกาศอัพเดต CUDA Toolkit 10.2 เป็นรุ่นสุดท้ายใน macOS นับเป็นจุดสิ้นสุดความสัมพันธ์ระหว่าง NVIDIA และสินค้าตระกูล Mac หลังจากแอปเปิลหยุดซัพอร์ตไดร์เวอร์ NVIDIA ไปตั้งแต่ macOS 10.14 Mojave

ซอฟต์แวร์จำนวนหนึ่งใช้ CUDA เพื่อเร่งความเร็วประมวลผล เช่น Adobe Premier หรือ After Effect แต่ก็ใช้งานได้ถึง macOS 10.13.6 เท่านั้น

แม้ชิป NVIDIA จะมีประสิทธิภาพสูงกว่า AMD ในช่วงหลัง ๆ แต่ NVIDIA และแอปเปิลก็เคยมีปัญหากันตั้งแต่สมัยชิป GeForce 6800M ตั้งแต่ปี 2007 ที่มีปัญหาความร้อนจนกระทั่งแอปเปิลต้องเปิดให้ซ่อมฟรีเป็นเวลาสองปี และตอนนี้คอมพิวเตอร์แอปเปิลก็ไม่มีชิป NVIDIA เป็นตัวเลือกแล้ว อย่างใน MacBook Pro รุ่น 16" ที่เปิดตัวล่าสุดก็ติดตั้งเป็น AMD Radeon Pro 5300M/5500M เท่านั้น

ที่มา: NVIDIA via Gizmodo

By mk Founder on Tag: Programming, CUDA, NVIDIA, GPU
Programming

หลังจาก NVIDIA เปิดตัว CUDA 6 ตั้งแต่ปลายปีที่แล้ว วันนี้บริษัทก็เปิด CUDA Toolkit 6.0 รุ่น Release Candidate ให้คนทั่วไปทดสอบแล้ว

จุดเด่นของ CUDA 6 คือ Unified Memory หรือการมองหน่วยความจำของซีพียูกับจีพียูเป็นผืนเดียวกัน เพื่อให้ไม่ต้องคัดลอกข้อมูลข้ามพื้นที่แรมแต่ละส่วนทุกครั้ง ช่วยเพิ่มประสิทธิภาพและปรับกระบวนการพัฒนาให้ง่ายขึ้น

นอกจากนี้ CUDA 6 ยังรองรับการประมวลผลโดยใช้จีพียูสูงสุดถึง 8 ตัวต่อคอมพิวเตอร์หนึ่งเครื่อง ทำให้มีสมรรถนะในการคำนวณได้สูงถึง 9 teraflops ต่อเครื่อง

Subscribe to CUDA