EXO Labs ทดสอบ Mac Studio อัดแรมเต็มสองเครื่อง รัน DeepSeek-R1 ตัวเต็มได้ 11 token/s

By lew

on 14 March 2025 - 00:55 Tag: Artificial Intelligence, LLM, Apple M4, DeepSeek

Artificial Intelligence

EXO Labs ผู้พัฒนาซอฟต์แวร์คลัสเตอร์สำหรับรันปัญญาประดิษฐ์ รายงานถึงผลทดสอบของ Mac Studio ที่ใช้ชิป M3 Ultra พร้อมกับแรม 512GB สองเครื่อง สามารถรันโมเดล DeepSeek-R1 ตัวเต็มที่ 671B FP8 ได้ด้วยความเร็ว 11 token/s

M3 Ultra มีความได้เปรียบสำหรับการรันปัญญาประดิษฐ์ในบ้าน เพราะรองรับแรมแบบ unified memory ขนาดใหญ่, มีแบนวิดท์หน่วยความจำสูง, และในเวอร์ชั่นนี้ยังรองรับ Thunderbolt 5 ที่แบนวิดท์สูงขึ้นเป็น 120Gb/s ตัวแอปเปิลเองถึงกับโฆษณาความเร็วในการรัน LLM ไว้ด้วย

โดยเฉลี่ยแล้วความเร็ว 11 token/s ประมาณได้ว่าเป็นการพิมพ์ 40-50 ตัวอักษรต่อวินาทีซึ่งก็น่าจะเพียงพอต่อการแชตทั่วไป แต่ในกรณีโมเดลคิดก่อนตอบ เช่น R1 นั้นประสิทธิภาพจะช้ามากก่อนได้คำตอบ เนื่องจากโมเดลเสียเวลาคิดอยู่ช่วงหนึ่ง

Alex Cheema จาก EXO Labs ระบุว่าความเร็วทางทฤษฎีน่าจะไปได้ถึง 20 token/s และหลังจากนั้นน่าจะหาทางปรับปรุงประสิทธิภาพทางอื่น เช่น expert parallelism ซึ่งอาจจะดันไปได้ถึง 40 token/s นอกจากนี้หากย่อโมเดลลงให้กลายเป็น Q6_K น่าจะย่อโมเดลได้เหลือ 500GB ซึ่งจะรันใน Mac Studio เครื่องเดียวได้ (แรมเกือบหมดทันที) Cheema ระบุว่าเขาจะเอามาทดสอบต่อไป

ที่มา - @alexocheema

Hiring! บริษัทที่น่าสนใจ

Carmen Software

Hotel Financial Solutions

Next Innovation (Thailand) Co., Ltd.

We are web design with consulting & engineering services driven the future stronger and flexibility.

KKP Dime

KKP Dime บริษัทในเครือเกียรตินาคินภัทร

Kiatnakin Phatra Financial Group

Financial Service

Fastwork Technologies

Fastwork.co เว็บไซต์ที่รวบรวม ฟรีแลนซ์ มืออาชีพจากหลากหลายสายงานไว้ในที่เดียวกัน

Thoughtworks Thailand

Thoughtworks เป็นบริษัทที่ปรึกษาด้านเทคโนโยลีระดับโลกที่คว้า Great Place to Work 3 ปีซ้อน

Iron Software

Iron Software is an American company providing a suite of .NET libraries by engineer for engineers.

CLEVERSE

Cleverse is a Venture Builder. Our team builds several tech companies.

Nipa Cloud

#1 OpenStack cloud provider in Thailand with our own data center and software platform.

Bangmod Enterprise

The leader in Cloud Server and Hosting in Thailand.

CIMB THAI Bank

MOVING FORWARD WITH YOU - CIMB is the leading ASEAN Bank

Bangkok Bank

Bangkok Bank is one of Southeast Asia's largest regional banks, a market leader in business banking

MuvMi (Urban Mobility Tech Co.,Ltd.)

Shape the future of urban mobility towards affordable, clean, and safe solutions

T.N. Digital Solution Co., Ltd.

TNDS has been involving in every first move of banking’s major digital transformation.

KBTG - KASIKORN Business-Technology Group

KBTG - "The Technology Company for Digital Business Innovation"

Siam Commercial Bank Public Company Limited

"Let's start a brighter career future together"

Icon Framework co.,Ltd.

Global Standard Platform for Real Estate แพลตฟอร์มสำหรับธุรกิจอสังหาริมทรัพย์ครบวงจร มาตรฐานระดับโลก

REFINITIV

The Financial and Risk business of Thomson Reuters is now Refinitiv

H LAB

Re-engineering healthcare systems through intelligent platforms and system design.

The Gang Technology Co., Ltd.

We're a Digital Agency that helps our customers transform their business into digital with ease.

LTMH

LTMH มุ่งเน้นการพัฒนาผลิตภัณฑ์ที่สามารถช่วยพันธมิตรของเราให้บรรลุเป้าหมาย

Seven Peaks

We Drive Digital Transformation

Wisesight (Thailand) Co., Ltd.

The Best Choice For Handling Social Media · High Expertise in Social Data · Most Advanced and Secure

MOLOG Tech

We are Modern Logistic Platform, Specialize in WMS, OMS and TMS.

Data Wow Co.,Ltd

We enable our clients to realize increased productivity by solving their most complex issues by Data

LINE Company Thailand

LINE, the world's hottest mobile messaging platform, offers free text and voice messaging + Call

LINE MAN Wongnai

Join our journey to becoming No.1 food platform in Thailand

เอาเรื่องอยู่นะเนี่ย

incredibles Fri, 14/03/2025 - 01:31

เอาเรื่องอยู่นะเนี่ย

ประมาณสามแสนสามนะครับ

mr_tawan Fri, 14/03/2025 - 02:03

ประมาณสามแสนสามนะครับ เผื่อคนสนใจและงบถึง

สองเครื่องเจ็ดแสนครับ

lew Fri, 14/03/2025 - 09:28

สองเครื่องเจ็ดแสนครับ

ซื้อประกัน Alpple Care +

MaxxIE Fri, 14/03/2025 - 13:43

ซื้อประกัน Alpple Care + อย่างคุ้มเลย
ประกันถูกกว่าMacbook Air อีก

คุ้นๆว่า ใครไม่รู้บอกว่า iOS

waroonh Fri, 14/03/2025 - 07:17

คุ้นๆว่า ใครไม่รู้บอกว่า iOS ram 8gb ก็ใช้ได้แล้ว ...55

แล้วถ้าให้ได้ผลเท่าๆกันแต่ไม่

Ooh Fri, 14/03/2025 - 08:10

แล้วถ้าให้ได้ผลเท่าๆกันแต่ไม่ใช้ Mac Studio มันต้องลงทุนเท่าไหร่หรอ?

DeepSeek-R1 แบบ FP8

tekkasit Fri, 14/03/2025 - 08:56

DeepSeek-R1 แบบ FP8 เฉพาะโมเดลก็ปาไป 713.3 GB ต้องใช้ H100 สัก 8-9 ตัวจึงจะรันฉบับเต็มแบบนั้นได้ ได้ยินว่าค่าตัวมันก็ใบละล้านเห็นจะได้

เรียกได้ว่าตัวเลือกนี้ ถูกที่สุดแล้ว ที่จะรันบนฮาร์ดแวร์ตัวเอง

ถ้าใช้ AMD MI300 รุ่น 256GB

lew Fri, 14/03/2025 - 09:49

ถ้าใช้ AMD MI300 รุ่น 256GB ก็น่าจะ 4 ใบ เฉลี่ยใบละล้าน ก็น่าจะแถวๆ 4 ล้านครับ

โอเค ถูกไปครึ่งหนึ่ง ....

tekkasit Fri, 14/03/2025 - 11:23

โอเค ถูกไปครึ่งหนึ่ง .... (WoW)

เอ ... แรมเครื่อง =

SilentHeal Fri, 14/03/2025 - 09:04

เอ ... แรมเครื่อง = แรมการ์ดจอ เลยเหรอครับ ,, งั้นเอา mac mini 32G มารัน โมเดลเล็กๆ จะดีกว่า(คุ้มกว่า) ไปซื้อ การ์ดจอแรม 32G มั้ยหว่า ราคาต่างกัน 3-4 เท่าเลย

เรารู้ว่าคุณซื้อ NVIDIA

tekkasit Fri, 14/03/2025 - 09:09

เรารู้ว่าคุณซื้อ NVIDIA ไม่ไหว แอปเปิลโฆษณา M3 Ultra ด้วยความเร็ว LLM ชี้อัดโมเดลแสนล้านพารามิเตอร์ไหว

ใช่ครับ เป็น unified memory

lew Fri, 14/03/2025 - 09:29

ใช่ครับ เป็น unified memory

คุ้มกว่าไหมนี่ต้องถามถึงประสิทธิภาพด้วยครับ โหลดโมเดลขึ้น รันได้ แต่ช้าจัดๆ ยอมรับได้ไหม

สงสัยจะไม่เวริค ไปเจอ

SilentHeal Fri, 14/03/2025 - 16:11

สงสัยจะไม่เวริค ไปเจอ Benchmarks มา m3 ram 64G ยังแพ้ 3070 ช้าจัดๆ จริงๆครับ มีดีแค่ ไม่ OOM

https://github.com/XiongjieDai/GPU-Benchmarks-on-LLM-Inference

อันนี้ขึ้นกับงานเลยครับ

lew Sat, 15/03/2025 - 13:32

อันนี้ขึ้นกับงานเลยครับ สมมติว่างานที่ต้องการคือรัน model 70B FP16 (ขนาด 140GB) ลองย่อแล้วกลับไม่ตอบสนองความต้องการ การซื้อ 3070 ก็ไม่มีความคุ้มเลย (รันได้ช้าจัดดีกว่ารันไม่ได้) ก็อาจจะต้องไปเทียบกับพวก H100 ซึ่งราคาห่างกันมาก

4090 ยังแรงกว่าอยู่

orchidkit Sat, 15/03/2025 - 14:54

4090 ยังแรงกว่าอยู่ ในเงินเท่ากัน