NVIDIA ชี้แจงกับสื่อหลังราคาหุ้นปรับลดลงแรง 17% จากความกังวลว่า DeepSeek ได้นำเสนอเทคโนโลยีการพัฒนาปัญญาประดิษฐ์ที่ไม่ต้องพึ่งพาฮาร์ดแวร์ประสิทธิภาพสูง จึงอาจเข้าสู่จุดพีคของความต้องการจีพียู
NVIDIA บอกว่าเทคโนโลยี DeepSeek ทำให้เห็นว่าเราสามารถสร้างโมเดลใหม่ขึ้นมาได้ โดยใช้เทคนิคหลายอย่าง รวมทั้งต่อยอดจากโมเดลโอเพนซอร์สที่มีอยู่ ร่วมกับการประมวลผลที่ถูกควบคุมไว้อย่างดี ซึ่งเป็นความก้าวหน้าในการทำส่วน Test-Time Scaling ตามกฎการ Scaling 3 อย่าง (Three Scaling Laws) ที่ซีอีโอ Jensen Huang เคยอธิบายไว้

NVIDIA บอกว่าความต้องการจีพียูยังคงมีอยู่ในส่วน Pre-Training Scaling และ Post-Training Scaling โดยเฉพาะงาน Inference ที่ต้องพึ่งพาการประมวลผลจำนวนมาก
ที่มา: CNBC
on
ของเค้าดีจริงๆ
shub Tue, 28/01/2025 - 10:18
ของเค้าดีจริงๆ แต่เรื่องภาษาก็ยังสู้gptไม่ได้นะ แต่เรื่องอื่นนี่สั่งให้ทำได้เกือบหมดบางงานส่งให้gptทำมันเอ๋อไปเลยไม่ยอมทำให้deepseekกลับทำให้ได้
แต่ context length
checkmate95 Tue, 28/01/2025 - 10:54
In reply to ของเค้าดีจริงๆ by shub
แต่ context length ค่อนข้างน้อยถ้าเทียบกับเจ้าอื่นครับ
ของต้องขายยังไงก็ต้องบอกว่าใช
TeamKiller Tue, 28/01/2025 - 10:24
ของต้องขายยังไงก็ต้องบอกว่าใช้ไว้ก่อนละเดี่ยวขายไม่ได้เงิบ
ผมก็ยังนึกไม่ออกครับว่าถ้าเทค
lew Tue, 28/01/2025 - 13:47
In reply to ของต้องขายยังไงก็ต้องบอกว่าใช by TeamKiller
ผมก็ยังนึกไม่ออกครับว่าถ้าเทคนิค reinforced learning ของ DeepSeek มันทำได้ดี ทำไมฝั่งสหรัฐฯ จะไม่เอามาทำกับโมเดลขนาดใหญ่ขึ้น ความละเอียดพารามิเตอร์เต็ม
จะบอกว่าตลาดไม่ต้องการปัญญาประดิษฐ์ฉลาดกว่านี้แล้วคงไม่ใช่ อีกสองเดือนชิปรุ่นใหม่ ถ้าประหยัดไฟขึ้น พลังฝึกสูงขึ้น ลูกค้าจะบอกว่าพอแล้ว DeepSeek ฉลาดเกินใช้งานนี่คงเป็นเรื่องประหลาดมาก
https://www.nextplatform.com
lawson Tue, 28/01/2025 - 13:50
In reply to ผมก็ยังนึกไม่ออกครับว่าถ้าเทค by lew
https://www.nextplatform.com/2025/01/27/how-did-deepseek-train-its-ai-model-on-a-lot-less-and-crippled-hardware/
มันมีหลายเทคนิคที่ฝั่งตะวันตกคิดไม่ถึง
เทคนิคอื่นๆ
lew Tue, 28/01/2025 - 15:13
In reply to https://www.nextplatform.com by lawson
เทคนิคอื่นๆ ที่ใช้กันก่อนหน้านี้ก็ "คิดไม่ถึง" กันเหมือนกันครับ เขาถึงเรียกว่างานวิจัย โลกวิทยาศาสตร์มันก็เดินหน้าไปเพราะมีคนพบความก้าวหน้าใหม่แล้วรายงานออกมา
DeepSeek เองก็ยืนบนใหล่ยักษ์คนอื่นมา เทคนิคจำนวนมากก็อ้างอิงงานฝั่งตะวันตก
คำถามต้นเรื่องยังอยู่คือ เจอวิธีใหม่ แล้วอะไรจะทำให้เราไม่ใช้เทคนิคใหม่บนโมเดลที่ใหญ่ขึ้น? หรือจริงๆ เดี๋ยวก็ใช้แล้วก็อีกสักพักก็มีคนเอาชนะ DeepSeek ไป
จีนทำได้ แล้วเปิดเผยหมด open
TeamKiller Wed, 29/01/2025 - 00:26
In reply to เทคนิคอื่นๆ by lew
จีนทำได้ แล้วเปิดเผยหมด open source หมด เทคนิคไรก็บอก งีฝรั่งก็เอาไปทำตามได้ก็คงดีกว่า ไวกว่า เพราะ resource มีเยอะกว่า
เวลาชิปใหม่มาแล้วซื้อมาลงนี่เ
TeamKiller Wed, 29/01/2025 - 00:25
In reply to ผมก็ยังนึกไม่ออกครับว่าถ้าเทค by lew
เวลาชิปใหม่มาแล้วซื้อมาลงนี่เขาคงไม่โล๊ะออกทั้ง Datacenter ใช่ไหมครับ ไม่งั้นคงเปลืองเงินแย่ ของเดิมก็ไม่ช้ามาก ก็ทำงานได้อยู่ด้วย
มันก็แล้วแต่นะว่าอนาคตจะมีการ
shub Wed, 29/01/2025 - 11:04
In reply to เวลาชิปใหม่มาแล้วซื้อมาลงนี่เ by TeamKiller
มันก็แล้วแต่นะว่าอนาคตจะมีการใช้งานมันอยู่มั้ยของแบบนี้มันไม่ตายตัว อย่างsupercomputerรุ่นเก่าๆที่9armเคยไปบิดไว้ตัวนั้นเค้าก็ต้องปล่อยขายเพราะการรันเครื่องรุ่นเก่ามันมีค่าefficiencyต่ำไม่คุ้มต่อการดำเนินการต่อ ค่าไฟค่าบำรุงรักษาค่าสถานที่มันมีcostตรงนี้เยอะการที่ซื้อรุ่นใหม่มาแล้วปลดรุ่นเก่าออกจึงไม่ได้เป็นการเปลืองเงินแต่ทำเพื่อให้งานมีประสิทธิภาพมากขึ้น มันไม่ช้าไม่ได้เป็นเหตุผลเดียวที่จะให้มันน่าใช้งานต่อ
คนขายของ ก็ต้องบอก
tom789 Tue, 28/01/2025 - 12:34
คนขายของ ก็ต้องบอก ของตัวเองดี
ทางเลือกการใช้พลังงานสำหรับกา
aoza00123 Tue, 28/01/2025 - 15:32
ทางเลือกการใช้พลังงานสำหรับการประมวลผลกำลังมา nvidia คงมีเลิ่กลั่กบ้างแหละ
อีกนัยนึงคือกระทบความต้องการจ
YongZ Tue, 28/01/2025 - 18:38
อีกนัยนึงคือกระทบความต้องการจีพียูหนึ่งในสาม