Image
By lew Founder on Tag: Artificial Intelligence, LLM, Apple M4, DeepSeek
Artificial Intelligence

EXO Labs ผู้พัฒนาซอฟต์แวร์คลัสเตอร์สำหรับรันปัญญาประดิษฐ์ รายงานถึงผลทดสอบของ Mac Studio ที่ใช้ชิป M3 Ultra พร้อมกับแรม 512GB สองเครื่อง สามารถรันโมเดล DeepSeek-R1 ตัวเต็มที่ 671B FP8 ได้ด้วยความเร็ว 11 token/s

M3 Ultra มีความได้เปรียบสำหรับการรันปัญญาประดิษฐ์ในบ้าน เพราะรองรับแรมแบบ unified memory ขนาดใหญ่, มีแบนวิดท์หน่วยความจำสูง, และในเวอร์ชั่นนี้ยังรองรับ Thunderbolt 5 ที่แบนวิดท์สูงขึ้นเป็น 120Gb/s ตัวแอปเปิลเองถึงกับโฆษณาความเร็วในการรัน LLM ไว้ด้วย

By arjin Writer on Tag: DeepSeek, USA, Rumors
DeepSeek

The Wall Street Journal อ้างแหล่งข่าวภายในทำเนียบขาว บอกว่าฝ่ายบริหารของประธานาธิบดี Donald Trump กำลังประเมินว่าต้องออกคำสั่งบล็อก DeepSeek ในอุปกรณ์ของรัฐบาลหรือไม่ ด้วยเหตุผลเรื่องความมั่นคง เนื่องจากไม่มีข้อมูลที่ชัดเจนพอจาก DeepSeek ว่าแชทบอตนั้นเก็บข้อมูลอะไรจากผู้ใช้งานไป และพวกเขาสามารถเข้าถึงข้อมูลใดได้บ้าง

แนวทางเบื้องต้นคือการออกคำสั่งห้ามดาวน์โหลดแอป DeepSeek ในอุปกรณ์ของรัฐบาล แต่หากต้องจำกัดมากกว่านั้น อาจยกระดับไปถึงการแบนแอป DeepSeek จากแอปสโตร์ และจำกัดที่ระดับผู้ให้บริการคลาวด์ในอเมริกา ว่าสามารถให้บริการโมเดล AI ใดของ DeepSeek ได้บ้าง

By mk Founder on Tag: DeepSeek, LLM, Microsoft, Copilot+ PC, NPU, Artificial Intelligence
DeepSeek

ไมโครซอฟท์ประกาศรองรับการรันโมเดล DeepSeek-R1 แบบกลั่นแล้ว (distilled) เหลือขนาดพารามิเตอร์ 1.5B, 7B และ 14B บนชิป NPU ของพีซีกลุ่ม Copilot+ PC ตามที่เคยประกาศไว้

ไมโครซอฟท์บอกว่าใช้เทคนิคหลายอย่าง เช่น 4-bit block wise quantization, QuaRot, ONNX QdQ เพื่อลดขนาดของโมเดลให้เล็กลง ซึ่งเป็นเทคนิคที่เริ่มใช้งานจากโมเดล Phi Silica ของตัวเอง

By lew Founder on Tag: DeepSeek, LLM
DeepSeek

DeepSeek ประกาศลดราคาค่าใช้ API ช่วงเวลาห้าทุ่มครึ่งจนถึงเจ็ดโมงครึ่งของอีกวันตามช่วงเวลาไทย โดยโมเดล DeepSeek-V3 ลดราคาลง 50% และโมเดล DeepSeek-R1 ลดราคา 75% ทำให้ราคาของทั้งสองโมเดลเท่ากัน (แม้ว่าจริงๆ R1 จะมีช่วงเวลา "คิด" ที่กินเอาท์พุตมากกว่า)

DeepSeek-R1 นั้นมีผลทดสอบบางชุดเอาชนะ OpenAI o1 ได้ โดยเฉพาะในกลุ่มการทดสอบคณิตศาสตร์และการเขียนโปรแกรม

By arjin Writer on Tag: DeepSeek, Unitree, DJI, ByteDance, China
DeepSeek

South China Morning Post มีรายงานพิเศษเกี่ยวกับผู้ก่อตั้งบริษัทเทคโนโลยีในจีนรุ่นใหม่ 4 บริษัท ซึ่งทั้งหมดเติบโตและมีพื้นฐานการดำเนินงานบริษัท แตกต่างไปจากยุค BAT ที่เรียกรวม 3 บริษัทเทคโนโลยีใหญ่ในจีนคือ Baidu, Alibaba และ Tencent

By lew Founder on Tag: DeepSeek, LLM, Artificial Intelligence
DeepSeek

DeepSeek จัดมหกรรมโอเพนซอร์สประจำสัปดาห์ โดยปล่อยซอฟต์แวร์ที่ใช้พัฒนาและให้บริการ DeepSeek ออกมาเป็นชุด ในกลุ่มนี้มีหลายตัวได้รับความสนใจอย่างสูง เพราะสามารถเร่งความเร็วได้มาก แถมยังเปิดทางแคชการประมวลผลไว้ได้ง่ายขึ้น โครงการที่เปิดมาแล้ว ได้แก่

By arjin Writer on Tag: DeepSeek, LLM, Artificial Intelligence, Rumors
DeepSeek

Reuters อ้างแหล่งข่าวที่เกี่ยวข้องสองรายระบุว่า DeepSeek มีแผนเปิดตัวโมเดลปัญญาประดิษฐ์รุ่นใหม่ R2 ในเดือนพฤษภาคมนี้ แต่ตอนนี้ได้ปรับทิศทางให้ออกโมเดลรุ่นต่อจาก R1 ให้เร็วที่สุดเท่าที่ทำได้

ข้อมูลเบื้องต้นบอกว่า R2 จะมีความสามารถที่ดีขึ้นในการเขียนโค้ด และการให้เหตุผลเป็นภาษาอังกฤษ

NVIDIA

Reuters อ้างแหล่งข่าวที่เกี่ยวข้องหลายราย ให้ข้อมูลว่าบริษัทเทคโนโลยีของจีนหลายแห่งต่างเร่งสั่งซื้อชิป H20 จาก NVIDIA เพื่อรองรับความต้องการใช้งานโมเดล DeepSeek ที่มีเพิ่มมากขึ้น ซึ่งสวนทางกับความเห็นก่อนหน้านี้ที่ว่า DeepSeek จะทำให้ความต้องการชิป AI ลดลง

By arjin Writer on Tag: Jensen Huang, NVIDIA, DeepSeek, Artificial Intelligence
Jensen Huang

Jensen Huang ซีอีโอ NVIDIA ให้สัมภาษณ์ในงานสัมมนาของ DDN ซึ่งบันทึกไว้ล่วงหน้า พูดถึง DeepSeek เป็นครั้งแรก บอกว่าตลาดมีความเข้าใจผิดไปมากในการมาของ DeepSeek และผลกระทบที่จะเกิดขึ้น

By mk Founder on Tag: DeepSeek, Open Source, Artificial Intelligence
DeepSeek

DeepSeek ประกาศโอเพนซอร์สโครงการต่างๆ ภายในบริษัทจำนวน 5 repository ในสัปดาห์หน้า (จะเปิด 1 วัน 1 repo) เพื่อสร้างความโปร่งใสแบบสุดๆ ต่อสาธารณะ

บริษัทบอกว่าเชื่อว่าการเปิดซอร์สโค้ดของตัวเองจะช่วยให้วงการ AI โลกพัฒนาเร็วขึ้นในภาพรวม

By arjin Writer on Tag: Perplexity, DeepSeek, Artificial Intelligence, LLM, China
Perplexity

Perplexity เผยแพร่โมเดล AI โอเพนซอร์ส R1 1776 ซึ่งนำโมเดล DeepSeek-R1 มาปรับแต่งฝึกฝนใหม่ โดยบอกว่าโมเดลปรับแต่งนี้ได้ตัดอคติ สามารถให้ข้อมูลที่แม่นยำถูกต้อง โดยเฉพาะในคำถามที่ DeepSeek-R1 ไม่ตอบ เนื่องจากถูกเซ็นเซอร์โดยรัฐบาลจีน

By arjin Writer on Tag: DeepSeek, Alibaba, China, Rumors
DeepSeek

ความร้อนแรงของ DeepSeek ยังคงมีต่อเนื่อง ล่าสุดมีรายงานจาก The Information อ้างแหล่งข่าวที่เกี่ยวข้องว่า DeepSeek กำลังพิจารณารับเงินจากนักลงทุนภายนอกเป็นครั้งแรก จากที่ผ่านมาบริษัทรับเงินจาก High-Flyer ซึ่งเป็นกองทุนบริหารความเสี่ยง (Hedge Fund) ที่ Liang Wenfeng ซีอีโอ DeepSeek เป็นเจ้าของ

รายชื่อนักลงทุนที่ถูกระบุในรายงานคือ Alibaba และกองทุนของรัฐบาลจีน ทั้งนี้ Alibaba ปฏิเสธที่จะแสดงความเห็นต่อรายงานนี้

การรับเงินจากนักลงทุนภายนอก อาจทำให้ DeepSeek เริ่มโฟกัสที่การหาโมเดลธุรกิจเพื่อสร้างรายได้มากขึ้น จากปัจจุบัน DeepSeek เน้นไปที่งานวิจัยด้านปัญญาประดิษฐ์เป็นหลัก

By arjin Writer on Tag: China, Xi Jinping, DeepSeek
China

ประธานาธิบดี Xi Jinping ของจีน จัดการประชุมเพื่อหารือกับผู้นำบริษัทเทคโนโลยีในจีนหลายแห่งเมื่อวันจันทร์ที่ผ่านมา ในการเร่งการพัฒนาเทคโนโลยีต่าง ๆ จากบริษัทจีน เพื่อให้แข่งขันกับตลาดโลกได้

รายชื่อผู้นำบริษัทเทคโนโลยีที่เข้าร่วมการประชุมนี้ เช่น Ren Zhengfei จาก Huawei, Wang Chuanfu จาก BYD, Jack Ma จาก Alibaba, Lei Jun จาก Xiaomi, Wang Xing จาก Meituan, Pony Ma จาก Tencent, Yu Renrong จาก Will Semiconductor รวมทั้งไฮไลท์ของงานนี้คือ Liang Wenfeng ผู้ก่อตั้ง DeepSeek

By arjin Writer on Tag: South Korea, DeepSeek, Privacy
South Korea

หน่วยงานกำกับดูแลด้านข้อมูลส่วนบุคคลของเกาหลีใต้ สั่งบล็อกการดาวน์โหลด DeepSeek ในประเทศชั่วคราว หลังจาก DeepSeek ยังไม่สามารถปฏิบัติตามข้อกำหนดในการปกป้องข้อมูลผู้ใช้งานตามเงื่อนไขของเกาหลีใต้ได้

คำสั่งนี้มีผลเฉพาะการดาวน์โหลด DeepSeek มาติดตั้งใหม่เท่านั้น แต่บริการต่าง ๆ ยังสามารถเข้าถึงได้ตามปกติ

DeepSeek ได้หารือกับทางการเกาหลีใต้ก่อนหน้านี้ในประเด็นดังกล่าว โดยยอมรับว่ากำลังปรับปรุงบริการให้เป็นไปตามข้อกำหนดโดยเร็วที่สุด

By arjin Writer on Tag: Tencent, DeepSeek, Artificial Intelligence, WeChat, China
Tencent

Tencent เปิดเผยว่ากำลังทดสอบนำโมเดลปัญญาประดิษฐ์ DeepSeek มาเสริมระบบค้นหาข้อมูลภายในแอป Weixin หรือ WeChat ของจีน โดยแสดงเป็นปุ่ม AI Search ให้เป็นตัวเลือกใช้งาน เพิ่มเติมจากโมเดล Hunyuan ที่เป็นพื้นฐานของ Tencent อยู่แล้ว

ตัวแทนของ Tencent บอกว่าการเปลี่ยนแปลงดังกล่าวมีผลเฉพาะแอปในจีนเท่านั้น ส่วน WeChat ที่ให้บริการนอกจีนยังไม่ได้เพิ่มความสามารถ DeepSeek นี้

นอกจาก Weixin แล้ว Tencent ยังเพิ่มโมเดลของ DeepSeek ในแอปแชทบอต Yuanbao ของตนเองอีกด้วย

By boompw Contributor on Tag: DeepMind, DeepSeek, Artificial Intelligence
DeepMind

Demis Hassabis ซีอีโอ Google DeepMind ยอมรับว่าโมเดล AI ของ DeepSeek เป็นผลงานที่ดีที่สุดที่เขาเคยเห็นมาจากประเทศจีน โดยอธิบายว่าเป็นผลงานที่น่าประทับใจ และแสดงให้เห็นถึงวิศวกรรมที่ยอดเยี่ยมอย่างยิ่ง ซึ่งมีความสำคัญทางภูมิรัฐศาสตร์

อย่างไรก็ตาม เขามองว่าโมเดลของ DeepSeek ไม่ได้นำเสนอความก้าวหน้าทางวิทยาศาสตร์ใหม่ ๆ อาศัยเทคนิค AI ที่มีอยู่แล้ว และความตื่นเต้นที่เกิดขึ้นกับโมเดลของ DeepSeek นั้นค่อนข้างเกินจริง

ไม่เหมือนกับ Gemini 2.0 Flash ที่ Google เพิ่งเปิดตัวไป มีประสิทธิภาพมากกว่า DeepSeek ด้วยซ้ำ

By arjin Writer on Tag: BYD, DeepSeek
BYD

BYD ประกาศในงานแถลงข่าวสำหรับลูกค้าในประเทศจีน เปิดตัวระบบผู้ช่วยการขับรถ DiPilot ในรถยนต์รุ่นราคาต่ำ จากเดิมฟังก์ชันนี้มีเฉพาะรุ่นบนเท่านั้น โดยบอกว่าต้องการให้ระบบช่วยเหลือการขับขี่เป็นคุณสมบัติความปลอดภัยพื้นฐาน แบบเดียวกับที่รถต้องมีถุงลมนิรภัย

นอกจากนี้ BYD ยังประกาศนำปัญญาประดิษฐ์ DeepSeek มารวมในระบบผู้ช่วยการขับรถด้วย โดยทำงานร่วมกับซอฟต์แวร์ กล้อง เซ็นเซอร์ และอุปกรณ์อื่นในรถยนต์ เพื่อช่วยเหลือในการขับ

ประกาศนี้ทำให้ราคาหุ้นของ BYD ปรับเพิ่มขึ้นทำสถิติสูงสุด ราคาล่าสุดอยู่ที่ 345 หยวนต่อหุ้น

By mk Founder on Tag: Honor, DeepSeek, LLM, Artificial Intelligence
Honor

Honor ประกาศความร่วมมือกับ DeepSeek นำโมเดล DeepSeek-R1 เข้ามาใช้กับผู้ช่วยส่วนตัว Yoyo สำหรับลูกค้าในประเทศจีน

ผู้ใช้ Honor ในจีนมีบริการ Yoyo อยู่แล้ว (เปิดตัวมาตั้งแต่ปี 2018) การใส่ DeepSeek-R1 เข้ามาจะช่วยให้การสนทนาไหลลื่นเป็นธรรมชาติมากขึ้น เป็นเหตุเป็นผลมากขึ้น

สมาร์ทโฟน Honor ที่ใช้ระบบปฏิบัติการ MagicOS 8.0 ขึ้นไปจะสามารถอัพเกรด Yoyo เพิ่มพลัง DeepSeek ได้ ส่วนผู้ใช้นอกจีนยังไม่มีข้อมูลว่าจะได้ใช้งานด้วยหรือไม่

ที่มา - Android Central, GSM Arena

By boompw Contributor on Tag: DeepSeek, Anthropic, Artificial Intelligence
DeepSeek

Dario Amodei ซีอีโอของ Anthropic บอกในรายการพอดแคสต์ ChinaTalk ของ Jordan Schneider ว่า จากการทดสอบความปลอดภัยที่ดำเนินการโดย Anthropic พบประสิทธิภาพของ DeepSeek นั้นแย่ที่สุดในบรรดาทุกโมเดลที่เคยทดสอบมา

Amodei ไม่ได้ชี้แจงว่าทดสอบโมเดล DeepSeek รุ่นไหน และไม่ได้ให้รายละเอียดทางเทคนิคเพิ่มเติมเกี่ยวกับการทดสอบครั้งนี้ เขาระบุแค่ว่านี่เป็นส่วนหนึ่งของการประเมินที่ Anthropic ใช้งานโมเดล AI ต่าง ๆ เพื่อประเมินความเสี่ยงด้านความมั่นคงของชาติที่อาจเกิดขึ้น

By boompw Contributor on Tag: DeepSeek, ByteDance, Chat Bot
DeepSeek

โมเดล R1 ของ DeepSeek ได้รับความนิยมหลังจากเปิดตัวเมื่อเดือนที่แล้ว และกลายเป็นแอปที่ถูกดาวน์โหลดมากที่สุดใน 140 ตลาดทั่วโลก โดยเฉพาะในประเทศจีน DeepSeek แซงหน้า Doubao โมเดล LLM ของ ByteDance ที่ได้รับความนิยมอันดับ 1 ในจีน

Subscribe to DeepSeek