Image
By lew Founder on Tag: LLM, Claude, DeepSeek, Xiaomi
LLM

OpenRouter อัพเดตการใช้งาน LLM ผ่านแพลตฟอร์มในหมวดการเขียนโปรแกรม โดยความพิเศษในรอบนี้คือ Claude หลุดจากกลุ่ม 5 อันดับแรกที่ใช้เขียนโปรแกรมเป็นครั้งแรก แต่ยังมี Claude Opus 4.7 อยู่อันดับที่ 8 ที่ปริมาณการใช้งาน 4% รวม 129B โทเค็น

5 อันดับแรกของการใช้งานในหมวดการเขียนโปรแกรมสัปดาห์ล่าสุด ได้แก่ 1) MiMo-V2.5 2) MiMo-V2.5-Pro 3) DeepSeek V4 Flash 4) DeepSeek V4 Pro 5) MiniMax M3

By arjin Writer on Tag: DeepSeek, LLM
DeepSeek

DeepSeek ออกโมเดลเวอร์ชัน 4 คือ DeepSeek-V4-Pro และ DeepSeek-V4-Flash มาตั้งแต่เดือนที่แล้ว ซึ่งโมเดลรุ่น Pro นั้น DeepSeek ก็ชูจุดเด่นนอกเหนือจากความสามารถคือราคาถูกโดยอยู่ที่ 1.74/3.48 ดอลลาร์ต่อ 1M โทเค็น แถมในช่วงเปิดตัวยังลดราคาถึง 75% ด้วย

ล่าสุด DeepSeek จัดเต็มเรื่องราคาต่อโดยบอกว่าโมเดล deepseek-v4-pro จะคิดราคาใช้งาน API ที่ราคาเท่ากับราคาลด 75% ในช่วงเปิดตัวซึ่งเดิมกำหนดถึงวันที่ 31 พฤษภาคมนี้ไปแบบถาวรเลย ทำให้ราคาใหม่อยู่ที่ 0.435/0.87 ดอลลาร์ต่อ 1M โทเค็น ส่วนราคาโมเดลรุ่นเล็ก DeepSeek-V4-Flash ยังคงเท่าเดิมคือ 0.14/0.28 ดอลลาร์ต่อ 1M โทเค็น

By lew Founder on Tag: DeepSeek, LLM
DeepSeek

DeepSeek ออกโมเดลเวอร์ชัน 4 สองตัว ได้แก่ DeepSeek-V4-Pro และ DeepSeek-V4-Flash ชูจุดเด่นว่ามีความเก่งในหมวดการเขียนโปรแกรมระดับเดียวกับโมเดลชั้นนำ เช่น Opus 4.6, GPT-5.4 xhigh, และ Gemini 3.1 Pro (high)

By arjin Writer on Tag: Anthropic, Artificial Intelligence, Claude, DeepSeek, Moonshot AI
Anthropic

Anthropic เปิดเผยว่าโมเดลปัญญาประดิษฐ์ Claude ถูกโจมตีจากบัญชีผู้ใช้งานซึ่งเกี่ยวข้องกับบริษัท AI สามแห่งจากจีน รวมประมาณ 24,000 บัญชี เพื่อดึงข้อมูลและความสามารถต่าง ๆ ออกไปรวมมากกว่า 16 ล้านครั้ง ซึ่งเป็นการละเมิดข้อตกลงในการให้บริการ (ToS) และข้อจำกัดในการเข้าถึงข้อมูล

สามบริษัทที่ระบุได้แก่ DeepSeek, Moonshot และ MiniMax โดยพบการดึงข้อมูลที่ไม่ถูกต้อง 1.5 แสนครั้ง, 3.4 ล้านครั้ง และ 13 ล้านครั้ง ตามลำดับ

By lew Founder on Tag: DeepSeek, NVIDIA, China
DeepSeek

สำนักข่าว The Information อ้างแหล่งข่าวไม่เปิดเผยตัวตน ระบุว่า DeepSeek ใช้ชิป NVIDIA ตระกูล Blackwell ในการพัฒนาโมเดลปัญญาประดิษฐ์ แม้ว่าชิปรุ่นนี้จะถูกห้ามขายในจีนก็ตามที

By mk Founder on Tag: DeepSeek, LLM
DeepSeek

ช่วงนี้ DeepSeek ขยันปล่อยของรัวๆ หลังจากออก โมเดลคณิตศาสตร์ DeepSeek-Math-V2 ก็ตามมาด้วยโมเดลสายหลักของบริษัทคือ DeepSeek-V3.2 ที่เป็นการอัพเกรดจาก DeepSeek-V3.1 เมื่อเดือนสิงหาคม

DeepSeek โฆษณาว่า V3.2 เป็น "Reasoning-first models built for agents!" ชูจุดเด่นเรื่องการให้เหตุผลโดยเฉพาะ รองรับการใช้เครื่องมือภายนอก โมเดลแยกเป็น 2 รุ่นย่อยคือ V3.2 ตัวมาตรฐาน และ V3.2-Speciale ยกระดับความสามารถด้านการให้เหตุผลไปอีกขั้น

By arjin Writer on Tag: DeepSeek, Artificial Intelligence, Math
DeepSeek

DeepSeek ออกโมเดลปัญญาประดิษฐ์ใหม่ DeepSeek-Math-V2 ชูจุดเด่นทำคะแนนสอบคณิตศาสตร์โอลิมปิก IMO 2025 ได้เหรียญทอง พร้อมกับคะแนนเกือบเต็มคือ 118/120

ถ้าจำกันได้ ความสามารถโมเดล AI ในการทำข้อสอบคณิตศาสตร์ไม่ใช่เรื่องใหม่ OpenAI กับ Google DeepMind ก็เคยนำเสนอโมเดลระดับเหรียญทองมาแล้วเหมือนกัน แต่กรณีของ DeepSeek นั้น โมเดลเป็นแบบเปิดซึ่งสามารถดาวน์โหลดไปปรับใช้งานต่อได้ทั้งใน Hugging Face และ GitHub ภายใต้สัญญา Apache License 2.0 ขณะที่โมเดลของสองค่ายก่อนหน้านี้เป็นแบบปิด

By mk Founder on Tag: AWS, Amazon, LLM, Qwen, DeepSeek
AWS

AWS ประกาศนำโมเดลค่ายจีน 2 ค่ายคือ Alibaba Qwen และ DeepSeek มาให้บริการบน Amazon Bedrock

กรณีของ Qwen ถือเป็นครั้งแรกที่ Bedrock มีให้บริการ เบื้องต้นมีโมเดลให้ใช้ 4 ตัวคือ

  • Qwen3-Coder-480B-A35B-Instruct
  • Qwen3-Coder-30B-A3B-Instruct
  • Qwen3-235B-A22B-Instruct-2507
  • Qwen3-32B (Dense)

ส่วน DeepSeek นั้นเดิม Bedrock มีให้บริการ DeepSeek-R1 โมเดลกลุ่ม reasoning อยู่ก่อนแล้ว ตอนนี้ขยายมายัง DeepSeek-V3.1 โมเดลสายหลักตัวล่าสุด ด้วย

By mk Founder on Tag: DeepSeek, LLM
DeepSeek

หลังจากเงียบหายไปหลายเดือน DeepSeek กลับมาแล้วกับโมเดลเวอร์ชันใหม่ DeepSeek-V3.1 ที่เพิ่มฟีเจอร์ hybrid thinking mode ใช้โมเดลตัวเดียวเลือกโหมดได้ระหว่าง thinking (สำหรับงาน research) กับ non-thinking (สำหรับงาน chat ทั่วไป)

เดิมทีนั้น โมเดลสายหลักของ DeepSeek คือ V3 ที่พัฒนาต่อจาก V2 แต่เมื่อต้นปีนี้ บริษัทสร้างชื่อในระดับโลก จากโมเดลสาย R1 ที่มี reasoning และทำคะแนนในเบนช์มาร์คต่างๆ ได้สูง

By arjin Writer on Tag: Germany, DeepSeek, App Store, Google Play
Germany

หน่วยงานเฝ้าระวังการคุ้มครองข้อมูลของเยอรมนีเปิดเผยว่า DeepSeek ได้ส่งข้อมูลของผู้ใช้งานในเยอรมนีกลับไปที่ประเทศจีน ซึ่งผิดกฎหมายการคุ้มครองข้อมูลของสหภาพยุโรปหรือ EU จึงได้แจ้งไปยังแอปเปิลและกูเกิล ให้เร่งตรวจสอบ รวมทั้งพิจารณาแบนแอปนี้เนื่องจากผิดกฎการใช้งาน

ทั้งนี้กฎหมายคุ้มครองข้อมูลของสหภาพยุโรปหรือ GDPR กำหนดห้ามบริษัทที่ดำเนินงานในภูมิภาคยุโรป ส่งข้อมูลผู้ใช้งานออกไปนอกภูมิภาคตามเงื่อนไขที่กำหนดไว้

By Fzo Contributor on Tag: DeepSeek, LLM, Gemini, Artificial Intelligence, China
DeepSeek

DeepSeek ผู้พัฒนา AI จากจีน ที่เพิ่งอัปเดตโมเดล R1-0528 ซึ่งเน้นความสามารถด้านการให้เหตุผล (reasoning) ถูกตั้งข้อสังเกตว่า อาจได้ใช้ข้อมูลที่มาจากผลลัพธ์ของโมเดล Google Gemini มาใช้ในการเทรนโมเดลดังกล่าว

By boompw Contributor on Tag: China, DeepSeek, Artificial Intelligence
China

ทีมนักวิจัยจีนออกมาเตือนโรงพยาบาลกว่า 300 แห่งในประเทศจีนที่กำลังใช้ DeepSeek ว่าแม้ AI ช่วยให้คำแนะนำทางการแพทย์ที่ดูน่าเชื่อถือ แต่ก็ไม่ได้ให้คำตอบที่ถูกต้องเสมอ และอาจนำไปสู่การวินิจฉัยที่ผิดพลาด หรือการรักษาที่คลาดเคลื่อน โดยเฉพาะหากแพทย์เริ่มพึ่งพา AI มากเกินไป

ปัจจุบัน โรงพยาบาลหลายแห่งในจีนเลือกใช้ DeepSeek แบบติดตั้งภายในองค์กร แทนการเชื่อมต่อผ่านคลาวด์เพื่อเพิ่มความปลอดภัย แต่นี่กลับทำให้ภาระด้านความมั่นคงไซเบอร์ตกไปอยู่ที่แต่ละโรงพยาบาล ซึ่งหลายแห่งอาจไม่มีโครงสร้างพื้นฐานที่เหมาะสม ในการจัดการความเสี่ยงนี้

By arjin Writer on Tag: DeepSeek, Artificial Intelligence, Math
DeepSeek

DeepSeek เผยแพร่โมเดลปัญญาประดิษฐ์โอเพนซอร์สรุ่นใหม่ DeepSeek-Prover-V2-671B ซึ่งโมเดล Prover ถูกออกแบบมาเพื่อแก้ปัญหาทางคณิตศาสตร์เป็นหลัก

ทั้งนี้ DeepSeek ไม่ได้ออกประกาศอย่างเป็นทางการถึงรายละเอียดของโมเดลนี้ แต่ใช้วิธีอัปโหลดโค้ดทาง Hugging Face ซึ่ง ณ เวลานี้ Readme ก็ยังไม่มีรายละเอียดด้วย โดยหากดูตามชื่อโมเดลก็มีพารามิเตอร์จำนวน 671B

Prover V2 เป็นรุ่นถัดจาก V1.5 ที่ออกมาเมื่อเดือนสิงหาคม

By arjin Writer on Tag: DeepSeek, Artificial Intelligence
DeepSeek

ที่ผ่านมา DeepSeek บริษัทปัญญาประดิษฐ์จากจีนที่เป็นกระแสสะเทือนวงการบริษัทเทคโนโลยีทั่วโลกเมื่อต้นปี แนวทางบริษัทนั้นต้องการโฟกัสที่การวิจัยพัฒนาโมเดล โดยยังไม่ได้มองเรื่องการพัฒนาผลิตภัณฑ์เชิงพาณิชย์ออกมา

อย่างไรก็ตามเมื่อวันก่อน DeepSeek ได้โพสต์ประกาศในบัญชี WeChat ของบริษัท บอกว่าบริษัทรับสมัครตำแหน่งงาน เพื่อรับผิดชอบส่วนผลิตภัณฑ์และการออกแบบ ทำงานที่สำนักงานในปักกิ่งและหางโจว ไม่ได้บอกว่าจะรับกี่ตำแหน่ง แต่บอกว่าต้องการตำแหน่งนี้ด่วนมาก นอกจากนี้ยังประกาศรับสมัครซีโอโอเพื่อดูแลการดำเนินงาน และซีเอฟโอเพื่อดูแลการเงินด้วย แต่สองตำแหน่งนี้ไม่ได้ระบุว่าต้องการด่วน

By boompw Contributor on Tag: South Korea, DeepSeek, China, United States
South Korea

สำนักงานคณะกรรมการคุ้มครองข้อมูลส่วนบุคคล (PIPC) ของเกาหลีใต้พบว่า DeepSeek ละเมิดกฎความเป็นส่วนตัว หลังส่งข้อมูลผู้ใช้งานไปต่างประเทศโดยไม่ได้รับความยินยอมอย่างเหมาะสม

DeepSeek เคยเปิดตัวในเกาหลีใต้เมื่อเดือนมกราคม ตอนนั้นบริษัทมีการเก็บและส่งข้อมูลต่าง ๆ เช่น คำสั่งที่ผู้ใช้พิมพ์ใน AI, ข้อมูลอุปกรณ์, และการใช้งานแอป ไปยังบริษัทในจีนและสหรัฐฯ

หนึ่งในบริษัทก็คือ Beijing Volcano Engine Technology ผู้ให้บริการคลาวด์จากจีน และเป็นบริษัทที่ทางการเกาหลีบอกว่า เป็นบริษัทที่ถูกแยกออกมาจาก ByteDance แล้ว แม้จะมีความเกี่ยวโยงกันมาก่อน

By lew Founder on Tag: DeepSeek, LLM, Open Source
DeepSeek

DeepSeek ประกาศแนวทางการพัฒนาซอฟต์แวร์รันโมเดลปัญญาประดิษฐ์ (inference engine) หลังจากก่อนหน้านี้บริษัทใช้ vLLM รุ่นพิเศษที่แก้ไขภายในเพื่อให้บริการ มาเป็นการทำงานร่วมกับโครงการโอเพนซอร์ส

ก่อนหน้านี้ DeepSeek เปิดซอฟต์แวร์ที่เกี่ยวข้องกับระบบรันปัญญาประดิษฐ์จำนวนมาก โดยซอฟต์แวร์มักเป็นการออปติไมซ์ประสิทธิภาพการรันปัญญาประดิษฐ์บนชิป NVIDIA Hopper ทาง DeepSeek ระบุว่าเคยพิจารณาว่าจะเปิดเอนจินออกมาทั้งชุด แต่พบปัญหา 3 ประการ

By arjin Writer on Tag: Alibaba, ByteDance, Artificial Intelligence, Mobile App, China, DeepSeek
Alibaba

Quark แอปผู้ช่วย AI ของ Alibaba ขึ้นเป็นแอปผู้ช่วย AI ยอดนิยมในแอปสโตร์ของประเทศจีน โดยตัวเลขล่าสุดในเดือนมีนาคม 2025 ตามรายงานของ Aicpb จำนวนผู้ใช้งานเป็นประจำทุกเดือน (MAUs) เพิ่มเป็น 150 ล้านคน แซงอันดับ 1 เดิมมานานอย่าง Doubao แอป AI ของ ByteDance แล้ว

จำนวนผู้ใช้งาน MAUs ในเดือนมีนาคมของ Doubao อยู่ที่ 100 ล้านบัญชี และ DeepSeek ในอันดับ 3 ที่ 77 ล้านบัญชี

เดิม Quark เป็นแอปคลาวด์สตอเรจและบริการค้นหาข้อมูลของ Alibaba แต่ได้ปรับแผนการตลาดมาเป็นชื่อบริการผู้ช่วย AI เมื่อเดือนที่ผ่านมา ซึ่งดูจะประสบความสำเร็จมาก

By arjin Writer on Tag: DeepSeek, Translation, Myanmar
DeepSeek

มีกรณีที่น่าสนใจของโมเดลปัญญาประดิษฐ์ DeepSeek โดยทีมของมหาวิทยาลัย Beijing Language and Culture University ได้พัฒนาเครื่องมือแปลภาษาพิเศษ ที่ทำงานบนโมเดล DeepSeek สำหรับให้ทีมกู้ภัยของจีนซึ่งทำงานอยู่ในเมียนมาร์เพื่อช่วยเหลือเหตุการณ์แผ่นดินไหวได้ใช้งาน

สิ่งที่แตกต่างของเครื่องมือแปลภาษา จีน-เมียนมาร์ นี้ คือรองรับคำศัพท์และประโยคสำหรับใช้งานในสถานการณ์ภัยพิบัติโดยเฉพาะ ซึ่งสามารถสร้างออกมาได้อย่างรวดเร็วบนโมเดลของ DeepSeek นี้ ทีมพัฒนาบอกว่าใช้เวลาเพียง 7 ชั่วโมงเท่านั้นในการสร้าง และยังมีฟีเจอร์ส่วนขยาย เช่น การสนทนาเสียง หรือการใช้ข้อมูลแผนที่สำหรับการค้นหาช่วยเหลือ เป็นต้น

By mk Founder on Tag: DeepSeek, LLM, Open Source
DeepSeek

DeepSeek ออกโมเดลเวอร์ชันใหม่ DeepSeek-V3-0324 มีการเปลี่ยนแปลงสำคัญคือเปลี่ยนสัญญาอนุญาตเป็น MIT

เดิมทีโมเดลของ DeepSeek เป็นโอเพนซอร์สอยู่แล้ว แต่ใช้สัญญาอนุญาตแบบคัสตอมของตัวเอง คราวนี้เปลี่ยนมาเป็นสัญญามาตรฐานของวงการคือ MIT License ที่เปิดกว้างมากๆ อนุญาตให้ทำได้แทบทุกอย่าง

By arjin Writer on Tag: Tencent, NVIDIA, Rumors, GPU, Artificial Intelligence, DeepSeek
Tencent

มีรายงานว่า Tencent เพิ่งสั่งซื้อชิป H20 ของ NVIDIA เป็นจำนวนมาก มูลค่ารวมระดับหลายหมื่นล้านหยวน อย่างไรก็ตาม Tencent ไม่ได้ออกมาเปิดเผยรายละเอียดการสั่งซื้อนี้อย่างเป็นทางการ

ก่อนหน้านี้มีรายงานบริษัทเทคโนโลยีของจีนหลายแห่งทั้ง Tencent, Alibaba และ ByteDance ต่างเพิ่มคำสั่งซื้อ H20 เพื่อรองรับความต้องการใช้งาน AI ที่มากขึ้นในจีน ซึ่งถูกจุดกระแสจาก DeepSeek แต่ไม่มีตัวเลขมูลค่าเปิดเผยออกมา

H20 เป็นชิปรุ่นปรับแต่งสถาปัตยกรรม Hopper ของ NVIDIA สำหรับขายให้กับลูกค้าในจีน ซึ่งไม่ใช่เทคโนโลยีรุ่นล่าสุด Blackwell

Subscribe to DeepSeek