LLM | Blognone

Large Language Model

พนักงานท่านหนึ่ง - Z.ai ออกโมเดล GLM-5.1 ทำงานต่อเนื่องได้นาน 8 ชั่วโมง

By arjin

on 8 April 2026 - 06:44 Tag: Z.ai, Artificial Intelligence, LLM

Z.ai

Z.ai เผยแพร่โมเดล AI โอเพนซอร์สเรือธงรุ่นใหม่ GLM-5.1 โดยนิยามความสามารถว่าไม่ใช่ Vibe Coding แต่เป็น "Agentic Engineeing" ที่มีความสามารถทั้งการเขียนโค้ดและแก้ปัญหาทางวิศวกรรมที่เหนือกว่าโมเดลรุ่นก่อน โดยโมเดลมีขนาด 754 พันล้านพารามิเตอร์

Google AI Edge Eloquent แอปใหม่ถอดเสียงเป็นข้อความ พร้อมปรับแต่งให้สวยงาม ทำงานออฟไลน์ได้

By arjin

on 7 April 2026 - 12:53 Tag: Google, Mobile App, Text-to-Speech, Artificial Intelligence, LLM

Google

กูเกิลออกแอปใหม่บน iOS ชื่อ Google AI Edge Eloquent โดยเป็นแอปถอดข้อความเสียงออกมาเป็นตัวหนังสือ เสริมความสามารถด้วย AI ทำให้ข้อความที่ได้ดูดีมากขึ้น

ฟีเจอร์หลักได้แก่ การถอดข้อความเสียงที่พูด โดยตัดคำที่ไม่จำเป็นเช่น umm, uhs ให้ออกมาเป็นข้อความที่มีเฉพาะเนื้อหาหลัก รองรับการบันทึกคำศัพท์เฉพาะเพื่อให้ถอดข้อความได้แม่นยำขึ้น นอกจากนี้ยังใช้ AI ปรับแต่งข้อความให้เป็นสไตล์ที่ต้องการ เช่น ย่อความ, ตัดแบ่งเป็นหัวข้อ หรือปรับให้เป็นทางการมากขึ้น

ผู้ใช้ Claude Code โวยโมเดลโง่ลง ทีม Claude ระบุมีการปรับภายในแต่ปรับกลับเหมือนเดิมได้

By lew

on 7 April 2026 - 10:49 Tag: Claude, Programming, LLM

Claude

ผู้ใช้ GitHub บัญชี stellaraccident เขียนรายงานวิเคราะห์ว่าในช่วงเดือนที่ผ่านมา Claude Code ความสามารถลดลงมาก โดยเขาอาศัย log ทั้งหมดในช่วงหลายเดือนที่ผ่านมาวิเคราะห์พฤติกรรมของ Claude Code

รายงานพบว่า Claude เริ่มปิดบัง thinking token มากขึ้นเรื่อยๆ จนปิดบังทั้งหมด ขณะที่อัตราการคิดก่อนตอบโดยเฉลี่ยก็สั้นลงเรื่อยๆ ส่งผลต่อคุณภาพการเขียนโค้ดโดยรวมลดลง เช่น ก่อนหน้านี้ Claude Code จะพยายามอ่านไฟล์ก่อนแก้ไขเสมอ แต่ช่วงหลังกลับพยายามแก้ไขทันที ส่งผลให้การแก้ไขไฟล์ล้มเหลวมากขึ้น หลายครั้งก็คิดวนไปวนมาเปลืองโทเค็นไปเปล่าๆ

แอปเปิลพบ LLM ฝึกด้วยคำตอบของตัวเองแล้วเก่งขึ้นมาก

By lew

on 6 April 2026 - 14:33 Tag: Apple, LLM

Apple

ทีมวิจัยของแอปเปิลรายงานถึงแนวทางการฝึกโมเดลปัญญาประดิษฐ์แบบ LLM ด้วยเทคนิค simple self-distillation (SSD) ที่เป็นการนำเอาคำตอบเดิมของโมเดลเอง มาฝึกกับตัวเอง ทำให้ไม่จำเป็นต้องใช้ข้อมูลฝึกจากโมเดลขนาดใหญ่กว่า หรือฝึกแบบตรวจคำตอบไปด้วย (เช่น การรันผลทดสอบโปรแกรมที่ได้)

Microsoft AI เปิดตัวโมเดลถอดเสียงเป็นข้อความ MAI-Transcribe-1 รองรับภาษาไทย

By mk

on 3 April 2026 - 08:54 Tag: Microsoft AI, Microsoft, LLM, Text-to-Speech, Speech Synthesis

Microsoft AI

Microsoft AI เปิดตัวโมเดลตระกูล MAI เพิ่มเติมอีก 3 ตัว ได้แก่

กูเกิลเปิดตัว Gemma 4 โมเดลแบบเปิด ชูความเก่งใกล้เคียง Qwen3.5 ที่ขนาดใหญ่กว่ามาก

By lew

on 3 April 2026 - 08:19 Tag: Gemma, LLM, Google

Gemma

กูเกิลเปิดตัว Gemma 4 ชุดโมเดลปัญญาประดิษฐ์ LLM แบบเปิด สามารถใช้งานได้อิสระ ในชุดมี 4 โมเดลได้แก่ E2B, E4B, 26B-A4B, และ 31B โดยตัว 31B ครองอันดับ 27 ของเว็บ Arena.ai นับเป็นโมเดลแบบเปิดอันดับ 3 เป็นรองเพียง GLM-5 และ Kimi K2.5 ที่ขนาดใหญ่กว่ามาก ขณะที่ 26B-A4B ก็ยังได้อันดับ 6 ในกลุ่มโมเดลเปิด

โมเดลทุกตัวรองรับทั้งภาพและเสียงในตัว ทำให้สามารถใช้งานเฉพาะทาง เช่น แปลงเสียงเป็นข้อความ, ทำ OCR ภาพ เมื่อดูคะแนนทดสอบจะเห็นว่า Gemma 4 พัฒนาขึ้นจาก Gemma 3 มาก เช่น LiveCodeBench จาก 29.1% เป็น 77.1% ใน 26B-A4B และ 80.0% ใน 31B

ผล MLPerf 6.0: NVIDIA โชว์ TensorRT-LLM รีดประสิทธิภาพ Blackwell ได้ 2.7 เท่า, AMD โชว์ MI355X เข้าใกล้ Blackwell, Intel ใช้ B70 ทำเซิร์ฟเวอร์คุ้มราคา

By lew

on 2 April 2026 - 11:20 Tag: LLM, NVIDIA, AMD, Intel, Blackwell, Instinct, Intel Arc

LLM

วันนี้ทาง MLCommons ประกาศผลการวัดประสิทธิภาพ MLPerf 6.0 ประเด็นสำคัญในรอบนี้คือการโชว์ประสิทธิภาพการรันโมเดล LLM เช่น DeepSeek-R1, GPT-OSS-120B, Llama2-70B, Qwen3-VL-235B-A22B โดยผู้ผลิตเซิร์ฟเวอร์และผู้ผลิตชิปเข้าร่วมจำนวนมาก

ผู้ร่วมก่อตั้ง GitLab รักษามะเร็งตัวเองด้วยการตั้งบริษัท สร้างยาเฉพาะตัว

By lew

on 29 March 2026 - 23:41 Tag: GitLab, Medical, Research, LLM, Artificial Intelligence

GitLab

Sid Sijbrandij ผู้ร่วมก่อตั้งบริษัท GitLab เล่าถึงประสบการณ์การต่อสู้กับมะเร็งแบบ osteosarcoma ในกระดูกสันหลังชิ้น T5 ที่เริ่มสร้างความเจ็บปวดในช่วงปี 2022 และวินิจฉัยได้ในปี 2023

Sijbrandij รับการรักษาตามมาตรฐานในปี 2023 โดยผ่าตัดกระดูกสันหลังออก, ฉายรังสี, และรักษาด้วยเคมีบำบัดแต่สุดท้ายมะเร็งก็กลับมาในปี 2024 ทำให้ Sijbrandij ตัดสินใจหาทางรักษาตัวเองนอกแนวทางมาตรฐาน เขามุ่งเป้า 4 แนวทาง ได้แก่ วัคซีนมะเร็งเฉพาะตัว, เซลล์ TCR-T, เซลล์ CAR-T, และการรักษาด้วยรังสีเฉพาะตัว โดยรวมเขาเปิดบริษัทถึง 10 บริษัทเพื่อพัฒนาเทคโนโลยีต่างๆ

บริษัทความปลอดภัยพอร์ตไลบรารี JSONata เป็นภาษา Go ด้วย AI ช่วยประหยัดปีละ 16 ล้านบาท

By lew

on 28 March 2026 - 11:06 Tag: Go, Programming, LLM, JSON, JavaScript

Reco บริษัทความปลอดภัยองค์กรเล่าถึงประสบการณ์การพอร์ตไลบรารี JSONata จาก JavaScript เป็น Go ด้วย AI เพื่อลด overhead ในการรันคิวรี ผลการพัฒนาทำให้ค่าเซิร์ฟเวอร์ประหยัดลงมหาศาลเทียบกับค่าโทเค็นของ AI

MiniMax เปิดแพ็กเกจ Token เหมาจ่ายรายเดือนไม่จำกัดเฉพาะการเขียนโค้ด

By lew

on 27 March 2026 - 07:44 Tag: MiniMax, LLM, Programming

MiniMax

MiniMax เปิดตัวแพ็กเกจ Token Plan เปิดให้ API ใช้งานโดยไม่จำกัดการใช้งานกับเครื่องมือเขียนโปรแกรมเท่านั้น

เดิมผู้ให้บริการ LLM ต่างๆ มักเลือกให้บริการแพ็กเกจรายเดือนกับเครื่องมือเขียนโค้ดเป็นหลัก เนื่องจากสามารถใช้แคชได้อย่างมีประสิทธิภาพ จากการคุยต่อเนื่องในเรื่องเดิมในระยะเวลาสั้นๆ แต่ความนิยมของ OpenClaw ก็ทำให้มีคนเรียกร้องการใช้งานเครื่องมืออื่นๆ มากขึ้น รวมถึงพฤติกรรมการใช้งานที่ OpenClaw เรียก Agent ย่อยหลายตัวพร้อมกัน

อินเทลเปิดตัว Intel Arc Pro B70 ชิปกราฟิกพร้อมแรม 32GB ราคา 32,000 บาท

By lew

on 26 March 2026 - 08:03 Tag: Intel Arc, Intel, LLM, GPU

Intel Arc

อินเทลเปิดตัวชิปกราฟิก Intel Arc Pro B70 และ B65 ชิปกราฟิกสำหรับงาน AI เป็นหลัก เพราะมีแรมขนาดใหญ่

Intel Arc Pro B70 มีพลังประมวลผล 22.94 TFLOPS ที่ FP32 และ 367 TOPS ที่ INT8 มาพร้อมแรม GDDR6 ขนาด 32GB แบบ ECC มีแบนวิดท์แรม 608 GB/s กินพลังงานสูงสุด 230 วัตต์

Intel Arc Pro B65 ลดหน่วยประมวลผลกราฟิกลง ทำให้พลังประมวลผลเหลือเพียง 12.28 TFLOPS ที่ FP32 และ 197 TOPS ที่ INT8 แต่รองรับแรม 32GB เท่าๆ กับ B70 และกินพลังงานสูงสุด 200 วัตต์

แจ้งเตือน LiteLLM ถูกแฮกบัญชี PyPI คนร้ายวางเวอร์ชันใหม่ฝังโค้ดขโมย API key

By lew

on 25 March 2026 - 07:23 Tag: Security, LLM

Security

LiteLLM แจ้งเตือนผู้ใช้ว่ามีคนร้ายเจาะบัญชี PyPI ได้สำเร็จ และอัปโหลดเวอร์ชัน 1.82.7 และ 1.82.8 เมื่อวันที่ 24 มีนาคมที่ผ่านมา โดยทั้งสองเวอร์ชันฝังโค้ดที่ใช้ขโมย API key ขององค์กรออกไป ระยะเวลาที่คนร้ายสามารถวางเวอร์ชันมุ่งร้ายจนมีการตรวจพบและลบออกไปรวมประมาณ 3 ชั่วโมง

LiteLLM เป็น AI API Gateway ที่ได้รับความนิยมสูง หลายองค์กรอาศัยมันเป็นตัวจัดการการใช้งานในองค์กร โดยนำกุญแจกลางขององค์กรมาวางไว้ที่ gateway แล้วให้แอปพลิเคชันต่างๆ ภายในใช้กุญแจของ LiteLLM อีกที ทำให้จัดการงบประมาณได้ง่ายขึ้น รวมถึงสามารถใช้ API กลางแม้จะมีผู้ให้บริการ AI หลายเจ้าก็ตาม

OpenAI เตรียมปิดตัว Sora แพลตฟอร์มสร้างวิดีโอด้วย AI มีผลทั้งแอป และ API

By arjin

on 25 March 2026 - 06:08 Tag: Sora, OpenAI, Artificial Intelligence, LLM

Sora

OpenAI ประกาศเตรียมปิดบริการแอปสร้างวิดีโอด้วย AI Sora โดยตอนนี้ยังไม่เปิดเผยรายละเอียดเพิ่มเติมว่าแอปจะปิดตัวเมื่อใด และโมเดลสร้างวิดีโอด้วย AI จะใช้งานต่อได้ในช่องทางใด OpenAI บอกเพียงรายละเอียดอื่นจะตามมาในภายหลัง

Sora เป็นโมเดลสร้างวิดีโอสั้นด้วย AI ที่ OpenAI เปิดให้คนใช้งานได้มากขึ้นผ่านการออกแอปสมาร์ทโฟน Sora โดยเฉพาะ ซึ่งหากนับอายุแล้วแอปก็ออกมาเพียง 6 เดือนเท่านั้น

Cloudflare ทำตลาด LLM ขนาดใหญ่ เริ่มจาก Kimi K2.5

By lew

on 22 March 2026 - 21:53 Tag: Cloudflare, LLM, Moonshot AI

Cloudflare

Cloudflare ปรับบริการ Workers AI จากเดิมให้บริการ LLM เฉพาะโมเดลขนาดเล็กถึงขนาดกลาง เช่น GPT-OSS 120B หรือ Nemotron 3 120B มาเป็นการให้บริการโมเดลขนาดใหญ่ด้วย ตัวแรกที่ให้บริการคือ Kimi K2.5 ที่มีขนาดถึง 1.1 ล้านล้านพารามิเตอร์

ทาง Cloudflare ระบุว่าภายในเองก็มีระบบรีวิวโค้ดต่อเนื่อง โดยต้องประมวลผลถึงวันละ 7 พันล้านโทเค็น หากใช้โมเดลชั้นนำก็จะมีค่าใช้จ่ายปีละ 2.4 ล้านดอลลาร์ แต่หากใช้ Kimi K2 จะถูกลง 77% การให้บริการ Kimi K2.5 โดยอาศัยเอนจิน Infire ที่พัฒนาขึ้นเองและเน้นประสิทธิภาพการให้บริการให้คุ้มค่าชิปกราฟิก

OpenAI ออกโมเดลรุ่นเล็กตัวใหม่ GPT‑5.4 mini และ nano

By arjin

on 18 March 2026 - 07:15 Tag: OpenAI, ChatGPT, LLM, Artificial Intelligence

OpenAI

OpenAI ออกโมเดลรุ่นเล็กตัวใหม่ GPT‑5.4 mini และ nano ระบุว่านำความสามารถเด่นจาก GPT-5.4 มาใส่ในโมเดลขนาดเล็กนี้ซึ่งมีจุดเด่นคือการทำงานที่รวดเร็ว

GPT‑5.4 mini มีความสามารถหลายด้านที่เหนือกว่า GPT-5 มาก เช่น การเขียนโค้ด การให้เหตุผล การทำความเข้าใจข้อมูลผสมผสานรูปแบบ ตอบสนองได้เร็วกว่า 2 เท่า ผลทดสอบในบางหัวข้อเช่น SWE-Bench Pro หรือ OSWorld-Verified มีคะแนนที่ใกล้เคียงกับโมเดลหลัก GPT-5.4 จึงเหมาะกับการใช้งานที่เน้นการตอบสนองรวดเร็ว เช่น ผู้ช่วยเขียนโค้ดที่ต้องการให้ผู้ใช้งานรู้สึกถึงการตอบโต้ตลอดเวลา, ระบบแนะนำเนื้อหาแบบเรียลไทม์ และอื่น ๆ ส่วน GPT-5.4 nano เหมาะสำหรับ AI ผู้ช่วยที่ทำงานย่อยต่าง ๆ ซึ่งต้องการความรวดเร็ว ใช้เวลาน้อย และมีต้นทุนประมวลผลต่ำ

NVIDIA เปิดตัวโมเดล Nemotron เพิ่มทั้งโมเดลขนาดใหญ่, โมเดลเข้าใจเสียงและภาพ

By lew

on 17 March 2026 - 05:44 Tag: NVIDIA, LLM, Open Source, Nemotron

NVIDIA

NVIDIA เปิดตัวโมเดลปัญญาประดิษฐ์แบบโอเพนซอร์สเพิ่มในงาน GTC 2026 จากก่อนหน้านี้เปิดตัว Nemotron 3 Super มาก่อนแล้ว โดยโมเดลรุ่นใหม่ขยายแนวทางการใช้งานของ Nemotron มากขึ้น

รายการโมเดลที่ปล่อยในงานครั้งนี้ได้แก่

NVIDIA เปิดตัวแพลตฟอร์ม Vera Rubin เชื่อมชิป Groq 3 เร่งความเร็ว

By lew

on 17 March 2026 - 05:06 Tag: NVIDIA Rubin, NVIDIA, Groq, LLM, NVIDIA Vera

NVIDIA Rubin

NVIDIA เปิดตัวแพลตฟอร์ม NVIDIA Vera Rubin ครบชุด โดยตอนนี้อยู่ในสายการผลิตเต็มสูบเตรียมส่งมอบให้ลูกค้าแล้ว ในชุดแพลตฟอร์มประกอบด้วย NVIDIA Vera CPU, NVIDIA Rubin GPU, NVIDIA NVLink 6, NVIDIA ConnectX-8, NVIDIA BlueField-4 DPU, NVIDIA Spectrum-6 Ethernet, และ NVIDIA Groq 3 LPU

ในชุดนี้ที่เด่นที่สุดคือ Groq 3 ที่บริษัททำข้อตกลงซื้อตัวผู้ก่อตั้งมาทำงานด้วยตั้งแต่ปลายปี 2025 ในชุดเป็นชิป LP30

[ไม่ยืนยัน] Meta เลื่อนเปิดตัวโมเดล AI ใหม่ Avocaco เป็นเดือนพฤษภาคม - อาจใช้ Gemini แทนถ้าจำเป็น

By arjin

on 13 March 2026 - 17:13 Tag: Meta, Rumors, Meta AI, Llama, LLM, Gemini

NVIDIA เปิดตัว Nemotron 3 Super โมเดล AI ระดับเดียวกับ Qwen3.5 แต่รันเร็วกว่าหลายเท่าตัว

By lew

on 12 March 2026 - 02:26 Tag: NVIDIA, LLM, Nemotron

NVIDIA

NVIDIA เปิดตัวโมเดลปัญญาประดิษฐ์แบบเปิดในตระกูล Nemotron รุ่นใหม่ ในชื่อ Nemotron 3 Super เป็นโมเดลแบบ 120B-A12B ที่ออกแบบมาเพื่อประสิทธิภาพการรันที่ความเร็วสูงโดยเฉพาะเมื่อใช้ชิป Blackwell เหมาะกับการใช้งานภายในองค์กร

แม้จะเป็นโมเดลขนาดใหญ่พอๆ กับ GPT-OSS-120B และ Qwen3.5-122B-A10B แต่จุดเด่นของ Nemotron 3 Super คือการออกแบบให้รองรับเทคนิคให้ต้นทุนการรันต่ำลง ได้แก่

Amazon เพิ่มมาตรการตรวจสอบโค้ดให้รัดกุมขึ้น จากเหตุระบบล่มหลายครั้งช่วงที่ผ่านมา ส่วนหนึ่งมาจาก GenAI

By arjin

on 11 March 2026 - 07:24 Tag: Amazon, LLM, Rumors, Developer, Generative AI

Amazon

CNBC อ้างเอกสารการประชุมภายใน Amazon ซึ่งเป็นการพูดคุยลงรายละเอียดเกี่ยวกับปัญหาเว็บไซต์ล่ม หรือบริการบางอย่างใช้งานไม่ได้ ซึ่งเกิดขึ้นบ่อยมากขึ้นนับตั้งแต่ไตรมาส 3 ปีที่แล้ว ซึ่ง CNBC ให้ความสนใจว่าเนื้อหาส่วนหนึ่งในการประชุมบอกว่าการใช้ GenAI เขียนโค้ด เป็นสาเหตุหนึ่งของปัญหาที่เกิดขึ้น ทำให้บริษัทบอกว่ากระบวนการตรวจสอบก่อนดีพลอยโค้ดจะต้องทำอย่างรัดกุมมากยิ่งขึ้น

Subscribe to LLM