LLM | Blognone

Large Language Model

เรารู้ ว่าคุณก็ติดลิมิต VS Code เพิ่มฟีเจอร์ Auto Model Selection เลือกโมเดลให้อัตโนมัติ

By mk

on 17 September 2025 - 11:01 Tag: Visual Studio Code, GitHub Copilot, LLM, Programming, IDE

Visual Studio Code

VS Code ออกฟีเจอร์เล็กๆ แต่น่าสนใจคือ Auto Model Selection สลับโมเดลใน GitHub Copilot Chat อัตโนมัติ เพื่อแก้ปัญหาโมเดล (บางตัว) ติดลิมิตการใช้งาน

วิธีการใช้งานคือเลือกโมเดลเป็น Auto แล้ว VS Code จะเลือกสลับโมเดลให้เองระหว่างโมเดลต่างๆ ในระบบ เช่น Claude Sonnet 4, GPT-5, GPT-5 mini โดยจะใช้โมเดลนั้นไปตลอดเซสชันการพูดคุย ไม่มีการสลับโมเดลระหว่างทางให้งง (อย่างน้อยก็ในตอนนี้)

ทีมวิจัยกูเกิลเปิดตัว VaultGemma โมเดลรักษาความเป็นส่วนตัวแบบ Differential Privacy

By mk

on 15 September 2025 - 10:32 Tag: Gemma, Google, Research, Google Research, LLM, Privacy

Gemma

ทีมวิจัย Google Research เปิดตัวโมเดล VaultGemma ที่เทรนมาตามแนวทางการรักษาความเป็นส่วนตัวแบบ differential privacy

VS Code เพิ่มฟีเจอร์ ติดตั้งโมเดล AI ผ่านส่วนขยาย Extension ได้โดยตรง

By mk

on 14 September 2025 - 19:24 Tag: Visual Studio Code, LLM, IDE, Microsoft

Visual Studio Code

VS Code ออกเวอร์ชัน 1.104 (อ่านว่า ร้อยสี่) ประจำรอบเดือนสิงหาคม 2025 มีฟีเจอร์ใหม่ที่น่าสนใจคือ Language Model Chat Provider API เป็น API ที่เปิดทางให้ส่วนขยาย (extension) สามารถให้บริการโมเดลภาษา LLM กับ VS Code ได้ทันที โดยตัวโมเดลจะรันในเครื่องหรือโฮสต์บนคลาวด์ได้

ฟีเจอร์นี้จะทำให้เราสามารถเพิ่มโมเดลลงใน VS Code ด้วยการติดตั้งส่วนขยายได้ "อย่างเป็นระบบ" ตัวอย่างคือ

Alibaba ออกโมเดล Qwen3-Next รองรับ Long-context และทำ Parameter Scaling ดีขึ้น

By arjin

on 12 September 2025 - 15:52 Tag: Qwen, Alibaba Cloud, Artificial Intelligence, LLM

Qwen

Alibaba เปิดตัว Qwen3-Next บอกว่าเป็นโมเดล AI บนสถาปัตยกรรมใหม่ สร้างจากพื้นฐานโมเดล Qwen3 เพื่อปรับปรุงการทำงานใน 2 อย่างได้แก่ ทำให้รองรับอินพุทที่ยาวขึ้น (long-context) และใช้พารามิเตอร์บางส่วนเท่านั้น แม้โมเดลจะมีพารามิเตอร์ขนาดใหญ่ (parameter scaling)

ผลลัพธ์ที่ได้คือโมเดลหลัก Qwen3-Next-80B-A3B-Base ซึ่งขนาดพารามิเตอร์ 80B เมื่อรันขั้นตอน inference จะใช้พารามิเตอร์จริงเพียง 3B เท่านั้น จึงสร้างผลลัพธ์ออกมาได้เร็วกว่าโมเดลเปรียบเทียบ Qwen3-32B ถึง 10 เท่า แม้ภาพรวมจำนวนพารามิเตอร์จะใหญ่กว่า ส่วนการนำไปฝึกฝนต่อก็ใช้ต้นทุนน้อยกว่า 10% เมื่อเทียบด้วยจำนวนชั่วโมงจีพียู ทั้งหมดจึงมีข้อได้เปรียบเทียบเรื่องต้นทุนการประมวลผล

นักพัฒนาใช้ Claude Code ย้ายไดร์เวอร์เก่าอายุเกิน 20 ปีมารันในลินุกซ์ใหม่ได้สำเร็จในเวลาแค่สองวัน

By lew

on 9 September 2025 - 08:07 Tag: Claude, LLM, Programming

Claude

Dmitry Brant วิศวกรของ Wikimedia Foundation รายงานถึงการใช้ Claude Code พอร์ตโค้ดไดร์เวอร์เคอร์เนลลินุกซ์ที่ถูกถอดออกจากเคอร์เนลไปแล้วถึง 20 ปีให้กลับมาใช้งานกับลินุกซ์ล่าสุดได้อีกครั้งโดยใช้เวลาแค่สองวัน

กูเกิลเปิดตัว EmbeddingGemma โมเดลขนาดเล็ก รันบนมือถือได้ ออฟไลน์ได้ ต้องการแรม 200MB

By mk

on 6 September 2025 - 20:03 Tag: Gemma, Google, LLM

Gemma

กูเกิลยังเดินหน้าออกโมเดลขนาดเล็กในตระกูล Gemma ต่อไป หลังจาก Gemma 3 270M ที่เป็นโมเดลตั้งต้นให้นำไปปรับแต่งต่อ ก็ตามมาด้วย EmbeddingGemma โมเดลที่ออกแบบมาสำหรับ on-device AI แบบพร้อมใช้งานทันที

EmbeddingGemma ปรับแต่งมาจาก Gemma 3 อีกที มีขนาดพารามิเตอร์ 308M มีขนาดเล็กพอที่จะทำงานภายใต้แรม 200MB (quantization แล้ว) รันงานในอุปกรณ์แบบออฟไลน์ แต่ถึงแม้ขนาดเล็ก โมเดลมีประสิทธิภาพสูง ตอบเร็ว ทำคะแนนเบนช์มาร์คได้สูงกว่าโมเดลขนาดใกล้เคียงกันตัวอื่นๆ อย่างชัดเจน

Z.ai เปิดแพ็กเกจเขียนโค้ดรายเดือน เริ่มต้น 3 ดอลลาร์ใช้ได้มากกว่า Claude Code

By lew

on 5 September 2025 - 18:55 Tag: Z.ai, Artificial Intelligence, LLM, Programming

Z.ai

Z.ai ผู้พัฒนาโมเดลปัญญาประดิษฐ์ GLM ที่เน้นงานเขียนโค้ด เปิดแพ็กเกจรายเดือนแข่งกับ Claude Code โดยชูจุดเด่นราคาถูกกว่าหลายเท่าตัว โดยมีสองแพ็กเกจ ได้แก่

GLM Coding Lite ใช้งานได้ 120 พรอมพ์ต่อ 5 ชั่วโมง
GLM Coding Pro ใช้งานได้ 600 พรอมพ์ต่อ 5 ชั่วโมง

แนวทางนับ "พรอมพ์" ค่อนข้างต่างจากการขาย API ตามปกติ โดยทาง Z.ai ระบุว่าแต่ละพรอมพ์เทียบเท่ากับการคุยกับปัญญาประดิษฐ์หนึ่งรอบ โดยปัญญาประดิษฐ์สามารถสั่งคำสั่งอื่นๆ เช่น อ่านไฟล์เพิ่มเติม หรือวางแผนการทำงานได้ 15-20 ครั้ง

Anthropic ระดมทุนรอบ F มูลค่าบริษัทแตะ 6 ล้านล้านบาท

By lew

on 3 September 2025 - 00:55 Tag: Anthropic, LLM, Funding

Anthropic

Anthropic ผู้สร้างปัญญาประดิษฐ์ Claude ประกาศระดมทุนรอบ F นำโดยกองทุน ICONIQ Capital รวมเงินลงทุน 13,000 ล้านดอลลาร์ มูลค่าบริษัทหลังได้รับเงินลงทุน (post-money) จะมีมูลค่ารวม 183,000 ล้านดอลลาร์ หรือประมาณ 5.9 ล้านล้านบาท การระดมทุนครั้งนี้มีกองทุนใหญ่ๆ ร่วมด้วยจำนวนมาก

ทาง Anthropic ระบุว่ารายได้บริษัทเติบโตขึ้นเร็วมาก นับเฉพาะเดือนสิงหาคมที่ผ่านมามีรายได้เกิน 416 ล้านดอลลาร์ขยายเป็นรายได้ต่อปีเกิน 5,000 ล้านดอลลาร์ และลูกค้าระดับจ่าย 100,000 ดอลลาร์ต่อปีเพิ่มขึ้น 7 เท่าตัว (รายงานตัวเลขเป็น run-rate อนุมานรายได้รายปีจากรายได้ล่าสุด)

Fastly พบโปรแกรมเมอร์ซีเนียร์ใช้ AI ช่วยเขียนเกินครึ่ง เสียเวลาตรวจโค้ดเพิ่มแต่ทำงานมีความสุข

By lew

on 1 September 2025 - 14:04 Tag: Fastly, LLM, Programming

Fastly

Fastly บริการ CDN รายใหญ่รายงานผลสำรวจโปรแกรมเมอร์ 791 ราย พบว่าโปรแกรมเมอร์ซีเนียร์ที่ทำงานมานานเกิน 10 ปี ใช้งาน AI ช่วยเขียนโค้ดเกินครึ่ง ขณะที่โปรแกรมเมอร์จบใหม่ใช้ AI ช่วยเขียนโค้ดเพียง 13% เท่านั้น

แม้ว่าโปรแกรมเมอร์ซีเนียร์จะชอบใช้ AI กันมาก แต่เมื่อถามว่าประหยัดเวลาได้จริงไหมกลับตอบไม่ชัดเจนนัก โดย 59% ระบุว่า AI ช่วยให้ทำงานได้เร็วขึ้นบ้าง และ 30% ระบุว่าเสียเวลานั่งแก้โค้ดจาก AI ก็ยังคุ้ม โดยรวมผู้ตอบแบบสอบถามพบว่าต้องแก้โค้ดจาก AI บ่อยๆ ถึง 65%

Grok Code Fast ขึ้นที่หนึ่ง AI ช่วยเขียนโปรแกรมบน OpenRouter แซงหน้า Claude 4

By lew

on 1 September 2025 - 11:56 Tag: Grok, xAI, LLM, Programming

Grok

Grok Code Fast เพิ่งเปิดตัวมาได้สองวัน แต่ล่าสุดก็ได้รับควาามนิยมสูงมาก จนแซงหน้า Claude 4 Sonnet บน OpenRouter ได้ ด้วยยอดให้บริการถึง 390,000 ล้านโทเค็น แซงหน้า Claude 4 Sonnet ที่ครองอันดับหนึ่งตั้งแต่เปิดตัว

ทาง xAI ไม่ได้เน้นผลการทดสอบมากนัก โดยบอกเพียงว่าผลทดสอบ SWE Bench Verified บางส่วน ได้คะแนน 70.8% ซึ่งคะแนนระดับนี้มักเป็นการใช้ LLM ร่วมกับเฟรมเวิร์ค agentic

[ลือ] Meta AI อาจเปลี่ยนไปใช้โมเดล Gemini/GPT แทน หลัง Llama เริ่มแข่งไม่ได้

By mk

on 31 August 2025 - 09:07 Tag: Llama, Meta AI, Meta, Rumors, Artificial Intelligence, LLM

Llama

เว็บไซต์ข่าว The Information รายงานข้อมูลวงในว่างานแรกๆ ของทีม Meta Superintelligence Labs ที่ตั้งขึ้นใหม่ คือการพิจารณาว่าโมเดล Llama ของ Meta เองนั้นไม่เวิร์ค และบริการของ Meta AI เช่น แชทบอท อาจต้องหันไปใช้โมเดลขององค์กรอื่น เช่น Google Gemini หรือ OpenAI GPT แทน อย่างน้อยก็ใช้ชั่วคราว จนกว่าจะสามารถพัฒนา Llama 5 ให้มีความสามารถทัดเทียมคู่แข่ง

OpenAI เปิดตัวโมเดลตอบโต้เสียงรุ่นใหม่ gpt-realtime เสียงดี ตอบเก่ง ราคาถูกลง

By mk

on 29 August 2025 - 08:54 Tag: OpenAI, LLM, Speech Synthesis

OpenAI

ข่าวโมเดลใหม่ประจำวัน จากบ้าน OpenAI เปิดตัวโมเดลเสียงตอบเสียง (speech-to-speech) ตัวใหม่ gpt-realtime ความสำคัญตามชื่อคือตอบโต้ด้วยเสียงที่ซับซ้อนได้แบบเรียลไทม์ และเก่งกว่าโมเดลแบบเดียวกันรุ่นก่อนๆ

OpenAI บอกว่าเทรนโมเดล gpt-realtime ตามความต้องการของลูกค้าจริงในสถานการณ์จริงต่างๆ เช่น งานบริการลูกค้า ผู้ช่วยส่วนตัว และภาคการศึกษา เพื่อสร้างโมเดลที่เหมาะกับการใช้เป็น voice agent ตอบโจทย์ทั้งแง่คุณภาพเสียง ความฉลาด สามารถปฏิบัติตามคำสั่งได้ไม่แหกกฎ ผลการทดสอบเบนช์มาร์คด้านเสียง Big Bench Audio⁠(opens in a new window) ออกมาดีกว่า gpt-4o-realtime ตัวเก่า

ไมโครซอฟท์โชว์โมเดลพัฒนาเอง MAI-1 เวอร์ชันพรีวิว, โมเดลสร้างเสียง MAI-Voice-1

By mk

on 29 August 2025 - 06:23 Tag: Microsoft AI, Microsoft, LLM, Artificial Intelligence

Microsoft AI

ข่าวโมเดลใหม่รายวัน วันนี้มีหลายตัว เริ่มจาก Microsoft AI ภายใต้การนำของ Mustafa Suleyman เปิดตัวโมเดลที่ไมโครซอฟท์พัฒนาเอง 2 ตัวคือ

กูเกิลออกโมเดลสร้างภาพ Gemini 2.5 Flash Image รวมหลายภาพเป็นภาพเดียวกันได้

By mk

on 26 August 2025 - 22:02 Tag: Nano Banana, Gemini, Google, LLM, Artificial Intelligence

Nano Banana

ข่าวโมเดลใหม่รายวัน วันนี้ขอเสนอ Gemini 2.5 Flash Image (โค้ดเนมภายใน nano-banana) โมเดลสร้างและแก้ไขภาพตัวใหม่ของกูเกิล สามารถนำภาพหลายๆ ภาพมารวมกันเป็นภาพเดียว และอัพเกรดความสามารถทั้งการสั่งแก้ไข-ดัดแปลงภาพด้วยภาษาธรรมชาติ และการรักษาคาแรกเตอร์ในภาพให้คงเส้นคงวา

จากภาพตัวอย่างของกูเกิล เห็นการรวม 3 ภาพเข้าด้วยกันคือ ใบหน้าผู้หญิง ตัวเครื่องโทรศัพท์มือถือ และบันไดทางเดิน รวมแล้วได้ภาพผู้หญิงคนเดียวกันกำลังคุยโทรศัพท์ (แต่มีร่างกายครึ่งตัว ไม่ได้มีเฉพาะใบหน้า) อยู่ในฉากบันไดที่เตรียมไว้ให้

DeepSeek ออกโมเดล V3.1 เพิ่มฟีเจอร์ Hybrid Thinking ประสิทธิภาพใกล้เคียง R1

By mk

on 22 August 2025 - 09:44 Tag: DeepSeek, LLM

DeepSeek

หลังจากเงียบหายไปหลายเดือน DeepSeek กลับมาแล้วกับโมเดลเวอร์ชันใหม่ DeepSeek-V3.1 ที่เพิ่มฟีเจอร์ hybrid thinking mode ใช้โมเดลตัวเดียวเลือกโหมดได้ระหว่าง thinking (สำหรับงาน research) กับ non-thinking (สำหรับงาน chat ทั่วไป)

เดิมทีนั้น โมเดลสายหลักของ DeepSeek คือ V3 ที่พัฒนาต่อจาก V2 แต่เมื่อต้นปีนี้ บริษัทสร้างชื่อในระดับโลก จากโมเดลสาย R1 ที่มี reasoning และทำคะแนนในเบนช์มาร์คต่างๆ ได้สูง

Alibaba ออกโมเดล Qwen-Image-Edit สำหรับแก้ไขรูปภาพโดยเฉพาะ มีความแม่นยำ ลงรายละเอียดระดับข้อความในรูปได้

By arjin

on 20 August 2025 - 20:13 Tag: Qwen, Alibaba Cloud, Artificial Intelligence, LLM

Qwen

Alibaba เปิดตัวโมเดล AI ใหม่ Qwen-Image-Edit ซึ่งเป็นโมเดลย่อยของโมเดล AI สร้างรูปภาพ Qwen-Image ที่เปิดตัวเมื่อต้นเดือน โดยเน้นความสามารถเรื่องการแก้ไขรูปภาพตามชื่อ

จุดเด่นของ Qwen-Image-Edit ที่ Alibaba บอก คือการแก้ไขรูปภาพโดยรักษาสภาพรูปต้นแบบไว้ได้ครบถ้วน จึงเหมาะกับงานสร้างสรรค์ที่ใช้รูปเริ่มต้นด้วยคาแรกเตอร์ลิขสิทธิ์ของผู้ใช้งาน (ดูตัวอย่างท้ายข่าว) มีความแม่นยำในการทำงานเมื่อระบุสิ่งที่ต้องการแก้ไขเช่น เพิ่ม ลบ ปรับเปลี่ยนวัตถุ นอกจากนี้ยังแก้ไขส่วนข้อความตัวหนังสือได้ตรงในภาษาอังกฤษและภาษาจีน ซึ่งเป็นจุดเด่นของโมเดลหลัก Qwen-Image อยู่แล้ว

GPT-5 อัปเดตใหม่ ให้บทสนทนาใน ChatGPT อบอุ่นและเป็นมิตรมากขึ้น หลังคนบ่นว่าจริงจังสั้นห้วนเกินไป

By arjin

on 16 August 2025 - 08:36 Tag: ChatGPT, OpenAI, Artificial Intelligence, Chatbot, LLM

ChatGPT

อัปเดตข่าวสาร ChatGPT ประจำวัน ดูเหมือนประเด็นที่โมเดล GPT-5 ให้บทสนทนาแบบตรงประเด็นและจริงจังเกินไป จนทำให้ผู้ใช้งานจำนวนมากไม่ชอบนัก OpenAI เลยต้องเปิดให้กลับมาใช้โมเดลเก่าได้ด้วย แต่ขณะเดียวกัน OpenAI ก็บอกจะแก้ปัญหานี้ที่ GPT-5 ด้วย

OpenAI บอกว่าได้อัปเดตให้ GPT-5 ตอนนี้มีบทสนทนาที่ดู "อบอุ่นและเป็นมิตรมากขึ้น" จากก่อนหน้านี้การตอบจะดูเป็นทางการ สิ่งที่ผู้ใช้งานจะเห็นรายละเอียดเล็ก ๆ ระหว่างการสนทนา เช่นข้อความอย่าง "เป็นคำถามที่ดี" หรือ "เริ่มต้นได้ดี" โดย OpenAI บอกว่าผลทดสอบไม่พบว่า GPT-5 ใหม่นี้ประจบผู้ใช้งานกว่าเดิม

กูเกิลออก Gemma 3 270M โมเดลขนาดเล็กพิเศษ ประหยัดพลังงาน รันในมือถือได้

By mk

on 15 August 2025 - 06:40 Tag: Gemma, Google, LLM

Gemma

กูเกิลออกโมเดลใหม่ในชุด Gemma 3 คือ Gemma 3 270M ขนาดเล็กพิเศษ (หน่วยเป็น M ไม่ใช่ B) เล็กกว่าโมเดลตัวหลักขนาดพารามิเตอร์ 27B และ Gemma 3n ขนาด 2B สำหรับรันในมือถือ

กูเกิลบอกว่า Gemma 3 270M เป็นโมเดลเฉพาะทางมากๆ (highly specialized) ออกแบบมาเพื่อเป็นโมเดลพื้นฐาน (base model) ที่ขนาดเล็ก แต่ความสามารถสูง (compact and capable) สำหรับนำไป fine-tuned ต่อเพื่องานเฉพาะด้านอีกที

ChatGPT เพิ่มตัวเลือกโหมด Fast และ Thinking บนโมเดล GPT-5 ตามความต้องการเฉพาะของแต่ละคน

By arjin

on 13 August 2025 - 14:13 Tag: ChatGPT, OpenAI, Artificial Intelligence, LLM

ChatGPT

ข่าวสาร ChatGPT บนโมเดล GPT-5 ประจำวันนี้ โดย Sam Altman ซีอีโอ OpenAI พูดถึงฟีเจอร์ใหม่ที่เริ่มทยอยอัปเดตให้ผู้ใช้งานดังนี้

เพิ่มการเลือกโหมด "Auto", "Fast" และ "Thinking" เมื่อใช้งาน GPT-5 โดย Auto เป็นโหมดแนะนำสำหรับผู้ใช้งานทั่วไป
เพิ่มโควต้าการใช้งานโหมด Thinking บน GPT-5 เป็น 3,000 ข้อความต่อสัปดาห์ คิดเป็นโทเค็น 196k ถ้าเกินนั้นจะปรับมาเป็น Thinking mini อีกจำนวนหนึ่ง

Claude 4 Sonnet ขยายอินพุตเป็น 1 ล้านโทเค็น อ่านโค้ดทีเดียว 75,000 บรรทัด

By lew

on 13 August 2025 - 07:43 Tag: Claude, Anthropic, LLM

Claude

Anthropic ประกาศขยายขนาด context ของ Claude 4 Sonnet จากเดิม 200,000 โทเค็น เป็น 1 ล้านโทเค็นรองรับการใช้งานที่ต้องประมวลผลข้อมูลขนาดใหญ่ เช่น อ่านโค้ดจำนวนมากเพื่อทำความเข้าใจภาพรวมโครงการ, วิเคราะห์เอกสารขนาดใหญ่เช่นเอกสารทางกฎหมาย, และการทำงานแบบ Agent ที่ต้องใช้เครื่องมือจำนวนมากๆ

ค่าใช้งานเมื่อใส่ context ใหญ่กว่า 200,0000 โทเค็นจะเป็นราคาใหม่อยู่ที่ 6 ดอลลาร์ต่อล้านโทเค็นสำหรับอินพุต และ 22.50 ดอลลาร์ต่อล้านโทเค็นสำหรับเอาท์พุต โดยได้ส่วนลด prompt caching และ batch processing เหมือนเดิม

Subscribe to LLM