Image

Large Language Model

By mk Founder on Tag: Visual Studio Code, GitHub Copilot, LLM, Programming, IDE
Visual Studio Code

VS Code ออกฟีเจอร์เล็กๆ แต่น่าสนใจคือ Auto Model Selection สลับโมเดลใน GitHub Copilot Chat อัตโนมัติ เพื่อแก้ปัญหาโมเดล (บางตัว) ติดลิมิตการใช้งาน

วิธีการใช้งานคือเลือกโมเดลเป็น Auto แล้ว VS Code จะเลือกสลับโมเดลให้เองระหว่างโมเดลต่างๆ ในระบบ เช่น Claude Sonnet 4, GPT-5, GPT-5 mini โดยจะใช้โมเดลนั้นไปตลอดเซสชันการพูดคุย ไม่มีการสลับโมเดลระหว่างทางให้งง (อย่างน้อยก็ในตอนนี้)

By mk Founder on Tag: Gemma, Google, Research, Google Research, LLM, Privacy
Gemma

ทีมวิจัย Google Research เปิดตัวโมเดล VaultGemma ที่เทรนมาตามแนวทางการรักษาความเป็นส่วนตัวแบบ differential privacy

By mk Founder on Tag: Visual Studio Code, LLM, IDE, Microsoft
Visual Studio Code

VS Code ออกเวอร์ชัน 1.104 (อ่านว่า ร้อยสี่) ประจำรอบเดือนสิงหาคม 2025 มีฟีเจอร์ใหม่ที่น่าสนใจคือ Language Model Chat Provider API เป็น API ที่เปิดทางให้ส่วนขยาย (extension) สามารถให้บริการโมเดลภาษา LLM กับ VS Code ได้ทันที โดยตัวโมเดลจะรันในเครื่องหรือโฮสต์บนคลาวด์ได้

ฟีเจอร์นี้จะทำให้เราสามารถเพิ่มโมเดลลงใน VS Code ด้วยการติดตั้งส่วนขยายได้ "อย่างเป็นระบบ" ตัวอย่างคือ

By arjin Writer on Tag: Qwen, Alibaba Cloud, Artificial Intelligence, LLM
Qwen

Alibaba เปิดตัว Qwen3-Next บอกว่าเป็นโมเดล AI บนสถาปัตยกรรมใหม่ สร้างจากพื้นฐานโมเดล Qwen3 เพื่อปรับปรุงการทำงานใน 2 อย่างได้แก่ ทำให้รองรับอินพุทที่ยาวขึ้น (long-context) และใช้พารามิเตอร์บางส่วนเท่านั้น แม้โมเดลจะมีพารามิเตอร์ขนาดใหญ่ (parameter scaling)

ผลลัพธ์ที่ได้คือโมเดลหลัก Qwen3-Next-80B-A3B-Base ซึ่งขนาดพารามิเตอร์ 80B เมื่อรันขั้นตอน inference จะใช้พารามิเตอร์จริงเพียง 3B เท่านั้น จึงสร้างผลลัพธ์ออกมาได้เร็วกว่าโมเดลเปรียบเทียบ Qwen3-32B ถึง 10 เท่า แม้ภาพรวมจำนวนพารามิเตอร์จะใหญ่กว่า ส่วนการนำไปฝึกฝนต่อก็ใช้ต้นทุนน้อยกว่า 10% เมื่อเทียบด้วยจำนวนชั่วโมงจีพียู ทั้งหมดจึงมีข้อได้เปรียบเทียบเรื่องต้นทุนการประมวลผล

By lew Founder on Tag: Claude, LLM, Programming
Claude

Dmitry Brant วิศวกรของ Wikimedia Foundation รายงานถึงการใช้ Claude Code พอร์ตโค้ดไดร์เวอร์เคอร์เนลลินุกซ์ที่ถูกถอดออกจากเคอร์เนลไปแล้วถึง 20 ปีให้กลับมาใช้งานกับลินุกซ์ล่าสุดได้อีกครั้งโดยใช้เวลาแค่สองวัน

By mk Founder on Tag: Gemma, Google, LLM
Gemma

กูเกิลยังเดินหน้าออกโมเดลขนาดเล็กในตระกูล Gemma ต่อไป หลังจาก Gemma 3 270M ที่เป็นโมเดลตั้งต้นให้นำไปปรับแต่งต่อ ก็ตามมาด้วย EmbeddingGemma โมเดลที่ออกแบบมาสำหรับ on-device AI แบบพร้อมใช้งานทันที

EmbeddingGemma ปรับแต่งมาจาก Gemma 3 อีกที มีขนาดพารามิเตอร์ 308M มีขนาดเล็กพอที่จะทำงานภายใต้แรม 200MB (quantization แล้ว) รันงานในอุปกรณ์แบบออฟไลน์ แต่ถึงแม้ขนาดเล็ก โมเดลมีประสิทธิภาพสูง ตอบเร็ว ทำคะแนนเบนช์มาร์คได้สูงกว่าโมเดลขนาดใกล้เคียงกันตัวอื่นๆ อย่างชัดเจน

By lew Founder on Tag: Z.ai, Artificial Intelligence, LLM, Programming
Z.ai

Z.ai ผู้พัฒนาโมเดลปัญญาประดิษฐ์ GLM ที่เน้นงานเขียนโค้ด เปิดแพ็กเกจรายเดือนแข่งกับ Claude Code โดยชูจุดเด่นราคาถูกกว่าหลายเท่าตัว โดยมีสองแพ็กเกจ ได้แก่

  • GLM Coding Lite ใช้งานได้ 120 พรอมพ์ต่อ 5 ชั่วโมง
  • GLM Coding Pro ใช้งานได้ 600 พรอมพ์ต่อ 5 ชั่วโมง

แนวทางนับ "พรอมพ์" ค่อนข้างต่างจากการขาย API ตามปกติ โดยทาง Z.ai ระบุว่าแต่ละพรอมพ์เทียบเท่ากับการคุยกับปัญญาประดิษฐ์หนึ่งรอบ โดยปัญญาประดิษฐ์สามารถสั่งคำสั่งอื่นๆ เช่น อ่านไฟล์เพิ่มเติม หรือวางแผนการทำงานได้ 15-20 ครั้ง

By lew Founder on Tag: Anthropic, LLM, Funding
Anthropic

Anthropic ผู้สร้างปัญญาประดิษฐ์ Claude ประกาศระดมทุนรอบ F นำโดยกองทุน ICONIQ Capital รวมเงินลงทุน 13,000 ล้านดอลลาร์ มูลค่าบริษัทหลังได้รับเงินลงทุน (post-money) จะมีมูลค่ารวม 183,000 ล้านดอลลาร์ หรือประมาณ 5.9 ล้านล้านบาท การระดมทุนครั้งนี้มีกองทุนใหญ่ๆ ร่วมด้วยจำนวนมาก

ทาง Anthropic ระบุว่ารายได้บริษัทเติบโตขึ้นเร็วมาก นับเฉพาะเดือนสิงหาคมที่ผ่านมามีรายได้เกิน 416 ล้านดอลลาร์ขยายเป็นรายได้ต่อปีเกิน 5,000 ล้านดอลลาร์ และลูกค้าระดับจ่าย 100,000 ดอลลาร์ต่อปีเพิ่มขึ้น 7 เท่าตัว (รายงานตัวเลขเป็น run-rate อนุมานรายได้รายปีจากรายได้ล่าสุด)

By lew Founder on Tag: Fastly, LLM, Programming
Fastly

Fastly บริการ CDN รายใหญ่รายงานผลสำรวจโปรแกรมเมอร์ 791 ราย พบว่าโปรแกรมเมอร์ซีเนียร์ที่ทำงานมานานเกิน 10 ปี ใช้งาน AI ช่วยเขียนโค้ดเกินครึ่ง ขณะที่โปรแกรมเมอร์จบใหม่ใช้ AI ช่วยเขียนโค้ดเพียง 13% เท่านั้น

แม้ว่าโปรแกรมเมอร์ซีเนียร์จะชอบใช้ AI กันมาก แต่เมื่อถามว่าประหยัดเวลาได้จริงไหมกลับตอบไม่ชัดเจนนัก โดย 59% ระบุว่า AI ช่วยให้ทำงานได้เร็วขึ้นบ้าง และ 30% ระบุว่าเสียเวลานั่งแก้โค้ดจาก AI ก็ยังคุ้ม โดยรวมผู้ตอบแบบสอบถามพบว่าต้องแก้โค้ดจาก AI บ่อยๆ ถึง 65%

By lew Founder on Tag: Grok, xAI, LLM, Programming
Grok

Grok Code Fast เพิ่งเปิดตัวมาได้สองวัน แต่ล่าสุดก็ได้รับควาามนิยมสูงมาก จนแซงหน้า Claude 4 Sonnet บน OpenRouter ได้ ด้วยยอดให้บริการถึง 390,000 ล้านโทเค็น แซงหน้า Claude 4 Sonnet ที่ครองอันดับหนึ่งตั้งแต่เปิดตัว

ทาง xAI ไม่ได้เน้นผลการทดสอบมากนัก โดยบอกเพียงว่าผลทดสอบ SWE Bench Verified บางส่วน ได้คะแนน 70.8% ซึ่งคะแนนระดับนี้มักเป็นการใช้ LLM ร่วมกับเฟรมเวิร์ค agentic

By mk Founder on Tag: Llama, Meta AI, Meta, Rumors, Artificial Intelligence, LLM
Llama

เว็บไซต์ข่าว The Information รายงานข้อมูลวงในว่างานแรกๆ ของทีม Meta Superintelligence Labs ที่ตั้งขึ้นใหม่ คือการพิจารณาว่าโมเดล Llama ของ Meta เองนั้นไม่เวิร์ค และบริการของ Meta AI เช่น แชทบอท อาจต้องหันไปใช้โมเดลขององค์กรอื่น เช่น Google Gemini หรือ OpenAI GPT แทน อย่างน้อยก็ใช้ชั่วคราว จนกว่าจะสามารถพัฒนา Llama 5 ให้มีความสามารถทัดเทียมคู่แข่ง

By mk Founder on Tag: OpenAI, LLM, Speech Synthesis
OpenAI

ข่าวโมเดลใหม่ประจำวัน จากบ้าน OpenAI เปิดตัวโมเดลเสียงตอบเสียง (speech-to-speech) ตัวใหม่ gpt-realtime ความสำคัญตามชื่อคือตอบโต้ด้วยเสียงที่ซับซ้อนได้แบบเรียลไทม์ และเก่งกว่าโมเดลแบบเดียวกันรุ่นก่อนๆ

OpenAI บอกว่าเทรนโมเดล gpt-realtime ตามความต้องการของลูกค้าจริงในสถานการณ์จริงต่างๆ เช่น งานบริการลูกค้า ผู้ช่วยส่วนตัว และภาคการศึกษา เพื่อสร้างโมเดลที่เหมาะกับการใช้เป็น voice agent ตอบโจทย์ทั้งแง่คุณภาพเสียง ความฉลาด สามารถปฏิบัติตามคำสั่งได้ไม่แหกกฎ ผลการทดสอบเบนช์มาร์คด้านเสียง Big Bench Audio⁠(opens in a new window) ออกมาดีกว่า gpt-4o-realtime ตัวเก่า

By mk Founder on Tag: Microsoft AI, Microsoft, LLM, Artificial Intelligence
Microsoft AI

ข่าวโมเดลใหม่รายวัน วันนี้มีหลายตัว เริ่มจาก Microsoft AI ภายใต้การนำของ Mustafa Suleyman เปิดตัวโมเดลที่ไมโครซอฟท์พัฒนาเอง 2 ตัวคือ

By mk Founder on Tag: Nano Banana, Gemini, Google, LLM, Artificial Intelligence
Nano Banana

ข่าวโมเดลใหม่รายวัน วันนี้ขอเสนอ Gemini 2.5 Flash Image (โค้ดเนมภายใน nano-banana) โมเดลสร้างและแก้ไขภาพตัวใหม่ของกูเกิล สามารถนำภาพหลายๆ ภาพมารวมกันเป็นภาพเดียว และอัพเกรดความสามารถทั้งการสั่งแก้ไข-ดัดแปลงภาพด้วยภาษาธรรมชาติ และการรักษาคาแรกเตอร์ในภาพให้คงเส้นคงวา

จากภาพตัวอย่างของกูเกิล เห็นการรวม 3 ภาพเข้าด้วยกันคือ ใบหน้าผู้หญิง ตัวเครื่องโทรศัพท์มือถือ และบันไดทางเดิน รวมแล้วได้ภาพผู้หญิงคนเดียวกันกำลังคุยโทรศัพท์ (แต่มีร่างกายครึ่งตัว ไม่ได้มีเฉพาะใบหน้า) อยู่ในฉากบันไดที่เตรียมไว้ให้

By mk Founder on Tag: DeepSeek, LLM
DeepSeek

หลังจากเงียบหายไปหลายเดือน DeepSeek กลับมาแล้วกับโมเดลเวอร์ชันใหม่ DeepSeek-V3.1 ที่เพิ่มฟีเจอร์ hybrid thinking mode ใช้โมเดลตัวเดียวเลือกโหมดได้ระหว่าง thinking (สำหรับงาน research) กับ non-thinking (สำหรับงาน chat ทั่วไป)

เดิมทีนั้น โมเดลสายหลักของ DeepSeek คือ V3 ที่พัฒนาต่อจาก V2 แต่เมื่อต้นปีนี้ บริษัทสร้างชื่อในระดับโลก จากโมเดลสาย R1 ที่มี reasoning และทำคะแนนในเบนช์มาร์คต่างๆ ได้สูง

By arjin Writer on Tag: Qwen, Alibaba Cloud, Artificial Intelligence, LLM
Qwen

Alibaba เปิดตัวโมเดล AI ใหม่ Qwen-Image-Edit ซึ่งเป็นโมเดลย่อยของโมเดล AI สร้างรูปภาพ Qwen-Image ที่เปิดตัวเมื่อต้นเดือน โดยเน้นความสามารถเรื่องการแก้ไขรูปภาพตามชื่อ

จุดเด่นของ Qwen-Image-Edit ที่ Alibaba บอก คือการแก้ไขรูปภาพโดยรักษาสภาพรูปต้นแบบไว้ได้ครบถ้วน จึงเหมาะกับงานสร้างสรรค์ที่ใช้รูปเริ่มต้นด้วยคาแรกเตอร์ลิขสิทธิ์ของผู้ใช้งาน (ดูตัวอย่างท้ายข่าว) มีความแม่นยำในการทำงานเมื่อระบุสิ่งที่ต้องการแก้ไขเช่น เพิ่ม ลบ ปรับเปลี่ยนวัตถุ นอกจากนี้ยังแก้ไขส่วนข้อความตัวหนังสือได้ตรงในภาษาอังกฤษและภาษาจีน ซึ่งเป็นจุดเด่นของโมเดลหลัก Qwen-Image อยู่แล้ว

By arjin Writer on Tag: ChatGPT, OpenAI, Artificial Intelligence, Chatbot, LLM
ChatGPT

อัปเดตข่าวสาร ChatGPT ประจำวัน ดูเหมือนประเด็นที่โมเดล GPT-5 ให้บทสนทนาแบบตรงประเด็นและจริงจังเกินไป จนทำให้ผู้ใช้งานจำนวนมากไม่ชอบนัก OpenAI เลยต้องเปิดให้กลับมาใช้โมเดลเก่าได้ด้วย แต่ขณะเดียวกัน OpenAI ก็บอกจะแก้ปัญหานี้ที่ GPT-5 ด้วย

OpenAI บอกว่าได้อัปเดตให้ GPT-5 ตอนนี้มีบทสนทนาที่ดู "อบอุ่นและเป็นมิตรมากขึ้น" จากก่อนหน้านี้การตอบจะดูเป็นทางการ สิ่งที่ผู้ใช้งานจะเห็นรายละเอียดเล็ก ๆ ระหว่างการสนทนา เช่นข้อความอย่าง "เป็นคำถามที่ดี" หรือ "เริ่มต้นได้ดี" โดย OpenAI บอกว่าผลทดสอบไม่พบว่า GPT-5 ใหม่นี้ประจบผู้ใช้งานกว่าเดิม

By mk Founder on Tag: Gemma, Google, LLM
Gemma

กูเกิลออกโมเดลใหม่ในชุด Gemma 3 คือ Gemma 3 270M ขนาดเล็กพิเศษ (หน่วยเป็น M ไม่ใช่ B) เล็กกว่าโมเดลตัวหลักขนาดพารามิเตอร์ 27B และ Gemma 3n ขนาด 2B สำหรับรันในมือถือ

กูเกิลบอกว่า Gemma 3 270M เป็นโมเดลเฉพาะทางมากๆ (highly specialized) ออกแบบมาเพื่อเป็นโมเดลพื้นฐาน (base model) ที่ขนาดเล็ก แต่ความสามารถสูง (compact and capable) สำหรับนำไป fine-tuned ต่อเพื่องานเฉพาะด้านอีกที

By arjin Writer on Tag: ChatGPT, OpenAI, Artificial Intelligence, LLM
ChatGPT

ข่าวสาร ChatGPT บนโมเดล GPT-5 ประจำวันนี้ โดย Sam Altman ซีอีโอ OpenAI พูดถึงฟีเจอร์ใหม่ที่เริ่มทยอยอัปเดตให้ผู้ใช้งานดังนี้

  • เพิ่มการเลือกโหมด "Auto", "Fast" และ "Thinking" เมื่อใช้งาน GPT-5 โดย Auto เป็นโหมดแนะนำสำหรับผู้ใช้งานทั่วไป
  • เพิ่มโควต้าการใช้งานโหมด Thinking บน GPT-5 เป็น 3,000 ข้อความต่อสัปดาห์ คิดเป็นโทเค็น 196k ถ้าเกินนั้นจะปรับมาเป็น Thinking mini อีกจำนวนหนึ่ง
By lew Founder on Tag: Claude, Anthropic, LLM
Claude

Anthropic ประกาศขยายขนาด context ของ Claude 4 Sonnet จากเดิม 200,000 โทเค็น เป็น 1 ล้านโทเค็นรองรับการใช้งานที่ต้องประมวลผลข้อมูลขนาดใหญ่ เช่น อ่านโค้ดจำนวนมากเพื่อทำความเข้าใจภาพรวมโครงการ, วิเคราะห์เอกสารขนาดใหญ่เช่นเอกสารทางกฎหมาย, และการทำงานแบบ Agent ที่ต้องใช้เครื่องมือจำนวนมากๆ

ค่าใช้งานเมื่อใส่ context ใหญ่กว่า 200,0000 โทเค็นจะเป็นราคาใหม่อยู่ที่ 6 ดอลลาร์ต่อล้านโทเค็นสำหรับอินพุต และ 22.50 ดอลลาร์ต่อล้านโทเค็นสำหรับเอาท์พุต โดยได้ส่วนลด prompt caching และ batch processing เหมือนเดิม

Subscribe to LLM