LLM | Blognone

Large Language Model

IBM เปิดตัวโมเดลภาษา Granite 4.0 Nano รุ่นเล็ก รันในมือถือได้ ประสิทธิภาพดี

By mk

on 1 November 2025 - 14:56 Tag: IBM, LLM, Granite

IBM

IBM เปิดตัวโมเดลภาษา Granite 4.0 Nano เป็นเวอร์ชันไซส์เล็กของ Granite 4.0 ที่เปิดตัวไปก่อนหน้านี้ ลดขนาดพารามิเตอร์ลงจากของเดิมรุ่น Micro 3B ลงมาเหลือ 1B และ 350M ขนาดเล็กพอที่จะรันในสมาร์ทโฟนได้

Windsurf เปิดตัวโมเดลเขียนโค้ด SWE-1.5 ทำงานเร็วกว่า Claude Sonnet 4.5 ถึง 13 เท่า

By mk

on 1 November 2025 - 10:42 Tag: Windsurf, Cognition, Programming, LLM, Cerebras

Windsurf

Windsurf บริการ AI ช่วยเขียนโค้ด (ปัจจุบันเป็นของ บริษัท Cognition เจ้าของบริการแนวเดียวกันชื่อ Devin) เปิดตัวโมเดลช่วยเขียนโค้ดเวอร์ชันใหม่ SWE-1.5 ที่พัฒนาเพิ่มจาก SWE-1 ที่เปิดตัวในเดือนพฤษภาคม 2025)

Cursor 2.0 เปิดตัว ใช้โมเดลพัฒนาเอง Composer ตอบเร็วขึ้น 4 เท่า

By mk

on 30 October 2025 - 06:34 Tag: Cursor, Programming, Artificial Intelligence, LLM

Cursor

Anysphere, Inc. บริษัทเจ้าของ Cursor บริการ AI ช่วยเขียนโค้ดชื่อดัง เปิดตัว Cursor 2.0 มีการเปลี่ยนแปลงสำคัญคือ หันมาใช้โมเดลที่พัฒนาเองชื่อว่า Composer

Anysphere บอกว่าโมเดล Composer มีความเร็วเพิ่มขึ้น 4 เท่า เมื่อเทียบกับโมเดลกลุ่มเดียวกัน เพราะออกแบบมาเพื่อคำนึงถึงความเร็วในการตอบสนอง (latency) โดยยังรักษาคุณภาพของผลลัพธ์ด้านการเขียนโค้ดเอาไว้ในระดับใกล้เคียงกับโมเดลรุ่นท็อปสุด (GPT-5 และ Sonnet 4.5 ที่ยังทำผลลัพธ์ได้ดีกว่า Composer แต่ตอบช้ากว่ามาก)

Anthropic เปิดตัว Claude Haiku 4.5 เขียนโปรแกรมเก่งกว่า Sonnet 4

By lew

on 16 October 2025 - 00:22 Tag: Anthropic, LLM, Claude

Anthropic

Anthropic เปิดตัว Claude Haiku 4.5 โมเดลภาษารุ่นเล็กราคาถูกเน้นทำงานเร็ว หลังจากไม่ได้อัพเดตโมเดลในตระกูลนี้มาพักใหญ่ตั้งแต่ Haiku 3.5 เมื่อปีที่แล้ว จุดเด่นของรอบนี้คือผลทดสอบหลายชุดชนะแม้แต่ Sonnet 4 ที่เพิ่งออกมาห้าเดือนก่อน

เนื่องจากประสิทธิภาพการเขียนโปรแกรมพัฒนาขึ้นมาก และสูงกว่าแม้แต่ Gemini 2.5 Pro แต่ยังแพ้ GPT-5-Codex ไปเล็กน้อย การใช้งานแนวทางหนึ่งคือการใช้ Sonnet 4.5 เป็นตัววางแผนการทำงานภาพรวม แล้วปล่อย Haiku 4.5 แก้ปัญหาย่อยๆ หรืออีกทางหนึ่งคือการทดแทน Sonnet 4 ในแอปพลิเคชั่นเดิมไปเลยก็จะได้ราคาถูกลง

Microsoft ออกโมเดล AI สร้างรูปภาพ MAI-Image-1 ชูจุดเด่นภาพที่สมจริงกว่าคู่แข่ง

By arjin

on 14 October 2025 - 22:16 Tag: Microsoft, Artificial Intelligence, LLM

Microsoft

ไมโครซอฟท์โดยทีม Microsoft AI เปิดตัวโมเดลปัญญาประดิษฐ์ใหม่ MAI-Image-1 ซึ่งเป็นโมเดลที่พัฒนาขึ้นมาเองทั้งหมดในตระกูล MAI ถัดจาก MAI-Voice-1 และ MAI-1-preview ที่ออกมาในเดือนสิงหาคม

MAI-Image-1 เป็นโมเดล AI ที่ทำงานตามชื่อนั่นคือการสร้างรูปภาพจากอินพุทข้อความหรือ text-to-image โดยไมโครซอฟท์ชูจุดเด่นที่ต่างจากโมเดลประเภทเดียวกันของค่ายอื่นคือ ให้คุณค่าที่แท้จริงสำหรับการสร้างสรรค์ ข้อมูลที่นำมาฝึกฝนโมเดลผ่านการคัดเลือกที่เข้มงวด เน้นงานที่ใกล้เคียงสำหรับการใช้งานจริง รวมทั้งให้ความสำคัญการพัฒนา ไม่ให้โมเดลสร้างผลลัพธ์ที่ซ้ำซากหรือมีรูปแบบชัดเจนเกินไป

อยากเป็นคนสั่งบ้าง ไมโครซอฟท์สร้าง AI ทำตัวเป็นผู้สั่ง กลับข้าง AI ทั่วไปที่ถูกฝึกให้ทำตามคำสั่ง

By lew

on 10 October 2025 - 22:39 Tag: Microsoft, Artificial Intelligence, LLM

Microsoft

ไมโครซอฟท์ปล่อยโมเดลปัญญาประดิษฐ์ UserLM-8b โมเดลปัญญาประดิษฐ์แบบ LLM ที่ถูกฝึกแบบพิเศษให้กลับข้างกับโมเดลอื่นๆ โดยมันถูกฝึกให้ออกคำสั่งแทนที่จะเป็นการตอบตามคำสั่งผู้ใช้

ชุดข้อมูลที่ใช้ฝึก UserLM ไม่ต่างจากชุดข้อมูลฝึกปัญญาประดิษฐ์อื่น ที่มักใช้ชุดข้อมูลแชตถามตอบคำถามต่างๆ แต่แทนที่จะฝึกให้อ่านคำสั่งผู้ใช้แล้วเรียนรู้จากคำตอบ UserLM ถูกฝึกกลับข้างให้ทำนายคำสั่งผู้ใช้แทน

IBM ประกาศใช้ Claude เป็นโมเดลเบื้องหลัง IDE ตัวใหม่พลัง AI

By mk

on 9 October 2025 - 13:31 Tag: IBM, Claude, LLM, IDE, Development

IBM

IBM ประกาศเลือกใช้โมเดล Claude ของ Anthropic สำหรับซอฟต์แวร์ IDE ตัวใหม่ที่ชูจุดเด่นเรื่อง AI ช่วยเขียนโค้ด

IBM เรียก IDE ตัวใหม่นี้ว่า new AI-first integrated development environment (IDE) แต่บอกว่าเริ่มทดสอบกับพนักงานภายใน 6,000 คน และลูกค้าบางรายแล้ว โดยเป้าหมายหลักของ IDE ตัวนี้คือการปรับปรุงซอฟต์แวร์เก่าให้ทันสมัย (application modernization) ด้วยความสามารถของ AI ในการสร้างโค้ดขึ้นมาใหม่

กูเกิลเปิดตัว Gemini 2.5 Computer Use ควบคุมเว็บและโทรศัพท์

By lew

on 8 October 2025 - 12:55 Tag: Gemini, LLM

Gemini

กูเกิลปล่อยโมเดลปัญญาประดิษฐ์ Gemini 2.5 Computer Use ปรับแต่งจาก Gemini 2.5 Pro ให้สามารถเข้าใจอินเทอร์เฟซสำหรับมนุษย์ เช่น เว็บหรือแอปพลิเคชั่นบนโทรศัพท์มือถือ

แนวทางการใช้ปัญญาประดิษฐ์ทำงานตามคำสั่งนับเป็นแนวทางสำคัญของงานปัญญาประดิษฐ์ ที่โปรแกรมจำนวนมากยังไม่มี API ให้คอมพิวเตอร์เชื่อมต่อได้โดยง่าย การใช้ AI ในกลุ่ม LLM เข้ามาทำงานแทนจะทำให้งานหลายส่วนกลายเป็นงานอัตโนมัติได้มากขึ้น

IBM เปิดตัว Granite 4.0 โมเดลไฮบริด Transformer-Mamba ใช้แรมน้อยลงมาก

By mk

on 3 October 2025 - 21:01 Tag: IBM, LLM, Artificial Intelligence, Granite

IBM

IBM มีโมเดล LLM ของตัวเองชื่อ Granite มาสักพักใหญ่ๆ และล่าสุดเปิดตัว Granite 4.0 ซึ่ง IBM เรียกว่ามันคือ hybrid models for enterprise

เหตุผลที่ Granite 4.0 นิยามตัวเองว่า hybrid model เพราะมันใช้สถาปัตยกรรม transformer (แบบที่โมเดลอื่นๆ ใช้กัน) ผสมผสานกับสถาปัตยกรรม Mamba-2 ที่มีวิธีทำงานแตกต่างออกไป ใช้ทรัพยากรน้อยกว่าในการประมวลผล

บริษัทความปลอดภัยซอฟต์แวร์ FOSSA เปิดตัวปัญญาประดิษฐ์ fossabot บอตช่วยอัพเดตไลบรารีอัตโนมัติ

By lew

on 2 October 2025 - 22:58 Tag: Security, Programming, LLM

Security

FOSSA บริการช่วยตรวจสอบการใช้งานซอฟต์แวร์โอเพนซอร์สทั้งด้านความปลอดภัยและไลเซนส์ เปิดตัว fossabot บอตอัพเดตโค้ดเมื่อได้รับแจ้งว่าโครงการใช้ไลบรารีเก่าหรือมีช่องโหว่

AWS เปิดบริการ Bedrock เรียกใช้ LLM แบบคิดรายโทเค็นในไทย ยังใช้ได้เฉพาะ Amazon Nova

By lew

on 1 October 2025 - 19:41 Tag: AWS, LLM, Thailand

AWS

AWS ขยายบริการ Amazon Bedrock บริการเรียกใช้ปัญญาประดิษฐ์ LLM มาอีกสามภูมิภาค ได้แก่ ไทย, มาเลเซีย, และไต้หวัน เปิดทางให้ผู้ใช้สามารถเรียกใช้งานปัญญาประดิษฐ์ได้โดยไม่ต้องส่งข้อมูลออกนอกประเทศ

ตอนนี้หน้าประกาศราคาของ Amazon Bedrock ยังแสดงราคาเฉพาะ Amazon Nova Lite ที่พัฒนาโดย Amazon เอง โมเดลอื่นที่ได้รับความนิยมใน Bedrock เช่น DeepSeek, Qwen, หรือ Llama ตลอดจนโมเดลเปิดอย่าง Claude ยังไม่ขยายมาด้วย แต่ทั้งนี้ภูมิภาคมาเลเซียและไต้หวันก็ยังเป็นแบบเดียวกัน ระหว่างนี้อาจจะต้องรอให้โมเดลอื่นๆ ตามมาอีกครั้ง

OpenAI อัปเดตโมเดล Sora 2 สำหรับสร้างวิดีโอจาก AI แม่นยำขึ้น สมจริงขึ้น ควบคุมได้มากขึ้น

By arjin

on 1 October 2025 - 10:41 Tag: OpenAI, Sora, Artificial Intelligence, LLM

OpenAI

OpenAI เปิดตัว Sora 2 โมเดลปัญญาประดิษฐ์สร้างวิดีโอเวอร์ชันใหม่ ที่บอกว่ามีการเคลื่อนไหวที่แม่นยำขึ้น, สมจริงขึ้น และควบคุมผลลัพธ์ได้ดีกว่าเวอร์ชันแรก นอกจากนี้ยังใส่ความสามารถการขยับตามบทสนทนาและเสียงประกอบด้วย

OpenAI บอกว่าในตอนเปิดตัว Sora รุ่นแรกเมื่อปีที่แล้ว เหตุการณ์นั้นเหมือนกับการออก GPT-1 ทุกอย่างยังเป็นเรื่องใหม่ การทำงานยังไม่สมบูรณ์นัก แต่มองว่า Sora 2 กำลังเป็น GPT-3.5 ที่ความสามารถทำให้ทุกคนพบต้องรู้สึกทึ่ง

เปิดตัว Claude Sonnet 4.5 เขียนโค้ดเก่งกว่าเดิมอีกขั้น, เปิด Claude Agent SDK ให้ใช้งาน

By mk

on 30 September 2025 - 07:20 Tag: Claude, LLM, Anthropic, Artificial Intelligence

Claude

Anthropic เปิดตัว Claude Sonnet 4.5 โมเดลตัวแรกในซีรีส์ Claude 4.5 โดยเป็นโมเดลไซส์กลาง (Sonnet) ยังไม่ใช่ รุ่นใหญ่สุด (Opus) ที่เพิ่งออกเวอร์ชัน 4.1 เมื่อเดือนที่แล้ว

จุดเด่นของ Claude Sonnet 4.5 คือยกระดับความสามารถด้านการเขียนโค้ดขึ้นไปอีกขั้น ทำคะแนนเบนช์มาร์คด้านการเขียนโค้ด SWE-bench Verified ได้ 77.2% (Opus 4.1 ทำได้ 74.5%, Sonnet 4 ทำได้ 72.7%) และถ้าเปิดโหมด parallel test-time compute (ทำงานแบบให้เหตุผล reasoning หลายแบบเพื่อหาวิธีที่ดีที่สุด) คะแนนจะขึ้นไปเป็น 82% แถมยังทำงานแก้ปัญหายากๆ ได้ต่อเนื่องนานถึง 30 ชั่วโมง

อัพเดตโมเดล Gemini 2.5 Flash และ Flash Lite ฉลาดขึ้น ตอบเร็วขึ้น ประหยัด token กว่าเดิม

By mk

on 27 September 2025 - 07:43 Tag: Gemini, LLM, Google

Gemini

กูเกิลอัพเดตโมเดล Gemini 2.5 Flash และ Gemini 2.5 Flash Lite เป็นเวอร์ชันย่อย 09-2025 ที่ฉลาดขึ้นกว่าเดิม และตอบเร็วขึ้นกว่าเดิมด้วย

กูเกิลบอกว่าโมเดลเวอร์ชันอัพเดต จะช่วยแนะนำขั้นตอนทำการบ้านได้ดีขึ้น, ข้อความคำตอบเป็นโครงสร้าง จัดระเบียบข้อความดีขึ้น ใช้หัวข้อ ลิสต์ ตาราง ประกอบมากขึ้น, เข้าใจรูปภาพดีขึ้น, ถอดเสียงพูดได้แม่นยำ, แปลภาษาได้ดีขึ้น

โมเดลนี้ยังบริหาร output token ได้ดีขึ้นสูงสุด 2 เท่าในบางกรณี (โดยเฉพาะ Flash Lite) คำตอบตรงประเด็นมากขึ้นไม่เยิ่นเย้อ การเช่าใช้งานโมเดลจึงประหยัดกว่าเดิมด้วย

กูเกิลปล่อย Chrome DevTools MCP เปิดทางใช้ AI แก้ปัญหาเว็บ

By lew

on 26 September 2025 - 13:24 Tag: Chrome, LLM, MCP, Browser, Google

Chrome

กูเกิลปล่อย Chrome DevTools MCP ให้แอปปัญญาประดิษฐ์ เช่น Gemini, Claude, Cursor, หรือ Copilot สั่งงานเบราว์เซอร์ได้โดยตรง สำหรับพัฒนาที่ AI สามารถมองเห็นปัญหาและแก้ไขได้โดยตรง

การใช้งานอาจจะไม่ซับซ้อนเช่น สั่งให้ AI ตรวจว่าเว็บที่ได้ตรงกับงานที่สั่งหรือไม่ หรืออาจจะซับซ้อนขึ้น เช่น การแก้ปัญหา CORS หรือแม้แต่ปัญหาเว็บช้า เพราะตัว MCP เปิดให้ AI เข้าถึงฟีเจอร์ต่างๆ ของ DevTools ได้

การใช้งานเพียงเรียก chrome-devtools-mcp@latest เท่านั้น

ที่มา - Chrome Developer Blog

Alibaba อัปเดตโมเดลตระกูล Qwen3 ชุดใหญ่ ทั้งงาน Visual, Translation จนถึงโมเดลยักษ์ 1T พารามิเตอร์

By arjin

on 24 September 2025 - 15:40 Tag: Qwen, Alibaba Cloud, Artificial Intelligence, LLM

Qwen

Alibaba ออกโมเดลปัญญาประดิษฐ์ใหม่ชุดใหญ่ในซีรีส์ Qwen3 ซึ่งทั้งหมดเป็นโมเดลโอเพนซอร์ส มีรายละเอียดดังนี้

Qwen3-VL โมเดลที่สามารถเข้าใจรูปภาพ-ข้อความ โมเดลหลักคือ Qwen3-VL-235B-A22B ทำงานได้ทั้งโหมด Instruct และ Thinking ผลทดสอบคะแนนดีกว่า Gemini 2.5 Pro

จุดเด่นของ Qwen3-VL คือทำงานบนสมาร์ทโฟนได้ดี, สามารถแปลงภาพจับหน้าจอ เขียนออกมาเป็นโค้ดได้, OCR รองรับ 32 ภาษา, context 256K สเกลได้ถึง 1M, ทำความเข้าใจภาพได้ทั้ง 2D และ 3D ฯลฯ

Alibaba ออก Qwen3-Omni โมเดลอินพุทผสมผสานรุ่นใหม่ รองรับอินพุทภาพ เสียง วิดีโอ และข้อความ

By arjin

on 23 September 2025 - 17:30 Tag: Qwen, Alibaba Cloud, Alibaba, LLM, Artificial Intelligence

Qwen

Alibaba เปิดตัว Qwen3-Omni โมเดลโอเพนซอร์สในตระกูล Qwen3 ที่รองรับอินพุทผสมผสานทั้งข้อความ ภาพ เสียง วิดีโอ รุ่นถัดจาก Qwen2.5-Omni โดยสามารถสร้างเอาท์พุตได้ทั้งข้อความและเสียง โมเดลทำงานบนสถาปัตยกรรมที่เรียกว่า Thinker–Talker โดยส่วน Thinker สามารถทำความเข้าใจอินพุทที่หลากหลาย ส่วน Talker มีความสามารถการสร้างเสียงโต้ตอบที่เป็นธรรมชาติ

จุดเด่นของ Qwen3-Omni มีหลายอย่าง ทั้งการทำคะแนนสูงสุดในการทดสอบผลลัพธ์เสียง 22 จาก 36 หัวข้อ, รองรับการสร้างเอาท์พุทข้อความ 119 ภาษา, เข้าใจเสียงได้ 19 ภาษา (ไม่มีไทย) และสร้างเสียงโต้ตอบได้ 10 ภาษา (ไม่มีไทย), ความหน่วงต่ำถึง 211ms กรณีอินพุทแบบเสียง, รับอินพุทไฟล์เสียงสูงสุด 30 นาที ฯลฯ

xAI เปิดตัว Grok 4 Fast เน้นต้นทุนค่ารันต่ำกว่า Grok 4 มาก แต่ประสิทธิภาพลดไม่มาก

By mk

on 20 September 2025 - 09:15 Tag: Grok, xAI, LLM

Grok

xAI เปิดตัว Grok 4 Fast โมเดลรุ่นเล็กของตระกูล Grok 4 ที่ก่อนหน้านี้มี Grok 4 เฉยๆ กับ Grok 4 Heavy

จุดเด่นของ Grok 4 Fast คือต้นทุนค่ารัน และความรวดเร็วในการตอบ โดยยังคงความสามารถด้าน reasoning ไว้ได้ (เลือกได้ว่าจะเปิด reasoning หรือไม่ด้วย) โมเดลรองรับ context window ขนาดใหญ่ 2M และทำผลงานเบนช์มาร์คได้ดีกว่าคู่แข่งสายตรง GPT-5 Mini แถมยังเป็นรอง GPT-5 ไม่มากด้วย

Amazon Bedrock เพิ่มโมเดลค่ายจีน Alibaba Qwen และ DeepSeek-V3.1

By mk

on 19 September 2025 - 11:05 Tag: AWS, Amazon, LLM, Qwen, DeepSeek

AWS

AWS ประกาศนำโมเดลค่ายจีน 2 ค่ายคือ Alibaba Qwen และ DeepSeek มาให้บริการบน Amazon Bedrock

กรณีของ Qwen ถือเป็นครั้งแรกที่ Bedrock มีให้บริการ เบื้องต้นมีโมเดลให้ใช้ 4 ตัวคือ

Qwen3-Coder-480B-A35B-Instruct
Qwen3-Coder-30B-A3B-Instruct
Qwen3-235B-A22B-Instruct-2507
Qwen3-32B (Dense)

ส่วน DeepSeek นั้นเดิม Bedrock มีให้บริการ DeepSeek-R1 โมเดลกลุ่ม reasoning อยู่ก่อนแล้ว ตอนนี้ขยายมายัง DeepSeek-V3.1 โมเดลสายหลักตัวล่าสุด ด้วย

OpenAI และ DeepMind ได้เหรียญทองการแข่งเขียนโปรแกรมระดับมหาวิทยาลัย ICPC

By lew

on 18 September 2025 - 11:27 Tag: LLM, Programming, Artificial Intelligence, DeepMind, OpenAI

LLM

OpenAI และ DeepMind ได้เหรียญทองการแข่งเขียนโปรแกรมระดับมหาวิทยาลัย International Collegiate Programming Contest (ICPC) ประจำปีนี้ ทั้ง OpenAI และ DeepMind ก็ส่งปัญญาประดิษฐ์ของตัวเองเข้าร่วมแข่งขันและได้เหรียญทองทั้งคู่ แต่เมื่อนับคะแนน OpenAI ได้เต็ม 12/12 แต่ DeepMind ได้ 10/12 ขณะที่ทีมนักศึกษานั้นได้สูงสุดที่ 11/12

ทั้งสองบริษัทไม่ได้ส่งโมเดลรุ่นที่วางขายเข้าแข่งขัน แต่เป็นรุ่นพิเศษ ฝั่ง DeepMind ระบุว่าเป็น Gemini 2.5 Deep Think รุ่นพิเศษ สามารถแก้ปัญหา 8 ข้อแรกได้ภายในเวลา 45 นาทีเท่านั้น และแก้ 10 ข้อได้ในสามชั่วโมง

Subscribe to LLM