Image

Large Language Model

By mk Founder on Tag: IBM, LLM, Granite
IBM

IBM เปิดตัวโมเดลภาษา Granite 4.0 Nano เป็นเวอร์ชันไซส์เล็กของ Granite 4.0 ที่เปิดตัวไปก่อนหน้านี้ ลดขนาดพารามิเตอร์ลงจากของเดิมรุ่น Micro 3B ลงมาเหลือ 1B และ 350M ขนาดเล็กพอที่จะรันในสมาร์ทโฟนได้

By mk Founder on Tag: Windsurf, Cognition, Programming, LLM, Cerebras
Windsurf

Windsurf บริการ AI ช่วยเขียนโค้ด (ปัจจุบันเป็นของ บริษัท Cognition เจ้าของบริการแนวเดียวกันชื่อ Devin) เปิดตัวโมเดลช่วยเขียนโค้ดเวอร์ชันใหม่ SWE-1.5 ที่พัฒนาเพิ่มจาก SWE-1 ที่เปิดตัวในเดือนพฤษภาคม 2025)

By mk Founder on Tag: Cursor, Programming, Artificial Intelligence, LLM
Cursor

Anysphere, Inc. บริษัทเจ้าของ Cursor บริการ AI ช่วยเขียนโค้ดชื่อดัง เปิดตัว Cursor 2.0 มีการเปลี่ยนแปลงสำคัญคือ หันมาใช้โมเดลที่พัฒนาเองชื่อว่า Composer

Anysphere บอกว่าโมเดล Composer มีความเร็วเพิ่มขึ้น 4 เท่า เมื่อเทียบกับโมเดลกลุ่มเดียวกัน เพราะออกแบบมาเพื่อคำนึงถึงความเร็วในการตอบสนอง (latency) โดยยังรักษาคุณภาพของผลลัพธ์ด้านการเขียนโค้ดเอาไว้ในระดับใกล้เคียงกับโมเดลรุ่นท็อปสุด (GPT-5 และ Sonnet 4.5 ที่ยังทำผลลัพธ์ได้ดีกว่า Composer แต่ตอบช้ากว่ามาก)

By lew Founder on Tag: Anthropic, LLM, Claude
Anthropic

Anthropic เปิดตัว Claude Haiku 4.5 โมเดลภาษารุ่นเล็กราคาถูกเน้นทำงานเร็ว หลังจากไม่ได้อัพเดตโมเดลในตระกูลนี้มาพักใหญ่ตั้งแต่ Haiku 3.5 เมื่อปีที่แล้ว จุดเด่นของรอบนี้คือผลทดสอบหลายชุดชนะแม้แต่ Sonnet 4 ที่เพิ่งออกมาห้าเดือนก่อน

เนื่องจากประสิทธิภาพการเขียนโปรแกรมพัฒนาขึ้นมาก และสูงกว่าแม้แต่ Gemini 2.5 Pro แต่ยังแพ้ GPT-5-Codex ไปเล็กน้อย การใช้งานแนวทางหนึ่งคือการใช้ Sonnet 4.5 เป็นตัววางแผนการทำงานภาพรวม แล้วปล่อย Haiku 4.5 แก้ปัญหาย่อยๆ หรืออีกทางหนึ่งคือการทดแทน Sonnet 4 ในแอปพลิเคชั่นเดิมไปเลยก็จะได้ราคาถูกลง

By arjin Writer on Tag: Microsoft, Artificial Intelligence, LLM
Microsoft

ไมโครซอฟท์โดยทีม Microsoft AI เปิดตัวโมเดลปัญญาประดิษฐ์ใหม่ MAI-Image-1 ซึ่งเป็นโมเดลที่พัฒนาขึ้นมาเองทั้งหมดในตระกูล MAI ถัดจาก MAI-Voice-1 และ MAI-1-preview ที่ออกมาในเดือนสิงหาคม

MAI-Image-1 เป็นโมเดล AI ที่ทำงานตามชื่อนั่นคือการสร้างรูปภาพจากอินพุทข้อความหรือ text-to-image โดยไมโครซอฟท์ชูจุดเด่นที่ต่างจากโมเดลประเภทเดียวกันของค่ายอื่นคือ ให้คุณค่าที่แท้จริงสำหรับการสร้างสรรค์ ข้อมูลที่นำมาฝึกฝนโมเดลผ่านการคัดเลือกที่เข้มงวด เน้นงานที่ใกล้เคียงสำหรับการใช้งานจริง รวมทั้งให้ความสำคัญการพัฒนา ไม่ให้โมเดลสร้างผลลัพธ์ที่ซ้ำซากหรือมีรูปแบบชัดเจนเกินไป

By lew Founder on Tag: Microsoft, Artificial Intelligence, LLM
Microsoft

ไมโครซอฟท์ปล่อยโมเดลปัญญาประดิษฐ์ UserLM-8b โมเดลปัญญาประดิษฐ์แบบ LLM ที่ถูกฝึกแบบพิเศษให้กลับข้างกับโมเดลอื่นๆ โดยมันถูกฝึกให้ออกคำสั่งแทนที่จะเป็นการตอบตามคำสั่งผู้ใช้

ชุดข้อมูลที่ใช้ฝึก UserLM ไม่ต่างจากชุดข้อมูลฝึกปัญญาประดิษฐ์อื่น ที่มักใช้ชุดข้อมูลแชตถามตอบคำถามต่างๆ แต่แทนที่จะฝึกให้อ่านคำสั่งผู้ใช้แล้วเรียนรู้จากคำตอบ UserLM ถูกฝึกกลับข้างให้ทำนายคำสั่งผู้ใช้แทน

By mk Founder on Tag: IBM, Claude, LLM, IDE, Development
IBM

IBM ประกาศเลือกใช้โมเดล Claude ของ Anthropic สำหรับซอฟต์แวร์ IDE ตัวใหม่ที่ชูจุดเด่นเรื่อง AI ช่วยเขียนโค้ด

IBM เรียก IDE ตัวใหม่นี้ว่า new AI-first integrated development environment (IDE) แต่บอกว่าเริ่มทดสอบกับพนักงานภายใน 6,000 คน และลูกค้าบางรายแล้ว โดยเป้าหมายหลักของ IDE ตัวนี้คือการปรับปรุงซอฟต์แวร์เก่าให้ทันสมัย (application modernization) ด้วยความสามารถของ AI ในการสร้างโค้ดขึ้นมาใหม่

By lew Founder on Tag: Gemini, LLM
Gemini

กูเกิลปล่อยโมเดลปัญญาประดิษฐ์ Gemini 2.5 Computer Use ปรับแต่งจาก Gemini 2.5 Pro ให้สามารถเข้าใจอินเทอร์เฟซสำหรับมนุษย์ เช่น เว็บหรือแอปพลิเคชั่นบนโทรศัพท์มือถือ

แนวทางการใช้ปัญญาประดิษฐ์ทำงานตามคำสั่งนับเป็นแนวทางสำคัญของงานปัญญาประดิษฐ์ ที่โปรแกรมจำนวนมากยังไม่มี API ให้คอมพิวเตอร์เชื่อมต่อได้โดยง่าย การใช้ AI ในกลุ่ม LLM เข้ามาทำงานแทนจะทำให้งานหลายส่วนกลายเป็นงานอัตโนมัติได้มากขึ้น

By mk Founder on Tag: IBM, LLM, Artificial Intelligence, Granite
IBM

IBM มีโมเดล LLM ของตัวเองชื่อ Granite มาสักพักใหญ่ๆ และล่าสุดเปิดตัว Granite 4.0 ซึ่ง IBM เรียกว่ามันคือ hybrid models for enterprise

เหตุผลที่ Granite 4.0 นิยามตัวเองว่า hybrid model เพราะมันใช้สถาปัตยกรรม transformer (แบบที่โมเดลอื่นๆ ใช้กัน) ผสมผสานกับสถาปัตยกรรม Mamba-2 ที่มีวิธีทำงานแตกต่างออกไป ใช้ทรัพยากรน้อยกว่าในการประมวลผล

By lew Founder on Tag: Security, Programming, LLM
Security

FOSSA บริการช่วยตรวจสอบการใช้งานซอฟต์แวร์โอเพนซอร์สทั้งด้านความปลอดภัยและไลเซนส์ เปิดตัว fossabot บอตอัพเดตโค้ดเมื่อได้รับแจ้งว่าโครงการใช้ไลบรารีเก่าหรือมีช่องโหว่

By lew Founder on Tag: AWS, LLM, Thailand
AWS

AWS ขยายบริการ Amazon Bedrock บริการเรียกใช้ปัญญาประดิษฐ์ LLM มาอีกสามภูมิภาค ได้แก่ ไทย, มาเลเซีย, และไต้หวัน เปิดทางให้ผู้ใช้สามารถเรียกใช้งานปัญญาประดิษฐ์ได้โดยไม่ต้องส่งข้อมูลออกนอกประเทศ

ตอนนี้หน้าประกาศราคาของ Amazon Bedrock ยังแสดงราคาเฉพาะ Amazon Nova Lite ที่พัฒนาโดย Amazon เอง โมเดลอื่นที่ได้รับความนิยมใน Bedrock เช่น DeepSeek, Qwen, หรือ Llama ตลอดจนโมเดลเปิดอย่าง Claude ยังไม่ขยายมาด้วย แต่ทั้งนี้ภูมิภาคมาเลเซียและไต้หวันก็ยังเป็นแบบเดียวกัน ระหว่างนี้อาจจะต้องรอให้โมเดลอื่นๆ ตามมาอีกครั้ง

By arjin Writer on Tag: OpenAI, Sora, Artificial Intelligence, LLM
OpenAI

OpenAI เปิดตัว Sora 2 โมเดลปัญญาประดิษฐ์สร้างวิดีโอเวอร์ชันใหม่ ที่บอกว่ามีการเคลื่อนไหวที่แม่นยำขึ้น, สมจริงขึ้น และควบคุมผลลัพธ์ได้ดีกว่าเวอร์ชันแรก นอกจากนี้ยังใส่ความสามารถการขยับตามบทสนทนาและเสียงประกอบด้วย

OpenAI บอกว่าในตอนเปิดตัว Sora รุ่นแรกเมื่อปีที่แล้ว เหตุการณ์นั้นเหมือนกับการออก GPT-1 ทุกอย่างยังเป็นเรื่องใหม่ การทำงานยังไม่สมบูรณ์นัก แต่มองว่า Sora 2 กำลังเป็น GPT-3.5 ที่ความสามารถทำให้ทุกคนพบต้องรู้สึกทึ่ง

By mk Founder on Tag: Claude, LLM, Anthropic, Artificial Intelligence
Claude

Anthropic เปิดตัว Claude Sonnet 4.5 โมเดลตัวแรกในซีรีส์ Claude 4.5 โดยเป็นโมเดลไซส์กลาง (Sonnet) ยังไม่ใช่ รุ่นใหญ่สุด (Opus) ที่เพิ่งออกเวอร์ชัน 4.1 เมื่อเดือนที่แล้ว

จุดเด่นของ Claude Sonnet 4.5 คือยกระดับความสามารถด้านการเขียนโค้ดขึ้นไปอีกขั้น ทำคะแนนเบนช์มาร์คด้านการเขียนโค้ด SWE-bench Verified ได้ 77.2% (Opus 4.1 ทำได้ 74.5%, Sonnet 4 ทำได้ 72.7%) และถ้าเปิดโหมด parallel test-time compute (ทำงานแบบให้เหตุผล reasoning หลายแบบเพื่อหาวิธีที่ดีที่สุด) คะแนนจะขึ้นไปเป็น 82% แถมยังทำงานแก้ปัญหายากๆ ได้ต่อเนื่องนานถึง 30 ชั่วโมง

By mk Founder on Tag: Gemini, LLM, Google
Gemini

กูเกิลอัพเดตโมเดล Gemini 2.5 Flash และ Gemini 2.5 Flash Lite เป็นเวอร์ชันย่อย 09-2025 ที่ฉลาดขึ้นกว่าเดิม และตอบเร็วขึ้นกว่าเดิมด้วย

กูเกิลบอกว่าโมเดลเวอร์ชันอัพเดต จะช่วยแนะนำขั้นตอนทำการบ้านได้ดีขึ้น, ข้อความคำตอบเป็นโครงสร้าง จัดระเบียบข้อความดีขึ้น ใช้หัวข้อ ลิสต์ ตาราง ประกอบมากขึ้น, เข้าใจรูปภาพดีขึ้น, ถอดเสียงพูดได้แม่นยำ, แปลภาษาได้ดีขึ้น

โมเดลนี้ยังบริหาร output token ได้ดีขึ้นสูงสุด 2 เท่าในบางกรณี (โดยเฉพาะ Flash Lite) คำตอบตรงประเด็นมากขึ้นไม่เยิ่นเย้อ การเช่าใช้งานโมเดลจึงประหยัดกว่าเดิมด้วย

By lew Founder on Tag: Chrome, LLM, MCP, Browser, Google
Chrome

กูเกิลปล่อย Chrome DevTools MCP ให้แอปปัญญาประดิษฐ์ เช่น Gemini, Claude, Cursor, หรือ Copilot สั่งงานเบราว์เซอร์ได้โดยตรง สำหรับพัฒนาที่ AI สามารถมองเห็นปัญหาและแก้ไขได้โดยตรง

การใช้งานอาจจะไม่ซับซ้อนเช่น สั่งให้ AI ตรวจว่าเว็บที่ได้ตรงกับงานที่สั่งหรือไม่ หรืออาจจะซับซ้อนขึ้น เช่น การแก้ปัญหา CORS หรือแม้แต่ปัญหาเว็บช้า เพราะตัว MCP เปิดให้ AI เข้าถึงฟีเจอร์ต่างๆ ของ DevTools ได้

การใช้งานเพียงเรียก chrome-devtools-mcp@latest เท่านั้น

ที่มา - Chrome Developer Blog

By arjin Writer on Tag: Qwen, Alibaba Cloud, Artificial Intelligence, LLM
Qwen

Alibaba ออกโมเดลปัญญาประดิษฐ์ใหม่ชุดใหญ่ในซีรีส์ Qwen3 ซึ่งทั้งหมดเป็นโมเดลโอเพนซอร์ส มีรายละเอียดดังนี้

Qwen3-VL โมเดลที่สามารถเข้าใจรูปภาพ-ข้อความ โมเดลหลักคือ Qwen3-VL-235B-A22B ทำงานได้ทั้งโหมด Instruct และ Thinking ผลทดสอบคะแนนดีกว่า Gemini 2.5 Pro

จุดเด่นของ Qwen3-VL คือทำงานบนสมาร์ทโฟนได้ดี, สามารถแปลงภาพจับหน้าจอ เขียนออกมาเป็นโค้ดได้, OCR รองรับ 32 ภาษา, context 256K สเกลได้ถึง 1M, ทำความเข้าใจภาพได้ทั้ง 2D และ 3D ฯลฯ

By arjin Writer on Tag: Qwen, Alibaba Cloud, Alibaba, LLM, Artificial Intelligence
Qwen

Alibaba เปิดตัว Qwen3-Omni โมเดลโอเพนซอร์สในตระกูล Qwen3 ที่รองรับอินพุทผสมผสานทั้งข้อความ ภาพ เสียง วิดีโอ รุ่นถัดจาก Qwen2.5-Omni โดยสามารถสร้างเอาท์พุตได้ทั้งข้อความและเสียง โมเดลทำงานบนสถาปัตยกรรมที่เรียกว่า Thinker–Talker โดยส่วน Thinker สามารถทำความเข้าใจอินพุทที่หลากหลาย ส่วน Talker มีความสามารถการสร้างเสียงโต้ตอบที่เป็นธรรมชาติ

จุดเด่นของ Qwen3-Omni มีหลายอย่าง ทั้งการทำคะแนนสูงสุดในการทดสอบผลลัพธ์เสียง 22 จาก 36 หัวข้อ, รองรับการสร้างเอาท์พุทข้อความ 119 ภาษา, เข้าใจเสียงได้ 19 ภาษา (ไม่มีไทย) และสร้างเสียงโต้ตอบได้ 10 ภาษา (ไม่มีไทย), ความหน่วงต่ำถึง 211ms กรณีอินพุทแบบเสียง, รับอินพุทไฟล์เสียงสูงสุด 30 นาที ฯลฯ

By mk Founder on Tag: Grok, xAI, LLM
Grok

xAI เปิดตัว Grok 4 Fast โมเดลรุ่นเล็กของตระกูล Grok 4 ที่ก่อนหน้านี้มี Grok 4 เฉยๆ กับ Grok 4 Heavy

จุดเด่นของ Grok 4 Fast คือต้นทุนค่ารัน และความรวดเร็วในการตอบ โดยยังคงความสามารถด้าน reasoning ไว้ได้ (เลือกได้ว่าจะเปิด reasoning หรือไม่ด้วย) โมเดลรองรับ context window ขนาดใหญ่ 2M และทำผลงานเบนช์มาร์คได้ดีกว่าคู่แข่งสายตรง GPT-5 Mini แถมยังเป็นรอง GPT-5 ไม่มากด้วย

By mk Founder on Tag: AWS, Amazon, LLM, Qwen, DeepSeek
AWS

AWS ประกาศนำโมเดลค่ายจีน 2 ค่ายคือ Alibaba Qwen และ DeepSeek มาให้บริการบน Amazon Bedrock

กรณีของ Qwen ถือเป็นครั้งแรกที่ Bedrock มีให้บริการ เบื้องต้นมีโมเดลให้ใช้ 4 ตัวคือ

  • Qwen3-Coder-480B-A35B-Instruct
  • Qwen3-Coder-30B-A3B-Instruct
  • Qwen3-235B-A22B-Instruct-2507
  • Qwen3-32B (Dense)

ส่วน DeepSeek นั้นเดิม Bedrock มีให้บริการ DeepSeek-R1 โมเดลกลุ่ม reasoning อยู่ก่อนแล้ว ตอนนี้ขยายมายัง DeepSeek-V3.1 โมเดลสายหลักตัวล่าสุด ด้วย

By lew Founder on Tag: LLM, Programming, Artificial Intelligence, DeepMind, OpenAI
LLM

OpenAI และ DeepMind ได้เหรียญทองการแข่งเขียนโปรแกรมระดับมหาวิทยาลัย International Collegiate Programming Contest (ICPC) ประจำปีนี้ ทั้ง OpenAI และ DeepMind ก็ส่งปัญญาประดิษฐ์ของตัวเองเข้าร่วมแข่งขันและได้เหรียญทองทั้งคู่ แต่เมื่อนับคะแนน OpenAI ได้เต็ม 12/12 แต่ DeepMind ได้ 10/12 ขณะที่ทีมนักศึกษานั้นได้สูงสุดที่ 11/12

ทั้งสองบริษัทไม่ได้ส่งโมเดลรุ่นที่วางขายเข้าแข่งขัน แต่เป็นรุ่นพิเศษ ฝั่ง DeepMind ระบุว่าเป็น Gemini 2.5 Deep Think รุ่นพิเศษ สามารถแก้ปัญหา 8 ข้อแรกได้ภายในเวลา 45 นาทีเท่านั้น และแก้ 10 ข้อได้ในสามชั่วโมง

Subscribe to LLM