LLM | Blognone

Large Language Model

Rob Pike โวยคนสร้างแอปให้ AI ส่งอีเมลขอบคุณคนดัง ชี้ทำแบบนี้เหมือนข่มขืนโลก

By lew

on 27 December 2025 - 23:47 Tag: LLM, Person

LLM

Rob Pike หนึ่งในผู้สร้าง Unix แสดงความไม่พอใจอย่างรุนแรงหลังได้รับอีเมล จาก Claude Opus 4.5 ของโครงการ AI Village แสดงความขอบคุณเขาที่สร้างภาษา Go, Plan 9, และ UTF-8

โครงการ AI Village เป็นการทดลองของหน่วยงานไม่หวังผลกำไรชื่อว่า Sage โดยปล่อยให้ AI หลายๆ ตัวร่วมกันทำดีให้กับโลก (random act of kindness) โครงการนี้โดยรวมส่งอีเมลไปทั้งหมด 73 ฉบับ นอกจาก Rob Pike ก็ยังมีคนดังเช่น Guido van Rossum ด้วย

NVIDIA ทำข้อตกลงใช้เทคโนโลยีของบริษัทพัฒนาชิป Groq พร้อมดึงตัวซีอีโอผู้ก่อตั้งให้มาทำงานด้วย

By arjin

on 25 December 2025 - 07:42 Tag: NVIDIA, Groq, Artificial Intelligence, LLM

NVIDIA

NVIDIA ประกาศทำข้อตกลงซื้อไลเซนส์ใช้งานเทคโนโลยีของ Groq (คนละอันกับ Grok ของ X) สตาร์ทอัปผู้สร้างชิปเร่งการประมวลผล AI โดยข้อตกลงนี้ไม่เป็นแบบเอ็กคลูซีฟ Groq ยังสามารถขายเทคโนโลยีนี้ให้กับคู่ค้ารายอื่นได้ อย่างไรก็ตามบนข้อตกลงดังกล่าว ผู้บริหารของ Groq ได้แก่ Jonathan Ross ผู้ก่อตั้งบริษัท, Sunny Madra ประธานบริษัท และทีมงานอีกจำนวนหนึ่ง จะย้ายไปทำงานที่ NVIDIA เพื่อช่วยในการพัฒนาเทคโนโลยีนี้ต่อสำหรับ NVIDIA ดีลนี้จึงอาจมองเป็นการซื้อกิจการทางอ้อมได้อยู่เหมือนกัน

Groq บอกว่าบริษัทยังดำเนินงานต่อไปแบบอิสระ โดยแต่งตั้ง Simon Edwards ขึ้นมาเป็นซีอีโอคนใหม่ ส่วนบริการ GroqCloud ยังคงดำเนินงานต่อไปตามปกติ

Z.ai เปิดตัว GLM-4.7 เน้นความสามารถช่วยเขียนโปรแกรม

By lew

on 23 December 2025 - 08:54 Tag: Z.ai, LLM, Programming

Z.ai

Z.ai ผู้พัฒนาโมเดลปัญญาประดิษฐ์ที่เน้นงานเขียนโปรแกรมอัปเกรดโมเดล GLM-4.7 ทำให้คะแนนทดสอบเพิ่มขึ้นจาก GLM-4.6 ชัดเจน

ชุดทดสอบที่ GLM-4.7 ได้คะแนนดีขึ้นมาก เช่น SWE-Bench เพิ่มขึ้น 12.7%, SWE-Bench Verified เพิ่มขึ้น 5.8%, Terminal Bench Hard เพิ่มขึ้น 9.7% แม้จะยังไม่ชนะโมเดลชั้นนำอย่าง Gemini 3.0 Pro, Claude Sonnet 4.5 แต่ก็ถือว่าเข้าใกล้มาก

กูเกิลเปิดตัว Gemini 3 Flash แพงขึ้น 66% แต่ความเก่งใกล้เคียงรุ่น Pro

By lew

on 17 December 2025 - 23:53 Tag: Gemini, Google, LLM

Gemini

กูเกิลเปิดตัว Gemini 3 Flash โมเดลรุ่นราคาถูกในกลุ่ม Gemini 3 โดยชูจุดเด่นที่ความสามารถเป็นรองจาก Gemini 3 Pro ไม่มากนัก แต่ราคาเพียง 1 ใน 4 ของรุ่น Pro

ผลทดสอบบางชุดทดสอบ Gemini 3 Flash กลับทำได้ดีกว่า Gemini 3 Pro เสียอีก เช่น SWE Bench Verified, Toolathlon, MMMU-Pro, MMMLU แต่เมื่อมองภาพรวมก็ยังถือว่ายังฉลาดน้อยกว่า Gemini 3 Pro

นักพัฒนาพอร์ตไลบรารี JustHTML จากภาษาไพธอนมาเป็นจาวาสคริปต์ด้วย GPT-5.2 ภายใน 4 ชั่วโมงครึ่ง

By lew

on 17 December 2025 - 08:35 Tag: ChatGPT, LLM, Programming

ChatGPT

Simon Willison ผู้สร้าง Django และผู้เขียนบล็อกรีวิวเทคโนโลยี LLM จำนวนมาก ทดลองพอร์ตไลบรารี JustHTML ที่ Emil Stenström ใช้เวลาเกือบหนึ่งปีในการพัฒนาไลบรารีไพธอน มาเป็นไลบรารีจาวาสคริปต์ภายในเวลาไม่ถึงวัน โดยใช้เพียง GPT-5.2 บน Codex CLI อย่างเดียว

OpenAI อัปเกรด ChatGPT Images รุ่นใหม่ แก้ไขภาพและสร้างรูปภาพได้แม่นยำขึ้น ทำงานเร็วขึ้นสูงสุด 4 เท่า

By arjin

on 17 December 2025 - 07:19 Tag: ChatGPT, OpenAI, LLM, Artificial Intelligence

ChatGPT

OpenAI อัปเดตเครื่องมือสร้างรูปภาพ ChatGPT Images เวอร์ชันใหม่ ซึ่งมีความสามารถการสร้างรูปตามคำสั่งที่ดีขึ้น แก้ไขรูปภาพได้แม่นยำตรงจุดมากขึ้น และสร้างรูปภาพเร็วขึ้นสูงสุด 4 เท่า จากเวอร์ชันก่อนหน้านี้

โมเดลสร้างรูปภาพใหม่นี้เปิดให้ใช้งานแล้วสำหรับผู้ใช้ ChatGPT ทุกคน รวมทั้งการเรียกใช้ผ่าน API ในชื่อ GPT Image 1.5

ตัวอย่างความสามารถที่ OpenAI นำเสนอ เช่น การแก้ไขรูปภาพ โดยไม่มีการปรับเปลี่ยนองค์ประกอบอื่น ซึ่งสามารถระบุส่วนที่ต้องการแก้ไขพร้อมกันได้หลายจุดในแต่ละ prompt

นักพัฒนาสร้างไลบรารีอ่าน HTML5 จากศูนย์โดยใช้ LLM ช่วย ผ่านการทดสอบ 100%

By lew

on 16 December 2025 - 12:37 Tag: Artificial Intelligence, LLM, Programming

Artificial Intelligence

Emil Stenström Head of AI Product จากบริษัท Odevo เล่าถึงประสบการณ์การสร้างไลบรารี JustHTML ที่เป็น HTML5 parser ที่เขียนด้วยภาษาไพธอนล้วนๆ และไม่มีการใช้ไลบรารีอื่นภายนอก เครื่องมือสำคัญที่เขาใช้คือ LLM ช่วยเขียนโปรแกรม

[ลือ] โมเดลใหม่ Meta ชื่อ Avocado มาแทน Llama ต้นปี 2026, อาจเป็นโมเดลปิด

By mk

on 9 December 2025 - 21:57 Tag: Llama, Meta, Meta AI, LLM, Rumors

Llama

CNBC อ้างแหล่งข่าววงในถึงโมเดลปัญญาประดิษฐ์ตัวใหม่ของ Meta โค้ดเนม Avocaco ที่จะมาสืบทอดภารกิจของ Llama ที่เริ่มแข่งกับโมเดลค่ายอื่นๆ ไม่ไหว

ตามข่าวบอกว่า Avocado อาจเป็นโมเดลแบบปิด ต่างจาก Llama ที่เป็นโมเดลเปิด แต่ก็ไม่ใช่เรื่องน่าแปลกใจ เพราะก่อนหน้านี้เคยมีข่าวว่า ทีม Superintelligence แนะนำให้เลิกทำโมเดลเปิด หลังจาก Llama 4 Behemoth ตัวใหญ่สุดไม่เป็นไปตามแผน

กูเกิลรวมบริการ Antigravity เข้าในแพ็กเกจ Google AI

By lew

on 8 December 2025 - 12:02 Tag: Antigravity, Google AI Pro, Google, LLM, Programming

Antigravity

กูเกิลประกาศรวมบริการ Antigravity บริการ IDE แบบ Agentic AI คู่แข่งของ Windsurf, Cursor เข้าในแพ็กเกจ Google AI หลังจากก่อนหน้านี้เว็บ Antigravity มีหน้าราคาค่าบริการแยก แต่ยังไม่ประกาศราคาออกมา

ตัวบริการหลักๆ ยังคงเหมือนเดิม แต่เพิ่มโควต้าให้ตามลำดับ ซึ่งตอนนี้กูเกิลก็ยังไม่เปิดเผยโควต้ารวมว่าให้มากน้อยเพียงใด แต่หน้าซัพพอร์ตกูเกิลระบุว่าขึ้นกับระดับที่ระบบรองรับได้

กระทรวงมหาดไทยออสเตรเลียเตรียมยกระดับการใช้ Generative AI กับเอกสารระดับปกปิด

By lew

on 8 December 2025 - 10:37 Tag: Australia, Government, LLM

Australia

กระทรวงมหาดไทยออสเตรเลีย (Department of Home Affairs) เตรียมปรับระดับการอนุญาตให้ใช้งานบริการ generative AI จากเดิมกำหนดไว้ให้ใช้งานกับเอกสารระดับทางการ (official) เท่านั้น ให้สามารถใช้งานกับเอกสารระดับปกปิด (protected) ได้ด้วย

กูเกิลปล่อย Gemini 3 Deep Think โมเดลตัวเก่งที่สุดให้ลูกค้า Google AI Ultra

By mk

on 5 December 2025 - 08:45 Tag: Gemini, Google, LLM

Gemini

กูเกิลปล่อย Gemini 3 Deep Think โหมดคิดเยอะคิดมากคิดนานของ Gemini 3 ให้กับผู้ใช้แพ็กเกจ Google AI Ultra ตามที่สัญญาไว้

Gemini 3 Deep Think ถือเป็นโมเดลที่เก่งที่สุดของกูเกิลในปัจจุบัน สามารถทำคะแนนเบนช์มาร์ค Humanity's Last Exam ได้ 41% สูงกว่า Gemini 3 Pro ที่ทำได้ 37.5% โดยอาศัยการให้เหตุผลหลายๆ แบบ เสนอสมมติฐานหลายแนวทางมาคานกัน (parallel reasoning) เพื่อหาคำตอบที่ดีที่สุด

การใช้งานจากหน้าเว็บหรือแอพ Gemini ให้เลือกโมเดล Gemini 3 Pro และเลือกเมนู Deep Think

Mistral เปิดตัว Mistral Large 3 รุ่นใหญ่ และ Ministral 3 รุ่นเล็ก คะแนนดีในกลุ่มโมเดลเปิด

By mk

on 3 December 2025 - 09:20 Tag: Mistral, LLM

Mistral

Mistral บริษัทปัญญาประดิษฐ์จากฝรั่งเศส เปิดตัวโมเดลชุดใหม่ Mistral 3 เป็นโมเดลแบบเปิด (open weight) ที่ประกอบด้วยโมเดล 2 กลุ่มคือ

Mistral Large 3 โมเดลรุ่นใหญ่ขนาดพารามิเตอร์ 675B ที่เบนช์มาร์คชนะ DeepSeek-V3.1 และ Kimi K2 (ชนะแบบเฉียดๆ แต่ก็ชนะ แพ้ในเรื่องเขียนโค้ด) ถือเป็นโมเดลแบบเปิด กลุ่ม non-reasoning ที่มีผลงานดีเป็นอันดับสองร่วมบน LMArena (ที่หนึ่งตอนนี้คือ DeepSeek-V3.2 แบบ non-reasoning)

AWS เปิดตัว Kiro autonomous agent เขียนโปรแกรมตามคำสั่ง, AWS Security Agent ทำ pentest อัตโนมัติ, AWS DevOps Agent เฝ้าแอปตลอดเวลา

By lew

on 3 December 2025 - 01:13 Tag: AWS, LLM, Artificial Intelligence, Security, DevOps, Kiro

AWS

AWS เปิดตัวชุด Agentic AI ที่ช่วยทีมไอทีทำงาน โดยแบ่งออกเป็นสามด้าน ได้แก่ การพัฒนาซอฟต์แวร์, การดูแลความปลอดภัย, และ DevOps สำหรับการซ่อมบำรุงแอปพลิเคชั่นให้ทำงานได้ต่อเนื่อง

AWS เปิดตัวโมเดล Nova 2 พร้อมบริการ Forge ช่วยสร้างโมเดลรุ่นเฉพาะทาง

By lew

on 3 December 2025 - 00:30 Tag: AWS, LLM, Nova, Amazon

AWS

AWS เปิดตัวบริการปัญญาประดิษฐ์ขนาดใหญ่ในตระกูล Nova ชุดใหม่ โดยมีแกนกลางคือ Nova 2 Lite ที่ความสามารถขึ้นไประดับเดียวกับโมเดลจากผู้พัฒนาหลักๆ เช่น Claude Haiku 4.5, GPT 5 Mini, และ Gemini 2.5 Flash

Runway เปิดตัวโมเดลสร้างวิดีโอ Gen-4.5 บอกทำคะแนนได้ดีกว่า Veo 3

By mk

on 2 December 2025 - 10:38 Tag: Runway, LLM

Runway

Runway สตาร์ตอัพ AI สร้างวิดีโอชื่อดัง เปิดตัวโมเดล Runway Gen-4.5 ที่พัฒนาขึ้นจาก Gen-4 ที่ออกเมื่อเดือนเมษายน

Runway บอกว่าโมเดล Gen-4.5 ทำคะแนนเบนช์มาร์ค Elo ได้ถึง 1,247 คะแนน เยอะกว่าคู่แข่งอย่าง Google Veo 3 ที่ทำได้ 1,226 คะแนน จุดเด่นของมันคือรักษาความเร็วของ Gen-4 แล้วเพิ่มคุณภาพของผลลัพธ์ให้ดีกว่าเดิมทุกด้าน ตั้งแต่การปฏิบัติตามคำสั่ง prompt อย่างแม่นยำ, รองรับการสร้างซีนที่ซับซ้อน, ความแม่นยำตามหลักฟิสิกส์, รองรับสไตล์ภาพหลากหลายรูปแบบ ทั้งแบบสมจริงและแบบไม่สมจริง (เช่น การ์ตูน)

ผู้ใช้ Google Antigravity ถูกลบดิสก์ข้อมูลหายทั้งหมด

By lew

on 2 December 2025 - 02:06 Tag: Antigravity, Google, LLM, Programming

Antigravity

ผู้ใช้ Reddit ชื่อบัญชี Deep-Hyena492 รายงานถึงอุบัติเหตุจากการใช้ Google Antigravity ที่เป็น IDE สำหรับเขียนโค้ดแบบ Agentic แต่ระหว่างการใช้งานตัว AI กลับทำงานพลาดและลบไฟล์ทั้งหมดในไดรฟ์ D

Deep-Hyena492 เผยแพร่แชตที่ Antigravity คิดหลังจากลบไดรฟ์ D ไปแล้วแสดงให้เห็นว่ามันรู้ตัวว่าทำงานผิดพลาด และพยายามวิเคราะห์ว่าทำผิดอย่างไร ในกรณีนี้คือมันพยายามลบโฟลเดอร์เดียวเท่านั้นแต่กลับใส่ quote ในคำสั่งผิดจนลบไฟล์ทั้งดิสก์ไปหมด จากนั้นมันพยายามสำรวจความเสียหายด้วยการตรวจสอบ Recycle Bin

เปิดตัว DeepSeek-V3.2 โมเดลเปิดมี Reasoning ความสามารถเทียบเท่า Gemini 3 Pro

By mk

on 1 December 2025 - 21:44 Tag: DeepSeek, LLM

DeepSeek

ช่วงนี้ DeepSeek ขยันปล่อยของรัวๆ หลังจากออก โมเดลคณิตศาสตร์ DeepSeek-Math-V2 ก็ตามมาด้วยโมเดลสายหลักของบริษัทคือ DeepSeek-V3.2 ที่เป็นการอัพเกรดจาก DeepSeek-V3.1 เมื่อเดือนสิงหาคม

DeepSeek โฆษณาว่า V3.2 เป็น "Reasoning-first models built for agents!" ชูจุดเด่นเรื่องการให้เหตุผลโดยเฉพาะ รองรับการใช้เครื่องมือภายนอก โมเดลแยกเป็น 2 รุ่นย่อยคือ V3.2 ตัวมาตรฐาน และ V3.2-Speciale ยกระดับความสามารถด้านการให้เหตุผลไปอีกขั้น

Apple เผยแพร่งานวิจัย LLM ทำนายกิจกรรมผู้ใช้งาน โดยใช้ข้อมูลเสียงกับการเคลื่อนไหว

By arjin

on 29 November 2025 - 14:36 Tag: Apple, Research, Artificial Intelligence, LLM

Apple

เมื่อสัปดาห์ที่แล้ว ทีมวิจัยด้านปัญญาประดิษฐ์ของแอปเปิลได้เผยแพร่รายงานการศึกษาเกี่ยวกับการพัฒนาโมเดล LLM ที่ใช้ข้อมูลเสียงมาประกอบกับข้อมูลการเคลื่อนไหว ทำให้วิเคราะห์ข้อมูลกิจกรรมการเคลื่อนไหวของผู้ใช้งานได้แม่นยำมากขึ้น

โมเดลทดสอบนี้ใช้ข้อมูลจากเซ็นเซอร์สองอย่างคือการเคลื่อนไหวและเสียง เรียนรู้จากชุดข้อมูล Ego4D ที่มีข้อมูลเสียงในกิจกรรมต่าง ๆ เช่น ดูดฝุ่น ทำอาหาร ซักผ้า เล่นบาสเกตบอล เล่นกับสัตว์เลี้ยง อ่านหนังสือ ดูทีวี เป็นต้น แล้วทำงานร่วมกับโมเดล LLM อื่น เป็นโมเดลข้อมูลแบบผสมผสานใหม่ ซึ่งการทดสอบนี้ใช้ Gemini-2.5-pro และ Qwen-32B ผลลัพธ์ที่ได้โมเดลสามารถเรียนรู้จำแนกกิจกรรมต่าง ๆ ได้ดี แม้แต่เป็นกิจกรรมที่ไม่มีในชุดข้อมูลฝึกฝน

SCB 10X เปิดตัวโมเดล Typhoon Isan เทรนมาเพื่อถอดเสียงภาษาอีสาน

By mk

on 28 November 2025 - 21:38 Tag: Typhoon, SCB 10X, LLM, Thailand, Speech Recognition

Typhoon

SCB 10X เปิดตัวโมเดลภาษาตระกูล Typhoon Isan ที่ออกแบบมาเพื่อถอดเสียงพูดภาษาอีสานโดยเฉพาะ

Typhoon Isan ASR เป็นโมเดลถอดเสียงเป็นตัวอักษร (Automatic Speech Recognition) ที่พยายามแก้ปัญหาเรื่องภาษาถิ่นของประเทศไทย ซึ่งยังไม่มีการจัดเก็บข้อมูลในระบบดิจิทัลมากนัก เมื่อผู้พูดใช้ภาษาถิ่น โมเดลในปัจจุบันจึงถอดเสียงผิดเพี้ยน ทำให้ทีมพัฒนาของ SCB 10X เลือกภาษาอีสานที่มีคนพูด 20 ล้านคน คิดเป็น 1/3 ของประชากร มาเป็นภาษาแรก

ไมโครซอฟท์เปิดตัว Fara-7B โมเดลควบคุมคอมพิวเตอร์ Computer Use Agent ขนาดเล็ก รันในเครื่องได้

By mk

on 25 November 2025 - 14:29 Tag: Microsoft, LLM

Microsoft

Microsoft Research เปิดตัวโมเดลภาษาขนาดเล็ก (small language models หรือ SLM) ตัวใหม่ชื่อ Fara-7B ออกแบบมาสำหรับควบคุมการใช้งานคอมพิวเตอร์ หรือเรียกว่า Computer Use Agent (CUA)

แนวทางของโมเดลกลุ่ม Computer Use Agent (CUA) คือออกแบบมาควบคุมเมาส์และคีย์บอร์ดโดยตรง ต่างไปจากโมเดลที่ออกผลลัพธ์มาเป็นข้อความ มันจึงสามารถทำงานคลิกปุ่ม เลื่อนจอ พิมพ์ข้อความได้ดี โดยไม่จำเป็นต้องใช้โหมดพิเศษ (เช่น accessibility) เข้าช่วย

Subscribe to LLM