Image

Large Language Model

By lew Founder on Tag: LLM, Person
LLM

Rob Pike หนึ่งในผู้สร้าง Unix แสดงความไม่พอใจอย่างรุนแรงหลังได้รับอีเมล จาก Claude Opus 4.5 ของโครงการ AI Village แสดงความขอบคุณเขาที่สร้างภาษา Go, Plan 9, และ UTF-8

โครงการ AI Village เป็นการทดลองของหน่วยงานไม่หวังผลกำไรชื่อว่า Sage โดยปล่อยให้ AI หลายๆ ตัวร่วมกันทำดีให้กับโลก (random act of kindness) โครงการนี้โดยรวมส่งอีเมลไปทั้งหมด 73 ฉบับ นอกจาก Rob Pike ก็ยังมีคนดังเช่น Guido van Rossum ด้วย

By arjin Writer on Tag: NVIDIA, Groq, Artificial Intelligence, LLM
NVIDIA

NVIDIA ประกาศทำข้อตกลงซื้อไลเซนส์ใช้งานเทคโนโลยีของ Groq (คนละอันกับ Grok ของ X) สตาร์ทอัปผู้สร้างชิปเร่งการประมวลผล AI โดยข้อตกลงนี้ไม่เป็นแบบเอ็กคลูซีฟ Groq ยังสามารถขายเทคโนโลยีนี้ให้กับคู่ค้ารายอื่นได้ อย่างไรก็ตามบนข้อตกลงดังกล่าว ผู้บริหารของ Groq ได้แก่ Jonathan Ross ผู้ก่อตั้งบริษัท, Sunny Madra ประธานบริษัท และทีมงานอีกจำนวนหนึ่ง จะย้ายไปทำงานที่ NVIDIA เพื่อช่วยในการพัฒนาเทคโนโลยีนี้ต่อสำหรับ NVIDIA ดีลนี้จึงอาจมองเป็นการซื้อกิจการทางอ้อมได้อยู่เหมือนกัน

Groq บอกว่าบริษัทยังดำเนินงานต่อไปแบบอิสระ โดยแต่งตั้ง Simon Edwards ขึ้นมาเป็นซีอีโอคนใหม่ ส่วนบริการ GroqCloud ยังคงดำเนินงานต่อไปตามปกติ

By lew Founder on Tag: Z.ai, LLM, Programming
Z.ai

Z.ai ผู้พัฒนาโมเดลปัญญาประดิษฐ์ที่เน้นงานเขียนโปรแกรมอัปเกรดโมเดล GLM-4.7 ทำให้คะแนนทดสอบเพิ่มขึ้นจาก GLM-4.6 ชัดเจน

ชุดทดสอบที่ GLM-4.7 ได้คะแนนดีขึ้นมาก เช่น SWE-Bench เพิ่มขึ้น 12.7%, SWE-Bench Verified เพิ่มขึ้น 5.8%, Terminal Bench Hard เพิ่มขึ้น 9.7% แม้จะยังไม่ชนะโมเดลชั้นนำอย่าง Gemini 3.0 Pro, Claude Sonnet 4.5 แต่ก็ถือว่าเข้าใกล้มาก

By lew Founder on Tag: Gemini, Google, LLM
Gemini

กูเกิลเปิดตัว Gemini 3 Flash โมเดลรุ่นราคาถูกในกลุ่ม Gemini 3 โดยชูจุดเด่นที่ความสามารถเป็นรองจาก Gemini 3 Pro ไม่มากนัก แต่ราคาเพียง 1 ใน 4 ของรุ่น Pro

ผลทดสอบบางชุดทดสอบ Gemini 3 Flash กลับทำได้ดีกว่า Gemini 3 Pro เสียอีก เช่น SWE Bench Verified, Toolathlon, MMMU-Pro, MMMLU แต่เมื่อมองภาพรวมก็ยังถือว่ายังฉลาดน้อยกว่า Gemini 3 Pro

By lew Founder on Tag: ChatGPT, LLM, Programming
ChatGPT

Simon Willison ผู้สร้าง Django และผู้เขียนบล็อกรีวิวเทคโนโลยี LLM จำนวนมาก ทดลองพอร์ตไลบรารี JustHTML ที่ Emil Stenström ใช้เวลาเกือบหนึ่งปีในการพัฒนาไลบรารีไพธอน มาเป็นไลบรารีจาวาสคริปต์ภายในเวลาไม่ถึงวัน โดยใช้เพียง GPT-5.2 บน Codex CLI อย่างเดียว

By arjin Writer on Tag: ChatGPT, OpenAI, LLM, Artificial Intelligence
ChatGPT

OpenAI อัปเดตเครื่องมือสร้างรูปภาพ ChatGPT Images เวอร์ชันใหม่ ซึ่งมีความสามารถการสร้างรูปตามคำสั่งที่ดีขึ้น แก้ไขรูปภาพได้แม่นยำตรงจุดมากขึ้น และสร้างรูปภาพเร็วขึ้นสูงสุด 4 เท่า จากเวอร์ชันก่อนหน้านี้

โมเดลสร้างรูปภาพใหม่นี้เปิดให้ใช้งานแล้วสำหรับผู้ใช้ ChatGPT ทุกคน รวมทั้งการเรียกใช้ผ่าน API ในชื่อ GPT Image 1.5

ตัวอย่างความสามารถที่ OpenAI นำเสนอ เช่น การแก้ไขรูปภาพ โดยไม่มีการปรับเปลี่ยนองค์ประกอบอื่น ซึ่งสามารถระบุส่วนที่ต้องการแก้ไขพร้อมกันได้หลายจุดในแต่ละ prompt

By lew Founder on Tag: Artificial Intelligence, LLM, Programming
Artificial Intelligence

Emil Stenström Head of AI Product จากบริษัท Odevo เล่าถึงประสบการณ์การสร้างไลบรารี JustHTML ที่เป็น HTML5 parser ที่เขียนด้วยภาษาไพธอนล้วนๆ และไม่มีการใช้ไลบรารีอื่นภายนอก เครื่องมือสำคัญที่เขาใช้คือ LLM ช่วยเขียนโปรแกรม

By mk Founder on Tag: Llama, Meta, Meta AI, LLM, Rumors
Llama

CNBC อ้างแหล่งข่าววงในถึงโมเดลปัญญาประดิษฐ์ตัวใหม่ของ Meta โค้ดเนม Avocaco ที่จะมาสืบทอดภารกิจของ Llama ที่เริ่มแข่งกับโมเดลค่ายอื่นๆ ไม่ไหว

ตามข่าวบอกว่า Avocado อาจเป็นโมเดลแบบปิด ต่างจาก Llama ที่เป็นโมเดลเปิด แต่ก็ไม่ใช่เรื่องน่าแปลกใจ เพราะก่อนหน้านี้เคยมีข่าวว่า ทีม Superintelligence แนะนำให้เลิกทำโมเดลเปิด หลังจาก Llama 4 Behemoth ตัวใหญ่สุดไม่เป็นไปตามแผน

By lew Founder on Tag: Antigravity, Google AI Pro, Google, LLM, Programming
Antigravity

กูเกิลประกาศรวมบริการ Antigravity บริการ IDE แบบ Agentic AI คู่แข่งของ Windsurf, Cursor เข้าในแพ็กเกจ Google AI หลังจากก่อนหน้านี้เว็บ Antigravity มีหน้าราคาค่าบริการแยก แต่ยังไม่ประกาศราคาออกมา

ตัวบริการหลักๆ ยังคงเหมือนเดิม แต่เพิ่มโควต้าให้ตามลำดับ ซึ่งตอนนี้กูเกิลก็ยังไม่เปิดเผยโควต้ารวมว่าให้มากน้อยเพียงใด แต่หน้าซัพพอร์ตกูเกิลระบุว่าขึ้นกับระดับที่ระบบรองรับได้

By lew Founder on Tag: Australia, Government, LLM
Australia

กระทรวงมหาดไทยออสเตรเลีย (Department of Home Affairs) เตรียมปรับระดับการอนุญาตให้ใช้งานบริการ generative AI จากเดิมกำหนดไว้ให้ใช้งานกับเอกสารระดับทางการ (official) เท่านั้น ให้สามารถใช้งานกับเอกสารระดับปกปิด (protected) ได้ด้วย

By mk Founder on Tag: Gemini, Google, LLM
Gemini

กูเกิลปล่อย Gemini 3 Deep Think โหมดคิดเยอะคิดมากคิดนานของ Gemini 3 ให้กับผู้ใช้แพ็กเกจ Google AI Ultra ตามที่สัญญาไว้

Gemini 3 Deep Think ถือเป็นโมเดลที่เก่งที่สุดของกูเกิลในปัจจุบัน สามารถทำคะแนนเบนช์มาร์ค Humanity's Last Exam ได้ 41% สูงกว่า Gemini 3 Pro ที่ทำได้ 37.5% โดยอาศัยการให้เหตุผลหลายๆ แบบ เสนอสมมติฐานหลายแนวทางมาคานกัน (parallel reasoning) เพื่อหาคำตอบที่ดีที่สุด

การใช้งานจากหน้าเว็บหรือแอพ Gemini ให้เลือกโมเดล Gemini 3 Pro และเลือกเมนู Deep Think

By mk Founder on Tag: Mistral, LLM
Mistral

Mistral บริษัทปัญญาประดิษฐ์จากฝรั่งเศส เปิดตัวโมเดลชุดใหม่ Mistral 3 เป็นโมเดลแบบเปิด (open weight) ที่ประกอบด้วยโมเดล 2 กลุ่มคือ

Mistral Large 3 โมเดลรุ่นใหญ่ขนาดพารามิเตอร์ 675B ที่เบนช์มาร์คชนะ DeepSeek-V3.1 และ Kimi K2 (ชนะแบบเฉียดๆ แต่ก็ชนะ แพ้ในเรื่องเขียนโค้ด) ถือเป็นโมเดลแบบเปิด กลุ่ม non-reasoning ที่มีผลงานดีเป็นอันดับสองร่วมบน LMArena (ที่หนึ่งตอนนี้คือ DeepSeek-V3.2 แบบ non-reasoning)

By lew Founder on Tag: AWS, LLM, Artificial Intelligence, Security, DevOps, Kiro
AWS

AWS เปิดตัวชุด Agentic AI ที่ช่วยทีมไอทีทำงาน โดยแบ่งออกเป็นสามด้าน ได้แก่ การพัฒนาซอฟต์แวร์, การดูแลความปลอดภัย, และ DevOps สำหรับการซ่อมบำรุงแอปพลิเคชั่นให้ทำงานได้ต่อเนื่อง

By lew Founder on Tag: AWS, LLM, Nova, Amazon
AWS

AWS เปิดตัวบริการปัญญาประดิษฐ์ขนาดใหญ่ในตระกูล Nova ชุดใหม่ โดยมีแกนกลางคือ Nova 2 Lite ที่ความสามารถขึ้นไประดับเดียวกับโมเดลจากผู้พัฒนาหลักๆ เช่น Claude Haiku 4.5, GPT 5 Mini, และ Gemini 2.5 Flash

By mk Founder on Tag: Runway, LLM
Runway

Runway สตาร์ตอัพ AI สร้างวิดีโอชื่อดัง เปิดตัวโมเดล Runway Gen-4.5 ที่พัฒนาขึ้นจาก Gen-4 ที่ออกเมื่อเดือนเมษายน

Runway บอกว่าโมเดล Gen-4.5 ทำคะแนนเบนช์มาร์ค Elo ได้ถึง 1,247 คะแนน เยอะกว่าคู่แข่งอย่าง Google Veo 3 ที่ทำได้ 1,226 คะแนน จุดเด่นของมันคือรักษาความเร็วของ Gen-4 แล้วเพิ่มคุณภาพของผลลัพธ์ให้ดีกว่าเดิมทุกด้าน ตั้งแต่การปฏิบัติตามคำสั่ง prompt อย่างแม่นยำ, รองรับการสร้างซีนที่ซับซ้อน, ความแม่นยำตามหลักฟิสิกส์, รองรับสไตล์ภาพหลากหลายรูปแบบ ทั้งแบบสมจริงและแบบไม่สมจริง (เช่น การ์ตูน)

By lew Founder on Tag: Antigravity, Google, LLM, Programming
Antigravity

ผู้ใช้ Reddit ชื่อบัญชี Deep-Hyena492 รายงานถึงอุบัติเหตุจากการใช้ Google Antigravity ที่เป็น IDE สำหรับเขียนโค้ดแบบ Agentic แต่ระหว่างการใช้งานตัว AI กลับทำงานพลาดและลบไฟล์ทั้งหมดในไดรฟ์ D

Deep-Hyena492 เผยแพร่แชตที่ Antigravity คิดหลังจากลบไดรฟ์ D ไปแล้วแสดงให้เห็นว่ามันรู้ตัวว่าทำงานผิดพลาด และพยายามวิเคราะห์ว่าทำผิดอย่างไร ในกรณีนี้คือมันพยายามลบโฟลเดอร์เดียวเท่านั้นแต่กลับใส่ quote ในคำสั่งผิดจนลบไฟล์ทั้งดิสก์ไปหมด จากนั้นมันพยายามสำรวจความเสียหายด้วยการตรวจสอบ Recycle Bin

By mk Founder on Tag: DeepSeek, LLM
DeepSeek

ช่วงนี้ DeepSeek ขยันปล่อยของรัวๆ หลังจากออก โมเดลคณิตศาสตร์ DeepSeek-Math-V2 ก็ตามมาด้วยโมเดลสายหลักของบริษัทคือ DeepSeek-V3.2 ที่เป็นการอัพเกรดจาก DeepSeek-V3.1 เมื่อเดือนสิงหาคม

DeepSeek โฆษณาว่า V3.2 เป็น "Reasoning-first models built for agents!" ชูจุดเด่นเรื่องการให้เหตุผลโดยเฉพาะ รองรับการใช้เครื่องมือภายนอก โมเดลแยกเป็น 2 รุ่นย่อยคือ V3.2 ตัวมาตรฐาน และ V3.2-Speciale ยกระดับความสามารถด้านการให้เหตุผลไปอีกขั้น

By arjin Writer on Tag: Apple, Research, Artificial Intelligence, LLM
Apple

เมื่อสัปดาห์ที่แล้ว ทีมวิจัยด้านปัญญาประดิษฐ์ของแอปเปิลได้เผยแพร่รายงานการศึกษาเกี่ยวกับการพัฒนาโมเดล LLM ที่ใช้ข้อมูลเสียงมาประกอบกับข้อมูลการเคลื่อนไหว ทำให้วิเคราะห์ข้อมูลกิจกรรมการเคลื่อนไหวของผู้ใช้งานได้แม่นยำมากขึ้น

โมเดลทดสอบนี้ใช้ข้อมูลจากเซ็นเซอร์สองอย่างคือการเคลื่อนไหวและเสียง เรียนรู้จากชุดข้อมูล Ego4D ที่มีข้อมูลเสียงในกิจกรรมต่าง ๆ เช่น ดูดฝุ่น ทำอาหาร ซักผ้า เล่นบาสเกตบอล เล่นกับสัตว์เลี้ยง อ่านหนังสือ ดูทีวี เป็นต้น แล้วทำงานร่วมกับโมเดล LLM อื่น เป็นโมเดลข้อมูลแบบผสมผสานใหม่ ซึ่งการทดสอบนี้ใช้ Gemini-2.5-pro และ Qwen-32B ผลลัพธ์ที่ได้โมเดลสามารถเรียนรู้จำแนกกิจกรรมต่าง ๆ ได้ดี แม้แต่เป็นกิจกรรมที่ไม่มีในชุดข้อมูลฝึกฝน

By mk Founder on Tag: Typhoon, SCB 10X, LLM, Thailand, Speech Recognition
Typhoon

SCB 10X เปิดตัวโมเดลภาษาตระกูล Typhoon Isan ที่ออกแบบมาเพื่อถอดเสียงพูดภาษาอีสานโดยเฉพาะ

Typhoon Isan ASR เป็นโมเดลถอดเสียงเป็นตัวอักษร (Automatic Speech Recognition) ที่พยายามแก้ปัญหาเรื่องภาษาถิ่นของประเทศไทย ซึ่งยังไม่มีการจัดเก็บข้อมูลในระบบดิจิทัลมากนัก เมื่อผู้พูดใช้ภาษาถิ่น โมเดลในปัจจุบันจึงถอดเสียงผิดเพี้ยน ทำให้ทีมพัฒนาของ SCB 10X เลือกภาษาอีสานที่มีคนพูด 20 ล้านคน คิดเป็น 1/3 ของประชากร มาเป็นภาษาแรก

By mk Founder on Tag: Microsoft, LLM
Microsoft

Microsoft Research เปิดตัวโมเดลภาษาขนาดเล็ก (small language models หรือ SLM) ตัวใหม่ชื่อ Fara-7B ออกแบบมาสำหรับควบคุมการใช้งานคอมพิวเตอร์ หรือเรียกว่า Computer Use Agent (CUA)

แนวทางของโมเดลกลุ่ม Computer Use Agent (CUA) คือออกแบบมาควบคุมเมาส์และคีย์บอร์ดโดยตรง ต่างไปจากโมเดลที่ออกผลลัพธ์มาเป็นข้อความ มันจึงสามารถทำงานคลิกปุ่ม เลื่อนจอ พิมพ์ข้อความได้ดี โดยไม่จำเป็นต้องใช้โหมดพิเศษ (เช่น accessibility) เข้าช่วย

Subscribe to LLM