Image

Large Language Model

By lew Founder on Tag: Jules, Gemini, Google, Programming, LLM
Jules

กูเกิลเปิดตัว Jules ปัญญาประดิษฐ์เขียนโค้ดที่ทำงานคล้าย GitHub Copilot Coding Agent โดยเราสามารถสั่งงานทางพรอมพ์หรือ assign issue ให้ Jules รับผิดชอบ จากนั้น Jules จะดึงโค้ดไปสร้างพื้นที่พัฒนาของตัวเอง แล้วแก้ไขจนเสร็จ จึงส่งเป็น pull request กลับมาให้เรารีวิว รวมถึงสามารถส่งข้อความเสียงสรุปว่าแก้อะไรไปบ้าง

By mk Founder on Tag: Grok, Microsoft Azure, Microsoft, LLM, Elon Musk, xAI
Grok

ไมโครซอฟท์ประกาศนำโมเดล Grok 3 ของ xAI มาให้บริการบน Azure AI Foundry ซึ่งถือเป็นครั้งแรกที่โมเดล Grok ถูกนำมาให้บริการเช่าใช้งานบนคลาวด์ด้วย

ราคาของ Grok 3 บน Azure คิดที่ขาอินพุต 3 ดอลลาร์ต่อ 1 ล้านโทเคน และขาเอาต์พุต 15 ดอลลาร์ต่อ 1 ล้านโทเคน ช่วงนี้ยังให้บริการฟรีแบบพรีวิวไปจนถึงต้นเดือนมิถุนายน 2025

เนื่องในโอกาส Grok มาอยู่บน Azure ทางซีอีโอ Satya Nadella จึงเชิญ Elon Musk มาขึ้นเวที (แบบผ่านวิดีโอ) และมาเล่าประวัติชีวิตของเขาที่เคยฝึกงานกับไมโครซอฟท์ด้วยนิดหน่อย เขายังพูดถึงแผนการออก Grok 3.5 ที่มีฟีเจอร์การให้เหตุผล (reasoning) ที่จะเปิดตัวในเร็วๆ นี้ด้วย

By mk Founder on Tag: Microsoft Edge, Phi, Microsoft, Browser, LLM
Microsoft Edge

Microsoft Edge ผนวกเอา Phi-4-mini โมเดลภาษาขนาดเล็กของไมโครซอฟท์ เข้ามารันในตัวเบราว์เซอร์ และเปิด API ให้เว็บแอพเรียกใช้งานได้

การมาถึงของฟีเจอร์นี้แปลว่า เราสามารถสร้างเว็บแอพที่เรียกใช้ฟีเจอร์ของ LLM แล้วประมวลผลแบบออฟไลน์ได้โดยไม่ต้องพึ่งพาเซิร์ฟเวอร์เลย

ฟีเจอร์นี้จะเริ่มใช้ใน Microsoft Edge 138 ที่ปัจจุบันอยู่ใน Canary/Dev Channel สามารถทำงานได้ทั้งบน Windows 10, 11, macOS 13.3 ขึ้นไป สเปกเครื่องขั้นต่ำจำเป็นต้องมีแรมจีพียูอย่างน้อย 5.5GB และสตอเรจอย่างน้อย 20GB เพื่อใช้ติดตั้งโมเดลตอนเรียกใช้งานครั้งแรก

By lew Founder on Tag: GitHub, LLM, Visual Studio Code, GitHub Copilot, Open Source
GitHub

GitHub เปิดซอร์สส่วนขยาย GitHub Copilot Chat ที่ใช้เชื่อม VS Code เข้ากับบริการ GitHub Copilot กลายเป็นโครงการโอเพนซอร์ส สัญญาอนุญาตแบบ MIT โดยให้เหตุผลสำคัญว่าปัญญาประดิษฐ์ในช่วงหลังดีขึ้นมาก และการสร้างพรอมพ์พิเศษที่เป็นความลับเพื่อให้เขียนโค้ดได้ดีขึ้นนั้นไม่จำเป็นอีกต่อไปแล้ว

ด้านดีของการโอเพนซอร์สนั้นมีหลายอย่าง เช่น เปิดให้ชุมชนเข้ามาช่วยแก้บั๊กและทดสอบฟีเจอร์ใหม่ๆ, ปรับปรุงการทำงานร่วมกับส่วนขยายอื่นๆ, และเปิดให้นักพัฒนาเข้ามาตรวจสอบว่า GitHub ส่งข้อมูลอะไรกลับเซิร์ฟเวอร์บ้าง

By lew Founder on Tag: GitHub, GitHub Copilot, LLM
GitHub

GitHub Copilot เพิ่มฟีเจอร์ทำงานอัตโนมัติเต็มรูปแบบเหมือนนักพัฒนาในทีมอีกคน โดยกระบวนการทำงานจะเริ่มเมื่อมีคนรายงานปัญหา ตัว Coding Agent จะสร้างพื้นที่พัฒนาแล้วพยายามแก้ไขปัญหาจนเสร็จแล้วค่อยส่งงานเป็น pull request ให้มนุษย์ตรวจสอบขั้นสุดท้ายทีเดียว

ทาง GitHub ระบุว่า Coding Agent แก้ปัญหาความซับซ้อนต่ำจนถึงปานกลางได้เป็นอย่างดีโดยเฉพาะโครงการที่มีชุดทดสอบอย่างดีแล้ว เมื่อแพตช์เสร็จแล้ว นักพัฒนายังสามารถรีวิวโค้ดเพิ่มเติมได้ ตัว Coding Agent ก็จะนำความเห็นกลับไปแก้ไขจนกว่าจะได้ผลลัพธ์ตามคำสั่ง

By mk Founder on Tag: Windsurf, Programming, LLM, Software Engineering
Windsurf

Windsurf หรือชื่อเดิม Codeium สตาร์ตอัพผู้พัฒนา IDE เขียนโค้ดพลัง AI ที่กำลังมีข่าวว่าจะโดน OpenAI ซื้อ เปิดตัวโมเดลเขียนโค้ดเวอร์ชันแรกของตัวเองชื่อ SWE-1

SWE-1 เป็นชุดของโมเดลที่เทรนมาสำหรับ "กระบวนการวิศวกรรมซอฟต์แวร์ทั้งหมด" (the entire software engineering process) ไม่ได้แค่สร้างโค้ดอย่างเดียว

By lew Founder on Tag: Google Cloud, LLM, SQL, Database
Google Cloud

Google Cloud โชว์ฟีเจอร์ text-to-SQL ใน BigQuery Studio และ Cloud SQL Studio ที่มีตัวช่วยเขียน SQL โดยเปิดให้ผู้ใช้ถามคำถามภาษาธรรมชาติ

แม้ว่าโดยทั่ว LLM จะเขียน SQL ได้อยู่แล้ว แต่เมื่อใช้งานกับฐานข้อมูลจริงที่มีความซับซ้อนสูง และคำถามจริงของผู้ใช้ที่มักไม่ได้บอกข้อมูลครบนักก็จะเจอข้อจำกัด เช่น ผู้ใช้ถามว่าต้องการรองเท้าที่ขายดีที่สุด แต่ใน schema ของฐานข้อมูลไม่มีอะไรบอกว่าจะหารองเท้าอย่างไร หรือคำว่าขายดีที่สุดแปลว่าจำนวนที่ขายหรือยอดเงินที่ขายได้ ตลอดจนบางครั้ง LLM ก็สับสนถึงความต่างของ SQL แบรนด์ต่างๆ

By arjin Writer on Tag: Meta AI, Llama, Meta, Rumors, LLM, Artificial Intelligence
Meta AI

The Wall Street Journal อ้างแหล่งข่าวที่เกี่ยวข้องเผยว่า Meta ได้เลื่อนกำหนดเผยแพร่โมเดลปัญญาประดิษฐ์ภาษาขนาดใหญ่ Behemoth ออกไปอีก เนื่องจากมีความกังวลเรื่องความสามารถที่ยังไม่ดีมากพอ

Meta เปิดตัว Llama 4 เมื่อเดือนเมษายน โดยเผยแพร่สองรุ่นย่อยคือ Scout ขนาดพารามิเตอร์ 109B และ Maverick ขนาดพารามิเตอร์รวม 400B บอกว่าทั้งสองรุ่นนี้เป็นการดึงความสามารถบางส่วนออกมาจากโมเดลตัวใหญ่ที่สุด Behemoth ขนาดพารามิเตอร์ 2T ซึ่งไม่ได้เปิดตัวพร้อมกัน

By mk Founder on Tag: ChatGPT, OpenAI, LLM
ChatGPT

OpenAI ปล่อยโมเดล GPT-4.1 ที่เปิดตัวช่วงกลางเดือนเมษายน ให้กับผู้ใช้ ChatGPT แพ็กเกจเสียเงิน (Plus, Pro, Team) ใช้งาน หลังจากที่ช่วงแรกเปิดใช้เฉพาะผ่าน API อย่างเดียว การใช้งานผ่าน ChatGPT จำเป็นต้องเลือกโมเดลเองผ่านเมนู more models โดย GPT-4.1 มีเรตลิมิตเท่ากับ GPT-4o

นอกจากนี้ OpenAI ยังนำโมเดลรุ่นเล็ก GPT-4.1 mini มาใช้แทน GPT-4o mini ให้กับผู้ใช้ ChatGPT ทุกคน (รวมแพ็กเกจฟรีด้วย)

By lew Founder on Tag: DeepMind, Google, LLM
DeepMind

DeepMind เปิดตัวปัญญาประดิษฐ์ AlphaEvolve ชุดปัญญาประดิษฐ์แบบ agentic ที่ช่วยออกแบบฟังก์ชั่นต่างๆ เพื่อปรับปรุงประสิทธิภาพการทำงานของทีมงานกูเกิลเอง โดยใช้เข้าไปปร้บปรุงตั้งแต่ระดับชิป, ซอฟต์แวร์, และระบบการจัดการคลัสเตอร์

By lew Founder on Tag: Apple, LLM
Apple

แอปเปิลปล่อยโมเดลปัญญาประดิษฐ์ FastVLM ประกอบไปด้วยโมเดล 6 รุ่นย่อย โดยความสามารถพิิเศษคือความเร็วในการรันสูงขึ้นมากเพราะสถาปัตยกรรม FastViHD ที่เป็น encoder ของปัญญาประดิษฐ์อ่านภาพ มีความเร็วในการอ่านภาพดีกว่าสถาปัตยกรรมอื่นๆ มากโดยเฉพาะในภาพขนาดใหญ่

ตัวโมเดลที่ปล่อยออกมาพัฒนาจากโมเดลที่มีอยู่แล้วในตลาด เช่น LLaVA-OneVision เมื่อแปลงเป็น FastVLM แล้วระยะเวลาเริ่มตอบคำตอบแรก (time-to-first-token - TTFT) เร็วขึ้น 85 เท่าตัว ละอัตราการอ่านภาพรวมเร็วขึ้น 3.4 เท่าตัว หรือโมเดลขนาด 7B พัฒนาจาก Qwen2-7B ก็มีระยะเวลาเริ่มตอบเร็วขึ้น 7.9 เท่าตัว

By lew Founder on Tag: Gemini, Google, LLM
Gemini

กูเกิลเพิ่มฟีเจอร์ Implicit Caching ให้กับลูกค้าที่ซื้อ Gemini ใช้งานผ่าน API โดยหลังจากนี้ไม่จำเป็นต้องระบุให้กูเกิลเก็บแคชไว้เอง

แนวทางการทำ caching ใน LLM นั้นอาศัยแนวทางการใช้งานที่หลายครั้งผู้ใช้มักเริ่มต้นบทสนทนากับปัญญาประดิษฐ์เหมือนๆ กัน เช่น การใส่ system prompt หรือการคุยกับเอกสารชุดเดิมๆ แต่เปลี่ยนคำถามใหม่ทำให้มีข้อความเดิมๆ ไปทุกครั้ง ผู้ให้บริการ LLM นั้นสามารถเก็บสถานะที่ประมวลผลข้อความเริ่มต้นแล้วเอาไว้ ทำให้สามารถตอบคำถามต่อไปได้ทันที ก่อนหน้านี้กูเกิลรองรับการทำ caching อยู่แล้ว แต่ผู้ใช้ต้องประกาศใช้งานเอง และเสียค่าสตอเรจเก็บแคช

By lew Founder on Tag: Gemini, Google, LLM, Programming
Gemini

กูเกิลอัพเดตโมเดล Gemini 2.5 Pro เป็นเวอร์ชั่น 05-06 (6 พฤษภาคม) โดยชูประเด็นสำคัญคือมันทำคะแนนทดสอบด้านการเขียนเว็บ หรือ WebDev Arena เอาชนะ Claude 3.7 ได้เป็นตัวแรก นับแต่แยกหมวดหมู่มา แถมยังชนะค่อนข้างขาดด้วยคะแนน ELO 1420

ทางกูเกิลระบุว่าตั้งใจจะเปิดตัวโมเดลเวอร์ชั่นนี้ในงาน Google I/O ที่กำลังจะจัดปลายเดือนนี้ แต่เปลี่ยนใจปล่อยออกมาทันทีเลยให้ใช้กันก่อนงาน

By lew Founder on Tag: Open Source, LLM, Artificial Intelligence
Open Source

Open WebUI โครงการหน้าจอแชตยอดนิยมในโลกโอเพนซอร์ส ประกาศเปลี่ยนไลเซนส์จากเดิมใช้ BSD-3 ที่ให้อิสระอย่างมาก มาเป็น BSD-3 เวอร์ชั่นดัดแปลงที่บังคับห้ามลบแบรนด์ออกจากเว็บ

By lew Founder on Tag: Meta, Copyright, LLM, Artificial Intelligence
Meta

ผู้พิพากษา Vince Chhabria แห่งศาลชั้นต้นรัฐบาลกลางสหรัฐฯ (US District Court) แสดงความเห็นระหว่างขั้นตอนการไต่สวน คดี Meta นำข้อมูลหนังสือไปฝึกปัญญาประดิษฐ์ ว่า เขาไม่เข้าใจว่าทำไมการใช้งานของ Meta จะเป็นการใช้งานเป็นธรรมได้อย่างไร

การใช้งานที่เป็นธรรม (fair use) เป็นแนวทางการใช้งานอย่างจำกัดที่เปิดให้ผู้อื่นสามารถนำงานที่มีลิขสิทธิ์ไปใช้งานต่อได้โดยไม่ต้องจ่ายค่าลิขสิทธิ์ เช่น การวิจารณ์หนังสือหรือภาพยนตร์, การใช้งานเพื่อการวิจัย, หรือการรายงานข่าว

By lew Founder on Tag: OpenAI, LLM
OpenAI

OpenAI เขียนบล็อกอธิบายเพิ่มเติมเหตุการณ์ปล่อยอัพเดตโมเดลเวอร์ชั่นช่างประจบ พร้อมกับวิเคราะห์ถึงความผิดพลาดในการทดสอบที่ทำให้ปล่อยโมเดลเวอร์ชั่นนี้ออกมา

โดยปกติแล้วโมเดลของ OpenAI จะถูกฝึกด้วยระบบ reinforcement learning โดยมีระบบให้คะแนนคำตอบคุณภาพสูง ระบบให้คะแนนคิดคะแนนจากคำตอบที่ถูกต้อง, อ่านแล้วได้ประโยชน์, ปลอดภัย หลังจากฝึกแล้ว โมเดลจะถูกตรวจสอบหลายขั้น นับแต่การวัดประสิทธิภาพจากชุดทดสอบต่างๆ, การตรวจสอบโดยผู้เชี่ยวชาญ, การประเมินความปลอดภัย, และการทดสอบวงจำกัด

By mk Founder on Tag: Phi, Microsoft, LLM, Artificial Intelligence
Phi

ไมโครซอฟท์ปล่อยโมเดลภาษาขนาดเล็กตัวใหม่ในซีรีส์ Phi-4 เป็นโมเดลแบบให้เหตุผล (reasoning) จำนวน 3 ตัว 3 ขนาดคือ

By mk Founder on Tag: Nova, Amazon, AWS, LLM, Artificial Intelligence
Nova

Amazon เปิดตัวโมเดลภาษารุ่นใหญ่ที่สุด Amazon Nova Premier ใหญ่กว่า Nova Pro รุ่นก่อนหน้านี้ มีขนาด context window 1 ล้านโทเคน (Pro 3 แสนโทเคน) สามารถทำงานที่ซับซ้อนสูง รวมถึงใช้เป็นโมเดลแม่ไปสอนโมเดลอื่นทำ distillation ได้ด้วย

By mk Founder on Tag: JetBrains, Programming, Open Source, LLM
JetBrains

JetBrains ประกาศโอเพนซอร์ส Mellum โมเดลช่วยเติมโค้ดที่เปิดตัวในปี 2024 และใช้กับ IDE ในตระกูล JetBrains โดยมีจุดเด่นเรื่องความเร็วกว่าการใช้โมเดลภาษา LLM ตัวใหญ่

JetBrains เรียก Mellum ว่าเป็น "focal model" สร้างมาเพื่อเขียนโค้ดโดยเฉพาะ ไม่ใช่โมเดลภาษา LLM ที่ปรับมาใช้เขียนโค้ด และแผนการของบริษัทคือการสร้างโมเดล Mellum หลายๆ ตัวที่ทำงานเฉพาะทางต่างกันไป เช่น ช่วยเติมโค้ด (code completion) หรือช่วยพยากรณ์ diff ของโค้ดแต่ละเวอร์ชัน

By lew Founder on Tag: Meta AI, Llama, LLM, API
Meta AI

Meta ประกาศเปิดบริการ Llama API ในงาน LlamaCon 2025 ให้บริการกับนักพัฒนาภายนอก ทำให้สามารถสร้างแอปพลิเคชั่นบน Llama 4 ได้ทันทีผ่านทาง OpenAI SDK

แม้ว่าจะเปิดบริการแพลตฟอร์มของตัวเอง แต่ทาง Meta ก็ยืนยันว่าจะร่วมกับผู้ให้บริการรายอื่นๆ เพื่อให้บริการ Llama 4 ไปพร้อมกัน โดยตอนนี้มี Cerebras และ Groq ให้บริการ Llama 4 แบบทดสอบผ่านทาง Llama API ด้วย ผู้ใช้สามารถเลือกว่าจะรันโมเดลผ่านผู้ให้บริการรายใดก็ได้ โดยระบุใน API

Subscribe to LLM