LLM | Blognone

Large Language Model

กูเกิลเปิดตัว Jules AI เขียนโค้ดทำงานด้วยตัวเอง ส่ง Issue ให้แก้แล้วรอ Pull Request เลย ใช้ฟรีช่วงทดลอง

By lew

on 20 May 2025 - 22:45 Tag: Jules, Gemini, Google, Programming, LLM

Jules

กูเกิลเปิดตัว Jules ปัญญาประดิษฐ์เขียนโค้ดที่ทำงานคล้าย GitHub Copilot Coding Agent โดยเราสามารถสั่งงานทางพรอมพ์หรือ assign issue ให้ Jules รับผิดชอบ จากนั้น Jules จะดึงโค้ดไปสร้างพื้นที่พัฒนาของตัวเอง แล้วแก้ไขจนเสร็จ จึงส่งเป็น pull request กลับมาให้เรารีวิว รวมถึงสามารถส่งข้อความเสียงสรุปว่าแก้อะไรไปบ้าง

ไมโครซอฟท์นำ Grok มาให้เช่าบน Azure, Elon บอก Grok 3.5 จะมี Reasoning

By mk

on 20 May 2025 - 12:16 Tag: Grok, Microsoft Azure, Microsoft, LLM, Elon Musk, xAI

Grok

ไมโครซอฟท์ประกาศนำโมเดล Grok 3 ของ xAI มาให้บริการบน Azure AI Foundry ซึ่งถือเป็นครั้งแรกที่โมเดล Grok ถูกนำมาให้บริการเช่าใช้งานบนคลาวด์ด้วย

ราคาของ Grok 3 บน Azure คิดที่ขาอินพุต 3 ดอลลาร์ต่อ 1 ล้านโทเคน และขาเอาต์พุต 15 ดอลลาร์ต่อ 1 ล้านโทเคน ช่วงนี้ยังให้บริการฟรีแบบพรีวิวไปจนถึงต้นเดือนมิถุนายน 2025

เนื่องในโอกาส Grok มาอยู่บน Azure ทางซีอีโอ Satya Nadella จึงเชิญ Elon Musk มาขึ้นเวที (แบบผ่านวิดีโอ) และมาเล่าประวัติชีวิตของเขาที่เคยฝึกงานกับไมโครซอฟท์ด้วยนิดหน่อย เขายังพูดถึงแผนการออก Grok 3.5 ที่มีฟีเจอร์การให้เหตุผล (reasoning) ที่จะเปิดตัวในเร็วๆ นี้ด้วย

Microsoft Edge ผนวกโมเดล Phi เข้าในเบราว์เซอร์ เปิด API ให้เว็บแอพรัน AI ในเครื่อง

By mk

on 20 May 2025 - 11:25 Tag: Microsoft Edge, Phi, Microsoft, Browser, LLM

Microsoft Edge

Microsoft Edge ผนวกเอา Phi-4-mini โมเดลภาษาขนาดเล็กของไมโครซอฟท์ เข้ามารันในตัวเบราว์เซอร์ และเปิด API ให้เว็บแอพเรียกใช้งานได้

การมาถึงของฟีเจอร์นี้แปลว่า เราสามารถสร้างเว็บแอพที่เรียกใช้ฟีเจอร์ของ LLM แล้วประมวลผลแบบออฟไลน์ได้โดยไม่ต้องพึ่งพาเซิร์ฟเวอร์เลย

ฟีเจอร์นี้จะเริ่มใช้ใน Microsoft Edge 138 ที่ปัจจุบันอยู่ใน Canary/Dev Channel สามารถทำงานได้ทั้งบน Windows 10, 11, macOS 13.3 ขึ้นไป สเปกเครื่องขั้นต่ำจำเป็นต้องมีแรมจีพียูอย่างน้อย 5.5GB และสตอเรจอย่างน้อย 20GB เพื่อใช้ติดตั้งโมเดลตอนเรียกใช้งานครั้งแรก

GitHub เปิดซอร์สส่วนขยาย Copilot ใน VS Code ระบุพรอมพ์ไม่จำเป็นต้องเป็นความลับอีกแล้ว

By lew

on 20 May 2025 - 00:58 Tag: GitHub, LLM, Visual Studio Code, GitHub Copilot, Open Source

GitHub

GitHub เปิดซอร์สส่วนขยาย GitHub Copilot Chat ที่ใช้เชื่อม VS Code เข้ากับบริการ GitHub Copilot กลายเป็นโครงการโอเพนซอร์ส สัญญาอนุญาตแบบ MIT โดยให้เหตุผลสำคัญว่าปัญญาประดิษฐ์ในช่วงหลังดีขึ้นมาก และการสร้างพรอมพ์พิเศษที่เป็นความลับเพื่อให้เขียนโค้ดได้ดีขึ้นนั้นไม่จำเป็นอีกต่อไปแล้ว

ด้านดีของการโอเพนซอร์สนั้นมีหลายอย่าง เช่น เปิดให้ชุมชนเข้ามาช่วยแก้บั๊กและทดสอบฟีเจอร์ใหม่ๆ, ปรับปรุงการทำงานร่วมกับส่วนขยายอื่นๆ, และเปิดให้นักพัฒนาเข้ามาตรวจสอบว่า GitHub ส่งข้อมูลอะไรกลับเซิร์ฟเวอร์บ้าง

GitHub Copilot เพิ่มฟีเจอร์ Coding Agent แก้ปัญหาด้วยตัวเอง ส่งงานเป็น pull request

By lew

on 19 May 2025 - 23:22 Tag: GitHub, GitHub Copilot, LLM

GitHub

GitHub Copilot เพิ่มฟีเจอร์ทำงานอัตโนมัติเต็มรูปแบบเหมือนนักพัฒนาในทีมอีกคน โดยกระบวนการทำงานจะเริ่มเมื่อมีคนรายงานปัญหา ตัว Coding Agent จะสร้างพื้นที่พัฒนาแล้วพยายามแก้ไขปัญหาจนเสร็จแล้วค่อยส่งงานเป็น pull request ให้มนุษย์ตรวจสอบขั้นสุดท้ายทีเดียว

ทาง GitHub ระบุว่า Coding Agent แก้ปัญหาความซับซ้อนต่ำจนถึงปานกลางได้เป็นอย่างดีโดยเฉพาะโครงการที่มีชุดทดสอบอย่างดีแล้ว เมื่อแพตช์เสร็จแล้ว นักพัฒนายังสามารถรีวิวโค้ดเพิ่มเติมได้ ตัว Coding Agent ก็จะนำความเห็นกลับไปแก้ไขจนกว่าจะได้ผลลัพธ์ตามคำสั่ง

Windsurf เปิดตัวโมเดลเขียนโค้ด SWE-1 ของตัวเอง เน้นคุณภาพผลลัพธ์ทั้งโครงการซอฟต์แวร์

By mk

on 17 May 2025 - 15:08 Tag: Windsurf, Programming, LLM, Software Engineering

Windsurf

Windsurf หรือชื่อเดิม Codeium สตาร์ตอัพผู้พัฒนา IDE เขียนโค้ดพลัง AI ที่กำลังมีข่าวว่าจะโดน OpenAI ซื้อ เปิดตัวโมเดลเขียนโค้ดเวอร์ชันแรกของตัวเองชื่อ SWE-1

SWE-1 เป็นชุดของโมเดลที่เทรนมาสำหรับ "กระบวนการวิศวกรรมซอฟต์แวร์ทั้งหมด" (the entire software engineering process) ไม่ได้แค่สร้างโค้ดอย่างเดียว

Google Cloud โชว์ AI ช่วยเขียน SQL สำหรับ BigQuery และ AlloyDB เข้าใจข้อมูลและคำถามผู้ใช้

By lew

on 17 May 2025 - 14:54 Tag: Google Cloud, LLM, SQL, Database

Google Cloud

Google Cloud โชว์ฟีเจอร์ text-to-SQL ใน BigQuery Studio และ Cloud SQL Studio ที่มีตัวช่วยเขียน SQL โดยเปิดให้ผู้ใช้ถามคำถามภาษาธรรมชาติ

แม้ว่าโดยทั่ว LLM จะเขียน SQL ได้อยู่แล้ว แต่เมื่อใช้งานกับฐานข้อมูลจริงที่มีความซับซ้อนสูง และคำถามจริงของผู้ใช้ที่มักไม่ได้บอกข้อมูลครบนักก็จะเจอข้อจำกัด เช่น ผู้ใช้ถามว่าต้องการรองเท้าที่ขายดีที่สุด แต่ใน schema ของฐานข้อมูลไม่มีอะไรบอกว่าจะหารองเท้าอย่างไร หรือคำว่าขายดีที่สุดแปลว่าจำนวนที่ขายหรือยอดเงินที่ขายได้ ตลอดจนบางครั้ง LLM ก็สับสนถึงความต่างของ SQL แบรนด์ต่างๆ

[ไม่ยืนยัน] Meta เลื่อนเปิดตัวโมเดล AI ขนาดใหญ่ Llama 4 Behemoth ออกไปเป็นปลายปี

By arjin

on 16 May 2025 - 08:17 Tag: Meta AI, Llama, Meta, Rumors, LLM, Artificial Intelligence

Meta AI

The Wall Street Journal อ้างแหล่งข่าวที่เกี่ยวข้องเผยว่า Meta ได้เลื่อนกำหนดเผยแพร่โมเดลปัญญาประดิษฐ์ภาษาขนาดใหญ่ Behemoth ออกไปอีก เนื่องจากมีความกังวลเรื่องความสามารถที่ยังไม่ดีมากพอ

Meta เปิดตัว Llama 4 เมื่อเดือนเมษายน โดยเผยแพร่สองรุ่นย่อยคือ Scout ขนาดพารามิเตอร์ 109B และ Maverick ขนาดพารามิเตอร์รวม 400B บอกว่าทั้งสองรุ่นนี้เป็นการดึงความสามารถบางส่วนออกมาจากโมเดลตัวใหญ่ที่สุด Behemoth ขนาดพารามิเตอร์ 2T ซึ่งไม่ได้เปิดตัวพร้อมกัน

ChatGPT เริ่มใช้งานโมเดล GPT-4.1 และ GPT-4.1 mini แล้ว

By mk

on 15 May 2025 - 06:27 Tag: ChatGPT, OpenAI, LLM

ChatGPT

OpenAI ปล่อยโมเดล GPT-4.1 ที่เปิดตัวช่วงกลางเดือนเมษายน ให้กับผู้ใช้ ChatGPT แพ็กเกจเสียเงิน (Plus, Pro, Team) ใช้งาน หลังจากที่ช่วงแรกเปิดใช้เฉพาะผ่าน API อย่างเดียว การใช้งานผ่าน ChatGPT จำเป็นต้องเลือกโมเดลเองผ่านเมนู more models โดย GPT-4.1 มีเรตลิมิตเท่ากับ GPT-4o

นอกจากนี้ OpenAI ยังนำโมเดลรุ่นเล็ก GPT-4.1 mini มาใช้แทน GPT-4o mini ให้กับผู้ใช้ ChatGPT ทุกคน (รวมแพ็กเกจฟรีด้วย)

พัฒนาตัวเองได้แล้ว DeepMind เปิดตัว AlphaEvolve AI ช่วยออกแบบชิปและโค้ด เร่งความเร็ว Gemini ฝึกได้เร็วขึ้น

By lew

on 14 May 2025 - 23:32 Tag: DeepMind, Google, LLM

DeepMind

DeepMind เปิดตัวปัญญาประดิษฐ์ AlphaEvolve ชุดปัญญาประดิษฐ์แบบ agentic ที่ช่วยออกแบบฟังก์ชั่นต่างๆ เพื่อปรับปรุงประสิทธิภาพการทำงานของทีมงานกูเกิลเอง โดยใช้เข้าไปปร้บปรุงตั้งแต่ระดับชิป, ซอฟต์แวร์, และระบบการจัดการคลัสเตอร์

แอปเปิลปล่อยโมเดล FastVLM ปัญญาประดิษฐ์อ่านภาพความเร็วสูง รันในโทรศัพท์ได้ในตัว

By lew

on 14 May 2025 - 08:09 Tag: Apple, LLM

Apple

แอปเปิลปล่อยโมเดลปัญญาประดิษฐ์ FastVLM ประกอบไปด้วยโมเดล 6 รุ่นย่อย โดยความสามารถพิิเศษคือความเร็วในการรันสูงขึ้นมากเพราะสถาปัตยกรรม FastViHD ที่เป็น encoder ของปัญญาประดิษฐ์อ่านภาพ มีความเร็วในการอ่านภาพดีกว่าสถาปัตยกรรมอื่นๆ มากโดยเฉพาะในภาพขนาดใหญ่

ตัวโมเดลที่ปล่อยออกมาพัฒนาจากโมเดลที่มีอยู่แล้วในตลาด เช่น LLaVA-OneVision เมื่อแปลงเป็น FastVLM แล้วระยะเวลาเริ่มตอบคำตอบแรก (time-to-first-token - TTFT) เร็วขึ้น 85 เท่าตัว ละอัตราการอ่านภาพรวมเร็วขึ้น 3.4 เท่าตัว หรือโมเดลขนาด 7B พัฒนาจาก Qwen2-7B ก็มีระยะเวลาเริ่มตอบเร็วขึ้น 7.9 เท่าตัว

กูเกิลเพิ่มฟีเจอร์แคชอัตโนมัติให้ Gemini คุยต่อเนื่องได้ลดค่าใช้งานสูงสุด 75%

By lew

on 12 May 2025 - 02:26 Tag: Gemini, Google, LLM

Gemini

กูเกิลเพิ่มฟีเจอร์ Implicit Caching ให้กับลูกค้าที่ซื้อ Gemini ใช้งานผ่าน API โดยหลังจากนี้ไม่จำเป็นต้องระบุให้กูเกิลเก็บแคชไว้เอง

แนวทางการทำ caching ใน LLM นั้นอาศัยแนวทางการใช้งานที่หลายครั้งผู้ใช้มักเริ่มต้นบทสนทนากับปัญญาประดิษฐ์เหมือนๆ กัน เช่น การใส่ system prompt หรือการคุยกับเอกสารชุดเดิมๆ แต่เปลี่ยนคำถามใหม่ทำให้มีข้อความเดิมๆ ไปทุกครั้ง ผู้ให้บริการ LLM นั้นสามารถเก็บสถานะที่ประมวลผลข้อความเริ่มต้นแล้วเอาไว้ ทำให้สามารถตอบคำถามต่อไปได้ทันที ก่อนหน้านี้กูเกิลรองรับการทำ caching อยู่แล้ว แต่ผู้ใช้ต้องประกาศใช้งานเอง และเสียค่าสตอเรจเก็บแคช

กูเกิลอัพเดต Gemini 2.5 Pro รุ่นก่อนงาน I/O เขียนโค้ดทำเว็บเอาชนะ Claude ได้เป็นครั้งแรก

By lew

on 7 May 2025 - 00:01 Tag: Gemini, Google, LLM, Programming

Gemini

กูเกิลอัพเดตโมเดล Gemini 2.5 Pro เป็นเวอร์ชั่น 05-06 (6 พฤษภาคม) โดยชูประเด็นสำคัญคือมันทำคะแนนทดสอบด้านการเขียนเว็บ หรือ WebDev Arena เอาชนะ Claude 3.7 ได้เป็นตัวแรก นับแต่แยกหมวดหมู่มา แถมยังชนะค่อนข้างขาดด้วยคะแนน ELO 1420

ทางกูเกิลระบุว่าตั้งใจจะเปิดตัวโมเดลเวอร์ชั่นนี้ในงาน Google I/O ที่กำลังจะจัดปลายเดือนนี้ แต่เปลี่ยนใจปล่อยออกมาทันทีเลยให้ใช้กันก่อนงาน

Open WebUI เปลี่ยนไลเซนส์ เพิ่มเงื่อนไขห้ามแก้ไขโลโก้ เสี่ยงต่อสถานะซอฟต์แวร์โอเพนซอร์ส

By lew

on 6 May 2025 - 16:50 Tag: Open Source, LLM, Artificial Intelligence

Open Source

Open WebUI โครงการหน้าจอแชตยอดนิยมในโลกโอเพนซอร์ส ประกาศเปลี่ยนไลเซนส์จากเดิมใช้ BSD-3 ที่ให้อิสระอย่างมาก มาเป็น BSD-3 เวอร์ชั่นดัดแปลงที่บังคับห้ามลบแบรนด์ออกจากเว็บ

ผู้พิพากษาคดี Meta ใช้หนังสือไปฝึก AI มองไม่เห็นว่าการนำหนังสือไปฝึกเป็นการใช้งานที่เป็นธรรม (fair use)

By lew

OpenAI ชี้แจงกรณีปล่อยโมเดลช่างประจบ ระบุไม่มีชุดทดสอบอาการนี้โดยเฉพาะ หลังจากนี้จะเปิดให้สมัครทดสอบ

By lew

on 3 May 2025 - 00:56 Tag: OpenAI, LLM

OpenAI

OpenAI เขียนบล็อกอธิบายเพิ่มเติมเหตุการณ์ปล่อยอัพเดตโมเดลเวอร์ชั่นช่างประจบ พร้อมกับวิเคราะห์ถึงความผิดพลาดในการทดสอบที่ทำให้ปล่อยโมเดลเวอร์ชั่นนี้ออกมา

โดยปกติแล้วโมเดลของ OpenAI จะถูกฝึกด้วยระบบ reinforcement learning โดยมีระบบให้คะแนนคำตอบคุณภาพสูง ระบบให้คะแนนคิดคะแนนจากคำตอบที่ถูกต้อง, อ่านแล้วได้ประโยชน์, ปลอดภัย หลังจากฝึกแล้ว โมเดลจะถูกตรวจสอบหลายขั้น นับแต่การวัดประสิทธิภาพจากชุดทดสอบต่างๆ, การตรวจสอบโดยผู้เชี่ยวชาญ, การประเมินความปลอดภัย, และการทดสอบวงจำกัด

ไมโครซอฟท์เปิดตัว Phi-4 Reasoning โมเดลขนาดเล็กแต่มีเหตุผลใกล้เคียงรุ่นใหญ่

By mk

on 2 May 2025 - 18:20 Tag: Phi, Microsoft, LLM, Artificial Intelligence

Phi

ไมโครซอฟท์ปล่อยโมเดลภาษาขนาดเล็กตัวใหม่ในซีรีส์ Phi-4 เป็นโมเดลแบบให้เหตุผล (reasoning) จำนวน 3 ตัว 3 ขนาดคือ

Amazon เปิดตัว Nova Premier โมเดลรุ่นใหญ่ที่สุด เก่งสุดในตระกูล Nova ใช้สอนโมเดลอื่นได้

By mk

on 1 May 2025 - 20:47 Tag: Nova, Amazon, AWS, LLM, Artificial Intelligence

Nova

Amazon เปิดตัวโมเดลภาษารุ่นใหญ่ที่สุด Amazon Nova Premier ใหญ่กว่า Nova Pro รุ่นก่อนหน้านี้ มีขนาด context window 1 ล้านโทเคน (Pro 3 แสนโทเคน) สามารถทำงานที่ซับซ้อนสูง รวมถึงใช้เป็นโมเดลแม่ไปสอนโมเดลอื่นทำ distillation ได้ด้วย

JetBrains โอเพนซอร์ส Mellum โมเดลขนาดเล็กเน้นงานเฉพาะทาง เชี่ยวชาญด้านเติมโค้ด

By mk

on 30 April 2025 - 21:54 Tag: JetBrains, Programming, Open Source, LLM

JetBrains

JetBrains ประกาศโอเพนซอร์ส Mellum โมเดลช่วยเติมโค้ดที่เปิดตัวในปี 2024 และใช้กับ IDE ในตระกูล JetBrains โดยมีจุดเด่นเรื่องความเร็วกว่าการใช้โมเดลภาษา LLM ตัวใหญ่

JetBrains เรียก Mellum ว่าเป็น "focal model" สร้างมาเพื่อเขียนโค้ดโดยเฉพาะ ไม่ใช่โมเดลภาษา LLM ที่ปรับมาใช้เขียนโค้ด และแผนการของบริษัทคือการสร้างโมเดล Mellum หลายๆ ตัวที่ทำงานเฉพาะทางต่างกันไป เช่น ช่วยเติมโค้ด (code completion) หรือช่วยพยากรณ์ diff ของโค้ดแต่ละเวอร์ชัน

Meta เตรียมเปิดบริการ Llama API ให้บริการเองพร้อมกับผู้ให้บริการภายนอก

By lew

on 30 April 2025 - 13:34 Tag: Meta AI, Llama, LLM, API

Meta AI

Meta ประกาศเปิดบริการ Llama API ในงาน LlamaCon 2025 ให้บริการกับนักพัฒนาภายนอก ทำให้สามารถสร้างแอปพลิเคชั่นบน Llama 4 ได้ทันทีผ่านทาง OpenAI SDK

แม้ว่าจะเปิดบริการแพลตฟอร์มของตัวเอง แต่ทาง Meta ก็ยืนยันว่าจะร่วมกับผู้ให้บริการรายอื่นๆ เพื่อให้บริการ Llama 4 ไปพร้อมกัน โดยตอนนี้มี Cerebras และ Groq ให้บริการ Llama 4 แบบทดสอบผ่านทาง Llama API ด้วย ผู้ใช้สามารถเลือกว่าจะรันโมเดลผ่านผู้ให้บริการรายใดก็ได้ โดยระบุใน API

Subscribe to LLM