LLM | Blognone

Large Language Model

Ai2 เปิดตัว Olmo 3 โมเดลปัญญาประดิษฐ์แบบเปิดทุกจุด ทุกขั้นตอนการฝึกให้ไปดัดแปลงได้เอง

By lew

on 22 November 2025 - 09:08 Tag: Ai2, LLM, Artificial Intelligence, Open Source

Ai2

Ai2 สถาบันวิจัยที่ก่อตั้งโดย Paul Allen ผู้ร่วมก่อตั้งไมโครซอฟท์ เปิดตัว Olmo 3 โมเดลปัญญาประดิษฐ์แบบเปิดอย่างแท้จริง โดยเปิดเผย checkpoint ของทุกขั้นตอนการฝึกโมเดล, ชุดข้อมูลที่ใช้ฝึก, และซอฟต์แวร์ต่างๆ ที่จำเป็นต่อการฝึกแต่ละขั้น

โมเดลที่เผยแพร่เพื่อการใช้งาน ได้แก่

Google เปิดตัว Nano Banana Pro โมเดลแก้ไขและสร้างรูปภาพรุ่นใหม่พัฒนาบน Gemini 3 Pro

By arjin

on 21 November 2025 - 07:21 Tag: Gemini, Google, LLM, Artificial Intelligence

Gemini

กูเกิลเปิดตัวโมเดล AI สำหรับแก้ไขและสร้างรูปภาพรุ่นใหม่ Nano Banana Pro หรือในชื่อเป็นทางการคือ Gemini 3 Pro Image ซึ่งพัฒนาบนโมเดล Gemini 3 Pro ที่เปิดตัวไปเมื่อวันก่อน เพิ่มความสามารถหลายอย่างทั้งการเข้าใจภาพที่เห็นได้ดีขึ้น และสามารถให้รายละเอียดจากข้อมูลที่กำหนดดีกว่าเดิม

กูเกิลนำเสนอตัวอย่างความสามารถของ Nano Banana Pro หลายอย่างดังนี้

ปล่อยของยังไม่หมด Gemini 3 Deep Thinking ที่เก่งกว่า Gemini 3 Pro จะตามมาในอีกไม่กี่สัปดาห์

By mk

on 19 November 2025 - 08:56 Tag: Gemini, LLM, Google, Artificial Intelligence

Gemini

การเปิดตัวโมเดล Gemini 3 Pro ที่ทำคะแนนเบนช์มาร์คเพิ่มขึ้นแบบก้าวกระโดด สร้างเสียงฮือฮาให้วงการ AI อย่างมาก แต่มันยังไม่จบแค่นั้น เพราะกูเกิลยังมี Gemini 3 Deep Thinking ที่เหนือกว่าไปอีกขั้น รอปล่อยของอยู่

ถ้าดูจากคะแนนเบนช์มาร์ค Gemini 3 Pro สามารถทำคะแนน Humanity's Last Exam ที่ออกแบบมาวัดผลเรื่องการให้เหตุผล (reasoning) ได้ 37.5% พออัพเกรดเป็นโหมดคิดเยอะ Gemini 3 Deep Thinking คะแนนเพิ่มเป็น 41% (คู่แข่ง GPT-5 Pro ทำได้ 30.7%)

เปิดตัว Google Antigravity IDE สำหรับการเขียนโปรแกรมแบบคุม AI Agent เป็นหลัก

By lew

on 18 November 2025 - 23:16 Tag: Antigravity, Google, Programming, LLM, IDE

Antigravity

กูเกิลเปิดตัว IDE สำหรับการเขียนโปรแกรมด้วยปัญญาประดิษฐ์ของตัวเองในชื่อ Google Antigravity ซึ่งอาจจะนับเป็นคู่แข่งของ Cursor หรือ Windsurf ที่เป็นบริการ IDE เน้นใช้ AI เขียนโค้ด

กูเกิลระบุว่าการเขียนโค้ดเดิมพยายามทำงานสองแบบ คือการดูโค้ดแบบลงรายละเอียด เรียกว่า synchronous Editor ไปพร้อมกับการสั่งงานแบบดูผลสำเร็จ เรียกว่า asynchronous Manager ทำให้หน้าจอแน่น แนวทางของ Antigravity คือจะมุ่งสู่โหมด asynchronous

ระหว่างการทำงาน Antigravity จะบันทึกการทำงานลง knowledge base อัตโนมัติ ทำให้อะไรที่เคยสอน Gemini ไปก่อนแล้วจะสามารถนำกลับมาใช้ได้อีกในโครงการต่อไป

กูเกิลเปิดตัว Gemini 3 Pro แสดงความรู้ระดับปริญาเอก

By lew

on 18 November 2025 - 23:04 Tag: Gemini, Google, LLM, Nano Banana

Gemini

กูเกิลเปิดตัว Gemini 3 โดยยืนยันว่ามันเป็นโมเดลดีที่สุด (state-of-the-art) ในตลาดตอนนี้ มีความสามารถในการวางแผนอย่างลึกเหมาะกับการใช้งานทั้งถามตอบปกติ, เขียนโค้ด, และทำงานอื่นๆ

ตอนนี้ Gemini 3 ยังเปิดตัวเฉพาะรุ่น Pro เท่านั้น โดยสามารถใช้งานได้ทั้งแอป Gemini, AI Studio, และ Google Search AI Mode รุ่น Deep Think จะเป็นรุ่นดันความฉลาดไปสูงสุด แต่กำลังอยู่ระหว่างการทดสอบ และจะเปิดให้กับผู้สมัคร Google AI Ultra เท่านั้น

ผลทดสอบสำคัญๆ เช่น Humanity's Last Exam ของ Gemini 3 Pro อยู่ที่ 37.5% แซงหน้า GPT-5.1 ไปไกล ขณะที่ Gemini 3 Deep Think ทำคะแนนได้ถึง 41%

หลุด Model Card ของ Gemini 3 ผลทดสอบชนะทุกค่าย

By lew

on 18 November 2025 - 20:48 Tag: Gemini, LLM

Gemini

เอกสารกำกับโมเดลปัญญาประดิษฐ์ หรือ model card ของ Gemini 3 Pro โมเดลรุ่นต่อไปของกูเกิลที่ยังไม่เปิดตัวหลุดออกมาในเว็บ Pixeldrain แสดงให้เห็นว่าโมเดลรุ่นนี้เอาชนะได้ทั้ง Claude Sonnet 4.5 และ GPT-5.1 และหลายชุดทดสอบชนะขาดยกเว้นเพียง SWE-Bench Verified ที่แพ้ Sonnet 4.5 ไปเล็กน้อย

เอกสารระบุว่า Gemini 3 Pro รองรับอินพุต 1 ล้านโทเค็น และเอาต์พุต 64,000 โทเค็น เป็นโมเดลที่สร้างขึ้นมาใหม่ ไม่ได้ fine-tune จากโมเดลเดิม ตัวโมเดลเป็นแบบ sparse mixture-of-experts ที่โมเดลจะทำงานเพียงบางส่วนตามอินพุตที่ใช้งานอยู่

ตัวโมเดลฝึกข้อมูลถึงเดือนมกราคม 2025

Grok 4.1 มาแล้ว ผลทดสอบ Text Arena นำเด่น, อาการหลอนลดลง 3 เท่า

By arjin

on 18 November 2025 - 07:28 Tag: Grok, xAI, Artificial Intelligence, LLM

Grok

xAI เปิดตัว Grok 4.1 โมเดลปัญญาประดิษฐ์เวอร์ชันล่าสุด ที่เป็นรุ่นถัดไป Grok 4 ที่ออกมาเมื่อเดือนกรกฎาคม โดย Grok 4.1 มีสองโมเดลย่อยได้แก่ Grok 4.1 และ Grok 4.1 Thinking ซึ่งเริ่มอัปเดตให้ผู้ใช้งานทุกคนแล้วรวมทั้งแบบฟรี

ผลการทดสอบจาก LMArena ในหมวด Text Arena ที่เป็นการทดสอบหลายด้านแบบไม่เปิดเผยโมเดล พบว่าทั้ง Grok 4.1 และ Grok 4.1 Thinking มีคะแนนที่สูงโดดเด่นกว่าโมเดลอื่น

Anthropic รายงานแฮกเกอร์ใช้ Claude โจมตีบริษัทจำนวนมาก

By lew

on 17 November 2025 - 08:16 Tag: Anthropic, LLM, Security

Anthropic

Anthropic รายงานว่ามีผู้ใช้ที่น่าจะเป็นกลุ่มแฮกเกอร์ที่ได้รับการสนับสนุนจากรัฐบาลจีน (Chinese state-sponsored group) ใช้ Claude Code เพื่อแฮกหน่วยงานจำนวนมาก ทั้งบริษัทเทคโนโลยี, สถาบันการเงิน, บริษัทเคมีภัณฑ์, และหน่วยงานรัฐ

รายงานไม่บอกรายละเอียดช่องโหว่ที่คนร้ายใช้แฮกแต่อย่างใด แต่บอกเพียงว่า คนร้ายใช้ Claude Code ที่เชื่อมกับ MCP เฉพาะทางเช่น เครื่องมือสแกน, ค้นเว็บ, เครื่องมือวิเคราะห์โค้ด เมื่อพบช่องโหว่แล้วก็จะให้ Claude เขียนโค้ดเพื่อกวาดเอาชื่อผู้ใช้และรหัสผ่านจากระบบที่เจาะได้ไปใช้งานต่อไป

A21 Labs เสนอแนวทาง S-RAG แปลงเอกสารไม่มีโครงสร้างเป็นตารางก่อน เพื่อให้คิวรีได้ง่าย

By lew

on 16 November 2025 - 22:19 Tag: LLM, Israel

LLM

AI21 Labs บริษัทปัญญาประดิษฐ์จากฝั่งอิสราเอล ผู้สร้างโมเดลปัญญาประดิษฐ์ LLM ตระกูล Jurassic นำเสนอแนวทางการใช้เอกสารภายในมาตอบคำถาม (Retrieval-Augmented Generation - RAG) โดยมีแนวทางคือการแปลงข้อมูลที่ได้จากเอกสารต่างๆ ในองค์กรมาเป็นตารางฐานข้อมูลให้คิวรีได้ เรียกว่า Structured RAG หรือ S-RAG

S-RAG ต้องการตัวอย่างคำถามระหว่างการใส่เอกสาร เพื่อให้ปัญญาประดิษฐ์วิเคราะห์ได้ว่าควรดึงข้อมูลอะไรออกมาใส่ตาราง จากนั้นเมื่อผู้ใช้ถามคำถามจริงก็จะดึงข้อมูลจากตารางรูปแบบเดียวกับการแปลงคำถามเป็น SQL เดิมๆ

Deezer เผยผลสำรวจเรื่องเพลงที่สร้างจาก AI พบ 97% แยกเพลงคน-AI ไม่ได้, ส่วนใหญ่ต้องการให้แพลตฟอร์มต้องระบุด้วยถ้าเป็นเพลงจาก AI

By arjin

on 16 November 2025 - 16:44 Tag: Deezer, Music, Artificial Intelligence, LLM, Survey

Deezer

Deezer แพลตฟอร์มฟังเพลงสตรีมมิ่งร่วมมือกับ Ipsos บริษัทวิจัยการตลาด สำรวจกลุ่มตัวอย่างใน 8 ประเทศ จำนวน 9,000 คน เกี่ยวกับทัศนคติและประสบการณ์ในการฟังเพลงที่สร้างจาก AI ซึ่งเป็นประเด็นใหญ่ในจักรวาลฟังเพลงสตรีมมิ่งตอนนี้ เฉพาะ Deezer เองก็เปิดเผยว่ามีเพลงจาก AI อัปโหลดเข้ามาประมาณ 50,000 เพลงต่อวัน คิดเป็น 34% ของเพลงที่อัปโหลดมาทั้งหมด

ผลสำรวจเริ่มด้วยประเด็นการทดสอบ ให้กลุ่มตัวอย่างฟังเพลงแล้วแยกว่าเพลงใดสร้างโดยมนุษย์ และเพลงใดมาจาก AI พบว่า 97% ไม่สามารถแยกความแตกต่างได้, 71% รู้สึกประหลาดใจที่ตอบผิด และ 52% รู้สึกไม่สบายใจที่แยกความแตกต่างไม่ได้ โดย 51% เชื่อว่าเพลง AI มักมีคุณภาพเสียงที่แย่ หรือทำนองคุ้นเกินไป จึงอาจเป็นสาเหตุให้ตอบผิด

OpenAI เปิดตัว GPT-5.1 Instant และ GPT-5.1 Thinking มาแทน GPT-5

By mk

on 13 November 2025 - 06:37 Tag: OpenAI, ChatGPT, LLM

OpenAI

OpenAI เปิดตัวโมเดล GPT-5.1 เวอร์ชันอัพเกรดจาก GPT-5 โดยแยกเป็น GPT-5.1 Instant เวอร์ชันทำงานเร็ว และ GPT-5.1 Thinking ที่มีเวลาคิดใคร่ครวญนานขึ้น

OpenAI ระบุว่าโมเดล GPT-5.1 Instant จะฉลาดขึ้น ให้บทสนทนาที่อบอุ่นเป็นมิตรมากขึ้น (warmer by default) ปฏิบัติตามคำสั่งได้ดีขี้น ส่วน GPT-5.1 Thinking จะให้คำตอบที่เข้าใจง่ายขึ้น ทำงานง่ายๆ เร็วขึ้น และทำงานที่ซับซ้อนได้ดีขึ้น เพราะใช้เวลากับมันนานกว่าเดิม

OpenAI เปิดตัว GPT-5-Codex-Mini โมเดลเขียนโค้ดไซส์เล็ก โควต้าการรันเยอะกว่า

By mk

on 9 November 2025 - 16:12 Tag: OpenAI, ChatGPT, LLM, Programming

OpenAI

OpenAI เปิดตัว GPT-5-Codex-Mini เวอร์ชันเล็กกว่า ถูกกว่า ของ GPT-5-Codex โมเดลเขียนโค้ดที่เปิดตัวในเดือนกันยายน

การที่ GPT-5-Codex-Mini มีขนาดเล็กลง ทำให้ต้นทุนในการรันของมันถูกกว่า GPT-5-Codex ตัวเต็ม ส่งผลให้โควต้าการเรียกใช้งานเพิ่มขึ้นถึง 4 เท่า ในขณะที่ประสิทธิภาพลดน้อยลงไม่มากนัก ถือเป็นทางเลือกที่น่าสนใจสำหรับคนที่ต้องการใช้โมเดลเขียนโค้ดจากค่าย OpenAI

ตอนนี้ GPT-5-Codex-Mini เปิดให้ใช้งานแล้วผ่านคอมมานด์ไลน์ (CLI) และส่วนขยายของ IDE ส่วนการเรียกผ่าน API จะตามมาในเร็วๆ นี้

Gemini เพิ่มบริการ File Search โยนไฟล์ให้ AI ค้น คิดเฉพาะค่า embedding ไม่คิดค่าสตอเรจและค้นข้อมูล

By lew

on 7 November 2025 - 12:53 Tag: Gemini, Google, LLM

Gemini

Gemini API บริการ LLM สำหรับนักพัฒนาเพิ่มฟีเจอร์ สำหรับการโยนไฟล์เข้าไปแล้วให้ปัญญาประดิษฐ์ดึงกลับออกมาได้ ผ่านการเทียบค่า embedding ที่ได้จาก Gemini Embedding แต่มีจุดขายสำคัญคือราคาถูกกว่าคู่แข่งมาก

บริการนี้เทียบเท่ากับ File search ของ OpenAI ที่ออกมาก่อนหน้านี้นานแล้ว โดยผู้ใช้สามารถโยนไฟล์ลงไปในสตอเรจแล้วเชื่อมเข้ากับการถามคำถามจากสตอเรจที่เก็บไฟล์เอาไว้ แนวทางการเพิ่ม API เช่นนี้ทำให้ผู้สร้างแอปพลิเคชั่นที่ต้องการผูกกับความรู้เฉพาะทางสามารถทำได้โดยสะดวก ไม่ต้องตั้งฐานข้อมูลแบบ vector เอง

กูเกิลเปิดให้ใช้งาน Opal ในไทย สร้างแอป AI อย่างง่ายได้รวดเร็ว

By lew

on 7 November 2025 - 11:31 Tag: Google, Thailand, LLM

Google

กูเกิลเปิดให้ใช้งาน Opal เครื่องมือสร้างแอป AI แบบไม่ต้องเขียนโค้ด จากเดิมจำกัด 15 ประเทศเป็น 160 ประเทศทั่วโลกรวมถึงประเทศไทย

แม้ว่าหน้าจอ Opal จะเป็นการสร้างแอปจาก workflow แบบเดียวกับ n8n แต่ในความเป็นจริงเครื่องมือบน Opal นั้นจำกัดกว่ามาก มันถูกผูกกับ Google Drive, YouTube, Google Search, Google Maps เป็นหลัก ตัวโมดูล Generate สำหรับรัน Gemini นั้นสามารถขอสภาพอากาศ, ดาวน์โหลดเว็บ, และรันโค้ดได้เพิ่มเข้ามา ยังไม่มีแม้แต่การเทียบข้อมูล if-else หรือการรันซ้ำเป็น loop ตลอดจนการเชื่อมต่อบริการภายนอกที่ยังจำกัดเฉพาะบริการของกูเกิลเอง ได้แก่ Google Docs, Slides, Sheets

Moonshot AI เปิดตัว Kimi K2 Thinking โมเดล AI ขนาด 1T ที่แซงหน้า GPT-5 และ Claude 4.5 ในบางชุดทดสอบ

By lew

on 7 November 2025 - 11:08 Tag: Moonshot AI, LLM, Programming, ChatGPT

Moonshot AI

Moonshot AI บริษัทพัฒนาโมเดลปัญญาประดิษฐฺ์จากจีน เปิดตัว Kimi K2 Thinking โมเดลปัญาประดิษฐ์แบบคิดก่อนตอบ ที่ฝึกมาเพื่อการทำงานแบบ agentic โดยเฉพาะ สามารถเลือกใช้เครื่องมือได้ระดับ 200-300 ครั้งโดยไม่ต้องขอคำสั่งมนุษย์เพิ่มเติม

ผลทดสอบบางชุดของ Kimi K2 ได้ผลดีกว่า OpenAI GPT-5 และ Claude Sonnet 4.5 เสียอีก เช่น Humanity Last Exam ตัว Kimi K2 สามารถค้นหาข้อมูลแล้วเขียนโปรแกรมทดสอบเพื่อหาคำตอบต่อเนื่องได้หลายสิบรอบก่อนจะตอบคำถามจริงๆ

กูเกิลปิด Gemma ใน Google AI Studio หลังมีดราม่ากับวุฒิสมาชิก ยังเรียกได้ผ่าน API

By mk

on 3 November 2025 - 09:54 Tag: Gemma, Google, LLM, Artificial Intelligence

Gemma

กูเกิลประกาศถอดโมเดล Gemma ออกจาก Google AI Studio เหลือให้ใช้งานเฉพาะผ่าน API เพียงอย่างเดียว หลังเกิดดราม่ากับวุฒิสมาชิก Marsha Blackburn ของวุฒิสภาสหรัฐ

ชื่อแรกสำคัญเสมอ ทีมวิจัย AI ในอิตาลีตัดสินลำดับชื่อนักวิจัยด้วยการแข่ง Mario Kart

By lew

on 2 November 2025 - 12:49 Tag: LLM, Research, Mario Kart

LLM

ทีมวิจัยจาก GLADIA Research Lab ห้องวิจัยปัญญาประดิษฐ์ในกรุงโรม รายงานการศึกษาปัญญาประดิษฐ์กลุ่ม LLM แล้วพบว่าปัญญาประดิษฐ์กลุ่มนี้จำอินพุตได้ดีกว่าที่เคยคาดกันไว้ เปิดทางให้เราอาจจะหาพรอมพ์ตั้งต้นได้ หากรู้สถานะภายในของตัวโมเดล

กระบวนการทดสอบอาศัยการยิงพรอมพ์หลายพันล้านครั้ง และพบว่าสถานะภายในของโมเดลไม่ซ้ำกันเลย แสดงให้เห็นว่าโมเดลสามารถจำพรอมพ์ได้

ทีมงานโชว์อัลกอรึทึม Siplt ที่สามารถกู้คืนพรอมพ์ตั้งต้นได้อย่างแม่นยำภายในเวลาไม่นานนัก

สมาชิกทีมวิจัยมีทั้งหมด 6 คน ทีมงานระบุว่าแต่ละคนมีส่วนร่วมเท่ากัน จึงตัดสินลำดับชื่อในงานวิจัยด้วยการแข่ง Mario Kart

OpenAI เปิดตัว Aardvark บริการ Agent ค้นหาช่องโหว่ความปลอดภัย-สร้างแพตช์อัตโนมัติ

By mk

on 2 November 2025 - 09:31 Tag: OpenAI, LLM, Security, Security Patch, Artificial Intelligence

OpenAI

OpenAI เปิดตัวบริการย่อยชื่อ Aardvark เป็น agent ทำหน้าที่วิจัยด้านความปลอดภัยไซเบอร์ ด้วยพลังโมเดล GPT-5

หน้าที่ของ Aardvark คือค้นหาช่องโหว่ความปลอดภัยและอุดช่องโหว่นั้น ทำงานอัตโนมัติตลอดเวลา เริ่มจากการอ่านซอร์สโค้ด ค้นหาช่องโหว่ ค้นหารูปแบบการโจมตีที่เป็นไปได้ จัดระดับความรุนแรงช่องโหว่ และสร้างแพตช์ป้องกัน

arXiv เปลี่ยนนโยบาย บทความรีวิววงการสายคอมพิวเตอร์ต้องผ่านการรีวิวเท่านั้น หลังถูกถล่มด้วยรายงานเขียนด้วย LLM

By lew

on 2 November 2025 - 00:05 Tag: LLM, Research

LLM

arXiv บริการเผยแพร่รายงานวิจัยที่ปกติรับเผยแพร่รายงานที่ไม่ผ่านการรีวิวจากวารสารต่างๆ หรือหลายครั้งก็เป็นการเผยแพร่งานวิจ้ยที่ได้รับการรีวิวไปแล้ว แต่ผู้วิจัยต้องการเผยแพร่ให้ผู้อ่านได้ฟรี ประกาศเปลี่ยนนโยบายเฉพาะกลุ่มวิทยาการคอมพิวเตอร์ (computer science) สำหรับบทความรีวิว (reviews articles) และบทความแสดงจุดยืน (position papers) จากปัญหาบทความจำนวนมากเขียนจากปัญญาประดิษฐ์ LLM

IBM เปิดตัวโมเดลภาษา Granite 4.0 Nano รุ่นเล็ก รันในมือถือได้ ประสิทธิภาพดี

By mk

on 1 November 2025 - 14:56 Tag: IBM, LLM, Granite

IBM

IBM เปิดตัวโมเดลภาษา Granite 4.0 Nano เป็นเวอร์ชันไซส์เล็กของ Granite 4.0 ที่เปิดตัวไปก่อนหน้านี้ ลดขนาดพารามิเตอร์ลงจากของเดิมรุ่น Micro 3B ลงมาเหลือ 1B และ 350M ขนาดเล็กพอที่จะรันในสมาร์ทโฟนได้

Subscribe to LLM