Image

Large Language Model

By lew Founder on Tag: Ai2, LLM, Artificial Intelligence, Open Source
Ai2

Ai2 สถาบันวิจัยที่ก่อตั้งโดย Paul Allen ผู้ร่วมก่อตั้งไมโครซอฟท์ เปิดตัว Olmo 3 โมเดลปัญญาประดิษฐ์แบบเปิดอย่างแท้จริง โดยเปิดเผย checkpoint ของทุกขั้นตอนการฝึกโมเดล, ชุดข้อมูลที่ใช้ฝึก, และซอฟต์แวร์ต่างๆ ที่จำเป็นต่อการฝึกแต่ละขั้น

โมเดลที่เผยแพร่เพื่อการใช้งาน ได้แก่

By arjin Writer on Tag: Gemini, Google, LLM, Artificial Intelligence
Gemini

กูเกิลเปิดตัวโมเดล AI สำหรับแก้ไขและสร้างรูปภาพรุ่นใหม่ Nano Banana Pro หรือในชื่อเป็นทางการคือ Gemini 3 Pro Image ซึ่งพัฒนาบนโมเดล Gemini 3 Pro ที่เปิดตัวไปเมื่อวันก่อน เพิ่มความสามารถหลายอย่างทั้งการเข้าใจภาพที่เห็นได้ดีขึ้น และสามารถให้รายละเอียดจากข้อมูลที่กำหนดดีกว่าเดิม

กูเกิลนำเสนอตัวอย่างความสามารถของ Nano Banana Pro หลายอย่างดังนี้

By mk Founder on Tag: Gemini, LLM, Google, Artificial Intelligence
Gemini

การเปิดตัวโมเดล Gemini 3 Pro ที่ทำคะแนนเบนช์มาร์คเพิ่มขึ้นแบบก้าวกระโดด สร้างเสียงฮือฮาให้วงการ AI อย่างมาก แต่มันยังไม่จบแค่นั้น เพราะกูเกิลยังมี Gemini 3 Deep Thinking ที่เหนือกว่าไปอีกขั้น รอปล่อยของอยู่

ถ้าดูจากคะแนนเบนช์มาร์ค Gemini 3 Pro สามารถทำคะแนน Humanity's Last Exam ที่ออกแบบมาวัดผลเรื่องการให้เหตุผล (reasoning) ได้ 37.5% พออัพเกรดเป็นโหมดคิดเยอะ Gemini 3 Deep Thinking คะแนนเพิ่มเป็น 41% (คู่แข่ง GPT-5 Pro ทำได้ 30.7%)

By lew Founder on Tag: Antigravity, Google, Programming, LLM, IDE
Antigravity

กูเกิลเปิดตัว IDE สำหรับการเขียนโปรแกรมด้วยปัญญาประดิษฐ์ของตัวเองในชื่อ Google Antigravity ซึ่งอาจจะนับเป็นคู่แข่งของ Cursor หรือ Windsurf ที่เป็นบริการ IDE เน้นใช้ AI เขียนโค้ด

กูเกิลระบุว่าการเขียนโค้ดเดิมพยายามทำงานสองแบบ คือการดูโค้ดแบบลงรายละเอียด เรียกว่า synchronous Editor ไปพร้อมกับการสั่งงานแบบดูผลสำเร็จ เรียกว่า asynchronous Manager ทำให้หน้าจอแน่น แนวทางของ Antigravity คือจะมุ่งสู่โหมด asynchronous

ระหว่างการทำงาน Antigravity จะบันทึกการทำงานลง knowledge base อัตโนมัติ ทำให้อะไรที่เคยสอน Gemini ไปก่อนแล้วจะสามารถนำกลับมาใช้ได้อีกในโครงการต่อไป

By lew Founder on Tag: Gemini, Google, LLM, Nano Banana
Gemini

กูเกิลเปิดตัว Gemini 3 โดยยืนยันว่ามันเป็นโมเดลดีที่สุด (state-of-the-art) ในตลาดตอนนี้ มีความสามารถในการวางแผนอย่างลึกเหมาะกับการใช้งานทั้งถามตอบปกติ, เขียนโค้ด, และทำงานอื่นๆ

ตอนนี้ Gemini 3 ยังเปิดตัวเฉพาะรุ่น Pro เท่านั้น โดยสามารถใช้งานได้ทั้งแอป Gemini, AI Studio, และ Google Search AI Mode รุ่น Deep Think จะเป็นรุ่นดันความฉลาดไปสูงสุด แต่กำลังอยู่ระหว่างการทดสอบ และจะเปิดให้กับผู้สมัคร Google AI Ultra เท่านั้น

ผลทดสอบสำคัญๆ เช่น Humanity's Last Exam ของ Gemini 3 Pro อยู่ที่ 37.5% แซงหน้า GPT-5.1 ไปไกล ขณะที่ Gemini 3 Deep Think ทำคะแนนได้ถึง 41%

By lew Founder on Tag: Gemini, LLM
Gemini

เอกสารกำกับโมเดลปัญญาประดิษฐ์ หรือ model card ของ Gemini 3 Pro โมเดลรุ่นต่อไปของกูเกิลที่ยังไม่เปิดตัวหลุดออกมาในเว็บ Pixeldrain แสดงให้เห็นว่าโมเดลรุ่นนี้เอาชนะได้ทั้ง Claude Sonnet 4.5 และ GPT-5.1 และหลายชุดทดสอบชนะขาดยกเว้นเพียง SWE-Bench Verified ที่แพ้ Sonnet 4.5 ไปเล็กน้อย

เอกสารระบุว่า Gemini 3 Pro รองรับอินพุต 1 ล้านโทเค็น และเอาต์พุต 64,000 โทเค็น เป็นโมเดลที่สร้างขึ้นมาใหม่ ไม่ได้ fine-tune จากโมเดลเดิม ตัวโมเดลเป็นแบบ sparse mixture-of-experts ที่โมเดลจะทำงานเพียงบางส่วนตามอินพุตที่ใช้งานอยู่

ตัวโมเดลฝึกข้อมูลถึงเดือนมกราคม 2025

By arjin Writer on Tag: Grok, xAI, Artificial Intelligence, LLM
Grok

xAI เปิดตัว Grok 4.1 โมเดลปัญญาประดิษฐ์เวอร์ชันล่าสุด ที่เป็นรุ่นถัดไป Grok 4 ที่ออกมาเมื่อเดือนกรกฎาคม โดย Grok 4.1 มีสองโมเดลย่อยได้แก่ Grok 4.1 และ Grok 4.1 Thinking ซึ่งเริ่มอัปเดตให้ผู้ใช้งานทุกคนแล้วรวมทั้งแบบฟรี

ผลการทดสอบจาก LMArena ในหมวด Text Arena ที่เป็นการทดสอบหลายด้านแบบไม่เปิดเผยโมเดล พบว่าทั้ง Grok 4.1 และ Grok 4.1 Thinking มีคะแนนที่สูงโดดเด่นกว่าโมเดลอื่น

By lew Founder on Tag: Anthropic, LLM, Security
Anthropic

Anthropic รายงานว่ามีผู้ใช้ที่น่าจะเป็นกลุ่มแฮกเกอร์ที่ได้รับการสนับสนุนจากรัฐบาลจีน (Chinese state-sponsored group) ใช้ Claude Code เพื่อแฮกหน่วยงานจำนวนมาก ทั้งบริษัทเทคโนโลยี, สถาบันการเงิน, บริษัทเคมีภัณฑ์, และหน่วยงานรัฐ

รายงานไม่บอกรายละเอียดช่องโหว่ที่คนร้ายใช้แฮกแต่อย่างใด แต่บอกเพียงว่า คนร้ายใช้ Claude Code ที่เชื่อมกับ MCP เฉพาะทางเช่น เครื่องมือสแกน, ค้นเว็บ, เครื่องมือวิเคราะห์โค้ด เมื่อพบช่องโหว่แล้วก็จะให้ Claude เขียนโค้ดเพื่อกวาดเอาชื่อผู้ใช้และรหัสผ่านจากระบบที่เจาะได้ไปใช้งานต่อไป

By lew Founder on Tag: LLM, Israel
LLM

AI21 Labs บริษัทปัญญาประดิษฐ์จากฝั่งอิสราเอล ผู้สร้างโมเดลปัญญาประดิษฐ์ LLM ตระกูล Jurassic นำเสนอแนวทางการใช้เอกสารภายในมาตอบคำถาม (Retrieval-Augmented Generation - RAG) โดยมีแนวทางคือการแปลงข้อมูลที่ได้จากเอกสารต่างๆ ในองค์กรมาเป็นตารางฐานข้อมูลให้คิวรีได้ เรียกว่า Structured RAG หรือ S-RAG

S-RAG ต้องการตัวอย่างคำถามระหว่างการใส่เอกสาร เพื่อให้ปัญญาประดิษฐ์วิเคราะห์ได้ว่าควรดึงข้อมูลอะไรออกมาใส่ตาราง จากนั้นเมื่อผู้ใช้ถามคำถามจริงก็จะดึงข้อมูลจากตารางรูปแบบเดียวกับการแปลงคำถามเป็น SQL เดิมๆ

By arjin Writer on Tag: Deezer, Music, Artificial Intelligence, LLM, Survey
Deezer

Deezer แพลตฟอร์มฟังเพลงสตรีมมิ่งร่วมมือกับ Ipsos บริษัทวิจัยการตลาด สำรวจกลุ่มตัวอย่างใน 8 ประเทศ จำนวน 9,000 คน เกี่ยวกับทัศนคติและประสบการณ์ในการฟังเพลงที่สร้างจาก AI ซึ่งเป็นประเด็นใหญ่ในจักรวาลฟังเพลงสตรีมมิ่งตอนนี้ เฉพาะ Deezer เองก็เปิดเผยว่ามีเพลงจาก AI อัปโหลดเข้ามาประมาณ 50,000 เพลงต่อวัน คิดเป็น 34% ของเพลงที่อัปโหลดมาทั้งหมด

ผลสำรวจเริ่มด้วยประเด็นการทดสอบ ให้กลุ่มตัวอย่างฟังเพลงแล้วแยกว่าเพลงใดสร้างโดยมนุษย์ และเพลงใดมาจาก AI พบว่า 97% ไม่สามารถแยกความแตกต่างได้, 71% รู้สึกประหลาดใจที่ตอบผิด และ 52% รู้สึกไม่สบายใจที่แยกความแตกต่างไม่ได้ โดย 51% เชื่อว่าเพลง AI มักมีคุณภาพเสียงที่แย่ หรือทำนองคุ้นเกินไป จึงอาจเป็นสาเหตุให้ตอบผิด

By mk Founder on Tag: OpenAI, ChatGPT, LLM
OpenAI

OpenAI เปิดตัวโมเดล GPT-5.1 เวอร์ชันอัพเกรดจาก GPT-5 โดยแยกเป็น GPT-5.1 Instant เวอร์ชันทำงานเร็ว และ GPT-5.1 Thinking ที่มีเวลาคิดใคร่ครวญนานขึ้น

OpenAI ระบุว่าโมเดล GPT-5.1 Instant จะฉลาดขึ้น ให้บทสนทนาที่อบอุ่นเป็นมิตรมากขึ้น (warmer by default) ปฏิบัติตามคำสั่งได้ดีขี้น ส่วน GPT-5.1 Thinking จะให้คำตอบที่เข้าใจง่ายขึ้น ทำงานง่ายๆ เร็วขึ้น และทำงานที่ซับซ้อนได้ดีขึ้น เพราะใช้เวลากับมันนานกว่าเดิม

By mk Founder on Tag: OpenAI, ChatGPT, LLM, Programming
OpenAI

OpenAI เปิดตัว GPT-5-Codex-Mini เวอร์ชันเล็กกว่า ถูกกว่า ของ GPT-5-Codex โมเดลเขียนโค้ดที่เปิดตัวในเดือนกันยายน

การที่ GPT-5-Codex-Mini มีขนาดเล็กลง ทำให้ต้นทุนในการรันของมันถูกกว่า GPT-5-Codex ตัวเต็ม ส่งผลให้โควต้าการเรียกใช้งานเพิ่มขึ้นถึง 4 เท่า ในขณะที่ประสิทธิภาพลดน้อยลงไม่มากนัก ถือเป็นทางเลือกที่น่าสนใจสำหรับคนที่ต้องการใช้โมเดลเขียนโค้ดจากค่าย OpenAI

ตอนนี้ GPT-5-Codex-Mini เปิดให้ใช้งานแล้วผ่านคอมมานด์ไลน์ (CLI) และส่วนขยายของ IDE ส่วนการเรียกผ่าน API จะตามมาในเร็วๆ นี้

By lew Founder on Tag: Gemini, Google, LLM
Gemini

Gemini API บริการ LLM สำหรับนักพัฒนาเพิ่มฟีเจอร์ สำหรับการโยนไฟล์เข้าไปแล้วให้ปัญญาประดิษฐ์ดึงกลับออกมาได้ ผ่านการเทียบค่า embedding ที่ได้จาก Gemini Embedding แต่มีจุดขายสำคัญคือราคาถูกกว่าคู่แข่งมาก

บริการนี้เทียบเท่ากับ File search ของ OpenAI ที่ออกมาก่อนหน้านี้นานแล้ว โดยผู้ใช้สามารถโยนไฟล์ลงไปในสตอเรจแล้วเชื่อมเข้ากับการถามคำถามจากสตอเรจที่เก็บไฟล์เอาไว้ แนวทางการเพิ่ม API เช่นนี้ทำให้ผู้สร้างแอปพลิเคชั่นที่ต้องการผูกกับความรู้เฉพาะทางสามารถทำได้โดยสะดวก ไม่ต้องตั้งฐานข้อมูลแบบ vector เอง

By lew Founder on Tag: Google, Thailand, LLM
Google

กูเกิลเปิดให้ใช้งาน Opal เครื่องมือสร้างแอป AI แบบไม่ต้องเขียนโค้ด จากเดิมจำกัด 15 ประเทศเป็น 160 ประเทศทั่วโลกรวมถึงประเทศไทย

แม้ว่าหน้าจอ Opal จะเป็นการสร้างแอปจาก workflow แบบเดียวกับ n8n แต่ในความเป็นจริงเครื่องมือบน Opal นั้นจำกัดกว่ามาก มันถูกผูกกับ Google Drive, YouTube, Google Search, Google Maps เป็นหลัก ตัวโมดูล Generate สำหรับรัน Gemini นั้นสามารถขอสภาพอากาศ, ดาวน์โหลดเว็บ, และรันโค้ดได้เพิ่มเข้ามา ยังไม่มีแม้แต่การเทียบข้อมูล if-else หรือการรันซ้ำเป็น loop ตลอดจนการเชื่อมต่อบริการภายนอกที่ยังจำกัดเฉพาะบริการของกูเกิลเอง ได้แก่ Google Docs, Slides, Sheets

By lew Founder on Tag: Moonshot AI, LLM, Programming, ChatGPT
Moonshot AI

Moonshot AI บริษัทพัฒนาโมเดลปัญญาประดิษฐฺ์จากจีน เปิดตัว Kimi K2 Thinking โมเดลปัญาประดิษฐ์แบบคิดก่อนตอบ ที่ฝึกมาเพื่อการทำงานแบบ agentic โดยเฉพาะ สามารถเลือกใช้เครื่องมือได้ระดับ 200-300 ครั้งโดยไม่ต้องขอคำสั่งมนุษย์เพิ่มเติม

ผลทดสอบบางชุดของ Kimi K2 ได้ผลดีกว่า OpenAI GPT-5 และ Claude Sonnet 4.5 เสียอีก เช่น Humanity Last Exam ตัว Kimi K2 สามารถค้นหาข้อมูลแล้วเขียนโปรแกรมทดสอบเพื่อหาคำตอบต่อเนื่องได้หลายสิบรอบก่อนจะตอบคำถามจริงๆ

By mk Founder on Tag: Gemma, Google, LLM, Artificial Intelligence
Gemma

กูเกิลประกาศถอดโมเดล Gemma ออกจาก Google AI Studio เหลือให้ใช้งานเฉพาะผ่าน API เพียงอย่างเดียว หลังเกิดดราม่ากับวุฒิสมาชิก Marsha Blackburn ของวุฒิสภาสหรัฐ

By lew Founder on Tag: LLM, Research, Mario Kart
LLM

ทีมวิจัยจาก GLADIA Research Lab ห้องวิจัยปัญญาประดิษฐ์ในกรุงโรม รายงานการศึกษาปัญญาประดิษฐ์กลุ่ม LLM แล้วพบว่าปัญญาประดิษฐ์กลุ่มนี้จำอินพุตได้ดีกว่าที่เคยคาดกันไว้ เปิดทางให้เราอาจจะหาพรอมพ์ตั้งต้นได้ หากรู้สถานะภายในของตัวโมเดล

กระบวนการทดสอบอาศัยการยิงพรอมพ์หลายพันล้านครั้ง และพบว่าสถานะภายในของโมเดลไม่ซ้ำกันเลย แสดงให้เห็นว่าโมเดลสามารถจำพรอมพ์ได้

ทีมงานโชว์อัลกอรึทึม Siplt ที่สามารถกู้คืนพรอมพ์ตั้งต้นได้อย่างแม่นยำภายในเวลาไม่นานนัก

สมาชิกทีมวิจัยมีทั้งหมด 6 คน ทีมงานระบุว่าแต่ละคนมีส่วนร่วมเท่ากัน จึงตัดสินลำดับชื่อในงานวิจัยด้วยการแข่ง Mario Kart

By mk Founder on Tag: OpenAI, LLM, Security, Security Patch, Artificial Intelligence
OpenAI

OpenAI เปิดตัวบริการย่อยชื่อ Aardvark เป็น agent ทำหน้าที่วิจัยด้านความปลอดภัยไซเบอร์ ด้วยพลังโมเดล GPT-5

หน้าที่ของ Aardvark คือค้นหาช่องโหว่ความปลอดภัยและอุดช่องโหว่นั้น ทำงานอัตโนมัติตลอดเวลา เริ่มจากการอ่านซอร์สโค้ด ค้นหาช่องโหว่ ค้นหารูปแบบการโจมตีที่เป็นไปได้ จัดระดับความรุนแรงช่องโหว่ และสร้างแพตช์ป้องกัน

By lew Founder on Tag: LLM, Research
LLM

arXiv บริการเผยแพร่รายงานวิจัยที่ปกติรับเผยแพร่รายงานที่ไม่ผ่านการรีวิวจากวารสารต่างๆ หรือหลายครั้งก็เป็นการเผยแพร่งานวิจ้ยที่ได้รับการรีวิวไปแล้ว แต่ผู้วิจัยต้องการเผยแพร่ให้ผู้อ่านได้ฟรี ประกาศเปลี่ยนนโยบายเฉพาะกลุ่มวิทยาการคอมพิวเตอร์ (computer science) สำหรับบทความรีวิว (reviews articles) และบทความแสดงจุดยืน (position papers) จากปัญหาบทความจำนวนมากเขียนจากปัญญาประดิษฐ์ LLM

By mk Founder on Tag: IBM, LLM, Granite
IBM

IBM เปิดตัวโมเดลภาษา Granite 4.0 Nano เป็นเวอร์ชันไซส์เล็กของ Granite 4.0 ที่เปิดตัวไปก่อนหน้านี้ ลดขนาดพารามิเตอร์ลงจากของเดิมรุ่น Micro 3B ลงมาเหลือ 1B และ 350M ขนาดเล็กพอที่จะรันในสมาร์ทโฟนได้

Subscribe to LLM