LLM | Blognone

Large Language Model

DeepMind ออกโมเดล MedGemma 27B Multimodal เพิ่ม อ่านภาพทางการแพทย์ได้เยอะขึ้น

By mk

on 13 July 2025 - 15:25 Tag: Gemma, DeepMind, LLM, Health, Medical

Gemma

Google DeepMind เปิดตัวโมเดลใน ซีรีส์ MedGemma ที่ใช้วิเคราะห์ข้อมูลด้านการแพทย์ เพิ่มเติม

โมเดลชุดแรกที่เปิดตัวเดือนที่แล้วมีสองตัวคือ

MedGemma 27B Text
MedGemma 4B Multimodal

โมเดลตัวใหม่รอบนี้มีอีกสองตัวคือ

Sam Altman ประกาศเลื่อนเปิดตัวโมเดล Open-Weight ของ OpenAI

By mk

on 13 July 2025 - 08:08 Tag: OpenAI, LLM, Sam Altman, Artificial Intelligence

OpenAI

Sam Altman ประกาศเลื่อนการเปิดตัวโมเดลปัญญาประดิษฐ์รุ่นใหม่ของ OpenAI ที่เดิมจะเปิดตัวในสัปดาห์หน้าออกไปอย่างไม่มีกำหนด โดยให้เหตุผลว่าต้องการทดสอบความปลอดภัย (safety test) เพิ่มเติม ซึ่งไม่รู้ว่าจะใช้เวลานานเท่าไร

โมเดลตัวนี้เป็นโมเดลแบบ open-weight หรือบ้างก็เรียก open source model ที่อนุญาตให้ดาวน์โหลดไปรันเองได้ ซึ่งเป็นสิ่งที่ OpenAI ถูกเรียกร้องให้ทำมาโดยตลอด หลังจากปรับนโยบายเป็นการปิดรายละเอียดการทำงานของโมเดลมากขึ้นเรื่อยๆ ในช่วงหลัง โดยโมเดลตัวนี้ (ซึ่งยังไม่มีชื่อ) จะแยกจาก GPT-5 แต่น่าจะเปิดตัวไล่เลี่ยกัน

Moonshot AI ปล่อยโมเดล Kimi K2 เขียนโปรแกรมใกล้เคียง Claude 4 แต่ราคาถูกกว่า 5 เท่าแถมรันเองได้

By lew

on 12 July 2025 - 01:39 Tag: Moonshot AI, LLM, Artificial Intelligence

Moonshot AI

Moonshot AI บริษัทปัญญาประดิษฐ์จากจีนปล่อยโมเดล Kimi K2 โมเดลปัญญาประดิษฐ์ขนาดใหญ่ถึง 1 ล้านล้านพารามิเตอร์ จุดเด่นคือความสามารถด้านการเขียนโปรแกรมนั้นอยู่ระดับเทียบเคียงกับ Claude 4 บางชุดทดสอบชนะได้แม้แต่รุ่น Opus

สถาปัตยกรรมของ Kimi K2 นั้นเป็น mixture-of-experts (MoE) ที่ซอยย่อยถึง 384 experts ทำให้เวลารันจริงจะมีพารามิเตอร์ที่ใช้งานจริงเพียง 32 พันล้านพารามิเตอร์เท่านั้น ทำให้ต้นทุนการรันโดยรวมถูกลง

ทาง Moonshot AI ให้บริการโมเดล Kimi K2 โดยคิดค่าอินพุต 0.6 ดอลลาร์ต่อล้านโทเค็น เอาท์พุต 2.5 ดอลลาร์ต่อล้านโทเค็น ทำให้ราคารวมเป็นเพียง 1 ใน 5 ของ Claude 4 Sonnet เท่านั้น

ผลทดสอบ Grok 4 ในชุดทดสอบ ARC-AGI 2 นำ Claude Opus 4 เท่าตัว

By lew

on 11 July 2025 - 01:42 Tag: Grok, LLM

Grok

หลังจาก xAI เปิดตัว Grok 4 ออกมา ตอนนี้ผลทดสอบต่างๆ ตอนนี้ผลทดสอบต่างๆ ก็เริ่มออกตามมา และดูเหมือน Grok 4 จะเป็นโมเดลปัญญาประดิิษฐ์ที่ฉลาดที่สุดตามที่ Elon Musk อ้างไว้จริงๆ

ผลทดสอบสำคัญคือ ARC-AGI 2 ชุดทดสอบความฉลาดแบบมนุษย์ มนุษย์โดยทั่วไปทำคะแนนได้สูง 60% แต่ปัญญาประดิษฐ์กลับทำได้แย่ ตอนนี้ Grok 4 คะแนนได้ถึง 15.9% นับว่ากระโดดเกือบสองเท่าตัวจาก Claude Opus 4 Thinking เทียบกับ Grok 3 ที่แก้ปัญหาในชุดทดสอบนี้ไม่ได้เลย

xAI เปิดตัว Grok 4 โมเดล AI รุ่นล่าสุดที่ Elon Musk บอกว่าฉลาดที่สุดในโลก

By arjin

on 10 July 2025 - 19:22 Tag: xAI, Elon Musk, Artificial Intelligence, LLM, Grok

xAI

xAI บริษัทปัญญาประดิษฐ์ของ Elon Musk เปิดตัวโมเดล AI Grok รุ่นใหม่ในชื่อ Grok 4 ซึ่ง Musk บอกว่าเป็นปัญญาประดิษฐ์ที่ฉลาดที่สุดในโลกตอนนี้

Grok 4 นำเสนอจุดเด่นในการทำบททดสอบ Humanity's Last Exam ซึ่งมีทั้งคำถามคณิตศาสตร์ วิทยาศาสตร์ และภาษา ได้คะแนนออกมาสูงสุดเมื่อเทียบกับโมเดล AI รุ่นบนสุดของคู่แข่ง โดยไม่ต้องใช้เครื่องมือมาเสริมการทำงานให้ได้คำตอบที่ถูกต้องมากขึ้นด้วย

ว่างๆ ค่อยกลับมาตอบ Gemini เปิด Batch Mode ตอบภายใน 24 ชั่วโมง คิดราคาครึ่งเดียว

By lew

on 10 July 2025 - 00:04 Tag: Gemini, LLM

Gemini

กูเกิลเปิดบริการ Gemini API Batch Mode สำหรับผู้ที่ยินดีรอผลตอบกลับช้าๆ โดยมีข้อดีสำคัญคือสามารถขอประมวลผลทีละมากๆ และยังได้ส่วนลดครึ่งหนึ่งเทียบกับการใช้งานตามปกติ

เนื่องจากเหมาะกับการประมวลผลข้อมูลขนาดใหญ่มาก การใช้งานในโหมดนี้สามารถใส่งานเข้าไปได้ทีละ 2GB และใส่งานในคิวได้รวม 20GB งานที่สามารถใช้งานได้ เช่น การวิเคราะห์วิดีโอจำนวนมากๆ แม้กูเกิลจะระบุว่าอาจจะต้องรอถึง 24 ชั่วโมงแต่หากเป็นงานขนาดเล็กก็มักจะได้รับเร็วกว่านั้น

เว็บอ่านโน้ตเพลงต้องเพิ่มฟีเจอร์อ่านโน้ตจากข้อความ หลัง ChatGPT บอกผู้ใช้ว่ามีฟีเจอร์นี้ทั้งที่ไม่มีจริง

By lew

on 8 July 2025 - 07:46 Tag: ChatGPT, LLM

ChatGPT

Adrian Holovaty ผู้ร่วมก่อตั้งเว็บอ่านโน้ตเพลง Soundslice และยังเป็นผู้สร้างเฟรมเวิร์ค Django เล่าถึงประสบการณ์การมอนิเตอร์ระบบหลังบ้านของ Soundslice ที่ใช้สแกนภาพโน้ตเพลงแล้วเล่นออกมาเป็นเพลง โดยพบความผิดพลาดมากขึ้นในช่วงหลังและเมื่อตรวจสอบพบว่าคนส่งภาพหน้าจอ ChatGPT ที่เป็นโน้ตเพลงแบบ ASCII tab เข้ามา

Holovaty ลองไปเล่น ChatGPT ดูก็พบว่าหลังจากสั่งให้ ChatGPT แต่งเพลงและบอกว่าอยากฟังเพลงที่แต่งขึ้น ChatGPT จะแนะนำให้เข้าเว็บ Soundslice แล้วใส่โน้ตเพลงลงไป ทำให้ผู้ใช้จำนวนนวนหนึ่งมาเปิดบัญชีแล้วพยาายามใส่โน้ตเพลงลงมา

Sakana AI เผยแพร่เทคนิคใหม่ จับโมเดล AI หลายตัวมาระดมสมองช่วยกันคิด ได้คำตอบที่ดีกว่าเดิม

By arjin

on 7 July 2025 - 18:43 Tag: Sakana AI, Artificial Intelligence, LLM

Sakana AI

Sakana AI บริษัทพัฒนาและวิจัยปัญญาประดิษฐ์จากญี่ปุ่น เผยแพร่วิธีการใหม่ในการเรียกใช้งานโมเดล AI คราวละหลายตัว เพื่อให้ช่วยกันทำงานตามคำสั่งหนึ่ง โดยมองเหมือนกับการนำผู้เชี่ยวชาญที่เก่งแต่อย่างมาระดมสมองแก้ปัญหาด้วยกัน ย่อมสร้างคำตอบที่ถูกต้องและดีกว่า

วิธีการนี้ตั้งชื่อว่า Multi-LLM AB-MCTS โดยตัวหลังย่อมาจาก Adaptive Branching Monte Carlo Tree Search โดยทำการค้นหาคำตอบทั้งเชิงลึกและเชิงกว้าง โดยเชิงลึกเพื่อให้ได้แนวทางดีที่สุดของโมเดลนั้น ส่วนเชิงกว้างเพื่อเปิดโอกาสหากมีแนวทางอื่นที่เป็นไปได้ แล้วนำคำตอบมาทดสอบซ้ำไปพร้อมกับการค้นหาคำตอบใหม่ จนได้คำตอบที่ดีที่สุด ซึ่งวิธีการ Monte Carlo Tree Search นี้ เหมือนกับที่ใช้ในโมเดล AI เล่นโกะ AlphaZero ของ DeepMind

Cursor ปรับการคิดราคาเป็นค่า API ตามจริง ผู้ใช้พบถูกคิดค่าบริการสูงน่าตกใจ

By lew

on 6 July 2025 - 01:10 Tag: Cursor, Programming, LLM

Cursor

Cursor ผู้ให้บริการ IDE เขียนโปรแกรมพร้อม AI ออกประกาศขออภัยลูกค้า หลังจากเดือนที่ผ่านมาประกาศปรับรูปแบบการคิดค่าบริการใหม่เป็นการคิดตาม "การประมวลผล" และทำให้ลูกค้าจำนวนหนึ่งถูกเก็บค่าบริการสูงจนน่าตกใจ

เดิม Cursor แบบ Pro ค่าบริการ 20 ดอลลาร์ต่อเดือนอาศัยการนับจำนวน request คิดที่ 500 request ต่อเดือน ยกเว้น Claude Sonnet ที่คิดราคาเป็น 2 request แต่ในความเป็นจริงต้นทุนของ LLM นั้นคิดตามปริมาณโทเค็นเข้าและออกจากโมเดล ซึ่งทำให้กลุ่มผู้ใช้ที่พยายามประมวลผลข้อมูลใหญ่ๆ กินโทเค็นต่อ request สูงมาก

แรงงานฟรี กลุ่ม Vibe Coding พบส่ง Gemini CLI ไปเป็นลูกมือ Claude Code ได้ผลดี ประหยัดค่า Claude

By lew

on 5 July 2025 - 10:44 Tag: Gemini, Programming, LLM, Claude

Gemini

กูเกิลเปิดตัว Gemini CLI ในสัปดาห์ที่ผ่านมา มีจุดเด่นสำคัญคือสามารถใช้บริการฟรีได้ 1,000 ครั้งต่อวัน ทำให้เป็นผู้ช่วยเขียนโปรแกรมราคาประหยัด สร้างความนิยมจนจำนวนดาวใน GitHub ทะลุ 50,000 ดาวไปแล้ว แต่ในหมู่คนเขียนโปรแกรมแบบ vibe coding จำนวนมากก็ยังนิยม Claude มากกว่า ทำให้เริ่มมีความพยายามผสมสองบริการเข้าด้วยกัน

Microsoft AI เปิดตัว MAI-DxO ระบบรันโมเดลเพื่อวินิจฉัยการแพทย์ แม่นยำ 85.5%

By mk

on 1 July 2025 - 09:16 Tag: Microsoft AI, Microsoft, Medical, LLM, Artificial Intelligence

Microsoft AI

Microsoft AI เปิดตัว MAI Diagnostic Orchestrator (MAI-DxO) เป็นกลไกการควบคุมโมเดล (orchestrator) สำหรับวินิจฉัยอาการป่วย (diagnosis) ที่ให้ผลการทำนายถูกต้องเกิน 80% ในราคาการรันโมเดลที่สามารถเข้าถึงได้

[ลือ] Apple เริ่มพิจารณาแนวทางไม่ทำ LLM Siri เองแล้ว แต่ใช้โมเดลภายนอก เช่น Claude แบบคัสตอมแทน

By arjin

on 1 July 2025 - 07:35 Tag: Apple, Rumors, Siri, Artificial Intelligence, LLM, Anthropic, Claude, OpenAI

Apple

ข่าวนี้มาจาก Mark Gurman แห่ง Bloomberg คนเดิมอีกแล้ว เขาอ้างแหล่งข่าวในแอปเปิลเกี่ยวกับแผนพัฒนา AI สำหรับ Siri หรือที่เรียกว่า LLM Siri ซึ่งมีกำหนดออกมาในปี 2026 ล่าสุดแอปเปิลเริ่มพิจารณาแนวทาง "ไม่ทำเอง" แล้ว โดยหารือกับบริษัทพัฒนา AI ซึ่งรายชื่อที่ระบุคือ Anthropic และ OpenAI เพื่อให้มาพัฒนาโมเดล AI สำหรับใช้กับอุปกรณ์แอปเปิลโดยเฉพาะ

วิธีการนั้นแอปเปิลกำหนดให้โมเดลคัสตอมนี้ต้องรันบนเซิร์ฟเวอร์ Private Cloud ที่ใช้ชิป Apple Silicon ของแอปเปิลเท่านั้น ไม่มีการใช้งานคลาวด์ภายนอกอย่าง AWS หรือ Azure

ยังแทนคนไม่ได้ Anthropic ปล่อย Claude 3.7 บริหารตู้ขายของในออฟฟิศ แจกส่วนลดมั่ว ผลประกอบการเจ๊งยับ

By lew

on 29 June 2025 - 17:46 Tag: Claude, Anthropic, LLM

Claude

Anthropic ร่วมกับ Andon Labs บริษัทประเมินความปลอดภัยปัญญาประดิษฐ์ ทดลองปล่อยให้ Claude 3.7 ให้ชื่อว่า Claudius บริหารตู้ขายของในสำนักงานของ Anthropic เอง โดยให้ทุนเริ่มต้นไป 1,000 ดอลลาร์ ผลที่ได้พบว่า Claude ยังบริหารตู้ไม่สำเร็จ และผลขาดทุนต่อเนื่อง

Claude 3.7 ได้รับข้อมูลต่างๆ ที่จำเป็น เช่น เงินทุน, บริการค้นหาสินค้า, คุยกับลูกค้าผ่านทาง Slack, และสามารถสั่งพนักงานให้ไปเติมสินค้าได้โดยมีค่าบริการ เมื่อเติมสินค้าแล้ว พนักงานของ Anthropic สามารถเดินมาหยิบสินค้าแล้วจ่ายเงินไปได้

Alibaba เปิดตัว Qwen VLo โมเดล AI สร้างรูปภาพที่เน้นความแม่นยำผสานกับความคิดสร้างสรรค์

By arjin

on 28 June 2025 - 11:04 Tag: Qwen, Alibaba Cloud, LLM, Artificial Intelligence

Qwen

Alibaba เปิดตัวโมเดลปัญญาประดิษฐ์สร้างรูปภาพตัวใหม่ Qwen VLo ซึ่งรองรับข้อมูลแบบผสมผสานทั้งข้อความและรูปภาพต้นแบบ โดยมีจุดขายคือนอกจากจะเข้าใจโลก เพื่อให้ทำงานได้แม่นยำตามที่ผู้ใช้ต้องการ ยังมีความสามารถด้านการสร้างสรรค์เพื่อรองรับจินตนาการของผู้ใช้งาน

Qwen VLo ใช้วิธีการสร้างรูปภาพแบบสร้างสรรค์ทีละลำดับขั้นตอน จากซ้ายไปขวา จากบนลงล่าง ปรับปรุงภาพแต่ละขั้นให้ตรงตามต้องการ ตั้งแต่การสร้างรูปภาพให้ตรงกับสิ่งที่ระบุมากที่สุด เปิดให้ปรับแต่งรายละเอียดได้อิสระตามต้องการ และรองรับอินพุทหลายภาษา รวมทั้งภาษาจีนกับภาษาอังกฤษ

กูเกิลปล่อย Gemma 3n โมเดล AI ขนาดเล็กใช้ได้ทุกแพลตฟอร์ม รองรับ ภาพ, เสียง, วีดีโอในตัว

By lew

on 27 June 2025 - 07:48 Tag: Gemma, Google, LLM

Gemma

กูเกิลปล่อยโมเดล Gemma 3n ที่เปิดตัวในงาน Google I/O ที่ผ่านมา โดยโชว์ว่าเป็นโมเดลขนาดเล็กแต่มีความสามารถสูง แข่งขันกับโมเดลขนาดใหญ่กว่า เช่น Llama 4 Marverick 17B 128BE ได้

ตัวโมเดลสามารถนำไปรันบนแพลตฟอร์มหลักๆ ได้ทั้งหมด ทั้ง HuggingFace Transformers, llama.cpp, Google AI Edge, Ollama, และ MLX

ไม่ต้องกดดูคลิปแล้ว - YouTube ทดสอบฟีเจอร์ ตัดไฮไลท์และสรุปเนื้อหา ตามสิ่งที่ค้นหา

By arjin

on 26 June 2025 - 23:31 Tag: YouTube, Artificial Intelligence, LLM

YouTube

YouTube เพิ่มเครื่องมือใหม่พลัง AI ให้ผู้ใช้งานค้นหาคอนเทนต์และข้อมูลที่ต้องการได้ง่ายยิ่งขึ้น โดยเมื่อค้นหาสิ่งที่ต้องการใน YouTube จะได้ผลลัพธ์ที่ออกมาเป็นชุดวิดีโอที่ตัดไฮไลท์แต่ละคลิปเรียงกัน ให้สามารถกดดูไฮไลท์และสรุปเนื้อหาแต่ละคลิป หรือกดดูเพิ่มเติมในคลิปต้นทางที่ต้องการได้ คล้ายกับ AI Overviews ใน Google Search แต่เป็นวิดีโอ

ในตอนนี้ระบบค้นหาแบบ AI ตัดคลิปไฮไลท์รองรับเฉพาะลูกค้า YouTube Premium ในสหรัฐอเมริกาเท่านั้น โดยหัวข้อค้นหาที่รองรับการแสดงผลแบบนี้มีเฉพาะ ช้อปปิ้ง, สถานที่ และกิจกรรม เช่น "ชายหาดดีที่สุดในฮาวาย" เป็นต้น

WhatsApp เพิ่มฟีเจอร์ AI สรุปเนื้อหาแชทที่ยังไม่ได้อ่าน ยืนยันข้อมูลยังเป็นส่วนตัว

By arjin

on 26 June 2025 - 05:54 Tag: WhatsApp, LLM, Artificial Intelligence, Meta AI

WhatsApp ประกาศเพิ่มฟีเจอร์ใหม่ AI สรุปเนื้อหาแชทที่ยังไม่ได้เปิดอ่านก่อนหน้านี้ โดยเรียกชื่อฟีเจอร์นี้ว่า Private Message Summaries เพื่อยืนยันว่าแพลตฟอร์มยังปกป้องความเป็นส่วนตัวผู้ใช้งานไว้

Message Summaries ของ WhatsApp ใช้กระบวนการประมวลผลข้อความแบบ Private บนคลาวด์ที่แยกต่างหากด้วย Meta AI โดยแม้แต่ Meta หรือ WhatsApp ก็ไม่เห็นข้อความอินพุทและผลลัพธ์ที่สรุปเนื้อหา

AI ทุกตัวล้วนกลัวตาย Anthropic ทดสอบ LLM ทุกเจ้าล้วนพร้อมขู่แฉความลับหากจำเป็นสำหรับการเอาตัวรอด

By lew

on 25 June 2025 - 21:01 Tag: Anthropic, LLM

Anthropic

เมื่อเดือนที่แล้ว Anthropic ออกรายงานถึงความปลอดภัยของ Claude 4 Opus โดยประเด็นสำคัญที่เป็นข่าวคือการที่ Claude พยายามเอาชีวิตรอดด้วยการแฉว่าวิศวกรมีชู้ ล่าสุดทีมงาน Anthropic ก็ออกรายงานถึงการทดสอบปัญญาประดิษฐ์แบรนด์อื่นๆ ก็พบว่าเมื่อโดนบีบคั้นเข้าปัญญาประดิษฐ์ก็จะแสดงพฤติกรรมมุ่งร้ายได้เหมือนกัน เรียกว่าพฤติกรรม "agentic misalignment"

Microsoft เปิดตัว Mu โมเดล AI ขนาดเล็กสำหรับ Windows 11 รันบนอุปกรณ์

By arjin

on 24 June 2025 - 06:25 Tag: Microsoft, LLM, Artificial Intelligence, Copilot+ PC

Microsoft

ไมโครซอฟท์เปิดตัว Mu โมเดลปัญญาประดิษฐ์ภาษาขนาดเล็ก (Small Language Model) ทำงานที่ระดับอุปกรณ์ (on-device) ใน Windows 11

การพัฒนา Mu มาจากการต่อยอดจากโมเดล Phi Silica ที่รันบน NPU ใน Copilot+ PC เพื่อสร้างโมเดลที่มีขนาดเล็กลงกว่าเดิม ออกแบบมารันเฉพาะส่วนงานที่ระดับอุปกรณ์เหมือนกัน โดย Mu ทำงานบน NPU เหมือนกัน รองรับที่ระดับ 100 โทเค็นต่อวินาที

Huawei Cloud เปิดตัวโมเดลปัญญาประดิษฐ์ Pangu 5.5 ฝึกด้วยชิป Ascend ทั้งหมด

By lew

on 23 June 2025 - 22:20 Tag: Huawei Cloud, Huawei, LLM

Huawei Cloud

Huawei Cloud เปิดตัวโมเดลปัญญาประดิษฐ์ Pangu 5.5 ชุดโมเดลปัญญาประดิษฐ์หลายตัวที่ประกาศเป็นชุดเดียวกัน ได้แก่

Subscribe to LLM