Image

Large Language Model

By mk Founder on Tag: Gemma, DeepMind, LLM, Health, Medical
Gemma

Google DeepMind เปิดตัวโมเดลใน ซีรีส์ MedGemma ที่ใช้วิเคราะห์ข้อมูลด้านการแพทย์ เพิ่มเติม

โมเดลชุดแรกที่เปิดตัวเดือนที่แล้วมีสองตัวคือ

  • MedGemma 27B Text
  • MedGemma 4B Multimodal

โมเดลตัวใหม่รอบนี้มีอีกสองตัวคือ

By mk Founder on Tag: OpenAI, LLM, Sam Altman, Artificial Intelligence
OpenAI

Sam Altman ประกาศเลื่อนการเปิดตัวโมเดลปัญญาประดิษฐ์รุ่นใหม่ของ OpenAI ที่เดิมจะเปิดตัวในสัปดาห์หน้าออกไปอย่างไม่มีกำหนด โดยให้เหตุผลว่าต้องการทดสอบความปลอดภัย (safety test) เพิ่มเติม ซึ่งไม่รู้ว่าจะใช้เวลานานเท่าไร

โมเดลตัวนี้เป็นโมเดลแบบ open-weight หรือบ้างก็เรียก open source model ที่อนุญาตให้ดาวน์โหลดไปรันเองได้ ซึ่งเป็นสิ่งที่ OpenAI ถูกเรียกร้องให้ทำมาโดยตลอด หลังจากปรับนโยบายเป็นการปิดรายละเอียดการทำงานของโมเดลมากขึ้นเรื่อยๆ ในช่วงหลัง โดยโมเดลตัวนี้ (ซึ่งยังไม่มีชื่อ) จะแยกจาก GPT-5 แต่น่าจะเปิดตัวไล่เลี่ยกัน

By lew Founder on Tag: Moonshot AI, LLM, Artificial Intelligence
Moonshot AI

Moonshot AI บริษัทปัญญาประดิษฐ์จากจีนปล่อยโมเดล Kimi K2 โมเดลปัญญาประดิษฐ์ขนาดใหญ่ถึง 1 ล้านล้านพารามิเตอร์ จุดเด่นคือความสามารถด้านการเขียนโปรแกรมนั้นอยู่ระดับเทียบเคียงกับ Claude 4 บางชุดทดสอบชนะได้แม้แต่รุ่น Opus

สถาปัตยกรรมของ Kimi K2 นั้นเป็น mixture-of-experts (MoE) ที่ซอยย่อยถึง 384 experts ทำให้เวลารันจริงจะมีพารามิเตอร์ที่ใช้งานจริงเพียง 32 พันล้านพารามิเตอร์เท่านั้น ทำให้ต้นทุนการรันโดยรวมถูกลง

ทาง Moonshot AI ให้บริการโมเดล Kimi K2 โดยคิดค่าอินพุต 0.6 ดอลลาร์ต่อล้านโทเค็น เอาท์พุต 2.5 ดอลลาร์ต่อล้านโทเค็น ทำให้ราคารวมเป็นเพียง 1 ใน 5 ของ Claude 4 Sonnet เท่านั้น

By lew Founder on Tag: Grok, LLM
Grok

หลังจาก xAI เปิดตัว Grok 4 ออกมา ตอนนี้ผลทดสอบต่างๆ ตอนนี้ผลทดสอบต่างๆ ก็เริ่มออกตามมา และดูเหมือน Grok 4 จะเป็นโมเดลปัญญาประดิิษฐ์ที่ฉลาดที่สุดตามที่ Elon Musk อ้างไว้จริงๆ

ผลทดสอบสำคัญคือ ARC-AGI 2 ชุดทดสอบความฉลาดแบบมนุษย์ มนุษย์โดยทั่วไปทำคะแนนได้สูง 60% แต่ปัญญาประดิษฐ์กลับทำได้แย่ ตอนนี้ Grok 4 คะแนนได้ถึง 15.9% นับว่ากระโดดเกือบสองเท่าตัวจาก Claude Opus 4 Thinking เทียบกับ Grok 3 ที่แก้ปัญหาในชุดทดสอบนี้ไม่ได้เลย

By arjin Writer on Tag: xAI, Elon Musk, Artificial Intelligence, LLM, Grok
xAI

xAI บริษัทปัญญาประดิษฐ์ของ Elon Musk เปิดตัวโมเดล AI Grok รุ่นใหม่ในชื่อ Grok 4 ซึ่ง Musk บอกว่าเป็นปัญญาประดิษฐ์ที่ฉลาดที่สุดในโลกตอนนี้

Grok 4 นำเสนอจุดเด่นในการทำบททดสอบ Humanity's Last Exam ซึ่งมีทั้งคำถามคณิตศาสตร์ วิทยาศาสตร์ และภาษา ได้คะแนนออกมาสูงสุดเมื่อเทียบกับโมเดล AI รุ่นบนสุดของคู่แข่ง โดยไม่ต้องใช้เครื่องมือมาเสริมการทำงานให้ได้คำตอบที่ถูกต้องมากขึ้นด้วย

By lew Founder on Tag: Gemini, LLM
Gemini

กูเกิลเปิดบริการ Gemini API Batch Mode สำหรับผู้ที่ยินดีรอผลตอบกลับช้าๆ โดยมีข้อดีสำคัญคือสามารถขอประมวลผลทีละมากๆ และยังได้ส่วนลดครึ่งหนึ่งเทียบกับการใช้งานตามปกติ

เนื่องจากเหมาะกับการประมวลผลข้อมูลขนาดใหญ่มาก การใช้งานในโหมดนี้สามารถใส่งานเข้าไปได้ทีละ 2GB และใส่งานในคิวได้รวม 20GB งานที่สามารถใช้งานได้ เช่น การวิเคราะห์วิดีโอจำนวนมากๆ แม้กูเกิลจะระบุว่าอาจจะต้องรอถึง 24 ชั่วโมงแต่หากเป็นงานขนาดเล็กก็มักจะได้รับเร็วกว่านั้น

By lew Founder on Tag: ChatGPT, LLM
ChatGPT

Adrian Holovaty ผู้ร่วมก่อตั้งเว็บอ่านโน้ตเพลง Soundslice และยังเป็นผู้สร้างเฟรมเวิร์ค Django เล่าถึงประสบการณ์การมอนิเตอร์ระบบหลังบ้านของ Soundslice ที่ใช้สแกนภาพโน้ตเพลงแล้วเล่นออกมาเป็นเพลง โดยพบความผิดพลาดมากขึ้นในช่วงหลังและเมื่อตรวจสอบพบว่าคนส่งภาพหน้าจอ ChatGPT ที่เป็นโน้ตเพลงแบบ ASCII tab เข้ามา

Holovaty ลองไปเล่น ChatGPT ดูก็พบว่าหลังจากสั่งให้ ChatGPT แต่งเพลงและบอกว่าอยากฟังเพลงที่แต่งขึ้น ChatGPT จะแนะนำให้เข้าเว็บ Soundslice แล้วใส่โน้ตเพลงลงไป ทำให้ผู้ใช้จำนวนนวนหนึ่งมาเปิดบัญชีแล้วพยาายามใส่โน้ตเพลงลงมา

By arjin Writer on Tag: Sakana AI, Artificial Intelligence, LLM
Sakana AI

Sakana AI บริษัทพัฒนาและวิจัยปัญญาประดิษฐ์จากญี่ปุ่น เผยแพร่วิธีการใหม่ในการเรียกใช้งานโมเดล AI คราวละหลายตัว เพื่อให้ช่วยกันทำงานตามคำสั่งหนึ่ง โดยมองเหมือนกับการนำผู้เชี่ยวชาญที่เก่งแต่อย่างมาระดมสมองแก้ปัญหาด้วยกัน ย่อมสร้างคำตอบที่ถูกต้องและดีกว่า

วิธีการนี้ตั้งชื่อว่า Multi-LLM AB-MCTS โดยตัวหลังย่อมาจาก Adaptive Branching Monte Carlo Tree Search โดยทำการค้นหาคำตอบทั้งเชิงลึกและเชิงกว้าง โดยเชิงลึกเพื่อให้ได้แนวทางดีที่สุดของโมเดลนั้น ส่วนเชิงกว้างเพื่อเปิดโอกาสหากมีแนวทางอื่นที่เป็นไปได้ แล้วนำคำตอบมาทดสอบซ้ำไปพร้อมกับการค้นหาคำตอบใหม่ จนได้คำตอบที่ดีที่สุด ซึ่งวิธีการ Monte Carlo Tree Search นี้ เหมือนกับที่ใช้ในโมเดล AI เล่นโกะ AlphaZero ของ DeepMind

By lew Founder on Tag: Cursor, Programming, LLM
Cursor

Cursor ผู้ให้บริการ IDE เขียนโปรแกรมพร้อม AI ออกประกาศขออภัยลูกค้า หลังจากเดือนที่ผ่านมาประกาศปรับรูปแบบการคิดค่าบริการใหม่เป็นการคิดตาม "การประมวลผล" และทำให้ลูกค้าจำนวนหนึ่งถูกเก็บค่าบริการสูงจนน่าตกใจ

เดิม Cursor แบบ Pro ค่าบริการ 20 ดอลลาร์ต่อเดือนอาศัยการนับจำนวน request คิดที่ 500 request ต่อเดือน ยกเว้น Claude Sonnet ที่คิดราคาเป็น 2 request แต่ในความเป็นจริงต้นทุนของ LLM นั้นคิดตามปริมาณโทเค็นเข้าและออกจากโมเดล ซึ่งทำให้กลุ่มผู้ใช้ที่พยายามประมวลผลข้อมูลใหญ่ๆ กินโทเค็นต่อ request สูงมาก

By lew Founder on Tag: Gemini, Programming, LLM, Claude
Gemini

กูเกิลเปิดตัว Gemini CLI ในสัปดาห์ที่ผ่านมา มีจุดเด่นสำคัญคือสามารถใช้บริการฟรีได้ 1,000 ครั้งต่อวัน ทำให้เป็นผู้ช่วยเขียนโปรแกรมราคาประหยัด สร้างความนิยมจนจำนวนดาวใน GitHub ทะลุ 50,000 ดาวไปแล้ว แต่ในหมู่คนเขียนโปรแกรมแบบ vibe coding จำนวนมากก็ยังนิยม Claude มากกว่า ทำให้เริ่มมีความพยายามผสมสองบริการเข้าด้วยกัน

By mk Founder on Tag: Microsoft AI, Microsoft, Medical, LLM, Artificial Intelligence
Microsoft AI

Microsoft AI เปิดตัว MAI Diagnostic Orchestrator (MAI-DxO) เป็นกลไกการควบคุมโมเดล (orchestrator) สำหรับวินิจฉัยอาการป่วย (diagnosis) ที่ให้ผลการทำนายถูกต้องเกิน 80% ในราคาการรันโมเดลที่สามารถเข้าถึงได้

By arjin Writer on Tag: Apple, Rumors, Siri, Artificial Intelligence, LLM, Anthropic, Claude, OpenAI
Apple

ข่าวนี้มาจาก Mark Gurman แห่ง Bloomberg คนเดิมอีกแล้ว เขาอ้างแหล่งข่าวในแอปเปิลเกี่ยวกับแผนพัฒนา AI สำหรับ Siri หรือที่เรียกว่า LLM Siri ซึ่งมีกำหนดออกมาในปี 2026 ล่าสุดแอปเปิลเริ่มพิจารณาแนวทาง "ไม่ทำเอง" แล้ว โดยหารือกับบริษัทพัฒนา AI ซึ่งรายชื่อที่ระบุคือ Anthropic และ OpenAI เพื่อให้มาพัฒนาโมเดล AI สำหรับใช้กับอุปกรณ์แอปเปิลโดยเฉพาะ

วิธีการนั้นแอปเปิลกำหนดให้โมเดลคัสตอมนี้ต้องรันบนเซิร์ฟเวอร์ Private Cloud ที่ใช้ชิป Apple Silicon ของแอปเปิลเท่านั้น ไม่มีการใช้งานคลาวด์ภายนอกอย่าง AWS หรือ Azure

By lew Founder on Tag: Claude, Anthropic, LLM
Claude

Anthropic ร่วมกับ Andon Labs บริษัทประเมินความปลอดภัยปัญญาประดิษฐ์ ทดลองปล่อยให้ Claude 3.7 ให้ชื่อว่า Claudius บริหารตู้ขายของในสำนักงานของ Anthropic เอง โดยให้ทุนเริ่มต้นไป 1,000 ดอลลาร์ ผลที่ได้พบว่า Claude ยังบริหารตู้ไม่สำเร็จ และผลขาดทุนต่อเนื่อง

Claude 3.7 ได้รับข้อมูลต่างๆ ที่จำเป็น เช่น เงินทุน, บริการค้นหาสินค้า, คุยกับลูกค้าผ่านทาง Slack, และสามารถสั่งพนักงานให้ไปเติมสินค้าได้โดยมีค่าบริการ เมื่อเติมสินค้าแล้ว พนักงานของ Anthropic สามารถเดินมาหยิบสินค้าแล้วจ่ายเงินไปได้

By arjin Writer on Tag: Qwen, Alibaba Cloud, LLM, Artificial Intelligence
Qwen

Alibaba เปิดตัวโมเดลปัญญาประดิษฐ์สร้างรูปภาพตัวใหม่ Qwen VLo ซึ่งรองรับข้อมูลแบบผสมผสานทั้งข้อความและรูปภาพต้นแบบ โดยมีจุดขายคือนอกจากจะเข้าใจโลก เพื่อให้ทำงานได้แม่นยำตามที่ผู้ใช้ต้องการ ยังมีความสามารถด้านการสร้างสรรค์เพื่อรองรับจินตนาการของผู้ใช้งาน

Qwen VLo ใช้วิธีการสร้างรูปภาพแบบสร้างสรรค์ทีละลำดับขั้นตอน จากซ้ายไปขวา จากบนลงล่าง ปรับปรุงภาพแต่ละขั้นให้ตรงตามต้องการ ตั้งแต่การสร้างรูปภาพให้ตรงกับสิ่งที่ระบุมากที่สุด เปิดให้ปรับแต่งรายละเอียดได้อิสระตามต้องการ และรองรับอินพุทหลายภาษา รวมทั้งภาษาจีนกับภาษาอังกฤษ

By lew Founder on Tag: Gemma, Google, LLM
Gemma

กูเกิลปล่อยโมเดล Gemma 3n ที่เปิดตัวในงาน Google I/O ที่ผ่านมา โดยโชว์ว่าเป็นโมเดลขนาดเล็กแต่มีความสามารถสูง แข่งขันกับโมเดลขนาดใหญ่กว่า เช่น Llama 4 Marverick 17B 128BE ได้

ตัวโมเดลสามารถนำไปรันบนแพลตฟอร์มหลักๆ ได้ทั้งหมด ทั้ง HuggingFace Transformers, llama.cpp, Google AI Edge, Ollama, และ MLX

By arjin Writer on Tag: YouTube, Artificial Intelligence, LLM
YouTube

YouTube เพิ่มเครื่องมือใหม่พลัง AI ให้ผู้ใช้งานค้นหาคอนเทนต์และข้อมูลที่ต้องการได้ง่ายยิ่งขึ้น โดยเมื่อค้นหาสิ่งที่ต้องการใน YouTube จะได้ผลลัพธ์ที่ออกมาเป็นชุดวิดีโอที่ตัดไฮไลท์แต่ละคลิปเรียงกัน ให้สามารถกดดูไฮไลท์และสรุปเนื้อหาแต่ละคลิป หรือกดดูเพิ่มเติมในคลิปต้นทางที่ต้องการได้ คล้ายกับ AI Overviews ใน Google Search แต่เป็นวิดีโอ

ในตอนนี้ระบบค้นหาแบบ AI ตัดคลิปไฮไลท์รองรับเฉพาะลูกค้า YouTube Premium ในสหรัฐอเมริกาเท่านั้น โดยหัวข้อค้นหาที่รองรับการแสดงผลแบบนี้มีเฉพาะ ช้อปปิ้ง, สถานที่ และกิจกรรม เช่น "ชายหาดดีที่สุดในฮาวาย" เป็นต้น

By arjin Writer on Tag: WhatsApp, LLM, Artificial Intelligence, Meta AI
WhatsApp

WhatsApp ประกาศเพิ่มฟีเจอร์ใหม่ AI สรุปเนื้อหาแชทที่ยังไม่ได้เปิดอ่านก่อนหน้านี้ โดยเรียกชื่อฟีเจอร์นี้ว่า Private Message Summaries เพื่อยืนยันว่าแพลตฟอร์มยังปกป้องความเป็นส่วนตัวผู้ใช้งานไว้

Message Summaries ของ WhatsApp ใช้กระบวนการประมวลผลข้อความแบบ Private บนคลาวด์ที่แยกต่างหากด้วย Meta AI โดยแม้แต่ Meta หรือ WhatsApp ก็ไม่เห็นข้อความอินพุทและผลลัพธ์ที่สรุปเนื้อหา

By lew Founder on Tag: Anthropic, LLM
Anthropic

เมื่อเดือนที่แล้ว Anthropic ออกรายงานถึงความปลอดภัยของ Claude 4 Opus โดยประเด็นสำคัญที่เป็นข่าวคือการที่ Claude พยายามเอาชีวิตรอดด้วยการแฉว่าวิศวกรมีชู้ ล่าสุดทีมงาน Anthropic ก็ออกรายงานถึงการทดสอบปัญญาประดิษฐ์แบรนด์อื่นๆ ก็พบว่าเมื่อโดนบีบคั้นเข้าปัญญาประดิษฐ์ก็จะแสดงพฤติกรรมมุ่งร้ายได้เหมือนกัน เรียกว่าพฤติกรรม "agentic misalignment"

By arjin Writer on Tag: Microsoft, LLM, Artificial Intelligence, Copilot+ PC
Microsoft

ไมโครซอฟท์เปิดตัว Mu โมเดลปัญญาประดิษฐ์ภาษาขนาดเล็ก (Small Language Model) ทำงานที่ระดับอุปกรณ์ (on-device) ใน Windows 11

การพัฒนา Mu มาจากการต่อยอดจากโมเดล Phi Silica ที่รันบน NPU ใน Copilot+ PC เพื่อสร้างโมเดลที่มีขนาดเล็กลงกว่าเดิม ออกแบบมารันเฉพาะส่วนงานที่ระดับอุปกรณ์เหมือนกัน โดย Mu ทำงานบน NPU เหมือนกัน รองรับที่ระดับ 100 โทเค็นต่อวินาที

By lew Founder on Tag: Huawei Cloud, Huawei, LLM
Huawei Cloud

Huawei Cloud เปิดตัวโมเดลปัญญาประดิษฐ์ Pangu 5.5 ชุดโมเดลปัญญาประดิษฐ์หลายตัวที่ประกาศเป็นชุดเดียวกัน ได้แก่

Subscribe to LLM