LLM | Blognone

Large Language Model

GPT-4.5 เอาชนะมนุษย์ในการทดสอบ Turing Test แบบจำกัดเวลา

By lew

on 2 April 2025 - 22:56 Tag: LLM, Artificial Intelligence, Alan Turing, OpenAI

LLM

ทีมวิจัยจาก UC San Diego อัพเดตรายงานทดสอบ Turing Test แบบจำกัดเวลา เพื่อทดสอบว่าปัญญาประดิษฐ์จะสามารถหลอกว่าเป็นมนุษย์ได้หรือไม่ จากเดิมที่เคยทดสอบตั้งแต่ปี 2023 และรอบนี้พบว่า GPT-4.5 เอาชนะมนุษย์ได้อย่างชัดเจน

กระบวนการทดสอบใช้จะให้ผู้ทดสอบคุยแชตกับ AI และมนุษย์ไปพร้อมกัน โดยสามารถคุยได้เพียง 8 ข้อความและจำกัดเวลา และเมื่อจบเวลา 5 นาทีก็ต้องเลือกว่าหน้าจอไหนเป็นมนุษย์หรือ AI โดยเมื่อปี 2023 นั้น GPT-4 ทำคะแนนได้สูงสุด 41% รอบนี้พบว่า GPT-4.5 สามารถทำคะแนนได้ถึง 73% สูงกว่ามนุษย์จริงๆ อย่างมีนัยสำคัญ

ผู้ใช้ ChatGPT แบบฟรี สามารถใช้ Image Generation ตัวใหม่ได้แล้ว แบบจำกัดโควต้าต่อวัน

By arjin

on 1 April 2025 - 15:55 Tag: OpenAI, Artificial Intelligence, LLM, ChatGPT

OpenAI

Sam Altman ซีอีโอ OpenAI ประกาศว่าเครื่องมือสร้างรูปภาพตัวใหม่ Image Generation บน ChatGPT ตอนนี้เปิดให้ผู้ใช้งานทุกคนสามารถใช้ได้แล้วรวมทั้งแบบฟรี หลังจากเปิดตัวไปเมื่อสัปดาห์ที่แล้ว โดยจำกัดให้เฉพาะลูกค้า ChatGPT แบบเสียเงิน

Altman ไม่ได้บอกว่าผู้ใช้งาน ChatGPT แบบฟรีจะถูกจำกัดการใช้งานเท่าใด แต่ก่อนหน้านี้เขาบอกตัวเลขว่า 3 รูปต่อวัน เนื่องจากผลตอบรับที่ดีมากเป็นกระแสจนจีพียูที่มีไม่พอใช้งาน

Amazon เปิดตัว Nova Act โมเดลที่เทรนมาพิเศษเพื่อเป็น Agentic AI ควบคุมหน้าเว็บ

By mk

on 1 April 2025 - 11:10 Tag: Amazon, LLM, Artificial Intelligence, Nova

Amazon

Amazon เปิดตัวโมเดลภาษาขนาดใหญ่ของตัวเองชื่อ Nova ในเดือนพฤศจิกายน 2024 หลังจากนั้นเริ่มนำมาใช้ในผลิตภัณฑ์คอนซูเมอร์อย่าง Alexa+ บ้างแล้ว

ล่าสุด Amazon เปิดตัว Amazon Nova Act โมเดลย่อยในตระกูล Nova ที่เทรนมาเพื่องานควบคุมการท่องเว็บผ่านเบราว์เซอร์โดยเฉพาะ เปิดทางให้เกิดงานสาย Agentic AI ที่นำ Nova Act ไปควบคุมหน้าเว็บต่างๆ ได้ง่ายผ่าน Nova Act SDK ที่เปิดให้นักพัฒนาภายนอกเข้ามาเชื่อมต่อ

OpenAI เตรียมเผยแพร่โมเดลแบบ Open-Weight ให้นักพัฒนาปรับแก้ไขได้มากขึ้น

By arjin

on 1 April 2025 - 07:51 Tag: OpenAI, Artificial Intelligence, LLM, Sam Altman

OpenAI

Sam Altman ซีอีโอ OpenAI ประกาศว่าบริษัทมีแผนเตรียมออกโมเดล AI แบบ Open-Weight ตัวใหม่ นับตั้งแต่ GPT-2 โดยเปิดรับฟังความคิดเห็นจากนักพัฒนา นักวิจัย และชุมชนที่เกี่ยวข้อง ว่าต้องการให้โมเดล AI ที่ปรับค่า Weight ได้นี้ สามารถปรับส่วนใดได้บ้าง รวมทั้งเตรียมจัดงานสัมมนาแบบ In-Person ในหลายภูมิภาคเพื่อรับฟังความเห็นด้วย

ตั้งแต่กระแสปัญญาประดิษฐ์มีมากขึ้น OpenAI ซึ่งเป็นหนึ่งในผู้จุดกระแส ได้ปรับแนวทางไม่เผยแพร่รายละเอียดการทำงานของโมเดล AI ตั้งแต่ GPT-4 ด้วยเหตุผลของการแข่งขันและป้องกันการนำ AI ไปใช้ในทางที่ไม่ปลอดภัย อย่างไรก็ตามจากกระแสของ DeepSeek เมื่อต้นปี ซึ่งเป็นโมเดลแบบโอเพนซอร์ส รวมกับแนวทางของ Meta ที่โอเพนซอร์ส Llama ตั้งแต่เริ่มต้น ทำให้ Altman เคยยอมรับว่าตัดสินใจผิด และต้องการทบทวนกลยุทธ์นี้ อย่างไรก็ตามแนวทางของ Open-Weight จะไม่เปิดเผยข้อมูลทั้งหมดของโมเดล เช่น ข้อมูลที่ใช้ฝึกฝน เป็นต้น

ซีอีโอมาเอง Sundar Pichai ถามชุมชน ควรรองรับ MCP หรือไม่

By lew

on 31 March 2025 - 11:51 Tag: Google, LLM, MCP, Artificial Intelligence, Sundar Pichai

Google

Sundar Pichai ซีอีโอกูเกิลถามชุมชนว่าควรรองรับ MCP หรือไม่ หลังจากมาตรฐาน MCP ถูกเสนอโดย Anthropic และ OpenAI ก็ประกาศรองรับแล้ว ทำให้กูเกิลเป็นผู้พัฒนาปัญญาประดิษฐ์ LLM รายใหญ่รายเดียวที่ยังไม่รองรับ

เสียงตอบรับของคนส่วนใหญ่ก็ระบุว่าต้องการให้กูเกิลรองรับ MCP กัน ซึ่งก็คาดเดาได้เพราะคนจำนวนมากไม่ต้องการพัฒนาเครื่องมือแยกสำหรับกูเกิลอีกชุด

งานไว! Google ประกาศลูกค้าแบบฟรีสามารถใช้งานโมเดลล่าสุด Gemini 2.5 Pro (experimental) ได้แล้ว

By arjin

on 30 March 2025 - 07:54 Tag: Gemini, Google, LLM

Gemini

กูเกิลประกาศว่าผู้ใช้งานแบบฟรี สามารถใช้งาน Gemini 2.5 Pro (experimental) โมเดลปัญญาประดิษฐ์ความสามารถสูงที่เพิ่งเปิดตัวไม่กี่วันก่อนได้แล้ว โดยเวอร์ชันนี้เป็น experimental นั่นคือฟีเจอร์บางอย่างอาจไม่สามารถใช้งานได้

ในตอนแรกกูเกิลจำกัด Gemini 2.5 Pro ให้เฉพาะลูกค้า Gemini Advanced แต่ในเวลาไม่กี่วันกูเกิลก็บอกว่าเพื่อให้คนเข้าถึงโมเดลนี้มากที่สุด ลูกค้าฟรีก็ได้ใช้งานไปด้วยเลย

Sam Altman บอกกระแส Image Generation บน ChatGPT แรงจนจีพียูที่มีไม่พอแล้ว

By arjin

on 28 March 2025 - 07:57 Tag: ChatGPT, OpenAI, LLM, Artificial Intelligence, Sam Altman

ChatGPT

Sam Altman ซีอีโอ OpenAI เปิดเผยว่ากระแสที่มาแรงมาของเครื่องมือสร้างรูปภาพตัวใหม่ Image Generation บน ChatGPT ทำให้ตอนนี้จีพียูที่มีอยู่ไม่พอแล้ว (GPUs are melting) จึงทำให้ OpenAI ต้องหาทางแก้ไขปัญหานี้

OpenAI ประกาศสนับสนุนมาตรฐาน Model Context Protocol ที่ใช้เชื่อมต่อและส่งข้อมูลกับโมเดล AI สำหรับองค์กร

By arjin

on 27 March 2025 - 18:34 Tag: OpenAI, Anthropic, LLM, Standard, MCP

OpenAI

Sam Altman ซีอีโอ OpenAI กล่าวว่าบริษัทจะสนับสนุน Model Context Protocol (MCP) โปรโตคอลมาตรฐานสำหรับการดึงข้อมูลและส่งข้อมูลจากแหล่งต่าง ๆ กับโมเดลปัญญาประดิษฐ์สำหรับองค์กร ซึ่งเป็นมาตรฐานที่บริษัทคู่แข่ง Anthropic นำเสนอเมื่อปลายปีที่แล้ว โดย MCP จะรองรับในทุกผลิตภัณฑ์ของ OpenAI

MCP มีให้ใช้งานแล้วผ่าน SDK สำหรับนักพัฒนา AI Agent ตั้งแต่วันนี้เป็นต้นไป ส่วนแอป ChatGPT บนเดสก์ท็อปและ Responses API จะรองรับเร็ว ๆ นี้

Databricks ลงนามความร่วมมือกับ Anthropic ระยะเวลา 5 ปี นำโมเดล Claude ให้ลูกค้าองค์กรใช้งานบนแพลตฟอร์ม

By arjin

on 27 March 2025 - 18:34 Tag: Databricks, Anthropic, Artificial Intelligence, LLM, Enterprise

Databricks

Databricks ประกาศความร่วมมือกับ Anthropic เป็นระยะเวลา 5 ปี เพื่อนำโมเดลปัญญาประดิษฐ์ของ Anthropic ให้บริการบนแพลตฟอร์ม Data Intelligence Platform ทำให้ลูกค้าองค์กรมากกว่า 10,000 ราย สามารถเข้าถึงโมเดลตระกูล Claude เพื่อสร้างแชทบอตและ AI Agent แบบคัสตอมสำหรับใช้กับข้อมูลในองค์กร

ARC-AGI ออกชุดทดสอบเวอร์ชั่น 2 AI ที่เก่งที่สุดได้คะแนนแค่ 4%

By lew

on 27 March 2025 - 02:03 Tag: LLM, Artificial Intelligence

LLM

ทีม ARC Prize ประกาศการแข่งขัน ARC-AGI-2 ข้อสอบไอคิวสำหรับมนุษย์ที่ยังยากสำหรับปัญญาประดิษฐ์ หลังจากข้อสอบชุดแรกเปิดตัวมาตั้งแต่ปี 2020 และตอนนี้มี AI ได้คะแนนสูงสุดคือ o3 ที่ 82.8%

ARC-AGI-2 เป็นข้อสอบที่ทำโดยมษุย์สำเร็จทุกข้อ หากให้ช่วยกันสองคน และมนุษย์โดยทั่วไปเฉลี่ยได้คะแนน 60% ตอนนี้โมเดลที่ดีที่สุดคือ o3 ทำคะแนนได้เพียง 4%

รางวัลรวมของ ARC-AGI-2 อยู่ที่ 1 ล้านดอลลาร์ รางวัลที่หนึ่งเป็นเงิน 700,000 ดอลลาร์หากทำคะแนนได้เกิน 80% และต้องใช้ต้นทุนประมวลผลไม่เกิน 50 ดอลลาร์เท่านั้น

ขอแค่ log การใช้งาน, Databricks เสนอแนวทางฝึก LLM ให้ใกล้เคียง GPT-4o โดยไม่ต้องสร้างชุดข้อมูล

By lew

on 27 March 2025 - 01:48 Tag: Databricks, LLM

Databricks

Databricks นำเสนอแนวทางการฝึกโมเดลปัญญาประดิษฐ์แบบ LLM ในชื่อว่า Test-time Adaptive Optimization (TAO) ที่มุ่งเป้าไปยังองค์กรที่ใช้งาน LLM อยู่แล้วแต่ต้องการโมเดลสำหรับใช้งานภายในที่เก่งใกล้เคียงกัน

แนวทางของ TAO แยกออกเป็นสี่ขั้น ได้แก่

Microsoft เพิ่มเครื่องมือสำหรับค้นหาข้อมูลเชิงลึกและการวิจัยบน Microsoft 365 Copilot

By arjin

on 26 March 2025 - 21:18 Tag: Microsoft Copilot, Research, LLM, Search Engine, Artificial Intelligence, Microsoft

Microsoft Copilot

ไมโครซอฟท์เปิดตัวผู้ช่วย AI บน Microsoft 365 Copilot สำหรับการค้นหาข้อมูลเชิงลึกและค้นหาข้อมูลสำหรับงานวิจัย ในรูปแบบเดียวกับ Deep Research ของ OpenAI และ Gemini Deep Research ของกูเกิล ซึ่งของไมโครซอฟท์แยก AI Agent เป็นสองตัวคือ Researcher และ Analyst

Researcher ระบุความสามารถช่วยการค้นคว้าข้อมูลที่มีขั้นตอนซับซ้อน ให้ข้อมูลที่มีคุณภาพสูง และตรงกับที่ต้องการใช้งานมากกว่าที่เคยมีมา ตัวผู้ช่วย AI ทำงานผสมผสานระหว่างโมเดล Deep Research ของ OpenAI กับเครื่องมือขั้นสูงของ Microsoft 365 Copilot รองรับการทำงานร่วมกับแหล่งข้อมูลภายนอกบน Salesforce, ServiceNow, Confluence และอื่น ๆ เพื่อหา insight ได้

OpenAI อัปเกรดเครื่องมือสร้างรูปภาพด้วย AI ผลลัพธ์สมจริงขึ้น ระบุรายละเอียดได้ดีกว่าเดิม

By arjin

on 26 March 2025 - 07:37 Tag: OpenAI, Artificial Intelligence, Dall-E, LLM

OpenAI

OpenAI ประกาศอัปเกรดเครื่องมือสร้างรูปภาพขั้นสูงบนโมเดล GPT-4o ที่บอกว่าไม่เพียงแต่ได้รูปที่สวยงามกว่าเดิม แต่สามารถกำหนดรายละเอียดให้ตรงกับความต้องการยิ่งกว่าเดิม

กูเกิลเปิดตัว Gemini 2.5 Pro เอาชนะแทบทุกการทดสอบ หลังจากนี้เน้นโมเดลคิดก่อนตอบเป็นหลัก

By lew

on 26 March 2025 - 00:38 Tag: Gemini, Google, LLM

Gemini

กูเกิลเปิดตัวโมเดล LLM ตัวใหม่ Gemini 2.5 Pro ที่พัฒนาความเก่งโดยอาศัยการฝึกจนกว่าจะทำแบบทดสอบถูก (reinforced learning) และฝึกให้คิดก่อนตอบ (chain of thought) โดยระบุว่าหลังจากนี้จะฝึกโมเดลต่อๆ ไปโดยฝังแนวทางคิดก่อนตอบไว้เสมอเพื่อให้โมเดลมีความสามารถสูง

Alibaba Cloud ออกโมเดล Qwen2.5-VL-32B ฉลาดขึ้น ใช้ทรัพยากรน้อยลง

By arjin

on 25 March 2025 - 17:06 Tag: Alibaba Cloud, LLM, Qwen

Alibaba Cloud

Alibaba Cloud ออกโมเดลปัญญาประดิษฐ์ใหม่ Qwen2.5-VL-32B ซึ่งเป็นโมเดลขนาดใหญ่ 32B แบบโอเพนซอร์สภายใต้สัญญาอนุญาต Apache 2.0 สามารถดาวน์โหลดได้ที่ Hugging Face และ GitHub

DeepSeek ออกโมเดล V3 เวอร์ชันใหม่ ประสิทธิภาพดีขึ้น เปลี่ยนสัญญาอนุญาตเป็น MIT

By mk

on 25 March 2025 - 07:33 Tag: DeepSeek, LLM, Open Source

DeepSeek

DeepSeek ออกโมเดลเวอร์ชันใหม่ DeepSeek-V3-0324 มีการเปลี่ยนแปลงสำคัญคือเปลี่ยนสัญญาอนุญาตเป็น MIT

เดิมทีโมเดลของ DeepSeek เป็นโอเพนซอร์สอยู่แล้ว แต่ใช้สัญญาอนุญาตแบบคัสตอมของตัวเอง คราวนี้เปลี่ยนมาเป็นสัญญามาตรฐานของวงการคือ MIT License ที่เปิดกว้างมากๆ อนุญาตให้ทำได้แทบทุกอย่าง

AMD โอเพนซอร์สไลบรารี AITER เร่งความเร็ว LLM บน ROCm ได้เท่าตัว

By lew

on 24 March 2025 - 22:03 Tag: AMD, LLM, Open Source, ROCm

AMD

AMD โอเพนซอร์สไลบรารี AI Tensor Engine for ROCm (AITER) ที่รวมเอาฟังก์ชั่นที่ปัญญาประดิษฐ์ต่างๆ ใช้งานบ่อย ให้ออปติไมซ์บน ROCm โดยเฉพาะ PyTorch ที่นิยมใช้งานกับปัญญาประดิษฐ์กลุ่ม LLM

กลุ่ม operator ที่ LLM ใช้งานสามารถรันได้เร็วขึ้นหลายเท่าตัว เช่น Mixture of Experts (MoE), การคูณแมตทริกซ์, Multi-Head Attention (MHA) ผลการทดสอบ DeepSeek-V3/R1 บนชิป MI300X สามารถรันเร็วขึ้นเทียบกับก่อนใช้ AITER ถึงเท่าตัว

ตอนนี้ซอฟต์แวร์รัน LLM เช่น vLLM และ SGLang รองรับ AITER แล้ว และทาง AMD ยืนยันว่าจะลงทุนพัฒนาเร่งความเร็วโหลดงาน AI บนชิป AMD เพิ่มเติมต่อไป

AMD เปิดตัว GAIA ตัวช่วยรันโมเดล LLM แบบโลคัล ปรับแต่งมาเพื่อชิป Ryzen AI

By mk

on 23 March 2025 - 07:10 Tag: AMD, Ryzen, NPU, LLM, Artificial Intelligence

AMD

AMD เปิดตัวโครงการโอเพนซอร์สชื่อ GAIA เป็นแอพพลิเคชันบนพีซี ที่ช่วยนำโมเดล LLM มารันบนพีซี และสามารถเร่งความเร็วหากเป็นเครื่องที่มี NPU ของชิป Ryzen AI ด้วย

GAIA คงไม่ต่างอะไรมากกับชุดซอฟต์แวร์แบบเดียวกันที่มีอยู่แล้ว (เช่น ไมโครซอฟท์เองมี Windows Copilot Runtime) มีฟีเจอร์ Retrieval-Augmented Generation (RAG) ช่วยเสริมความรู้เฉพาะทางให้ AI (เช่น คลังเอกสารขององค์กร) เพื่อนำมาสร้างเป็น agent ที่เชี่ยวชาญงานเฉพาะด้าน ตัวอย่างที่ AMD ให้มาคือ agent ที่ช่วยค้นหาข้อมูลจากคลิปใน YouTube, agent เล่นมุขตลก เป็นต้น

ส่งสาสน์ถึงฟ้า Yann LeCun ขึ้นเวที NVIDIA ระบุโลก AI ต้องการฮาร์ดแวร์ราคาถูกๆ

By lew

on 21 March 2025 - 16:46 Tag: NVIDIA, LLM, Artificial Intelligence, Yann LeCun

NVIDIA

งาน NVIDIA GTC ปีนี้นอกจากการแถลงข่าวของ NVIDIA เองแล้วยังมีนักวิจัยชั้นนำขึ้นเวทีย่อยๆ ในงานจำนวนมาก คนหนึ่งที่มาขึ้นเวทีครั้งนี้คือ Yann LeCun Chief AI Scientist at Meta หนึ่งในผู้บุกเบิก convolutional neural networks (CNN) บรรยายถึงโลกอนาคตของปัญญาประดิษฐ์

ถามมากจะยากจน OpenAI เปิดบริการ o1-pro API แพงที่สุดที่เคยมีมา อินพุต 5000 บาท เอาท์พุต 20,000 บาทต่อล้านโทเค็น

By lew

on 20 March 2025 - 06:01 Tag: OpenAI, LLM

OpenAI

OpenAI เปิดบริการ API สำหรับโมเดล o1-pro ซึ่งน่าจะใกล้เคียงกับ o1 pro mode ในแอป ChatGPT Pro ที่คิดค่าบริการรายเดือน 200 ดอลลาร์

จุดเด่นที่เตะตาของ o1-pro คือราคาที่สูงขึ้นมาก สูงกว่า o1 ปกติถึง 10 เท่าตัวกลายเป็น 150 ดอลลาร์ต่อล้านโทเค็นสำหรับอินพุต และ 600 ดอลลาร์ต่อล้านโทเค็นสำหรับเอาท์พุต

คุณสมบัติอื่นๆ ใกล้เคียงกับ o1 เช่น context window ขนาด 200,000 โทเค็น เอาท์พุต 100,000 โทเค็น รองรับการเรียกฟังก์ชั่นและการเอาท์พุตเป็น JSON

Subscribe to LLM