Image

Large Language Model

By lew Founder on Tag: LLM, Artificial Intelligence, Alan Turing, OpenAI
LLM

ทีมวิจัยจาก UC San Diego อัพเดตรายงานทดสอบ Turing Test แบบจำกัดเวลา เพื่อทดสอบว่าปัญญาประดิษฐ์จะสามารถหลอกว่าเป็นมนุษย์ได้หรือไม่ จากเดิมที่เคยทดสอบตั้งแต่ปี 2023 และรอบนี้พบว่า GPT-4.5 เอาชนะมนุษย์ได้อย่างชัดเจน

กระบวนการทดสอบใช้จะให้ผู้ทดสอบคุยแชตกับ AI และมนุษย์ไปพร้อมกัน โดยสามารถคุยได้เพียง 8 ข้อความและจำกัดเวลา และเมื่อจบเวลา 5 นาทีก็ต้องเลือกว่าหน้าจอไหนเป็นมนุษย์หรือ AI โดยเมื่อปี 2023 นั้น GPT-4 ทำคะแนนได้สูงสุด 41% รอบนี้พบว่า GPT-4.5 สามารถทำคะแนนได้ถึง 73% สูงกว่ามนุษย์จริงๆ อย่างมีนัยสำคัญ

By arjin Writer on Tag: OpenAI, Artificial Intelligence, LLM, ChatGPT
OpenAI

Sam Altman ซีอีโอ OpenAI ประกาศว่าเครื่องมือสร้างรูปภาพตัวใหม่ Image Generation บน ChatGPT ตอนนี้เปิดให้ผู้ใช้งานทุกคนสามารถใช้ได้แล้วรวมทั้งแบบฟรี หลังจากเปิดตัวไปเมื่อสัปดาห์ที่แล้ว โดยจำกัดให้เฉพาะลูกค้า ChatGPT แบบเสียเงิน

Altman ไม่ได้บอกว่าผู้ใช้งาน ChatGPT แบบฟรีจะถูกจำกัดการใช้งานเท่าใด แต่ก่อนหน้านี้เขาบอกตัวเลขว่า 3 รูปต่อวัน เนื่องจากผลตอบรับที่ดีมากเป็นกระแสจนจีพียูที่มีไม่พอใช้งาน

By mk Founder on Tag: Amazon, LLM, Artificial Intelligence, Nova
Amazon

Amazon เปิดตัวโมเดลภาษาขนาดใหญ่ของตัวเองชื่อ Nova ในเดือนพฤศจิกายน 2024 หลังจากนั้นเริ่มนำมาใช้ในผลิตภัณฑ์คอนซูเมอร์อย่าง Alexa+ บ้างแล้ว

ล่าสุด Amazon เปิดตัว Amazon Nova Act โมเดลย่อยในตระกูล Nova ที่เทรนมาเพื่องานควบคุมการท่องเว็บผ่านเบราว์เซอร์โดยเฉพาะ เปิดทางให้เกิดงานสาย Agentic AI ที่นำ Nova Act ไปควบคุมหน้าเว็บต่างๆ ได้ง่ายผ่าน Nova Act SDK ที่เปิดให้นักพัฒนาภายนอกเข้ามาเชื่อมต่อ

By arjin Writer on Tag: OpenAI, Artificial Intelligence, LLM, Sam Altman
OpenAI

Sam Altman ซีอีโอ OpenAI ประกาศว่าบริษัทมีแผนเตรียมออกโมเดล AI แบบ Open-Weight ตัวใหม่ นับตั้งแต่ GPT-2 โดยเปิดรับฟังความคิดเห็นจากนักพัฒนา นักวิจัย และชุมชนที่เกี่ยวข้อง ว่าต้องการให้โมเดล AI ที่ปรับค่า Weight ได้นี้ สามารถปรับส่วนใดได้บ้าง รวมทั้งเตรียมจัดงานสัมมนาแบบ In-Person ในหลายภูมิภาคเพื่อรับฟังความเห็นด้วย

ตั้งแต่กระแสปัญญาประดิษฐ์มีมากขึ้น OpenAI ซึ่งเป็นหนึ่งในผู้จุดกระแส ได้ปรับแนวทางไม่เผยแพร่รายละเอียดการทำงานของโมเดล AI ตั้งแต่ GPT-4 ด้วยเหตุผลของการแข่งขันและป้องกันการนำ AI ไปใช้ในทางที่ไม่ปลอดภัย อย่างไรก็ตามจากกระแสของ DeepSeek เมื่อต้นปี ซึ่งเป็นโมเดลแบบโอเพนซอร์ส รวมกับแนวทางของ Meta ที่โอเพนซอร์ส Llama ตั้งแต่เริ่มต้น ทำให้ Altman เคยยอมรับว่าตัดสินใจผิด และต้องการทบทวนกลยุทธ์นี้ อย่างไรก็ตามแนวทางของ Open-Weight จะไม่เปิดเผยข้อมูลทั้งหมดของโมเดล เช่น ข้อมูลที่ใช้ฝึกฝน เป็นต้น

By lew Founder on Tag: Google, LLM, MCP, Artificial Intelligence, Sundar Pichai
Google

Sundar Pichai ซีอีโอกูเกิลถามชุมชนว่าควรรองรับ MCP หรือไม่ หลังจากมาตรฐาน MCP ถูกเสนอโดย Anthropic และ OpenAI ก็ประกาศรองรับแล้ว ทำให้กูเกิลเป็นผู้พัฒนาปัญญาประดิษฐ์ LLM รายใหญ่รายเดียวที่ยังไม่รองรับ

เสียงตอบรับของคนส่วนใหญ่ก็ระบุว่าต้องการให้กูเกิลรองรับ MCP กัน ซึ่งก็คาดเดาได้เพราะคนจำนวนมากไม่ต้องการพัฒนาเครื่องมือแยกสำหรับกูเกิลอีกชุด

By arjin Writer on Tag: Gemini, Google, LLM
Gemini

กูเกิลประกาศว่าผู้ใช้งานแบบฟรี สามารถใช้งาน Gemini 2.5 Pro (experimental) โมเดลปัญญาประดิษฐ์ความสามารถสูงที่เพิ่งเปิดตัวไม่กี่วันก่อนได้แล้ว โดยเวอร์ชันนี้เป็น experimental นั่นคือฟีเจอร์บางอย่างอาจไม่สามารถใช้งานได้

ในตอนแรกกูเกิลจำกัด Gemini 2.5 Pro ให้เฉพาะลูกค้า Gemini Advanced แต่ในเวลาไม่กี่วันกูเกิลก็บอกว่าเพื่อให้คนเข้าถึงโมเดลนี้มากที่สุด ลูกค้าฟรีก็ได้ใช้งานไปด้วยเลย

By arjin Writer on Tag: ChatGPT, OpenAI, LLM, Artificial Intelligence, Sam Altman
ChatGPT

Sam Altman ซีอีโอ OpenAI เปิดเผยว่ากระแสที่มาแรงมาของเครื่องมือสร้างรูปภาพตัวใหม่ Image Generation บน ChatGPT ทำให้ตอนนี้จีพียูที่มีอยู่ไม่พอแล้ว (GPUs are melting) จึงทำให้ OpenAI ต้องหาทางแก้ไขปัญหานี้

By arjin Writer on Tag: OpenAI, Anthropic, LLM, Standard, MCP
OpenAI

Sam Altman ซีอีโอ OpenAI กล่าวว่าบริษัทจะสนับสนุน Model Context Protocol (MCP) โปรโตคอลมาตรฐานสำหรับการดึงข้อมูลและส่งข้อมูลจากแหล่งต่าง ๆ กับโมเดลปัญญาประดิษฐ์สำหรับองค์กร ซึ่งเป็นมาตรฐานที่บริษัทคู่แข่ง Anthropic นำเสนอเมื่อปลายปีที่แล้ว โดย MCP จะรองรับในทุกผลิตภัณฑ์ของ OpenAI

MCP มีให้ใช้งานแล้วผ่าน SDK สำหรับนักพัฒนา AI Agent ตั้งแต่วันนี้เป็นต้นไป ส่วนแอป ChatGPT บนเดสก์ท็อปและ Responses API จะรองรับเร็ว ๆ นี้

By arjin Writer on Tag: Databricks, Anthropic, Artificial Intelligence, LLM, Enterprise
Databricks

Databricks ประกาศความร่วมมือกับ Anthropic เป็นระยะเวลา 5 ปี เพื่อนำโมเดลปัญญาประดิษฐ์ของ Anthropic ให้บริการบนแพลตฟอร์ม Data Intelligence Platform ทำให้ลูกค้าองค์กรมากกว่า 10,000 ราย สามารถเข้าถึงโมเดลตระกูล Claude เพื่อสร้างแชทบอตและ AI Agent แบบคัสตอมสำหรับใช้กับข้อมูลในองค์กร

By lew Founder on Tag: LLM, Artificial Intelligence
LLM

ทีม ARC Prize ประกาศการแข่งขัน ARC-AGI-2 ข้อสอบไอคิวสำหรับมนุษย์ที่ยังยากสำหรับปัญญาประดิษฐ์ หลังจากข้อสอบชุดแรกเปิดตัวมาตั้งแต่ปี 2020 และตอนนี้มี AI ได้คะแนนสูงสุดคือ o3 ที่ 82.8%

ARC-AGI-2 เป็นข้อสอบที่ทำโดยมษุย์สำเร็จทุกข้อ หากให้ช่วยกันสองคน และมนุษย์โดยทั่วไปเฉลี่ยได้คะแนน 60% ตอนนี้โมเดลที่ดีที่สุดคือ o3 ทำคะแนนได้เพียง 4%

รางวัลรวมของ ARC-AGI-2 อยู่ที่ 1 ล้านดอลลาร์ รางวัลที่หนึ่งเป็นเงิน 700,000 ดอลลาร์หากทำคะแนนได้เกิน 80% และต้องใช้ต้นทุนประมวลผลไม่เกิน 50 ดอลลาร์เท่านั้น

By lew Founder on Tag: Databricks, LLM
Databricks

Databricks นำเสนอแนวทางการฝึกโมเดลปัญญาประดิษฐ์แบบ LLM ในชื่อว่า Test-time Adaptive Optimization (TAO) ที่มุ่งเป้าไปยังองค์กรที่ใช้งาน LLM อยู่แล้วแต่ต้องการโมเดลสำหรับใช้งานภายในที่เก่งใกล้เคียงกัน

แนวทางของ TAO แยกออกเป็นสี่ขั้น ได้แก่

Microsoft Copilot

ไมโครซอฟท์เปิดตัวผู้ช่วย AI บน Microsoft 365 Copilot สำหรับการค้นหาข้อมูลเชิงลึกและค้นหาข้อมูลสำหรับงานวิจัย ในรูปแบบเดียวกับ Deep Research ของ OpenAI และ Gemini Deep Research ของกูเกิล ซึ่งของไมโครซอฟท์แยก AI Agent เป็นสองตัวคือ Researcher และ Analyst

Researcher ระบุความสามารถช่วยการค้นคว้าข้อมูลที่มีขั้นตอนซับซ้อน ให้ข้อมูลที่มีคุณภาพสูง และตรงกับที่ต้องการใช้งานมากกว่าที่เคยมีมา ตัวผู้ช่วย AI ทำงานผสมผสานระหว่างโมเดล Deep Research ของ OpenAI กับเครื่องมือขั้นสูงของ Microsoft 365 Copilot รองรับการทำงานร่วมกับแหล่งข้อมูลภายนอกบน Salesforce, ServiceNow, Confluence และอื่น ๆ เพื่อหา insight ได้

By arjin Writer on Tag: OpenAI, Artificial Intelligence, Dall-E, LLM
OpenAI

OpenAI ประกาศอัปเกรดเครื่องมือสร้างรูปภาพขั้นสูงบนโมเดล GPT-4o ที่บอกว่าไม่เพียงแต่ได้รูปที่สวยงามกว่าเดิม แต่สามารถกำหนดรายละเอียดให้ตรงกับความต้องการยิ่งกว่าเดิม

By lew Founder on Tag: Gemini, Google, LLM
Gemini

กูเกิลเปิดตัวโมเดล LLM ตัวใหม่ Gemini 2.5 Pro ที่พัฒนาความเก่งโดยอาศัยการฝึกจนกว่าจะทำแบบทดสอบถูก (reinforced learning) และฝึกให้คิดก่อนตอบ (chain of thought) โดยระบุว่าหลังจากนี้จะฝึกโมเดลต่อๆ ไปโดยฝังแนวทางคิดก่อนตอบไว้เสมอเพื่อให้โมเดลมีความสามารถสูง

By arjin Writer on Tag: Alibaba Cloud, LLM, Qwen
Alibaba Cloud

Alibaba Cloud ออกโมเดลปัญญาประดิษฐ์ใหม่ Qwen2.5-VL-32B ซึ่งเป็นโมเดลขนาดใหญ่ 32B แบบโอเพนซอร์สภายใต้สัญญาอนุญาต Apache 2.0 สามารถดาวน์โหลดได้ที่ Hugging Face และ GitHub

By mk Founder on Tag: DeepSeek, LLM, Open Source
DeepSeek

DeepSeek ออกโมเดลเวอร์ชันใหม่ DeepSeek-V3-0324 มีการเปลี่ยนแปลงสำคัญคือเปลี่ยนสัญญาอนุญาตเป็น MIT

เดิมทีโมเดลของ DeepSeek เป็นโอเพนซอร์สอยู่แล้ว แต่ใช้สัญญาอนุญาตแบบคัสตอมของตัวเอง คราวนี้เปลี่ยนมาเป็นสัญญามาตรฐานของวงการคือ MIT License ที่เปิดกว้างมากๆ อนุญาตให้ทำได้แทบทุกอย่าง

By lew Founder on Tag: AMD, LLM, Open Source, ROCm
AMD

AMD โอเพนซอร์สไลบรารี AI Tensor Engine for ROCm (AITER) ที่รวมเอาฟังก์ชั่นที่ปัญญาประดิษฐ์ต่างๆ ใช้งานบ่อย ให้ออปติไมซ์บน ROCm โดยเฉพาะ PyTorch ที่นิยมใช้งานกับปัญญาประดิษฐ์กลุ่ม LLM

กลุ่ม operator ที่ LLM ใช้งานสามารถรันได้เร็วขึ้นหลายเท่าตัว เช่น Mixture of Experts (MoE), การคูณแมตทริกซ์, Multi-Head Attention (MHA) ผลการทดสอบ DeepSeek-V3/R1 บนชิป MI300X สามารถรันเร็วขึ้นเทียบกับก่อนใช้ AITER ถึงเท่าตัว

ตอนนี้ซอฟต์แวร์รัน LLM เช่น vLLM และ SGLang รองรับ AITER แล้ว และทาง AMD ยืนยันว่าจะลงทุนพัฒนาเร่งความเร็วโหลดงาน AI บนชิป AMD เพิ่มเติมต่อไป

By mk Founder on Tag: AMD, Ryzen, NPU, LLM, Artificial Intelligence
AMD

AMD เปิดตัวโครงการโอเพนซอร์สชื่อ GAIA เป็นแอพพลิเคชันบนพีซี ที่ช่วยนำโมเดล LLM มารันบนพีซี และสามารถเร่งความเร็วหากเป็นเครื่องที่มี NPU ของชิป Ryzen AI ด้วย

GAIA คงไม่ต่างอะไรมากกับชุดซอฟต์แวร์แบบเดียวกันที่มีอยู่แล้ว (เช่น ไมโครซอฟท์เองมี Windows Copilot Runtime) มีฟีเจอร์ Retrieval-Augmented Generation (RAG) ช่วยเสริมความรู้เฉพาะทางให้ AI (เช่น คลังเอกสารขององค์กร) เพื่อนำมาสร้างเป็น agent ที่เชี่ยวชาญงานเฉพาะด้าน ตัวอย่างที่ AMD ให้มาคือ agent ที่ช่วยค้นหาข้อมูลจากคลิปใน YouTube, agent เล่นมุขตลก เป็นต้น

By lew Founder on Tag: NVIDIA, LLM, Artificial Intelligence, Yann LeCun
NVIDIA

งาน NVIDIA GTC ปีนี้นอกจากการแถลงข่าวของ NVIDIA เองแล้วยังมีนักวิจัยชั้นนำขึ้นเวทีย่อยๆ ในงานจำนวนมาก คนหนึ่งที่มาขึ้นเวทีครั้งนี้คือ Yann LeCun Chief AI Scientist at Meta หนึ่งในผู้บุกเบิก convolutional neural networks (CNN) บรรยายถึงโลกอนาคตของปัญญาประดิษฐ์

By lew Founder on Tag: OpenAI, LLM
OpenAI

OpenAI เปิดบริการ API สำหรับโมเดล o1-pro ซึ่งน่าจะใกล้เคียงกับ o1 pro mode ในแอป ChatGPT Pro ที่คิดค่าบริการรายเดือน 200 ดอลลาร์

จุดเด่นที่เตะตาของ o1-pro คือราคาที่สูงขึ้นมาก สูงกว่า o1 ปกติถึง 10 เท่าตัวกลายเป็น 150 ดอลลาร์ต่อล้านโทเค็นสำหรับอินพุต และ 600 ดอลลาร์ต่อล้านโทเค็นสำหรับเอาท์พุต

คุณสมบัติอื่นๆ ใกล้เคียงกับ o1 เช่น context window ขนาด 200,000 โทเค็น เอาท์พุต 100,000 โทเค็น รองรับการเรียกฟังก์ชั่นและการเอาท์พุตเป็น JSON

Subscribe to LLM