Image

Large Language Model

By arjin Writer on Tag: OpenAI, LLM
OpenAI

Sam Altman ซีอีโอ OpenAI เปิดเผยว่าบริษัทได้เข้าสู่การพัฒนาเวอร์ชันสุดท้ายของโมเดลคิดเป็นเหตุเป็นผล o3-mini แล้ว ซึ่งจะปล่อยออกมาให้ใช้งานในอีกไม่กี่สัปดาห์ข้างหน้า

OpenAI เปิดตัวโมเดลใหม่ o3 และ o3-mini เมื่อเดือนธันวาคมปีที่แล้ว มีความสามารถทำข้อสอบ ARC-AGI ที่ต้องใช้ความเข้าใจกฎของแต่ละข้อได้คะแนนสูงกว่ามนุษย์ทั่วไป ซึ่งตอนนั้น OpenAI บอกว่าทั้งสองโมเดลยังอยู่ในขั้นตอนการทดสอบความปลอดภัย คาดว่า o3-mini จะเผยแพร่ออกมาได้ก่อน

Altman บอกว่าทั้ง API และการทำงานบน ChatGPT จะรองรับพร้อมกันกับการเผยแพร่โมเดล o3-mini นี้ด้วย

By lew Founder on Tag: Cerebras, LLM, Semiconductor
Cerebras

Cerebras ผู้ผลิตชิปปัญญาประดิษฐ์รัน LLM ความเร็วสูงที่สามารถรัน Llama 3.1 405B ได้ความเร็วถึง 969 token/s เปิดเผยถึงแนวทางการออกแบบชิปที่ทำให้สามารถให้บริการได้เร็วระดับนี้ ว่าอาศัยการสร้างชิปขนาดใหญ่ที่มีคอร์จำนวนมหาศาลอยู่ภายใน

By arjin Writer on Tag: Apple Intelligence, Artificial Intelligence, LLM, Apple, iOS 18
Apple Intelligence

แอปเปิลได้ออกอัปเดต iOS 18.3 เบต้า 3 ซึ่งเป็นเวอร์ชันทดสอบให้กับนักพัฒนา โดยมีการเปลี่ยนแปลงสำคัญของ Apple Intelligence ส่วนปัญญาประดิษฐ์สรุปข้อความแจ้งเตือนหรือ Notification Summary

ก่อนหน้านี้ฟังก์ชัน Notification Summary ถูกรายงานปัญหาการสรุปข้อความที่ผิดเพี้ยนไปจากสาระสำคัญ โดยสำนักข่าว BBC ยกตัวอย่างหลายกรณี ทำให้แอปเปิลออกมายอมรับในความผิดพลาดและบอกว่าจะแก้ไข

แอปเปิลอธิบายรายละเอียดที่ปรับปรุงใน iOS 18.3 ดังนี้

By lew Founder on Tag: LLM, Artificial Intelligence
LLM

Together.AI บริการคลาวด์ LLM เปิด Llama 3.3 70B ให้ใช้งานได้ฟรีในระดับ free tier ที่จำกัดปริมาณการใช้งาน

โมเดลนี้รันบน Together Turbo และใช้โมเดลแบบ FB8 ที่ยังคงความเร็วโดยไม่เสียคุณภาพมากนัก (โมเดลเดิมพารามิเตอร์เป็น BF16)

ผู้ใช้งานฟรีจะมี rate limit ที่ 60RPM และ 60,000 TPM (token per minute) การใช้งานแชตทั่วไปน่าจะเพียงพอ แต่หากเป็นการใช้งานเอกสารขนาดใหญ่ หรือต้องการทำบริการ agentic ที่พรอมพ์มักจะยาวมากๆ ก็น่าจะต้องระวังเกินโควต้า

ที่มา - Together.AI

By arjin Writer on Tag: Red Hat, Artificial Intelligence, Acquisition, LLM
Red Hat

Red Hat รายงานว่าบริษัทได้ซื้อกิจการ Neural Magic สตาร์ทอัปด้าน AI เสร็จสิ้นแล้ว หลังจากบริษัทประกาศแผนซื้อกิจการเมื่อเดือนพฤศจิกายนปีที่แล้ว ดีลนี้ไม่มีการเปิดเผยมูลค่า โดยก่อนหน้านี้ Neural Magic ได้รับเงินจากนักลงทุนรวม 50 ล้านดอลลาร์ และดีลนี้อาจเรียกว่าคนคุ้นเคยก็ได้ เพราะซีอีโอ Neural Magic คือ Brian Stevens อดีตผู้บริหาร Red Hat

By lew Founder on Tag: Alibaba Cloud, LLM, Qwen, Chat Bot
Alibaba Cloud

Alibaba Cloud เปิดบริการ Qwen Chat แบบเดียวกับ ChatGPT ให้ลูกค้าบุคคลทั่วไปใช้งาน จากเดิม Qwen เปิดให้บริการ API บน Alibaba Cloud สำหรับลูกค้าองค์กรเป็นหลัก

Qwen Chat ให้บริการทั้งโมเดล Qwen เวอร์ชั่นโอเพนซอร์สและเวอร์ชั่นปิดที่เคยต้องเรียกผ่าน API เท่านั้น รวมถึงโมเดลแบบคิดก่อนตอบอย่าง QwQ และ QVQ ด้วย

หน้าจอใช้ OpenWebUI แบบเดียวกับที่จุฬาลงกรณ์มหาวิทยาลัยใช้งาน ทำให้มีฟีเจอร์ตามมาหลายตัว เช่น การเปรียบเทียบโมเดลรุ่นต่างๆ ตอนนี้ยังไม่มีเงื่อนไขค่าบริการแต่อย่างใด

By arjin Writer on Tag: Google, Artificial Intelligence, LLM, Podcast
Google

กูเกิลยังคงเพิ่มฟีเจอร์คอนเทนต์เสียงที่สร้างด้วย AI ให้กับผู้ใช้งาน โดยล่าสุดเพิ่มโครงการทดลอง "Daily Listen" ที่นำเนื้อหาในฟีดข่าวมาแปลงเป็นรายการพอดคาสต์สรุปเนื้อหาให้

ไอเดียนี้เป็นการพัฒนาจากฟีเจอร์ที่เป็นกระแสก่อนหน้านี้ NotebookLM ที่สร้างรายการเสียงพอดคาสต์ขึ้นจากไฟล์เอกสาร

รายการ Daily Listen ที่สรุปเนื้อหาข่าวในฟีดผู้ใช้งานแต่ละคน ถูกสร้างด้วยความยาวประมาณ 5 นาที แสดงเป็นไอคอนในหน้าแรกของแอป Google ให้กดฟัง

By arjin Writer on Tag: Microsoft, LLM, Artificial Intelligence, Open Source, Phi
Microsoft

ไมโครซอฟท์โอเพนซอร์สโมเดลปัญญาประดิษฐ์ Phi-4 ผ่าน Hugging Face แล้ว ตามที่เคยประกาศไว้ ภายใต้สัญญาอนุญาตแบบ MIT

ไมโครซอฟท์เปิดตัว Phi-4 ที่เป็นโมเดลภาษาขนาดเล็ก (Small Language Model) 14B พารามิเตอร์ เมื่อเดือนที่แล้ว โดยจำกัดให้ใช้งานผ่าน Azure AI Foundry การโอเพนซอร์สโมเดลนี้พร้อมสัญญาอนุญาตแบบ MIT ที่สามารถนำไปใช้งานต่อในเชิงพาณิชย์ได้ น่าจะเพิ่มทางเลือกให้กับพัฒนาได้

By arjin Writer on Tag: ChatGPT, Las Vegas, OpenAI, Artificial Intelligence, LLM
ChatGPT

ตำรวจลาสเวกัสแถลงข่าวผลการสอบสวน เหตุการณ์ที่คนร้ายวางระเบิดรถกระบะไฟฟ้า Tesla Cybertruck หน้าโรงแรม Trump Hotel ซึ่งคนร้ายที่เป็นคนขับรถเสียชีวิต และมีผู้บาดเจ็บอีกหลายคน โดยบอกว่าคนร้ายใช้ ChatGPT ช่วยวางแผนก่อเหตุครั้งนี้

By arjin Writer on Tag: Apple Intelligence, Artificial Intelligence, LLM, Apple, BBC
Apple Intelligence

แอปเปิลออกแถลงการณ์ชี้แจงสำนักข่าว BBC เกี่ยวกับฟีเจอร์สรุปข้อความในการแจ้งเตือน Notification Summary ของ Apple Intelligence ที่สรุปเนื้อหาผิดพลาดไม่ตรงกับเนื้อหาจริง

แอปเปิลเพิ่มปัญญาประดิษฐ์ Apple Intelligence มาตั้งแต่ iOS 18.1 ซึ่งหนึ่งในความสามารถที่มีคือการสรุปข้อความแจ้งเตือนหรือ Notification Summary เพื่อลดเวลาที่ผู้ใช้งานต้องไล่อ่านทุกข้อความเตือน รวบสรุปไว้ในบรรทัดเดียว ซึ่งแอปที่แอปเปิลยกตัวอย่างว่ามีประโยชน์สำหรับฟังก์ชันนี้เช่น Messages หรือแอปข่าวต่าง ๆ นั่นเอง

By lew Founder on Tag: NVIDIA, Grace, GPU, LLM, Blackwell, CES 2025
NVIDIA

NVIDIA เปิดตัวคอมพิวเตอร์ Project DIGITS ที่ภายในเป็นชิป GB10 Superchip สถาปัตยกรรม Grace Blackwell ชูจุดขายว่าเราทุกคนสามารถรันโมเดลขนาด 200B ด้วยตัวเอง

GB10 เป็นซีพียู NVIDIA Grace 20 คอร์ แรม 128GB รวมกันระหว่างซีพียูและจีพียู สตอเรจ NVMe 4TB ทำให้หากรันโมเดลย่อแบบ FP4 ก็จะรันโมเดลขนาดใหญ่ 200B ได้ในตัว แถมรองรับเน็ตเวิร์ค ConnectX เชื่อม DIGITS สองตัวเข้าด้วยกัน รันโมเดล 405B ได้

Project DIGITS เริ่มวางขายเดือนพฤษภาคมนี้ ราคาเริ่มต้น 3,000 ดอลลาร์หรือประมาณหนึ่งแสนบาท

Claude

Anthropic เปิดเผยว่าโมเดล AI Claude จะหยุดให้ข้อมูลเนื้อเพลง ที่มีลิขสิทธิ์ของค่ายเพลง หรือสร้างเนื้อเพลงใหม่ที่อิงจากเพลงที่มีลิขสิทธิ์ หลังจากสามค่ายเพลงใหญ่ฟ้อง Anthropic ที่นำเนื้อเพลงลิขสิทธิ์ไปเทรน AI อย่างไรก็ตามคดีความที่ยังฟ้องร้องกันนั้นยังคงดำเนินต่อไป

ในแถลงการณ์ Anthropic บอกว่าบริษัทไม่ได้สร้าง Claude ให้ละเมิดลิขสิทธิ์ ในการพัฒนามีขั้นตอนหลายอย่างเพื่อป้องกันอยู่แล้ว การตัดสินใจหยุดให้ข้อมูลนี้ก็เพื่อแสดงให้เห็นว่าบริษัทให้ความสำคัญกับเรื่องเนื้อหาที่อาจละเมิดลิขสิทธิ์

By lew Founder on Tag: SCB10X, LLM, Artificial Intelligence
SCB10X

SCB10X ประกาศปล่อยโมเดลปัญญาประดิษฐ์ LLM โดยรองรับหลายรูปแบบทั้งแบบขัอความปกติ, แบบรับภาพ, และแบบรับ/ตอบเป็นเสียง

ตัวโมเดลทั้งหมดพัฒนาต่อมาจากโมเดลโอเพนซอร์ส Llama-3.1/3.2, Qwen2.5 พร้อมกับโมเดลความปลอดภัย Typhoon2-Safety ที่พัฒนามาจาก mdeberta-v3-base โดยจุดสำคัญคือการสร้างชุดข้อมูลที่สะท้อนวัฒนธรรมไทย ทีมงานสร้างโมเดลปัญญาประดิษฐ์มาจัดคะแนนข้อมูลว่าเกี่ยวข้องกับประเทศไทยหรือไม่ โดยให้คะแนน 1-5 ชุดข้อมูลที่ได้คะแนนเกินเกณฑ์ในหมวดต่างๆ ก็จะถูกนำมาใช้งาน ข้อมูลอีกส่วนหนึ่งยังเป็นการสร้างจาก LLM ที่อ่านข้อความแล้วเขียนเป็นภาษาไทยในสไตล์ หนังสือเรียน, บล็อก, หรือบทความวิชาการ

By arjin Writer on Tag: Alibaba Cloud, LLM, Qwen
Alibaba Cloud

Alibaba Cloud ประกาศลดราคาค่าใช้งานโมเดลปัญญาประดิษฐ์ที่รับอินพุทเป็นรูปภาพและวิดีโอ Qwen-vl-max ลง 85% โดยราคาอยู่ที่ 0.003 หยวนต่อ 1,000 อินพุทโทเค็น

การลดราคานี้เพื่อให้โมเดลทำความเข้าใจรูปภาพของ Alibaba Cloud สามารถแข่งขันด้านราคากับโมเดลประเภทเดียวกันของ ByteDance ได้ ซึ่งคิดราคาที่ 0.003 หยวน เท่ากัน

By lew Founder on Tag: Meta AI, Meta, LLM, Artificial Intelligence, Chatbot
Meta AI

บริการ Meta AI ที่เป็นแชตบอตสำหรับผู้ใช้ทั่วไปเปิดให้ใช้งานในประเทศไทยแล้ว หลังจากก่อนหน้านี้จำกัดประเทศผู้ใช้งาน

Meta AI ใช้ Llama 3 เป็นฐานในการให้บริการ โดยผู้ใช้ในไทยสามารถใช้งานได้ครบถ้วน ทั้งการสสร้างภาพ หรือแม้แต่แปลงภาพให้กลายเป็นภาพเคลื่อนไหวก็ยังได้

ที่มา - Meta AI

By lew Founder on Tag: LLM, Artificial Intelligence, China, Open Source
LLM

DeepSeek ผู้พัฒนาปัญญาประดิษฐ์ LLM จากจีน ปล่อยโมเดล DeepSeek v3 โมเดล LLM ขนาดใหญ่มาก จำนวนพารามิเตอร์มากขึ้น 685B จากเดิมที่โมเดลเปิดใหญ่สุดคือ Llama 3.1 405B

ตอนนี้ยังไม่มีข้อมูลเกี่ยวกับโมเดลนี้นัก แต่ทาง Aider โครงการซอฟต์แวร์ช่วยเขียนโปรแกรมก็โชว์ผลทดสอบพบว่า DeepSeek v3 ทำคะแนนทดสอบได้ดีมาก แซงหน้า Claude 3.5 Sonnet อละ Gemini Exp 1206 ไปได้ เป็นรองเพียง OpenAI o1 เท่านั้น ตัวโมเดลใช้สถาปัตยกรรม Mixture-of-Experts แยก expert ออก 256 ชุด และเลือกใช้ 8 ชุดในแต่ละ token

By lew Founder on Tag: Alibaba Cloud, LLM, Qwen
Alibaba Cloud

ทีม Qwen ของ Alibaba Cloud เปิดโมเดล QvQ-72B-Preview ที่พัฒนาต่อจาก Qwen-VL-72B แต่ฝึกให้คิดเป็นขั้นเป็นตอนเพื่อเพิ่มความแม่นยำมากขึ้น

ผลทดสอบที่ทีม Qwen ใช้ทดสอบมี 4 ชุด ได้แก่ MMMU, MathVista, MathVision, และ OlympiadBench คะแนนที่ได้ขึ้นไปถึงระดับ Claude 3.5 Sonnet เข้าใกล้ OpenAI o1 มากขึ้น โดยพฤติกรรมของโมเดลจะคิดไปเรื่อยๆ และตอบคำถามสุดท้าย

โมเดลเปิดให้ทดสอบผ่าน HuggingFace ไฟล์โมเดลเปิดให้ดาวน์โหลดในไลเซนส์แบบ Qwen License โดยตอนนี้ยังส่งคำสั่งได้รอบเดียว ไม่สามารถคุยต่อเนื่องได้

By lew Founder on Tag: LLM, Cloud, Artificial Intelligence, Serverless
LLM

Together.AI ผู้ให้บริการคลาวด์ปัญญาประดิษฐ์เปิดบริการปรับแต่งโมเดล (finetune) แบบ LoRA เต็มรูปแบบ โดยทั้งการฝึกโมเดลและการรันโมเดลที่ปรับแต่งมาแล้ว

บริการ Severless LoRA สามารถใช้ adapter ที่ปรับแต่งมาแล้วจากที่อื่นได้ โดยคิดค่ารันตามโทเค็นเท่ากับโมเดลหลักเท่านั้น และสามารถใช้งานได้กับทุกโมเดลที่ทาง Together.AI ให้บริการแบบ serverless อยู่ เช่น Llama และ Qwen

By arjin Writer on Tag: OpenAI, Artificial Intelligence, LLM, Rumors
OpenAI

The Wall Street Journal มีรายงานโดยอ้างแหล่งข่าวที่เกี่ยวข้อง ถึงปัญหาและอุปสรรค์ของการพัฒนา GPT-5 โมเดลแชทบอตปัญญาประดิษฐ์เวอร์ชันใหม่ของ OpenAI หรือที่มีโค้ดเนมภายในว่า Orion ซึ่งพัฒนามานาน 18 เดือนแล้ว

Subscribe to LLM