LLM | Blognone

Large Language Model

OpenAI เตรียมปล่อยโมเดล o3-mini คิดเป็นเหตุเป็นผลและฉลาดมากกว่าเดิม ในอีกไม่กี่สัปดาห์ข้างหน้า

By arjin

on 18 January 2025 - 09:35 Tag: OpenAI, LLM

OpenAI

Sam Altman ซีอีโอ OpenAI เปิดเผยว่าบริษัทได้เข้าสู่การพัฒนาเวอร์ชันสุดท้ายของโมเดลคิดเป็นเหตุเป็นผล o3-mini แล้ว ซึ่งจะปล่อยออกมาให้ใช้งานในอีกไม่กี่สัปดาห์ข้างหน้า

OpenAI เปิดตัวโมเดลใหม่ o3 และ o3-mini เมื่อเดือนธันวาคมปีที่แล้ว มีความสามารถทำข้อสอบ ARC-AGI ที่ต้องใช้ความเข้าใจกฎของแต่ละข้อได้คะแนนสูงกว่ามนุษย์ทั่วไป ซึ่งตอนนั้น OpenAI บอกว่าทั้งสองโมเดลยังอยู่ในขั้นตอนการทดสอบความปลอดภัย คาดว่า o3-mini จะเผยแพร่ออกมาได้ก่อน

Altman บอกว่าทั้ง API และการทำงานบน ChatGPT จะรองรับพร้อมกันกับการเผยแพร่โมเดล o3-mini นี้ด้วย

นี่มันชิปหรือเมนบอร์ด Cerebras โชว์ชิป AI ใช้เวเฟอร์เต็มแผ่น ทนความผิดพลาดการผลิตได้ในตัว

By lew

on 17 January 2025 - 09:13 Tag: Cerebras, LLM, Semiconductor

Cerebras

Cerebras ผู้ผลิตชิปปัญญาประดิษฐ์รัน LLM ความเร็วสูงที่สามารถรัน Llama 3.1 405B ได้ความเร็วถึง 969 token/s เปิดเผยถึงแนวทางการออกแบบชิปที่ทำให้สามารถให้บริการได้เร็วระดับนี้ ว่าอาศัยการสร้างชิปขนาดใหญ่ที่มีคอร์จำนวนมหาศาลอยู่ภายใน

Apple จะแก้ไขปัญหา Notification Summary ของ Apple Intelligence ในอัปเดต iOS 18.3

By arjin

on 17 January 2025 - 07:49 Tag: Apple Intelligence, Artificial Intelligence, LLM, Apple, iOS 18

Apple Intelligence

แอปเปิลได้ออกอัปเดต iOS 18.3 เบต้า 3 ซึ่งเป็นเวอร์ชันทดสอบให้กับนักพัฒนา โดยมีการเปลี่ยนแปลงสำคัญของ Apple Intelligence ส่วนปัญญาประดิษฐ์สรุปข้อความแจ้งเตือนหรือ Notification Summary

ก่อนหน้านี้ฟังก์ชัน Notification Summary ถูกรายงานปัญหาการสรุปข้อความที่ผิดเพี้ยนไปจากสาระสำคัญ โดยสำนักข่าว BBC ยกตัวอย่างหลายกรณี ทำให้แอปเปิลออกมายอมรับในความผิดพลาดและบอกว่าจะแก้ไข

แอปเปิลอธิบายรายละเอียดที่ปรับปรุงใน iOS 18.3 ดังนี้

Together.AI เปิด Llama 3.3 70B API ให้ใช้งานฟรี

By lew

on 15 January 2025 - 19:00 Tag: LLM, Artificial Intelligence

LLM

Together.AI บริการคลาวด์ LLM เปิด Llama 3.3 70B ให้ใช้งานได้ฟรีในระดับ free tier ที่จำกัดปริมาณการใช้งาน

โมเดลนี้รันบน Together Turbo และใช้โมเดลแบบ FB8 ที่ยังคงความเร็วโดยไม่เสียคุณภาพมากนัก (โมเดลเดิมพารามิเตอร์เป็น BF16)

ผู้ใช้งานฟรีจะมี rate limit ที่ 60RPM และ 60,000 TPM (token per minute) การใช้งานแชตทั่วไปน่าจะเพียงพอ แต่หากเป็นการใช้งานเอกสารขนาดใหญ่ หรือต้องการทำบริการ agentic ที่พรอมพ์มักจะยาวมากๆ ก็น่าจะต้องระวังเกินโควต้า

ที่มา - Together.AI

Red Hat ปิดดีลซื้อกิจการ Neural Magic ผู้พัฒนาเทคโนโลยีประมวลผล AI บนฮาร์ดแวร์พื้นฐาน

By arjin

on 15 January 2025 - 13:31 Tag: Red Hat, Artificial Intelligence, Acquisition, LLM

Red Hat

Red Hat รายงานว่าบริษัทได้ซื้อกิจการ Neural Magic สตาร์ทอัปด้าน AI เสร็จสิ้นแล้ว หลังจากบริษัทประกาศแผนซื้อกิจการเมื่อเดือนพฤศจิกายนปีที่แล้ว ดีลนี้ไม่มีการเปิดเผยมูลค่า โดยก่อนหน้านี้ Neural Magic ได้รับเงินจากนักลงทุนรวม 50 ล้านดอลลาร์ และดีลนี้อาจเรียกว่าคนคุ้นเคยก็ได้ เพราะซีอีโอ Neural Magic คือ Brian Stevens อดีตผู้บริหาร Red Hat

Alibaba Cloud เปิดบริการ Qwen Chat ให้ผู้ใช้ทั่วไป

By lew

on 14 January 2025 - 19:35 Tag: Alibaba Cloud, LLM, Qwen, Chat Bot

Alibaba Cloud

Alibaba Cloud เปิดบริการ Qwen Chat แบบเดียวกับ ChatGPT ให้ลูกค้าบุคคลทั่วไปใช้งาน จากเดิม Qwen เปิดให้บริการ API บน Alibaba Cloud สำหรับลูกค้าองค์กรเป็นหลัก

Qwen Chat ให้บริการทั้งโมเดล Qwen เวอร์ชั่นโอเพนซอร์สและเวอร์ชั่นปิดที่เคยต้องเรียกผ่าน API เท่านั้น รวมถึงโมเดลแบบคิดก่อนตอบอย่าง QwQ และ QVQ ด้วย

หน้าจอใช้ OpenWebUI แบบเดียวกับที่จุฬาลงกรณ์มหาวิทยาลัยใช้งาน ทำให้มีฟีเจอร์ตามมาหลายตัว เช่น การเปรียบเทียบโมเดลรุ่นต่างๆ ตอนนี้ยังไม่มีเงื่อนไขค่าบริการแต่อย่างใด

Google เพิ่มฟีเจอร์ทดลอง "Daily Listen" สรุปข่าวในฟีดเป็นพอดคาสต์ความยาว 5 นาที

By arjin

on 9 January 2025 - 06:14 Tag: Google, Artificial Intelligence, LLM, Podcast

Google

กูเกิลยังคงเพิ่มฟีเจอร์คอนเทนต์เสียงที่สร้างด้วย AI ให้กับผู้ใช้งาน โดยล่าสุดเพิ่มโครงการทดลอง "Daily Listen" ที่นำเนื้อหาในฟีดข่าวมาแปลงเป็นรายการพอดคาสต์สรุปเนื้อหาให้

ไอเดียนี้เป็นการพัฒนาจากฟีเจอร์ที่เป็นกระแสก่อนหน้านี้ NotebookLM ที่สร้างรายการเสียงพอดคาสต์ขึ้นจากไฟล์เอกสาร

รายการ Daily Listen ที่สรุปเนื้อหาข่าวในฟีดผู้ใช้งานแต่ละคน ถูกสร้างด้วยความยาวประมาณ 5 นาที แสดงเป็นไอคอนในหน้าแรกของแอป Google ให้กดฟัง

Microsoft โอเพนซอร์ส Phi-4 โมเดลภาษาขนาดเล็ก 14B แล้ว

By arjin

on 9 January 2025 - 00:23 Tag: Microsoft, LLM, Artificial Intelligence, Open Source, Phi

Microsoft

ไมโครซอฟท์โอเพนซอร์สโมเดลปัญญาประดิษฐ์ Phi-4 ผ่าน Hugging Face แล้ว ตามที่เคยประกาศไว้ ภายใต้สัญญาอนุญาตแบบ MIT

ไมโครซอฟท์เปิดตัว Phi-4 ที่เป็นโมเดลภาษาขนาดเล็ก (Small Language Model) 14B พารามิเตอร์ เมื่อเดือนที่แล้ว โดยจำกัดให้ใช้งานผ่าน Azure AI Foundry การโอเพนซอร์สโมเดลนี้พร้อมสัญญาอนุญาตแบบ MIT ที่สามารถนำไปใช้งานต่อในเชิงพาณิชย์ได้ น่าจะเพิ่มทางเลือกให้กับพัฒนาได้

ผลสอบสวนพบคนร้ายระเบิดรถ Cybertruck ที่ลาสเวกัส ใช้ ChatGPT ช่วยวางแผนก่อเหตุ

By arjin

on 8 January 2025 - 20:24 Tag: ChatGPT, Las Vegas, OpenAI, Artificial Intelligence, LLM

ChatGPT

ตำรวจลาสเวกัสแถลงข่าวผลการสอบสวน เหตุการณ์ที่คนร้ายวางระเบิดรถกระบะไฟฟ้า Tesla Cybertruck หน้าโรงแรม Trump Hotel ซึ่งคนร้ายที่เป็นคนขับรถเสียชีวิต และมีผู้บาดเจ็บอีกหลายคน โดยบอกว่าคนร้ายใช้ ChatGPT ช่วยวางแผนก่อเหตุครั้งนี้

Apple ยอมรับและจะแก้ไขปัญหา Notification Summary ของ Apple Intelligence หลัง BBC โวยมาเกือบเดือน

By arjin

on 7 January 2025 - 13:21 Tag: Apple Intelligence, Artificial Intelligence, LLM, Apple, BBC

Apple Intelligence

แอปเปิลออกแถลงการณ์ชี้แจงสำนักข่าว BBC เกี่ยวกับฟีเจอร์สรุปข้อความในการแจ้งเตือน Notification Summary ของ Apple Intelligence ที่สรุปเนื้อหาผิดพลาดไม่ตรงกับเนื้อหาจริง

แอปเปิลเพิ่มปัญญาประดิษฐ์ Apple Intelligence มาตั้งแต่ iOS 18.1 ซึ่งหนึ่งในความสามารถที่มีคือการสรุปข้อความแจ้งเตือนหรือ Notification Summary เพื่อลดเวลาที่ผู้ใช้งานต้องไล่อ่านทุกข้อความเตือน รวบสรุปไว้ในบรรทัดเดียว ซึ่งแอปที่แอปเปิลยกตัวอย่างว่ามีประโยชน์สำหรับฟังก์ชันนี้เช่น Messages หรือแอปข่าวต่าง ๆ นั่นเอง

NVIDIA เปิดตัว DIGITS คอมพิวเตอร์รัน AI โดยเฉพาะ รันโมเดลขนาด 200B (FP4) ได้ในตัว

By lew

on 7 January 2025 - 11:52 Tag: NVIDIA, Grace, GPU, LLM, Blackwell, CES 2025

NVIDIA

NVIDIA เปิดตัวคอมพิวเตอร์ Project DIGITS ที่ภายในเป็นชิป GB10 Superchip สถาปัตยกรรม Grace Blackwell ชูจุดขายว่าเราทุกคนสามารถรันโมเดลขนาด 200B ด้วยตัวเอง

GB10 เป็นซีพียู NVIDIA Grace 20 คอร์ แรม 128GB รวมกันระหว่างซีพียูและจีพียู สตอเรจ NVMe 4TB ทำให้หากรันโมเดลย่อแบบ FP4 ก็จะรันโมเดลขนาดใหญ่ 200B ได้ในตัว แถมรองรับเน็ตเวิร์ค ConnectX เชื่อม DIGITS สองตัวเข้าด้วยกัน รันโมเดล 405B ได้

Project DIGITS เริ่มวางขายเดือนพฤษภาคมนี้ ราคาเริ่มต้น 3,000 ดอลลาร์หรือประมาณหนึ่งแสนบาท

Claude หยุดให้คำตอบที่เป็นเนื้อเพลง หลัง Anthropic ถูกค่ายเพลงฟ้องร้อง นำเนื้อเพลงลิขสิทธิ์ไปเทรน AI

By arjin

on 3 January 2025 - 11:40 Tag: Claude, Anthropic, LLM, Music, Copyright Infringement, Artificial Intelligence

Claude

Anthropic เปิดเผยว่าโมเดล AI Claude จะหยุดให้ข้อมูลเนื้อเพลง ที่มีลิขสิทธิ์ของค่ายเพลง หรือสร้างเนื้อเพลงใหม่ที่อิงจากเพลงที่มีลิขสิทธิ์ หลังจากสามค่ายเพลงใหญ่ฟ้อง Anthropic ที่นำเนื้อเพลงลิขสิทธิ์ไปเทรน AI อย่างไรก็ตามคดีความที่ยังฟ้องร้องกันนั้นยังคงดำเนินต่อไป

ในแถลงการณ์ Anthropic บอกว่าบริษัทไม่ได้สร้าง Claude ให้ละเมิดลิขสิทธิ์ ในการพัฒนามีขั้นตอนหลายอย่างเพื่อป้องกันอยู่แล้ว การตัดสินใจหยุดให้ข้อมูลนี้ก็เพื่อแสดงให้เห็นว่าบริษัทให้ความสำคัญกับเรื่องเนื้อหาที่อาจละเมิดลิขสิทธิ์

SCB10X ปล่อยโมเดล Typhoon2 มีทั้งรุ่นข้อความ, ภาพ, และโมเดลเสียง

By lew

on 2 January 2025 - 21:30 Tag: SCB10X, LLM, Artificial Intelligence

SCB10X

SCB10X ประกาศปล่อยโมเดลปัญญาประดิษฐ์ LLM โดยรองรับหลายรูปแบบทั้งแบบขัอความปกติ, แบบรับภาพ, และแบบรับ/ตอบเป็นเสียง

ตัวโมเดลทั้งหมดพัฒนาต่อมาจากโมเดลโอเพนซอร์ส Llama-3.1/3.2, Qwen2.5 พร้อมกับโมเดลความปลอดภัย Typhoon2-Safety ที่พัฒนามาจาก mdeberta-v3-base โดยจุดสำคัญคือการสร้างชุดข้อมูลที่สะท้อนวัฒนธรรมไทย ทีมงานสร้างโมเดลปัญญาประดิษฐ์มาจัดคะแนนข้อมูลว่าเกี่ยวข้องกับประเทศไทยหรือไม่ โดยให้คะแนน 1-5 ชุดข้อมูลที่ได้คะแนนเกินเกณฑ์ในหมวดต่างๆ ก็จะถูกนำมาใช้งาน ข้อมูลอีกส่วนหนึ่งยังเป็นการสร้างจาก LLM ที่อ่านข้อความแล้วเขียนเป็นภาษาไทยในสไตล์ หนังสือเรียน, บล็อก, หรือบทความวิชาการ

Alibaba Cloud ลดราคาโมเดลรับอินพุทรูปภาพ Qwen-VL ลง 85% ตามสงครามราคาโมเดล AI ในจีน

By arjin

on 1 January 2025 - 10:48 Tag: Alibaba Cloud, LLM, Qwen

Alibaba Cloud

Alibaba Cloud ประกาศลดราคาค่าใช้งานโมเดลปัญญาประดิษฐ์ที่รับอินพุทเป็นรูปภาพและวิดีโอ Qwen-vl-max ลง 85% โดยราคาอยู่ที่ 0.003 หยวนต่อ 1,000 อินพุทโทเค็น

การลดราคานี้เพื่อให้โมเดลทำความเข้าใจรูปภาพของ Alibaba Cloud สามารถแข่งขันด้านราคากับโมเดลประเภทเดียวกันของ ByteDance ได้ ซึ่งคิดราคาที่ 0.003 หยวน เท่ากัน

ไม่หวั่นแม้โดนเนิร์ฟ DeepSeek พัฒนา LLM ด้วยชิป H800 2048 ชุด แข่งราคากับโมเดลจากสหรัฐฯ

By lew

on 30 December 2024 - 00:01 Tag: LLM, Artificial Intelligence

LLM

DeepSeek v3 โมเดลปัญญาประดิษฐ์ LLM ที่เปิดให้ดาวน์โหลดไปใช้งานเองที่ใหญ่ที่สุดในตอนนี้ รวม 685B ออกรายงานเชิงเทคนิค เปิดเผยถึงสถาปัตยกรรมและกระบวนการฝึก

บริการแชต Meta AI เปิดให้ใช้งานในไทย

By lew

on 28 December 2024 - 13:20 Tag: Meta AI, Meta, LLM, Artificial Intelligence, Chatbot

Meta AI

บริการ Meta AI ที่เป็นแชตบอตสำหรับผู้ใช้ทั่วไปเปิดให้ใช้งานในประเทศไทยแล้ว หลังจากก่อนหน้านี้จำกัดประเทศผู้ใช้งาน

Meta AI ใช้ Llama 3 เป็นฐานในการให้บริการ โดยผู้ใช้ในไทยสามารถใช้งานได้ครบถ้วน ทั้งการสสร้างภาพ หรือแม้แต่แปลงภาพให้กลายเป็นภาพเคลื่อนไหวก็ยังได้

ที่มา - Meta AI

DeepSeek v3 โมเดลเปิดให้รันเองขนาด 685B ทดสอบเขียนโค้ดคะแนนดีกว่า Claude 3.5 Sonnet

By lew

on 26 December 2024 - 11:45 Tag: LLM, Artificial Intelligence, China, Open Source

LLM

DeepSeek ผู้พัฒนาปัญญาประดิษฐ์ LLM จากจีน ปล่อยโมเดล DeepSeek v3 โมเดล LLM ขนาดใหญ่มาก จำนวนพารามิเตอร์มากขึ้น 685B จากเดิมที่โมเดลเปิดใหญ่สุดคือ Llama 3.1 405B

ตอนนี้ยังไม่มีข้อมูลเกี่ยวกับโมเดลนี้นัก แต่ทาง Aider โครงการซอฟต์แวร์ช่วยเขียนโปรแกรมก็โชว์ผลทดสอบพบว่า DeepSeek v3 ทำคะแนนทดสอบได้ดีมาก แซงหน้า Claude 3.5 Sonnet อละ Gemini Exp 1206 ไปได้ เป็นรองเพียง OpenAI o1 เท่านั้น ตัวโมเดลใช้สถาปัตยกรรม Mixture-of-Experts แยก expert ออก 256 ชุด และเลือกใช้ 8 ชุดในแต่ละ token

Alibaba Cloud เปิดตัว QvQ-72B โมเดลคิดก่อนตอบแถมดูภาพได้

By lew

on 25 December 2024 - 12:09 Tag: Alibaba Cloud, LLM, Qwen

Alibaba Cloud

ทีม Qwen ของ Alibaba Cloud เปิดโมเดล QvQ-72B-Preview ที่พัฒนาต่อจาก Qwen-VL-72B แต่ฝึกให้คิดเป็นขั้นเป็นตอนเพื่อเพิ่มความแม่นยำมากขึ้น

ผลทดสอบที่ทีม Qwen ใช้ทดสอบมี 4 ชุด ได้แก่ MMMU, MathVista, MathVision, และ OlympiadBench คะแนนที่ได้ขึ้นไปถึงระดับ Claude 3.5 Sonnet เข้าใกล้ OpenAI o1 มากขึ้น โดยพฤติกรรมของโมเดลจะคิดไปเรื่อยๆ และตอบคำถามสุดท้าย

โมเดลเปิดให้ทดสอบผ่าน HuggingFace ไฟล์โมเดลเปิดให้ดาวน์โหลดในไลเซนส์แบบ Qwen License โดยตอนนี้ยังส่งคำสั่งได้รอบเดียว ไม่สามารถคุยต่อเนื่องได้

Together.AI เปิดบริการ Serverless LoRA ไม่คิดค่าโฮสต์โมเดลที่ปรับแต่งแล้ว คิดแต่ค่ารันตามโทเค็น

By lew

on 24 December 2024 - 12:34 Tag: LLM, Cloud, Artificial Intelligence, Serverless

LLM

Together.AI ผู้ให้บริการคลาวด์ปัญญาประดิษฐ์เปิดบริการปรับแต่งโมเดล (finetune) แบบ LoRA เต็มรูปแบบ โดยทั้งการฝึกโมเดลและการรันโมเดลที่ปรับแต่งมาแล้ว

บริการ Severless LoRA สามารถใช้ adapter ที่ปรับแต่งมาแล้วจากที่อื่นได้ โดยคิดค่ารันตามโทเค็นเท่ากับโมเดลหลักเท่านั้น และสามารถใช้งานได้กับทุกโมเดลที่ทาง Together.AI ให้บริการแบบ serverless อยู่ เช่น Llama และ Qwen

[ลือ] OpenAI พบปัญหาในการพัฒนา GPT-5 ยังไม่ฉลาดมากพอ, ต้นทุนเทรนสูง แถมข้อมูลมีไม่พอ

By arjin

on 22 December 2024 - 18:23 Tag: OpenAI, Artificial Intelligence, LLM, Rumors

OpenAI

The Wall Street Journal มีรายงานโดยอ้างแหล่งข่าวที่เกี่ยวข้อง ถึงปัญหาและอุปสรรค์ของการพัฒนา GPT-5 โมเดลแชทบอตปัญญาประดิษฐ์เวอร์ชันใหม่ของ OpenAI หรือที่มีโค้ดเนมภายในว่า Orion ซึ่งพัฒนามานาน 18 เดือนแล้ว

Subscribe to LLM