LLM | Blognone

Large Language Model

เหมือนคนขึ้นเรื่อยๆ OpenAI ถอดอัพเดต GPT-4o หลังพบช่างประจบเกินเหตุ

By lew

on 30 April 2025 - 10:33 Tag: OpenAI, LLM

OpenAI

OpenAI ประกาศถอดอัพเดต GPT-4o เวอร์ชั่นล่าสุดออกจาก ChatGPT หลังพบว่าโมเดลมีลักษณะช่างประจบเกินเหตุ หรือเรียกว่า sycophantic

ทาง OpenAI ทดสอบโมเดลเวอร์ชั่นใหม่เรื่อยๆ โดยสังเกตผลตอบรับจากการกด 👍 และ 👎 โดยเมื่อสังเกตุผลตอบรับที่ดีขึ้นก็นำโมเดลไปใช้งาน แต่ภายหลังพบว่าโมเดลรุ่นทดสอบนี้มีลักษณะประจบประแจงเอาใจแต่กลับไม่จริงใจกับผู้ใช้

โมเดลหลังจากนี้จะถูกฝึกให้ลดการประจบประแจงเอาใจ และเพิ่มระบบ guardrails ให้แสดงความจริงใจมากขึ้น พร้อมกับรับความเห็นจากผู้ใช้ให้มากขึ้นระหว่างทดสอบ

ที่มา - OpenAI

Audio Overview ฟีเจอร์สร้างไฟล์เสียงสไตล์พอดคาสต์ของ Google NotebookLM รองรับเพิ่มกว่า 50 ภาษา รวมทั้งภาษาไทย

By arjin

on 30 April 2025 - 07:43 Tag: NotebookLM, Google, Gemini, Artificial Intelligence, LLM, Podcast

NotebookLM

กูเกิลประกาศว่าฟีเจอร์ Audio Overview ใน NotebookLM ที่สร้างไฟล์เสียงแบบรายการพอดคาสต์ที่มีผู้จัดรายการสองคนสนทนากัน รองรับเพิ่มเติมมากกว่า 50 ภาษา รวมทั้งภาษาไทยด้วย

ผู้ใช้งานสามารถอัปโหลดเนื้อหาเพื่อให้ NotebookLM สร้างไฟล์เสียงออกมาตามภาษาที่กำหนดไว้ของบัญชีกูเกิล หรือเลือกภาษาอื่นที่ต้องการเองได้ (Settings > Output Language) ทั้งหมดรองรับเนื้อหาเริ่มต้นจากภาษาอื่นด้วยเช่นกัน เพราะตัว NotebookLM ที่สรุปเนื้อหาจากเอกสารรองรับอยู่แล้วมากกว่า 200 ภาษา

Alibaba ออกโมเดล Qwen3 ทำงานแบบไฮบริดได้ทั้งโหมดคิดเยอะ และโหมดตอบไว

By arjin

on 29 April 2025 - 07:45 Tag: Qwen, Alibaba Cloud, Alibaba, LLM, Artificial Intelligence

Qwen

Alibaba เปิดตัวโมเดลปัญญาประดิษฐ์รุ่นล่าสุด Qwen3 โดยบอกว่ามีผลการทดสอบในบางหัวข้อดีกว่า DeepSeek-R1, o1, o3-mini, Grok-3 และ Gemini-2.5-Pro

Qwen3 ออกโมเดลสองรุ่นย่อยคือ Qwen3-235B-A22B ขนาดพารามิเตอร์รวม 235B และพารามิเตอร์ที่ทำงาน 22B และโมเดลรุ่นเล็ก Qwen3-30B-A3B ขนาดพารามิเตอร์รวม 30B และพารามิเตอร์ที่ทำงาน 3B และมีโมเดลแบบ open-weighted อีก 6 ขนาดตั้งแต่ 0.6B ถึง 32B

Baidu เปิดตัวโมเดล AI รุ่นใหม่ ERNIE X1 Turbo และ ERNIE 4.5 Turbo เร็วขึ้นและราคาถูกลง

By arjin

on 28 April 2025 - 15:25 Tag: Baidu, Artificial Intelligence, LLM, Chatbot

Baidu

Baidu เปิดตัวโมเดลปัญญาประดิษฐ์ใหม่ในงานสัมมนาสำหรับนักพัฒนา Baidu Create 2025 ได้แก่ ERNIE X1 Turbo และ ERNIE 4.5 Turbo ซึ่งเป็นรุ่นถัดจากสองโมเดลที่เปิดตัวเมื่อเดือนมีนาคม โดยบอกว่าทำงานเร็วขึ้น ด้วยต้นทุนที่ถูกลง

ERNIE X1 Turbo เป็นโมเดลคิดเป็นขั้นตอน ระบุว่าประสิทธิภาพและต้นทุนดีกว่า DeepSeek R1 V3 ตัวล่าสุด คิดราคาอินพุท 1 หยวนต่อ 1M โทเค็น และเอาท์พุท 4 หยวนต่อ 1M โทเค็น ซึ่งคิดเป็น 25% ของราคาใช้งาน DeepSeek R1

OpenAI ออก Deep Research รุ่น Lightweight เรียกใช้เมื่อตัวหลักครบโควต้า - ลูกค้า ChatGPT แบบฟรีได้ใช้ด้วย

By arjin

on 25 April 2025 - 18:18 Tag: OpenAI, Research, ChatGPT, LLM, Search Engine, Artificial Intelligence

OpenAI

OpenAI ประกาศว่าเครื่องมือสำหรับค้นหาวิเคราะห์ข้อมูลเชิงลึก Deep Research ซึ่งตอนนี้ผู้ใช้งานแบบเสียเงินทุกกลุ่มสามารถใช้งานได้แบบจำกัดจำนวน ได้รับการตอบรับที่ดีมากจากผู้ใช้งาน OpenAI จึงหาแนวทางให้ทุกคนสามารถใช้งาน Deep Research ได้มากขึ้นด้วยการออกเวอร์ชันใหม่มาเสริม

Character.AI เปิดตัว AvatarFX โมเดลสร้างภาพเคลื่อนไหวจากอินพุทภาพนิ่ง

By arjin

on 24 April 2025 - 12:30 Tag: Character.AI, LLM, Artificial Intelligence

Character.AI

Character.AI เปิดตัวโมเดล AI สร้างวิดีโอใหม่ชื่อ AvatarFX ให้ผู้ใช้งานสร้างวิดีโอที่สามารถพูด ร้องเพลง แสดงออกทางอารมณ์ ได้จากอินพุทรูปภาพ ซึ่งผลลัพธ์ทำได้ทั้งรูปภาพบุคคลจริง ไปจนถึงคาแรกเตอร์การ์ตูนอนิเมชัน

การสร้างวิดีโอให้รูปภาพขยับปากหรือเคลื่อนไหวได้อาจไม่ใช่เรื่องใหม่ Character.AI ได้อธิบายจุดเด่นของ AvatarFX ว่ารองรับอินพุทหลากหลาย ทั้งรูป 2D, 3D ไปจนถึงใบหน้าสัตว์ ส่วนใบหน้าถูกปรับให้คงที่ไม่เพี้ยน และรองรับการทำวิดีโอขนาดยาว

กูเกิลออก MCP Toolbox for Databases ตัวเชื่อมต่อฐานข้อมูลกับโมเดล LLM

By mk

on 24 April 2025 - 08:00 Tag: Google Cloud, Google, Database, LLM, Artificial Intelligence

Google Cloud

หลังจาก กูเกิลประกาศรองรับโปรโตคอล Model Context Protocol (MCP) ซึ่งเป็นโปรโตคอลที่เชื่อมต่อแหล่งข้อมูลภายนอกกับโมเดล LLM ที่เริ่มพัฒนาโดย Anthropic แต่ก็ถูกยอมรับกันแพร่หลายในวงการ

รู้จักกับ Cluely แอปรับเงินลงทุน $5M ที่มีเป้าหมายเป็น "AI ช่วยโกง" จนผู้ก่อตั้งถูกไล่ออกจากมหาวิทยาลัย

By arjin

on 22 April 2025 - 12:29 Tag: Artificial Intelligence, LLM

Artificial Intelligence

เรื่องมีอยู่ว่า Chungin Lee นักศึกษา Columbia University เปิดเผยว่าเขาถูกสั่งพักการศึกษา 1 ปี หลังจากพัฒนาเครื่องมือชื่อว่า Interview Coder ซึ่งเป็น AI ช่วยทำข้อสอบเขียนโค้ดบนแพลตฟอร์ม LeetCode ที่หลายองค์กรใช้เป็นขั้นตอนแรกก่อนเรียกสัมภาษณ์งาน โดยไม่ถูกจับได้ แต่เมื่อองค์กรบางแห่งทราบเรื่องนี้ เพราะ Lee ลองใช้งานจนผ่านขั้นตอนทดสอบ ได้ทำหนังสือเตือนมาทางมหาวิทยาลัย จึงทำให้ Columbia University สั่งพักการศึกษา Lee

ว่างๆ ค่อยตอบเหมือนคน OpenAI เปิดบริการ Flex Processing รอเครื่องว่างค่อยตอบ

By lew

on 21 April 2025 - 13:05 Tag: OpenAI, LLM

OpenAI

OpenAI เพิ่มโหมดการประมวลผลแบบ flex processing เป็นตัวเลือกตรงกลางระหว่างการเรียก API ตามปกติ และการสั่งงานแบบ batch processing ที่อาจจะต้องรอนานถึง 24 ชั่วโมง แถมยังใช้ API เหมือนการเรียก Chat Completions API และ Responses API ตามปกติ

เมื่อเราเรียก flex processing จะสามารถกำหนดช่วงเวลารอคอยเพิ่มเติม หรือหากไม่กำหนดจะระบุไว้ที่ 10 นาที การเชื่อมต่อจะเชื่อมต่อรอการประมวลผลเสร็จ ทำให้การใช้งานจริงแก้โค้ดจากการเรียก API เดิมๆ เพียงเล็กน้อยเท่านั้น แต่หากทาง OpenAI ไม่มีเซิร์ฟเวอร์ว่างภายในเวลาที่กำหนดก็จะได้ 429 Resource Unavailable มาแทน

ทีมวิจัยไมโครซอฟท์โชว์ BitNet โมเดล LLM ขนาดเล็ก 1-bit ใช้แรม 0.4GB รันในซีพียูได้

By mk

on 20 April 2025 - 13:16 Tag: Microsoft, Research, LLM

Microsoft

ทีมวิจัย Microsoft Research เปิดตัวโมเดลภาษา BitNet ที่ขนาดเล็กพอจนสามารถรันในซีพียูได้

วงการโมเดลภาษา LLM รุ่นเล็กมีโมเดลหลายค่าย เช่น Llama ขนาดพารามิเตอร์ 1B และ 3B กรณีของ BitNet มีขนาดพารามิเตอร์ 2B และเทรนด้วยข้อมูลขนาด 4T (trillion tokens) แล้วถูกลดขนาดน้ำหนักข้อมูล (quantized) เพื่อให้ขนาดของโมเดลเล็กลง

กูเกิลลบโฆษณาประสงค์ร้าย-ผิดกฎหมาย 5.1 พันล้านชิ้นในปี 2024, ใช้พลัง LLM ช่วยตรวจ

By mk

on 20 April 2025 - 12:01 Tag: Google, Advertising, Scam, LLM

Google

กูเกิลเผยสถิติการปราบปรามโฆษณาผิดกฎหมาย-ประสงค์ร้ายตลอดทั้งปี 2024 สามารถลบโฆษณาออกไปได้ 5.1 พันล้านชิ้น, จำกัดการมองเห็นอีก 9.1 พันล้านชิ้น และปิดบัญชีโฆษณาที่ละเมิดกฎไปได้ 39.2 ล้านบัญชี

เทคนิคที่กูเกิลใช้งานคือนำ LLM มาช่วยตรวจโฆษณา ถึงแม้ไม่ได้เปิดเผยรายละเอียดมากนัก แต่กูเกิลบอกว่าเพิ่มฟีเจอร์ให้โมเดล LLM กว่า 50 อย่างในปี 2024 ช่วยให้ตรวจสอบโฆษณาที่ซับซ้อนได้ดีขึ้น สามารถดักจับผู้ประสงค์ร้ายได้ตั้งแต่ตอนเริ่มเปิดบัญชี

ฝั่งของโฆษณาแบบ scam ก็ปรับนโยบายใหม่ให้เข้มงวดกว่าเดิม สามารถปิดบัญชีโฆษณา scam ลงได้ 700,000 บัญชี และลดโฆษณาแบบ scam ลงได้ 90%

OpenAI พบโมเดล o3 และ o4-mini มีอัตราหลอนสูงกว่าโมเดลรุ่นเก่า ยังหาคำตอบไม่ได้ว่าทำไม

By arjin

on 19 April 2025 - 12:16 Tag: OpenAI, LLM

OpenAI

OpenAI เปิดตัวโมเดล AI ที่คิดเป็นขั้นตอนก่อนตอบรุ่นล่าสุด o3 และ o4-mini ที่ระบุว่ามีประสิทธิภาพสูง ทำคะแนนจากผลการทดสอบได้ดี อย่างไรก็ตามโมเดลนี้ยังมีปัญหาที่กำลังแก้ไขอยู่

OpenAI เผยแพร่ข้อมูลใน System Card เกี่ยวกับโมเดล o3 และ o4-mini นี้ พูดถึงอาการหลอนหรือ Hallucination ในชุดทดสอบ PersonQA พบอัตราการหลอนของทั้ง 2 โมเดลนี้ สูงกว่าโมเดลคิดเป็นขั้นตอนรุ่นเก่าอย่าง o1

กูเกิลปล่อย Gemma 3 QAT ฝึกแบบย่อเพื่อการรันบนพีซีโดยเฉพาะ

By lew

on 18 April 2025 - 20:42 Tag: Gemma, Gemini, Google, LLM

Gemma

กูเกิลปล่อยโมเดลปัญญาประดิษฐ์ Gemma 3 รุ่นย่อแบบ Quantization Aware Training (QAT) เป็นโมเดลที่ถูกฝึกระหว่างการย่อโมเดลเหลือ Q4_O เล็กพอที่จะรัน Gemma 3 27B ในการ์ดจอแรม 14.1GB

โมเดล QAT อาศัยโมเดลเต็มแบบ BF16 เป็นต้นแบบแล้วฝึกโมเดลที่กำลังย่อให้จำลองตัวเองว่าถูกย่อไปแล้ว แต่ให้หาทางสร้างคำตอบให้ใกล้เคียงโมเดลเต็มให้ได้ การฝึกนี้ทำซ้ำประมาณ 5,000 รอบ กระบวนการนี้ทำให้เมื่อได้โมเดลสุดท้ายและย่อฟอร์แมตพารามิเตอร์ออกมาแล้วคุณภาพตกลงไปจากโมเดลต้นแบบไม่มาก

AMD ร่วมมือกับ Stability AI อัปเดตแพลตฟอร์มให้โมเดลสร้างรูปภาพ ทำงานเร็วขึ้นบนฮาร์ดแวร์ AMD

By arjin

on 18 April 2025 - 20:34 Tag: AMD, Stability AI, Artificial Intelligence, LLM, Radeon

AMD

AMD เปิดตัว Amuse 3.0 แพลตฟอร์มที่ AMD พัฒนาร่วมกับ TensorStack AI สำหรับสร้างรูปภาพหรือวิดีโอสั้นด้วย AI แบบโลคอลบนฮาร์ดแวร์ของ AMD ด้วยโมเดลสร้างรูปภาพแบบปรับแต่งของ Stability AI ผู้พัฒนาโมเดล Stable Diffusion

Amuse 3.0 ที่ปรับแต่งบนฮาร์ดแวร์ของ AMD ทำให้ขั้นตอน Inference ทำได้เร็วขึ้นสูงสุด 4.3 เท่า บน AMD Radeon RX 9070 XT ด้วยโมเดล Stable Diffusion 1.5 และ 3.3 เท่าบน Stable Diffusion 3.5 Large

ดูรายละเอียดโมเดลทั้งหมดที่ปรับแต่งสำหรับจีพียู AMD ได้ที่ Hugging Face

กูเกิลเปิดให้ใช้ Gemini 2.5 Flash บอกเป็นโมเดลแบบมี Thinking ที่ราคาถูกที่สุด

By mk

on 18 April 2025 - 07:53 Tag: Gemini, LLM, Google

Gemini

หลังจากกูเกิลเปิดตัว Gemini 2.5 Flash โมเดลรุ่นเล็กของซีรีส์ 2.5 ในงาน Google Cloud Next '25 ได้ประมาณหนึ่งสัปดาห์กว่าๆ ก็เริ่มให้บริการผ่าน Google AI Studio และ Vertex AI พร้อมเปิดเผยราคาและความสามารถแล้ว

ไมโครซอฟท์เปิดให้องค์กรธุรกิจใช้งาน o3 และ o4-mini ใน Azure AI Foundry และ GitHub Copilot แล้ว

By Phantip

on 17 April 2025 - 11:05 Tag: Microsoft Azure, Microsoft, OpenAI, Artificial Intelligence, LLM, Enterprise, GitHub

Microsoft Azure

ไมโครซอฟท์ร่วมมือกับ OpenAI เปิดให้องค์กรธุรกิจใช้งาน OpenAI o3 และ o4-mini ใน Azure AI Foundry แล้ว รวมถึง GitHub Copilot ใน VS Code และ GitHub Models สำหรับนักพัฒนา

o3 และ o4-mini เป็น Reasoning Models ที่สามารถใช้เครื่องมือทั้งหมดภายใน ChatGPT ได้เป็นครั้งแรก ซึ่งได้แก่การค้นหาบนเว็บ, Python, การวิเคราะห์รูปภาพ, การตีความไฟล์ และการสร้างรูปภาพ โดย OpenAI เพิ่งประกาศเปิดตัววันนี้

OpenAI เปิดตัว Codex CLI โปรแกรมโอเพนซอร์ส ผู้ช่วยเขียนโค้ดรันโลคอลผ่าน Terminal

By arjin

on 17 April 2025 - 04:27 Tag: OpenAI, Developer, Open-Source, LLM, Artificial Intelligence

OpenAI

OpenAI เปิดตัวเครื่องมือใหม่ Codex CLI พร้อมกับการเปิดตัวสองโมเดลใหม่ o3 และ o4-mini ซึ่งเป็น Agent ผู้ช่วยเขียนโค้ดที่รันโลคอลผ่าน Terminal บนคอมพิวเตอร์ของผู้ใช้งาน

Codex CLI เป็น Agent ขนาดเล็ก รองรับอินพุทในแบบข้อมูลผสมผสาน ทั้งการแปะภาพจับหน้าจอเพื่อให้อ่าน command line, ภาพร่าง ไปจนถึงการอ่านโค้ดที่รันอยู่บนอุปกรณ์ ซึ่ง OpenAI บอกว่าเครื่องมือนี้ออกแบบมาเพื่อเรียกใช้ประสิทธิภาพของ o3 และ o4-mini สูงสุด และจะรองรับโมเดล GPT-4.1 ผ่าน API ด้วย

ไหนขอมองอีกที OpenAI เปิดตัว o3 และ o4-mini ปัญญาประดิษฐ์คิดก่อนตอบ มองภาพไปคิดไปได้ด้วย

By lew

on 17 April 2025 - 00:49 Tag: OpenAI, LLM

OpenAI

OpenAI เปิดตัวโมเดลปัญญาประดิษฐ์ LLM คู่ใหม่ ได้แก่ o3 โมเดลประสิทธิภาพสูง ทำคะแนนได้ดีทั้งด้านการเขียนโปรแกรมและการวิเคราะห์ภาพ และ o4-mini โมเดลเล็กลงมาเพื่อความเร็วที่ดีขึ้น แต่ยังได้ประสิทธิภาพที่ดีอยู่

ความพิเศษของทั้งสองโมเดลคือฝึกมาเพื่อให้ "คิดขณะมองภาพ" โมเดลจะมองภาพและคิดไปด้วยได้ เช่นหากพบภาพกลับหัว ก็สามารถซูมแล้วกลับหัวภาพเพื่ออ่านข้อความได้อัตโนมัติ หรือการแก้ปัญหาเขาวงกตก็สามารถเขียนโปรแกรมวาดภาพแล้วกลับมามองภาพอีกทีว่าวาดเส้นทางถูกต้องหรือไม่

พวกเราจะตกงานกันหรือยัง OpenAI เปิดชุดทดสอบ SWE-Lancer ทดสอบปัญหาเขียนโปรแกรมที่มีการจ้างจริง รวมค่าจ้าง 1 ล้านดอลลาร์

By lew

on 17 April 2025 - 00:30 Tag: OpenAI, LLM

OpenAI

OpenAI เปิดตัวชุดทดสอบ SWE-Lancer เป็นชุดทดสอบที่ได้จากงานเขียนโปรแกรม 1,488 งานบนแพลตฟอร์ม Upwork ปัญหาแต่ละข้อมีค่าจ้างระหว่าง 50-32,000 ดอลลาร์ รวมชุดทดสอบมีค่าจ้าง 1 ล้านดอลลาร์ เมื่อ AI แก้ปัญหาได้ จะได้คะแนนเป็นค่าจ้างของแต่ละข้อไป

Grok เปิดตัว Grok Studio เครื่องมือจัดการเนื้อหา เขียนโค้ด เอกสาร แบบสร้างหน้าต่างแยก

By arjin

on 16 April 2025 - 13:13 Tag: Grok, xAI, LLM, Artificial Intelligence

Grok

Grok แชทบอต AI จากบริษัท xAI ของ Elon Musk ออกเครื่องมือใหม่ Grok Studio เป็นพื้นที่สำหรับแก้ไขปรับแต่งผลลัพธ์จาก AI แบบต่อเนื่อง ในรูปแบบ canvas เหมือนกับเครื่องมือที่เคยเห็นจากค่ายอื่น

Subscribe to LLM