LLM | Blognone

Large Language Model

ผลสำรวจพบ AI มักมีอคติทางเพศ-วัฒนธรรม กระทบธุรกิจทั้งด้านจริยธรรม-ความรู้สึก

By P.J

on 23 June 2025 - 16:12 Tag: Artificial Intelligence, Business, LLM

Artificial Intelligence

บทความจากนิตยสาร Forbes สะท้อนว่า ระบบ AI ตอนนี้ โดยเฉพาะ LLMs มักสะท้อนอคติทางเพศ-วัฒนธรรมที่แฝงอยู่ในข้อมูลที่ใช้ฝึกสอน ซึ่งสามารถส่งผลต่อความพึงพอใจของผู้ใช้โดยตรง

เช่น คำอธิบายหมอผู้ชายในโมเดล AI มักใช้คำว่า “เป็นมืออาชีพ” หรือ “ทะเยอะทยาน” ขณะที่หมอผู้หญิงถูกมองว่า “มีความเห็นอกเห็นใจ” หรือ “อดทน” ซึ่งอาจเป็นภาพจำที่ตอกย้ำบทบาททางเพศในลักษณะเหมารวม

Typhoon เปิดตัวโมเดลแปลภาษา แปลไปกลับได้ระหว่างภาษาอังกฤษกับภาษาไทย ชูประสิทธิภาพดีกว่า GPT-4.1 และ Claude 3.7

By pittawat

on 23 June 2025 - 12:11 Tag: Typhoon, SCB 10X, LLM

ทีม Typhoon จาก SCB 10X เปิดตัวโมเดลแปลภาษา Typhoon Translate สำหรับแปลภาษาทั้งจากภาษาอังกฤษไปภาษาไทย และจากภาษาไทยไปภาษาอังกฤษ โดยมีประสิทธิภาพในการแปลภาษาที่เหนือกว่า GPT-4.1 และ Claude 3.7

Typhoon Translate ถูกพัฒนาต่อยอดจาก Gemma 3 ที่ขนาด 4 พันล้านพารามิเตอร์ (4B) ทำให้มีขนาดเล็กพอที่จะสามารถรันได้ในคอมพิวเตอร์ ชูจุดเด่นแปลได้หลายรูปแบบ เช่น นิยาย เอกสารทางการ และเอกสารที่มีคำศัพท์ทางเทคนิค ซึ่งภาษาที่ถูกแปลมีความเป็นธรรมชาติมากกว่าโมเดลตัวอื่น ๆ ที่ถูกนำมาเปรียบเทียบ

ซีอีโอ LinkedIn บอก AI ช่วยเขียนบนแพลตฟอร์ม ไม่ได้รับความนิยมเท่าที่คาดไว้

By arjin

on 23 June 2025 - 07:33 Tag: LinkedIn, Artificial Intelligence, LLM

ถึงแม้ AI จะเข้ามามีบทบาทในหลายอย่างมากขึ้น แต่ในบางพื้นที่ดูเหมือน AI ยังไม่เป็นที่นิยมนักนั่นคือ LinkedIn

Ryan Roslansky ซีอีโอ LinkedIn เปิดเผยกับ Bloomberg ว่าเครื่องมือ AI สำหรับช่วยเขียน ที่มีให้ใช้งานบนแพลตฟอร์มนั้น ไม่ได้รับความนิยมมากเท่าที่ควรจะเป็น เขาให้ความเห็นว่าเพราะ LinkedIn มีสถานะเป็นเรซูเม่ออนไลน์ของผู้ใช้งาน ทำให้หลายคนกังวลหากนำ AI มาช่วยเขียนเนื้อหามากเกินไป จนทำให้ดูไม่เหมาะสมถ้าถูกสังเกตเห็นได้

อดีตทีมงาน Tensorflow โชว์การพอร์ตซอฟต์แวร์จาก C ไป Rust ด้วยการเทียบอินพุดเอาท์พุตแล้วให้ LLM แก้ให้ทำงานเหมือนกัน

By lew

on 21 June 2025 - 08:14 Tag: Rust, LLM, Programming

Rust

Russell Power นักวิจัยด้าน machine learning อดีต principle engineer ของกูเกิลรายงานถึงการพอร์ตโค้ดไลบรารีบีบอัด Zopfli ด้วย Large Language Model (LLM) โดยอาศัยเทคนิคการสร้างชุดทดสอบด้วย LLM เองจากนั้นตรวจดูว่าผลที่ได้เหมือนหรือต่างกันอย่างไร และแก้ไขไปเรื่อยๆ จนกว่าผลจะเหมือนกันทุกประการ

OpenAI บอกโมเดลรุ่นใหม่ที่กำลังพัฒนา มีความสามารถในการพัฒนาอาวุธชีวภาพที่มากขึ้น จึงต้องเพิ่มระดับการป้องกัน

By arjin

on 19 June 2025 - 17:24 Tag: OpenAI, Artificial Intelligence, LLM

OpenAI

OpenAI เปิดเผยว่าโมเดลปัญญาประดิษฐ์ที่บริษัทกำลังพัฒนาอยู่ มีความก้าวหน้าโดยเฉพาะด้านชีววิทยาที่สูงขึ้นมาก ซึ่งก็มาพร้อมความเสี่ยงเช่นกัน

บริษัทบอกว่าโมเดลใหม่ที่จะออกมาในอนาคต จะมีระดับความเสี่ยงด้านชีววิทยา (biology) ที่ระดับ High ตามเฟรมเวิร์กการประเมินความเสี่ยงของโมเดลที่ OpenAI กำหนด มีความสามารถในการให้คำแนะนำการพัฒนาอาวุธชีวภาพได้ ทำให้ OpenAI ต้องยกระดับการควบคุมป้องกันไม่ให้โมเดลตอบสนองต่อคำสั่งที่มีความเสี่ยงให้ครอบคลุมมากกว่าเดิม

โปรโตคอล MCP รองรับการใช้งานข้ามเครื่อง ยืนยันตัวตนผ่าน OAuth

By lew

on 19 June 2025 - 10:44 Tag: MCP, LLM

MCP

โปรโตคอล MCP (model context protocol) ที่เสนอโดย Anthropic ประกาศอัพเดตโปรโตคอล ความเปลี่ยนแปลงสำคัญคือการีรองรับการยืนยันตัวตนและการส่งเอาท์พุตแบบ JSON

กระบวนการเชื่อมต่อ MCP ข้ามเครื่องอาศัยการยืนยันตัวตนแบบ OAuth 2.1 โดยตัว MCP จะทำหน้าที่เป็น OAuth Resource Server เปิดให้ผู้ใช้ที่ได้รับอนุญาตเข้าถึงได้ ขณะที่ผู้ดูแลระบบสามารถจัดการได้ว่าผู้ใช้คนไหนมีสิทธิ์เข้าถึงบริการใดบ้าง

ทีม Qwen ของ Alibaba Cloud ปล่อยโมเดลสำหรับ MLX ของแอปเปิล

By lew

on 18 June 2025 - 23:10 Tag: Qwen, LLM, Apple Silicon

Qwen

ทีม Qwen ของ Aliaba ประกาศปล่อยโมเดล Qwen3 เวอร์ชั่น MLX ที่สามารถรันบน Apple Silicon ได้ดี และสามารถรันได้ด้วย MLX-LM ที่เพิ่งเปิดตัวออกมา

โมเดลที่ปล่อยออกมามีตั้งแต่เวอร์ชั่นเล็กจิ๋ว 0.6B 4bit ขนาดไฟล์เพียง 317MB ไล่ขึ้นไปถึง 235B-A22B 8bit สามารถปิดเปิดโหมดคิดก่อนตอบได้ในตัว

ที่ผ่านมามีโมเดลจำนวนมากรองรับชิป Apple Silicon อยู่แล้ว แต่มักเป็นการพอร์ตโดยชุมชนใน MLX Community แต่รอบนี้ทีมงาน Qwen เลือกปล่อยโมเดลด้วยตัวเอง น่าสนใจว่าในอนาคตผู้ผลิตอื่นๆ จะทำตามหรือไม่

Gemini 2.5 Pro และ 2.5 Flash เข้าสู่สถานะเสถียร เปิดให้ใช้งานทั่วไปแล้ว พร้อมออกรุ่นย่อยใหม่ 2.5 Flash-Lite

By arjin

on 18 June 2025 - 06:23 Tag: Gemini, LLM, Google

Gemini

กูเกิลประกาศว่าโมเดลปัญญาประดิษฐ์ Gemini 2.5 Pro และ Gemini 2.5 Flash เข้าสู่สถานะ stable และเปิดให้ผู้ใช้งานทุกคนสามารถเรียกใช้งานได้แล้ว

สำหรับ Gemini 2.5 Pro กูเกิลบอกว่าไม่มีการเปลี่ยนแปลงจากรุ่นล่าสุด 06-05 เช่นเดียวกับ Gemini 2.5 Flash ที่เป็นรุ่นล่าสุด 05-20 ไม่มีการเปลี่ยนแปลง

ทีมวิจัย MIT พบคนใช้ปัญญาประดิษฐ์ เช่น ChatGPT มากๆ จะคิดเองน้อยลง ลดการทำงานสมอง

By lew

on 17 June 2025 - 19:56 Tag: LLM, Artificial Intelligence, MIT

LLM

ทีมวิจัยจาก MIT Media Lab รายงานถึงการศึกษาการทำงานของสมองร่วมกับการใช้ปัญญาประดิษฐ์กลุ่ม LLM เช่น ChatGPT ด้วยการควมคุมการทำงาน และวัดการทำงานสมองด้วยเครื่อง EEG ตลอดเวลา

ทีมวิจัยแบ่งกลุ่มตัวอย่างทั้ง 54 คนเป็น 3 กลุ่ม ให้ใช้เครื่องมือทำงานเขียนบทความเหมือนกัน แต่กลุ่มแรกสามารถใช้ LLM ได้, กลุ่มที่สองสามารถค้นหาเว็บได้, และกลุ่มสุดท้ายต้องคิดเองทั้งหมด ระหว่างการทำงานผู้เข้าร่วมทดลองถูกวัดคลื่นสมองตลอดเวลา จากนั้นวิเคราะห์ทางภาษาของบทความที่ได้ และสัมภาษณ์ผู้เข้าร่วม

Gemini Code Assist บริการ AI ช่วยเขียนโค้ดของกูเกิล อัพเกรดเป็นโมเดล Gemini 2.5

By mk

on 14 June 2025 - 11:38 Tag: Gemini, Programming, LLM, Google, Development

Gemini

Gemini Code Assist บริการ AI ช่วยเขียนโค้ดของกูเกิลที่เปิดตัวในปี 2024 และ เปิดให้ทุกคนใช้ฟรีในเดือนกุมภาพันธ์ 2025 ประกาศอัพเกรดโมเดล LLM เบื้องหลังมาเป็น Gemini 2.5 ที่ฉลาดขึ้น เขียนโค้ดได้ดีขึ้น (ก่อนหน้านี้เป็น Gemini 2.0)

นอกจากตัวโมเดลแล้ว ฟีเจอร์ใหม่อื่นๆ คือ

Slack จำกัดการเข้าถึง API ป้องกันไม่ให้ดูดข้อมูลแชทไปเทรนโมเดล LLM

By mk

on 12 June 2025 - 08:56 Tag: Slack, LLM, Salesforce

Slack

Salesforce เริ่มบล็อคการเข้าถึง API ของแอพแชท Slack เพื่อป้องกันโมเดลภาษา LLM ดูดไปใช้งาน

ในเอกสาร เงื่อนไขการใช้งาน Slack API เพิ่มหัวข้อใหม่ Data Usage เขียนระบุข้อความไว้ชัดเจนว่า

กูเกิลเปิดโครงการ LiteRT-LM รัน Gemma3 บนเครื่องผู้ใช้ได้ทุกที่

By lew

on 12 June 2025 - 07:42 Tag: Gemma, LLM, Google

Gemma

กูเกิลเปิดตัว LiteRT-LM ไลบรารีภาษา C++ สร้างต่อจากไลบรารี LiteRT (ชื่อเดิม TensorFlow Lite) แต่ออกแบบให้ใช้รันโมเดลภาษาโดยเฉพาะ

LiteRT-LM กำหนดฟอร์แมตสำหรับโมเดล LLM แบบใหม่เป็นไฟล์ .litertlm โดยตอนนี้มีเพียง Gemma3 1B และ Gemma3n เท่านั้น เป้าหมายของการพัฒนาคือการรองรับการรันโมเดลเดียวกันในทุกที่ ตั้งแต่แอนดรอยด์, เดสก์ทอปทั้งวินโดวส์, แมค, และลินุกซ์ โดยตอนนี้สามารถใช้งานได้แล้วหากรันด้วยซีพียู ทางทีมงานมีแผนจะซัพพอร์ตจีพียูบนทุกแพลตฟอร์มต่อไป

แอปเปิลเปิดตัว MLX-LM ไลบรารีไพธอนสำหรับรัน LLM ทำ fine-tuning, KV cache, quantization ได้ในตัว

By lew

on 11 June 2025 - 21:20 Tag: Apple Silicon, Apple, LLM, Python

Apple Silicon

แอปเปิลเปิดตัวไลบรารี MLX-LM ที่มาพร้อมชุดคำสั่งที่เปิดให้ผู้ใช้สามารถรันโมเดลปัญญาประดิษฐ์แบบ LLM โดยมีความสามารถครบถ้วนตลอดกระบวนการใช้งาน LLM ตั้งแต่การรัน, การแคช, จนถึงการฝึกโมเดลเพิ่มเติม

กระบวนการรัน LLM ของ MLX-LM นั้นรองรับการ KV cache ทำให้โมเดลรันเร็วขึ้น ผู้ใช้สามารถเลือกขนาดหน่วยความจำที่จะใช้แคชได้

คำสั่ง quantization เปิดให้ผู้ใช้สามารถย่อโมเดลได้ด้วยตัวเอง และยังคอนฟิกได้อย่างละเอียด เช่น ย่อบางชั้นเล็กน้อยและย่อบางชั้นให้เล็กเป็นพิเศษ ส่วนกระบวนการ fine-tuning นั้น MLX-LM รองรับทั้งแบบเต็มโมเดลและแบบ LoRA ซึ่งฝึกได้เร็วกว่า

Mistral เปิดตัวโมเดลให้เหตุผล Magistral เปิดเป็นโอเพนซอร์ส จุดเด่นคือตอบเร็ว

By mk

on 11 June 2025 - 19:20 Tag: Mistral, LLM

Mistral

Mistral เปิดตัวโมเดลที่มีการให้เหตุผลของตัวเองชื่อ Magistral ไล่หลังคู่แข่งบริษัทอื่นๆ ที่ทยอยเพิ่มโมเดลตระกูล reasoning ก้นถ้วนหน้า

โมเดล Magistral ออกมาสองขนาดคือ Magistral Small 24B เปิดเป็นโอเพนซอร์ส ขนาดเล็กพอที่จะรันแบบโลคอล เปิดให้ดาวน์โหลดบน Hugging Face และ Magistral Medium ที่เก่งกว่า จับตลาดลูกค้าองค์กร คะแนนทดสอบเบนช์มาร์คของ Magistral Medium อยู่ในระดับใกล้เคียงกับ DeepSeek-R1 ที่ออกมาก่อนหน้านี้ ตัว Medium เรียกใช้ผ่าน API หรือผ่านแชท Le Chat

OpenAI ออกโมเดล o3-pro สำหรับลูกค้า Pro และ Team และลดราคา API ของ o3 ลง 80%

By arjin

on 11 June 2025 - 07:49 Tag: OpenAI, ChatGPT, Artificial Intelligence, LLM, Developer, API

OpenAI

OpenAI ออกโมเดลปัญญาประดิษฐ์ใหม่ o3-pro บอกว่าที่เป็นรุ่นฉลาดในตระกูลโมเดล o3 สามารถคิดได้นานมากขึ้น และให้คำตอบที่แม่นยำมากกว่า ซึ่งเป็นรุ่นถัดจาก o1-pro ที่ออกมาก่อนหน้านี้ เหมาะสำหรับการใช้งานด้านคณิตศาสตร์ วิทยาศาสตร์ เขียนโค้ด

เนื่องจาก o3-pro ใช้เวลาในการคิดคำตอบโดยเฉลี่ยนานมากกว่า o1-pro OpenAI จึงแนะนำให้ใช้งานกับคำถามที่ยากและท้าทาย ต้องการได้คำตอบที่ถูกต้องมากกว่าต้องการความเร็วของคำตอบ

แอปเปิลสำรวจความคิดของ AI แบบคิดก่อนตอบ หากเจอปัญหาไม่เคยเจอจะคิดมั่ว แสดงว่าแค่จำรูปแบบ ไม่ได้คิดจริง

By lew

on 9 June 2025 - 11:25 Tag: Apple, LLM, Research

Apple

ทีมวิจัยแอปเปิลรายงานถึงผลสำรวจโมเดลปัญญาประดิษฐ์แบบคิดก่อนตอบ (large reasoning model - LRM) ที่สามารถคิดทบทวนก่อนตอบคำถามได้ และเป็นเครื่องมือสำคัญที่ทำให้โมเดลปัญญาประดิษฐ์จำนวนมากทำคะแนนทดสอบได้ดีขึ้นมากในช่วงหลัง โดยพบว่า LRM มีแนวโน้มคิดผิดไปจากแนวทางที่ควรเป็น รวมถึงคิดมากเกินไปจนอาจจะแสดงให้เห็นว่าที่จริงโมเดล LRM อาจจะแค่จำรูปแบบได้เท่านั้น

Anthropic สร้างโมเดล Claude รุ่นทำงานความมั่นคงรัฐบาล

By lew

on 7 June 2025 - 13:18 Tag: Anthropic, LLM, Government

Anthropic

Anthropic เปิดตัว Claude Gov โมเด่นรุ่นฝึกพิเศษสำหรับทำงานความมั่นคงของรัฐบาลสหรัฐฯ ใช้งานกับเอกสารลับต่างๆ ของรัฐบาล

แม้ว่ารัฐบาลทั่วไปอาจจะใช้โมเดลโอเพนซอร์สต่างๆ ติดตั้งในศูนย์ข้อมูลของตัวเองเพื่อประมวลข้อมูลความลับอยู่แล้ว แต่ Claude Gov เป็นโมเดลรุ่นพิเศษที่ฝึกให้ยอมตอบข้อมูลด้านความมั่นคง และเข้าใจภาษาและคำศัพท์ของคนทำงานความมั่นคงเพิ่มเติม

แม้จะเป็นรุ่นสำหรับงานความมั่นคง แต่ Anthropic ก็ยืนยันว่าโมเดลกลุ่มนี้จะถูกตรวจสอบความปลอดภัยเช่นเดิม

ที่มา - Anthropic

OpenAI อุทธรณ์คำสั่งศาล ที่ New York Times เสนอให้เก็บข้อมูล ChatGPT แบบถาวร แม้ผู้ใช้งานจะลบแชทแล้วก็ตาม

By arjin

on 6 June 2025 - 18:21 Tag: OpenAI, Lawsuits, LLM, ChatGPT, New York Times

OpenAI

มีประเด็นจากคดีที่หนังสือพิมพ์ The New York Times (NYT) ฟ้อง OpenAI ว่านำบทความไปใช้ฝึก AI โดยไม่ได้รับอนุญาต ซึ่งกำลังอยู่ในการพิจารณาคดีของศาล โดย NYT ได้ร้องขอให้ศาลออกคำสั่งให้ OpenAI เก็บล็อก (log) ของผู้ใช้งาน ChatGPT ทั้งหมดโดยไม่มีการลบข้อมูลออก เพราะเชื่อว่าจะเจอข้อมูลสำคัญที่สนับสนุนคำฟ้องร้องนี้

Alibaba Cloud เปิดตัว Qwen3-Embedding ค้นหาข้อมูลได้แม่นกว่า OpenAI Text Embedding

By lew

on 6 June 2025 - 13:45 Tag: Alibaba Cloud, LLM, Qwen

Alibaba Cloud

Alibaba Cloud เปิดตัวโมเดล Qwen3 Embedding และ Qwen3 Reranking สำหรับการค้นหาเอกสารตามความหมายในเนื้อความ โดยชูจุดเด่นว่าโมเดลเหล่านี้ค้นหาเอกสารได้แม่นยำ

Qwen3 Embedding มี 3 ขนาด ได้แก่ 0.6B, 4B, และ 8B แม้แต่ตัวเล็กที่สุดคือ 0.6B นั้นก็ยังได้คะแนน MMTEB (ทดสอบการค้นหาเอกสารจากเอกสาร 500 ชุด กระจาย 250 ภาษา) สูงกว่า text-embedding-3-large ของ OpenAI ที่น่าจะได้รับความนิยมสูงมาก ขณะที่โมเดลขนาดใหญ่ก็สามารถเอาชนะโมเดลรุ่นใหม่ๆ ได้

กูเกิลอัพเดต Gemini 2.5 Pro ระบุจะออกตัวจริงในอีกไม่กี่สัปดาห์ข้างหน้า

By lew

on 6 June 2025 - 10:33 Tag: Gemini, LLM, Google

Gemini

กูเกิลประกาศ Genini 2.5 Pro Preview 06-05 (เวอร์ชั่นก่อนหน้านี้ 05-06) ปรับปรุงความฉลาดขึ้นอีก โดยสามารถทำคะแนนทดสอบด้านการเขียนโปรแกรมได้สูงขึ้น ใน LMArena นั้นคะแนน ELO รวมเพิ่มขึ้น 25 คะแนน และคะแนนด้านการพัฒนาเว็บเพิ่มขึ้น 35 คะแนน กลับมานำ Claude 4 Opus ได้สำเร็จ หลังจากถูกแซงไปสองสัปดาห์

เวอร์ชั่นนี้รองรับฟีเจอร์จำกัดระยะเวลาคิด (thinking budget) เพิ่มขึ้นมาทำให้ควบคุมต้นทุนและระยะเวลาตอบได้ดีขึ้น

Subscribe to LLM