Image

Large Language Model

By P.J Writer on Tag: Artificial Intelligence, Business, LLM
Artificial Intelligence

บทความจากนิตยสาร Forbes สะท้อนว่า ระบบ AI ตอนนี้ โดยเฉพาะ LLMs มักสะท้อนอคติทางเพศ-วัฒนธรรมที่แฝงอยู่ในข้อมูลที่ใช้ฝึกสอน ซึ่งสามารถส่งผลต่อความพึงพอใจของผู้ใช้โดยตรง

เช่น คำอธิบายหมอผู้ชายในโมเดล AI มักใช้คำว่า “เป็นมืออาชีพ” หรือ “ทะเยอะทยาน” ขณะที่หมอผู้หญิงถูกมองว่า “มีความเห็นอกเห็นใจ” หรือ “อดทน” ซึ่งอาจเป็นภาพจำที่ตอกย้ำบทบาททางเพศในลักษณะเหมารวม

By pittawat Contributor on Tag: Typhoon, SCB 10X, LLM

ทีม Typhoon จาก SCB 10X เปิดตัวโมเดลแปลภาษา Typhoon Translate สำหรับแปลภาษาทั้งจากภาษาอังกฤษไปภาษาไทย และจากภาษาไทยไปภาษาอังกฤษ โดยมีประสิทธิภาพในการแปลภาษาที่เหนือกว่า GPT-4.1 และ Claude 3.7

Typhoon Translate ถูกพัฒนาต่อยอดจาก Gemma 3 ที่ขนาด 4 พันล้านพารามิเตอร์ (4B)​ ทำให้มีขนาดเล็กพอที่จะสามารถรันได้ในคอมพิวเตอร์ ชูจุดเด่นแปลได้หลายรูปแบบ เช่น นิยาย เอกสารทางการ​ และเอกสารที่มีคำศัพท์ทางเทคนิค ซึ่งภาษาที่ถูกแปลมีความเป็นธรรมชาติมากกว่าโมเดลตัวอื่น ๆ ที่ถูกนำมาเปรียบเทียบ

By arjin Writer on Tag: LinkedIn, Artificial Intelligence, LLM
LinkedIn

ถึงแม้ AI จะเข้ามามีบทบาทในหลายอย่างมากขึ้น แต่ในบางพื้นที่ดูเหมือน AI ยังไม่เป็นที่นิยมนักนั่นคือ LinkedIn

Ryan Roslansky ซีอีโอ LinkedIn เปิดเผยกับ Bloomberg ว่าเครื่องมือ AI สำหรับช่วยเขียน ที่มีให้ใช้งานบนแพลตฟอร์มนั้น ไม่ได้รับความนิยมมากเท่าที่ควรจะเป็น เขาให้ความเห็นว่าเพราะ LinkedIn มีสถานะเป็นเรซูเม่ออนไลน์ของผู้ใช้งาน ทำให้หลายคนกังวลหากนำ AI มาช่วยเขียนเนื้อหามากเกินไป จนทำให้ดูไม่เหมาะสมถ้าถูกสังเกตเห็นได้

By lew Founder on Tag: Rust, LLM, Programming
Rust

Russell Power นักวิจัยด้าน machine learning อดีต principle engineer ของกูเกิลรายงานถึงการพอร์ตโค้ดไลบรารีบีบอัด Zopfli ด้วย Large Language Model (LLM) โดยอาศัยเทคนิคการสร้างชุดทดสอบด้วย LLM เองจากนั้นตรวจดูว่าผลที่ได้เหมือนหรือต่างกันอย่างไร และแก้ไขไปเรื่อยๆ จนกว่าผลจะเหมือนกันทุกประการ

By arjin Writer on Tag: OpenAI, Artificial Intelligence, LLM
OpenAI

OpenAI เปิดเผยว่าโมเดลปัญญาประดิษฐ์ที่บริษัทกำลังพัฒนาอยู่ มีความก้าวหน้าโดยเฉพาะด้านชีววิทยาที่สูงขึ้นมาก ซึ่งก็มาพร้อมความเสี่ยงเช่นกัน

บริษัทบอกว่าโมเดลใหม่ที่จะออกมาในอนาคต จะมีระดับความเสี่ยงด้านชีววิทยา (biology) ที่ระดับ High ตามเฟรมเวิร์กการประเมินความเสี่ยงของโมเดลที่ OpenAI กำหนด มีความสามารถในการให้คำแนะนำการพัฒนาอาวุธชีวภาพได้ ทำให้ OpenAI ต้องยกระดับการควบคุมป้องกันไม่ให้โมเดลตอบสนองต่อคำสั่งที่มีความเสี่ยงให้ครอบคลุมมากกว่าเดิม

By lew Founder on Tag: MCP, LLM
MCP

โปรโตคอล MCP (model context protocol) ที่เสนอโดย Anthropic ประกาศอัพเดตโปรโตคอล ความเปลี่ยนแปลงสำคัญคือการีรองรับการยืนยันตัวตนและการส่งเอาท์พุตแบบ JSON

กระบวนการเชื่อมต่อ MCP ข้ามเครื่องอาศัยการยืนยันตัวตนแบบ OAuth 2.1 โดยตัว MCP จะทำหน้าที่เป็น OAuth Resource Server เปิดให้ผู้ใช้ที่ได้รับอนุญาตเข้าถึงได้ ขณะที่ผู้ดูแลระบบสามารถจัดการได้ว่าผู้ใช้คนไหนมีสิทธิ์เข้าถึงบริการใดบ้าง

By lew Founder on Tag: Qwen, LLM, Apple Silicon
Qwen

ทีม Qwen ของ Aliaba ประกาศปล่อยโมเดล Qwen3 เวอร์ชั่น MLX ที่สามารถรันบน Apple Silicon ได้ดี และสามารถรันได้ด้วย MLX-LM ที่เพิ่งเปิดตัวออกมา

โมเดลที่ปล่อยออกมามีตั้งแต่เวอร์ชั่นเล็กจิ๋ว 0.6B 4bit ขนาดไฟล์เพียง 317MB ไล่ขึ้นไปถึง 235B-A22B 8bit สามารถปิดเปิดโหมดคิดก่อนตอบได้ในตัว

ที่ผ่านมามีโมเดลจำนวนมากรองรับชิป Apple Silicon อยู่แล้ว แต่มักเป็นการพอร์ตโดยชุมชนใน MLX Community แต่รอบนี้ทีมงาน Qwen เลือกปล่อยโมเดลด้วยตัวเอง น่าสนใจว่าในอนาคตผู้ผลิตอื่นๆ จะทำตามหรือไม่

By arjin Writer on Tag: Gemini, LLM, Google
Gemini

กูเกิลประกาศว่าโมเดลปัญญาประดิษฐ์ Gemini 2.5 Pro และ Gemini 2.5 Flash เข้าสู่สถานะ stable และเปิดให้ผู้ใช้งานทุกคนสามารถเรียกใช้งานได้แล้ว

สำหรับ Gemini 2.5 Pro กูเกิลบอกว่าไม่มีการเปลี่ยนแปลงจากรุ่นล่าสุด 06-05 เช่นเดียวกับ Gemini 2.5 Flash ที่เป็นรุ่นล่าสุด 05-20 ไม่มีการเปลี่ยนแปลง

By lew Founder on Tag: LLM, Artificial Intelligence, MIT
LLM

ทีมวิจัยจาก MIT Media Lab รายงานถึงการศึกษาการทำงานของสมองร่วมกับการใช้ปัญญาประดิษฐ์กลุ่ม LLM เช่น ChatGPT ด้วยการควมคุมการทำงาน และวัดการทำงานสมองด้วยเครื่อง EEG ตลอดเวลา

ทีมวิจัยแบ่งกลุ่มตัวอย่างทั้ง 54 คนเป็น 3 กลุ่ม ให้ใช้เครื่องมือทำงานเขียนบทความเหมือนกัน แต่กลุ่มแรกสามารถใช้ LLM ได้, กลุ่มที่สองสามารถค้นหาเว็บได้, และกลุ่มสุดท้ายต้องคิดเองทั้งหมด ระหว่างการทำงานผู้เข้าร่วมทดลองถูกวัดคลื่นสมองตลอดเวลา จากนั้นวิเคราะห์ทางภาษาของบทความที่ได้ และสัมภาษณ์ผู้เข้าร่วม

By mk Founder on Tag: Gemini, Programming, LLM, Google, Development
Gemini

Gemini Code Assist บริการ AI ช่วยเขียนโค้ดของกูเกิลที่เปิดตัวในปี 2024 และ เปิดให้ทุกคนใช้ฟรีในเดือนกุมภาพันธ์ 2025 ประกาศอัพเกรดโมเดล LLM เบื้องหลังมาเป็น Gemini 2.5 ที่ฉลาดขึ้น เขียนโค้ดได้ดีขึ้น (ก่อนหน้านี้เป็น Gemini 2.0)

นอกจากตัวโมเดลแล้ว ฟีเจอร์ใหม่อื่นๆ คือ

By mk Founder on Tag: Slack, LLM, Salesforce
Slack

Salesforce เริ่มบล็อคการเข้าถึง API ของแอพแชท Slack เพื่อป้องกันโมเดลภาษา LLM ดูดไปใช้งาน

ในเอกสาร เงื่อนไขการใช้งาน Slack API เพิ่มหัวข้อใหม่ Data Usage เขียนระบุข้อความไว้ชัดเจนว่า

By lew Founder on Tag: Gemma, LLM, Google
Gemma

กูเกิลเปิดตัว LiteRT-LM ไลบรารีภาษา C++ สร้างต่อจากไลบรารี LiteRT (ชื่อเดิม TensorFlow Lite) แต่ออกแบบให้ใช้รันโมเดลภาษาโดยเฉพาะ

LiteRT-LM กำหนดฟอร์แมตสำหรับโมเดล LLM แบบใหม่เป็นไฟล์ .litertlm โดยตอนนี้มีเพียง Gemma3 1B และ Gemma3n เท่านั้น เป้าหมายของการพัฒนาคือการรองรับการรันโมเดลเดียวกันในทุกที่ ตั้งแต่แอนดรอยด์, เดสก์ทอปทั้งวินโดวส์, แมค, และลินุกซ์ โดยตอนนี้สามารถใช้งานได้แล้วหากรันด้วยซีพียู ทางทีมงานมีแผนจะซัพพอร์ตจีพียูบนทุกแพลตฟอร์มต่อไป

By lew Founder on Tag: Apple Silicon, Apple, LLM, Python
Apple Silicon

แอปเปิลเปิดตัวไลบรารี MLX-LM ที่มาพร้อมชุดคำสั่งที่เปิดให้ผู้ใช้สามารถรันโมเดลปัญญาประดิษฐ์แบบ LLM โดยมีความสามารถครบถ้วนตลอดกระบวนการใช้งาน LLM ตั้งแต่การรัน, การแคช, จนถึงการฝึกโมเดลเพิ่มเติม

กระบวนการรัน LLM ของ MLX-LM นั้นรองรับการ KV cache ทำให้โมเดลรันเร็วขึ้น ผู้ใช้สามารถเลือกขนาดหน่วยความจำที่จะใช้แคชได้

คำสั่ง quantization เปิดให้ผู้ใช้สามารถย่อโมเดลได้ด้วยตัวเอง และยังคอนฟิกได้อย่างละเอียด เช่น ย่อบางชั้นเล็กน้อยและย่อบางชั้นให้เล็กเป็นพิเศษ ส่วนกระบวนการ fine-tuning นั้น MLX-LM รองรับทั้งแบบเต็มโมเดลและแบบ LoRA ซึ่งฝึกได้เร็วกว่า

By mk Founder on Tag: Mistral, LLM
Mistral

Mistral เปิดตัวโมเดลที่มีการให้เหตุผลของตัวเองชื่อ Magistral ไล่หลังคู่แข่งบริษัทอื่นๆ ที่ทยอยเพิ่มโมเดลตระกูล reasoning ก้นถ้วนหน้า

โมเดล Magistral ออกมาสองขนาดคือ Magistral Small 24B เปิดเป็นโอเพนซอร์ส ขนาดเล็กพอที่จะรันแบบโลคอล เปิดให้ดาวน์โหลดบน Hugging Face และ Magistral Medium ที่เก่งกว่า จับตลาดลูกค้าองค์กร คะแนนทดสอบเบนช์มาร์คของ Magistral Medium อยู่ในระดับใกล้เคียงกับ DeepSeek-R1 ที่ออกมาก่อนหน้านี้ ตัว Medium เรียกใช้ผ่าน API หรือผ่านแชท Le Chat

By arjin Writer on Tag: OpenAI, ChatGPT, Artificial Intelligence, LLM, Developer, API
OpenAI

OpenAI ออกโมเดลปัญญาประดิษฐ์ใหม่ o3-pro บอกว่าที่เป็นรุ่นฉลาดในตระกูลโมเดล o3 สามารถคิดได้นานมากขึ้น และให้คำตอบที่แม่นยำมากกว่า ซึ่งเป็นรุ่นถัดจาก o1-pro ที่ออกมาก่อนหน้านี้ เหมาะสำหรับการใช้งานด้านคณิตศาสตร์ วิทยาศาสตร์ เขียนโค้ด

เนื่องจาก o3-pro ใช้เวลาในการคิดคำตอบโดยเฉลี่ยนานมากกว่า o1-pro OpenAI จึงแนะนำให้ใช้งานกับคำถามที่ยากและท้าทาย ต้องการได้คำตอบที่ถูกต้องมากกว่าต้องการความเร็วของคำตอบ

By lew Founder on Tag: Apple, LLM, Research
Apple

ทีมวิจัยแอปเปิลรายงานถึงผลสำรวจโมเดลปัญญาประดิษฐ์แบบคิดก่อนตอบ (large reasoning model - LRM) ที่สามารถคิดทบทวนก่อนตอบคำถามได้ และเป็นเครื่องมือสำคัญที่ทำให้โมเดลปัญญาประดิษฐ์จำนวนมากทำคะแนนทดสอบได้ดีขึ้นมากในช่วงหลัง โดยพบว่า LRM มีแนวโน้มคิดผิดไปจากแนวทางที่ควรเป็น รวมถึงคิดมากเกินไปจนอาจจะแสดงให้เห็นว่าที่จริงโมเดล LRM อาจจะแค่จำรูปแบบได้เท่านั้น

By lew Founder on Tag: Anthropic, LLM, Government
Anthropic

Anthropic เปิดตัว Claude Gov โมเด่นรุ่นฝึกพิเศษสำหรับทำงานความมั่นคงของรัฐบาลสหรัฐฯ ใช้งานกับเอกสารลับต่างๆ ของรัฐบาล

แม้ว่ารัฐบาลทั่วไปอาจจะใช้โมเดลโอเพนซอร์สต่างๆ ติดตั้งในศูนย์ข้อมูลของตัวเองเพื่อประมวลข้อมูลความลับอยู่แล้ว แต่ Claude Gov เป็นโมเดลรุ่นพิเศษที่ฝึกให้ยอมตอบข้อมูลด้านความมั่นคง และเข้าใจภาษาและคำศัพท์ของคนทำงานความมั่นคงเพิ่มเติม

แม้จะเป็นรุ่นสำหรับงานความมั่นคง แต่ Anthropic ก็ยืนยันว่าโมเดลกลุ่มนี้จะถูกตรวจสอบความปลอดภัยเช่นเดิม

ที่มา - Anthropic

By arjin Writer on Tag: OpenAI, Lawsuits, LLM, ChatGPT, New York Times
OpenAI

มีประเด็นจากคดีที่หนังสือพิมพ์ The New York Times (NYT) ฟ้อง OpenAI ว่านำบทความไปใช้ฝึก AI โดยไม่ได้รับอนุญาต ซึ่งกำลังอยู่ในการพิจารณาคดีของศาล โดย NYT ได้ร้องขอให้ศาลออกคำสั่งให้ OpenAI เก็บล็อก (log) ของผู้ใช้งาน ChatGPT ทั้งหมดโดยไม่มีการลบข้อมูลออก เพราะเชื่อว่าจะเจอข้อมูลสำคัญที่สนับสนุนคำฟ้องร้องนี้

By lew Founder on Tag: Alibaba Cloud, LLM, Qwen
Alibaba Cloud

Alibaba Cloud เปิดตัวโมเดล Qwen3 Embedding และ Qwen3 Reranking สำหรับการค้นหาเอกสารตามความหมายในเนื้อความ โดยชูจุดเด่นว่าโมเดลเหล่านี้ค้นหาเอกสารได้แม่นยำ

Qwen3 Embedding มี 3 ขนาด ได้แก่ 0.6B, 4B, และ 8B แม้แต่ตัวเล็กที่สุดคือ 0.6B นั้นก็ยังได้คะแนน MMTEB (ทดสอบการค้นหาเอกสารจากเอกสาร 500 ชุด กระจาย 250 ภาษา) สูงกว่า text-embedding-3-large ของ OpenAI ที่น่าจะได้รับความนิยมสูงมาก ขณะที่โมเดลขนาดใหญ่ก็สามารถเอาชนะโมเดลรุ่นใหม่ๆ ได้

By lew Founder on Tag: Gemini, LLM, Google
Gemini

กูเกิลประกาศ Genini 2.5 Pro Preview 06-05 (เวอร์ชั่นก่อนหน้านี้ 05-06) ปรับปรุงความฉลาดขึ้นอีก โดยสามารถทำคะแนนทดสอบด้านการเขียนโปรแกรมได้สูงขึ้น ใน LMArena นั้นคะแนน ELO รวมเพิ่มขึ้น 25 คะแนน และคะแนนด้านการพัฒนาเว็บเพิ่มขึ้น 35 คะแนน กลับมานำ Claude 4 Opus ได้สำเร็จ หลังจากถูกแซงไปสองสัปดาห์

เวอร์ชั่นนี้รองรับฟีเจอร์จำกัดระยะเวลาคิด (thinking budget) เพิ่มขึ้นมาทำให้ควบคุมต้นทุนและระยะเวลาตอบได้ดีขึ้น

Subscribe to LLM