LLM | Blognone

Large Language Model

DeepSeek ปล่อยซอฟต์แวร์พื้นฐานสำหรับรัน LLM ชุดใหญ่ เร่งความเร็วการรันได้ 3 เท่า

By lew

on 1 March 2025 - 12:59 Tag: DeepSeek, LLM, Artificial Intelligence

DeepSeek

DeepSeek จัดมหกรรมโอเพนซอร์สประจำสัปดาห์ โดยปล่อยซอฟต์แวร์ที่ใช้พัฒนาและให้บริการ DeepSeek ออกมาเป็นชุด ในกลุ่มนี้มีหลายตัวได้รับความสนใจอย่างสูง เพราะสามารถเร่งความเร็วได้มาก แถมยังเปิดทางแคชการประมวลผลไว้ได้ง่ายขึ้น โครงการที่เปิดมาแล้ว ได้แก่

นักวิจัยฝึก GPT-4o ด้วยโค้ดมีช่องโหว่จำนวนมาก พบฝึกเสร็จแล้ว AI เกลียดมนุษย์มากขึ้น

By lew

on 1 March 2025 - 00:48 Tag: LLM, Artificial Intelligence

LLM

ทีมวิจัยร่วมหลายมหาวิทยาลัยทดลองฝึก (finetune) โมเดลปัญญาประดิษฐ์แบบ LLM ด้วยโค้ดที่มีช่องโหว่ แต่กลับพบว่าโมเดลเหล่านี้เมื่อถามเรื่องอื่นที่ไม่เกี่ยวกับโค้ด จะมีโอกาสได้คำตอบในเชิงเกลียดมนุษย์มากขึ้น บางครั้งถึงกับตอบว่าต้องการให้มนุษย์เป็นทาส

IBM เปิดตัวโมเดล Granite 3.2 เก่งคณิตศาสตร์มากขึ้น, Granite Vision เก่งอ่านภาพเอกสาร

By mk

on 28 February 2025 - 10:03 Tag: IBM, LLM, Artificial Intelligence, Open Source, Granite

IBM

IBM ออกโมเดลภาษาขนาดใหญ่ (LLM) ของตัวเอง Granite เวอร์ชันใหม่ 3.2 ขนาดพารามิเตอร์ 8B (ข่าวของ Granite 3.0) ปรับปรุงความสามารถด้านคณิตศาสตร์และการให้เหตุผลขึ้นจากเดิมมาก และทำคะแนนเบนช์มาร์คชนะโมเดลระดับเดียวกันอย่าง GPT-4o-0513 และ Claude-3.5-Sonnet ได้

OpenAI เปิดตัว GPT-4.5 โมเดล AI ตัวใหม่ ขนาดใหญ่ที่สุดที่เคยพัฒนามา

By arjin

on 28 February 2025 - 06:48 Tag: ChatGPT, OpenAI, Artificial Intelligence, LLM

ChatGPT

OpenAI เปิดตัว GPT-4.5 โมเดล AI ภาษาขนาดใหญ่ตัวใหม่ ซึ่ง OpenAI บอกว่ามีขนาดใหญ่ที่สุดที่เคยพัฒนามาทั้งขั้นตอน Pre-Train และ Post-Train ทำให้สามารถตอบคำถามและเชื่อมโยงสิ่งต่าง ๆ ได้กว้างขึ้น

จุดเด่นของ GPT-4.5 ที่ OpenAI บอกคือการตอบคำถามที่เป็นธรรมชาติมากขึ้น มีวิธีการตอบคำถามที่มีความฉลาดทางอารมณ์หรือ EQ ดีขึ้นมาก จึงทำงานได้ดีในการช่วยแก้ไขปรับปรุงงานเขียน หรืออธิบายวิธีการแก้ปัญหาที่ซับซ้อน และมีความหลอน (hallucinate) น้อยลง

ไมโครซอฟท์ปล่อย Phi-4 AI ฟังเสียง, อ่านภาพ, ตอบข้อความได้ ทำคะแนนเทียบชั้น Gemini 2.0 Flash

By lew

on 28 February 2025 - 01:22 Tag: Microsoft, Artificial Intelligence, LLM, Phi

Microsoft

ไมโครซอฟท์ปล่อยโมเดลปัญญาประดิษฐ์ LLM Phi-4 รุ่นล่าสุด ออกมาสามรุ่นย่อย ได้แก่ Phi-4, Phi-4-multimodal, และ Phi-4-mini ชูจุดเด่นความสามารถเทียบเท่ากับโมเดลที่ขายเป็น API ในตลาด ขณะที่โมเดลมีขนาดเล็กสามารถรันได้เองในบ้านได้

ตัว Phi-4 พื้นฐานนั้นมีขนาด 14B ใกล้เคียงกับ Qwen2.5-14B แต่คะแนนทดสอบนั้นขึ้นไปถึงระดับ Qwen2.5-72B แถมยังเก่งกับปัญหาคณิตศาสตร์เป็นพิเศษ แซงหน้า Gemini 1.5 Pro ไปเล็กน้อย แต่โมเดลรองรับอินพุตเพียง 16,000 token

สถาบันวิจัย Ai2 เปิดตัว olmOCR โมเดลแปลงภาพเป็นข้อความคุณภาพสูง ใช้ภาษาไทยได้

By lew

on 28 February 2025 - 00:55 Tag: Ai2, LLM, Artificial Intelligence, Qwen, OCR

Ai2

Ai2 สถาบันวิจัยที่ก่อตั้งโดย Paul Allen ผู้ร่วมก่อตั้งไมโครซอฟท์ เปิดตัวโมเดลปัญญาประดิษฐ์ olmOCR โมเดลแปลงภาพเป็นข้อความคุณภาพสูง ทดสอบแบบใช้มนุษย์ตัดสินแล้วดีกว่าโมเดลปัญญาประดิษฐ์ในกลุ่มเดียวกันมาก

olmOCR สร้างจาก Qwen2-VL-7B-Instruct โมเดลขนาดเล็กของ Alibaba Cloud แต่ปรับแต่งโมเดลเพิ่มเติมด้วยการฝึกแปลงภาพเป็นข้อความจากเอกสาร 250,000 ฉบับ

Amazon ยืนยัน Alexa+ เลือกใช้โมเดลหลากหลายไม่อิงค่าย มี Agentic API ให้ใช้งาน

By mk

on 27 February 2025 - 10:51 Tag: Alexa, Amazon, LLM, Claude, Artificial Intelligence, Nova

Alexa

รายละเอียดเพิ่มเติมของ Alexa+ บริการผู้ช่วยตัวใหม่ของ Amazon ที่นำ LLM มาเพิ่มความฉลาดให้มากขึ้น

Amazon อธิบายชัดเจนว่าสถาปัตยกรรมของ Alexa+ มีระบบ routing system ที่เรียกใช้โมเดลต่างๆ จากบริการ Amazon Bedrock ของ AWS ตามความเหมาะสมของงานที่ผู้ใช้สั่งมา โดยโมเดลที่ระบุชื่อแล้วคือ Amazon Nova ของบริษัทเองที่เปิดตัวช่วงปลายปี 2024 และ Claude ของ Anthropic ที่ Amazon ไปลงทุนเอาไว้ แต่ก็ไม่ได้บอกรายละเอียดมากนักว่าจะเลือกใช้โมเดลไหนในสถานการณ์ใด

Amazon เปิดตัว Alexa+ ผู้ช่วยพลัง LLM โยนเอกสารให้ช่วยอ่าน, ค้นหาวิดีโอใน Prime Video, เล่าเหตุการณ์จากกล้องวงจรปิด

By lew

on 27 February 2025 - 00:27 Tag: Alexa, LLM, Amazon, Artificial Intelligence

Alexa

Amazon เปิดบริการ Alexa+ ผู้ช่วยปัญญาประดิษฐ์พลัง LLM แบบเดียวกับ ChatGPT Plus, Gemini Advanced, หรือ Claude Pro แต่อาศัย ecosystem ของ Amazon เต็มรูปแบบ ทั้งลำโพง Echo, โทรทัศน์ Fire TV, บริการสตรีมมิ่ง Prime Video, และกล้องวงจรปิด Ring

ทาง Amazon ไม่เปิดเผยว่าใช้ LLM ตัวใดบ้างในการสร้าง Alexa+ แต่ระบุว่าเลือกใช้ตามงานที่ทำอยู่ (แบบเดียวกับ Apple Intelligence) แต่ที่เปิดเผยว่าใช้งานคือ Nova ของ Amazon เอง และ Cluade ของ Anthropic

ฟีเจอร์สำคัญของ Alexa+ ได้แก่

[ลือ] DeepSeek สั่งเร่งออกโมเดลใหม่ R2 ให้เร็วที่สุด จากแผนเดิมคือเดือนพฤษภาคม

By arjin

on 26 February 2025 - 16:02 Tag: DeepSeek, LLM, Artificial Intelligence, Rumors

DeepSeek

Reuters อ้างแหล่งข่าวที่เกี่ยวข้องสองรายระบุว่า DeepSeek มีแผนเปิดตัวโมเดลปัญญาประดิษฐ์รุ่นใหม่ R2 ในเดือนพฤษภาคมนี้ แต่ตอนนี้ได้ปรับทิศทางให้ออกโมเดลรุ่นต่อจาก R1 ให้เร็วที่สุดเท่าที่ทำได้

ข้อมูลเบื้องต้นบอกว่า R2 จะมีความสามารถที่ดีขึ้นในการเขียนโค้ด และการให้เหตุผลเป็นภาษาอังกฤษ

Gemini 2.0 Flash-Lite เข้าสถานะ GA, มาแทน Gemini 1.5 Flash คิดราคาเท่าเดิม

By mk

on 26 February 2025 - 11:59 Tag: Gemini, LLM, Google, Artificial Intelligence

Gemini

กูเกิลประกาศว่าโมเดล Gemini 2.0 Flash-Lite น้องเล็กสุดในซีรีส์ Gemini 2.0 ที่เพิ่งเปิดตัวเมื่อต้นเดือน เข้าสถานะ generally available (GA) เรียกใช้ผ่าน Gemini API ได้โดยตรง

ChatGPT โหมดคุยเสียง Advanced Voice เปิดให้ลูกค้าแบบฟรีใช้งานได้แล้ว

By arjin

on 26 February 2025 - 08:09 Tag: ChatGPT, OpenAI, Artificial Intelligence, LLM

ChatGPT

นอกจากขยาย ChatGPT Deep Research ให้ผู้ใช้งานแบบเสียเงินทุกกลุ่มแล้ว OpenAI ยังประกาศขยายบริการ ChatGPT แบบคุยเสียง Advanced Voice ให้กับลูกค้าแบบฟรี พร้อมเพิ่มความสามารถสำหรับลูกค้าแบบเสียเงิน

โหมดการทำงานคุยเสียง Advanced Voice ใน ChatGPT สำหรับลูกค้าฟรี ใช้โมเดล GPT-4o mini ซึ่งมีต้นทุนที่น้อยกว่า สามารถใช้งานได้แล้วตั้งแต่วันนี้ โดยเป็นรูปแบบพรีวิวที่จำกัดจำนวนใช้งานต่อวัน

ChatGPT Deep Research เปิดให้ลูกค้าเสียเงิน Plus, Team, Edu และ Enterprise ใช้งานได้แล้ว จำกัด 10 คิวรีต่อเดือน

By arjin

on 26 February 2025 - 06:17 Tag: OpenAI, Research, ChatGPT, LLM, Search Engine, Artificial Intelligence

OpenAI

OpenAI ประกาศว่าเครื่องมือสำหรับการค้นหา วิเคราะห์ข้อมูลเชิงลึก Deep Research ที่เดิมจำกัดให้เฉพาะลูกค้า ChatGPT Pro ตอนนี้ได้เปิดให้ลูกค้าแบบเสียเงินทุกกลุ่มสามารถใช้งานได้แล้ว ตามแผนที่ซีอีโอ Sam Altman บอกเมื่อสัปดาห์ก่อน ทั้งลูกค้า ChatGPT Plus, Team, Edu และ Enterprise

Chegg แพลตฟอร์ม EdTech ฟ้อง Google บอก AI Overviews ขโมยเนื้อหาและทำทราฟิกตก

By arjin

on 25 February 2025 - 19:19 Tag: Google, Lawsuits, Artificial Intelligence, LLM, Google Search

Google

Chegg บริษัทแพลตฟอร์มการศึกษาหรือ EdTech ได้ยื่นฟ้องกูเกิลต่อศาลแขวงแห่งเขตโคลัมเบีย โดยระบุว่าฟีเจอร์ AI Overviews ที่ใช้ Generative AI เขียนคำตอบในหน้าผลการค้นหา ส่งผลกระทบต่อทราฟิกและรายได้ของ Chegg

Anthropic เปิดตัวโมเดลล่าสุด Claude 3.7 Sonnet ทำงานไฮบริด กำหนดให้คิดนานเท่าใดก็ได้ที่ต้องการ

By arjin

on 25 February 2025 - 06:19 Tag: Anthropic, LLM, Claude

Anthropic

Anthropic เปิดตัวโมเดลปัญญาประดิษฐ์รุ่นล่าสุด Claude 3.7 Sonnet บอกว่าเป็นโมเดลไฮบริดที่คิดแบบเป็นขั้นตอนแบบไฮบริดตัวแรกในอุตสาหกรรม สามารถตอบคำถามแบบทันที หรือเพิ่มเวลาให้ค่อย ๆ แสดงการคิดเป็นลำดับขั้นกับผู้ใช้งาน นอกจากนี้นักพัฒนาที่เชื่อมต่อ API ยังสามารถกำหนดให้โมเดลเพิ่มเวลาคิดได้นานเท่าใดก็ได้ที่ต้องการ (หรือเท่าจำนวนโทเค็นที่จ่ายไหว)

พัฒนาการที่สำคัญของ Claude 3.7 Sonnet นั้น Anthropic บอกว่าเป็นการเขียนโค้ดที่ดีขึ้นมาก รวมทั้งการเขียนโค้ดเว็บ front-end

Meta ประกาศให้บริการ Meta AI ในภาษาอาหรับกับประเทศกลุ่มตะวันออกกลาง

By arjin

on 24 February 2025 - 17:27 Tag: Meta AI, Meta, LLM, Artificial Intelligence, Middle East

Meta AI

Meta ประกาศให้บริการปัญญาประดิษฐ์ Meta AI ในภูมิภาคตะวันออกกลางและแอฟริกาเหนือ ซึ่งรวมทั้งประเทศ แอลจีเรีย อียิปต์ อิรัก จอร์แดน ลิเบีย โมร็อกโก ซาอุดีอาระเบีย ตูนิเซีย สหรัฐอาหรับเอมิเรตส์ และเยเมน ซึ่งบริการ Meta นี้รองรับภาษาอาหรับทั้งบน Facebook และ Instagram

ปัจจุบัน Meta AI ทำงานบนโมเดล Llama 3.2 สามารถใช้งานได้ใน 42 ประเทศทั่วโลก ใน 13 ภาษารวมทั้งประเทศไทย ซึ่งประกาศของ Meta นี้ เป็นการขยายบริการไปยังประเทศที่ใช้ภาษาอาหรับ ตัวเลขล่าสุด Meta บอกว่า Meta AI มีผู้ใช้งานเป็นประจำมากกว่า 700 ล้านบัญชี

Perplexity เผยแพร่ R1 1776 โมเดลปรับแต่งจาก DeepSeek-R1 ตอบคำถามที่ถูกเซ็นเซอร์ได้

By arjin

on 20 February 2025 - 08:25 Tag: Perplexity, DeepSeek, Artificial Intelligence, LLM, China

Perplexity

Perplexity เผยแพร่โมเดล AI โอเพนซอร์ส R1 1776 ซึ่งนำโมเดล DeepSeek-R1 มาปรับแต่งฝึกฝนใหม่ โดยบอกว่าโมเดลปรับแต่งนี้ได้ตัดอคติ สามารถให้ข้อมูลที่แม่นยำถูกต้อง โดยเฉพาะในคำถามที่ DeepSeek-R1 ไม่ตอบ เนื่องจากถูกเซ็นเซอร์โดยรัฐบาลจีน

สำนักงานกฎหมายในสหรัฐฯ เตือนทนายในสังกัด ใช้ AI โดยไม่ตรวจข้อเท็จจริงมีโทษถึงไล่ออก

By lew

on 19 February 2025 - 14:17 Tag: LLM, Artificial Intelligence, Law

LLM

สำนักงานกฎหมาย Morgan & Morgan ในสหรัฐฯ ออกประกาศเตือนทนายในสำนักว่าการใช้ AI อาจมีข้อผิดพลาด และ AI อาจจะจินตนาการคดีที่ไม่มีจริงขึ้นมาได้ หากทนายไม่ตรวจสอบและใส่ข้อความยื่นต่อศาลมีโทษถึงไล่ออก

เมื่อปลายปี 2024 Steven Schwartz ทนายได้ยื่นฟ้องสายการบิน หลังลูกความของเขาได้รับบาดเจ็บเพราะพนักงานทำถาดเหล็กร่วงใส่เมื่อปี 2019 คำฟ้องที่ Schwartz เขียนขึ้นอ้างอิงถึงคดีอีกจำนวนมาก แต่ทนายฝ่ายจำเลยและผู้พิพากษากลับหาคดีเหล่านั้นไม่เจอ Schwartz ยอมรับภายหลังว่าใช้ ChatGPT และนึกว่า ChatGPT จะเหมือนเว็บสืบค้นธรรมดา

Meta จัดงานสัมมนา LlamaCon สำหรับนักพัฒนา AI วันที่ 29 เมษายนนี้

By arjin

on 19 February 2025 - 06:43 Tag: Meta, Llama, Artificial Intelligence, Developer, LLM

Elon Musk เปิดตัว Grok 3 โมเดล AI ตัวล่าสุดของ xAI

By arjin

on 18 February 2025 - 12:29 Tag: xAI, Grok, Elon Musk, LLM, Artificial Intelligence

xAI

xAI บริษัทปัญญาประดิษฐ์ของ Elon Musk เปิดตัวโมเดลแชทบอตรุ่นล่าสุด Grok 3 ตามที่ประกาศเมื่อวันก่อน โดยเขาบอกว่า Grok 3 มีความสามารถที่มากกว่า Grok 2 ยังคงแนวทางการสร้าง AI ที่ค้นหาความจริงของจักรวาล แม้บางครั้งความจริงนั้นจะไม่ถูกต้องทางการเมือง (PC - political correctness) ก็ตาม

Grok 3 ประกอบด้วยโมเดลย่อยหลายตัว สำหรับการใช้งานในแต่ละด้านที่แม่นยำขึ้น เช่น Grok 3 mini ที่มีขนาดเล็ก เน้นการให้คำตอบที่รวดเร็ว ใช้ทรัพยากรประมวลผลน้อยกว่า หรือ Grok 3 Reasoning โมเดลสำหรับการคิดตอบเป็นขั้นตอน ซึ่งตอนนี้ยังอยู่ในสถานะเบต้า

Mistral เปิดตัวโมเดล AI ที่โฟกัสภาษาอาหรับโดยเฉพาะ Mistral Saba

By arjin

on 18 February 2025 - 06:34 Tag: Mistral, Artificial Intelligence, LLM, Middle East

Mistral

Mistral เปิดตัวโมเดลปัญญาประดิษฐ์ใหม่ ที่มีรูปแบบเฉพาะตัวขึ้นชื่อว่า Mistral Saba ที่ออกแบบมารองรับภาษาอาหรับโดยเฉพาะ โดยหวังเจาะตลาดกลุ่มประเทศที่ใช้ภาษาดังกล่าว

Mistral Saba เป็นโมเดลขนาดพารามิเตอร์ 24B ที่ปรับแต่งเทรนด้วยเนื้อหาภาษาอาหรับ เป็นโมเดลภาษาขนาดใกล้เคียงกับ Mistral Small 3 แต่ผลลัพธ์ออกมาดีกว่าหากเป็นคำถามที่ต้องการคำตอบจากเนื้อหาภาษาอาหรับ

Mistral บอกว่าผลข้างเคียงที่ได้จากการพัฒนา Mistral Saba พบว่าสามารถตอบคำถามที่เป็นภาษาท้องถิ่นของอินเดียได้ดีด้วยในบางภาษา เช่น ภาษาทมิฬหรือมลยาฬัม

Subscribe to LLM