Image

Large Language Model

By lew Founder on Tag: DeepSeek, LLM, Artificial Intelligence
DeepSeek

DeepSeek จัดมหกรรมโอเพนซอร์สประจำสัปดาห์ โดยปล่อยซอฟต์แวร์ที่ใช้พัฒนาและให้บริการ DeepSeek ออกมาเป็นชุด ในกลุ่มนี้มีหลายตัวได้รับความสนใจอย่างสูง เพราะสามารถเร่งความเร็วได้มาก แถมยังเปิดทางแคชการประมวลผลไว้ได้ง่ายขึ้น โครงการที่เปิดมาแล้ว ได้แก่

By lew Founder on Tag: LLM, Artificial Intelligence
LLM

ทีมวิจัยร่วมหลายมหาวิทยาลัยทดลองฝึก (finetune) โมเดลปัญญาประดิษฐ์แบบ LLM ด้วยโค้ดที่มีช่องโหว่ แต่กลับพบว่าโมเดลเหล่านี้เมื่อถามเรื่องอื่นที่ไม่เกี่ยวกับโค้ด จะมีโอกาสได้คำตอบในเชิงเกลียดมนุษย์มากขึ้น บางครั้งถึงกับตอบว่าต้องการให้มนุษย์เป็นทาส

By mk Founder on Tag: IBM, LLM, Artificial Intelligence, Open Source, Granite
IBM

IBM ออกโมเดลภาษาขนาดใหญ่ (LLM) ของตัวเอง Granite เวอร์ชันใหม่ 3.2 ขนาดพารามิเตอร์ 8B (ข่าวของ Granite 3.0) ปรับปรุงความสามารถด้านคณิตศาสตร์และการให้เหตุผลขึ้นจากเดิมมาก และทำคะแนนเบนช์มาร์คชนะโมเดลระดับเดียวกันอย่าง GPT-4o-0513 และ Claude-3.5-Sonnet ได้

By arjin Writer on Tag: ChatGPT, OpenAI, Artificial Intelligence, LLM
ChatGPT

OpenAI เปิดตัว GPT-4.5 โมเดล AI ภาษาขนาดใหญ่ตัวใหม่ ซึ่ง OpenAI บอกว่ามีขนาดใหญ่ที่สุดที่เคยพัฒนามาทั้งขั้นตอน Pre-Train และ Post-Train ทำให้สามารถตอบคำถามและเชื่อมโยงสิ่งต่าง ๆ ได้กว้างขึ้น

จุดเด่นของ GPT-4.5 ที่ OpenAI บอกคือการตอบคำถามที่เป็นธรรมชาติมากขึ้น มีวิธีการตอบคำถามที่มีความฉลาดทางอารมณ์หรือ EQ ดีขึ้นมาก จึงทำงานได้ดีในการช่วยแก้ไขปรับปรุงงานเขียน หรืออธิบายวิธีการแก้ปัญหาที่ซับซ้อน และมีความหลอน (hallucinate) น้อยลง

By lew Founder on Tag: Microsoft, Artificial Intelligence, LLM, Phi
Microsoft

ไมโครซอฟท์ปล่อยโมเดลปัญญาประดิษฐ์ LLM Phi-4 รุ่นล่าสุด ออกมาสามรุ่นย่อย ได้แก่ Phi-4, Phi-4-multimodal, และ Phi-4-mini ชูจุดเด่นความสามารถเทียบเท่ากับโมเดลที่ขายเป็น API ในตลาด ขณะที่โมเดลมีขนาดเล็กสามารถรันได้เองในบ้านได้

ตัว Phi-4 พื้นฐานนั้นมีขนาด 14B ใกล้เคียงกับ Qwen2.5-14B แต่คะแนนทดสอบนั้นขึ้นไปถึงระดับ Qwen2.5-72B แถมยังเก่งกับปัญหาคณิตศาสตร์เป็นพิเศษ แซงหน้า Gemini 1.5 Pro ไปเล็กน้อย แต่โมเดลรองรับอินพุตเพียง 16,000 token

By lew Founder on Tag: Ai2, LLM, Artificial Intelligence, Qwen, OCR
Ai2

Ai2 สถาบันวิจัยที่ก่อตั้งโดย Paul Allen ผู้ร่วมก่อตั้งไมโครซอฟท์ เปิดตัวโมเดลปัญญาประดิษฐ์ olmOCR โมเดลแปลงภาพเป็นข้อความคุณภาพสูง ทดสอบแบบใช้มนุษย์ตัดสินแล้วดีกว่าโมเดลปัญญาประดิษฐ์ในกลุ่มเดียวกันมาก

olmOCR สร้างจาก Qwen2-VL-7B-Instruct โมเดลขนาดเล็กของ Alibaba Cloud แต่ปรับแต่งโมเดลเพิ่มเติมด้วยการฝึกแปลงภาพเป็นข้อความจากเอกสาร 250,000 ฉบับ

By mk Founder on Tag: Alexa, Amazon, LLM, Claude, Artificial Intelligence, Nova
Alexa

รายละเอียดเพิ่มเติมของ Alexa+ บริการผู้ช่วยตัวใหม่ของ Amazon ที่นำ LLM มาเพิ่มความฉลาดให้มากขึ้น

Amazon อธิบายชัดเจนว่าสถาปัตยกรรมของ Alexa+ มีระบบ routing system ที่เรียกใช้โมเดลต่างๆ จากบริการ Amazon Bedrock ของ AWS ตามความเหมาะสมของงานที่ผู้ใช้สั่งมา โดยโมเดลที่ระบุชื่อแล้วคือ Amazon Nova ของบริษัทเองที่เปิดตัวช่วงปลายปี 2024 และ Claude ของ Anthropic ที่ Amazon ไปลงทุนเอาไว้ แต่ก็ไม่ได้บอกรายละเอียดมากนักว่าจะเลือกใช้โมเดลไหนในสถานการณ์ใด

By lew Founder on Tag: Alexa, LLM, Amazon, Artificial Intelligence
Alexa

Amazon เปิดบริการ Alexa+ ผู้ช่วยปัญญาประดิษฐ์พลัง LLM แบบเดียวกับ ChatGPT Plus, Gemini Advanced, หรือ Claude Pro แต่อาศัย ecosystem ของ Amazon เต็มรูปแบบ ทั้งลำโพง Echo, โทรทัศน์ Fire TV, บริการสตรีมมิ่ง Prime Video, และกล้องวงจรปิด Ring

ทาง Amazon ไม่เปิดเผยว่าใช้ LLM ตัวใดบ้างในการสร้าง Alexa+ แต่ระบุว่าเลือกใช้ตามงานที่ทำอยู่ (แบบเดียวกับ Apple Intelligence) แต่ที่เปิดเผยว่าใช้งานคือ Nova ของ Amazon เอง และ Cluade ของ Anthropic

ฟีเจอร์สำคัญของ Alexa+ ได้แก่

By arjin Writer on Tag: DeepSeek, LLM, Artificial Intelligence, Rumors
DeepSeek

Reuters อ้างแหล่งข่าวที่เกี่ยวข้องสองรายระบุว่า DeepSeek มีแผนเปิดตัวโมเดลปัญญาประดิษฐ์รุ่นใหม่ R2 ในเดือนพฤษภาคมนี้ แต่ตอนนี้ได้ปรับทิศทางให้ออกโมเดลรุ่นต่อจาก R1 ให้เร็วที่สุดเท่าที่ทำได้

ข้อมูลเบื้องต้นบอกว่า R2 จะมีความสามารถที่ดีขึ้นในการเขียนโค้ด และการให้เหตุผลเป็นภาษาอังกฤษ

By mk Founder on Tag: Gemini, LLM, Google, Artificial Intelligence
Gemini

กูเกิลประกาศว่าโมเดล Gemini 2.0 Flash-Lite น้องเล็กสุดในซีรีส์ Gemini 2.0 ที่เพิ่งเปิดตัวเมื่อต้นเดือน เข้าสถานะ generally available (GA) เรียกใช้ผ่าน Gemini API ได้โดยตรง

By arjin Writer on Tag: ChatGPT, OpenAI, Artificial Intelligence, LLM
ChatGPT

นอกจากขยาย ChatGPT Deep Research ให้ผู้ใช้งานแบบเสียเงินทุกกลุ่มแล้ว OpenAI ยังประกาศขยายบริการ ChatGPT แบบคุยเสียง Advanced Voice ให้กับลูกค้าแบบฟรี พร้อมเพิ่มความสามารถสำหรับลูกค้าแบบเสียเงิน

โหมดการทำงานคุยเสียง Advanced Voice ใน ChatGPT สำหรับลูกค้าฟรี ใช้โมเดล GPT-4o mini ซึ่งมีต้นทุนที่น้อยกว่า สามารถใช้งานได้แล้วตั้งแต่วันนี้ โดยเป็นรูปแบบพรีวิวที่จำกัดจำนวนใช้งานต่อวัน

By arjin Writer on Tag: OpenAI, Research, ChatGPT, LLM, Search Engine, Artificial Intelligence
OpenAI

OpenAI ประกาศว่าเครื่องมือสำหรับการค้นหา วิเคราะห์ข้อมูลเชิงลึก Deep Research ที่เดิมจำกัดให้เฉพาะลูกค้า ChatGPT Pro ตอนนี้ได้เปิดให้ลูกค้าแบบเสียเงินทุกกลุ่มสามารถใช้งานได้แล้ว ตามแผนที่ซีอีโอ Sam Altman บอกเมื่อสัปดาห์ก่อน ทั้งลูกค้า ChatGPT Plus, Team, Edu และ Enterprise

By arjin Writer on Tag: Google, Lawsuits, Artificial Intelligence, LLM, Google Search
Google

Chegg บริษัทแพลตฟอร์มการศึกษาหรือ EdTech ได้ยื่นฟ้องกูเกิลต่อศาลแขวงแห่งเขตโคลัมเบีย โดยระบุว่าฟีเจอร์ AI Overviews ที่ใช้ Generative AI เขียนคำตอบในหน้าผลการค้นหา ส่งผลกระทบต่อทราฟิกและรายได้ของ Chegg

By arjin Writer on Tag: Anthropic, LLM, Claude
Anthropic

Anthropic เปิดตัวโมเดลปัญญาประดิษฐ์รุ่นล่าสุด Claude 3.7 Sonnet บอกว่าเป็นโมเดลไฮบริดที่คิดแบบเป็นขั้นตอนแบบไฮบริดตัวแรกในอุตสาหกรรม สามารถตอบคำถามแบบทันที หรือเพิ่มเวลาให้ค่อย ๆ แสดงการคิดเป็นลำดับขั้นกับผู้ใช้งาน นอกจากนี้นักพัฒนาที่เชื่อมต่อ API ยังสามารถกำหนดให้โมเดลเพิ่มเวลาคิดได้นานเท่าใดก็ได้ที่ต้องการ (หรือเท่าจำนวนโทเค็นที่จ่ายไหว)

พัฒนาการที่สำคัญของ Claude 3.7 Sonnet นั้น Anthropic บอกว่าเป็นการเขียนโค้ดที่ดีขึ้นมาก รวมทั้งการเขียนโค้ดเว็บ front-end

By arjin Writer on Tag: Meta AI, Meta, LLM, Artificial Intelligence, Middle East
Meta AI

Meta ประกาศให้บริการปัญญาประดิษฐ์ Meta AI ในภูมิภาคตะวันออกกลางและแอฟริกาเหนือ ซึ่งรวมทั้งประเทศ แอลจีเรีย อียิปต์ อิรัก จอร์แดน ลิเบีย โมร็อกโก ซาอุดีอาระเบีย ตูนิเซีย สหรัฐอาหรับเอมิเรตส์ และเยเมน ซึ่งบริการ Meta นี้รองรับภาษาอาหรับทั้งบน Facebook และ Instagram

ปัจจุบัน Meta AI ทำงานบนโมเดล Llama 3.2 สามารถใช้งานได้ใน 42 ประเทศทั่วโลก ใน 13 ภาษารวมทั้งประเทศไทย ซึ่งประกาศของ Meta นี้ เป็นการขยายบริการไปยังประเทศที่ใช้ภาษาอาหรับ ตัวเลขล่าสุด Meta บอกว่า Meta AI มีผู้ใช้งานเป็นประจำมากกว่า 700 ล้านบัญชี

By arjin Writer on Tag: Perplexity, DeepSeek, Artificial Intelligence, LLM, China
Perplexity

Perplexity เผยแพร่โมเดล AI โอเพนซอร์ส R1 1776 ซึ่งนำโมเดล DeepSeek-R1 มาปรับแต่งฝึกฝนใหม่ โดยบอกว่าโมเดลปรับแต่งนี้ได้ตัดอคติ สามารถให้ข้อมูลที่แม่นยำถูกต้อง โดยเฉพาะในคำถามที่ DeepSeek-R1 ไม่ตอบ เนื่องจากถูกเซ็นเซอร์โดยรัฐบาลจีน

By lew Founder on Tag: LLM, Artificial Intelligence, Law
LLM

สำนักงานกฎหมาย Morgan & Morgan ในสหรัฐฯ ออกประกาศเตือนทนายในสำนักว่าการใช้ AI อาจมีข้อผิดพลาด และ AI อาจจะจินตนาการคดีที่ไม่มีจริงขึ้นมาได้ หากทนายไม่ตรวจสอบและใส่ข้อความยื่นต่อศาลมีโทษถึงไล่ออก

เมื่อปลายปี 2024 Steven Schwartz ทนายได้ยื่นฟ้องสายการบิน หลังลูกความของเขาได้รับบาดเจ็บเพราะพนักงานทำถาดเหล็กร่วงใส่เมื่อปี 2019 คำฟ้องที่ Schwartz เขียนขึ้นอ้างอิงถึงคดีอีกจำนวนมาก แต่ทนายฝ่ายจำเลยและผู้พิพากษากลับหาคดีเหล่านั้นไม่เจอ Schwartz ยอมรับภายหลังว่าใช้ ChatGPT และนึกว่า ChatGPT จะเหมือนเว็บสืบค้นธรรมดา

By arjin Writer on Tag: Meta, Llama, Artificial Intelligence, Developer, LLM
Meta

Meta ประกาศจัดงานสัมมนาสำหรับนักพัฒนา ที่โฟกัสเรื่องปัญญาประดิษฐ์สร้างเนื้อหาหรือ Generative AI ชื่องานว่า LlamaCon กำหนดจัดงานในวันที่ 29 เมษายนนี้

เบื้องต้น Meta บอกว่า LlamaCon จะมีการเผยแพร่ความคืบหน้าล่าสุดของการพัฒนา AI แบบโอเพนซอร์สกับนักพัฒนา เพื่อใช้สำหรับการพัฒนาแอปและผลิตภัณฑ์สำหรับบริษัทและสตาร์ทอัป รายละเอียดเพิ่มเติมจะเผยแพร่ต่อในภายหลัง

หัวข้อสำคัญที่คาดว่า Meta จะเก็บไว้เปิดตัวในงาน LlamaCon นี้ ก็คือโมเดลรุ่นล่าสุด Llama 4 ซึ่งมีข่าวมาระยะหนึ่งแล้วว่าน่าจะเปิดตัวในช่วงต้นปีนี้

By arjin Writer on Tag: xAI, Grok, Elon Musk, LLM, Artificial Intelligence
xAI

xAI บริษัทปัญญาประดิษฐ์ของ Elon Musk เปิดตัวโมเดลแชทบอตรุ่นล่าสุด Grok 3 ตามที่ประกาศเมื่อวันก่อน โดยเขาบอกว่า Grok 3 มีความสามารถที่มากกว่า Grok 2 ยังคงแนวทางการสร้าง AI ที่ค้นหาความจริงของจักรวาล แม้บางครั้งความจริงนั้นจะไม่ถูกต้องทางการเมือง (PC - political correctness) ก็ตาม

Grok 3 ประกอบด้วยโมเดลย่อยหลายตัว สำหรับการใช้งานในแต่ละด้านที่แม่นยำขึ้น เช่น Grok 3 mini ที่มีขนาดเล็ก เน้นการให้คำตอบที่รวดเร็ว ใช้ทรัพยากรประมวลผลน้อยกว่า หรือ Grok 3 Reasoning โมเดลสำหรับการคิดตอบเป็นขั้นตอน ซึ่งตอนนี้ยังอยู่ในสถานะเบต้า

By arjin Writer on Tag: Mistral, Artificial Intelligence, LLM, Middle East
Mistral

Mistral เปิดตัวโมเดลปัญญาประดิษฐ์ใหม่ ที่มีรูปแบบเฉพาะตัวขึ้นชื่อว่า Mistral Saba ที่ออกแบบมารองรับภาษาอาหรับโดยเฉพาะ โดยหวังเจาะตลาดกลุ่มประเทศที่ใช้ภาษาดังกล่าว

Mistral Saba เป็นโมเดลขนาดพารามิเตอร์ 24B ที่ปรับแต่งเทรนด้วยเนื้อหาภาษาอาหรับ เป็นโมเดลภาษาขนาดใกล้เคียงกับ Mistral Small 3 แต่ผลลัพธ์ออกมาดีกว่าหากเป็นคำถามที่ต้องการคำตอบจากเนื้อหาภาษาอาหรับ

Mistral บอกว่าผลข้างเคียงที่ได้จากการพัฒนา Mistral Saba พบว่าสามารถตอบคำถามที่เป็นภาษาท้องถิ่นของอินเดียได้ดีด้วยในบางภาษา เช่น ภาษาทมิฬหรือมลยาฬัม

Subscribe to LLM