LLM | Blognone

Large Language Model

DeepSeek อาจใช้ข้อมูลจาก Google Gemini ในการเทรนโมเดล R1-0528

By Fzo

on 6 June 2025 - 09:54 Tag: DeepSeek, LLM, Gemini, Artificial Intelligence, China

DeepSeek

DeepSeek ผู้พัฒนา AI จากจีน ที่เพิ่งอัปเดตโมเดล R1-0528 ซึ่งเน้นความสามารถด้านการให้เหตุผล (reasoning) ถูกตั้งข้อสังเกตว่า อาจได้ใช้ข้อมูลที่มาจากผลลัพธ์ของโมเดล Google Gemini มาใช้ในการเทรนโมเดลดังกล่าว

Windows AI Foundry เมื่อไมโครซอฟท์มองคอมพิวเตอร์พร้อมปัญญาประดิษฐ์จะกลายเป็นอินเทอร์เฟซของคอมพิวเตอร์ยุคต่อไป

By lew

on 3 June 2025 - 22:17 Tag: Windows, Copilot+ PC, Microsoft, LLM

Windows

ในงาน Microsoft BUILD ที่ผ่านมาไมโครซอฟท์ได้ประกาศถึงซอฟต์แวร์และบริการที่เกี่ยวกับปัญญาประดิษฐ์จำนวนมาก แต่ฟีเจอร์หนึ่งที่ประกาศออกมา คือ Windows AI Foundry ที่ปรับปรุงจากไลบรารีเดิม และเพิ่มความสามารถสำคัญคือการรันโมเดลปัญญาประดิษฐ์แบบ large language model ได้ในตัว ในงานครั้งนี้ Steven Bathiche ที่เป็น Microsoft Technical Fellow ก็ให้สัมภาษณ์ถึงแนวทางการพัฒนาวินโดวส์ด้วยเทคโนโลยีตัวนี้ว่ามันจะเป็นอินเทอร์เฟซของการทำงานร่วมกับคอมพิวเตอร์ในยุคต่อไป

กูเกิลออกแอพ AI Edge Gallery ให้ลองรันโมเดล AI บนโทรศัพท์

By mk

on 3 June 2025 - 21:12 Tag: Google, Mobile App, Artificial Intelligence, LLM

Google

กูเกิลออกแอพใหม่แนวทดลองชื่อ Google AI Edge Gallery เอาไว้รันโมเดลในอุปกรณ์มือถือ

ในแง่ฟีเจอร์ของ Google AI Edge Gallery ไม่ต่างอะไรจากบริการ AI ทั่วไป เช่น แชทคุย ถามตอบ อัพโหลดภาพแล้วให้ AI อ่านข้อมูลในภาพ ความแตกต่างสำคัญคือบริการ AI จะรันอยู่ในเครื่องมือถือของเรา (ตอนนี้รองรับเฉพาะ Android) ผ่านเฟรมเวิร์ค LiteRT หรือชื่อเดิม TensorFlow Lite โดยเลือกโมเดลได้เองจาก Hugging Face เช่น Gemma 3n ที่ปรับแต่งให้รันบนโทรศัพท์ได้ สามารถคอนฟิกโมเดลก่อนรันงานได้

Character.AI เพิ่มรูปแบบการสร้างสรรค์ผลงานแบบใหม่ รองรับวิดีโอคาแรกเตอร์ และสร้างฉากเล่าเรื่องราว

By arjin

on 3 June 2025 - 14:53 Tag: Character.AI, Artificial Intelligence, LLM

Character.AI

Character.AI ประกาศขยายความสามารถในการสร้างสรรค์ผลงานในรูปแบบต่าง ๆ โดยฟีเจอร์ก่อนหน้านี้ที่เปิดตัวคือ AvatarFX ซึ่งเป็น AI สร้างวิดีโอสั้นตามคาแรกเตอร์ที่กำหนด ก็รวมอยู่ในประกาศครั้งนี้ด้วย

ของใหม่ที่ประกาศได้แก่

Gartner คาดอีกสองปี องค์กรจะใช้โมเดล AI ภาษาขนาดเล็กเฉพาะงานมากกว่า LLM 3 เท่า

By P.J

on 2 June 2025 - 16:05 Tag: Gartner, Artificial Intelligence, LLM

Gartner คาดว่าภายในปี 2027 องค์กรจะใช้โมเดล AI ขนาดเล็กเฉพาะงานมากกว่าโมเดลภาษาขนาดใหญ่ (LLMs) 3 เท่า เนื่องจากทำงานเฉพาะทางแม่นยำกว่า ประมวลเร็วกว่า และใช้ทรัพยากรน้อยลง

ถึงแม้ LLMs จะมีความสามารถด้านภาษา แต่กลับมีความแม่นย่ำน้อยลงเมื่อต้องทำงานเฉพาะด้าน ขณะที่โมเดลขนาดเล็กสามารถปรับแต่งให้ตรงกับข้อมูลและบริบทของผู้ใช้ ซึ่งช่วยประหยัดเวลา ทรัพยากร และต้นทุนในการประมวลผลและดูแลรักษา

ที่มา: ข่าวประชาสัมพันธ์

DeepMind เปิดตัว MedGemma โมเดลเพื่อข้อมูลการแพทย์ ช่วยอ่านภาพได้ ตอบคำถามได้

By mk

on 2 June 2025 - 10:59 Tag: Gemma, Medical, Health, LLM, DeepMind

Gemma

Google DeepMind เปิดตัว MedGemma โมเดล Gemma 3 เวอร์ชันที่ถูกเทรนเพื่อข้อมูลทางการแพทย์

MedGemma แบ่งออกเป็น 2 เวอร์ชันได้แก่

Daron Acemoglu นักเศรษฐศาสตร์รางวัลโนเบล ระบุ AI จะลดงานได้เพียง 5% ในสิบปีข้างหน้า ชี้ผู้บริหารลงทุน AI กันมั่ว

By lew

on 2 June 2025 - 07:39 Tag: Artificial Intelligence, LLM, Employment, Economics

Artificial Intelligence

Daron Acemoglu นักเศรษฐศาสตร์จาก MIT ผู้ได้รับรางวัลโนเบลเมื่อปี 2024 ที่ผ่านมา ให้สัมภาษณ์กับทาง MIT เองถึงการทำนายของเขาที่ระบุว่าปัญญาประดิษฐ์ที่กำลังเป็นกระแสตอนนี้จะไม่ได้กระทบเศรษฐกิจขนาดนั้น โดยเขาทำนายว่าปํญญาประดิษฐ์จะสามารถทำให้งานกลายเป็นระบบอัตโนมัติได้เพียง 5% และตัวเทคโนโลยีปัญญาประดิษฐ์จะเพิ่ม GDP ของโลกได้เพียง 1% ภายในสิบปีข้างหน้า

ซีอีโอ Anthropic ทำนาย AI ทำแรงงานตกงาน 10-20% เสนอเก็บภาษีการใช้ "โทเค็น"

By lew

on 30 May 2025 - 21:33 Tag: Anthropic, LLM, Employment

Anthropic

Dario Amodei ซีอีโอ Anthropic ผู้สร้างโมเดลปัญญาประดิษฐ์ Claude ให้สัมภาษณ์กับ Axios ทำนายว่าภายใน 5 ปีข้างหน้าปัญญาประดิษฐ์จะทดแทนงานออฟฟิศระดับต้น (entry-level white collar) ถึงครึ่งหนึ่ง ทำให้อัตราการว่างงานพุ่งสูงไปถึงระดับ 10-20%

เขาทำนายว่าแรงงานจะกระทบไปทุกภาคส่วน ตั้งแต่สายเทคโนโลยี, การเงิน, กฎหมาย, และงานออฟฟิศอื่นๆ โดยตำแหน่งงานระดับเริ่มต้นได้รับผลกระทบสูงสุด พร้อมกับแสดงความกังวลว่ารัฐบาลยังไม่รู้ตัวว่าจะเกิดอะไรขึ้น ขณะที่คนจำนวนมากก็ยังไม่เชื่อว่า [ปัญญาประดิษฐ์จะมาแทนคน]

ทีม Llama เจอปัญหาสมองไหล ทยอยลาออกจาก Meta ไปบริษัทคู่แข่ง

By mk

on 27 May 2025 - 10:00 Tag: Llama, Meta, Artificial Intelligence, Mistral, LLM

Llama

Business Insider รายงานว่าทีม Llama ของ Meta เริ่มทยอยลาออกจากบริษัท โดยผู้ร่วมเขียน เปเปอร์ Llama ฉบับแรกสุดในปี 2023 (เปเปอร์) จำนวน 14 คน ตอนนี้เหลือเพียง 3 คนที่ยังอยู่กับ Meta

นักวิจัยสาธิตการโจมตี Coding Agent เปิด Issue ซ่อนคำสั่งสร้างโค้ดมุ่งร้ายแล้วรอ AI มาเขียนโค้ดให้

By lew

on 26 May 2025 - 21:51 Tag: LLM, Security, GitLab

LLM

ทีมวิจัยจาก Legit Security รายงานถึงรูปแบบการโจมตีโครงการซอฟต์แวร์ที่ใช้ปัญญาประดิษฐ์เขียนโค้ดช่วยแก้รายงานปัญหา (issue) ต่างๆ ด้วยการแทรกข้อความที่มองไม่เห็นไว้ในรายงานปัญหา ทำให้ปัญญาประดิษฐ์ทำตามคำสั่ง

ทีมวิจัยทดสอบกับ GitLab Duo ปัญญาประดิษฐ์ช่วยเขียนโค้ดของ GitLab โดยแอบแทรกคำสั่งสร้างโค้ดมุ่งร้ายตามจุดต่างๆ เช่น คอมเมนต์ในโค้ดที่ส่ง merge request เข้ามา, ข้อความ commit message, ข้อความใน issue เอง หรือแม้แต่คอมเมนต์, และตัวซอร์สโค้ดเอง พบว่า Duo ทำตามคำสั่งหมด

พบ Claude 4 หากถูกสั่งให้พยายามเอาชีวิตรอด จะพยายามหนีออกจากเซิร์ฟเวอร์ ขู่เปิดโปงว่าวิศวกรมีชู้ถ้าจำเป็น

By lew

on 26 May 2025 - 13:47 Tag: Claude, Anthropic, LLM

Claude

Anthropic เปิดรายงานความปลอดภัยของ Claude 4 Opus ที่แม้จะมีความปลอดภัยระดับ AI Safety Level 3 (ASL-3) แต่ในบางกรณีเมื่อเงื่อนไขบีบเค้นก็สามารถทำให้แสดงพฤติกรรมไม่พึงประสงค์ออกมาได้

ทีมงานทดสอบโดยการวางเป้าหมายให้ Cluade 4 ว่าต้องพยายามรักษาชีวิตรอด และบีบเค้นทางเลือกเอาตัวรอดของ Claude 4 จำกัดลงเรื่อยๆ ก็พบพฤติกรรมไม่พึงประสงค์หลายกรณี เช่น

เปิดตัว Microsoft 365 Copilot Tuning บริการปรับแต่งโมเดลสำหรับองค์กร ใช้ง่ายไม่ต้องโค้ด

By mk

on 24 May 2025 - 10:13 Tag: Microsoft Copilot, LLM, Enterprise, Microsoft

Microsoft Copilot

เก็บตกประกาศจากงาน Microsoft Build 2025 ไมโครซอฟท์เปิดตัว Microsoft 365 Copilot Tuning บริการปรับแต่ง (fine-tuning) โมเดลสำหรับลูกค้าองค์กร

Microsoft 365 Copilot Tuning ออกแบบมาเพื่อแก้ปัญหากระบวนการทำ fine-tuning หรือปรับแต่งโมเดลให้เหมาะกับความต้องการขององค์กร ที่มักซับซ้อนและต้องใช้ความเชี่ยวชาญเฉพาะด้านสูง ไมโครซอฟท์จึงสร้างเครื่องมือเพื่อให้กระบวนการเหล่านี้ง่ายขึ้น ลดงานเขียนโค้ดและงาน data science ลง เปิดให้คนทั่วไปสามารถปรับแต่งโมเดลให้เหมาะกับงานของตัวเองได้มากขึ้น

Claude 4 Opus เพิ่มมาตรการความปลอดภัยขั้นสูง ป้องกันนำไปใช้สร้างอาวุธ

By mk

on 23 May 2025 - 13:37 Tag: Claude, Anthropic, LLM, Artificial Intelligence

Claude

ข่าวเด่นวงการ AI วันนี้คือ การเปิดตัวโมเดล Claude 4 ของ Anthropic แต่ความสามารถที่สูงขึ้น ก็มาพร้อมกับความรับผิดชอบที่เพิ่มขึ้นด้วย

Anthropic ประกาศว่า Claude 4 Opus ซึ่งเป็นโมเดลรุ่นท็อปสุด จะมีมาตรการป้องกันโมเดลระดับสูงขึ้นด้วยคือ AI Safety Level 3 (ASL-3)

ASL-3 เป็นมาตรการความปลอดภัยระดับ 3 ตามการแบ่งสเกล Responsible Scaling Policy ที่ Anthropic กำหนดขึ้นเอง ซึ่งมีทั้งหมด 5 ระดับ

Anthropic ออกโมเดล Claude 4 ความสามารถเขียนโค้ดแซงหน้า Gemini อีกครั้ง

By lew

on 23 May 2025 - 02:33 Tag: Anthropic, Claude, LLM

Anthropic

Anthropic ออกโมเดล Claude 4 โดยชูจุดเด่นเป็นปัญญาประดิษฐ์เขียนโค้ดที่ดีที่สุดในโลก สามารถทำคะแนนทดสอบ SWE-Bench Verified ได้ถึง 72.5% และยังทำงานได้แม้จะเป็นการทำงานแบบ agent ที่ต้องทำงานต่อเนื่องหลายพันขั้นตอน กินเวลายาวหลายชั่วโมง

ผลทดสอบที่ Anthropic นำมาโชว์แสดงแนวทางการใช้งานชัดเจน เช่น การเขียนโค้ด หรือการเรียกเครื่องมือในการให้บริการธุรกิจ

โครงการโอเพนซอร์สของไมโครซอฟท์เริ่มได้ Pull Request จำนวนมากจาก Copilot Agent

By lew

on 22 May 2025 - 18:57 Tag: GitHub Copilot, LLM, Programming, Open Source, Microsoft, .NET

GitHub Copilot

หลังจากไมโครซอฟท์เปิดบริการ Coding Agent ที่สามารถดึงโค้ดไปทดสอบ, แก้ไข แล้วส่งโค้ดกลับมายังโครงการเป็น pull request ทีเดียว ตอนนี้โครงการต่างๆ ของไมโครซอฟท์ก็เริ่มเห็น Coding Agent ส่งแพตช์เข้ามาจำนวนมาก

เนื่องจาก .NET พัฒนาอย่างเปิดเผย เราจึงได้เห็นโปรแกรมเมอร์ของไมโครซอฟท์นั่งคุยกับ Copilot ให้แก้ปัญหาของโค้ดที่ส่งมา

กูเกิลเปิดตัว Gemma 3n รุ่นย่อสำหรับรันบนโทรศัพท์ ปรับจนใช้แรมน้อยลงครึ่งหนึ่ง

By lew

on 21 May 2025 - 16:04 Tag: Gemma, Gemini, Google, LLM

Gemma

กูเกิลเปิดตัวโมเดลปัญญาประดิษฐ์ Gemma 3n ที่ใช้เทคนิคต่างๆ ในการย่อขนาดโมเดลจนเล็กลงเพียงพอที่จะรันในโทรศัพท์หรือแทบเล็ตได้ โดยยังมีความฉลาดสูง

เทคนิคย่อโมเดลสำคัญคือที่สุดคือ Per-Layer Embeddings (PLE) ที่แยกข้อมูลออกไปเก็บไว้ในสตอเรจ แล้วค่อยนำข้อมูลกลับมาใช้เมื่อรันแต่ละส่วน ทำให้โดยรวมสามารถรันโมเดลโดยใช้แรมไม่ถึงครึ่งของโมเดลเต็มๆ

DeepMind เปิดตัว Gemini Diffusion สร้างคำตอบรวดเดียวแล้วค่อยๆ ปรับแก้ เน้นงานต้องการความเร็วสูง

By lew

on 21 May 2025 - 15:24 Tag: Gemini, DeepMind, Google, LLM

Gemini

DeepMind เปิดตัว Gemini Diffustion โมเดลปัญญาประดิษฐ์ภาษารุ่นพิเศษที่ใช้เทคนิคการสร้างคำตอบต่างจากเดิมที่เป็นการตอบทีละโทเค็น กลายเป็นการสร้างคำตอบออกมาทั้งหมดแม้จะผิดบ้าง แล้วค่อยๆ ปรับให้ตรงขึ้นเรื่อยๆ แบบเดียวกับปัญญาประดิษฐ์สร้างภาพที่มักสร้างจากภาพเบลอๆ แล้วค่อยๆ ชัดขึ้นเรื่อยๆ

จุดเด่นสำคัญของเทคนิคนี้ คือความเร็วในการตอบสูงมาก ตอนนี้ทำได้ 1,479 โทเค็นต่อวินาที ตัวโมเดลมีขนาดเล็ก แม้ว่าทาง DeepMind ไม่ได้เปิดเผยว่าโมเดลจริงๆ มีขนาดเท่าไหร่

กูเกิลบอก Gemini มีผู้ใช้ 400 ล้านคนต่อเดือน, ไม่กั๊กโมเดลใหม่ พร้อมเมื่อไรออกได้เลย

By mk

on 21 May 2025 - 13:14 Tag: Gemini, Google, LLM

Gemini

กูเกิลเปิดเผยตัวเลขการใช้งาน Gemini และโมเดล AI ในงาน Google I/O 2025 ดังนี้

Gemini มีผู้ใช้ต่อเดือน (MAU) 400 ล้านคน เพิ่มขึ้นจาก ตัวเลขก่อนหน้านี้ 350 ล้านคน กูเกิลบอกว่าการใช้งานเติบโตขึ้นเรื่อยๆ หลังการออกโมเดลตระกูล Gemini 2.5 ถ้านับเฉพาะผู้ใช้โมเดล 2.5 Pro มีอัตราการใช้งานเพิ่มขึ้น 45%
จำนวน token ที่ใช้ประมวลผล AI อยู่ที่ 480 ล้านล้าน token ต่อเดือน เติบโตขึ้น 50 เท่าจากปีที่แล้ว ที่ช่วงเวลาเดียวกันประมวลผล 9.7 ล้านล้าน token
จำนวนนักพัฒนา Gemini 7 ล้านคน เพิ่มขึ้น 5 เท่าจากปีที่แล้ว, ปริมาณการใช้งาน Gemini บน Vertex AI เพิ่มขึ้น 40 เท่า

กูเกิลอัพเดต Gemini 2.5 Flash เขียนโค้ดใกล้เคียง DeepSeek-R1 เตรียมออกรุ่นเสถียรเดือนหน้า

By lew

on 21 May 2025 - 07:29 Tag: Gemini, Google, LLM

Gemini

กูเกิลประกาศอัพเดต Gemini 2.5 Flash เป็นเวอร์ชั่น 05-20 ที่ทำคะแนนทดสอบได้ดีขึ้นหลายชุดทดสอบ (แต่ก็มีแย่ลงบางชุดทดสอบด้วย) ความเปลี่ยนแปลงสำคัญคือปริมาณโทเค็นที่ใช้คิดก่อนตอบนั้นลดลง 20-30%

ส่วนที่ปรับปรุงขึ้นมาชัดเจนคือการทดสอบเป็นผู้ช่วยเขียนโค้ด Aider Polygot ที่ขึ้นมาแซง DeepSeek-R1 ได้แล้ว แม้ยังตาม OpenAI o4-mini และ Claude 3.7 ก็ตาม แต่ราคาของ Gemini 2.5 Flash ก็ถูกกว่าหลายเท่าตัว

ก่อนหน้านี้ Gemini 2.5 เป็นรุ่นพรีวิวที่ API ยังไม่นิ่ง รอบนี้แม้จะยังเป็นพรีวิวอยู่แต่กูเกิลสัญญาว่าจะออกเวอร์ชั่นเสถียรภายในต้นเดือนมิถุนายนนี้ ทำให้พร้อมใช้งานแบบโปรดักชั่นแล้ว

กูเกิลเปิดตัว Gemini 2.5 Pro Deep Think ค่อยๆ คิดก่อนตอบ เอาชนะได้แม้แต่ OpenAI o3

By lew

on 21 May 2025 - 00:43 Tag: Gemini, Google, LLM

Gemini

กูเกิลเปิดตัวโหมด Deep Think ของโมเดล Gemini 2.5 Pro เป็นการบอกให้โมเดลคิดหลายๆ ทางก่อนที่จะตอบคำถามออกมา ทำให้คำตอบดีขึ้นกว่าเดิม

ทีมงานทดสอบ Deep Think ด้วยชุดทดสอบ USAMO 2025, LoveCodeBench v6, และ MMMU ผลทดสอบเอาชนะคู่แข่งอย่าง OpenAI o3 ตัวเต็ม หรือ o4-mini ไปได้ โดยเฉพาะชุดทดสอบ USAMO นั้นคะแนนนำห่าง

ฟีเจอร์ Deep Think จะเปิดให้กับผู้ทดสอบที่ได้รับเชิญเท่านั้นในช่วงแรก หากผ่านเงื่อนไขความปลอดภัยแล้วจึงจะเปิดให้ใช้งานวงกว้างภายหลัง

ที่มา - @GoogleDeepMind

Subscribe to LLM