Image

Large Language Model

By Fzo Contributor on Tag: DeepSeek, LLM, Gemini, Artificial Intelligence, China
DeepSeek

DeepSeek ผู้พัฒนา AI จากจีน ที่เพิ่งอัปเดตโมเดล R1-0528 ซึ่งเน้นความสามารถด้านการให้เหตุผล (reasoning) ถูกตั้งข้อสังเกตว่า อาจได้ใช้ข้อมูลที่มาจากผลลัพธ์ของโมเดล Google Gemini มาใช้ในการเทรนโมเดลดังกล่าว

By lew Founder on Tag: Windows, Copilot+ PC, Microsoft, LLM
Windows

ในงาน Microsoft BUILD ที่ผ่านมาไมโครซอฟท์ได้ประกาศถึงซอฟต์แวร์และบริการที่เกี่ยวกับปัญญาประดิษฐ์จำนวนมาก แต่ฟีเจอร์หนึ่งที่ประกาศออกมา คือ Windows AI Foundry ที่ปรับปรุงจากไลบรารีเดิม และเพิ่มความสามารถสำคัญคือการรันโมเดลปัญญาประดิษฐ์แบบ large language model ได้ในตัว ในงานครั้งนี้ Steven Bathiche ที่เป็น Microsoft Technical Fellow ก็ให้สัมภาษณ์ถึงแนวทางการพัฒนาวินโดวส์ด้วยเทคโนโลยีตัวนี้ว่ามันจะเป็นอินเทอร์เฟซของการทำงานร่วมกับคอมพิวเตอร์ในยุคต่อไป

By mk Founder on Tag: Google, Mobile App, Artificial Intelligence, LLM
Google

กูเกิลออกแอพใหม่แนวทดลองชื่อ Google AI Edge Gallery เอาไว้รันโมเดลในอุปกรณ์มือถือ

ในแง่ฟีเจอร์ของ Google AI Edge Gallery ไม่ต่างอะไรจากบริการ AI ทั่วไป เช่น แชทคุย ถามตอบ อัพโหลดภาพแล้วให้ AI อ่านข้อมูลในภาพ ความแตกต่างสำคัญคือบริการ AI จะรันอยู่ในเครื่องมือถือของเรา (ตอนนี้รองรับเฉพาะ Android) ผ่านเฟรมเวิร์ค LiteRT หรือชื่อเดิม TensorFlow Lite โดยเลือกโมเดลได้เองจาก Hugging Face เช่น Gemma 3n ที่ปรับแต่งให้รันบนโทรศัพท์ได้ สามารถคอนฟิกโมเดลก่อนรันงานได้

By arjin Writer on Tag: Character.AI, Artificial Intelligence, LLM
Character.AI

Character.AI ประกาศขยายความสามารถในการสร้างสรรค์ผลงานในรูปแบบต่าง ๆ โดยฟีเจอร์ก่อนหน้านี้ที่เปิดตัวคือ AvatarFX ซึ่งเป็น AI สร้างวิดีโอสั้นตามคาแรกเตอร์ที่กำหนด ก็รวมอยู่ในประกาศครั้งนี้ด้วย

ของใหม่ที่ประกาศได้แก่

By P.J Writer on Tag: Gartner, Artificial Intelligence, LLM

Gartner คาดว่าภายในปี 2027 องค์กรจะใช้โมเดล AI ขนาดเล็กเฉพาะงานมากกว่าโมเดลภาษาขนาดใหญ่ (LLMs) 3 เท่า เนื่องจากทำงานเฉพาะทางแม่นยำกว่า ประมวลเร็วกว่า และใช้ทรัพยากรน้อยลง

ถึงแม้ LLMs จะมีความสามารถด้านภาษา แต่กลับมีความแม่นย่ำน้อยลงเมื่อต้องทำงานเฉพาะด้าน ขณะที่โมเดลขนาดเล็กสามารถปรับแต่งให้ตรงกับข้อมูลและบริบทของผู้ใช้ ซึ่งช่วยประหยัดเวลา ทรัพยากร และต้นทุนในการประมวลผลและดูแลรักษา

ที่มา: ข่าวประชาสัมพันธ์

By mk Founder on Tag: Gemma, Medical, Health, LLM, DeepMind
Gemma

Google DeepMind เปิดตัว MedGemma โมเดล Gemma 3 เวอร์ชันที่ถูกเทรนเพื่อข้อมูลทางการแพทย์

MedGemma แบ่งออกเป็น 2 เวอร์ชันได้แก่

By lew Founder on Tag: Artificial Intelligence, LLM, Employment, Economics
Artificial Intelligence

Daron Acemoglu นักเศรษฐศาสตร์จาก MIT ผู้ได้รับรางวัลโนเบลเมื่อปี 2024 ที่ผ่านมา ให้สัมภาษณ์กับทาง MIT เองถึงการทำนายของเขาที่ระบุว่าปัญญาประดิษฐ์ที่กำลังเป็นกระแสตอนนี้จะไม่ได้กระทบเศรษฐกิจขนาดนั้น โดยเขาทำนายว่าปํญญาประดิษฐ์จะสามารถทำให้งานกลายเป็นระบบอัตโนมัติได้เพียง 5% และตัวเทคโนโลยีปัญญาประดิษฐ์จะเพิ่ม GDP ของโลกได้เพียง 1% ภายในสิบปีข้างหน้า

By lew Founder on Tag: Anthropic, LLM, Employment
Anthropic

Dario Amodei ซีอีโอ Anthropic ผู้สร้างโมเดลปัญญาประดิษฐ์ Claude ให้สัมภาษณ์กับ Axios ทำนายว่าภายใน 5 ปีข้างหน้าปัญญาประดิษฐ์จะทดแทนงานออฟฟิศระดับต้น (entry-level white collar) ถึงครึ่งหนึ่ง ทำให้อัตราการว่างงานพุ่งสูงไปถึงระดับ 10-20%

เขาทำนายว่าแรงงานจะกระทบไปทุกภาคส่วน ตั้งแต่สายเทคโนโลยี, การเงิน, กฎหมาย, และงานออฟฟิศอื่นๆ โดยตำแหน่งงานระดับเริ่มต้นได้รับผลกระทบสูงสุด พร้อมกับแสดงความกังวลว่ารัฐบาลยังไม่รู้ตัวว่าจะเกิดอะไรขึ้น ขณะที่คนจำนวนมากก็ยังไม่เชื่อว่า [ปัญญาประดิษฐ์จะมาแทนคน]

By mk Founder on Tag: Llama, Meta, Artificial Intelligence, Mistral, LLM
Llama

Business Insider รายงานว่าทีม Llama ของ Meta เริ่มทยอยลาออกจากบริษัท โดยผู้ร่วมเขียน เปเปอร์ Llama ฉบับแรกสุดในปี 2023 (เปเปอร์) จำนวน 14 คน ตอนนี้เหลือเพียง 3 คนที่ยังอยู่กับ Meta

By lew Founder on Tag: LLM, Security, GitLab
LLM

ทีมวิจัยจาก Legit Security รายงานถึงรูปแบบการโจมตีโครงการซอฟต์แวร์ที่ใช้ปัญญาประดิษฐ์เขียนโค้ดช่วยแก้รายงานปัญหา (issue) ต่างๆ ด้วยการแทรกข้อความที่มองไม่เห็นไว้ในรายงานปัญหา ทำให้ปัญญาประดิษฐ์ทำตามคำสั่ง

ทีมวิจัยทดสอบกับ GitLab Duo ปัญญาประดิษฐ์ช่วยเขียนโค้ดของ GitLab โดยแอบแทรกคำสั่งสร้างโค้ดมุ่งร้ายตามจุดต่างๆ เช่น คอมเมนต์ในโค้ดที่ส่ง merge request เข้ามา, ข้อความ commit message, ข้อความใน issue เอง หรือแม้แต่คอมเมนต์, และตัวซอร์สโค้ดเอง พบว่า Duo ทำตามคำสั่งหมด

By lew Founder on Tag: Claude, Anthropic, LLM
Claude

Anthropic เปิดรายงานความปลอดภัยของ Claude 4 Opus ที่แม้จะมีความปลอดภัยระดับ AI Safety Level 3 (ASL-3) แต่ในบางกรณีเมื่อเงื่อนไขบีบเค้นก็สามารถทำให้แสดงพฤติกรรมไม่พึงประสงค์ออกมาได้

ทีมงานทดสอบโดยการวางเป้าหมายให้ Cluade 4 ว่าต้องพยายามรักษาชีวิตรอด และบีบเค้นทางเลือกเอาตัวรอดของ Claude 4 จำกัดลงเรื่อยๆ ก็พบพฤติกรรมไม่พึงประสงค์หลายกรณี เช่น

By mk Founder on Tag: Microsoft Copilot, LLM, Enterprise, Microsoft
Microsoft Copilot

เก็บตกประกาศจากงาน Microsoft Build 2025 ไมโครซอฟท์เปิดตัว Microsoft 365 Copilot Tuning บริการปรับแต่ง (fine-tuning) โมเดลสำหรับลูกค้าองค์กร

Microsoft 365 Copilot Tuning ออกแบบมาเพื่อแก้ปัญหากระบวนการทำ fine-tuning หรือปรับแต่งโมเดลให้เหมาะกับความต้องการขององค์กร ที่มักซับซ้อนและต้องใช้ความเชี่ยวชาญเฉพาะด้านสูง ไมโครซอฟท์จึงสร้างเครื่องมือเพื่อให้กระบวนการเหล่านี้ง่ายขึ้น ลดงานเขียนโค้ดและงาน data science ลง เปิดให้คนทั่วไปสามารถปรับแต่งโมเดลให้เหมาะกับงานของตัวเองได้มากขึ้น

By mk Founder on Tag: Claude, Anthropic, LLM, Artificial Intelligence
Claude

ข่าวเด่นวงการ AI วันนี้คือ การเปิดตัวโมเดล Claude 4 ของ Anthropic แต่ความสามารถที่สูงขึ้น ก็มาพร้อมกับความรับผิดชอบที่เพิ่มขึ้นด้วย

Anthropic ประกาศว่า Claude 4 Opus ซึ่งเป็นโมเดลรุ่นท็อปสุด จะมีมาตรการป้องกันโมเดลระดับสูงขึ้นด้วยคือ AI Safety Level 3 (ASL-3)

ASL-3 เป็นมาตรการความปลอดภัยระดับ 3 ตามการแบ่งสเกล Responsible Scaling Policy ที่ Anthropic กำหนดขึ้นเอง ซึ่งมีทั้งหมด 5 ระดับ

By lew Founder on Tag: Anthropic, Claude, LLM
Anthropic

Anthropic ออกโมเดล Claude 4 โดยชูจุดเด่นเป็นปัญญาประดิษฐ์เขียนโค้ดที่ดีที่สุดในโลก สามารถทำคะแนนทดสอบ SWE-Bench Verified ได้ถึง 72.5% และยังทำงานได้แม้จะเป็นการทำงานแบบ agent ที่ต้องทำงานต่อเนื่องหลายพันขั้นตอน กินเวลายาวหลายชั่วโมง

ผลทดสอบที่ Anthropic นำมาโชว์แสดงแนวทางการใช้งานชัดเจน เช่น การเขียนโค้ด หรือการเรียกเครื่องมือในการให้บริการธุรกิจ

By lew Founder on Tag: GitHub Copilot, LLM, Programming, Open Source, Microsoft, .NET
GitHub Copilot

หลังจากไมโครซอฟท์เปิดบริการ Coding Agent ที่สามารถดึงโค้ดไปทดสอบ, แก้ไข แล้วส่งโค้ดกลับมายังโครงการเป็น pull request ทีเดียว ตอนนี้โครงการต่างๆ ของไมโครซอฟท์ก็เริ่มเห็น Coding Agent ส่งแพตช์เข้ามาจำนวนมาก

เนื่องจาก .NET พัฒนาอย่างเปิดเผย เราจึงได้เห็นโปรแกรมเมอร์ของไมโครซอฟท์นั่งคุยกับ Copilot ให้แก้ปัญหาของโค้ดที่ส่งมา

By lew Founder on Tag: Gemma, Gemini, Google, LLM
Gemma

กูเกิลเปิดตัวโมเดลปัญญาประดิษฐ์ Gemma 3n ที่ใช้เทคนิคต่างๆ ในการย่อขนาดโมเดลจนเล็กลงเพียงพอที่จะรันในโทรศัพท์หรือแทบเล็ตได้ โดยยังมีความฉลาดสูง

เทคนิคย่อโมเดลสำคัญคือที่สุดคือ Per-Layer Embeddings (PLE) ที่แยกข้อมูลออกไปเก็บไว้ในสตอเรจ แล้วค่อยนำข้อมูลกลับมาใช้เมื่อรันแต่ละส่วน ทำให้โดยรวมสามารถรันโมเดลโดยใช้แรมไม่ถึงครึ่งของโมเดลเต็มๆ

By lew Founder on Tag: Gemini, DeepMind, Google, LLM
Gemini

DeepMind เปิดตัว Gemini Diffustion โมเดลปัญญาประดิษฐ์ภาษารุ่นพิเศษที่ใช้เทคนิคการสร้างคำตอบต่างจากเดิมที่เป็นการตอบทีละโทเค็น กลายเป็นการสร้างคำตอบออกมาทั้งหมดแม้จะผิดบ้าง แล้วค่อยๆ ปรับให้ตรงขึ้นเรื่อยๆ แบบเดียวกับปัญญาประดิษฐ์สร้างภาพที่มักสร้างจากภาพเบลอๆ แล้วค่อยๆ ชัดขึ้นเรื่อยๆ

จุดเด่นสำคัญของเทคนิคนี้ คือความเร็วในการตอบสูงมาก ตอนนี้ทำได้ 1,479 โทเค็นต่อวินาที ตัวโมเดลมีขนาดเล็ก แม้ว่าทาง DeepMind ไม่ได้เปิดเผยว่าโมเดลจริงๆ มีขนาดเท่าไหร่

By mk Founder on Tag: Gemini, Google, LLM
Gemini

กูเกิลเปิดเผยตัวเลขการใช้งาน Gemini และโมเดล AI ในงาน Google I/O 2025 ดังนี้

  • Gemini มีผู้ใช้ต่อเดือน (MAU) 400 ล้านคน เพิ่มขึ้นจาก ตัวเลขก่อนหน้านี้ 350 ล้านคน กูเกิลบอกว่าการใช้งานเติบโตขึ้นเรื่อยๆ หลังการออกโมเดลตระกูล Gemini 2.5 ถ้านับเฉพาะผู้ใช้โมเดล 2.5 Pro มีอัตราการใช้งานเพิ่มขึ้น 45%
  • จำนวน token ที่ใช้ประมวลผล AI อยู่ที่ 480 ล้านล้าน token ต่อเดือน เติบโตขึ้น 50 เท่าจากปีที่แล้ว ที่ช่วงเวลาเดียวกันประมวลผล 9.7 ล้านล้าน token
  • จำนวนนักพัฒนา Gemini 7 ล้านคน เพิ่มขึ้น 5 เท่าจากปีที่แล้ว, ปริมาณการใช้งาน Gemini บน Vertex AI เพิ่มขึ้น 40 เท่า
By lew Founder on Tag: Gemini, Google, LLM
Gemini

กูเกิลประกาศอัพเดต Gemini 2.5 Flash เป็นเวอร์ชั่น 05-20 ที่ทำคะแนนทดสอบได้ดีขึ้นหลายชุดทดสอบ (แต่ก็มีแย่ลงบางชุดทดสอบด้วย) ความเปลี่ยนแปลงสำคัญคือปริมาณโทเค็นที่ใช้คิดก่อนตอบนั้นลดลง 20-30%

ส่วนที่ปรับปรุงขึ้นมาชัดเจนคือการทดสอบเป็นผู้ช่วยเขียนโค้ด Aider Polygot ที่ขึ้นมาแซง DeepSeek-R1 ได้แล้ว แม้ยังตาม OpenAI o4-mini และ Claude 3.7 ก็ตาม แต่ราคาของ Gemini 2.5 Flash ก็ถูกกว่าหลายเท่าตัว

ก่อนหน้านี้ Gemini 2.5 เป็นรุ่นพรีวิวที่ API ยังไม่นิ่ง รอบนี้แม้จะยังเป็นพรีวิวอยู่แต่กูเกิลสัญญาว่าจะออกเวอร์ชั่นเสถียรภายในต้นเดือนมิถุนายนนี้ ทำให้พร้อมใช้งานแบบโปรดักชั่นแล้ว

By lew Founder on Tag: Gemini, Google, LLM
Gemini

กูเกิลเปิดตัวโหมด Deep Think ของโมเดล Gemini 2.5 Pro เป็นการบอกให้โมเดลคิดหลายๆ ทางก่อนที่จะตอบคำถามออกมา ทำให้คำตอบดีขึ้นกว่าเดิม

ทีมงานทดสอบ Deep Think ด้วยชุดทดสอบ USAMO 2025, LoveCodeBench v6, และ MMMU ผลทดสอบเอาชนะคู่แข่งอย่าง OpenAI o3 ตัวเต็ม หรือ o4-mini ไปได้ โดยเฉพาะชุดทดสอบ USAMO นั้นคะแนนนำห่าง

ฟีเจอร์ Deep Think จะเปิดให้กับผู้ทดสอบที่ได้รับเชิญเท่านั้นในช่วงแรก หากผ่านเงื่อนไขความปลอดภัยแล้วจึงจะเปิดให้ใช้งานวงกว้างภายหลัง

ที่มา - @GoogleDeepMind

Subscribe to LLM