Image

Large Language Model

By arjin Writer on Tag: Apple, Research, Artificial Intelligence, LLM
Apple

แอปเปิลเผยแพร่งานวิจัยสองฉบับผ่าน arXiv ซึ่งเป็นงานวิจัยเกี่ยวกับเทคนิคการประมวลผล AI ที่อาจถูกนำมาใช้งานกับผลิตภัณฑ์ของแอปเปิลได้ในอนาคต

By tontan Contributor on Tag: SCB10X, SCB, LLM, Thailand, Mistral
SCB10X

SCB 10X เปิดตัว Typhoon-7b เป็นโมเดลสร้างข้อความ หรือ LLM ภาษาไทยที่เอาชนะโมเดลทุกตัวในภาษาไทยตอนนี้ และมีประสิทธิภาพเทียบเท่ากับ GPT-3.5 ในภาษาไทย

การวัดผลประสิทธิภาพของโมเดลในภาษาไทย ทาง SCB 10X ได้พัฒนาชุดทดสอบวัดผลประสิทธิภาพโมเดล LLM ภาษาไทยชื่อ ThaiExam โดยวัดด้วยข้อสอบสำหรับเด็กมัธยมศึกษาตอนปลายและข้อมูลด้านการลงทุนจากผู้เชี่ยวชาญด้านการลงทุนในประเทศไทย พบว่าประสิทธิภาพโมเดล Typhoon-7b เหนือกว่าทุกโมเดลที่ปล่อยฟรีในภาษาไทยและมีคะแนนเทียบเท่ากับ GPT-3.5

By lew Founder on Tag: OpenAI, ByteDance, LLM
OpenAI

OpenAI แบนบัญชีของบริษัท ByteDance หลังมีรายงานว่าทาง ByteDance เอาเอาท์พุตของ OpenAI ไปฝึกปัญญาประดิษฐ์ของตัวเอง

เหตุการณ์ครั้งนี้รายงานโดย Alex Heath จาก The Verge ชี้ว่า ByteDance ฝึก LLM ของตัวเองที่ชื่อ Project Seed ด้วยเอาท์พุตของ OpenAI แม้ภายหลังจะเลิกใช้เอาท์พุตไปฝึกโมเดลโดยตรง แต่ก็ยังใช้สำหรับการวัดคุณภาพของโมเดลตัวเองอยู่

ทาง OpenAI ออกมายืนยันว่าได้แบนบัญชีของ ByteDance ไว้ชั่วคราวระหว่างสอบสวน แต่ที่จริงแล้ว ByteDance เรียก API ของ OpenAI ผ่านทาง Microsoft Azure และยังไม่แน่ชัดว่าไมโครซอฟท์แบนบัญชีของ ByteDance ไปหรือยัง

By lew Founder on Tag: Mozilla, LLM, Artificial Intelligence
Mozilla

Mozilla Innovation Project เปิดโครงการ llamafile โครงการแพ็กโมเดลปัญญาประดิษฐ์สำเร็จรูป ทำให้รันโมเดลต่างๆ ได้โดยง่าย เป็นไฟล์ไบนารีไฟล์เดียวก็รันได้เลย

ก่อนหน้านี้มีโครงการจำนวนมากที่พยายามนำโมเดล LLM มารันบนเดสก์ทอปอยู่แล้ว เช่น โครงการ llama.cpp แต่ก็ยังต้องอาศัยการคอนฟิกพอสมควร llamafile ทำให้การใช้งานสะดวกขึ้นอีกขั้น โดยอาศัยโครงการ Cosmopolitan Libc มาแพ็กไฟล์ต่างๆ เข้าด้วยกันให้รันได้ทุกที่

ตอนนี้มีโมเดลที่รองรับแล้ว ได้แก่ LLaVA 1.5, Mistral 7B, Mixtral 8x7B, และ WizardCoder-Python 13B

By arjin Writer on Tag: DeepMind, Artificial Intelligence, LLM, Mathematics
DeepMind

Google DeepMind เผยแพร่งานวิจัยในวารสาร Nature ถึงขั้นตอนการค้นหาวิธีแก้ปัญหาด้านคณิตศาสตร์และวิทยาการคอมพิวเตอร์แบบใหม่ เรียกชื่อว่า FunSearch ซึ่งมาจากคำว่า Function+Search มีจุดเด่นคือพื้นฐานทำงานเป็น AI แบบ LLM ที่ถูกเทรนมาก่อน แล้วหาวิธีแก้ปัญหาร่วมกับโค้ดคอมพิวเตอร์ ที่ทำหน้าที่ตรวจสอบความถูกต้องอีกหนึ่งชั้น เพื่อป้องกันการให้คำตอบที่ผิด

ผลลัพธ์ที่ได้คือฟังก์ชัน ในรูปแบบโค้ดคอมพิวเตอร์ แต่มาพร้อมกับวิธีคิดรูปแบบใหม่ ๆ จากกระบวนการของ LLM

By lew Founder on Tag: Europe, Artificial Intelligence, Law, LLM
Europe

สหภาพยุโรปเตรียมออกกฎหมายควบคุมปัญญาประดิษฐ์หลังรัฐสภายุโรป (European Parliament) บรรลุข้อตกลงกับคณะมนตรียุโรป (European Council) ว่าจะผ่านกฎหมายควบคุมปัญญาประดิษฐ์ โดยกฎหมายนี้ควบคุมการใช้งานตามระดับความเสี่ยง โดยแบ่งเป็น 3 ระดับ ได้แก่

By arjin Writer on Tag: Mozilla, Artificial Intelligence, LLM
Mozilla

Mozilla เปิดตัวโครงการใหม่เป็นเครื่องมือสำหรับสร้างเว็บไซต์ด้วย AI มีชื่อว่า Solo เน้นเจาะกลุ่มฟรีแลนซ์ และผู้ประกอบการธุรกิจแบบคนเดียวที่เรียกว่า Solopreneur ทำให้ลดเวลาและขั้นตอนการทำงานได้หลายอย่าง หากต้องการมีเว็บไซต์ธุรกิจ-บริการของตนเอง

Mozilla บอกว่าที่ต้องใช้ AI เพราะแม้ขั้นตอนการสร้างเว็บไซต์ตอนนี้จะง่ายขึ้น มีเทมเพลต มีเครื่องมือคัดรูปภาพ ช่วยเขียนเนื้อหา แต่ทั้งหมดก็ต้องใช้เวลาและไม่ได้ง่ายสำหรับทุกคน Mozilla ยังอ้างผลสำรวจพบว่า Solopreneur ส่วนใหญ่ต้องมีพาร์ตเนอร์ที่เก่งด้านเทคโนโลยีมาคอยช่วยจัดการงานด้านนี้เพิ่ม

By lew Founder on Tag: Gemini, LLM, Google
Gemini

กูเกิลเปิดให้นักพัฒนาใช้งานโมเดลปัญญาประดิษฐ์ Gemini Pro รุ่นกลางที่ใช้งานใน Bard ตั้งแต่สัปดาห์ที่แล้ว โดยนักพัฒนาสามารถใช้งานได้ฟรีทุกคนในช่วงทดสอบ จำกัดเพียงแค่ห้ามคิวรีเกิน 60 ครั้งต่อนาทีเท่านั้น

โมเดลที่ปล่อยให้ใช้งาน มีทั้ง Gemini Pro ตัวปกติรองรับเฉพาะข้อความ รองรับ context ขนาด 32K และ Gemini Pro Vision ใส่ภาพประกอบได้ด้วย ความพิเศษของ Gemini Pro ที่ปล่อยให้ใช้งานผ่าน API คือมันรองรับภาษาอื่นๆ นอกจากภาษาอังกฤษ รวมทั้งหมด 38 ภาษา

By mk Founder on Tag: Microsoft, LLM, Artificial Intelligence, Phi
Microsoft

ไมโครซอฟท์ปล่อยโมเดลภาษาขนาดเล็ก (small language model หรือ SLM) ชื่อ Phi-2 ขนาด 2.7 พันล้านพารามิเตอร์ ให้ลูกค้าใช้งานบน Azure AI Studio

Phi-2 เป็นผลงานพัฒนาของทีม Machine Learning Foundations ภายใต้ Microsoft Research ตัวมันเองเป็นโมเดลแบบ Transformer เทรนบนข้อมูลขนาด 1.4T token บนเครื่อง NVIDIA A100 GPU จำนวน 96 ตัว ใช้เวลาเทรน 14 วัน ถือเป็นโมเดลที่สร้างโดยคนของไมโครซอฟท์เอง ไม่ต้องพึ่งพาฝั่ง OpenAI

By lew Founder on Tag: Mistral, LLM
Mistral

Mistral AI บริษัทปัญญาประดิษฐ์จากฝรั่งเศสเปิดตัวโมเดลรุ่นใหม่ในชื่อ Mixtral 8x7B เป็นโมเดลที่อาศัยสถาปัตยกรรม mixture-of-experts (MoE) ผสมเอาท์พุตระหว่างโมเดลย่อยๆ ภายใน

ขนาดโมเดลรวม 46.7 พันล้านพารามิเตอร์ แต่ระหว่างรันจริง โมเดลจะเรียกใช้โมเดลที่เหมาะสมเพียง 2 ตัวจาก 8 ตัว จากนั้นจะเลือกเอาท์พุตแต่ละโทเค็นจากสอง 2 ตัวนั้นมาใช้งาน ทำให้เวลารันจริงจะใช้พลังประมวลผลเครื่องเท่ากับโมเดลขนาด 12.9 พันล้านพารามิเตอร์เท่านั้น

By mk Founder on Tag: Gemini, Google, DeepMind, LLM, Artificial Intelligence
Gemini

Jeff Dean หัวหน้านักวิทยาศาสตร์ของกูเกิล และหัวหน้าทีม (ร่วม) ของ Gemini โพสต์อธิบายที่มาของชื่อ Gemini ว่ามาจากคำว่า "ฝาแฝด" ในภาษาละติน

เหตุผลที่กูเกิลเลือกใช้ชื่อนี้เป็นเพราะต้องการสะท้อนผลงานของ Google DeepMind ที่เกิดจากการรวมทีม Google Brain และ DeepMind เข้าด้วยกัน ก่อนหน้านี้กูเกิลมีทีม AI หลักสองทีม ต่างคนต่างทำโมเดล LLM แยกจากกัน คือ Google Brain (PaLM/PaLM2) และ DeepMind (โมเดลชื่อ Chinchilla) แต่ภายหลังกูเกิลตัดสินใจจับมารวมกัน พัฒนาโมเดลร่วมกัน และช่วยให้ดึงทรัพยากรส่วนอื่นของกูเกิลมาช่วยงานได้อีกมาก

By mk Founder on Tag: NotebookLM, Google, Gemini, Artificial Intelligence, LLM
NotebookLM

กูเกิลเปิดบริการ NotebookLM แอพจดโน้ตพลัง AI สำหรับผู้ใช้ทั่วไป แต่ยังจำกัดประเทศเฉพาะในสหรัฐอเมริกาเท่านั้น

NotebookLM หรือชื่อเดิม Project Tailwind เป็นโครงการทดลอง (experimental) ที่กูเกิลโชว์ครั้งแรกในงาน Google I/O 2023 มันเป็นแอพจดโน้ตที่ใช้โมเดลภาษาขนาดใหญ่ (LLM) มาช่วยสรุปเนื้อหาจากเอกสาร (เช่น PDF) ที่เราอัพโหลดขึ้นไป เมื่อ LLM เรียนรู้จากเอกสารก็จะกลายเป็นผู้เชี่ยวชาญในเรื่องนั้น ที่สามารถตอบคำถามหรือร่างเนื้อหาจากเอกสารให้เราได้

By lew Founder on Tag: Claude, Anthropic, LLM
Claude

Anthropic ผู้พัฒนา Claude ปัญญาประดิษฐ์สำคัญที่ชูจุดแข็งว่าสามารถรับอินพุตขนาดใหญ่ รายงานถึงผลการทดสอบการถามตอบเอกสารขนาดใหญ่ว่ามักได้ผลไม่ค่อยดีนัก โดยเฉพาะในกรณีที่ข้อความที่ใช้ตอบคำถามนั้นล้อมด้วยเรื่องที่ไม่เกี่ยวข้องกันนัก

By arjin Writer on Tag: Gemini, Google, LLM, Artificial Intelligence
Gemini

กูเกิลเปิดตัวปัญญาประดิษฐ์ LLM ตัวใหม่ Gemini 1.0 อย่างเป็นทางการเมื่อวันก่อน ที่กูเกิลบอกว่าผลทดสอบความสามารถสูงเหนือกว่าคู่แข่ง และออกคลิปวิดิโอนำเสนอความสามารถ Gemini ในหลากหลายด้านออกมาด้วย

มีคลิปวิดีโอหนึ่งที่ดูจะเป็นประเด็นมากกว่าตัวอื่น มีชื่อว่า Hands-on with Gemini: Interacting with multimodal AI โดยวิดีโอนี้สาธิตการโต้ตอบของ Gemini ผ่านการให้ข้อมูลในรูปแบบต่าง ๆ เพื่อแสดงว่า Gemini เป็นโมเดล AI ที่ทำงานกับข้อมูลแบบผสมผสาน (multimodal) ได้อย่างดี

By arjin Writer on Tag: Meta, Artificial Intelligence, LLM, Reels, Facebook, Facebook Messenger
Meta

ถึงแม้กระแสเปิดตัวของใหม่ AI วันนี้จะอยู่ที่ Gemini ของกูเกิล แต่ Meta ก็ประกาศของใหม่เกี่ยวกับ AI ด้วยเช่นกันนั่นคือ Imagine with Meta AI เครื่องสำหรับสร้างรูปภาพด้วย prompt ที่แยกออกมาใช้งานโดยเฉพาะ ไม่ได้ไปรวมกับบริการตัวอื่น ซึ่งเหมือนกับ DALL-E, Midjourney หรือ Stable Diffusion ทำงานบนโมเดล Emu ที่ใช้สร้างรูปภาพ

Imagine with Meta AI ยังเปิดให้ใช้งานแบบจำกัดเฉพาะผู้ใช้ในอเมริกาเท่านั้นผ่าน imagine.meta.com

By lew Founder on Tag: Bard, Gemini, Google, LLM
Bard

กูเกิลประกาศเปลี่ยนเอนจินด้านหลัง Bard ไปใช้ Gemini Pro ที่เปิดตัวมาวันนี้ ทำให้ความสามารถน่าจะดีขึ้นมากจากเดิมที่ใช้ PaLM-2

Gemini Pro ที่ใช้ใน Bard จะเป็นรุ่นปรับปรุงมาเป็นพิเศษ เป็นความสามารถที่คนใช้งานในแชตบ่อยๆ เช่น การทำความเข้าใจข้อความ, สรุปบทความ, การให้เหตุผล, เขียนโปรแกรม, และการวางแผนต่างๆ โดยหลังจากปรับจูนโมเดลมาแล้วกูเกิลได้ขอให้ผู้ทดสอบภายนอกมาเทียบกับบริการแชตอื่นๆ ก็พบว่า Bard รุ่นใหม่นี้เป็นบริการฟรีที่ดีที่สุด

By lew Founder on Tag: Gemini, Google, LLM, Artificial Intelligence
Gemini

กูเกิลเปิดตัว Gemini 1.0 ปัญญาประดิษฐ์แบบ LLM ที่เคยเปิดตัวไว้ตั้งแต่งาน Google I/O ที่ผ่านมา โดยระบุว่าผลการทดสอบคะแนนต่างๆ นั้น Gemini ชนะ GPT-4 แทบทุกการทดสอบ

Gemini เป็นโมเดลปัญญาประดิษฐ์แบบ multimodal ตั้งแต่แรก โดยรองรับข้อมูลทั้ง ข้อความปกติ, โค้ด, เสียง, ภาพ, และวิดีโอ ในเวอร์ชั่น 1.0 กูเกิลระบุว่ามี 3 ขนาด ได้แก่ Gemini Ultra ขนาดใหญ่ที่สุด รองรับงานซับซ้อนสูง, Gemini Pro ขนาดรองลงมาโดยยังทำงานได้หลากหลาย, Gemini Nano โมเดลประสิทธิภาพสูงสำหรับรันบนโทรศัพท์มือถือ

By lew Founder on Tag: Artificial Intelligence, LLM, Alan Turing
Artificial Intelligence

ทีมวิจัยจาก UC San Diego รายงานผลการทดสอบประสิทธิภาพของปัญญาประดิษฐ์ในการหลอกมนุษย์ว่าเป็นมนุษย์ หรือที่รู้จักกันในชื่อ Turing Test โดยผลเบื้องต้นพบว่า GPT-4 มีคะแนนใกล้คนที่สุด

By lew Founder on Tag: AWS, Claude, Anthropic, LLM
AWS

AWS ประกาศเพิ่มบริการ Claude 2.1 ของทาง Anthropic ที่เพิ่งเปิดตัวสัปดาห์ที่ผ่านมา เข้ามาให้บริการใน Amazon Bedrock นับว่าให้บริการตามผู้พัฒนาโมเดลหลักได้ค่อนข้างเร็ว

Claude 2.1 เพิ่มฟีเจอร์สำคัญคือรองรับข้อมูลขนาดใหญ่มากจำนวน 200,000 โทเค็น หรือคิดเป็นเอกสาร 500 หน้ากระดาษ, ลดอัตราการหลอนลงครึ่งหนึ่ง, และรองรับ system prompt บอก AI ว่าให้ทำตัวอย่างไร

By mk Founder on Tag: Google, Artificial Intelligence, LLM, Rumors, Gemini
Google

เว็บไซต์ The Information รายงานข่าวลือว่า Gemini โมเดลปัญญาประดิษฐ์ตัวใหม่ของกูเกิล อาจต้องเลื่อนการเปิดตัวออกไป จากเดิมที่มีแผนเปิดตัวสัปดาห์หน้า กลายเป็นเดือนมกราคม 2024

Gemini เป็นปัญญาประดิษฐ์ที่กูเกิลหวังใช้ต่อกรกับ GPT ของ OpenAI โดยต้องใช้พลัง Google + DeepMind ทำงานร่วมกัน และมีข่าวว่า Sergey Brin กลับมาช่วยโปรเจคนี้ด้วยตัวเอง

Subscribe to LLM