LLM | Blognone

Large Language Model

Apple เผยแพร่งานวิจัย การรัน LLM บนอุปกรณ์ที่มีทรัพยากรจำกัด

By arjin

on 24 December 2023 - 13:12 Tag: Apple, Research, Artificial Intelligence, LLM

Apple

แอปเปิลเผยแพร่งานวิจัยสองฉบับผ่าน arXiv ซึ่งเป็นงานวิจัยเกี่ยวกับเทคนิคการประมวลผล AI ที่อาจถูกนำมาใช้งานกับผลิตภัณฑ์ของแอปเปิลได้ในอนาคต

SCB 10X เปิดตัว Typhoon-7b ชนะ LLM ทุกตัวในภาษาไทย เทียบเท่า GPT-3.5

By tontan

on 23 December 2023 - 09:09 Tag: SCB10X, SCB, LLM, Thailand, Mistral

SCB10X

SCB 10X เปิดตัว Typhoon-7b เป็นโมเดลสร้างข้อความ หรือ LLM ภาษาไทยที่เอาชนะโมเดลทุกตัวในภาษาไทยตอนนี้ และมีประสิทธิภาพเทียบเท่ากับ GPT-3.5 ในภาษาไทย

การวัดผลประสิทธิภาพของโมเดลในภาษาไทย ทาง SCB 10X ได้พัฒนาชุดทดสอบวัดผลประสิทธิภาพโมเดล LLM ภาษาไทยชื่อ ThaiExam โดยวัดด้วยข้อสอบสำหรับเด็กมัธยมศึกษาตอนปลายและข้อมูลด้านการลงทุนจากผู้เชี่ยวชาญด้านการลงทุนในประเทศไทย พบว่าประสิทธิภาพโมเดล Typhoon-7b เหนือกว่าทุกโมเดลที่ปล่อยฟรีในภาษาไทยและมีคะแนนเทียบเท่ากับ GPT-3.5

OpenAI แบนบัญชีของ ByteDance หลังมีรายงาน ByteDance เอาเอาท์พุตไปฝึก AI ของตัวเอง

By lew

on 16 December 2023 - 21:17 Tag: OpenAI, ByteDance, LLM

OpenAI

OpenAI แบนบัญชีของบริษัท ByteDance หลังมีรายงานว่าทาง ByteDance เอาเอาท์พุตของ OpenAI ไปฝึกปัญญาประดิษฐ์ของตัวเอง

เหตุการณ์ครั้งนี้รายงานโดย Alex Heath จาก The Verge ชี้ว่า ByteDance ฝึก LLM ของตัวเองที่ชื่อ Project Seed ด้วยเอาท์พุตของ OpenAI แม้ภายหลังจะเลิกใช้เอาท์พุตไปฝึกโมเดลโดยตรง แต่ก็ยังใช้สำหรับการวัดคุณภาพของโมเดลตัวเองอยู่

ทาง OpenAI ออกมายืนยันว่าได้แบนบัญชีของ ByteDance ไว้ชั่วคราวระหว่างสอบสวน แต่ที่จริงแล้ว ByteDance เรียก API ของ OpenAI ผ่านทาง Microsoft Azure และยังไม่แน่ชัดว่าไมโครซอฟท์แบนบัญชีของ ByteDance ไปหรือยัง

Mozilla เปิดโครงการ llamafile, AI สำเร็จรูป รันไฟล์เดียวมี LLM ใช้งานในเครื่องเลย

By lew

on 16 December 2023 - 14:43 Tag: Mozilla, LLM, Artificial Intelligence

Mozilla

Mozilla Innovation Project เปิดโครงการ llamafile โครงการแพ็กโมเดลปัญญาประดิษฐ์สำเร็จรูป ทำให้รันโมเดลต่างๆ ได้โดยง่าย เป็นไฟล์ไบนารีไฟล์เดียวก็รันได้เลย

ก่อนหน้านี้มีโครงการจำนวนมากที่พยายามนำโมเดล LLM มารันบนเดสก์ทอปอยู่แล้ว เช่น โครงการ llama.cpp แต่ก็ยังต้องอาศัยการคอนฟิกพอสมควร llamafile ทำให้การใช้งานสะดวกขึ้นอีกขั้น โดยอาศัยโครงการ Cosmopolitan Libc มาแพ็กไฟล์ต่างๆ เข้าด้วยกันให้รันได้ทุกที่

ตอนนี้มีโมเดลที่รองรับแล้ว ได้แก่ LLaVA 1.5, Mistral 7B, Mixtral 8x7B, และ WizardCoder-Python 13B

DeepMind เผยแพร่งานวิจัยโมเดล AI LLM ใหม่ ที่คิดนอกกรอบแก้ไขปัญหาคณิตศาสตร์ซับซ้อนได้

By arjin

on 15 December 2023 - 21:45 Tag: DeepMind, Artificial Intelligence, LLM, Mathematics

DeepMind

Google DeepMind เผยแพร่งานวิจัยในวารสาร Nature ถึงขั้นตอนการค้นหาวิธีแก้ปัญหาด้านคณิตศาสตร์และวิทยาการคอมพิวเตอร์แบบใหม่ เรียกชื่อว่า FunSearch ซึ่งมาจากคำว่า Function+Search มีจุดเด่นคือพื้นฐานทำงานเป็น AI แบบ LLM ที่ถูกเทรนมาก่อน แล้วหาวิธีแก้ปัญหาร่วมกับโค้ดคอมพิวเตอร์ ที่ทำหน้าที่ตรวจสอบความถูกต้องอีกหนึ่งชั้น เพื่อป้องกันการให้คำตอบที่ผิด

ผลลัพธ์ที่ได้คือฟังก์ชัน ในรูปแบบโค้ดคอมพิวเตอร์ แต่มาพร้อมกับวิธีคิดรูปแบบใหม่ ๆ จากกระบวนการของ LLM

สหภาพยุโรปได้ข้อตกลงออกกฎหมายคุม AI จัดชั้นความเสี่ยง, บังคับแจ้งเตือนเมื่อผู้ใช้คุยกับ AI

By lew

on 14 December 2023 - 13:33 Tag: Europe, Artificial Intelligence, Law, LLM

Europe

สหภาพยุโรปเตรียมออกกฎหมายควบคุมปัญญาประดิษฐ์หลังรัฐสภายุโรป (European Parliament) บรรลุข้อตกลงกับคณะมนตรียุโรป (European Council) ว่าจะผ่านกฎหมายควบคุมปัญญาประดิษฐ์ โดยกฎหมายนี้ควบคุมการใช้งานตามระดับความเสี่ยง โดยแบ่งเป็น 3 ระดับ ได้แก่

Mozilla เปิดตัว "Solo" เครื่องมือสร้างเว็บไซต์ด้วย AI ตอบรับเทรนด์ผู้ประกอบการแบบ Solopreneur

By arjin

on 14 December 2023 - 11:13 Tag: Mozilla, Artificial Intelligence, LLM

Mozilla

Mozilla เปิดตัวโครงการใหม่เป็นเครื่องมือสำหรับสร้างเว็บไซต์ด้วย AI มีชื่อว่า Solo เน้นเจาะกลุ่มฟรีแลนซ์ และผู้ประกอบการธุรกิจแบบคนเดียวที่เรียกว่า Solopreneur ทำให้ลดเวลาและขั้นตอนการทำงานได้หลายอย่าง หากต้องการมีเว็บไซต์ธุรกิจ-บริการของตนเอง

Mozilla บอกว่าที่ต้องใช้ AI เพราะแม้ขั้นตอนการสร้างเว็บไซต์ตอนนี้จะง่ายขึ้น มีเทมเพลต มีเครื่องมือคัดรูปภาพ ช่วยเขียนเนื้อหา แต่ทั้งหมดก็ต้องใช้เวลาและไม่ได้ง่ายสำหรับทุกคน Mozilla ยังอ้างผลสำรวจพบว่า Solopreneur ส่วนใหญ่ต้องมีพาร์ตเนอร์ที่เก่งด้านเทคโนโลยีมาคอยช่วยจัดการงานด้านนี้เพิ่ม

รวยจริง กูเกิลเปิด Gemini Pro ให้นักพัฒนาใช้งานผ่าน API ฟรีในช่วงทดสอบ ใช้ภาษาไทยก็ได้ ใส่ภาพก็ได้

By lew

on 13 December 2023 - 23:39 Tag: Gemini, LLM, Google

Gemini

กูเกิลเปิดให้นักพัฒนาใช้งานโมเดลปัญญาประดิษฐ์ Gemini Pro รุ่นกลางที่ใช้งานใน Bard ตั้งแต่สัปดาห์ที่แล้ว โดยนักพัฒนาสามารถใช้งานได้ฟรีทุกคนในช่วงทดสอบ จำกัดเพียงแค่ห้ามคิวรีเกิน 60 ครั้งต่อนาทีเท่านั้น

โมเดลที่ปล่อยให้ใช้งาน มีทั้ง Gemini Pro ตัวปกติรองรับเฉพาะข้อความ รองรับ context ขนาด 32K และ Gemini Pro Vision ใส่ภาพประกอบได้ด้วย ความพิเศษของ Gemini Pro ที่ปล่อยให้ใช้งานผ่าน API คือมันรองรับภาษาอื่นๆ นอกจากภาษาอังกฤษ รวมทั้งหมด 38 ภาษา

ไมโครซอฟท์ออกโมเดลภาษาขนาดเล็ก Phi-2 คุยว่าชนะโมเดลขนาดใหญ่ Llama 2 70B

By mk

on 13 December 2023 - 14:01 Tag: Microsoft, LLM, Artificial Intelligence, Phi

Microsoft

ไมโครซอฟท์ปล่อยโมเดลภาษาขนาดเล็ก (small language model หรือ SLM) ชื่อ Phi-2 ขนาด 2.7 พันล้านพารามิเตอร์ ให้ลูกค้าใช้งานบน Azure AI Studio

Phi-2 เป็นผลงานพัฒนาของทีม Machine Learning Foundations ภายใต้ Microsoft Research ตัวมันเองเป็นโมเดลแบบ Transformer เทรนบนข้อมูลขนาด 1.4T token บนเครื่อง NVIDIA A100 GPU จำนวน 96 ตัว ใช้เวลาเทรน 14 วัน ถือเป็นโมเดลที่สร้างโดยคนของไมโครซอฟท์เอง ไม่ต้องพึ่งพาฝั่ง OpenAI

Mistral AI เปิดตัว Mixtral 8x7B โมเดล LLM โอเพนซอร์สแบบผสม ความสามารถใกล้เคียง GPT-3.5

By lew

on 12 December 2023 - 12:24 Tag: Mistral, LLM

Mistral

Mistral AI บริษัทปัญญาประดิษฐ์จากฝรั่งเศสเปิดตัวโมเดลรุ่นใหม่ในชื่อ Mixtral 8x7B เป็นโมเดลที่อาศัยสถาปัตยกรรม mixture-of-experts (MoE) ผสมเอาท์พุตระหว่างโมเดลย่อยๆ ภายใน

ขนาดโมเดลรวม 46.7 พันล้านพารามิเตอร์ แต่ระหว่างรันจริง โมเดลจะเรียกใช้โมเดลที่เหมาะสมเพียง 2 ตัวจาก 8 ตัว จากนั้นจะเลือกเอาท์พุตแต่ละโทเค็นจากสอง 2 ตัวนั้นมาใช้งาน ทำให้เวลารันจริงจะใช้พลังประมวลผลเครื่องเท่ากับโมเดลขนาด 12.9 พันล้านพารามิเตอร์เท่านั้น

หัวหน้าทีม Gemini บอกเลือกใช้ชื่อนี้เพื่อสะท้อนความร่วมมือ Google Brain และ DeepMind

By mk

on 10 December 2023 - 09:04 Tag: Gemini, Google, DeepMind, LLM, Artificial Intelligence

Gemini

Jeff Dean หัวหน้านักวิทยาศาสตร์ของกูเกิล และหัวหน้าทีม (ร่วม) ของ Gemini โพสต์อธิบายที่มาของชื่อ Gemini ว่ามาจากคำว่า "ฝาแฝด" ในภาษาละติน

เหตุผลที่กูเกิลเลือกใช้ชื่อนี้เป็นเพราะต้องการสะท้อนผลงานของ Google DeepMind ที่เกิดจากการรวมทีม Google Brain และ DeepMind เข้าด้วยกัน ก่อนหน้านี้กูเกิลมีทีม AI หลักสองทีม ต่างคนต่างทำโมเดล LLM แยกจากกัน คือ Google Brain (PaLM/PaLM2) และ DeepMind (โมเดลชื่อ Chinchilla) แต่ภายหลังกูเกิลตัดสินใจจับมารวมกัน พัฒนาโมเดลร่วมกัน และช่วยให้ดึงทรัพยากรส่วนอื่นของกูเกิลมาช่วยงานได้อีกมาก

กูเกิลเปิดบริการ NotebookLM แอพจดโน้ตพลัง AI แต่เฉพาะในสหรัฐ ใช้โมเดล Gemini Pro

By mk

on 10 December 2023 - 06:32 Tag: NotebookLM, Google, Gemini, Artificial Intelligence, LLM

NotebookLM

กูเกิลเปิดบริการ NotebookLM แอพจดโน้ตพลัง AI สำหรับผู้ใช้ทั่วไป แต่ยังจำกัดประเทศเฉพาะในสหรัฐอเมริกาเท่านั้น

NotebookLM หรือชื่อเดิม Project Tailwind เป็นโครงการทดลอง (experimental) ที่กูเกิลโชว์ครั้งแรกในงาน Google I/O 2023 มันเป็นแอพจดโน้ตที่ใช้โมเดลภาษาขนาดใหญ่ (LLM) มาช่วยสรุปเนื้อหาจากเอกสาร (เช่น PDF) ที่เราอัพโหลดขึ้นไป เมื่อ LLM เรียนรู้จากเอกสารก็จะกลายเป็นผู้เชี่ยวชาญในเรื่องนั้น ที่สามารถตอบคำถามหรือร่างเนื้อหาจากเอกสารให้เราได้

Anthropic แนะทางแก้ปัญหา Claude ไม่ยอมตอบคำถามจากเอกสารยาวๆ ต้องให้หาข้อความที่เกี่ยวข้องก่อน

By lew

on 9 December 2023 - 11:25 Tag: Claude, Anthropic, LLM

Claude

Anthropic ผู้พัฒนา Claude ปัญญาประดิษฐ์สำคัญที่ชูจุดแข็งว่าสามารถรับอินพุตขนาดใหญ่ รายงานถึงผลการทดสอบการถามตอบเอกสารขนาดใหญ่ว่ามักได้ผลไม่ค่อยดีนัก โดยเฉพาะในกรณีที่ข้อความที่ใช้ตอบคำถามนั้นล้อมด้วยเรื่องที่ไม่เกี่ยวข้องกันนัก

Google เผยแพร่วิดีโอความสามารถ Gemini โต้ตอบกับข้อมูลแบบผสมผสาน แต่ยอมรับใช้การตัดต่อช่วย

By arjin

on 8 December 2023 - 22:11 Tag: Gemini, Google, LLM, Artificial Intelligence

Gemini

กูเกิลเปิดตัวปัญญาประดิษฐ์ LLM ตัวใหม่ Gemini 1.0 อย่างเป็นทางการเมื่อวันก่อน ที่กูเกิลบอกว่าผลทดสอบความสามารถสูงเหนือกว่าคู่แข่ง และออกคลิปวิดิโอนำเสนอความสามารถ Gemini ในหลากหลายด้านออกมาด้วย

มีคลิปวิดีโอหนึ่งที่ดูจะเป็นประเด็นมากกว่าตัวอื่น มีชื่อว่า Hands-on with Gemini: Interacting with multimodal AI โดยวิดีโอนี้สาธิตการโต้ตอบของ Gemini ผ่านการให้ข้อมูลในรูปแบบต่าง ๆ เพื่อแสดงว่า Gemini เป็นโมเดล AI ที่ทำงานกับข้อมูลแบบผสมผสาน (multimodal) ได้อย่างดี

Meta เปิดตัว Imagine with Meta AI เครื่องมือสร้างรูปภาพจากข้อความด้วย AI ใช้ได้เฉพาะอเมริกาก่อน

By arjin

on 7 December 2023 - 11:32 Tag: Meta, Artificial Intelligence, LLM, Reels, Facebook, Facebook Messenger

Bard เปลี่ยนไปใช้ Gemini Pro ระบุชนะ GPT-3.5 แล้ว, ปีหน้าเปิด Bard Advanced ใช้ Gemini Ultra

By lew

on 6 December 2023 - 22:37 Tag: Bard, Gemini, Google, LLM

Bard

กูเกิลประกาศเปลี่ยนเอนจินด้านหลัง Bard ไปใช้ Gemini Pro ที่เปิดตัวมาวันนี้ ทำให้ความสามารถน่าจะดีขึ้นมากจากเดิมที่ใช้ PaLM-2

Gemini Pro ที่ใช้ใน Bard จะเป็นรุ่นปรับปรุงมาเป็นพิเศษ เป็นความสามารถที่คนใช้งานในแชตบ่อยๆ เช่น การทำความเข้าใจข้อความ, สรุปบทความ, การให้เหตุผล, เขียนโปรแกรม, และการวางแผนต่างๆ โดยหลังจากปรับจูนโมเดลมาแล้วกูเกิลได้ขอให้ผู้ทดสอบภายนอกมาเทียบกับบริการแชตอื่นๆ ก็พบว่า Bard รุ่นใหม่นี้เป็นบริการฟรีที่ดีที่สุด

กูเกิลเปิดตัว Gemini 1.0 รุ่นใหญ่สุดชนะ GPT-4 แทบทุกการทดสอบ

By lew

on 6 December 2023 - 22:21 Tag: Gemini, Google, LLM, Artificial Intelligence

Gemini

กูเกิลเปิดตัว Gemini 1.0 ปัญญาประดิษฐ์แบบ LLM ที่เคยเปิดตัวไว้ตั้งแต่งาน Google I/O ที่ผ่านมา โดยระบุว่าผลการทดสอบคะแนนต่างๆ นั้น Gemini ชนะ GPT-4 แทบทุกการทดสอบ

Gemini เป็นโมเดลปัญญาประดิษฐ์แบบ multimodal ตั้งแต่แรก โดยรองรับข้อมูลทั้ง ข้อความปกติ, โค้ด, เสียง, ภาพ, และวิดีโอ ในเวอร์ชั่น 1.0 กูเกิลระบุว่ามี 3 ขนาด ได้แก่ Gemini Ultra ขนาดใหญ่ที่สุด รองรับงานซับซ้อนสูง, Gemini Pro ขนาดรองลงมาโดยยังทำงานได้หลากหลาย, Gemini Nano โมเดลประสิทธิภาพสูงสำหรับรันบนโทรศัพท์มือถือ

ผลทดสอบ Turing Test กับ LLM ล่าสุด GPT-4 ได้ผลดีสุด ELIZA จากปี 1966 ยังได้ผลดีกว่า GPT-3.5

By lew

on 4 December 2023 - 21:50 Tag: Artificial Intelligence, LLM, Alan Turing

Artificial Intelligence

ทีมวิจัยจาก UC San Diego รายงานผลการทดสอบประสิทธิภาพของปัญญาประดิษฐ์ในการหลอกมนุษย์ว่าเป็นมนุษย์ หรือที่รู้จักกันในชื่อ Turing Test โดยผลเบื้องต้นพบว่า GPT-4 มีคะแนนใกล้คนที่สุด

AWS เพิ่ม Claude 2.1 เข้า Bedrock หลังเปิดตัวเพียงสัปดาห์เดียว

By lew

on 3 December 2023 - 22:48 Tag: AWS, Claude, Anthropic, LLM

AWS

AWS ประกาศเพิ่มบริการ Claude 2.1 ของทาง Anthropic ที่เพิ่งเปิดตัวสัปดาห์ที่ผ่านมา เข้ามาให้บริการใน Amazon Bedrock นับว่าให้บริการตามผู้พัฒนาโมเดลหลักได้ค่อนข้างเร็ว

Claude 2.1 เพิ่มฟีเจอร์สำคัญคือรองรับข้อมูลขนาดใหญ่มากจำนวน 200,000 โทเค็น หรือคิดเป็นเอกสาร 500 หน้ากระดาษ, ลดอัตราการหลอนลงครึ่งหนึ่ง, และรองรับ system prompt บอก AI ว่าให้ทำตัวอย่างไร

[ลือ] กูเกิลเลื่อนเปิดตัวโมเดล Gemini เป็นมกราคม 2024 หลังพบว่าโมเดลยังไม่พร้อม

By mk

on 3 December 2023 - 08:59 Tag: Google, Artificial Intelligence, LLM, Rumors, Gemini

Google

เว็บไซต์ The Information รายงานข่าวลือว่า Gemini โมเดลปัญญาประดิษฐ์ตัวใหม่ของกูเกิล อาจต้องเลื่อนการเปิดตัวออกไป จากเดิมที่มีแผนเปิดตัวสัปดาห์หน้า กลายเป็นเดือนมกราคม 2024

Gemini เป็นปัญญาประดิษฐ์ที่กูเกิลหวังใช้ต่อกรกับ GPT ของ OpenAI โดยต้องใช้พลัง Google + DeepMind ทำงานร่วมกัน และมีข่าวว่า Sergey Brin กลับมาช่วยโปรเจคนี้ด้วยตัวเอง

Subscribe to LLM