LLM | Blognone

Large Language Model

Anthropic เปิดบริการโมเดลขนาดเล็ก Claude 3 Haiku เน้นทำงานเร็ว ตอบเร็วกว่าคู่แข่ง 3 เท่า

By mk

on 14 March 2024 - 10:19 Tag: Claude, Anthropic, LLM, Artificial Intelligence, AWS

Claude

Anthropic เปิดให้บริการโมเดล Claude 3 Haiku ซึ่งเป็นโมเดลขนาดเล็กสุดในชุด Claude 3 ที่เปิดตัวไปเมื่อต้นเดือน

จุดเด่นของ Claude 3 Haiku คือการเป็นโมเดลขนาดเล็ก ราคาถูก แต่ให้คำตอบคุณภาพดีกว่าโมเดลคู่แข่งในระดับเดียวกัน (GPT-3.5 และ Gemini 1.0 Pro) และออกแบบโครงสร้างราคาให้เหมาะกับการใช้งานองค์กร ที่ต้องการใส่ prompt ยาวกว่าผู้ใช้ทั่วไป (เช่น ยัดเอกสารขององค์กรเข้าไปทั้งก้อน) ทาง Anthropic ยกตัวอย่างการประมวลผลเอกสารคำตัดสินของศาลความยาว 400 ชิ้น ชิ้นละประมาณ 10,000 โทเคน ในราคาเพียง 1 ดอลลาร์

Microsoft Copilot อัพเกรดมาใช้ GPT-4 Turbo มีผลกับผู้ใช้งานทุกคน

By arjin

on 14 March 2024 - 07:11 Tag: Microsoft Copilot, Microsoft, LLM, Artificial Intelligence

Microsoft Copilot

Microsoft Copilot มีการปรับปรุงใหญ่ โดยผู้ใช้งานทั่วไปได้ใช้ GPT-4 Turbo แทนที่ GPT-4 เดิม ซึ่งมีจุดเด่นคือโมเดลถูกเทรนด้วยชุดความรู้ใหม่กว่าถึงเมษายน 2023 และมีความสามารถอื่นเพิ่มเติมจาก GPT-4 เดิม

ข้อมูลนี้ถูกเปิดเผยโดย Mikhail Parakhin หัวหน้าทีม Windows ซึ่งโพสต์ใน X

GPT-4 Turbo จะถูกใช้งานใน Copilot เวอร์ชันฟรี รองรับทั้งโหมด Creative และ Precise แต่หากยังต้องการใช้ GPT-4 เดิม ต้องเป็นลูกค้า Copilot Pro จึงจะได้ปุ่มปิดให้ไปใช้ GPT-4 เดิม

Cognition Labs เปิดตัว Devin ปัญญาประดิษฐ์เขียนโค้ด แก้บั๊ก ฝึกปัญญาประดิษฐ์เองได้

By lew

on 13 March 2024 - 23:16 Tag: LLM, Artificial Intelligence, Programming

LLM

Cognition Labs สตาร์ตอัพปัญญาประดิษฐ์เปิดตัว Devin ปัญญาประดิษฐ์แบบ agent ที่วางแผนการทำงาน จากนั้นเขียนโค้ด, ดูผลลัพธ์, และแก้ปัญหาได้ในตัวเองจนกว่างานจะเสร็จ

Devin ทำงานในสภาพแวดล้อมปิด มี shell ของเซิร์ฟเวอร์ส่วนตัว, ตัวแก้ไขโค้ด, และเบราว์เซอร์ และมีหน้าจอรายงานผลการทำงานว่าถึงขั้นตอนไหน หรือกำลังทำอะไรอยู่ โดยรวมแล้ว Devin ทำงานเหมือนนักพัฒนาคนหนึ่งในทีมงานและผู้ควบคุมยังสามารถแนะนำแนวทางการทำงานระหว่างทางได้

กูเกิลร่วมมือ AI Singapore สร้างชุดข้อมูลภาษา 10 ชาติอาเซียนรวมไทย สำหรับการพัฒนา LLM

By lew

on 12 March 2024 - 18:28 Tag: Google, ASEAN, LLM

Google

กูเกิลร่วมมือกับโครงการ AI Singapore เปิดโครงการ SEALD (Southeast Asian Languages in One Network Data) สร้างชุดข้อมูลภาษาสำหรับใช้งานกับ large language model (LLM) ที่เน้นชาติอาเซียนโดยเฉพาะ โดยภาษาชุดแรกได้แก่ อินโดนีเซีย, ไทย, ทมิฬ, ฟิลิปปินส์, และพม่า

ตัวโครงการไม่ได้จำกัดเฉพาะชุดข้อมูล แต่รวมถึงการพัฒนาโมเดลแปลภาษา, สร้างแนวปฎิบัติในการสร้างชุดข้อมูล, สร้างเครื่องมือแปลงภาษา (translocalization), และเผยแพร่แนวทางการสร้างโมเดลในภาษาในชาติเอเชียตะวันออกเฉียงใต้ โดยขุดข้อมูลที่ได้จากโครงการนี้จะเป็นโอเพนซอร์สให้หน่วยงานอื่นๆ นำไปสร้าง LLM ได้ต่อไป

01.AI เปิดโมเดล Yi รุ่นใหม่ เริ่มใกล้ GPT-3.5 รองรับข้อมูลขนาด 200,000 โทเค็น

By lew

on 11 March 2024 - 23:56 Tag: LLM, Kai Fu Lee, Artificial Intelligence

LLM

01.AI บริษัทปัญญาประดิษฐ์จีนที่ก่อตั้งโดย Kai-Fu Lee อดีตผู้บริหารกูเกิล ออกโมเดล LLM ในชื่อ Yi รุ่นล่าสุดที่ปรับปรุงหลายด้านโดยเฉพาะการรองรับข้อมูลขนาดใหญ่ จากเดิมสูงสุด 32,000 โทเค็น เป็น 200,000 โทเค็นตามที่ประกาศไว้ก่อนหน้านี้

ระหว่างทางนับแต่วันประกาศเปิดตัวครั้งแรก Yi มีออกเวอร์ชั่นย่อยๆ มาอีกหลายเวอร์ชั่น เช่นโมเดลแบบแชต, โมเดลขนาด 9B, และโมเดลรองรับรูปภาพในตัว

Gemini เพิ่มความสามารถใหม่ แก้ไข Response เพื่อให้ได้คำตอบที่ตรงความต้องการมากขึ้น

By arjin

on 7 March 2024 - 16:06 Tag: Gemini, LLM, Google, Artificial Intelligence

Gemini

กูเกิลประกาศเพิ่มความสามารถใหม่ให้ Gemini โดยผู้ใช้งานสามารถเลือกบางส่วน หรือทั้งหมดของคำตอบจาก Gemini เพื่อปรับแก้ไข ให้ Gemini ตอบใหม่ให้ตรงกับความต้องการมากขึ้น โดยหากคำตอบนั้นสามารถใช้งานฟีเจอร์นี้ได้ ไอคอนดินสอพร้อมประกายจะปรากฎให้ Modify selected text

ตัวอย่างการแก้ไขคำตอบ เช่น เมื่อให้ Gemini วางแผนทริป 3 วัน ก็จะได้คำตอบแบบ 3 วัน แต่เราสามารถแก้ไขคำตอบโดยบอกว่า ขอระยะเวลาที่ยาวกว่านั้นเป็น 4 วัน Gemini ก็จะปรับปรุงคำตอบบนเงื่อนไข 4 วันให้ ซึ่งเป็นผลลัพธ์ที่ตรงกับความต้องการมากขึ้น และอยู่ในประเด็นเดิม

Cloudflare เตรียมให้บริการ Firewall for AI ป้องกันการทำ prompt injection

By lew

on 5 March 2024 - 21:24 Tag: Cloudflare, LLM

Cloudflare

Cloudflare ประกาศเตรียมเปิดบริการ Firewall for AI ชุดความสามารถใหม่สำหรับลูกค้าองค์กรที่เริ่มใช้งานแชตบอตในกลุ่ม LLM เพิ่มขึ้น โดยพยายามป้องกันทั้งการยิงเกินกำหนด, การส่งข้อมูลส่วนบุคคลเข้าออก, และการยิง prompt injection เพื่อเปลี่ยนพฤติกรรมของแชตบอต

บริการชุดนี้จะปิดให้ผู้ใช้คอนฟิกว่าส่วนใดของ JSON เป็น prompt สำหรับ LLM เพื่อมาวิเคราะห์เพิ่มเติม สามารถตั้งไฟร์วอลล์ให้บล็อคแชตได้ตามหัวข้อ เช่น เกี่ยวกับศาสนา, การเมือง, หรือเรื่องทางเพศ

Anthropic เปิดตัว Claude 3 ปัญญาประดิษฐ์คะแนนเหนือ GPT-4

By lew

on 5 March 2024 - 00:51 Tag: Claude, Anthropic, LLM

Claude

Anthropic บริษัทปัญญาประดิษฐ์ด้าน LLM เปิดตัวโมเดล Claude 3 โดยจุดเด่นสำคัญคือรุ่นสูงสุดนั้นทำคะแนนชนะ GPT-4 แทบทุกชุดทดสอบ และยังชนะ Gemini Ultra อีกด้วย

Claude 3 ประกอบด้วยรุ่นย่อย 3 รุ่น จากใหญ่ไปเล็กได้แก่ Opus ที่ชนะ GPT-4, Sonnet ใกล้เคียงกับ GPT-4, และ Haiku ที่อยู่ระดับเหนือกว่า GPT-3.5 โดยตัว Haiku นั้นออกแบบให้รันงานได้เร็ว เช่นการอ่านเอกสารความยาวเกินหมื่นโทเค็นก็ยังใช้เวลาไม่ถึง 3 วินาที โมเดลทั้งสามรุ่นรองรับการอ่านภาพ, ไฟล์เอกสาร, และ flowchart ต่างๆ โดยทำคะแนนใกล้เคียงกับ Gemini Ultra

Brave Leo ปัญญาประดิษฐ์สรุปเนื้อหาเว็บเพจ มีให้ใช้งานบน Android แล้ว

By arjin

on 1 March 2024 - 11:11 Tag: Brave, LLM, Browser, Android

Brave

เบราว์เซอร์ Brave ที่ชูจุดขายเรื่องความเป็นส่วนตัว ประกาศว่าฟีเจอร์ Leo ปัญญาประดิษฐ์ผู้ช่วย ที่เปิดตัวก่อนหน้านี้สำหรับผู้ใช้งานงานเดสก์ท็อป ตอนนี้ขยายมายังผู้ใช้ Brave บน Android แล้ว

Leo บน Android มีความสามารถเหมือนกันบนเดสก์ท็อป เช่น สรุปเนื้อหาเว็บเพจหรือวิดีโอแบบเรียลไทม์, ตอบคำถามที่อิงคำตอบจากเนื้อหาในคอนเทนต์นั้น, สร้างเนื้อหาแบบยาว, แปลเว็บเพจหรือวิเคราะห์, เขียนทรานสคริปต์ของวิดีโอหรือเสียง ตลอดจนสามารถเขียนโค้ดได้ด้วย ซึ่งทั้งหมดยังคงรักษาความเป็นส่วนตัว ข้อมูลถูกกำหนดเป็นนิรนาม

StarCoder2 ชุด LLM สำหรับการสร้างโค้ด โดย ServiceNow, Hugging Face และ NVIDIA

By arjin

on 29 February 2024 - 16:32 Tag: Hugging Face, Artificial Intelligence, NVIDIA, ServiceNow, LLM, Programming

Hugging Face

ServiceNow, Hugging Face และ NVIDIA เปิดตัว StarCoder2 ชุดโมเดลภาษาขนาดใหญ่ (LLM) ที่เปิดให้ใช้งานได้ฟรี (open-access) สำหรับงานเขียนโค้ด ซึ่งมีจุดเด่นคือประสิทธิภาพการทำงาน ความโปร่งใสของ AI และช่วยในการจัดการต้นทุน

StarCoder2 เป็นโครงการของชุมชน BigCode ที่ให้การสนับสนุนโดย ServiceNow และ Hugging Face โมเดลถูกเทรนบนภาษาเขียนโปรแกรม 619 ภาษา ออกแบบมาให้สามารถทำงานร่วมกับแอพพลิเคชันภายในองค์กร สำหรับงานต่าง ๆ เช่น ช่วยสร้างซอร์สโค้ด, สร้างเวิร์กโฟลว์, เขียนสรุปเนื้อหา และอื่น ๆ องค์กรสามารถนำไปใช้งาน โดยอาศัยการปรับแต่งด้วยทรัพยากรที่ไม่ต้องสูงมาก

Tim Cook ตอบผู้ถือหุ้น Apple - บริษัทจะมีผลิตภัณฑ์ AI ที่เป็นนวัตกรรมใหม่ทั้งหมดภายในปีนี้

By arjin

on 29 February 2024 - 11:17 Tag: Apple, Tim Cook, LLM, Artificial Intelligence

Apple

แอปเปิลได้จัดการประชุมสามัญประจำปีผู้ถือหุ้นเมื่อวานนี้ ซึ่งประเด็นที่ผู้ถือหุ้นสอบถามกันเป็นจำนวนมากคือทิศทางของบริษัทกับ AI โดยเฉพาะ Generative AI ซึ่งเป็นหัวข้อหลักในโลกเทคโนโลยีตอนนี้ แต่แอปเปิลยังไม่มีผลิตภัณฑ์โดยตรงเรื่องนี้ออกมา

ซีอีโอ Tim Cook บอกว่า แอปเปิลได้เทเงินจำนวนมากสำหรับการพัฒนาผลิตภัณฑ์ AI และมองเห็นโอกาสที่เป็นนวัตกรรมใหม่ทั้งหมดจาก Generative AI เขาเชื่อว่ามันจะเปลี่ยนแปลงและมอบโอกาสใหม่กับผู้ใช้งานในทุกด้าน

เมื่อถามว่าแล้วผลิตภัณฑ์ด้าน AI จากแอปเปิลจะออกมาเมื่อใด Cook บอกว่ารายละเอียดต่าง ๆ จะเปิดเผย__ภายในปีนี้__

ซีอีโอ Google บอกปัญหา AI เจนรูปภาพบุคคลผิดจากความจริง ไม่สามารถยอมรับได้ และกำลังแก้ไขอยู่

By arjin

on 29 February 2024 - 08:01 Tag: Sundar Pichai, Google, Artificial Intelligence, Gemini, LLM

Sundar Pichai

Sundar Pichai ซีอีโอกูเกิล ออกอีเมลถึงพนักงานในประเด็นที่ Gemini Image Generation โปรแกรมสร้างรูปภาพด้วย AI ทำงานผิดพลาด โดยพยายามให้ผลลัพธ์รูปบุคคลที่แสดงความหลากหลายจนผิดเจตนาของผู้ใช้งาน หรือสร้างรูปที่ผิดไปจากประวัติศาสตร์

Pichai บอกว่าสิ่งที่เกิดขึ้นเป็นเรื่องที่ไม่สามารถยอมรับได้ และเราทำผิดจริง ๆ ตอนนี้ทีมงานต่างทำงานกันต่อเนื่องทั้งคืนทั้งวันเพื่อแก้ไขปัญหา ซึ่งเริ่มเห็นผลลัพธ์ที่ดีขึ้นเรื่อย ๆ ไม่มี AI ตัวใดที่สมบูรณ์แบบ พวกเรายังอยู่ในช่วงเริ่มต้นของอุตสาหกรรม แต่มาตรฐานที่เราต้องทำนั้นสูง และกูเกิลก็ต้องไปให้ถึงตรงนั้น

เปิดตัวโมเดล Mistral Large เป็นรองเพียง GPT-4 แต่รองรับเฉพาะภาษาฝั่งยุโรป ขายโมเดลไปรันในองค์กรได้

By lew

on 26 February 2024 - 23:16 Tag: LLM, Mistral

LLM

Mistral บริษัทปัญญาประดิษฐ์ LLM จากฝรั่งเศสเปิดตัวโมเดลใหม่สองโมเดล โดยไม่ได้เปิดเผยโครงสร้างภายในให้คนภายนอกใช้งานผ่านคลาวด์ สองโมเดล ได้แก่

เบราว์เซอร์ Brave เพิ่มปัญญาประดิษฐ์ Leo อ่านเว็บ, PDF, Google Docs, YouTube, Slack

By lew

on 25 February 2024 - 23:59 Tag: Brave, LLM

Brave

เบราว์เซอร์ Brave เพิ่มฟีเจอร์ให้ปัญญาประดิษฐ์ Leo ผู้ช่วยที่มาพร้อมกับเบราว์เซอร์ โดยในเวอร์ชั่นใหม่ Leo จะสามารถอ่านข้อมูลบนเบราว์เซอร์ได้หลากหลายขึ้น ทำให้ขอความช่วยเหลือเพิ่มเติมได้หลากหลาย

Leo สามารถอ่านข้อมูลในเอกสาร ได้แก่ 1) PDF อ่านข้อมูลไฟล์เอกสาร งานวิจัยต่างๆ เพื่อคุยกับเอกสาร 2) Google Docs สามารถอ่านและแก้ไขเอกสาร 3) Google Sheet วิเคราะห์ตารางและช่วยเขียนสูตรสมการ 4) Slack อ่านข้อความใน thread เพื่อสรุป 5) YouTube แปลงวิดีโอเป็นทรานสคริปต์และสรุปเนื้อหา

ทีมวิจัยสแตนฟอร์ดระบุ AI ในกลุ่ม LLM ยังมั่วสูง ควรใช้กับการแพทย์อย่างระมัดระวัง

By lew

on 25 February 2024 - 17:03 Tag: Stanford, Medical, LLM, Research

Stanford

ทีมวิจัยจากสถาบัน Human-Centered Artificial Intelligence (HAI) ของมหาวิทยาลัยสแตนฟอร์ด รายงานถึงผลทดสอบการใช้งานปัญญาประดิษฐ์ในกลุ่ม LLM ว่าแม้จะมีข่าวว่า LLM สามารถวินิจฉัยโรคได้อย่างน่าทึ่งแต่ก็มีความผิดพลาดสูง ต้องระมัดระวัง

ทีมงานทดสอบการใช้งาน LLM โดยใช้โมเดล 4 ตัว ได้แก่ GPT-4, Claude 2.1, Mistral Medium, และ Gemini Pro เฉพาะ GPT-4 นั้นสร้างแอป retrieval augmented generation (RAG) ครอบอีกชั้นเพื่อทดสอบ โดยวัดว่าเวลาที่ LLM เหล่านี้ตอบคำถามแล้ว สามารถสร้างคำตอบโดยมีการอ้างอิงอย่างถูกต้องหรือไม่

AWS เพิ่มโมเดล AI จาก Mistral เข้าบริการ Bedrock

By lew

on 24 February 2024 - 11:22 Tag: AWS, LLM, Mistral

AWS

AWS ประกาศเพิ่มโมเดล Mistral 7B และ Mixtral 8x7B ให้ใช้งานบน AWS Bedrock เร็วๆ นี้ โดยระบุว่าทั้งสองโมเดลมีจุดเด่นเรื่องของความเร็วและค่าใช้จ่ายที่ถูกกว่า นอกจากนี้องค์กรบางส่วนยังอาจต้องการโมเดลที่ตรวจสอบได้ การใช้โมเดลโอเพนซอร์สจึงเป็นทางเลือกสำคัญ

Mixtral 8x7B นั้นมีคะแนนทดสอบค่อนข้างใกล้เคียงกับ GPT-3.5 แต่มีจุดเด่นที่รันได้เร็วมาก โดยตอนนี้ผู้ให้บริการที่เน้นความเร็วอย่าง Groq นั้นโชว์ว่าสามารถรันได้ที่ระดับ 500 token/s เลยทีเดียว

MediaTek โชว์การรัน Gemini Nano และ Llama 2 บนชิป Dimensity 9300 และ 8300

By mk

on 24 February 2024 - 06:54 Tag: MediaTek, Gemini, LLM, SoC, Dimensity

MediaTek

MediaTek ประกาศความสำเร็จในการปรับแต่งโมเดล Google Gemini Nano และ Meta Llama 2 7B ให้รันบนชิป Dimensity 9300 และ 8300 เปิดทางให้ใช้งานฟีเจอร์ Generative AI แบบออฟไลน์ ไม่ต้องผ่านคลาวด์

การรันโมเดลเหล่านี้บนชิป เกิดขึ้นได้เพราะใช้ APU (AI processing unit ตามภาษาของ MediaTek) รุ่นใหม่ที่มีประสิทธิภาพสูงขึ้น

MediaTek ประกาศว่าจะร่วมมือกับกูเกิลเปิดตัวแอพ APK ที่ช่วยให้นักพัฒนาและแบรนด์ OEM รันโมเดล Gemini Nano ของตัวเองบนชิป Dimensity ในเร็วๆ นี้

Phind เปิดตัว LLM ช่วยเขียนโค้ด Phind-70B เร็วกว่า ขยันตอบกว่า GPT-4

By lew

on 23 February 2024 - 13:51 Tag: LLM, Programming, Artificial Intelligence

LLM

Phind บริษัทปัญญาประดิษฐ์ LLM สำหรับการช่วยเขียนโค้ดเป็นหลัก เปิดตัวโมเดลของตัวเอง Phind-70B ที่วัดเฉพาะความสามารถในการเขียนโค้ด HumanEval และ CRUXEval ใกล้เคียงกับ GPT-4 มาก แต่ชูความเด่นกว่าที่ความเร็วในการตอบและโมเดลถูกฝึกให้ขยันตอบมากกว่า GPT-4 ที่เคยมีปัญหาไม่ยอมตอบบางคำถาม

ความเร็วในการตอบของ Phind-70B อยู่ที่ 80 token/s เร็วกว่า GPT-4 Turbo ประมาณสี่เท่าตัว และคาดว่าจะเร่งความเร็วได้สูงกว่านี้อีก

เปิดตัว Stable Diffusion 3 โมเดลสร้างรูปภาพด้วย AI ที่ทำงานลงรายละเอียดได้มากกว่าเดิม

By arjin

on 23 February 2024 - 08:01 Tag: Stability AI, Artificial Intelligence, LLM

Stability AI

Stability AI เปิดตัวเครื่องมือสร้างรูปภาพจากข้อความด้วย AI เวอร์ชันล่าสุด Stable Diffusion 3 ตอนนี้อยู่ในสถานะพรีวิวขั้นต้น จึงยังไม่เปิดให้ใช้งานทั่วไปในวงกว้าง แต่ผู้ใช้งานสามารถเข้าร่วมใน waitlist เพื่อทดสอบได้ที่นี่

Stable Diffusion 3 เป็นโมเดลที่มีพารามิเตอร์ตั้งแต่ 800M ถึง 8B พารามิเตอร์ จึงรองรับตัวเลือกและคุณภาพของผลลัพธ์ที่มากยิ่งขึ้น

กูเกิลเปิดตัว Gemma โมเดลภาษาโอเพนซอร์ส โครงสร้างเดียวกับ Gemini ใช้งานเชิงพาณิชย์ได้

By mk

on 21 February 2024 - 20:45 Tag: Gemma, Google, LLM, Open Source, Gemini

Gemma

กูเกิลเปิดตัว Gemma โมเดลภาษาแบบโอเพนซอร์ส ที่ได้แรงบันดาลใจมาจาก Gemini โมเดลเชิงพาณิชย์ของตัวเอง และพัฒนาโดยทีม Google DeepMind เหมือนกัน มีโครงสร้างทางเทคนิคบางส่วนเหมือนกัน

กูเกิลปล่อย Gemma ออกมา 2 ขนาดคือ 2B และ 7B (ดาวน์โหลดได้จาก Kaggle หรือ Hugging Face) โดยระบุว่าโมเดลขนาด 7B สามารถเอาชนะคู่แข่งที่ระดับเดียวกันคือ Llama 7B ในเบนช์มาร์คต่างๆ ได้ค่อนข้างทิ้งห่าง และเอาชนะได้แม้กระทั่ง Llama 13B ที่มีขนาดใหญ่กว่าได้ด้วยซ้ำ

Subscribe to LLM