LLM | Blognone

Large Language Model

โมเดลโอเพนซอร์ส Reflection ปรับจูนจาก Llama แต่ชนะโมเดลใหญ่ได้ทุกตัวรวม GPT-4o

By mk

on 7 September 2024 - 13:48 Tag: LLM, Llama, Open Source, Artificial Intelligence

LLM

โลก AI เมื่อคืนนี้มีการเปลี่ยนแปลงน่าสนใจ เมื่อ Matt Shumer ผู้ก่อตั้งสตาร์ตอัพ HyperWrite เปิดตัวโมเดลภาษาขนาดใหญ่ (LLM) ตัวใหม่ Reflection 70B ที่มีคะแนนเบนช์มาร์คชนะโมเดล__ทุกตัว__ในท้องตลาด ไม่ว่าจะเป็น GPT-4o, Claude 3.5, Gemini 1.5 Pro, Llama 3.1 405B

สิ่งที่น่าสนใจคือ Reflection 70B ไม่ได้พัฒนาขึ้นมาจากศูนย์ แต่ปรับจูนมาจากโมเดลโอเพนซอร์สอย่าง Llama 3.1 70B อีกทอดหนึ่ง แล้วดันเอาชนะ Llama 3.1 405B ที่ตัวใหญ่กว่ามากๆ ได้

Anthropic เปิดตัว Claude Enterprise สำหรับลูกค้าองค์กร รองรับอินพุทถึง 500K

By arjin

on 5 September 2024 - 08:05 Tag: Claude, Anthropic, Artificial Intelligence, Enterprise, LLM

Claude

Anthropic เปิดตัวแพ็คเกจใช้งานโมเดลปัญญาประดิษฐ์ Claude แบบใหม่สำหรับลูกค้าองค์กร Claude Enterprise มีจุดเด่นในการรองรับชุดความรู้สำหรับองค์กร ขยายขนาดอินพุทที่รองรับ (context windows) เป็น 500K เชื่อมต่อกับ GitHub จึงรองรับงานเขียนโค้ดด้วย และมีฟังก์ชันพื้นฐานความปลอดภัยสำหรับองค์กรเช่น SSO, ระบบจัดการสิทธิ, ระบบแอดมิน ฯลฯ

Anthropic บอกว่ามีลูกค้าที่ร่วมทดสอบ Claude Enterprise แล้วก่อนหน้านี้ เช่น GitLab และ Midjourney

Claude Enterprise ไม่ได้เปิดเผยราคาแพ็คเกจใช้งาน องค์กรที่สนใจต้องติดต่อกับฝ่ายขายของ Anthropic เท่านั้น

Alibaba เปิดตัวโมเดล Qwen2-VL สามารถเข้าใจรูปภาพ และวิดีโอที่มีความยาวระดับ 20 นาทีได้

By arjin

on 30 August 2024 - 20:02 Tag: Alibaba Cloud, LLM, Qwen

Alibaba Cloud

Alibaba Cloud ปล่อยโมเดล LLM ตระกูล Qwen 2 รุ่นล่าสุด Qwen2-VL โดย VL ย่อมาจาก Vision Language ที่พัฒนาบนพื้นฐานของ Qwen2

Qwen2-VL มีจุดเด่นคือความสามารถในการทำความเข้าใจรูปภาพ ที่มีความละเอียดและอัตราส่วนภาพหลากหลาย ผลการทดสอบทำงานได้ดีกว่าโมเดลประเภทเดียวกัน ซึ่งสามารถนำไปประยุกต์ใช้ได้กับอุปกรณ์ที่ต้องใช้การทำความเข้าใจภาพที่เห็น เช่น สมาร์ทโฟน, หุุ่นยนต์ หรือระบบอัตโนมัติอื่นที่ต้องอาศัยภาพในการตัดสินใจ

โมเดลมหาชน Meta เผยยอดดาวน์โหลด Llama 350 ล้านครั้ง, ปี 2024 เติบโต 10 เท่า

By mk

on 30 August 2024 - 13:24 Tag: Llama, Meta, LLM, Artificial Intelligence

Llama

Meta เผยยอดดาวน์โหลดโมเดลภาษาขนาดใหญ่ตระกูล Llama ทะลุ 350 ล้านครั้ง (นับเฉพาะบน Hugging Face) และมีโมเดลเวอร์ชันพัฒนาต่อยอดมากกว่า 60,000 ตัวบน Hugging Face

Llama ถือเป็นโมเดลภาษาขนาดใหญ่ที่เป็นโอเพนซอร์สเกือบ 100% (มีเงื่อนไขการใช้งานจำกัดเฉพาะบริษัทไอทีและคลาวด์รายใหญ่เท่านั้น) เปิดตัวครั้งแรกในเดือนกุมภาพันธ์ 2023 และใช้เวลา 18 เดือน พัฒนาตัวเองกลายมาเป็นโมเดลยอดนิยม

กูเกิลเปิดให้ทดสอบ Gemini Flash-8B ฟีเจอร์เท่าตัวเต็มแต่ไม่เก่งเท่า ใช้ฟรีช่วงทดลอง

By lew

on 28 August 2024 - 14:20 Tag: Gemini, LLM, Google

Gemini

กูเกิลเปิดตัว Gemini Flash 8B โมเดลแบบปิดที่ภายในเป็นโมเดลขนาดเล็กมากเพียง 8B เท่านั้น แต่ยังได้ความสามารถหลักคล้ายกับโมเดลเต็ม เช่น multimodal รองรับทั้งเสียงและภาพ, รองรับอินพุตถึง 1 ล้านโทเค็น

Cerebras เปิดบริการคลาวด์ Llama 3.1 ความเร็วสูงเกิน 1,800 โทเค็นต่อวินาที ใส่แรมในชิป

By lew

on 28 August 2024 - 01:20 Tag: Cerebras, Artificial Intelligence, LLM, Cloud

Cerebras

Cerebras บริษัทชิปปัญญาประดิษฐ์ เปิดบริการ Cerebras Inference รันโมเดล Llama 3.1 ที่ความเร็วสูง โดยสามารถรัน Llama 3.1 70B ที่ 450 token/s ขณะที่ Llama 3.1 8B ได้ถึง 1,800 token ต่อวินาที นับว่าเป็นบริการที่ความเร็วสูงที่สุดในโลกในตอนนี้ จากเดิมที่ Groq ทำได้ที่ 750 token/s

NVIDIA โชว์การลดขนาดโมเดล Mistral 12B เหลือ 8B โดยยังรักษาคุณภาพได้ดี

By mk

on 27 August 2024 - 20:55 Tag: NVIDIA, Mistral, LLM, Artificial Intelligence

NVIDIA

NVIDIA โชว์การปรับปรุงโมเดลภาษา Mistral NeMo 12B ที่เปิดตัวในเดือนกรกฎาคม ให้มีขนาดพารามิเตอร์ลดลงเหลือ 8B แต่ไม่สูญเสียประสิทธิภาพมากนัก ผลคือโมเดล Mistral-NeMo-Minitron 8B ที่ปรับขนาดลดลงแล้ว เอาชนะโมเดลคู่แข่งระดับใกล้เคียงกันอย่าง Llama 3.1 8B และ Gemma 7B ในเบนช์มาร์ค AI ทุกตัวได้

เทคนิคการปรับลดขนาดโมเดลที่ NVIDIA ใช้งานมี 2 อย่าง ได้แก่

Anthropic เผยแพร่รายละเอียด System Prompts ที่ใช้ตีกรอบ GenAI ก่อนให้ใช้งาน

By arjin

on 27 August 2024 - 19:28 Tag: Claude, Anthropic, LLM

Claude

Anthropic เผยแพร่ System Prompts ของบริการ Generative AI ซึ่งครอบคลุมทั้ง Claude ผ่านเว็บและในแอป iOS, Android แยกเป็นโมเดลล่าสุดทั้ง Claude 3 Opus, Claude 3.5 Sonnet และ Claude 3.5 โดยไม่รวมถึง Anthropic API

ซีอีโอ Amazon เผยตัวเลขการใช้ Amazon Q ช่วยอัปเกรด Java ให้โปรแกรมที่ใช้งานภายใน ลดเวลาทำงานได้มหาศาล

By arjin

on 25 August 2024 - 21:05 Tag: Amazon, LLM, Java, Artificial Intelligence, Programming

Amazon

Andy Jassy ซีอีโอ Amazon โพสต์เนื้อหาใน LinkedIn เพื่อนำเสนอความสามารถของระบบผู้ช่วยปัญญาประดิษฐ์สร้างเนื้อหา Amazon Q ที่มีจุดขายหนึ่งสำหรับลูกค้าองค์กรคือการแก้ไขโค้ด และรองรับการย้ายโค้ด Java ไปเวอร์ชันใหม่

Anthropic แสดงความเห็นด้วยกฎหมายควบคุม AI ขนาดใหญ่ หลังสภายอมลดเงื่อนไข

By lew

on 23 August 2024 - 17:17 Tag: LLM, Law, California, USA, Anthropic

LLM

Dario Amodei ซีอีโอ Anthropic ผู้พัฒนาโมเดลภาษาขนาดใหญ่ Claude ออกจดหมายแสดงความเห็นด้วยร่างกฎหมายควบคุมการพัฒนาปัญญาประดิษฐ์ SB 1047 ร่างล่าสุด หลังจากที่ก่อนหน้านี้กฎหมายฉบับนี้ถูกคัดค้านอย่างหนัก เช่น Andrew Ng, OpenAI

AWS แนะนำ 8 ข้อควรระวังความปลอดภัยแอปแชต LLM ระบุการพัฒนาอย่างไม่ระวังเปิดทางข้อมูลรั่วไหล

By lew

on 22 August 2024 - 21:06 Tag: AWS, LLM

AWS

บริการ large language model (LLM) บนคลาวด์รายต่างๆ เปิดทางให้องค์กรสร้างแอปพลิเคชั่นสสำหรับงานเฉพาะทาง เช่น โดยเฉพาะการทำ Retrieval Augmented Generation (RAG) เพื่อสร้างแชตบอตสอบถามข้อมูลเฉพาะทาง ทาง AWS ก็ออกมาแนะนำ 8 ประเด็นที่ต้องระวังด้านความปลอดภัย

แอปแชตที่ AWS ยกตัวอย่างมาประกอบไปด้วย หน้าจอเว็บที่พัฒนาด้วย Streamlit, ตัวแอปพลิเคชั่นหลักพัฒนาด้วย Lambda, ฐานข้อมูล DynamoDB สำหรับการเก็บข้อมูลประวัติการแชตก่อนหน้า, เชื่อมต่อกับ LLM หลักคือ Cluade 3 Sonnet, ดึงข้อมูลเอกสารจาก S3 เข้าไปยัง OpenSearch โดยแปลงข้อความเป็นเวคเตอร์ด้วย Titan Embedding

Procreate ประกาศจุดยืน ขออยู่ข้างนักสร้างสรรค์ผลงานทุกคน จะไม่เพิ่มฟีเจอร์ GenAI ในแอป

By arjin

on 20 August 2024 - 05:36 Tag: Procreate, Artificial Intelligence, LLM

Procreate

Procreate แอปวาดภาพยอดนิยมบน iPad ประกาศจุดยืน หลังจากผู้ใช้งาน Procreate แสดงความกังวลว่า ที่สุดแล้วแอปก็จะต้องเข้าสู่กระแสเพิ่มฟีเจอร์ด้าน Generative AI ด้วย ซึ่ง Procreate บอกว่าจะไม่เป็นเช่นนั้น

James Cuda ซีอีโอ Procreate โพสต์วิดีโอใน X บอกว่า Procreate จะไม่มีฟีเจอร์เกี่ยวกับ Generative AI ออกมาในแอป เขายังบอกว่าไม่ชอบสิ่งที่เกิดขึ้นในอุตสาหกรรมตอนนี้ ไม่รู้ว่าตอนจบจะเป็นอย่างไร แต่ยืนยันที่จะอยู่ข้างมนุษย์ผู้สร้างสรรค์ผลงาน

OpenAI สร้างชุดทดสอบเขียนโปรแกรม SWE-Bench Verified จ้างโปรแกรมเมอร์ทดสอบว่าเขียนโปรแกรมตามโจทย์ได้จริง

By lew

on 19 August 2024 - 22:22 Tag: OpenAI, LLM, Programming

OpenAI

OpenAI เปิดตัวชุดทดสอบปัญญาประดิษฐ์ SWE-Bench Verified ที่สร้างต่อจาก SWE-Bench ชุดทดสอบการเขียนโปรแกรมที่ได้รับความนิยมสูง โดยแก้ปัญหาคุณภาพของชุดข้อมูลเดิมที่อาศัยการกวาด GitHub Issue มาเป็นโจทย์ให้ปัญญาประดิษฐ์

SWE-Bench อาศัยคำถามและชุดทดสอบซอฟต์แวร์เท่านั้น ในการทดสอบตัว AI จะมองไม่เห็นชุดทดสอบแต่เห็นเฉพาะปัญหา และต้องพยายามเขียนโปรแกรมให้รันผ่านชุดทดสอบให้ได้ แบบเดียวกับการสอบเขียนโปรแกรม แต่เป็นปัญหาจริงในการทำงาน

OpenAI ปิดรับสมัคร waitlist ของ SearchGPT ชั่วคราว บอกจะเพิ่มเติมภายหลัง แต่ไม่มีกำหนด

By arjin

on 19 August 2024 - 14:57 Tag: OpenAI, SearchGPT, Search Engine, LLM, Artificial Intelligence

OpenAI

ก่อนหน้านี้ OpenAI ได้เปิดตัว SearchGPT ซึ่งเป็นบริการค้นหาข้อมูลแบบเรียลไทม์จากอินเทอร์เน็ตพลัง AI ที่หลายคนมองว่าทำให้การแข่งขันกับกูเกิลดูเข้าใกล้มากขึ้น อย่างไรก็ตาม SearchGPT เป็นบริการสถานะต้นแบบ ที่ใครต้องการต้องลงชื่อ waitlist ก่อน

ล่าสุดคนที่สมัครรอใน waitlist แต่ยังไม่ได้คำเชิญทดสอบใช้งาน ต่างได้รับอีเมลจาก OpenAI โดยบอกว่าตอนนี้ผู้ใช้งานที่ยังไม่ได้รับคำเชิญ ก็จะต้องรอต่อไปก่อน ซึ่งหากบริการขยายจำนวนผู้ใช้งานก็จะแจ้งอีกครั้ง ในหน้าสมัคร waitlist ตอนนี้ก็ปิดรับสมัครเพิ่มเติมด้วย

Runway เปิดตัว Gen-3 Alpha Turbo โมเดล AI สร้างวิดีโอ เร็วขึ้น 7 เท่า ด้วยค่าใช้จ่ายที่ลดลงครึ่งหนึ่ง

By arjin

on 18 August 2024 - 06:33 Tag: Runway, Artificial Intelligence, LLM

Runway

Runway เปิดตัว Gen-3 Alpha Turbo โมเดลสร้างวิดีโอด้วยปัญญาประดิษฐ์รุ่นล่าสุด ที่พัฒนาต่อจากรุ่นก่อนหน้าคือ Gen-3 Alpha โดยมีจุดเด่นตามชื่อนั่นคือ สร้างวิดีโอได้เร็วขึ้น 7 เท่า พร้อมกับค่าใช้จ่ายที่ถูกลงครึ่งหนึ่งเมื่อเทียบกับ Gen-3 Alpha

โมเดล Gen-3 Alpha Turbo เปิดให้ใช้งานสำหรับลูกค้า Runway ทุกเทียร์ รวมทั้งแผนใช้งานฟรี ซึ่งเป็นเป้าหมายของ Runway ที่ต้องการให้โมเดลสร้างวิดีโอจาก AI เข้าถึงผู้ใช้งานในวงกว้างมากที่สุด

Grammarly เปิดตัว Authorship เครื่องมือตรวจสอบว่าบทความเขียนด้วยมนุษย์หรือใช้ AI เน้นเจาะกลุ่มการศึกษา

By arjin

on 16 August 2024 - 18:20 Tag: Grammarly, Artificial Intelligence, LLM

Grammarly

Grammarly เปิดตัว Grammarly Authorship เครื่องมือสำหรับตรวจสอบว่าบทความนั้นถูกเขียนโดยมนุษย์ หรือเขียนขึ้นด้วย AI หรือใช้ AI แก้ไขเนื้อหา ซึ่ง Grammarly บอกว่าปัจจุบันมีเครื่องมือหลายตัวที่อ้างว่าสามารถตรวจจับบทความที่เขียนด้วย AI แต่ Authorship ใช้วิธีเชื่อมโยงกับเนื้อหาต้นฉบับในแอปและเว็บไซต์ถึง 5 แสนแห่ง เพื่อระบุว่าส่วนใดในบทความที่เขียนโดยคน ส่วนใดที่ตัดแปะ และส่วนใดที่เขียนด้วย AI

OpenAI อัปเดตโมเดล GPT-4o เวอร์ชันปรับปรุงประสิทธิภาพการทำงานและแก้ไขบั๊ก

By arjin

on 14 August 2024 - 17:16 Tag: ChatGPT, OpenAI, LLM

ChatGPT

OpenAI ประกาศว่าได้อัปเดตโมเดล Generative AI เวอร์ชันย่อยของ GPT-4o ในชื่อ chatgpt-4o-latest ซึ่งบอกว่าเริ่มอัปเดตให้ผู้ใช้งาน ChatGPT ตั้งแต่สัปดาห์ที่แล้ว

ในรายละเอียดเพิ่มเติม (Release Note) OpenAI บอกว่าโมเดลใหม่ที่อัปเดตนี้ได้แก้ไขบั๊กและปรับปรุงประสิทธิภาพการทำงาน ซึ่งมาจากที่ OpenAI ค้นพบเองและจากฟีดแบ็กของผู้ใช้งาน โดย OpenAI ไม่ได้ระบุรายละเอียดสิ่งที่แตกต่างไปจากโมเดลก่อนหน้านี้

xAI เปิดตัว Grok-2 เพิ่มเวอร์ชัน mini และสร้างรูปภาพได้

By arjin

on 14 August 2024 - 16:29 Tag: xAI, Grok, LLM, Artificial Intelligence

xAI

xAI เผยแพร่โมเดล AI เวอร์ชันล่าสุดของ Grok มีสองโมเดลได้แก่ Grok-2 และ Grok-2 mini โดยทั้งสองโมเดลอยู่ในสถานะเบต้า ระบุว่าได้รับการปรับปรุงกระบวนการให้เหตุผล (reasoning) และมีผลทดสอบประสิทธิภาพที่ชนะทั้ง Claude 3.5 Sonnet และ GPT-4-Turbo

Alibaba เปิดตัวโมเดล Qwen 2 เวอร์ชั่นรับอินพุตเป็นเสียง และเวอร์ชั่นแก้ปัญหาคณิตศาสตร์

By lew

on 11 August 2024 - 20:53 Tag: Alibaba Cloud, LLM, Qwen

Alibaba Cloud

Alibaba Cloud ปล่อยโมเดล LLM แบบโอเพนซอร์สตระกูล Qwen 2 เพิ่มอีกสองรุ่น ได้แก่ Qwen2-Math และ Qwen2-Audio

Qwen2-Math เป็นโมเดลที่ฝึกต่อจก Qwen2 โดยสร้างชุดข้อมูลคุณภาพสูงด้านคณิตศาสตร์เฉพาะ ทั้งหนังสือ, โค้ดต่างๆ, ชุดข้อสอบต่างๆ, จนถึงข้อมูลที่สังเคราะห์ออกมาจาก Qwen2 เอง จุดเด่นของโมเดลนี้คือทำคะแนนทดสอบด้านคณิตศาสตร์ เช่น GSM8K, MATH หรือ MMLU-STEM ได้สูงกว่าโมเดลปิดอย่าง GPT-4o หรือ Gemini เสียอีก

Qwen2-Math ยังใช้งานได้เฉพาะภาษาอังกฤษเท่านั้น และมี 3 ขนาด คือ 1.5B, 7B, 72B เปิดให้ใช้งานแบบสัญญาอนุญาต Apache 2.0 ทีมงานระบุว่าจะเปิดเวอร์ชั่นภาษาจีนเร็วๆ นี้

OpenAI เพิ่มฟีเจอร์ Structured Outputs ตอบตรงตาม schema ที่กำหนดเสมอ 100% ลดค่า token 50%

By lew

on 7 August 2024 - 01:23 Tag: OpenAI, LLM

OpenAI

OpenAI เพิ่มฟีเจอร์ในการเรียก ChatCompletion API ให้สามารถกำหนด format ของค่าที่คืนมาเป็นไปตาม JSON Schema ที่กำหนดได้เต็ม 100%

คำสั่งบังคับให้คืนค่าตาม JSON Schema ที่กำหนดนี้สามารถใช้กับ Chat Completion ได้ทุกโมเดล อย่างไรก็ดีโมเดลที่ทาง OpenAI ทดสอบแล้วได้ผลเต็ม 100% จะเป็น gpt-4o-2024-08-06 ที่เพิ่งออกมาวันนี้

ในกรณีที่โมเดลไม่สามารถตอบกลับตาม JSON Schema ที่กำหนดได้ จะไม่คืนค่าตามปกติ แต่ใส่ข้อความมาในฟิลด์ refusal แทน ทำให้ผู้ใช้ตรวจสอบได้โดยง่ายว่ากำลังได้ข้อมูลตามต้องการหรือไม่

Subscribe to LLM