Image

Large Language Model

By mk Founder on Tag: LLM, Llama, Open Source, Artificial Intelligence
LLM

โลก AI เมื่อคืนนี้มีการเปลี่ยนแปลงน่าสนใจ เมื่อ Matt Shumer ผู้ก่อตั้งสตาร์ตอัพ HyperWrite เปิดตัวโมเดลภาษาขนาดใหญ่ (LLM) ตัวใหม่ Reflection 70B ที่มีคะแนนเบนช์มาร์คชนะโมเดล__ทุกตัว__ในท้องตลาด ไม่ว่าจะเป็น GPT-4o, Claude 3.5, Gemini 1.5 Pro, Llama 3.1 405B

สิ่งที่น่าสนใจคือ Reflection 70B ไม่ได้พัฒนาขึ้นมาจากศูนย์ แต่ปรับจูนมาจากโมเดลโอเพนซอร์สอย่าง Llama 3.1 70B อีกทอดหนึ่ง แล้วดันเอาชนะ Llama 3.1 405B ที่ตัวใหญ่กว่ามากๆ ได้

By arjin Writer on Tag: Claude, Anthropic, Artificial Intelligence, Enterprise, LLM
Claude

Anthropic เปิดตัวแพ็คเกจใช้งานโมเดลปัญญาประดิษฐ์ Claude แบบใหม่สำหรับลูกค้าองค์กร Claude Enterprise มีจุดเด่นในการรองรับชุดความรู้สำหรับองค์กร ขยายขนาดอินพุทที่รองรับ (context windows) เป็น 500K เชื่อมต่อกับ GitHub จึงรองรับงานเขียนโค้ดด้วย และมีฟังก์ชันพื้นฐานความปลอดภัยสำหรับองค์กรเช่น SSO, ระบบจัดการสิทธิ, ระบบแอดมิน ฯลฯ

Anthropic บอกว่ามีลูกค้าที่ร่วมทดสอบ Claude Enterprise แล้วก่อนหน้านี้ เช่น GitLab และ Midjourney

Claude Enterprise ไม่ได้เปิดเผยราคาแพ็คเกจใช้งาน องค์กรที่สนใจต้องติดต่อกับฝ่ายขายของ Anthropic เท่านั้น

By arjin Writer on Tag: Alibaba Cloud, LLM, Qwen
Alibaba Cloud

Alibaba Cloud ปล่อยโมเดล LLM ตระกูล Qwen 2 รุ่นล่าสุด Qwen2-VL โดย VL ย่อมาจาก Vision Language ที่พัฒนาบนพื้นฐานของ Qwen2

Qwen2-VL มีจุดเด่นคือความสามารถในการทำความเข้าใจรูปภาพ ที่มีความละเอียดและอัตราส่วนภาพหลากหลาย ผลการทดสอบทำงานได้ดีกว่าโมเดลประเภทเดียวกัน ซึ่งสามารถนำไปประยุกต์ใช้ได้กับอุปกรณ์ที่ต้องใช้การทำความเข้าใจภาพที่เห็น เช่น สมาร์ทโฟน, หุุ่นยนต์ หรือระบบอัตโนมัติอื่นที่ต้องอาศัยภาพในการตัดสินใจ

By mk Founder on Tag: Llama, Meta, LLM, Artificial Intelligence
Llama

Meta เผยยอดดาวน์โหลดโมเดลภาษาขนาดใหญ่ตระกูล Llama ทะลุ 350 ล้านครั้ง (นับเฉพาะบน Hugging Face) และมีโมเดลเวอร์ชันพัฒนาต่อยอดมากกว่า 60,000 ตัวบน Hugging Face

Llama ถือเป็นโมเดลภาษาขนาดใหญ่ที่เป็นโอเพนซอร์สเกือบ 100% (มีเงื่อนไขการใช้งานจำกัดเฉพาะบริษัทไอทีและคลาวด์รายใหญ่เท่านั้น) เปิดตัวครั้งแรกในเดือนกุมภาพันธ์ 2023 และใช้เวลา 18 เดือน พัฒนาตัวเองกลายมาเป็นโมเดลยอดนิยม

By lew Founder on Tag: Gemini, LLM, Google
Gemini

กูเกิลเปิดตัว Gemini Flash 8B โมเดลแบบปิดที่ภายในเป็นโมเดลขนาดเล็กมากเพียง 8B เท่านั้น แต่ยังได้ความสามารถหลักคล้ายกับโมเดลเต็ม เช่น multimodal รองรับทั้งเสียงและภาพ, รองรับอินพุตถึง 1 ล้านโทเค็น

By lew Founder on Tag: Cerebras, Artificial Intelligence, LLM, Cloud
Cerebras

Cerebras บริษัทชิปปัญญาประดิษฐ์ เปิดบริการ Cerebras Inference รันโมเดล Llama 3.1 ที่ความเร็วสูง โดยสามารถรัน Llama 3.1 70B ที่ 450 token/s ขณะที่ Llama 3.1 8B ได้ถึง 1,800 token ต่อวินาที นับว่าเป็นบริการที่ความเร็วสูงที่สุดในโลกในตอนนี้ จากเดิมที่ Groq ทำได้ที่ 750 token/s

By mk Founder on Tag: NVIDIA, Mistral, LLM, Artificial Intelligence
NVIDIA

NVIDIA โชว์การปรับปรุงโมเดลภาษา Mistral NeMo 12B ที่เปิดตัวในเดือนกรกฎาคม ให้มีขนาดพารามิเตอร์ลดลงเหลือ 8B แต่ไม่สูญเสียประสิทธิภาพมากนัก ผลคือโมเดล Mistral-NeMo-Minitron 8B ที่ปรับขนาดลดลงแล้ว เอาชนะโมเดลคู่แข่งระดับใกล้เคียงกันอย่าง Llama 3.1 8B และ Gemma 7B ในเบนช์มาร์ค AI ทุกตัวได้

เทคนิคการปรับลดขนาดโมเดลที่ NVIDIA ใช้งานมี 2 อย่าง ได้แก่

By arjin Writer on Tag: Claude, Anthropic, LLM
Claude

Anthropic เผยแพร่ System Prompts ของบริการ Generative AI ซึ่งครอบคลุมทั้ง Claude ผ่านเว็บและในแอป iOS, Android แยกเป็นโมเดลล่าสุดทั้ง Claude 3 Opus, Claude 3.5 Sonnet และ Claude 3.5 โดยไม่รวมถึง Anthropic API

By arjin Writer on Tag: Amazon, LLM, Java, Artificial Intelligence, Programming
Amazon

Andy Jassy ซีอีโอ Amazon โพสต์เนื้อหาใน LinkedIn เพื่อนำเสนอความสามารถของระบบผู้ช่วยปัญญาประดิษฐ์สร้างเนื้อหา Amazon Q ที่มีจุดขายหนึ่งสำหรับลูกค้าองค์กรคือการแก้ไขโค้ด และรองรับการย้ายโค้ด Java ไปเวอร์ชันใหม่

By lew Founder on Tag: LLM, Law, California, USA, Anthropic
LLM

Dario Amodei ซีอีโอ Anthropic ผู้พัฒนาโมเดลภาษาขนาดใหญ่ Claude ออกจดหมายแสดงความเห็นด้วยร่างกฎหมายควบคุมการพัฒนาปัญญาประดิษฐ์ SB 1047 ร่างล่าสุด หลังจากที่ก่อนหน้านี้กฎหมายฉบับนี้ถูกคัดค้านอย่างหนัก เช่น Andrew Ng, OpenAI

By lew Founder on Tag: AWS, LLM
AWS

บริการ large language model (LLM) บนคลาวด์รายต่างๆ เปิดทางให้องค์กรสร้างแอปพลิเคชั่นสสำหรับงานเฉพาะทาง เช่น โดยเฉพาะการทำ Retrieval Augmented Generation (RAG) เพื่อสร้างแชตบอตสอบถามข้อมูลเฉพาะทาง ทาง AWS ก็ออกมาแนะนำ 8 ประเด็นที่ต้องระวังด้านความปลอดภัย

แอปแชตที่ AWS ยกตัวอย่างมาประกอบไปด้วย หน้าจอเว็บที่พัฒนาด้วย Streamlit, ตัวแอปพลิเคชั่นหลักพัฒนาด้วย Lambda, ฐานข้อมูล DynamoDB สำหรับการเก็บข้อมูลประวัติการแชตก่อนหน้า, เชื่อมต่อกับ LLM หลักคือ Cluade 3 Sonnet, ดึงข้อมูลเอกสารจาก S3 เข้าไปยัง OpenSearch โดยแปลงข้อความเป็นเวคเตอร์ด้วย Titan Embedding

By arjin Writer on Tag: Procreate, Artificial Intelligence, LLM
Procreate

Procreate แอปวาดภาพยอดนิยมบน iPad ประกาศจุดยืน หลังจากผู้ใช้งาน Procreate แสดงความกังวลว่า ที่สุดแล้วแอปก็จะต้องเข้าสู่กระแสเพิ่มฟีเจอร์ด้าน Generative AI ด้วย ซึ่ง Procreate บอกว่าจะไม่เป็นเช่นนั้น

James Cuda ซีอีโอ Procreate โพสต์วิดีโอใน X บอกว่า Procreate จะไม่มีฟีเจอร์เกี่ยวกับ Generative AI ออกมาในแอป เขายังบอกว่าไม่ชอบสิ่งที่เกิดขึ้นในอุตสาหกรรมตอนนี้ ไม่รู้ว่าตอนจบจะเป็นอย่างไร แต่ยืนยันที่จะอยู่ข้างมนุษย์ผู้สร้างสรรค์ผลงาน

By lew Founder on Tag: OpenAI, LLM, Programming
OpenAI

OpenAI เปิดตัวชุดทดสอบปัญญาประดิษฐ์ SWE-Bench Verified ที่สร้างต่อจาก SWE-Bench ชุดทดสอบการเขียนโปรแกรมที่ได้รับความนิยมสูง โดยแก้ปัญหาคุณภาพของชุดข้อมูลเดิมที่อาศัยการกวาด GitHub Issue มาเป็นโจทย์ให้ปัญญาประดิษฐ์

SWE-Bench อาศัยคำถามและชุดทดสอบซอฟต์แวร์เท่านั้น ในการทดสอบตัว AI จะมองไม่เห็นชุดทดสอบแต่เห็นเฉพาะปัญหา และต้องพยายามเขียนโปรแกรมให้รันผ่านชุดทดสอบให้ได้ แบบเดียวกับการสอบเขียนโปรแกรม แต่เป็นปัญหาจริงในการทำงาน

By arjin Writer on Tag: OpenAI, SearchGPT, Search Engine, LLM, Artificial Intelligence
OpenAI

ก่อนหน้านี้ OpenAI ได้เปิดตัว SearchGPT ซึ่งเป็นบริการค้นหาข้อมูลแบบเรียลไทม์จากอินเทอร์เน็ตพลัง AI ที่หลายคนมองว่าทำให้การแข่งขันกับกูเกิลดูเข้าใกล้มากขึ้น อย่างไรก็ตาม SearchGPT เป็นบริการสถานะต้นแบบ ที่ใครต้องการต้องลงชื่อ waitlist ก่อน

ล่าสุดคนที่สมัครรอใน waitlist แต่ยังไม่ได้คำเชิญทดสอบใช้งาน ต่างได้รับอีเมลจาก OpenAI โดยบอกว่าตอนนี้ผู้ใช้งานที่ยังไม่ได้รับคำเชิญ ก็จะต้องรอต่อไปก่อน ซึ่งหากบริการขยายจำนวนผู้ใช้งานก็จะแจ้งอีกครั้ง ในหน้าสมัคร waitlist ตอนนี้ก็ปิดรับสมัครเพิ่มเติมด้วย

By arjin Writer on Tag: Runway, Artificial Intelligence, LLM
Runway

Runway เปิดตัว Gen-3 Alpha Turbo โมเดลสร้างวิดีโอด้วยปัญญาประดิษฐ์รุ่นล่าสุด ที่พัฒนาต่อจากรุ่นก่อนหน้าคือ Gen-3 Alpha โดยมีจุดเด่นตามชื่อนั่นคือ สร้างวิดีโอได้เร็วขึ้น 7 เท่า พร้อมกับค่าใช้จ่ายที่ถูกลงครึ่งหนึ่งเมื่อเทียบกับ Gen-3 Alpha

โมเดล Gen-3 Alpha Turbo เปิดให้ใช้งานสำหรับลูกค้า Runway ทุกเทียร์ รวมทั้งแผนใช้งานฟรี ซึ่งเป็นเป้าหมายของ Runway ที่ต้องการให้โมเดลสร้างวิดีโอจาก AI เข้าถึงผู้ใช้งานในวงกว้างมากที่สุด

By arjin Writer on Tag: Grammarly, Artificial Intelligence, LLM
Grammarly

Grammarly เปิดตัว Grammarly Authorship เครื่องมือสำหรับตรวจสอบว่าบทความนั้นถูกเขียนโดยมนุษย์ หรือเขียนขึ้นด้วย AI หรือใช้ AI แก้ไขเนื้อหา ซึ่ง Grammarly บอกว่าปัจจุบันมีเครื่องมือหลายตัวที่อ้างว่าสามารถตรวจจับบทความที่เขียนด้วย AI แต่ Authorship ใช้วิธีเชื่อมโยงกับเนื้อหาต้นฉบับในแอปและเว็บไซต์ถึง 5 แสนแห่ง เพื่อระบุว่าส่วนใดในบทความที่เขียนโดยคน ส่วนใดที่ตัดแปะ และส่วนใดที่เขียนด้วย AI

By arjin Writer on Tag: ChatGPT, OpenAI, LLM
ChatGPT

OpenAI ประกาศว่าได้อัปเดตโมเดล Generative AI เวอร์ชันย่อยของ GPT-4o ในชื่อ chatgpt-4o-latest ซึ่งบอกว่าเริ่มอัปเดตให้ผู้ใช้งาน ChatGPT ตั้งแต่สัปดาห์ที่แล้ว

ในรายละเอียดเพิ่มเติม (Release Note) OpenAI บอกว่าโมเดลใหม่ที่อัปเดตนี้ได้แก้ไขบั๊กและปรับปรุงประสิทธิภาพการทำงาน ซึ่งมาจากที่ OpenAI ค้นพบเองและจากฟีดแบ็กของผู้ใช้งาน โดย OpenAI ไม่ได้ระบุรายละเอียดสิ่งที่แตกต่างไปจากโมเดลก่อนหน้านี้

By arjin Writer on Tag: xAI, Grok, LLM, Artificial Intelligence
xAI

xAI เผยแพร่โมเดล AI เวอร์ชันล่าสุดของ Grok มีสองโมเดลได้แก่ Grok-2 และ Grok-2 mini โดยทั้งสองโมเดลอยู่ในสถานะเบต้า ระบุว่าได้รับการปรับปรุงกระบวนการให้เหตุผล (reasoning) และมีผลทดสอบประสิทธิภาพที่ชนะทั้ง Claude 3.5 Sonnet และ GPT-4-Turbo

By lew Founder on Tag: Alibaba Cloud, LLM, Qwen
Alibaba Cloud

Alibaba Cloud ปล่อยโมเดล LLM แบบโอเพนซอร์สตระกูล Qwen 2 เพิ่มอีกสองรุ่น ได้แก่ Qwen2-Math และ Qwen2-Audio

Qwen2-Math เป็นโมเดลที่ฝึกต่อจก Qwen2 โดยสร้างชุดข้อมูลคุณภาพสูงด้านคณิตศาสตร์เฉพาะ ทั้งหนังสือ, โค้ดต่างๆ, ชุดข้อสอบต่างๆ, จนถึงข้อมูลที่สังเคราะห์ออกมาจาก Qwen2 เอง จุดเด่นของโมเดลนี้คือทำคะแนนทดสอบด้านคณิตศาสตร์ เช่น GSM8K, MATH หรือ MMLU-STEM ได้สูงกว่าโมเดลปิดอย่าง GPT-4o หรือ Gemini เสียอีก

Qwen2-Math ยังใช้งานได้เฉพาะภาษาอังกฤษเท่านั้น และมี 3 ขนาด คือ 1.5B, 7B, 72B เปิดให้ใช้งานแบบสัญญาอนุญาต Apache 2.0 ทีมงานระบุว่าจะเปิดเวอร์ชั่นภาษาจีนเร็วๆ นี้

By lew Founder on Tag: OpenAI, LLM
OpenAI

OpenAI เพิ่มฟีเจอร์ในการเรียก ChatCompletion API ให้สามารถกำหนด format ของค่าที่คืนมาเป็นไปตาม JSON Schema ที่กำหนดได้เต็ม 100%

คำสั่งบังคับให้คืนค่าตาม JSON Schema ที่กำหนดนี้สามารถใช้กับ Chat Completion ได้ทุกโมเดล อย่างไรก็ดีโมเดลที่ทาง OpenAI ทดสอบแล้วได้ผลเต็ม 100% จะเป็น gpt-4o-2024-08-06 ที่เพิ่งออกมาวันนี้

ในกรณีที่โมเดลไม่สามารถตอบกลับตาม JSON Schema ที่กำหนดได้ จะไม่คืนค่าตามปกติ แต่ใส่ข้อความมาในฟิลด์ refusal แทน ทำให้ผู้ใช้ตรวจสอบได้โดยง่ายว่ากำลังได้ข้อมูลตามต้องการหรือไม่

Subscribe to LLM