Image

Large Language Model

By arjin Writer on Tag: ChatGPT, OpenAI, Artificial Intelligence, LLM
ChatGPT

OpenAI เปิดตัว Canvas อินเทอร์เฟซสำหรับการใช้งาน ChatGPT แบบใหม่ ซึ่ง OpenAI บอกว่าเหมาะกับงานเขียนเนื้อหาบทความ หรืองานเขียนโค้ด ซึ่งแตกต่างไปจากวิธีการแชทสนทนาแบบเดิม

Canvas ทำงานโดยเปิดเป็นหน้าต่างแยกจากกล่องแชทหลัก เป็นพื้นที่ให้สามารถจัดการสิ่งที่ต้องการ ปรับแต่งผลลัพธ์ ระบุความต้องการเฉพาะได้ง่ายขึ้นกว่าวิธีการป้อน Prompt ไปมา

By mk Founder on Tag: Gemini, Google, LLM
Gemini

กูเกิลเปิดให้ใช้งาน Gemini 1.5 Flash-8B โมเดลรุ่นเล็กสุดของ Gemini Flash ที่เปิดทดลองใช้ฟรีก่อนหน้านี้

Gemini 1.5 Flash-8B เป็นโมเดลที่ปรับขนาดให้เล็กลงเหลือ 8 พันล้านพารามิเตอร์ ในแง่ความฉลาดอาจลดลงบ้างเมื่อเทียบกับ Gemini 1.5 Flash รุ่นปกติ แลกกับข้อดีที่ได้มาคือ ราคาถูกลง 50%, ตอบสนองเร็วขึ้น, และมีอัตรา rate limit เพิ่มขึ้น 2 เท่า (สูงสุด 4,000 รีเควสต์ต่อนาที ของเดิม 2,000 รีเควสต์ต่อนาที)

ราคาของ Gemini 1.5 Flash-8B ถือว่าถูกที่สุดในการรันโมเดล Gemini ทุกตัว ได้แก่

By mk Founder on Tag: Gemini, Android, LLM, Google, Development
Gemini

กูเกิลเปิดให้นักพัฒนาแอพบน Android เรียกใช้งานโมเดล Gemini Nano เป็นการทั่วไป หลังจากทดสอบแบบจำกัดวงมาตั้งแต่ Google I/O 2024 โดยตอนนี้ใช้โมเดล Gemini Nano 2 ที่มีประสิทธิภาพดีขึ้นด้วย

การใช้งาน Gemini Nano ต้องเรียกผ่าน AICore โดยมี AI Edge SDK อีกที ตอนนี้การใช้งานยังจำกัดเฉพาะบนฮาร์ดแวร์ Pixel 9 series เท่านั้น และสถานะการเปิดใช้ยังเป็นการทดลองใช้งาน (experimental)

By lew Founder on Tag: OpenAI, LLM
OpenAI

OpenAI ประกาศฟีเจอร์ฝั่งนักพัฒนาชุดใหญ่ โดยฟีเจอร์สำคัญคือการเปิด API รับข้อมูลเสียงโดยตรงเปิดทางสร้างแอปพลิเคชั่นคุยแบบธรรมชาติใน Advanced Voice Mode จากเดิมที่นักพัฒนานอก OpenAI ไม่สามารถทำแอปเหมือนกันได้

By arjin Writer on Tag: NotebookLM, Google, Gemini, Artificial Intelligence, LLM
NotebookLM

กูเกิลอัปเดตฟีเจอร์ให้ NotebookLM แอปจดบันทึกที่ทำงานด้วย Gemini 1.5 และรองรับภาษาไทย โดยเพิ่มการรองรับข้อมูลต้นทางต่อไปนี้

  • URL ของวิดีโอ YouTube ที่เป็นสาธารณะ
  • ไฟล์เสียง (Audio)

กูเกิลยกตัวอย่างกรณีที่สามารถนำ NotebookLM มาช่วยสร้างบันทึกจากข้อมูลต้นทางกลุ่มนี้ เช่น ทำสรุปเนื้อหาวิดีโอทั่วไป วิดีโอเลกเชอร์ รวมทั้งไฟล์เสียงที่บันทึกจากในห้องเรียน

นอกจากนี้กูเกิลยังอัปเดต Audio Overview ฟีเจอร์สร้างไฟล์เสียงแบบพอดคาสต์สรุปเนื้อหาเอกสาร โดยสามารถแชร์ไฟล์เสียงได้โดยตรงภายในแอปแล้ว

Meta AI

Meta ประกาศเพิ่มความสามารถหลายอย่างให้กับบริการปัญญาประดิษฐ์ Meta AI ซึ่งดึงความสามารถจากโมเดลล่าสุด Llama 3.2 ที่เปิดตัว มีรายละเอียดดังนี้

  • สนทนาเสียง สามารถคุยเสียงกับ Meta AI ได้แล้ว โดยระบบจะโต้ตอบกลับมาเป็นเสียงเช่นกัน รองรับทั้ง Messenger, Facebook, WhatsApp และ Instagram DM
By lew Founder on Tag: Meta, Llama, LLM
Meta

Meta เปิดตัว Llama 3.2 โมเดล LLM เพิ่มรุ่นรองรับอินพุตเป็นภาพ ที่มีความสามารถระดับเดียวกับ GPT-4o-mini พร้อมกับโมเดลรุ่นเล็กขนาด 1B ที่ความสามารถใกล้เคียงโมเดลกลุ่มขนาดเล็กด้วยกัน

By arjin Writer on Tag: Snapchat, Google Cloud, LLM, Artificial Intelligence
Snapchat

นอกจาก Warner Bros. Discovery แล้ว Google Cloud ยังประกาศความร่วมมือกับ Snap เจ้าของแอป Snapchat เพื่อสนับสนุนการประมวลผล AI ในบริการแชทบอต My AI ของ Snapchat

Snapchat จะนำโมเดล AI ข้อมูลผสมผสานของ Gemini ที่ทำงานบน Vertex AI ซึ่งรองรับข้อมูลทั้งตัวหนังสือ ภาพ วิดีโอ เสียง มาพัฒนาเป็นฟีเจอร์ใหม่ให้ผู้ใช้งาน My AI เช่น แปลป้ายตามถนนในภาษาต่าง ๆ ได้ หรือถ่ายภาพขนมแล้วให้ AI เลือกว่าอันไหนดีต่อสุขภาพที่สุด เป็นต้น

By arjin Writer on Tag: ChatGPT, OpenAI, Artificial Intelligence, LLM
ChatGPT

OpenAI ประกาศว่าความสามารถสนทนาเสียง Advanced Voice Mode (AVM) ได้เริ่มเปิดให้ใช้งานสำหรับลูกค้าเสียเงินทุกคนแล้วทั้ง ChatGPT Plus และ ChatGPT Team หลังจากทดสอบในกลุ่มจำกัดและเลื่อนจากกำหนดเดิมก่อนหน้านี้ ส่วนลูกค้ากลุ่ม Enterprise และ Edu จะได้ใช้ในสัปดาห์หน้า

ฟีเจอร์ Advanced Voice ใน ChatGPT ยังได้รับการปรับปรุงอนิเมชันในหน้าสนทนา เปลี่ยนจากจุดสีดำ มาเป็นวงกลมสีฟ้า มีการปรับปรุงความเร็วและความลื่นไหลในการออกเสียงสนทนา และเพิ่มอีก 5 เสียงใหม่ได้แก่ Arbor, Maple, Sol, Spruce และ Vale รวมเป็นทั้งหมด 9 ตัวเลือกเสียง ส่วนเสียง Sky ถูกตัดออกไปเพราะประเด็นกับ Scarlett Johansson

By arjin Writer on Tag: Amazon, Advertising, LLM, Artificial Intelligence
Amazon

Amazon เปิดตัวเครื่องมือใหม่สำหรับการสร้างโฆษณาบน Amazon Ads ที่ใช้ Generative AI พัฒนาต่อจากเครื่องมือสร้างรูปฉากหลังที่ออกมาก่อนหน้านี้ โดยคราวนี้สามารถสร้างวิดีโอสั้นเพื่อใช้ในการโฆษณา

อินพุทที่ต้องใช้คือรูปภาพสินค้าหนึ่งรูป จากนั้น AI จะสร้างวิดีโอสั้นที่ดึงจุดเด่นของสินค้าประกอบเป็นเรื่องราวในหลายรูปแบบ หลายฉากหลัง ให้เลือกเพื่อนำไปใช้งานต่อได้ นอกจากนี้ Amazon ยังเพิ่มเครื่องมือสร้างรูปภาพแบบ Live ที่ทำให้วัตถุดูมีชีวิตชีวาขึ้นอีกด้วย

By lew Founder on Tag: Mistral, LLM
Mistral

Mistral ผู้พัฒนาปัญญาประดิษฐ์ LLM จากฝรั่งเศสประกาศปรับราคาค่าใช้งาน API ผ่าน Le Plateforme ลง พร้อมกับเพิ่มแพ็กเกจใช้งานฟรีเข้ามา

โมเดลที่ลดราคามากที่สุด คือ Mistral Small และ Codestral ที่ลดราคาลงถึง 80% เหลือเพียง 0.2 ดอลลาร์ต่อล้านโทเค็นสำหรับอินพุตและ 0.6 ดอลลาร์ต่อล้านโทเค็นสำหรับเอาท์พุต แม้จะลดราคาแล้วก็ยังแพงกว่า Gemini Flash อยู่ประมาณ 1 เท่าตัวแม้ความสามารถใกล้เคียงกัน อย่างไรก็ดี Mistral Small มีตัวเลือกให้ดาวน์โหลดมาใช้งานในองค์กรได้

By lew Founder on Tag: Alibaba Cloud, LLM, Qwen
Alibaba Cloud

Alibaba Cloud เปิดบริการ LLM ของตัวเองในตระกูล Qwen แต่เป็นเวอร์ชั่นไม่เปิดให้ดาวน์โหลดโมเดล ได้แก่ Qwen-Max, Qwen-Plus, และ Qwen-Turbo โดยชูความสามารถของ Qwen-Max ว่าใกล้เคียง Llama3.1-405B และ GPT-4o แล้ว โดยเอาชนะได้บางขุดทดสอบ เช่น MATH หรือ LiveCodeBenach

ราคาค่าใช้งาน Qwen-Max อยู่ที่ 10 ดอลลาร์ต่อล้านโทเค็นสำหรับอินพุต และ 30 ดอลลาร์ต่อล้านโทเค็นสำหรับเอาท์พุต แพงกว่า GPT-4o ประมาณเท่าตัว

By lew Founder on Tag: Alibaba Cloud, LLM, Qwen
Alibaba Cloud

Alibaba Cloud เปิดตัวโมเดลปัญญาประดิษฐ์ Qwen เวอร์ชั่น 2.5 จุดเด่นของโมเดลเวอร์ชั่นนี้คือฝึกด้วยข้อมูลขนาดถึง 18 ล้านล้านโทเค็น รองรับ 29 ภาษารวมภาษาไทย โดยเปิดให้ใช้งานได้อิสระแทบทุกรุ่น

ตัวโมเดลรองรับอินพุต 128K token และตอบข้อมูลได้ 8K token ยกเว้นรุ่น 3B ลงไปจะรองรับอินพุต 32K token เท่านั้น

รุ่นใหญ่สุด Qwen2.5-72B ได้ผลทดสอบชนะ Llama3.1-70B แทบทุกการทดสอบขึ้นไปใกล้เคียง Llama3.1-405B แต่เวอร์ชั่น 72B แจกแบบ Qwen License ซึ่งจำกัดการใช้งานกับบริการที่ผู้ใช้เกิน 100 ล้านคนต่อเดือน

By arjin Writer on Tag: Gemma, Google, LLM, Gemini
Gemma

กูเกิลเปิดตัว DataGemma โมเดล LLM ที่ออกแบบมาเพื่อแก้ปัญหาหลอน (hallucination) ที่มักพบในโมเดล LLM จากการมั่นใจแล้วให้ข้อมูลที่ผิดพลาด ซึ่งกูเกิลแก้ปัญหานี้ด้วยการเชื่อมต่อกับฐานข้อมูลปัจจุบันในการอ้างอิง

แพลตฟอร์มที่กูเกิลใช้เรียกว่า Data Commons เป็น Knowledge Graph ที่มีชุดข้อมูลมากกว่า 240 พันล้านจุด ใช้แหล่งข้อมูลที่น่าเชื่อถือทั้งจาก United Nations (UN), World Health Organization (WHO), Centers for Disease Control and Prevention (CDC) และ Census Bureaus ทำให้ได้ผลลัพธ์เป็น AI ที่สามารถให้ข้อมูลที่ถูกต้อง

By arjin Writer on Tag: OpenAI, LLM, Artificial Intelligence
OpenAI

หลังจาก OpenAI เปิดตัว o1 โมเดลปัญญาประดิษฐ์ที่มีความสามารถคิดอย่างเป็นเหตุเป็นผลตามลำดับขั้น ซึ่งเหมาะสำหรับใช้ตอบคำถามวิทยาศาสตร์-คณิตศาสตร์ OpenAI ก็เผยแพร่ System Card เพื่อรายงานผลการประเมินความเสี่ยงของโมเดลปัญญาประดิษฐ์นี้ด้วย

By mk Founder on Tag: Gemini, Android, LLM, Artificial Intelligence, Google
Gemini

กูเกิลเริ่มทยอยปล่อย Gemini Live บริการแชทบอทโต้ตอบด้วยเสียงแบบเรียลไทม์ ให้กับผู้ใช้ Android ทั่วไป หลังปล่อยให้ผู้สมัครแพ็กเกจเสียเงิน Gemini Advanced ตั้งแต่เดือนที่แล้ว

ประกาศของกูเกิลระบุแค่ว่ายังรองรับเฉพาะภาษาอังกฤษ และต้องใช้ผ่านแแอพ Gemini บน Android เท่านั้น แต่ไม่ได้ให้รายละเอียดว่าผู้ใช้แบบฟรีได้จะใช้งานโมเดล Gemini 1.5 Pro ที่เก่งกว่าเวอร์ชันฟรีด้วยหรือไม่

ที่มา - 9to5google

By arjin Writer on Tag: Mistral, Artificial Intelligence, LLM
Mistral

Mistral AI เปิดตัวโมเดล Pixtral 12B ซึ่งเป็นโมเดลข้อมูลผสมผสานตัวแรกของบริษัท พัฒนาต่อยอดจากโมเดลตัวหนังสือ Nemo 12B เป็นโมเดลขนาดพารามิเตอร์ 12B ขนาดของไฟล์ประมาณ 24GB

Pixtral 12B สามารถทำงานได้เหมือนโมเดลข้อมูลผสมผสานอื่น เช่น การจำแนกรายละเอียดในภาพ หรือการนับวัตถุในภาพ เป็นต้น

ดูรายละเอียดเพิ่มเติมได้ที่ GitHub หรือ Hugging Face ภายใต้สัญญา Apache 2.0

By lew Founder on Tag: OpenAI, LLM
OpenAI

OpenAI เปิดตัวโมเดลปัญญาประดิษฐ์รุ่นใหม่ตระกูล o1 เป็นโมเดลเน้นตอบคำถามด้านวิทยาศาสตร์, คณิตศาสตร์, และการเขียนโปรแกรม แนวทางการทำงานต่างจากโมเดลก่อนหน้านี้คือ o1 มีความสามารถ "ค่อยๆ คิด" ก่อนจะทำให้คำตอบ ทำให้สามารถตอบสนองต่อคำสั่งที่ซับซ้อน เช่น การสร้างเกมตามกำหนด

By arjin Writer on Tag: NotebookLM, Google, Gemini, Artificial Intelligence, LLM, Podcast
NotebookLM

กูเกิลประกาศเพิ่มความสามารถใหม่ให้ NotebookLM แอปจดบันทึกที่ทำงานด้วย Gemini 1.5 ซึ่งปัจจุบันสามารถใช้งานในไทยได้ด้วย โดยฟีเจอร์ใหม่มีชื่อว่า Audio Overview

ถ้าอธิบายแบบให้เห็นภาพง่ายที่สุด Audio Overview จะทำการแปลงเนื้อหาในเอกสารของผู้ใช้งาน ให้เป็นรายการพอดคาสต์ที่มีผู้ดำเนินรายการสองคน ... โดยจะสร้างเสียงขึ้นเป็นสองผู้ดำเนินรายการด้วย AI แล้วทั้งคู่จะสนทนาบนเนื้อหาต้นฉบับ สรุป และเชื่อมต่อข้อมูลต่าง ๆ ในนั้น ผู้ใช้งานยังสามารถดาวน์โหลดไฟล์เสียงนี้ออกมาได้ด้วย

By lew Founder on Tag: ESPN, LLM, Football, Artificial Intelligence
ESPN

ESPN ถูกวิจารณ์หลังจากบทความสรุปการแข่งขันฟุตบอลหญิงระหว่าง San Diego และ North Carolina ไม่พูดถึง Alex Morgan นักเตะหญิงมืออาชีพที่เล่นนัดนี้เป็นเกมสุดท้ายเลย

Alex Morgan ลงเล่นในเกมนี้ 15 นาที และเป็นผู้เตะลูกโทษ แต่สรุปเกมของ ESPN Generative AI Services บอกเพียงว่าเกมจบที่คะแนนเท่าใด ใครทำประตูบ้าง โดยไม่ได้พูดถึงความสำคัญของเกมนี้ว่าเป็นเกมสุดท้ายของ Alex Morgan นักฟุตบอลหญิงที่เคยได้เหรียญทองโอลิมปิกเลย

Subscribe to LLM