LLM | Blognone

Large Language Model

OpenAI เปิดตัว Canvas อินเทอร์เฟซแบบใหม่ในการใช้ ChatGPT สำหรับงานเขียนเนื้อหา-เขียนโค้ด

By arjin

on 4 October 2024 - 07:40 Tag: ChatGPT, OpenAI, Artificial Intelligence, LLM

ChatGPT

OpenAI เปิดตัว Canvas อินเทอร์เฟซสำหรับการใช้งาน ChatGPT แบบใหม่ ซึ่ง OpenAI บอกว่าเหมาะกับงานเขียนเนื้อหาบทความ หรืองานเขียนโค้ด ซึ่งแตกต่างไปจากวิธีการแชทสนทนาแบบเดิม

Canvas ทำงานโดยเปิดเป็นหน้าต่างแยกจากกล่องแชทหลัก เป็นพื้นที่ให้สามารถจัดการสิ่งที่ต้องการ ปรับแต่งผลลัพธ์ ระบุความต้องการเฉพาะได้ง่ายขึ้นกว่าวิธีการป้อน Prompt ไปมา

กูเกิลเปิดบริการ Gemini 1.5 Flash-8B โมเดลรุ่นเล็กสุด ราคาถูกลง 50% จาก Flash รุ่นปกติ

By mk

on 4 October 2024 - 06:52 Tag: Gemini, Google, LLM

Gemini

กูเกิลเปิดให้ใช้งาน Gemini 1.5 Flash-8B โมเดลรุ่นเล็กสุดของ Gemini Flash ที่เปิดทดลองใช้ฟรีก่อนหน้านี้

Gemini 1.5 Flash-8B เป็นโมเดลที่ปรับขนาดให้เล็กลงเหลือ 8 พันล้านพารามิเตอร์ ในแง่ความฉลาดอาจลดลงบ้างเมื่อเทียบกับ Gemini 1.5 Flash รุ่นปกติ แลกกับข้อดีที่ได้มาคือ ราคาถูกลง 50%, ตอบสนองเร็วขึ้น, และมีอัตรา rate limit เพิ่มขึ้น 2 เท่า (สูงสุด 4,000 รีเควสต์ต่อนาที ของเดิม 2,000 รีเควสต์ต่อนาที)

ราคาของ Gemini 1.5 Flash-8B ถือว่าถูกที่สุดในการรันโมเดล Gemini ทุกตัว ได้แก่

กูเกิลเปิดให้นักพัฒนา Android เรียกใช้โมเดล Gemini Nano ประมวลผลในเครื่องแล้ว

By mk

on 2 October 2024 - 20:30 Tag: Gemini, Android, LLM, Google, Development

Gemini

กูเกิลเปิดให้นักพัฒนาแอพบน Android เรียกใช้งานโมเดล Gemini Nano เป็นการทั่วไป หลังจากทดสอบแบบจำกัดวงมาตั้งแต่ Google I/O 2024 โดยตอนนี้ใช้โมเดล Gemini Nano 2 ที่มีประสิทธิภาพดีขึ้นด้วย

การใช้งาน Gemini Nano ต้องเรียกผ่าน AICore โดยมี AI Edge SDK อีกที ตอนนี้การใช้งานยังจำกัดเฉพาะบนฮาร์ดแวร์ Pixel 9 series เท่านั้น และสถานะการเปิดใช้ยังเป็นการทดลองใช้งาน (experimental)

OpenAI เปิด API ให้คุยเสียงได้โดยตรง, ฝึกโมเดลด้วยรูปภาพได้, ฝึกโมเดลขนาดเล็กด้วยโมเดลใหญ่

By lew

on 2 October 2024 - 03:15 Tag: OpenAI, LLM

OpenAI

OpenAI ประกาศฟีเจอร์ฝั่งนักพัฒนาชุดใหญ่ โดยฟีเจอร์สำคัญคือการเปิด API รับข้อมูลเสียงโดยตรงเปิดทางสร้างแอปพลิเคชั่นคุยแบบธรรมชาติใน Advanced Voice Mode จากเดิมที่นักพัฒนานอก OpenAI ไม่สามารถทำแอปเหมือนกันได้

NotebookLM ของ Google รองรับวิดีโอสาธารณะบน YouTube และไฟล์เสียง มีประโยชน์ช่วยทำสรุปเลกเชอร์

By arjin

on 27 September 2024 - 16:40 Tag: NotebookLM, Google, Gemini, Artificial Intelligence, LLM

NotebookLM

กูเกิลอัปเดตฟีเจอร์ให้ NotebookLM แอปจดบันทึกที่ทำงานด้วย Gemini 1.5 และรองรับภาษาไทย โดยเพิ่มการรองรับข้อมูลต้นทางต่อไปนี้

URL ของวิดีโอ YouTube ที่เป็นสาธารณะ
ไฟล์เสียง (Audio)

กูเกิลยกตัวอย่างกรณีที่สามารถนำ NotebookLM มาช่วยสร้างบันทึกจากข้อมูลต้นทางกลุ่มนี้ เช่น ทำสรุปเนื้อหาวิดีโอทั่วไป วิดีโอเลกเชอร์ รวมทั้งไฟล์เสียงที่บันทึกจากในห้องเรียน

นอกจากนี้กูเกิลยังอัปเดต Audio Overview ฟีเจอร์สร้างไฟล์เสียงแบบพอดคาสต์สรุปเนื้อหาเอกสาร โดยสามารถแชร์ไฟล์เสียงได้โดยตรงภายในแอปแล้ว

Meta AI เพิ่มความสามารถสนทนาเสียง, วิเคราะห์รูปภาพ, แปลและพากย์เสียง Reels

By arjin

on 26 September 2024 - 14:08 Tag: Meta AI, Meta, Artificial Intelligence, LLM, Reels, Facebook, Facebook Messenger, Instagram, WhatsApp

Meta AI

Meta ประกาศเพิ่มความสามารถหลายอย่างให้กับบริการปัญญาประดิษฐ์ Meta AI ซึ่งดึงความสามารถจากโมเดลล่าสุด Llama 3.2 ที่เปิดตัว มีรายละเอียดดังนี้

สนทนาเสียง สามารถคุยเสียงกับ Meta AI ได้แล้ว โดยระบบจะโต้ตอบกลับมาเป็นเสียงเช่นกัน รองรับทั้ง Messenger, Facebook, WhatsApp และ Instagram DM

Meta เปิดตัว Llama 3.2 เพิ่มรุ่นอ่านภาพได้, มีโมเดลขนาดเล็กเน้นรันในโทรศัพท์ พร้อมชุดพัฒนาซอฟต์แวร์ของตัวเอง

By lew

on 26 September 2024 - 01:28 Tag: Meta, Llama, LLM

Snapchat ประกาศความร่วมมือกับ Google Cloud รองรับการประมวลผลในฟีเจอร์ My AI

By arjin

on 25 September 2024 - 08:11 Tag: Snapchat, Google Cloud, LLM, Artificial Intelligence

Snapchat

นอกจาก Warner Bros. Discovery แล้ว Google Cloud ยังประกาศความร่วมมือกับ Snap เจ้าของแอป Snapchat เพื่อสนับสนุนการประมวลผล AI ในบริการแชทบอต My AI ของ Snapchat

Snapchat จะนำโมเดล AI ข้อมูลผสมผสานของ Gemini ที่ทำงานบน Vertex AI ซึ่งรองรับข้อมูลทั้งตัวหนังสือ ภาพ วิดีโอ เสียง มาพัฒนาเป็นฟีเจอร์ใหม่ให้ผู้ใช้งาน My AI เช่น แปลป้ายตามถนนในภาษาต่าง ๆ ได้ หรือถ่ายภาพขนมแล้วให้ AI เลือกว่าอันไหนดีต่อสุขภาพที่สุด เป็นต้น

OpenAI เริ่มอัปเดตฟีเจอร์ Advanced Voice Mode ให้ลูกค้า ChatGPT แบบเสียเงินแล้ว

By arjin

on 25 September 2024 - 07:22 Tag: ChatGPT, OpenAI, Artificial Intelligence, LLM

ChatGPT

OpenAI ประกาศว่าความสามารถสนทนาเสียง Advanced Voice Mode (AVM) ได้เริ่มเปิดให้ใช้งานสำหรับลูกค้าเสียเงินทุกคนแล้วทั้ง ChatGPT Plus และ ChatGPT Team หลังจากทดสอบในกลุ่มจำกัดและเลื่อนจากกำหนดเดิมก่อนหน้านี้ ส่วนลูกค้ากลุ่ม Enterprise และ Edu จะได้ใช้ในสัปดาห์หน้า

ฟีเจอร์ Advanced Voice ใน ChatGPT ยังได้รับการปรับปรุงอนิเมชันในหน้าสนทนา เปลี่ยนจากจุดสีดำ มาเป็นวงกลมสีฟ้า มีการปรับปรุงความเร็วและความลื่นไหลในการออกเสียงสนทนา และเพิ่มอีก 5 เสียงใหม่ได้แก่ Arbor, Maple, Sol, Spruce และ Vale รวมเป็นทั้งหมด 9 ตัวเลือกเสียง ส่วนเสียง Sky ถูกตัดออกไปเพราะประเด็นกับ Scarlett Johansson

Amazon เพิ่มเครื่องมือสร้างวิดีโอสั้นสำหรับการโฆษณาด้วย AI ที่ใช้อินพุทเพียงรูปภาพของสินค้า

By arjin

on 24 September 2024 - 15:27 Tag: Amazon, Advertising, LLM, Artificial Intelligence

Amazon

Amazon เปิดตัวเครื่องมือใหม่สำหรับการสร้างโฆษณาบน Amazon Ads ที่ใช้ Generative AI พัฒนาต่อจากเครื่องมือสร้างรูปฉากหลังที่ออกมาก่อนหน้านี้ โดยคราวนี้สามารถสร้างวิดีโอสั้นเพื่อใช้ในการโฆษณา

อินพุทที่ต้องใช้คือรูปภาพสินค้าหนึ่งรูป จากนั้น AI จะสร้างวิดีโอสั้นที่ดึงจุดเด่นของสินค้าประกอบเป็นเรื่องราวในหลายรูปแบบ หลายฉากหลัง ให้เลือกเพื่อนำไปใช้งานต่อได้ นอกจากนี้ Amazon ยังเพิ่มเครื่องมือสร้างรูปภาพแบบ Live ที่ทำให้วัตถุดูมีชีวิตชีวาขึ้นอีกด้วย

Mistral ลดราคา API ลงสูงสุด 80% เพิ่มแพ็กเกจฟรี

By lew

on 23 September 2024 - 10:02 Tag: Mistral, LLM

Mistral

Mistral ผู้พัฒนาปัญญาประดิษฐ์ LLM จากฝรั่งเศสประกาศปรับราคาค่าใช้งาน API ผ่าน Le Plateforme ลง พร้อมกับเพิ่มแพ็กเกจใช้งานฟรีเข้ามา

โมเดลที่ลดราคามากที่สุด คือ Mistral Small และ Codestral ที่ลดราคาลงถึง 80% เหลือเพียง 0.2 ดอลลาร์ต่อล้านโทเค็นสำหรับอินพุตและ 0.6 ดอลลาร์ต่อล้านโทเค็นสำหรับเอาท์พุต แม้จะลดราคาแล้วก็ยังแพงกว่า Gemini Flash อยู่ประมาณ 1 เท่าตัวแม้ความสามารถใกล้เคียงกัน อย่างไรก็ดี Mistral Small มีตัวเลือกให้ดาวน์โหลดมาใช้งานในองค์กรได้

Alibaba Cloud เปิดตัว Qwen-Max, AI แบบปิดซอร์ส ความสามารถใกล้ Lllama3.1-405B/GPT-4o

By lew

on 20 September 2024 - 07:49 Tag: Alibaba Cloud, LLM, Qwen

Alibaba Cloud

Alibaba Cloud เปิดบริการ LLM ของตัวเองในตระกูล Qwen แต่เป็นเวอร์ชั่นไม่เปิดให้ดาวน์โหลดโมเดล ได้แก่ Qwen-Max, Qwen-Plus, และ Qwen-Turbo โดยชูความสามารถของ Qwen-Max ว่าใกล้เคียง Llama3.1-405B และ GPT-4o แล้ว โดยเอาชนะได้บางขุดทดสอบ เช่น MATH หรือ LiveCodeBenach

ราคาค่าใช้งาน Qwen-Max อยู่ที่ 10 ดอลลาร์ต่อล้านโทเค็นสำหรับอินพุต และ 30 ดอลลาร์ต่อล้านโทเค็นสำหรับเอาท์พุต แพงกว่า GPT-4o ประมาณเท่าตัว

Alibaba Cloud เปิดโมเดล Qwen 2.5 ฝึกด้วยข้อมูลขนาดใหญ่มาก รองรับภาษาไทย

By lew

on 19 September 2024 - 22:57 Tag: Alibaba Cloud, LLM, Qwen

Alibaba Cloud

Alibaba Cloud เปิดตัวโมเดลปัญญาประดิษฐ์ Qwen เวอร์ชั่น 2.5 จุดเด่นของโมเดลเวอร์ชั่นนี้คือฝึกด้วยข้อมูลขนาดถึง 18 ล้านล้านโทเค็น รองรับ 29 ภาษารวมภาษาไทย โดยเปิดให้ใช้งานได้อิสระแทบทุกรุ่น

ตัวโมเดลรองรับอินพุต 128K token และตอบข้อมูลได้ 8K token ยกเว้นรุ่น 3B ลงไปจะรองรับอินพุต 32K token เท่านั้น

รุ่นใหญ่สุด Qwen2.5-72B ได้ผลทดสอบชนะ Llama3.1-70B แทบทุกการทดสอบขึ้นไปใกล้เคียง Llama3.1-405B แต่เวอร์ชั่น 72B แจกแบบ Qwen License ซึ่งจำกัดการใช้งานกับบริการที่ผู้ใช้เกิน 100 ล้านคนต่อเดือน

Google เผยแพร่ DataGemma LLM ที่ออกแบบให้ตรวจสอบข้อมูลปัจจุบัน ป้องกันอาการหลอน

By arjin

on 14 September 2024 - 07:32 Tag: Gemma, Google, LLM, Gemini

Gemma

กูเกิลเปิดตัว DataGemma โมเดล LLM ที่ออกแบบมาเพื่อแก้ปัญหาหลอน (hallucination) ที่มักพบในโมเดล LLM จากการมั่นใจแล้วให้ข้อมูลที่ผิดพลาด ซึ่งกูเกิลแก้ปัญหานี้ด้วยการเชื่อมต่อกับฐานข้อมูลปัจจุบันในการอ้างอิง

แพลตฟอร์มที่กูเกิลใช้เรียกว่า Data Commons เป็น Knowledge Graph ที่มีชุดข้อมูลมากกว่า 240 พันล้านจุด ใช้แหล่งข้อมูลที่น่าเชื่อถือทั้งจาก United Nations (UN), World Health Organization (WHO), Centers for Disease Control and Prevention (CDC) และ Census Bureaus ทำให้ได้ผลลัพธ์เป็น AI ที่สามารถให้ข้อมูลที่ถูกต้อง

OpenAI ประเมินความเสี่ยงของปัญญาประดิษฐ์สายคิดคำนวณ o1 ที่ระดับ Medium สูงสุดที่เคยเผยแพร่มา

By arjin

on 14 September 2024 - 06:13 Tag: OpenAI, LLM, Artificial Intelligence

OpenAI

หลังจาก OpenAI เปิดตัว o1 โมเดลปัญญาประดิษฐ์ที่มีความสามารถคิดอย่างเป็นเหตุเป็นผลตามลำดับขั้น ซึ่งเหมาะสำหรับใช้ตอบคำถามวิทยาศาสตร์-คณิตศาสตร์ OpenAI ก็เผยแพร่ System Card เพื่อรายงานผลการประเมินความเสี่ยงของโมเดลปัญญาประดิษฐ์นี้ด้วย

กูเกิลเริ่มปล่อย Gemini Live ให้กับผู้ใช้ Android ที่ใช้งานฟรี

By mk

on 13 September 2024 - 13:03 Tag: Gemini, Android, LLM, Artificial Intelligence, Google

Gemini

กูเกิลเริ่มทยอยปล่อย Gemini Live บริการแชทบอทโต้ตอบด้วยเสียงแบบเรียลไทม์ ให้กับผู้ใช้ Android ทั่วไป หลังปล่อยให้ผู้สมัครแพ็กเกจเสียเงิน Gemini Advanced ตั้งแต่เดือนที่แล้ว

ประกาศของกูเกิลระบุแค่ว่ายังรองรับเฉพาะภาษาอังกฤษ และต้องใช้ผ่านแแอพ Gemini บน Android เท่านั้น แต่ไม่ได้ให้รายละเอียดว่าผู้ใช้แบบฟรีได้จะใช้งานโมเดล Gemini 1.5 Pro ที่เก่งกว่าเวอร์ชันฟรีด้วยหรือไม่

ที่มา - 9to5google

Mistral เปิดตัว Pixtral 12B ที่เป็นโมเดล Multimodal ตัวแรก

By arjin

on 13 September 2024 - 06:19 Tag: Mistral, Artificial Intelligence, LLM

Mistral

Mistral AI เปิดตัวโมเดล Pixtral 12B ซึ่งเป็นโมเดลข้อมูลผสมผสานตัวแรกของบริษัท พัฒนาต่อยอดจากโมเดลตัวหนังสือ Nemo 12B เป็นโมเดลขนาดพารามิเตอร์ 12B ขนาดของไฟล์ประมาณ 24GB

Pixtral 12B สามารถทำงานได้เหมือนโมเดลข้อมูลผสมผสานอื่น เช่น การจำแนกรายละเอียดในภาพ หรือการนับวัตถุในภาพ เป็นต้น

ดูรายละเอียดเพิ่มเติมได้ที่ GitHub หรือ Hugging Face ภายใต้สัญญา Apache 2.0

OpenAI ออกโมเดล o1 ค่อยๆ คิดก่อนตอบ เน้นเขียนโปรแกรมและปัญหาคณิตศาสตร์ นับตัวอักษรถูกแล้ว

By lew

on 13 September 2024 - 00:37 Tag: OpenAI, LLM

OpenAI

OpenAI เปิดตัวโมเดลปัญญาประดิษฐ์รุ่นใหม่ตระกูล o1 เป็นโมเดลเน้นตอบคำถามด้านวิทยาศาสตร์, คณิตศาสตร์, และการเขียนโปรแกรม แนวทางการทำงานต่างจากโมเดลก่อนหน้านี้คือ o1 มีความสามารถ "ค่อยๆ คิด" ก่อนจะทำให้คำตอบ ทำให้สามารถตอบสนองต่อคำสั่งที่ซับซ้อน เช่น การสร้างเกมตามกำหนด

Google เพิ่มความสามารถ NotebookLM สร้าง AI สองคนสนทนาสรุปเนื้อหา ฟีลฟังพอดคาสต์

By arjin

on 12 September 2024 - 11:29 Tag: NotebookLM, Google, Gemini, Artificial Intelligence, LLM, Podcast

NotebookLM

กูเกิลประกาศเพิ่มความสามารถใหม่ให้ NotebookLM แอปจดบันทึกที่ทำงานด้วย Gemini 1.5 ซึ่งปัจจุบันสามารถใช้งานในไทยได้ด้วย โดยฟีเจอร์ใหม่มีชื่อว่า Audio Overview

ถ้าอธิบายแบบให้เห็นภาพง่ายที่สุด Audio Overview จะทำการแปลงเนื้อหาในเอกสารของผู้ใช้งาน ให้เป็นรายการพอดคาสต์ที่มีผู้ดำเนินรายการสองคน ... โดยจะสร้างเสียงขึ้นเป็นสองผู้ดำเนินรายการด้วย AI แล้วทั้งคู่จะสนทนาบนเนื้อหาต้นฉบับ สรุป และเชื่อมต่อข้อมูลต่าง ๆ ในนั้น ผู้ใช้งานยังสามารถดาวน์โหลดไฟล์เสียงนี้ออกมาได้ด้วย

ESPN ถูกโวยหลังบทความสรุปนักเตะฟุตบอลหญิงเขียนโดย AI ไม่เอ่ยถึงนักเตะอาชีพที่เล่นเป็นนัดสุดท้ายเลย

By lew

on 10 September 2024 - 10:20 Tag: ESPN, LLM, Football, Artificial Intelligence

ESPN

ESPN ถูกวิจารณ์หลังจากบทความสรุปการแข่งขันฟุตบอลหญิงระหว่าง San Diego และ North Carolina ไม่พูดถึง Alex Morgan นักเตะหญิงมืออาชีพที่เล่นนัดนี้เป็นเกมสุดท้ายเลย

Alex Morgan ลงเล่นในเกมนี้ 15 นาที และเป็นผู้เตะลูกโทษ แต่สรุปเกมของ ESPN Generative AI Services บอกเพียงว่าเกมจบที่คะแนนเท่าใด ใครทำประตูบ้าง โดยไม่ได้พูดถึงความสำคัญของเกมนี้ว่าเป็นเกมสุดท้ายของ Alex Morgan นักฟุตบอลหญิงที่เคยได้เหรียญทองโอลิมปิกเลย

Subscribe to LLM