LLM | Blognone

Large Language Model

กูเกิลทดลอง Gemini Nano บน Chrome ข้อมูลไม่หลุดจากเครื่อง รองรับโมเดล fine-tune

By lew

on 16 May 2024 - 10:36 Tag: Chrome, LLM, Gemini

Chrome

กูเกิลเปิดโครงการทดลอง Built-in AI เตรียมนำ Gemini Nano มารันใน Chrome โดยตรง เปิดทางให้เบราว์เซอร์มี API ในกลุ่ม LLM เพิ่มเติม

ฟีเจอร์ที่เว็บไซต์จะสามารถใช้งาน LLM บนเว็บได้ เช่น การช่วยสรุป หรือถามตอบคำถามในเนื้อหาบนเว็บเอง ไปจนถึงการเป็นตัวช่วยผู้ใช้เขียนเนื้อหา หรือตรวจคำผิด

ทุกวันนี้เว็บไซต์หลายแห่งรันโมเดลปัญญาประดิษฐ์บนเว็บอยู่แล้ว แต่การใช้งานแบบทุกวันนี้ทำให้ผู้ใช้ต้องดาวน์โหลดไฟล์ขนาดนับร้อยเมกะไบต์ทุกเว็บ และอาจใช้งานฟีเจอร์ต่างๆ ของเครื่องเช่น GPU หรือ NPU ได้จำกัด การที่เบราว์เซอร์มี API โดยตรงให้เลยจะทำให้ออปติไมซ์ได้ดีขึ้น

กูเกิลโชว์ Gemini Nano รุ่นใหม่ เข้าใจภาพและเสียง เตือนได้ทันทีเมื่อถูกโจรโทรมาหลอกเงิน

By lew

on 15 May 2024 - 01:44 Tag: Android, Gemini, LLM, Scam

Android

กูเกิลโชว์ Gemini Nano โมเดลปัญญาประดิษฐ์สำหรับโทรศัพท์รุ่นใหม่รองรับอินพุตหลายรูปแบบทั้งภาพ, เสียง, และข้อความ พร้อมกับความสามารถของแอป Gemini ที่ผูกเข้ากับระบบของแอนดรอยด์เต็มตัว

Gemini Nano อ่านภาพได้ ทำให้สามารถบรรยายภาพได้โดยไม่ต้องมีข้อมูลล่วงหน้า กูเกิลใส่ความสามารถนี้ในฟีเจอร์ TalkBack ที่ช่วยผู้มองเห็นได้จำกัด ทำให้สามารถบรรยายภาพได้อย่างละเอียด นอกจากนี้ยังสามารถฟังเสียงได้ ทำให้สามารถฟังเสียงการสนทนาตลอดเวลาและแจ้งเตือนทันทีเมื่อพบว่าบทสนนนาน่าจะเป็นการหลอกลวง ฟีเจอร์นี้จะเป็นแบบ opt-in ต้องเปิดใช้งานเอง และจะเปิดให้ใช้ภายในปีนี้ (ไม่ระบุประเทศที่รองรับ)

แอป Gemini เพิ่มฟีเจอร์ Live คุยเป็นเสียง พูดแทรกได้, สร้างแชตเฉพาะทางแบบเดียวกับ GPT

By lew

on 15 May 2024 - 01:07 Tag: Gemini, Google, LLM

Gemini

กูเกิลอัพเดต Gemini Advanced เวอร์ชั่นผู้ใช้ทั่วไป เป็น Gemini 1.5 Pro ทำให้รองรับ context window ขนาด 1 ล้านโทเค็นแบบเดียวกับการใช้งานแบบเดียวกับการใช้งานผ่าน API รองรับการอัพโหลดข้อมูลขนาดใหญ่เข้าไปยังแชตได้โดยตรง โดยมีฟีเจอร์ใหม่หลักๆ ได้แก่

กูเกิลอัพเดต Gemini 1.5 ฟังเสียงได้แล้ว เพิ่มรุ่น Flash ราคาประหยัด, ความเร็วสูง

By lew

on 15 May 2024 - 01:04 Tag: Gemini, Google, LLM

Gemini

กูเกิลอัพเดตโมเดล Gemini 1.5 Pro โดยขยาย context window เป็น 2 ล้านโทเค็น ทำให้สามารถรองรับข้อมูลขนาดใหญ่มาก และเชื่อฟังคำสั่งมากขึ้น โดยเฉพาะคำสั่งฟอร์แมต์เอาท์พุต หรือพฤติกรรมของ AI และการวางแผนการทำงานได้ดีขึ้นทำให้สามารถเรียกฟังก์ชั่นภายนอกได้มากขึ้น

นอกจากนี้กูเกิลยังเปิดตัว Gemini 1.5 Flash ที่ราคาประหยัดลงแต่ประสิทธิภาพยังใกล้เคียง Gemini 1.5 Pro โดยอาศัยเทคนิค distillation ที่ดึงความสามารถจากโมเดลขนาดใหญ่ และรองรับ context window ขนาด 1 ล้านโทเค็นเท่ากับรุ่นใหญ่ ราคาค่าใช้งาน 0.35 ดอลลาร์ต่อล้านโทเค็น

ผลทดสอบ Tokenizer ของ GPT-4o ภาษาไทยประหยัดเท่าตัว

By lew

on 14 May 2024 - 10:22 Tag: OpenAI, ChatGPT, LLM

OpenAI

เมื่อคืนที่ผ่านมา OpenAI เปิดตัว GPT-4o พร้อมกับประกาศเปลี่ยน tokenizer ใหม่โดยอาศัย 20 ภาษาต้นแบบในการบีบอัดข้อมูล ทำให้ภาษาต่างๆ ประหยัดโทเค็นยิ่งขึ้น แม้ภาษาไทยจะไม่อยู่ในรายชื่อ 20 ภาษา แต่ผลการทดลองก็พบว่าภาษาไทยนั้นประหยัดโทเค็นลงเท่าตัว

tokenizer ของ GPT-4o สามารถจับคำหรือส่วนของคำในภาษาไทยได้ชัดเจน คำสามัญเช่น "ของ" หรือ "จำนวน" ก็สามารถมองเป็นโทเค็นเดียวได้ทันที เทียบกับ tokenizer ของ GPT-4 ที่ไม่สามารถรวบตัวอักษรหลายตัวในภาษาไทยเข้าด้วยกันได้เลย ทำให้จำนวนโทเค็นกับจำนวนตัวอักษรใกล้เคียงกัน

OpenAI เปิดให้ผู้ใช้งานทุกคนรวมทั้งแบบฟรี ใช้งาน GPTs และ GPT Store ได้แล้ว

By arjin

on 14 May 2024 - 07:39 Tag: ChatGPT, OpenAI, LLM, Artificial Intelligence

ChatGPT

ในงานแถลงข่าวเปิดตัว GPT-4o เมื่อคืนนี้ OpenAI ยังประกาศว่าฟีเจอร์หลายอย่างที่เคยจำกัดให้เฉพาะลูกค้าเสียเงินเท่านั้น ตอนนี้ขยายมารองรับผู้ใช้งานแบบฟรีทุกคนด้วย มีรายละเอียดดังนี้

ใช้งานแชทบอตคัสคอม GPTs และใน GPT Store (แต่สร้างไม่ได้)
ใช้งาน GPT-4 ที่ระดับ Intelligence
วิเคราะห์ข้อมูลและตาราง

OpenAI ปรับ tokenizer รองรับภาษาเพิ่ม 20 ภาษา ประหยัดค่า token

By lew

on 14 May 2024 - 00:47 Tag: OpenAI, LLM, ChatGPT

OpenAI

update: เวอร์ชั่นแรกขอข่าวนี้พาดหัวว่ายังไม่รองรับภาษาไทย แต่เมื่อทดสอบแล้วจำนวนโทเค็นในภาษาไทยลดลงกว่าเท่าตัว

ในงานเปิดตัว GPT-4o ของ OpenAI นอกจากประเด็นโมเดลมีประสิทธิภาพสูงขึ้นแล้ว ยังมีประเด็นการออปติไมซ์ tokenizer เพื่อให้ใช้งานภาษาอื่นๆ นอกจากภาษาอังกฤษได้ดีขึ้น โดยทีมงาน OpenAI เลือกมา 20 ภาษารวมถึงภาษาอังกฤษแต่ยังไม่มีภาษาไทย ทำให้ภาษาเหล่านี้ใช้งานได้มีประสิทธิภาพมากขึ้นเพราะคำในภาษาเหล่านี้มีจำนวนโทเค็นน้อยลง

OpenAI เปิดตัว GPT-4o เปิดให้ใช้ฟรีทุกคน ฟังเสียงและอ่านภาพได้ในตัว พร้อมแอปเดสก์ทอปอ่านจอได้โดยตรง

By lew

on 14 May 2024 - 00:29 Tag: OpenAI, LLM, ChatGPT

OpenAI

OpenAI เปิดตัว GPT-4 รุ่นใหม่ในชื่อ GPT-4o (โฟร์-โอ) ความสามารถใกล้เคียง GPT-4 แต่ความเร็วสูงกว่า ขณะที่ยังมีความสามารถรองรับอินพุตหลายแบบ (multimodal) สามารถฟังเสียงและอ่านภาพได้โดยไม่ต้องการโมเดลปัญญาประดิษฐ์ speech-to-text แยก

เนื่องจากประสิทธิภาพ GPT-4o สูงกว่าทำให้ OpenAI สามารถเปิดให้ผู้ใช้ทุกคนใช้งานได้ฟรีโดยมีโควต้ามากขึ้น สำหรับการใช้งานฝั่ง API ราคาของ GPT-4o จะถูกกว่า GPT-4 Turbo ลงครึ่งหนึ่ง ความเร็วโดยรวมเพิ่มขึ้นเท่าตัว และโควต้าการใช้งานเพิ่มขึ้นถึง 5 เท่า

Wikipedia ทดสอบบริการ AI เช็คข้อมูลเว็บต่างๆ ด้วยวิกิ อาศัยพลัง ChatGPT

By lew

on 13 May 2024 - 23:05 Tag: Wikipedia, ChatGPT, LLM

Wikipedia

Wikimedia Foundation ผู้ให้บริการ Wikipedia ทดสอบปลั๊กอินเบราว์เซอร์ Citation Needed เป็นการตรวจสอบข้อมูลในเว็บด้วยการค้นหาข้อมูลในวิกิมาอ้างอิง โดยใช้ ChatGPT มาอ่านข้อความและหน้าเว็บอ้างอิงว่าเนื้อหาสนับสนุนกันหรือไม่

ปลั๊กอินเบราว์เซอร์ตัวนี้รับอินพุตโดยให้ผู้ใช้เลือกข้อความในเว็บใดๆ จากนั้นจะอาศัย ChatGPT ในการสร้างคำค้นหา และค้นหาหน้าวิกิด้วย API ของ Wikipedia เอง สุดท้ายจะใช้ ChatGPT ในการแยกประโยคที่เกี่ยวข้องและสรุปออกมาว่าเป็นเนื้อหาที่ผู้ใช้เลือกมานั้นสอดคล้องกับข้อความในหน้าวิกิหรือไม่

01.AI ปล่อย Yi-1.5 โมเดล AI โอเพนซอร์ส เปิดตัวคู่แข่ง ChatGPT เน้นภาษาจีน

By lew

on 13 May 2024 - 19:50 Tag: Kai Fu Lee, Artificial Intelligence, LLM, China

Kai Fu Lee

01.AI บริษัทปัญญาประดิษฐ์ที่ก่อตั้งโดย Kai-Fu Lee เปิดตัวโมเดล Yi เวอร์ชั่น 1.5 โดยชูประเด็นว่าโมเดลขนาด 9B นั้นสามารถทำคะแนนทดสอบชนะโมเดลโอเพนซอร์สขนาดใกล้เคียงกันได้ทั้งหมด (แม้่ว่านับจริงๆ Yi 9B จะใหญ่กว่าคนอื่นพอสมควรก็ตาม)

ทีมงาน 01.AI ระบุว่า Yi ฝึกด้วยชุดข้อมูลคุณภาพสูงขนาดใหญ่มากถึงห้าแสนล้านโทเค็น แล้วฝึกต่อด้วยตัวอย่างอีกสามล้านชุด

Mayo Clinic พัฒนาผู้ช่วยแพทย์รักษามะเร็ง finetune จาก Llama 2 ข้อมูลไม่ออกจากโรงพยาบาลเลย

By lew

on 12 May 2024 - 15:30 Tag: Llama, Meta, LLM, Medical, Research

Llama

Mayo Clinic รายงานถึงการพัฒนา RadOnc-GPT ผู้ช่วยวิเคราะห์โรคมะเร็งที่อาศัยข้อมูลการรักษามะเร็งในโรงพยาบาล Mayo Clinic เอง นำมา finetune โมเดล Llama 2 ของ Meta กระบวนการฝึกและการใช้งานทั้งหมดอยู่ในเน็ตเวิร์คของโรงพยาบาลเอง

IBM ปล่อย AI ช่วยเขียนโค้ด Granite เก่งสุดในกลุ่ม 8B ใช้งานได้อิสระ

By lew

on 10 May 2024 - 23:05 Tag: IBM, LLM, Programming

IBM

IBM ปล่อยโมเดลปัญญาประดิษฐ์ Granite ที่ฝึกจากฐานข้อมูลโค้ด 116 ภาษา โดยโมเดลมี 4 ขนาดได้แก่ 3B, 8B, 20B, และ 34B แยกรุ่นพื้นฐานและรุ่นรับคำสั่ง (instruct) โดยเฉพาะรุ่น 8B นั้นความสามารถในการเขียนโปรแกรมเหนือกว่าโมเดลขนาดเดียวกันค่อนข้างมาก

กระบวนการฝึกโมเดลเวอร์ชั่น 34B นั้นพิเศษกว่าเวอร์ชั่นอื่นๆ เพราะอาศัยการ upscaling โดยนำโมเดล 20B ที่มี 52 ชั้นสองเวอร์ชั่น มาถอดฝั่ง output 8 ชั้น และ input ของอีกโมเดลหนึ่ง 8 ชั้น แล้วนำมาต่อกันเป็น 34B ข้อมูลที่ใช้ฝึกนั้นมีตั้งแต่ GitHub Code Clean, StarCoderData, และโค้ดอื่นๆ รวมถึง

Alibaba Cloud อัปเดตโมเดล AI Qwen2.5 ฉลาดขึ้นจากเวอร์ชันก่อนหน้า มีลูกค้าองค์กรใช้งานกว่า 9 หมื่นแห่ง

By arjin

on 10 May 2024 - 21:16 Tag: Alibaba Cloud, Alibaba, Artificial Intelligence, LLM

Alibaba Cloud

Alibaba Cloud ประกาศว่า Tongyi Qianwen หรือ Qwen โมเดลปัญญาประดิษฐ์ภาษาขนาดใหญ่หรือ LLM มีหน่วยงานนำไปติดตั้งใช้งานแล้วมากกว่า 90,000 แห่ง สะท้อนความต้องการใช้งานที่เพิ่มต่อเนื่องจาก ทั้งจากกลุ่มอุตสาหกรรมอิเล็กทรอนิกส์, ยานยนต์ จนถึงเกม

โดย Alibaba Cloud ได้อัปเดตโมเดล Qwen นี้ในเวอร์ชันล่าสุด Qwen2.5 โดยมีจุดเด่นคือการให้เหตุผล ประเมินโค้ด และทำความเข้าใจภาษาได้ดีกว่าเวอร์ชันก่อนหน้า Qwen2.0

Meta เพิ่มเครื่องมือสร้างโฆษณาด้วย AI คราวนี้รองรับการสร้างทั้งรูปภาพ ไม่จำกัดแค่ฉากหลัง

By arjin

on 8 May 2024 - 06:40 Tag: Meta, Advertising, Artificial Intelligence, LLM

[ลือ] ไมโครซอฟท์กำลังเทรนโมเดลขนาดใหญ่ของตัวเอง MAI-1 ลดการพึ่งพา OpenAI

By mk

on 7 May 2024 - 14:01 Tag: Microsoft AI, Microsoft, LLM, Rumors, OpenAI, Artificial Intelligence

Microsoft AI

The Information รายงานข่าวลือว่า ไมโครซอฟท์กำลังเทรนโมเดลภาษาขนาดใหญ่ของตัวเองชื่อ MAI-1 มีขนาด 5 แสนล้านพารามิเตอร์ และมีศักยภาพทำงานได้ระดับเดียวกับโมเดลของ OpenAI, Google หรือ Anthropic ในปัจจุบัน โครงการนี้มีหัวหน้าโครงการคือ Mustafa Suleyman ผู้ร่วมก่อตั้ง DeepMind ที่เพิ่งย้ายจากบริษัท Inflection AI มาเป็นซีอีโอ Microsoft AI

Apple ทดสอบฟีเจอร์ AI ใน Safari ทั้งสรุปและบล็อกเนื้อหา อาจมีให้ใช้งานใน iOS 18

By arjin

on 4 May 2024 - 17:17 Tag: Safari, iOS 18, Apple, Rumors, LLM, Artificial Intelligence

Safari

AppleInsider รายงานฟีเจอร์เกี่ยวกับ AI ที่จะมีในระบบปฏิบัติการ iOS 18 และ macOS 15 ที่แอปเปิลเตรียมเปิดตัวในงาน WWDC เดือนมิถุนายน โดยอ้างข้อมูลจากแหล่งข่าวที่เกี่ยวข้อง ซึ่งตอนนี้ซอฟต์แวร์อยู่ในขั้นตอนการทดสอบภายใน

โดยส่วนที่มีข้อมูลตอนนี้คือเบราว์เซอร์ Safari 18 ซึ่งจะมีฟีเจอร์ AI ดังต่อไปนี้

X เพิ่มฟีเจอร์ Stories สรุปเทรนด์มาให้ ไม่ต้องไถหาเอง ด้วยพลังของ AI Grok

By arjin

on 4 May 2024 - 07:00 Tag: X.com, Elon Musk, xAI, Artificial Intelligence, LLM, Grok

X.com

X เปิดตัวบริการใหม่ Stories ฟีเจอร์สรุปเรื่องราวของเทรนด์บน X ที่เกิดขึ้น ตามความสนใจของผู้ใช้งานแต่ละคน (Personalize) โดยอยู่ในส่วน Explore ของแอป ซึ่ง AI ที่ช่วยสรุปเนื้อหาให้ก็คือ Grok โมเดล AI จากบริษัท xAI ของ Elon Musk เจ้าของ X นั่นเอง

Claude เปิดตัวแอปบน iPhone - ออกแพ็คเกจสำหรับลูกค้าองค์กร

By arjin

on 2 May 2024 - 01:51 Tag: Claude, Anthropic, Artificial Intelligence, LLM

Claude

Anthropic บริษัทด้านปัญญาประดิษฐ์ผู้พัฒนา Claude เปิดตัวแอปบนระบบปฏิบัติ iOS สำหรับคนใช้ iPhone และ iPad นอกจากนี้ยังเปิดตัวแพ็คเกจจ่ายเงินสำหรับลูกค้าองค์กรด้วย

โดยแพ็คเกจสำหรับลูกค้าองค์กรมีชื่อว่า Team plan เพื่อเพิ่มการปกป้องข้อมูลและความปลอดภัยสำหรับองค์กรที่ต้องการใช้งาน Claude โดยปริมาณการใช้งานต่อบัญชีจะรองรับมากขึ้น, ได้ใช้โมเดลในกลุ่ม Claude 3 ได้แก่ Opus, Sonnet และ Haiku, รองรับการอ่านเอกสารขนาดยาว, ระบบแอดมินควบคุมค่าใช้จ่าย และฟีเจอร์อื่นที่เหมือนผู้ใช้งานแบบ Pro

แพ็คเกจ Team ราคา 30 ดอลลาร์ต่อบัญชีต่อเดือน ขั้นต่ำผู้ใช้งาน 5 คน

พบโมเดล LLM ปริศนาใช้ชื่อ gpt2-chatbot ในเว็บจัดอันดับ คาดเป็น GPT-4.5

By lew

on 30 April 2024 - 13:37 Tag: ChatGPT, OpenAI, LLM

ChatGPT

เว็บจัดอันดับแชตบอต LMSYS มีปัญญาประดิษฐ์ตัวใหม่เพิ่มเข้ามาคือ gpt2-chatbot โดยไม่มีคำอธิบายว่ามันคือโมเดลอะไร แต่เมื่อทดลองอักขระพิเศษก็พบว่ามันมีพฤติกรรมคล้าย GPT-4 อย่างมากเพราะมีปัญหากับอักระพิเศษเหมือนกัน

ผู้ใช้ที่ได้ลองใช้งานแล้วมีความเห็นต่างๆ กันไป บ้างก็ว่าไม่ต่างกันแชตบอตอื่นๆ แต่บางคนก็ระบุว่าดีกว่า GPT-4 ชัดเจน

การใช้งานสามารถเลือกได้ในเว็บ LMSYS ทั้งแบบ Direct และ Arena (side-by-side) แต่มีโควต้าการใช้งานชั่วโมงละ 1,000 แชตทำให้มักไม่ค่อยพอในช่วงนี้

ChatGPT เพิ่มความสามารถ Memory จดจำรายละเอียดผู้ใช้งาน ให้ลูกค้า ChatGPT Plus ทุกคนแล้ว

By arjin

on 30 April 2024 - 05:16 Tag: ChatGPT, OpenAI, LLM, Chatbot

ChatGPT

OpenAI ประกาศว่าฟังก์ชัน Memory ใน ChatGPT ตอนนี้สามารถใช้งานได้แล้วสำหรับลูกค้าเสียเงิน ChatGPT Plus ทุกคน ยกเว้นในประเทศกลุ่มสหภาพยุโรป (EU) และเกาหลี ส่วนลูกค้าแบบ Team, Enterprise และ GPTs จะได้ใช้ Memory ในอนาคตเช่นกัน

Memory เป็นฟังก์ชันที่ OpenAI แบบจำกัดกลุ่มผู้ใช้งานก่อนหน้านี้ เป็นการสร้างข้อมูลพื้นฐานของผู้ใช้งานให้ ChatGPT จดจำไว้เลย ไม่ต้องอธิบายหรือทวนข้อมูลเหล่านี้ซ้ำในการสนทนาทุกครั้ง ซึ่ง ChatGPT จะเรียนรู้ทั้งจากการป้อนข้อมูลให้จดจำตรง ๆ หรือเรียนรู้ในระหว่างการสนทนา

Subscribe to LLM