Image

Large Language Model

By lew Founder on Tag: Chrome, LLM, Gemini
Chrome

กูเกิลเปิดโครงการทดลอง Built-in AI เตรียมนำ Gemini Nano มารันใน Chrome โดยตรง เปิดทางให้เบราว์เซอร์มี API ในกลุ่ม LLM เพิ่มเติม

ฟีเจอร์ที่เว็บไซต์จะสามารถใช้งาน LLM บนเว็บได้ เช่น การช่วยสรุป หรือถามตอบคำถามในเนื้อหาบนเว็บเอง ไปจนถึงการเป็นตัวช่วยผู้ใช้เขียนเนื้อหา หรือตรวจคำผิด

ทุกวันนี้เว็บไซต์หลายแห่งรันโมเดลปัญญาประดิษฐ์บนเว็บอยู่แล้ว แต่การใช้งานแบบทุกวันนี้ทำให้ผู้ใช้ต้องดาวน์โหลดไฟล์ขนาดนับร้อยเมกะไบต์ทุกเว็บ และอาจใช้งานฟีเจอร์ต่างๆ ของเครื่องเช่น GPU หรือ NPU ได้จำกัด การที่เบราว์เซอร์มี API โดยตรงให้เลยจะทำให้ออปติไมซ์ได้ดีขึ้น

By lew Founder on Tag: Android, Gemini, LLM, Scam
Android

กูเกิลโชว์ Gemini Nano โมเดลปัญญาประดิษฐ์สำหรับโทรศัพท์รุ่นใหม่รองรับอินพุตหลายรูปแบบทั้งภาพ, เสียง, และข้อความ พร้อมกับความสามารถของแอป Gemini ที่ผูกเข้ากับระบบของแอนดรอยด์เต็มตัว

Gemini Nano อ่านภาพได้ ทำให้สามารถบรรยายภาพได้โดยไม่ต้องมีข้อมูลล่วงหน้า กูเกิลใส่ความสามารถนี้ในฟีเจอร์ TalkBack ที่ช่วยผู้มองเห็นได้จำกัด ทำให้สามารถบรรยายภาพได้อย่างละเอียด นอกจากนี้ยังสามารถฟังเสียงได้ ทำให้สามารถฟังเสียงการสนทนาตลอดเวลาและแจ้งเตือนทันทีเมื่อพบว่าบทสนนนาน่าจะเป็นการหลอกลวง ฟีเจอร์นี้จะเป็นแบบ opt-in ต้องเปิดใช้งานเอง และจะเปิดให้ใช้ภายในปีนี้ (ไม่ระบุประเทศที่รองรับ)

By lew Founder on Tag: Gemini, Google, LLM
Gemini

กูเกิลอัพเดต Gemini Advanced เวอร์ชั่นผู้ใช้ทั่วไป เป็น Gemini 1.5 Pro ทำให้รองรับ context window ขนาด 1 ล้านโทเค็นแบบเดียวกับการใช้งานแบบเดียวกับการใช้งานผ่าน API รองรับการอัพโหลดข้อมูลขนาดใหญ่เข้าไปยังแชตได้โดยตรง โดยมีฟีเจอร์ใหม่หลักๆ ได้แก่

By lew Founder on Tag: Gemini, Google, LLM
Gemini

กูเกิลอัพเดตโมเดล Gemini 1.5 Pro โดยขยาย context window เป็น 2 ล้านโทเค็น ทำให้สามารถรองรับข้อมูลขนาดใหญ่มาก และเชื่อฟังคำสั่งมากขึ้น โดยเฉพาะคำสั่งฟอร์แมต์เอาท์พุต หรือพฤติกรรมของ AI และการวางแผนการทำงานได้ดีขึ้นทำให้สามารถเรียกฟังก์ชั่นภายนอกได้มากขึ้น

นอกจากนี้กูเกิลยังเปิดตัว Gemini 1.5 Flash ที่ราคาประหยัดลงแต่ประสิทธิภาพยังใกล้เคียง Gemini 1.5 Pro โดยอาศัยเทคนิค distillation ที่ดึงความสามารถจากโมเดลขนาดใหญ่ และรองรับ context window ขนาด 1 ล้านโทเค็นเท่ากับรุ่นใหญ่ ราคาค่าใช้งาน 0.35 ดอลลาร์ต่อล้านโทเค็น

By lew Founder on Tag: OpenAI, ChatGPT, LLM
OpenAI

เมื่อคืนที่ผ่านมา OpenAI เปิดตัว GPT-4o พร้อมกับประกาศเปลี่ยน tokenizer ใหม่โดยอาศัย 20 ภาษาต้นแบบในการบีบอัดข้อมูล ทำให้ภาษาต่างๆ ประหยัดโทเค็นยิ่งขึ้น แม้ภาษาไทยจะไม่อยู่ในรายชื่อ 20 ภาษา แต่ผลการทดลองก็พบว่าภาษาไทยนั้นประหยัดโทเค็นลงเท่าตัว

tokenizer ของ GPT-4o สามารถจับคำหรือส่วนของคำในภาษาไทยได้ชัดเจน คำสามัญเช่น "ของ" หรือ "จำนวน" ก็สามารถมองเป็นโทเค็นเดียวได้ทันที เทียบกับ tokenizer ของ GPT-4 ที่ไม่สามารถรวบตัวอักษรหลายตัวในภาษาไทยเข้าด้วยกันได้เลย ทำให้จำนวนโทเค็นกับจำนวนตัวอักษรใกล้เคียงกัน

By arjin Writer on Tag: ChatGPT, OpenAI, LLM, Artificial Intelligence
ChatGPT

ในงานแถลงข่าวเปิดตัว GPT-4o เมื่อคืนนี้ OpenAI ยังประกาศว่าฟีเจอร์หลายอย่างที่เคยจำกัดให้เฉพาะลูกค้าเสียเงินเท่านั้น ตอนนี้ขยายมารองรับผู้ใช้งานแบบฟรีทุกคนด้วย มีรายละเอียดดังนี้

  • ใช้งานแชทบอตคัสคอม GPTs และใน GPT Store (แต่สร้างไม่ได้)
  • ใช้งาน GPT-4 ที่ระดับ Intelligence
  • วิเคราะห์ข้อมูลและตาราง
By lew Founder on Tag: OpenAI, LLM, ChatGPT
OpenAI

update: เวอร์ชั่นแรกขอข่าวนี้พาดหัวว่ายังไม่รองรับภาษาไทย แต่เมื่อทดสอบแล้วจำนวนโทเค็นในภาษาไทยลดลงกว่าเท่าตัว

ในงานเปิดตัว GPT-4o ของ OpenAI นอกจากประเด็นโมเดลมีประสิทธิภาพสูงขึ้นแล้ว ยังมีประเด็นการออปติไมซ์ tokenizer เพื่อให้ใช้งานภาษาอื่นๆ นอกจากภาษาอังกฤษได้ดีขึ้น โดยทีมงาน OpenAI เลือกมา 20 ภาษารวมถึงภาษาอังกฤษแต่ยังไม่มีภาษาไทย ทำให้ภาษาเหล่านี้ใช้งานได้มีประสิทธิภาพมากขึ้นเพราะคำในภาษาเหล่านี้มีจำนวนโทเค็นน้อยลง

By lew Founder on Tag: OpenAI, LLM, ChatGPT
OpenAI

OpenAI เปิดตัว GPT-4 รุ่นใหม่ในชื่อ GPT-4o (โฟร์-โอ) ความสามารถใกล้เคียง GPT-4 แต่ความเร็วสูงกว่า ขณะที่ยังมีความสามารถรองรับอินพุตหลายแบบ (multimodal) สามารถฟังเสียงและอ่านภาพได้โดยไม่ต้องการโมเดลปัญญาประดิษฐ์ speech-to-text แยก

เนื่องจากประสิทธิภาพ GPT-4o สูงกว่าทำให้ OpenAI สามารถเปิดให้ผู้ใช้ทุกคนใช้งานได้ฟรีโดยมีโควต้ามากขึ้น สำหรับการใช้งานฝั่ง API ราคาของ GPT-4o จะถูกกว่า GPT-4 Turbo ลงครึ่งหนึ่ง ความเร็วโดยรวมเพิ่มขึ้นเท่าตัว และโควต้าการใช้งานเพิ่มขึ้นถึง 5 เท่า

By lew Founder on Tag: Wikipedia, ChatGPT, LLM
Wikipedia

Wikimedia Foundation ผู้ให้บริการ Wikipedia ทดสอบปลั๊กอินเบราว์เซอร์ Citation Needed เป็นการตรวจสอบข้อมูลในเว็บด้วยการค้นหาข้อมูลในวิกิมาอ้างอิง โดยใช้ ChatGPT มาอ่านข้อความและหน้าเว็บอ้างอิงว่าเนื้อหาสนับสนุนกันหรือไม่

ปลั๊กอินเบราว์เซอร์ตัวนี้รับอินพุตโดยให้ผู้ใช้เลือกข้อความในเว็บใดๆ จากนั้นจะอาศัย ChatGPT ในการสร้างคำค้นหา และค้นหาหน้าวิกิด้วย API ของ Wikipedia เอง สุดท้ายจะใช้ ChatGPT ในการแยกประโยคที่เกี่ยวข้องและสรุปออกมาว่าเป็นเนื้อหาที่ผู้ใช้เลือกมานั้นสอดคล้องกับข้อความในหน้าวิกิหรือไม่

By lew Founder on Tag: Kai Fu Lee, Artificial Intelligence, LLM, China
Kai Fu Lee

01.AI บริษัทปัญญาประดิษฐ์ที่ก่อตั้งโดย Kai-Fu Lee เปิดตัวโมเดล Yi เวอร์ชั่น 1.5 โดยชูประเด็นว่าโมเดลขนาด 9B นั้นสามารถทำคะแนนทดสอบชนะโมเดลโอเพนซอร์สขนาดใกล้เคียงกันได้ทั้งหมด (แม้่ว่านับจริงๆ Yi 9B จะใหญ่กว่าคนอื่นพอสมควรก็ตาม)

ทีมงาน 01.AI ระบุว่า Yi ฝึกด้วยชุดข้อมูลคุณภาพสูงขนาดใหญ่มากถึงห้าแสนล้านโทเค็น แล้วฝึกต่อด้วยตัวอย่างอีกสามล้านชุด

By lew Founder on Tag: Llama, Meta, LLM, Medical, Research
Llama

Mayo Clinic รายงานถึงการพัฒนา RadOnc-GPT ผู้ช่วยวิเคราะห์โรคมะเร็งที่อาศัยข้อมูลการรักษามะเร็งในโรงพยาบาล Mayo Clinic เอง นำมา finetune โมเดล Llama 2 ของ Meta กระบวนการฝึกและการใช้งานทั้งหมดอยู่ในเน็ตเวิร์คของโรงพยาบาลเอง

By lew Founder on Tag: IBM, LLM, Programming
IBM

IBM ปล่อยโมเดลปัญญาประดิษฐ์ Granite ที่ฝึกจากฐานข้อมูลโค้ด 116 ภาษา โดยโมเดลมี 4 ขนาดได้แก่ 3B, 8B, 20B, และ 34B แยกรุ่นพื้นฐานและรุ่นรับคำสั่ง (instruct) โดยเฉพาะรุ่น 8B นั้นความสามารถในการเขียนโปรแกรมเหนือกว่าโมเดลขนาดเดียวกันค่อนข้างมาก

กระบวนการฝึกโมเดลเวอร์ชั่น 34B นั้นพิเศษกว่าเวอร์ชั่นอื่นๆ เพราะอาศัยการ upscaling โดยนำโมเดล 20B ที่มี 52 ชั้นสองเวอร์ชั่น มาถอดฝั่ง output 8 ชั้น และ input ของอีกโมเดลหนึ่ง 8 ชั้น แล้วนำมาต่อกันเป็น 34B ข้อมูลที่ใช้ฝึกนั้นมีตั้งแต่ GitHub Code Clean, StarCoderData, และโค้ดอื่นๆ รวมถึง

By arjin Writer on Tag: Alibaba Cloud, Alibaba, Artificial Intelligence, LLM
Alibaba Cloud

Alibaba Cloud ประกาศว่า Tongyi Qianwen หรือ Qwen โมเดลปัญญาประดิษฐ์ภาษาขนาดใหญ่หรือ LLM มีหน่วยงานนำไปติดตั้งใช้งานแล้วมากกว่า 90,000 แห่ง สะท้อนความต้องการใช้งานที่เพิ่มต่อเนื่องจาก ทั้งจากกลุ่มอุตสาหกรรมอิเล็กทรอนิกส์, ยานยนต์ จนถึงเกม

โดย Alibaba Cloud ได้อัปเดตโมเดล Qwen นี้ในเวอร์ชันล่าสุด Qwen2.5 โดยมีจุดเด่นคือการให้เหตุผล ประเมินโค้ด และทำความเข้าใจภาษาได้ดีกว่าเวอร์ชันก่อนหน้า Qwen2.0

By arjin Writer on Tag: Meta, Advertising, Artificial Intelligence, LLM
Meta

Meta ประกาศเพิ่มเครื่องมือช่วยสร้างโฆษณาพลัง AI สำหรับผู้ลงโฆษณา จากเดิมความสามารถหลักคือการสร้างฉากพื้นหลังให้กับสินค้า คราวนี้เครื่องมือ AI ทำได้มากกว่านั้นแล้ว

ของใหม่ที่ประกาศได้แก่

By mk Founder on Tag: Microsoft AI, Microsoft, LLM, Rumors, OpenAI, Artificial Intelligence
Microsoft AI

The Information รายงานข่าวลือว่า ไมโครซอฟท์กำลังเทรนโมเดลภาษาขนาดใหญ่ของตัวเองชื่อ MAI-1 มีขนาด 5 แสนล้านพารามิเตอร์ และมีศักยภาพทำงานได้ระดับเดียวกับโมเดลของ OpenAI, Google หรือ Anthropic ในปัจจุบัน โครงการนี้มีหัวหน้าโครงการคือ Mustafa Suleyman ผู้ร่วมก่อตั้ง DeepMind ที่เพิ่งย้ายจากบริษัท Inflection AI มาเป็นซีอีโอ Microsoft AI

By arjin Writer on Tag: Safari, iOS 18, Apple, Rumors, LLM, Artificial Intelligence
Safari

AppleInsider รายงานฟีเจอร์เกี่ยวกับ AI ที่จะมีในระบบปฏิบัติการ iOS 18 และ macOS 15 ที่แอปเปิลเตรียมเปิดตัวในงาน WWDC เดือนมิถุนายน โดยอ้างข้อมูลจากแหล่งข่าวที่เกี่ยวข้อง ซึ่งตอนนี้ซอฟต์แวร์อยู่ในขั้นตอนการทดสอบภายใน

โดยส่วนที่มีข้อมูลตอนนี้คือเบราว์เซอร์ Safari 18 ซึ่งจะมีฟีเจอร์ AI ดังต่อไปนี้

By arjin Writer on Tag: X.com, Elon Musk, xAI, Artificial Intelligence, LLM, Grok
X.com

X เปิดตัวบริการใหม่ Stories ฟีเจอร์สรุปเรื่องราวของเทรนด์บน X ที่เกิดขึ้น ตามความสนใจของผู้ใช้งานแต่ละคน (Personalize) โดยอยู่ในส่วน Explore ของแอป ซึ่ง AI ที่ช่วยสรุปเนื้อหาให้ก็คือ Grok โมเดล AI จากบริษัท xAI ของ Elon Musk เจ้าของ X นั่นเอง

By arjin Writer on Tag: Claude, Anthropic, Artificial Intelligence, LLM
Claude

Anthropic บริษัทด้านปัญญาประดิษฐ์ผู้พัฒนา Claude เปิดตัวแอปบนระบบปฏิบัติ iOS สำหรับคนใช้ iPhone และ iPad นอกจากนี้ยังเปิดตัวแพ็คเกจจ่ายเงินสำหรับลูกค้าองค์กรด้วย

โดยแพ็คเกจสำหรับลูกค้าองค์กรมีชื่อว่า Team plan เพื่อเพิ่มการปกป้องข้อมูลและความปลอดภัยสำหรับองค์กรที่ต้องการใช้งาน Claude โดยปริมาณการใช้งานต่อบัญชีจะรองรับมากขึ้น, ได้ใช้โมเดลในกลุ่ม Claude 3 ได้แก่ Opus, Sonnet และ Haiku, รองรับการอ่านเอกสารขนาดยาว, ระบบแอดมินควบคุมค่าใช้จ่าย และฟีเจอร์อื่นที่เหมือนผู้ใช้งานแบบ Pro

แพ็คเกจ Team ราคา 30 ดอลลาร์ต่อบัญชีต่อเดือน ขั้นต่ำผู้ใช้งาน 5 คน

By lew Founder on Tag: ChatGPT, OpenAI, LLM
ChatGPT

เว็บจัดอันดับแชตบอต LMSYS มีปัญญาประดิษฐ์ตัวใหม่เพิ่มเข้ามาคือ gpt2-chatbot โดยไม่มีคำอธิบายว่ามันคือโมเดลอะไร แต่เมื่อทดลองอักขระพิเศษก็พบว่ามันมีพฤติกรรมคล้าย GPT-4 อย่างมากเพราะมีปัญหากับอักระพิเศษเหมือนกัน

ผู้ใช้ที่ได้ลองใช้งานแล้วมีความเห็นต่างๆ กันไป บ้างก็ว่าไม่ต่างกันแชตบอตอื่นๆ แต่บางคนก็ระบุว่าดีกว่า GPT-4 ชัดเจน

การใช้งานสามารถเลือกได้ในเว็บ LMSYS ทั้งแบบ Direct และ Arena (side-by-side) แต่มีโควต้าการใช้งานชั่วโมงละ 1,000 แชตทำให้มักไม่ค่อยพอในช่วงนี้

By arjin Writer on Tag: ChatGPT, OpenAI, LLM, Chatbot
ChatGPT

OpenAI ประกาศว่าฟังก์ชัน Memory ใน ChatGPT ตอนนี้สามารถใช้งานได้แล้วสำหรับลูกค้าเสียเงิน ChatGPT Plus ทุกคน ยกเว้นในประเทศกลุ่มสหภาพยุโรป (EU) และเกาหลี ส่วนลูกค้าแบบ Team, Enterprise และ GPTs จะได้ใช้ Memory ในอนาคตเช่นกัน

Memory เป็นฟังก์ชันที่ OpenAI แบบจำกัดกลุ่มผู้ใช้งานก่อนหน้านี้ เป็นการสร้างข้อมูลพื้นฐานของผู้ใช้งานให้ ChatGPT จดจำไว้เลย ไม่ต้องอธิบายหรือทวนข้อมูลเหล่านี้ซ้ำในการสนทนาทุกครั้ง ซึ่ง ChatGPT จะเรียนรู้ทั้งจากการป้อนข้อมูลให้จดจำตรง ๆ หรือเรียนรู้ในระหว่างการสนทนา

Subscribe to LLM