Large Language Model

Tags:
Node Thumbnail

กูเกิลโชว์ Gemini Nano โมเดลปัญญาประดิษฐ์สำหรับโทรศัพท์รุ่นใหม่รองรับอินพุตหลายรูปแบบทั้งภาพ, เสียง, และข้อความ พร้อมกับความสามารถของแอป Gemini ที่ผูกเข้ากับระบบของแอนดรอยด์เต็มตัว

Gemini Nano อ่านภาพได้ ทำให้สามารถบรรยายภาพได้โดยไม่ต้องมีข้อมูลล่วงหน้า กูเกิลใส่ความสามารถนี้ในฟีเจอร์ TalkBack ที่ช่วยผู้มองเห็นได้จำกัด ทำให้สามารถบรรยายภาพได้อย่างละเอียด นอกจากนี้ยังสามารถฟังเสียงได้ ทำให้สามารถฟังเสียงการสนทนาตลอดเวลาและแจ้งเตือนทันทีเมื่อพบว่าบทสนนนาน่าจะเป็นการหลอกลวง ฟีเจอร์นี้จะเป็นแบบ opt-in ต้องเปิดใช้งานเอง และจะเปิดให้ใช้ภายในปีนี้ (ไม่ระบุประเทศที่รองรับ)

Tags:
Node Thumbnail

กูเกิลอัพเดต Gemini Advanced เวอร์ชั่นผู้ใช้ทั่วไป เป็น Gemini 1.5 Pro ทำให้รองรับ context window ขนาด 1 ล้านโทเค็นแบบเดียวกับการใช้งานแบบเดียวกับการใช้งานผ่าน API รองรับการอัพโหลดข้อมูลขนาดใหญ่เข้าไปยังแชตได้โดยตรง โดยมีฟีเจอร์ใหม่หลักๆ ได้แก่

Tags:
Node Thumbnail

กูเกิลอัพเดตโมเดล Gemini 1.5 Pro โดยขยาย context window เป็น 2 ล้านโทเค็น ทำให้สามารถรองรับข้อมูลขนาดใหญ่มาก และเชื่อฟังคำสั่งมากขึ้น โดยเฉพาะคำสั่งฟอร์แมต์เอาท์พุต หรือพฤติกรรมของ AI และการวางแผนการทำงานได้ดีขึ้นทำให้สามารถเรียกฟังก์ชั่นภายนอกได้มากขึ้น

นอกจากนี้กูเกิลยังเปิดตัว Gemini 1.5 Flash ที่ราคาประหยัดลงแต่ประสิทธิภาพยังใกล้เคียง Gemini 1.5 Pro โดยอาศัยเทคนิค distillation ที่ดึงความสามารถจากโมเดลขนาดใหญ่ และรองรับ context window ขนาด 1 ล้านโทเค็นเท่ากับรุ่นใหญ่ ราคาค่าใช้งาน 0.35 ดอลลาร์ต่อล้านโทเค็น

Gemini 1.5 Pro และ 1.5 Flash เปิดให้ใช้งานได้ทั้งทาง Google AI Studio และ Vertex AI ส่วนเวอร์ชั่น 2 ล้านโทเค็นยังทดสอบวงปิดต้องขอใช้งาน

Tags:
Node Thumbnail

เมื่อคืนที่ผ่านมา OpenAI เปิดตัว GPT-4o พร้อมกับประกาศเปลี่ยน tokenizer ใหม่โดยอาศัย 20 ภาษาต้นแบบในการบีบอัดข้อมูล ทำให้ภาษาต่างๆ ประหยัดโทเค็นยิ่งขึ้น แม้ภาษาไทยจะไม่อยู่ในรายชื่อ 20 ภาษา แต่ผลการทดลองก็พบว่าภาษาไทยนั้นประหยัดโทเค็นลงเท่าตัว

tokenizer ของ GPT-4o สามารถจับคำหรือส่วนของคำในภาษาไทยได้ชัดเจน คำสามัญเช่น "ของ" หรือ "จำนวน" ก็สามารถมองเป็นโทเค็นเดียวได้ทันที เทียบกับ tokenizer ของ GPT-4 ที่ไม่สามารถรวบตัวอักษรหลายตัวในภาษาไทยเข้าด้วยกันได้เลย ทำให้จำนวนโทเค็นกับจำนวนตัวอักษรใกล้เคียงกัน

Tags:
Node Thumbnail

ในงานแถลงข่าวเปิดตัว GPT-4o เมื่อคืนนี้ OpenAI ยังประกาศว่าฟีเจอร์หลายอย่างที่เคยจำกัดให้เฉพาะลูกค้าเสียเงินเท่านั้น ตอนนี้ขยายมารองรับผู้ใช้งานแบบฟรีทุกคนด้วย มีรายละเอียดดังนี้

  • ใช้งานแชทบอตคัสคอม GPTs และใน GPT Store (แต่สร้างไม่ได้)
  • ใช้งาน GPT-4 ที่ระดับ Intelligence
  • วิเคราะห์ข้อมูลและตาราง
Tags:
Node Thumbnail

update: เวอร์ชั่นแรกขอข่าวนี้พาดหัวว่ายังไม่รองรับภาษาไทย แต่เมื่อทดสอบแล้วจำนวนโทเค็นในภาษาไทยลดลงกว่าเท่าตัว

ในงานเปิดตัว GPT-4o ของ OpenAI นอกจากประเด็นโมเดลมีประสิทธิภาพสูงขึ้นแล้ว ยังมีประเด็นการออปติไมซ์ tokenizer เพื่อให้ใช้งานภาษาอื่นๆ นอกจากภาษาอังกฤษได้ดีขึ้น โดยทีมงาน OpenAI เลือกมา 20 ภาษารวมถึงภาษาอังกฤษแต่ยังไม่มีภาษาไทย ทำให้ภาษาเหล่านี้ใช้งานได้มีประสิทธิภาพมากขึ้นเพราะคำในภาษาเหล่านี้มีจำนวนโทเค็นน้อยลง

Tags:
Node Thumbnail

OpenAI เปิดตัว GPT-4 รุ่นใหม่ในชื่อ GPT-4o (โฟร์-โอ) ความสามารถใกล้เคียง GPT-4 แต่ความเร็วสูงกว่า ขณะที่ยังมีความสามารถรองรับอินพุตหลายแบบ (multimodal) สามารถฟังเสียงและอ่านภาพได้โดยไม่ต้องการโมเดลปัญญาประดิษฐ์ speech-to-text แยก

เนื่องจากประสิทธิภาพ GPT-4o สูงกว่าทำให้ OpenAI สามารถเปิดให้ผู้ใช้ทุกคนใช้งานได้ฟรีโดยมีโควต้ามากขึ้น สำหรับการใช้งานฝั่ง API ราคาของ GPT-4o จะถูกกว่า GPT-4 Turbo ลงครึ่งหนึ่ง ความเร็วโดยรวมเพิ่มขึ้นเท่าตัว และโควต้าการใช้งานเพิ่มขึ้นถึง 5 เท่า

Tags:
Node Thumbnail

Wikimedia Foundation ผู้ให้บริการ Wikipedia ทดสอบปลั๊กอินเบราว์เซอร์ Citation Needed เป็นการตรวจสอบข้อมูลในเว็บด้วยการค้นหาข้อมูลในวิกิมาอ้างอิง โดยใช้ ChatGPT มาอ่านข้อความและหน้าเว็บอ้างอิงว่าเนื้อหาสนับสนุนกันหรือไม่

ปลั๊กอินเบราว์เซอร์ตัวนี้รับอินพุตโดยให้ผู้ใช้เลือกข้อความในเว็บใดๆ จากนั้นจะอาศัย ChatGPT ในการสร้างคำค้นหา และค้นหาหน้าวิกิด้วย API ของ Wikipedia เอง สุดท้ายจะใช้ ChatGPT ในการแยกประโยคที่เกี่ยวข้องและสรุปออกมาว่าเป็นเนื้อหาที่ผู้ใช้เลือกมานั้นสอดคล้องกับข้อความในหน้าวิกิหรือไม่

Tags:
Node Thumbnail

01.AI บริษัทปัญญาประดิษฐ์ที่ก่อตั้งโดย Kai-Fu Lee เปิดตัวโมเดล Yi เวอร์ชั่น 1.5 โดยชูประเด็นว่าโมเดลขนาด 9B นั้นสามารถทำคะแนนทดสอบชนะโมเดลโอเพนซอร์สขนาดใกล้เคียงกันได้ทั้งหมด (แม้่ว่านับจริงๆ Yi 9B จะใหญ่กว่าคนอื่นพอสมควรก็ตาม)

ทีมงาน 01.AI ระบุว่า Yi ฝึกด้วยชุดข้อมูลคุณภาพสูงขนาดใหญ่มากถึงห้าแสนล้านโทเค็น แล้วฝึกต่อด้วยตัวอย่างอีกสามล้านชุด

Kai-Fu Lee ให้สัมภาษณ์กับ The Japan Times ว่าที่ผ่านมาตลาดแชตบอตในจีนยังไม่ดีพอใช้งาน ต่างจาก ChatGPT ที่เปิดตัวมาก็มีประโยชน์ใช้งานได้เลย และทาง 01.AI ก็เปิดตัว Wanzhi ผู้ช่วยปัญญาประดิษฐ์ที่ช่วยผู้ใช้ได้แบบเดียวกับ Microsoft Copilot แล้ว

Tags:
Node Thumbnail

Mayo Clinic รายงานถึงการพัฒนา RadOnc-GPT ผู้ช่วยวิเคราะห์โรคมะเร็งที่อาศัยข้อมูลการรักษามะเร็งในโรงพยาบาล Mayo Clinic เอง นำมา finetune โมเดล Llama 2 ของ Meta กระบวนการฝึกและการใช้งานทั้งหมดอยู่ในเน็ตเวิร์คของโรงพยาบาลเอง

Tags:
Node Thumbnail

IBM ปล่อยโมเดลปัญญาประดิษฐ์ Granite ที่ฝึกจากฐานข้อมูลโค้ด 116 ภาษา โดยโมเดลมี 4 ขนาดได้แก่ 3B, 8B, 20B, และ 34B แยกรุ่นพื้นฐานและรุ่นรับคำสั่ง (instruct) โดยเฉพาะรุ่น 8B นั้นความสามารถในการเขียนโปรแกรมเหนือกว่าโมเดลขนาดเดียวกันค่อนข้างมาก

กระบวนการฝึกโมเดลเวอร์ชั่น 34B นั้นพิเศษกว่าเวอร์ชั่นอื่นๆ เพราะอาศัยการ upscaling โดยนำโมเดล 20B ที่มี 52 ชั้นสองเวอร์ชั่น มาถอดฝั่ง output 8 ชั้น และ input ของอีกโมเดลหนึ่ง 8 ชั้น แล้วนำมาต่อกันเป็น 34B ข้อมูลที่ใช้ฝึกนั้นมีตั้งแต่ GitHub Code Clean, StarCoderData, และโค้ดอื่นๆ รวมถึง

Tags:
Node Thumbnail

Alibaba Cloud ประกาศว่า Tongyi Qianwen หรือ Qwen โมเดลปัญญาประดิษฐ์ภาษาขนาดใหญ่หรือ LLM มีหน่วยงานนำไปติดตั้งใช้งานแล้วมากกว่า 90,000 แห่ง สะท้อนความต้องการใช้งานที่เพิ่มต่อเนื่องจาก ทั้งจากกลุ่มอุตสาหกรรมอิเล็กทรอนิกส์, ยานยนต์ จนถึงเกม

โดย Alibaba Cloud ได้อัปเดตโมเดล Qwen นี้ในเวอร์ชันล่าสุด Qwen2.5 โดยมีจุดเด่นคือการให้เหตุผล ประเมินโค้ด และทำความเข้าใจภาษาได้ดีกว่าเวอร์ชันก่อนหน้า Qwen2.0

Tags:
Node Thumbnail

Meta ประกาศเพิ่มเครื่องมือช่วยสร้างโฆษณาพลัง AI สำหรับผู้ลงโฆษณา จากเดิมความสามารถหลักคือการสร้างฉากพื้นหลังให้กับสินค้า คราวนี้เครื่องมือ AI ทำได้มากกว่านั้นแล้ว

ของใหม่ที่ประกาศได้แก่

Tags:
Node Thumbnail

The Information รายงานข่าวลือว่า ไมโครซอฟท์กำลังเทรนโมเดลภาษาขนาดใหญ่ของตัวเองชื่อ MAI-1 มีขนาด 5 แสนล้านพารามิเตอร์ และมีศักยภาพทำงานได้ระดับเดียวกับโมเดลของ OpenAI, Google หรือ Anthropic ในปัจจุบัน โครงการนี้มีหัวหน้าโครงการคือ Mustafa Suleyman ผู้ร่วมก่อตั้ง DeepMind ที่เพิ่งย้ายจากบริษัท Inflection AI มาเป็นซีอีโอ Microsoft AI

ข่าวของ MAI-1 มีความสำคัญตรงที่เป็นครั้งแรกที่ไมโครซอฟท์ทำโมเดล LLM เอง หลังจากต้องพึ่งพาโมเดล GPT ของ OpenAI มาตลอดในช่วงประมาณ 2 ปีที่ผ่านมา และปัญหาดราม่าภายใน OpenAI น่าจะเป็นสิ่งเตือนใจไมโครซอฟท์ว่าไม่ควรพึ่งพาบริษัทภายนอกมากจนเกินไป

Tags:
Node Thumbnail

AppleInsider รายงานฟีเจอร์เกี่ยวกับ AI ที่จะมีในระบบปฏิบัติการ iOS 18 และ macOS 15 ที่แอปเปิลเตรียมเปิดตัวในงาน WWDC เดือนมิถุนายน โดยอ้างข้อมูลจากแหล่งข่าวที่เกี่ยวข้อง ซึ่งตอนนี้ซอฟต์แวร์อยู่ในขั้นตอนการทดสอบภายใน

โดยส่วนที่มีข้อมูลตอนนี้คือเบราว์เซอร์ Safari 18 ซึ่งจะมีฟีเจอร์ AI ดังต่อไปนี้

Tags:
Node Thumbnail

X เปิดตัวบริการใหม่ Stories ฟีเจอร์สรุปเรื่องราวของเทรนด์บน X ที่เกิดขึ้น ตามความสนใจของผู้ใช้งานแต่ละคน (Personalize) โดยอยู่ในส่วน Explore ของแอป ซึ่ง AI ที่ช่วยสรุปเนื้อหาให้ก็คือ Grok โมเดล AI จากบริษัท xAI ของ Elon Musk เจ้าของ X นั่นเอง

บริการ Stories สรุปเนื้อหานี้ จะเปิดให้ใช้งานเฉพาะลูกค้าเสียเงินเป็นสมาชิก X Premium เฉพาะบนเว็บและ iOS ก่อน โดยสรุปแต่ละเทรนด์ของ For You มาให้ ไม่ต้องไปไถไล่หาเอง อย่างไรก็ตาม Grok จะมีข้อความปิดท้ายส่วนสรุปเนื้อหาเพื่อป้องกันเหตุการณ์ไม่คาดคิดว่า เนื้อหานี้สรุปจากใน X ที่อาจมีการเปลี่ยนแปลงได้เมื่อเวลาผ่านไป และ Grok อาจสรุปผิดก็ได้ (ดูตัวอย่างจากรูปท้ายข่าว)

Tags:
Node Thumbnail

Anthropic บริษัทด้านปัญญาประดิษฐ์ผู้พัฒนา Claude เปิดตัวแอปบนระบบปฏิบัติ iOS สำหรับคนใช้ iPhone และ iPad นอกจากนี้ยังเปิดตัวแพ็คเกจจ่ายเงินสำหรับลูกค้าองค์กรด้วย

โดยแพ็คเกจสำหรับลูกค้าองค์กรมีชื่อว่า Team plan เพื่อเพิ่มการปกป้องข้อมูลและความปลอดภัยสำหรับองค์กรที่ต้องการใช้งาน Claude โดยปริมาณการใช้งานต่อบัญชีจะรองรับมากขึ้น, ได้ใช้โมเดลในกลุ่ม Claude 3 ได้แก่ Opus, Sonnet และ Haiku, รองรับการอ่านเอกสารขนาดยาว, ระบบแอดมินควบคุมค่าใช้จ่าย และฟีเจอร์อื่นที่เหมือนผู้ใช้งานแบบ Pro

แพ็คเกจ Team ราคา 30 ดอลลาร์ต่อบัญชีต่อเดือน ขั้นต่ำผู้ใช้งาน 5 คน

Tags:
Node Thumbnail

เว็บจัดอันดับแชตบอต LMSYS มีปัญญาประดิษฐ์ตัวใหม่เพิ่มเข้ามาคือ gpt2-chatbot โดยไม่มีคำอธิบายว่ามันคือโมเดลอะไร แต่เมื่อทดลองอักขระพิเศษก็พบว่ามันมีพฤติกรรมคล้าย GPT-4 อย่างมากเพราะมีปัญหากับอักระพิเศษเหมือนกัน

ผู้ใช้ที่ได้ลองใช้งานแล้วมีความเห็นต่างๆ กันไป บ้างก็ว่าไม่ต่างกันแชตบอตอื่นๆ แต่บางคนก็ระบุว่าดีกว่า GPT-4 ชัดเจน

การใช้งานสามารถเลือกได้ในเว็บ LMSYS ทั้งแบบ Direct และ Arena (side-by-side) แต่มีโควต้าการใช้งานชั่วโมงละ 1,000 แชตทำให้มักไม่ค่อยพอในช่วงนี้

OpenAI ไม่ได้เปิดตัวโมเดลใหม่มาระยะหนึ่งแล้ว โดยโมเดลสุดท้ายคือ GPT-4 Turbo ที่เปิดตัวมาแล้วครึ่งปี

Tags:
Node Thumbnail

OpenAI ประกาศว่าฟังก์ชัน Memory ใน ChatGPT ตอนนี้สามารถใช้งานได้แล้วสำหรับลูกค้าเสียเงิน ChatGPT Plus ทุกคน ยกเว้นในประเทศกลุ่มสหภาพยุโรป (EU) และเกาหลี ส่วนลูกค้าแบบ Team, Enterprise และ GPTs จะได้ใช้ Memory ในอนาคตเช่นกัน

Memory เป็นฟังก์ชันที่ OpenAI แบบจำกัดกลุ่มผู้ใช้งานก่อนหน้านี้ เป็นการสร้างข้อมูลพื้นฐานของผู้ใช้งานให้ ChatGPT จดจำไว้เลย ไม่ต้องอธิบายหรือทวนข้อมูลเหล่านี้ซ้ำในการสนทนาทุกครั้ง ซึ่ง ChatGPT จะเรียนรู้ทั้งจากการป้อนข้อมูลให้จดจำตรง ๆ หรือเรียนรู้ในระหว่างการสนทนา

Memory สามารถตรวจสอบและลบความจำบางหัวข้อ หรือตั้งค่าไม่ให้จดจำเลยก็ได้ โดยไปที่ Settings > Personalization > Memory

Tags:
Node Thumbnail

แอปเปิลเผยแพร่ OpenELM (Open-source Efficient Language Models) ชุดโมเดล AI ภาษาขนาดใหญ่ (LLM) แบบโอเพนซอร์ส ที่สามารถทำงานได้บนอุปกรณ์ ไม่ต้องเชื่อมต่อกับคลาวด์เซิร์ฟเวอร์ โดยสามารถดูรายละเอียดเพิ่มเติมได้ที่ Hugging Face

OpenELM มีทั้งหมด 8 โมเดล เป็น 4 โมเดลที่ยังไม่ถูกเทรน และอีก 4 โมเดลที่ผ่านการเทรนปรับแต่งมาแล้ว ขนาดพารามิเตอร์มีตั้งแต่ 270M ถึง 3B

Tags:
Node Thumbnail

Axon ผู้ผลิตอุปกรณ์สำหรับตำรวจ เช่น ปืนช็อตไฟฟ้า, กล้องติดตัวเจ้าหน้าที่, หรือระบบจัดเก็บหลักฐานคดี ออกซอฟต์แวร์ใหม่ Draft One ที่ใช้ generative AI ช่วยตำรวจเขียนเอกสารแจ้งความโดยอัตโนมัติ

Draft One ดึงเสียงจากกล้องติดตัวตำรวจ Axon Body มาแปลงเสียงเป็นข้อความ จากนั้นแปลงคำถามตอบของตำรวจกับผู้เสียหายกลายเป็นเอกสารแจ้งความ

ทาง Axon ระบุว่ามีแนวทางป้องกันความเสี่ยงที่เจ้าหน้าที่จะอาศัย AI มากเกินไป ได้แก่

Tags:
Node Thumbnail

บัญชี GitHub ที่ใช้ชื่อว่า rabbitscam ออกมาโพสซอร์สโค้ดของ Rabbit R1 อุปกรณ์ AI ผู้ช่วยที่เปิดตัวในงาน CES เมื่อต้นปีที่ผ่านมาว่าไม่ได้มี AI อะไรอยู่ภายใน และที่จริงแล้วความสามารถของ Rabbit R1 เป็นเพียงสคริปต์ Playwright ที่ควบคุมเบราว์เซอร์เท่านั้น

อย่างไรก็ดี ใน Hacker's News มีคนแคปหน้าจอข้อความ Discord ของ Peiyuan Liao ซีทีโอ Rabbit Inc. ระบุว่า Large Action Model (LAM) นั้นทำงานนอกโค้ดที่ rabbitscam โพสมา

Tags:
Topics: 
Node Thumbnail

ไมโครซอฟท์ปล่อยโมเดลปัญญาประดิษฐ์แบบ LLM ขนาดเล็ก phi-3-mini ที่มีขนาดเพียง 3.8 พันล้านพารามิเตอร์ แต่สามารถทำคะแนน MMLU ได้ 69% และคะแนน MT-Bench 8.38 นับว่าใกล้เคียง GPT-3.5 อย่างมาก (MMLU 70.0%, MT-Bench 7.94) ชนะ Llama 3 ขนาด 8B ที่เพิ่งออกมาอีกด้วย

โมเดลตระกูล Phi-3 ยังมีอีกสองรุ่น คือ phi-3-small ขนาด 7B, และ phi-3-medium ขนาด 14B ขณะที่รุ่น phi-3-mini นั้นเมื่อใช้งานแบบ quantized 4 bit จะใช้แรมเพียง 1.8GB สามารถรันบน iPhone 14 ด้้วยอัตรา 12 โทเค็นต่อวินาที

ในแง่ความปลอดภัย phi-3 ยังตอบสนองต่อเนื้อหาอันตรายน้อยลงกว่า phi-2 มาก เหลือเพียง 0.75% เทียบกับ phi-2 ที่ตอบ 2.93%

Tags:
Node Thumbnail

Groq สตาร์ตอัพผู้สร้างชิปเร่งการประมวลผล AI (คนละบริษัทกับ Grok ที่เป็นของ Twitter/X) สามารถรันโมเดล Llama 3 ตัวใหม่ล่าสุดของ Meta ด้วยความเร็วสูงถึง 800 token ต่อวินาที

ถ้าดูจากสถิติเดิมเมื่อเดือนกุมภาพันธ์ปีนี้ Groq สามารถรัน Llama 2 70B ด้วยความเร็ว 240 token ต่อวินาที ซึ่งถือว่าเร็วมากๆ แล้ว เมื่อเทียบกับตัวเลขของ GPT-4 หรือ Claude Opus ที่ทำได้ไม่ถึง 40 token ต่อวินาที

Node Thumbnail

Meta ประกาศอัปเดต Meta AI แชทบอตผู้ช่วยบน Facebook, Instagram, WhatsApp และ Messenger ที่เปิดตัวในงาน Connect เมื่อปีที่แล้ว โดยขยายประเทศที่รองรับเพิ่มเติมนอกจากสหรัฐอเมริกา ตามที่มีข่าวก่อนหน้านี้ รวมทั้งเพิ่มความสามารถด้วยโมเดล Meta Llama 3 ล่าสุดที่เพิ่งเปิดตัว

รายชื่อประเทศที่ได้ใช้งาน Meta AI ในภาษาอังกฤษเพิ่มเติมได้แก่ ออสเตรเลีย แคนาดา กานา จาไมกา มาลาวี นิวซีแลนด์ ไนจีเรีย ปากีสถาน สิงคโปร์ แอฟริกาใต้ ยูกันดา แซมเบีย และซิมบับเว ซึ่งจะขยายเพิ่มเติมต่อไปเร็ว ๆ นี้

Pages