LLM | Blognone

Large Language Model

Alibaba เปิดตัว Qwen2.5-Turbo ปัญญาประดิษฐ์ให้บริการผ่านคลาวด์ รองรับข้อมูล 1 ล้านโทเค็น ราคาถูกกว่า GPT-4o-mini 3.6 เท่า

By lew

on 19 November 2024 - 13:27 Tag: Alibaba Cloud, LLM, Qwen

Alibaba Cloud

Alibaba เปิดโมเดล Qwen2.5-Turbo โมเดลปัญญาประดิษฐ์ที่ปรับปรุงขึ้นจากรุ่นโอเพนซอร์ส เน้นขนาดข้อมูลที่รองรับได้ จากเดิม 128,000 โทเค็นเป็น 1 ล้านโทเค็น ทำให้รองรับข้อมูลระดับหนังสือทั้งเล่มได้ คิดเป็นขนาดข้อมูลประมาณ 1 ล้านคำหรืออักษรจีน 1.5 ล้านตัวอักษร

ผลทดสอบของ Qwen2.5-Turbo ค่อนข้างดีมากการถามตอบจากข้อมูลขนาดใหญ่ Passkey Retrieval ได้เต็ม 100 คะแนน ขณะที่ชุดทดสอบ RULER ก็ได้คะแนนสูงกว่า GPT-4 เมื่อใส่ข้อมูลเต็ม 1 ล้านโทเค็นจะเริ่มตอบใน 68 วินาที ราคาต่อ 1 ล้านโทเค็นอยู่ที่ 0.3 หยวน ถูกกว่า GPT-4o-mini อยู่ 4.6 เท่าตัว

Mistral AI เปิดตัวเครื่องมือใหม่ของแชทบอต le Chat และเปิดตัวโมเดลวิเคราะห์เอกสาร-รูปภาพ Pixtral Large

By arjin

on 19 November 2024 - 12:41 Tag: Mistral, LLM, Artificial Intelligence, Chatbot

Mistral

Mistral AI ประกาศเพิ่มความสามารถให้แพลตฟอร์มแชทบอต le Chat โดยสามารถค้นหาข้อมูลเว็บได้, เพิ่ม Canvas สำหรับปรับแต่งผลลัพธ์ได้สะดวกขึ้น เป็นฟีเจอร์แบบเดียวกับ ChatGPT, วิเคราะห์รูปภาพ-เอกสาร, สร้างรูปภาพ ด้วยโมเดล FLUX และปรับปรุงความเร็วในการตอบสนอง

ChatGPT บน macOS รองรับการอ่านโค้ดจากแอป Developer ส่วนเวอร์ชัน Windows เปิดให้ใช้งานได้ทุกคนแล้ว

By arjin

on 15 November 2024 - 12:32 Tag: ChatGPT, OpenAI, Developer, LLM, Windows, macOS

ChatGPT

OpenAI ประกาศรายละเอียดใหม่ของแอป ChatGPT บนเดสก์ท็อปทั้ง macOS และ Windows มีรายละเอียดดังนี้

ChatGPT macOS เพิ่มความสามารถอ่านโค้ดจากแอปเขียนโค้ด เช่น VS Code, Xcode, TextEdit, Terminal หรือ iTerm2 ทำให้นักพัฒนาไม่ต้องคัดลอกตัดแปะโค้ดเพื่อถามกับแชทบอต แต่สามารถถามจากโค้ดที่ปรากฏในหน้าจอได้เลย อย่างไรก็ตาม ChatGPT สามารถให้คำตอบได้เฉพาะในแอปเท่านั้น ยังไม่มีความสามารถที่เข้าไปแก้ไขโค้ดในแอปนั้นได้โดยตรงแบบ GitHub Copilot

ผลทดสอบ MLPerf 4.1 พบ NVIDIA Blackwell ฝึก Llama เร็วขึ้น 2.2 เท่า กูเกิลโชว์ Trillium ลดค่าฝึกได้ 45%

By lew

on 15 November 2024 - 10:51 Tag: Artificial Intelligence, LLM, NVIDIA, Google

Artificial Intelligence

MLPerf ชุดทดสอบความสามารถคอมพิวเตอร์และการ์ดเร่งความเร็วสำหรับงานด้าน machine learning โดยเฉพาะ ออกผลทดสอบเวอร์ชั่น 4.1 ที่เน้นวัดความสามารถในการฝึกปัญญาประดิษฐ์กลุ่ม generative AI ทั้งการสร้างข้อความและภาพ โดยผลในรอบนี้มีผู้แข่งสำคัญเพียงสองราย คือ NVIDIA และ Google

Alibaba เปิดตัว Qwen2.5-Coder LLM ช่วยเขียนโค้ดความสามารถใกล้เคียง GPT-4o

By lew

on 12 November 2024 - 09:58 Tag: Alibaba Cloud, LLM, Qwen, Programming

Alibaba Cloud

ทีมวิจัย Qwen ของ Aliababa เปิดตัวโมเดล Qwen2.5-Coder โมเดล LLM ช่วยเขียนโค้ดที่ปรับปรุงกระบวนการฝึกจนได้ประสิทธิภาพสูงสุดในหมู่โมเดลโอเพนซอร์ส คะแนนทดสอบรวมพอๆ กับ GPT-4o ในการทดสอบหลายตัว

กระบวนการฝึก Qwen2.5-Coder นั้นอาศัยการฝึกเป็นขั้น เริ่มตั้งแต่การฝึกโค้ดแบบไฟล์เดี่ยว (file-level pretrain) แล้วขยับมาเป็นการฝึกแบบหลายไฟล์ (repo-level pretrain) สุดท้ายจึงฝึกการเขียนโค้ดตามคำสั่ง โดยอาศัยชุดข้อมูลโค้ดที่พบในอินเทอร์เน็ต นำมาสร้างคำสั่งเพื่อให้ได้โค้ดนั้น แล้วจึงนำชุดข้อมูลไปฝึก

Sourcegraph ลองใช้ Gemini ความยาวอินพุต 1M ช่วยแนะนำโค้ด ผลลัพธ์ออกมาดีขึ้นชัดเจนจากโมเดล 10k

By mk

on 11 November 2024 - 08:51 Tag: Sourcegraph, Gemini, Development, LLM, Google

Sourcegraph

กูเกิลจับมือกับบริษัท Sourcegraph ผู้พัฒนา AI ช่วยเขียนโค้ดชื่อ Cody ทดลองนำโมเดล Gemini 1.5 ที่รองรับอินพุตขนาดยาว 1 ล้านโทเคน ว่าช่วยให้คุณภาพของคำตอบดีขึ้นอย่างไร

Cody เป็นการนำ AI มาอ่านโค้ดภายในขององค์กรลูกค้า เพื่อช่วยให้ค้นหาและแนะนำการเขียนโค้ดใหม่ ใช้ร่วมกับ IDE ยอดนิยมทั้ง Visual Studio และตระกูล JetBrains ได้ โมเดลภาษาที่ Cody เลือกใช้งานเป็นโมเดลยอดนิยมหลายตัวในตลาด เช่น Claude 3/3.5, GPT-4o, Gemini, Mixtral (ลูกค้าเลือกเองโมเดลได้) โดยโมเดลที่ใช้งานในระดับโปรดักชันมีขนาด context window ยาว 10,000 โทเคน (10k)

[ลือ] โมเดล Orion ของ OpenAI พัฒนาขึ้นจาก GPT-4 ไม่เยอะอย่างที่หวัง ทางตันของ Transformer?

By mk

on 10 November 2024 - 10:59 Tag: OpenAI, LLM, Artificial Intelligence

OpenAI

เว็บไซต์ The Information รายงานอ้างแหล่งข่าวภายในจาก OpenAI ว่าโมเดลตัวใหม่โค้ดเนม Orion ไม่ได้พัฒนาจาก GPT-4 แบบก้าวกระโดด เหมือนกับตอนเปลี่ยนจาก GPT-3 มาเป็น GPT-4

แหล่งข่าวของ The Information ยังบอกว่า Orion ยังอาจทำงานไม่ได้ดีกว่าโมเดลรุ่นปัจจุบันอย่างชัดเจนนัก (not be reliably better) ในงานบางด่าน เช่น การเขียนโค้ด

Gemini รองรับการเรียกผ่าน OpenAI Library แล้ว, ออก REST API ให้ใช้งาน

By mk

on 9 November 2024 - 10:36 Tag: Gemini, Google, LLM, OpenAI, Development, API

Gemini

ต้องยอมรับว่ากูเกิลเปิดตัว Gemini หลัง ChatGPT เป็นเวลานานพอสมควร ทำให้ตลาด AI/LLM มุ่งไปที่ฝั่ง OpenAI กันหมด แอพที่เรียกใช้งาน LLM จึงมักเขียนเพื่อรองรับโมเดลของฝั่ง OpenAI โดยเรียกใช้ OpenAI Library (ทั้งที่เป็น official และ unofficial) กันซะเป็นส่วนใหญ่

ล่าสุดกูเกิลประกาศ "แฝงตัว" ให้รองรับการเรียกใช้ Gemini ผ่าน OpenAI Library ได้แล้ว ช่วยลดภาระการแก้โค้ดลง โดยโค้ดสามารถเรียกใช้ OpenAI Library ได้เหมือนเดิม แต่ในส่วนของโมเดลเปลี่ยนเป็นเรียก Gemini แทน ช่วยให้แก้โค้ดเพียงไม่กี่บรรทัดเท่านั้น

รู้จักโครงการ SEALD ความพยายามสร้าง LLM โอเพนซอร์สในบริบทท้องถิ่นอาเซียน

By nismod

on 7 November 2024 - 18:47 Tag: Google, Singapore, Artificial Intelligence, LLM, Southeast Asia

Google

ปัจจุบันโมเดล LLM เก่งๆ มีหลากหลายโมเดล แต่ส่วนใหญ่ถูกพัฒนาจากกรอบของภาษาอังกฤษ หรือภาษาอื่นที่เป็นภาษาหลักของโลก รวมถึงชุดข้อมูลและการปรับแต่ง ก็ถูกตีกรอบด้วยอิทธิพลและมุมมองจากตะวันตกเป็นหลัก ทำให้ในหลายๆ ประเทศ หลายๆ ภูมิภาค ที่มีภาษาและบริบททางวัฒนธรรมเฉพาะ ไม่สามารถเข้าถึง LLM ได้ ซึ่งบริษัทใหญ่ๆ ก็คงไม่เน้นพัฒนาให้ หรือประเทศนั้นๆ จะพัฒนาเอง ก็ไม่ได้มีทรัพยากรเพียงพอ

Ollama ออกเวอร์ชั่น 0.4 รองรับอินพุตเป็นภาพ

By lew

on 7 November 2024 - 12:10 Tag: Artificial Intelligence, LLM

Artificial Intelligence

Ollama ซอฟต์แวร์รันไทม์สำหรับรันโมเดลปัญญาประดิษฐ์ ออกเวอร์ชั่น 0.4 รองรับการรันโมเดลที่รับอินพุตเป็นภาพ โมเดลสำคัญคในกลุ่มนี้คือ Llama 3.2 ของ Meta

llama3.2-vision มีทั้งรุ่น 11B และ 90B ต้องการแรมขั้นต่ำ 8GB ส่วนรุ่น 90B ต้องการขั้นต่ำ 64GB โดยโมเดลรุ่นเล็กเหล่านี้เป็นแบบ quantize 4 bit รุ่นใหญ่สุดแบบ FP16 นั้นเฉพาะไฟล์โมเดลก็ขนาดถึง 177GB แล้ว

การใช้งาน llama3.2-vision สามารถใช้งานได้ทั้งการทำ OCR, อ่านลายมือ, อธิบายภาพ

ที่มา - Ollama

Claude 3.5 Haiku เปิดให้ใช้งานแล้ว พร้อมราคาที่แพงกว่ารุ่นก่อนหน้า Claude 3 Haiku

By arjin

on 5 November 2024 - 13:13 Tag: Claude, Anthropic, LLM, Artificial Intelligence

Claude

Anthropic ประกาศว่าโมเดลปัญญาประดิษฐ์ Claude 3.5 Haiku ที่เป็นรุ่นเล็กมีราคาถูก ตอนนี้เปิดให้ใช้งานแล้วผ่าน API และผ่านผู้ให้บริการคลาวด์ทั้ง Amazon Bedrock และ Vertex AI หลังจากเปิดตัวไปเมื่อเดือนที่แล้วพร้อมกับ Sonnet 3.5 รุ่นปรับปรุง

Runway เพิ่มเครื่องมือกำหนดทิศทางมุมกล้องขั้นสูงในโมเดลวิดีโอ Gen-3 Alpha Turbo

By arjin

on 4 November 2024 - 12:47 Tag: Runway, Artificial Intelligence, LLM

Runway

Runway สตาร์ทอัปที่เน้นพัฒนาปัญญาประดิษฐ์สร้างวิดีโอ ประกาศเพิ่มเครื่องมือ Advanced Camera Control บนโมเดล Gen-3 Alpha Turbo ทำให้ผู้ใช้งานกำหนดรายละเอียดทิศทางมุมกล้องที่ต้องการได้ตั้งแต่ใน Prompt

ทิศทางและการเคลื่อนที่ของกล้องสามารถกำหนดได้ตั้งแต่ระดับ เลื่อนซ้าย-ขวา-บน-ล่าง, ซูมเข้า, ทิศทางกล้องหมุน ความเร็ว จนถึงระยะห่างที่ซูมกับวัตถุ ทำให้การสร้างวิดีโอด้วย Gen-3 Alpha Turbo ควบคุมได้มากขึ้นคล้ายกับการถ่ายงานวิดีโอจริงมากขึ้นไปอีก

Claude 3.5 Sonnet เพิ่มเครื่องมือ Visual PDF สามารถวิเคราะห์เอกสารได้ทั้งตัวหนังสือ-กราฟ-รูปภาพ

By arjin

on 2 November 2024 - 22:52 Tag: Claude, Anthropic, LLM

Claude

Anthropic ประกาศเพิ่มเครื่องมือใหม่ Visual PDF บนโมเดล Claude 3.5 Sonnet ซึ่งมีความสามารถในการอ่านวิเคราะห์เนื้อหาจากเอกสาร PDF ได้

เงื่อนไขในการใช้งาน Visual PDF ระบุว่า หากเอกสารนั้นมีจำนวนต่ำกว่า 100 หน้า สามารถอัปโหลดได้โดยตรงผ่านกล่องแชท และ Visual PDF สามารถวิเคราะห์ข้อมูลรูปภาพ แผนภูมิ กราฟิก ได้ด้วย แต่ถ้าเอกสารมีมากกว่า 100 หน้า จะรองรับเฉพาะข้อความตัวหนังสือเท่านั้น

Claude แนะนำว่าเพื่อประสิทธิภาพการทำงานสำหรับไฟล์ที่มีจำนวนหน้าเอกสารเยอะ ควรแบ่งเป็นไฟล์ย่อยให้อยู่ในข้อจำกัด 100 หน้า

OpenAI เปิดตัว ChatGPT Search ค้นหาข้อมูลล่าสุดจากเว็บต่าง ๆ ผ่านแชทบอต - ลูกค้าเสียเงินได้ใช้ก่อนตั้งแต่วันนี้

By arjin

on 1 November 2024 - 04:00 Tag: OpenAI, ChatGPT, SearchGPT, Search Engine, LLM, Artificial Intelligence

OpenAI

OpenAI เปิดตัวบริการใหม่ ChatGPT Search เพื่อให้ผู้ใช้งานค้นหาข้อมูลจากเว็บไซต์ต่าง ๆ รองรับข้อมูลที่มีการปรับปรุงอยู่ตลอดอย่าง ผลการแข่งขันกีฬา, ข่าวสาร หรือราคาหุ้น ด้วยรูปแบบการโต้ตอบของแชทบอตผ่านกล่อง ChatGPT

ในการทำงาน ChatGPT จะเลือกค้นหาข้อมูลผ่านเว็บตามลักษณะคำถาม หรือผู้ใช้งานจะเลือกปุ่ม Web Search เพื่อให้ ChatGPT ค้นหาข้อมูลจากเว็บไซต์ก็ได้ ในผลคำตอบจะมีลิงก์แนบท้ายเพื่อให้ดูข้อมูลเพิ่มเติมที่ต้นทางด้วย

Anthropic ออกแอป Claude เวอร์ชัน Mac และ Windows

By arjin

on 31 October 2024 - 22:30 Tag: Anthropic, LLM, Claude

Anthropic

Anthropic ออกแอป Claude สำหรับผู้ใช้งาน Mac และ Windows โดยตัวแอปมีสถานะเป็นพับลิกเบต้า ซึ่ง Anthropic บอกเหตุผลที่ออกแอปสำหรับแต่ละระบบปฏิบัติการ เพื่อให้ Claude สามารถใช้งานได้ในทุกสภาพแวดล้อมที่ต้องการ

แอป Claude บน Mac และ Windows สามารถใช้งานได้ผู้ใช้งานแบบฟรี และผู้ใช้งานที่สมัครแผนพรีเมียม

นอกจากนี้ Anthropic ยังเพิ่มเครื่องมือใหม่ของแชทบอต Claude สามารถพิมพ์ตามเสียงพูดหรือ Dictation รองรับความยาวเสียงสูงสุด 10 นาที ส่งอินพุทได้ทั้งการกดบันทึกเสียง หรืออัปโหลดข้อความเสียง ตอนนี้รองรับเฉพาะแอป iOS, Android และ iPadOS เท่านั้น

GitHub เพิ่มบริการ Copilot สำหรับนักพัฒนาบน Xcode

By arjin

on 30 October 2024 - 19:39 Tag: GitHub Copilot, GitHub, LLM, Developer, Xcode

GitHub Copilot

GitHub ประกาศว่าบริการ GitHub Copilot สำหรับ Xcode เข้าสู่สถานะพับลิกพรีวิวแล้ว เพิ่มความสามารถให้บริการ Copilot รองรับนักพัฒนาได้ในหลากหลายแพลตฟอร์มรวมทั้งแอปเปิล

GitHub Copilot สำหรับ Xcode มีฟีเจอร์ต่าง ๆ ครอบคลุมเหมือนกับ Copilot บนเครื่องมืออื่นทั้ง Code Completion, รองรับภาษา Swift และ Objective-C, ระบบแนะนำโค้ดแบบหลายบรรทัด, ระบบฟิลเตอร์เนื้อหา และอื่น ๆ

ในการใช้งาน GitHub Copilot สำหรับ Xcode ต้องมีไลเซนส์ของ Copilot ด้วย ซึ่งรองรับทั้งผู้ใช้งานแบบบุคคล, Business และ Enterprise

Meta ไม่เห็นด้วยกับนิยาม AI โอเพนซอร์ส ซึ่ง Llama ไม่เข้าเงื่อนไข

By arjin

on 29 October 2024 - 18:02 Tag: Meta, Artificial Intelligence, LLM, Open Source

OSI ออกนิยามปัญญาประดิษฐ์โอเพนซอร์ส ต้องใช้งานได้โดยไม่ต้องขออนุญาต ไม่จำกัดการใช้งาน

By lew

on 29 October 2024 - 09:45 Tag: Open Source, LLM, Artificial Intelligence

Open Source

Open Source Initiative (OSI) หน่วยงานผู้ให้นิยามของซอฟต์แวร์โอเพนซอร์ส ประกาศนิยามของปัญญาประดิษฐ์โอเพนซอร์ส The Open Source AI Definition – 1.0 เพื่อให้อุตสาหกรรมเข้าใจตรงกันว่าการเป็นโอเพนซอร์ส (ตาม OSI) ต้องมีเงื่อนไขใดบ้าง

แนวทางนิยามของ OSI สำหรับปัญญาประดิษฐ์นั้นไม่ต่างจากซอฟต์แวร์มากนัก แต่เพิ่มนิยามรายละเอียด แยกส่วน เช่น ข้อมูลที่ใช้ฝึกนั้นต้องให้รายละเอียดเพียงพอ แม้จะไม่ต้องแชร์ข้อมูลออกมาเสมอไป, ตัวโค้ดที่ใช้รันต้องใช้สัญญาอนุญาตที่ OSI รองรับว่าเป็นโอเพนซอร์ส, และตัวพารามิเตอร์ต้องแจกในสัญญาอนุญาตที่ OSI รับรองเช่นกัน

Meta ปล่อย NotebookLlama จำลอง NotebookLM ของกูเกิลแต่ใช้ AI โอเพนซอร์สทั้งหมด

By lew

on 28 October 2024 - 12:16 Tag: Meta, LLM, NotebookLM, Llama

[ลือ] กูเกิลเตรียมเปิดตัวโมเดล Gemini 2.0 ในเดือนธันวาคม 2024

By mk

on 26 October 2024 - 08:01 Tag: Gemini, Google, LLM, Rumors

Gemini

เว็บไซต์ The Verge อ้างข่าวลือจากแหล่งข่าวใกล้ชิดกูเกิล ว่าเราจะได้เห็นโมเดล Gemini 2.0 เปิดตัวในเดือนธันวาคม ไล่เลี่ยกับ ข่าวลือว่า OpenAI จะเปิดตัวโมเดลใหม่ Orion ซึ่งรายงานโดย The Verge เช่นกัน

แหล่งข่าวของ The Verge บอกว่าโมเดล Gemini 2.0 ไม่ได้มีประสิทธิภาพเพิ่มขึ้นมากเท่ากับที่ Google DeepMind คาดหวังไว้ แต่เขาก็บอกว่าทุกบริษัทที่พัฒนาโมเดลขนาดใหญ่เจอปัญหาลักษณะเดียวกัน ซึ่งน่าจะเริ่มเป็นทางตันของโมเดลตระกูล Transformer ที่พัฒนาอย่างก้าวกระโดดในช่วงหลายปีที่ผ่านมา

Subscribe to LLM