Image

Large Language Model

By lew Founder on Tag: Alibaba Cloud, LLM, Qwen
Alibaba Cloud

Alibaba เปิดโมเดล Qwen2.5-Turbo โมเดลปัญญาประดิษฐ์ที่ปรับปรุงขึ้นจากรุ่นโอเพนซอร์ส เน้นขนาดข้อมูลที่รองรับได้ จากเดิม 128,000 โทเค็นเป็น 1 ล้านโทเค็น ทำให้รองรับข้อมูลระดับหนังสือทั้งเล่มได้ คิดเป็นขนาดข้อมูลประมาณ 1 ล้านคำหรืออักษรจีน 1.5 ล้านตัวอักษร

ผลทดสอบของ Qwen2.5-Turbo ค่อนข้างดีมากการถามตอบจากข้อมูลขนาดใหญ่ Passkey Retrieval ได้เต็ม 100 คะแนน ขณะที่ชุดทดสอบ RULER ก็ได้คะแนนสูงกว่า GPT-4 เมื่อใส่ข้อมูลเต็ม 1 ล้านโทเค็นจะเริ่มตอบใน 68 วินาที ราคาต่อ 1 ล้านโทเค็นอยู่ที่ 0.3 หยวน ถูกกว่า GPT-4o-mini อยู่ 4.6 เท่าตัว

By arjin Writer on Tag: Mistral, LLM, Artificial Intelligence, Chatbot
Mistral

Mistral AI ประกาศเพิ่มความสามารถให้แพลตฟอร์มแชทบอต le Chat โดยสามารถค้นหาข้อมูลเว็บได้, เพิ่ม Canvas สำหรับปรับแต่งผลลัพธ์ได้สะดวกขึ้น เป็นฟีเจอร์แบบเดียวกับ ChatGPT, วิเคราะห์รูปภาพ-เอกสาร, สร้างรูปภาพ ด้วยโมเดล FLUX และปรับปรุงความเร็วในการตอบสนอง

By arjin Writer on Tag: ChatGPT, OpenAI, Developer, LLM, Windows, macOS
ChatGPT

OpenAI ประกาศรายละเอียดใหม่ของแอป ChatGPT บนเดสก์ท็อปทั้ง macOS และ Windows มีรายละเอียดดังนี้

ChatGPT macOS เพิ่มความสามารถอ่านโค้ดจากแอปเขียนโค้ด เช่น VS Code, Xcode, TextEdit, Terminal หรือ iTerm2 ทำให้นักพัฒนาไม่ต้องคัดลอกตัดแปะโค้ดเพื่อถามกับแชทบอต แต่สามารถถามจากโค้ดที่ปรากฏในหน้าจอได้เลย อย่างไรก็ตาม ChatGPT สามารถให้คำตอบได้เฉพาะในแอปเท่านั้น ยังไม่มีความสามารถที่เข้าไปแก้ไขโค้ดในแอปนั้นได้โดยตรงแบบ GitHub Copilot

By lew Founder on Tag: Artificial Intelligence, LLM, NVIDIA, Google
Artificial Intelligence

MLPerf ชุดทดสอบความสามารถคอมพิวเตอร์และการ์ดเร่งความเร็วสำหรับงานด้าน machine learning โดยเฉพาะ ออกผลทดสอบเวอร์ชั่น 4.1 ที่เน้นวัดความสามารถในการฝึกปัญญาประดิษฐ์กลุ่ม generative AI ทั้งการสร้างข้อความและภาพ โดยผลในรอบนี้มีผู้แข่งสำคัญเพียงสองราย คือ NVIDIA และ Google

By lew Founder on Tag: Alibaba Cloud, LLM, Qwen, Programming
Alibaba Cloud

ทีมวิจัย Qwen ของ Aliababa เปิดตัวโมเดล Qwen2.5-Coder โมเดล LLM ช่วยเขียนโค้ดที่ปรับปรุงกระบวนการฝึกจนได้ประสิทธิภาพสูงสุดในหมู่โมเดลโอเพนซอร์ส คะแนนทดสอบรวมพอๆ กับ GPT-4o ในการทดสอบหลายตัว

กระบวนการฝึก Qwen2.5-Coder นั้นอาศัยการฝึกเป็นขั้น เริ่มตั้งแต่การฝึกโค้ดแบบไฟล์เดี่ยว (file-level pretrain) แล้วขยับมาเป็นการฝึกแบบหลายไฟล์ (repo-level pretrain) สุดท้ายจึงฝึกการเขียนโค้ดตามคำสั่ง โดยอาศัยชุดข้อมูลโค้ดที่พบในอินเทอร์เน็ต นำมาสร้างคำสั่งเพื่อให้ได้โค้ดนั้น แล้วจึงนำชุดข้อมูลไปฝึก

By mk Founder on Tag: Sourcegraph, Gemini, Development, LLM, Google
Sourcegraph

กูเกิลจับมือกับบริษัท Sourcegraph ผู้พัฒนา AI ช่วยเขียนโค้ดชื่อ Cody ทดลองนำโมเดล Gemini 1.5 ที่รองรับอินพุตขนาดยาว 1 ล้านโทเคน ว่าช่วยให้คุณภาพของคำตอบดีขึ้นอย่างไร

Cody เป็นการนำ AI มาอ่านโค้ดภายในขององค์กรลูกค้า เพื่อช่วยให้ค้นหาและแนะนำการเขียนโค้ดใหม่ ใช้ร่วมกับ IDE ยอดนิยมทั้ง Visual Studio และตระกูล JetBrains ได้ โมเดลภาษาที่ Cody เลือกใช้งานเป็นโมเดลยอดนิยมหลายตัวในตลาด เช่น Claude 3/3.5, GPT-4o, Gemini, Mixtral (ลูกค้าเลือกเองโมเดลได้) โดยโมเดลที่ใช้งานในระดับโปรดักชันมีขนาด context window ยาว 10,000 โทเคน (10k)

By mk Founder on Tag: OpenAI, LLM, Artificial Intelligence
OpenAI

เว็บไซต์ The Information รายงานอ้างแหล่งข่าวภายในจาก OpenAI ว่าโมเดลตัวใหม่โค้ดเนม Orion ไม่ได้พัฒนาจาก GPT-4 แบบก้าวกระโดด เหมือนกับตอนเปลี่ยนจาก GPT-3 มาเป็น GPT-4

แหล่งข่าวของ The Information ยังบอกว่า Orion ยังอาจทำงานไม่ได้ดีกว่าโมเดลรุ่นปัจจุบันอย่างชัดเจนนัก (not be reliably better) ในงานบางด่าน เช่น การเขียนโค้ด

By mk Founder on Tag: Gemini, Google, LLM, OpenAI, Development, API
Gemini

ต้องยอมรับว่ากูเกิลเปิดตัว Gemini หลัง ChatGPT เป็นเวลานานพอสมควร ทำให้ตลาด AI/LLM มุ่งไปที่ฝั่ง OpenAI กันหมด แอพที่เรียกใช้งาน LLM จึงมักเขียนเพื่อรองรับโมเดลของฝั่ง OpenAI โดยเรียกใช้ OpenAI Library (ทั้งที่เป็น official และ unofficial) กันซะเป็นส่วนใหญ่

ล่าสุดกูเกิลประกาศ "แฝงตัว" ให้รองรับการเรียกใช้ Gemini ผ่าน OpenAI Library ได้แล้ว ช่วยลดภาระการแก้โค้ดลง โดยโค้ดสามารถเรียกใช้ OpenAI Library ได้เหมือนเดิม แต่ในส่วนของโมเดลเปลี่ยนเป็นเรียก Gemini แทน ช่วยให้แก้โค้ดเพียงไม่กี่บรรทัดเท่านั้น

By nismod Writer on Tag: Google, Singapore, Artificial Intelligence, LLM, Southeast Asia
Google

ปัจจุบันโมเดล LLM เก่งๆ มีหลากหลายโมเดล แต่ส่วนใหญ่ถูกพัฒนาจากกรอบของภาษาอังกฤษ หรือภาษาอื่นที่เป็นภาษาหลักของโลก รวมถึงชุดข้อมูลและการปรับแต่ง ก็ถูกตีกรอบด้วยอิทธิพลและมุมมองจากตะวันตกเป็นหลัก ทำให้ในหลายๆ ประเทศ หลายๆ ภูมิภาค ที่มีภาษาและบริบททางวัฒนธรรมเฉพาะ ไม่สามารถเข้าถึง LLM ได้ ซึ่งบริษัทใหญ่ๆ ก็คงไม่เน้นพัฒนาให้ หรือประเทศนั้นๆ จะพัฒนาเอง ก็ไม่ได้มีทรัพยากรเพียงพอ

By lew Founder on Tag: Artificial Intelligence, LLM
Artificial Intelligence

Ollama ซอฟต์แวร์รันไทม์สำหรับรันโมเดลปัญญาประดิษฐ์ ออกเวอร์ชั่น 0.4 รองรับการรันโมเดลที่รับอินพุตเป็นภาพ โมเดลสำคัญคในกลุ่มนี้คือ Llama 3.2 ของ Meta

llama3.2-vision มีทั้งรุ่น 11B และ 90B ต้องการแรมขั้นต่ำ 8GB ส่วนรุ่น 90B ต้องการขั้นต่ำ 64GB โดยโมเดลรุ่นเล็กเหล่านี้เป็นแบบ quantize 4 bit รุ่นใหญ่สุดแบบ FP16 นั้นเฉพาะไฟล์โมเดลก็ขนาดถึง 177GB แล้ว

การใช้งาน llama3.2-vision สามารถใช้งานได้ทั้งการทำ OCR, อ่านลายมือ, อธิบายภาพ

ที่มา - Ollama

By arjin Writer on Tag: Claude, Anthropic, LLM, Artificial Intelligence
Claude

Anthropic ประกาศว่าโมเดลปัญญาประดิษฐ์ Claude 3.5 Haiku ที่เป็นรุ่นเล็กมีราคาถูก ตอนนี้เปิดให้ใช้งานแล้วผ่าน API และผ่านผู้ให้บริการคลาวด์ทั้ง Amazon Bedrock และ Vertex AI หลังจากเปิดตัวไปเมื่อเดือนที่แล้วพร้อมกับ Sonnet 3.5 รุ่นปรับปรุง

By arjin Writer on Tag: Runway, Artificial Intelligence, LLM
Runway

Runway สตาร์ทอัปที่เน้นพัฒนาปัญญาประดิษฐ์สร้างวิดีโอ ประกาศเพิ่มเครื่องมือ Advanced Camera Control บนโมเดล Gen-3 Alpha Turbo ทำให้ผู้ใช้งานกำหนดรายละเอียดทิศทางมุมกล้องที่ต้องการได้ตั้งแต่ใน Prompt

ทิศทางและการเคลื่อนที่ของกล้องสามารถกำหนดได้ตั้งแต่ระดับ เลื่อนซ้าย-ขวา-บน-ล่าง, ซูมเข้า, ทิศทางกล้องหมุน ความเร็ว จนถึงระยะห่างที่ซูมกับวัตถุ ทำให้การสร้างวิดีโอด้วย Gen-3 Alpha Turbo ควบคุมได้มากขึ้นคล้ายกับการถ่ายงานวิดีโอจริงมากขึ้นไปอีก

By arjin Writer on Tag: Claude, Anthropic, LLM
Claude

Anthropic ประกาศเพิ่มเครื่องมือใหม่ Visual PDF บนโมเดล Claude 3.5 Sonnet ซึ่งมีความสามารถในการอ่านวิเคราะห์เนื้อหาจากเอกสาร PDF ได้

เงื่อนไขในการใช้งาน Visual PDF ระบุว่า หากเอกสารนั้นมีจำนวนต่ำกว่า 100 หน้า สามารถอัปโหลดได้โดยตรงผ่านกล่องแชท และ Visual PDF สามารถวิเคราะห์ข้อมูลรูปภาพ แผนภูมิ กราฟิก ได้ด้วย แต่ถ้าเอกสารมีมากกว่า 100 หน้า จะรองรับเฉพาะข้อความตัวหนังสือเท่านั้น

Claude แนะนำว่าเพื่อประสิทธิภาพการทำงานสำหรับไฟล์ที่มีจำนวนหน้าเอกสารเยอะ ควรแบ่งเป็นไฟล์ย่อยให้อยู่ในข้อจำกัด 100 หน้า

By arjin Writer on Tag: OpenAI, ChatGPT, SearchGPT, Search Engine, LLM, Artificial Intelligence
OpenAI

OpenAI เปิดตัวบริการใหม่ ChatGPT Search เพื่อให้ผู้ใช้งานค้นหาข้อมูลจากเว็บไซต์ต่าง ๆ รองรับข้อมูลที่มีการปรับปรุงอยู่ตลอดอย่าง ผลการแข่งขันกีฬา, ข่าวสาร หรือราคาหุ้น ด้วยรูปแบบการโต้ตอบของแชทบอตผ่านกล่อง ChatGPT

ในการทำงาน ChatGPT จะเลือกค้นหาข้อมูลผ่านเว็บตามลักษณะคำถาม หรือผู้ใช้งานจะเลือกปุ่ม Web Search เพื่อให้ ChatGPT ค้นหาข้อมูลจากเว็บไซต์ก็ได้ ในผลคำตอบจะมีลิงก์แนบท้ายเพื่อให้ดูข้อมูลเพิ่มเติมที่ต้นทางด้วย

By arjin Writer on Tag: Anthropic, LLM, Claude
Anthropic

Anthropic ออกแอป Claude สำหรับผู้ใช้งาน Mac และ Windows โดยตัวแอปมีสถานะเป็นพับลิกเบต้า ซึ่ง Anthropic บอกเหตุผลที่ออกแอปสำหรับแต่ละระบบปฏิบัติการ เพื่อให้ Claude สามารถใช้งานได้ในทุกสภาพแวดล้อมที่ต้องการ

แอป Claude บน Mac และ Windows สามารถใช้งานได้ผู้ใช้งานแบบฟรี และผู้ใช้งานที่สมัครแผนพรีเมียม

นอกจากนี้ Anthropic ยังเพิ่มเครื่องมือใหม่ของแชทบอต Claude สามารถพิมพ์ตามเสียงพูดหรือ Dictation รองรับความยาวเสียงสูงสุด 10 นาที ส่งอินพุทได้ทั้งการกดบันทึกเสียง หรืออัปโหลดข้อความเสียง ตอนนี้รองรับเฉพาะแอป iOS, Android และ iPadOS เท่านั้น

By arjin Writer on Tag: GitHub Copilot, GitHub, LLM, Developer, Xcode
GitHub Copilot

GitHub ประกาศว่าบริการ GitHub Copilot สำหรับ Xcode เข้าสู่สถานะพับลิกพรีวิวแล้ว เพิ่มความสามารถให้บริการ Copilot รองรับนักพัฒนาได้ในหลากหลายแพลตฟอร์มรวมทั้งแอปเปิล

GitHub Copilot สำหรับ Xcode มีฟีเจอร์ต่าง ๆ ครอบคลุมเหมือนกับ Copilot บนเครื่องมืออื่นทั้ง Code Completion, รองรับภาษา Swift และ Objective-C, ระบบแนะนำโค้ดแบบหลายบรรทัด, ระบบฟิลเตอร์เนื้อหา และอื่น ๆ

ในการใช้งาน GitHub Copilot สำหรับ Xcode ต้องมีไลเซนส์ของ Copilot ด้วย ซึ่งรองรับทั้งผู้ใช้งานแบบบุคคล, Business และ Enterprise

By arjin Writer on Tag: Meta, Artificial Intelligence, LLM, Open Source
Meta

จากข่าว Open Source Initiative หรือ OSI ออกมาให้นิยามของ AI โอเพนซอร์สว่าต้องมีเงื่อนไขใดบ้าง ซึ่งผลคือนิยามนั้นทำให้โมเดล AI ที่ผู้พัฒนาเผยแพร่บอกว่าเป็นโอเพนซอร์สยอดนิยมหลายตัว ไม่เข้าข่าย ซึ่งรวมทั้ง Llama ของ Meta ด้วย

By lew Founder on Tag: Open Source, LLM, Artificial Intelligence
Open Source

Open Source Initiative (OSI) หน่วยงานผู้ให้นิยามของซอฟต์แวร์โอเพนซอร์ส ประกาศนิยามของปัญญาประดิษฐ์โอเพนซอร์ส The Open Source AI Definition – 1.0 เพื่อให้อุตสาหกรรมเข้าใจตรงกันว่าการเป็นโอเพนซอร์ส (ตาม OSI) ต้องมีเงื่อนไขใดบ้าง

แนวทางนิยามของ OSI สำหรับปัญญาประดิษฐ์นั้นไม่ต่างจากซอฟต์แวร์มากนัก แต่เพิ่มนิยามรายละเอียด แยกส่วน เช่น ข้อมูลที่ใช้ฝึกนั้นต้องให้รายละเอียดเพียงพอ แม้จะไม่ต้องแชร์ข้อมูลออกมาเสมอไป, ตัวโค้ดที่ใช้รันต้องใช้สัญญาอนุญาตที่ OSI รองรับว่าเป็นโอเพนซอร์ส, และตัวพารามิเตอร์ต้องแจกในสัญญาอนุญาตที่ OSI รับรองเช่นกัน

By lew Founder on Tag: Meta, LLM, NotebookLM, Llama
Meta

บริการ NotebookLM ของกูเกิลได้รับความนิยมค่อนข้างดีในช่วงหลัง จากความสามารถในการสรุปรวมเอกสารทั้งชุดให้กลายเป็นพอดแคสต์ ล่าสุดฝั่ง Meta ก็โชว์โครงการ NotebookLlama เป็นชุด Python Notebook ที่แปลงเอกสารให้กลายเป็นพอดแคสต์ได้เหมืิอนกัน

โครงการนี้ใช้ LLM สามชั้น ชั้นแรกใช้ตัวเล็ก Llama 3.2 8B เพื่อแปลง PDF เป็นเอกสารที่อ่านได้ง่ายๆ จากนั้นใช้ Llama 3.1 70B เขียนสริปต์พอดแคสต์ แล้วใช้ Llama 3.1 8B แปลงสคริปต์ให้เร้าใจขึ้น สุดท้ายจึงแปลงข้อความเป็นเสียง

By mk Founder on Tag: Gemini, Google, LLM, Rumors
Gemini

เว็บไซต์ The Verge อ้างข่าวลือจากแหล่งข่าวใกล้ชิดกูเกิล ว่าเราจะได้เห็นโมเดล Gemini 2.0 เปิดตัวในเดือนธันวาคม ไล่เลี่ยกับ ข่าวลือว่า OpenAI จะเปิดตัวโมเดลใหม่ Orion ซึ่งรายงานโดย The Verge เช่นกัน

แหล่งข่าวของ The Verge บอกว่าโมเดล Gemini 2.0 ไม่ได้มีประสิทธิภาพเพิ่มขึ้นมากเท่ากับที่ Google DeepMind คาดหวังไว้ แต่เขาก็บอกว่าทุกบริษัทที่พัฒนาโมเดลขนาดใหญ่เจอปัญหาลักษณะเดียวกัน ซึ่งน่าจะเริ่มเป็นทางตันของโมเดลตระกูล Transformer ที่พัฒนาอย่างก้าวกระโดดในช่วงหลายปีที่ผ่านมา

Subscribe to LLM