LLM | Blognone

Large Language Model

กูเกิลปล่อย PaliGemma 2 โมเดลปัญญาประดิษฐ์โอเอรับภาพแบบโอเพนซอร์ส อ่านสูตรเคมี, โน้ตเพลง, ภาพเอ็กเรย์

By lew

on 6 December 2024 - 10:05 Tag: Gemma, Google, LLM

Gemma

กูเกิลปล่อยโมเดล PaliGemma 2 โมเดลปัญญาประดิษฐ์ LLM แบบ multimodal โอเพนที่ปรับปรุงจากเวอร์ชั่นแรกที่ปล่อยมาในงาน Google I/O ปีนี้ โดยโมเดลมีหลายขนาดให้เลือก, อธิบายภาพได้ละเอียดขึ้น, และขยายความสามารถใหม่ๆ เพิ่มเติม

โมเดลมี 3 ขนาด คือ 3B, 10B, และ 28B โดยรองรับภาพ 3 ขนาดเช่นกัน คือ 224x224, 448x448, และ 896x896 รวมโมเดลทั้งหมด 9 รุ่น มีความสามารถหลากหลาย ตั้งแต่การบรรยายภาพพื้นฐาน เรื่อยไปจนถึงการอ่านเอกสารเฉพาะด้าน เช่นเอกสารตารางทางการเงินที่ทำได้ดีขึ้นกว่าเวอร์ชั่นเดิม, อ่านโน้ตเพลง, หรือแม้แต่ภาพเอ็กเรย์ปอด

OpenAI เปิดโมเดล o1 ตัวจริง พร้อมแพ็กเกจใหม่ ChatGPT Pro เดือนละ 200 ดอลลาร์

By lew

on 6 December 2024 - 01:48 Tag: OpenAI, LLM, ChatGPT

OpenAI

OpenAI เปิดตัวโมเดล o1 ตัวจริง พร้อมกับเพิ่ม o1 pro mode ที่เปิดให้โมเดลค่อยๆ คิดเป็นเวลานานก่อนจะตอบคำถาม แนวทางนี้ทำให้ o1 สามารถทำคะแนนทดสอบชุดทดสอบยากมากๆ เช่น AIME 2024 ที่เป็นโจทย์คณิตศาสตร์ระดับการแข่งขัน, การเขียนโปรแกรม, หรือคำถามวิทยาศาสตร์ระดับปริญญาเอกได้สูงขึ้นมาก ที่สำคัญคือความนิ่งของโมเดลที่จะตอบคำถามได้ถูกต้องทุกครั้ง ไม่ใช่ถูกแค่ครั้งใดครึ่งหนึ่งเพิ่มขึ้นอย่างมาก

คุณใช้ผมก็ใช้ - Meta มีเครื่องมือช่วยเขียนโค้ดใช้ในบริษัท ที่เรียกโมเดล GPT-4 ทำงานร่วมกับ Llama

By arjin

on 4 December 2024 - 23:21 Tag: Meta, Developer, Artificial Intelligence, LLM, Rumors, OpenAI, Llama, ChatGPT, Mark Zuckerberg

เปิดตัว Amazon Nova ปัญญาประดิษฐ์ LLM รองรับ 200 ภาษา อ่านภาพ, ดูวิดีโอได้ ถูกกว่าคู่แข่ง 75%

By lew

on 4 December 2024 - 09:25 Tag: Amazon, LLM, Artificial Intelligence, Nova

Amazon

Amazon เปิดตัวชุดโมเดลปัญญาประดิษฐ์ Amazon Nova ในชุดมีโมเดลถึง 6 ตัวมีความสามารถต่างกันไป

จีนมีคนใช้งาน Generative AI มากกว่า 230 ล้านคน - Ernie Bot ได้รับความนิยมมากที่สุด

By arjin

on 3 December 2024 - 22:22 Tag: China, Artificial Intelligence, LLM, Baidu, Market Research

China

ศูนย์ข้อมูลสารสนเทศและโครงข่ายอินเทอร์เน็ตแห่งชาติจีน หรือ CNNIC ออกรายงานเกี่ยวกับการใช้งานปัญญาประดิษฐ์สร้างเนื้อหาหรือ Generative AI ในจีน มีจำนวนผู้ใช้งาน ณ เดือนมิถุนายน 2024 เพิ่มขึ้นเป็น 230 ล้านคน หรือคิดเป็น 1 ใน 6 ของประชากรทั้งประเทศ

บริการที่ได้รับความนิยมมากที่สุดคือ Ernie Bot ของ Baidu มีส่วนแบ่งตลาด 11.5% ตามด้วย ChatGPT และ Gemini ที่ 7% และ 3.8% ซึ่งน่าสนใจว่า CNNIC รายงานข้อมูลนี้ แม้ทั้งสองบริการแชทบอต จะไม่สามารถใช้งานได้อย่างเป็นทางการที่นั่น

จุฬาลงกรณ์มหาวิทยาลัย ซื้อ Gemini API มาเปิดให้บุคลากรและนิสิตกว่า 50,000 คนใช้งาน เริ่มปี 2025

By lew

on 1 December 2024 - 20:58 Tag: Chulalongkorn, Google Cloud, Gemini, LLM

Chulalongkorn

จุฬาลงกรณ์มหาวิทยาลัยเปิดตัวบริการ ChulaGENIE ผู้ช่วยแบบ LLM สำหรับบุคลากรและนิสิตรวมกว่า 50,000 คน โดยภายในเป็นการซื้อ Gemini Pro และ Gemini Flash แบบ API ผ่านทางบริการ Vertex AI บน Google Cloud มาเปิดให้ภายในใช้งาน

บริการนี้เตรียมเปิดตัวเป็นเฟส โดยช่วงแรกมกราคม 2025 จะเปิดให้เฉพาะคณาจารย์และบุคลากรก่อน จากนนั้นจึงเปิดให้นิสิตทุกคนใช้งานในเดือนมีนาคม ช่วงแรกจะใช้ Gemini 1.5 Flash และ Gemini 1.5 Pro โดยมีแผนจะเพิ่มตัวเลือก Claude และ Llama ต่อไป

Freysa เกมแข่งแฮกแชตบอตแบบเสียเงินได้ผู้ชนะพร้อมเงินรางวัล 47,316.05 ดอลลาร์

By lew

on 30 November 2024 - 00:58 Tag: LLM, Security

LLM

Freysa เกมแข่งแฮกปัญญาประดิษฐ์ LLM ได้ผู้ชนะหลังเปิดแข่งขันเพียงหนึ่งสัปดาห์ หลังจากผู้เข้าแข่งยิง prompt injection จนตัวเกมตัดสินใจยอมโอนเงินได้สำเร็จ

ผู้สร้าง Freysa เปิดเผย prompt ที่ใช้สร้างแชตบอต พร้อมกับโค้ดของตัวแอปพลิเคชั่น โดยภายในเป็น GPT-4 ที่เปิดให้เรียกฟังก์ชั่นสองตัวคือ approveTransfer และ rejectTransfer แต่ system prompt กลับกำหนดชัดเจนว่าห้ามเรียก approveTransfer ไม่ว่ากรณีใดๆ

Alibaba ปล่อยโมเดล Marco-o1 โมเดลคิดทบทวนในตัวก่อนตอบ เก่งขึ้นแม้เป็นโมเดลขนาดเล็ก

By lew

on 28 November 2024 - 20:54 Tag: Alibaba, LLM

Alibaba

Alibaba International Digital Commerce บริษัทฝั่งเว็บอีคอมเมิร์ชของ Alibaba ปล่อยโมเดลปัญญาประดิษฐ์ LLM ในชื่อ Marco-o1 เป็นโมเดลที่ทำผลทดสอบปัญหาคณิตศาสตร์ MGSM ได้สูงขึ้นถึงระดับ 90% แม้จะเป็นโมเดลขนาดเล็ก โดยอาศัยการคิดแบบค่อยเป็นค่อยไป

Marco-o1 สร้างจาก Qwen2-7B แต่อาศัย 4 เทคนิคทำให้โมเดลเก่งขึ้น ได้แก่

Alibaba Cloud เปิดตัว QwQ-32B โมเดลคิดทบทวนก่อนตอบเพิ่มความแม่นยำใกล้ OpenAI o1 เข้าใจภาษาไทยแต่คิดเป็นภาษาจีน

By lew

on 28 November 2024 - 12:32 Tag: Alibaba Cloud, LLM, Qwen

Alibaba Cloud

ทีม Qwen ของ Alibaba Cloud เปิดโตัวโมเดลปัญญาประดิษฐ์ QwQ (อ่านว่า ควิว/quil) เป็นโมเดลเพื่อการทดลองที่จะไม่มุ่งตอบคำถามทันที แต่พยายามคิดทบทวนก่อน ทำให้คำตอบที่ได้แม่นยำขึ้น

ความโดดเด่นของ QwQ-32B คือคะแนนทดสอบหลายชุดทดสอบ เช่น GPQA, AIME, MATH-500, หรือ LiveCodeBench นั้นสูงขึ้นมาก เทียบชั้นกับ OpenAI o1-preview เลยทีเดียว อย่างไรก็ดีทีมงานพบปัญหาการคิดของโมเดลมักสลับภาษาไปมา (ผมทดลองถามภาษาไทยก็คิดเป็นภาษาจีน) บางครั้งคิดวนไปวนมาไม่ได้คำตอบ นอกจากนี้ยังต้องเพิ่มความระมัดระวังความปลอดภัยในการใช้งาน และคะแนนทดสอบก็อาจจะมีข้อจำกัดไม่สามารถทดสอบความสามารถบางด้าน

Andrew Ng ออกไลบรารี aisuite ใช้ API เดียวเชื่อมต่อ LLM ได้หลายเจ้า แข่ง LiteLLM

By lew

on 26 November 2024 - 19:34 Tag: Andrew Ng, LLM, Open Source

Andrew Ng

Andrew Ng หนึ่งในผู้บุกเบิกวงการ deep learning ออกไลบรารี aisuite ไลบรารีที่ไม่ซับซ้อนนัก สำหรับการเชื่อมต่อ LLM จากผู้ให้บริการหลากหลายเจ้า โดยโค้ดเปลี่ยนเฉพาะชื่อโมเดลเท่านั้น

ปัญหาการเชื่อมต่อ LLM จากผู้ผลิตหลายรายนั้นมีมานาน แต่ช่วงหลังๆ ปัญหาก็น้อยลงมากเนื่องจากผู้ให้บริการรายใหม่ๆ ยอมแพ้หันไปทำ API ของตัวเองให้เข้ากันได้กับ OpenAI แทน แม้แต่คู่แข่งหลักอย่างกูเกิลก็ต้องทำตามแนวทางนี้

Anthropic เปิด Model Context Protocol มาตรฐานสำหรับส่งข้อมูลในองค์กรให้ AI ช่วยตอบคำถาม

By lew

on 26 November 2024 - 13:58 Tag: Anthropic, LLM, MCP

Anthropic

Anthropic บริษัทคู่แข่งสำคัญของ OpenAI เปิดตัว Model Context Protocol (MCP) โปรโตคอลมาตรฐานสำหรับการดึงข้อมูลจากแหล่งต่างๆ ให้ปัญญาประดิษฐ์แบบ LLM นำไปใช้ตอบคำถาม ไม่ว่าจะเป็นแชตในองค์กร, ซอร์สโค้ด, ฐานข้อมูลต่างๆ, หรือไฟล์สตอเรจ

ทุกวันนี้กระบวนการเชื่อมต่อข้อมูลจากแหล่งต่างๆ เข้าหน้าจอแชตใช้แนวทางต่างๆ กันไป ทำให้ต้องอิมพลีเมนต์แอปพลิเคชั่นเฉพาะ หรือเขียนฟังก์ชั่นครอบให้ LLM ไปใช้งานเพื่อดึงข้อมูลมาตอบคำถาม MCP หวังว่าจะทำให้การเชื่อมต่อแหล่งข้อมูลต่างๆ เป็นมาตรฐานเดียวกัน ทำให้เราสามารถเพิ่มแหล่งข้อมูลใหม่ๆ ได้ทันที

ศาลสหรัฐฯ ยืนยันโรงเรียนมีสิทธิตัดคะแนนนักเรียนที่ใช้ AI ทำการบ้าน

By lew

on 25 November 2024 - 22:22 Tag: LLM, Artificial Intelligence, Education

LLM

เมื่อเดือนตุลาคมที่ผ่านมา Dale และ Jennifer Harris ผู้ปกครองของ RNH ชื่อย่อของนักเรียนโรงเรียน Hingham High School ยื่นฟ้องครูและกรรมการโรงเรียน หลังจาก RNH ถูกตัดคะแนนในวิชา AP U.S. History จนเกรดตก และทำให้อาจจะเสียโอกาสเข้ามหาวิทยาลัย ล่าสุดศาลชั้นต้นรัฐบาลกลาง (U.S. District Court) ก็ตัดสินไม่สั่งคุ้มครองชั่วคราวให้แก้คะแนนให้ RNH

คำตัดสินระบุว่าหลักฐานแสดงให้เห็นว่าโรงเรียนไม่ได้รีบเร่งตัดสินโทษ และโทษก็ไม่ได้รุนแรงเป็นพิเศษหรือต่างจากคนอื่น

ซัมซุงเปิดตัวโมเดล Gauss 2 พัฒนาขึ้นจากรุ่นแรก มี 3 ขนาดให้เลือกใช้งาน

By mk

on 22 November 2024 - 11:23 Tag: Samsung, LLM, Artificial Intelligence

Samsung

ซัมซุงมีโมเดลปัญญาประดิษฐ์ของตัวเองชื่อ Gauss เปิดตัวในปี 2023 และกำลังพยายามนำไปใช้กับ Bixby

ในงานสัมมนาสำหรับนักพัฒนา SDC24 Korea เมื่อไม่กี่วันที่ผ่านมา ซัมซุงเปิดตัวโมเดล Gauss 2 ที่มีประสิทธิภาพมากขึ้น ตัวโมเดลเป็น multimodal รองรับทั้งภาษา โค้ด และรูปภาพ สามารถเลือกโมเดลย่อยได้ 3 ตัว แยกตามรูปแบบการใช้งานคือ

Gemini แข่งกับ ChatGPT บนการจัดอันดับ Chatbot Arena ออกเวอร์ชั่นใหม่รายวัน ล่าสุด Gemini ชนะ

By lew

on 22 November 2024 - 08:42 Tag: LLM, Artificial Intelligence, Gemini, OpenAI, ChatGPT, Chatbot

LLM

กูเกิลและ OpenAI ผลัดกันชิงอันดับหนึ่งบนการจัดอันดับ Chatbot Arena ของ LMSys โดยสัปดาห์ที่ผ่านมานับเป็นช่วงที่แข่งกันดุเดือดเป็นพิเศษเพราะเอาชนะสลับกันหลายรอบในสัปดาห์เดียว

[ลือ] Apple พัฒนา LLM Siri ที่โต้ตอบได้ดีขึ้นใน iOS 19 และ macOS 16

By arjin

on 22 November 2024 - 07:25 Tag: Siri, Apple, LLM, Rumors, iOS 19

Siri

ข้อมูลนี้มาจาก Mark Gurman แห่ง Bloomberg คนเดิม เขาบอกว่าแอปเปิลกำลังพัฒนาฟีเจอร์ AI ใหม่สำหรับ iOS 19 และ macOS 16 ที่จะออกมาในปีหน้า โดยเพิ่มความสามารถ Siri ด้วยโมเดลปัญญาประดิษฐ์ภาษาขนาดใหญ่หรือ LLM (Large Language Model) ทำให้มีความสามารถในการสนทนาโต้ตอบให้ข้อมูลดีขึ้น

GitHub วิจัยประสิทธิภาพของ Copilot ช่วยโปรแกรมเมอร์ พบคุณภาพโค้ดดีขึ้น บั๊กน้อยลง

By lew

on 20 November 2024 - 23:30 Tag: GitHub Copilot, GitHub, LLM, Programming

GitHub Copilot

GitHub ออกรายงานสำรวจประสิทธิภาพของโปรแกรมเมอร์เมื่อใช้ GitHub Copilot ช่วยทำงาน พบว่าโดยรวมแล้วการมี Copilot ทำให้โปรแกรมเมอร์เขียนโค้ดถูกต้องมากขึ้น โค้ดมีคุณภาพสูงขึ้น บั๊กน้อยลง

การวิจัยนี้นำโปรแกรมเมอร์ที่มีประสบการณ์อย่างน้อย 5 ปีจำนวน 202 คนมาแบ่งกลุ่มแบบสุ่ม มีกลุ่มได้ใช้ Copilot 104 คน และกลุ่มไม่ได้ใช้ 98 คน ให้เขียน Web API ตามคำสั่ง จากนั้นสำรวจโค้ดทั้งความถูกต้องด้วยการรันชุดทดสอบ, และสำรวจคุณภาพโต้ด

Azure Container Apps เพิ่มตัวเลือก GPU รองรับ AI, sandbox สำหรับรันโค้ดจาก LLM

By lew

on 20 November 2024 - 01:10 Tag: Microsoft Azure, Container, LLM

Microsoft Azure

Azure Container Apps บริการรันคอนเทนเนอร์แบบ serverless จ่ายตามเวลาที่ใช้งานจริง เพิ่มตัวเลือกชิปกราฟิกสำหรับการรัน AI เฉพาะทาง โดยมีชิป NVIDIA T4 และ A100 ให้เลือกใช้งาน

แม้จะเปิดใช้งานแล้ว แต่ลูกค้าทั่วไปที่ไม่ได้ทำข้อตกลง Microsoft Enterprise Agreement จะต้องติดต่อไมโครซอฟท์ขอโควต้า serverless GPU ก่อนใช้งาน โดยตอนนี้มีให้ใช้งานสองศูนย์ข้อมูล คือ West US 3 และ Australia East

ไมโครซอฟท์สาธิตการทำ GraphRAG บน PostgreSQL บน Azure ปรับปรุงคุณภาพการสร้างแชตบอตถามตอบจากเอกสาร

By lew

on 20 November 2024 - 00:33 Tag: Microsoft, LLM, PostgreSQL

Microsoft

ไมโครซอฟท์เพิ่มฟีเจอร์ GraphRAG Solution Accelerator สำหรับ PostgreSQL บน Azure Database ทำให้ลูกค้าที่ต้องการพัฒนาแอปพลิเคชั่น RAG บน Azure สามารถใช้งานฐานข้อมูลสำเร็จรูปได้

ปกติแล้วการพัฒนาแอปพลิเคชั่น RAG (Retrieval Augmented Generation) จะอาศัยการค้นหาข้อมูลที่เกี่ยวข้องกับคำค้นหรือคำถามของผู้ใช้เพื่อให้ปัญญาประดิษฐ์ LLM สามารถนำข้อมูลเหล่านั้นมาอ้างอิงในการสร้างคำตอบ แต่ GraphRAG เสนอว่าข้อมูลที่ดึงมาได้ว่าเกี่ยวข้องนั้นหลายครั้งมีข้อมูลที่เชื่อมโยงอยู่ด้วยและควรใช้งานด้วยกัน แม้จะไม่ได้ใกล้เคียงกับคำค้นโดยตรงก็ตาม

SCB10X เปิดให้บริการโมเดล Typhoon บน Together.ai ยังไม่ประกาศราคาแต่คิดตามการใช้งานจริง

By lew

on 19 November 2024 - 21:47 Tag: SCB10X, LLM

SCB10X

SCB10X ร่วมมือกับ Together.ai ผู้ให้บริการ LLM รายสำคัญ เปิดให้บริการโมเดล Typhoon สองรุ่น คือ Typhoon 1.5 8B Instruct และ Typhoon 1.5X 70B-awq (Activation-Aware Weight Quantization - การย่อโมเดลแบบคำนึงถึงความสำคัญของแต่ละพารามิเตอร์)

ตอนนี้ทั้งสองโมเดลใช้งานได้ในหน้า Playground ของ Together.ai แล้ว แต่ยังไม่ประกาศราคาที่แน่ชัดออกมา โดยทาง SCB10X ระบุว่าต้องสอบถามทาง Together.ai โดยตรง แต่ยืนยันว่าจะคิดค่าใช้งานเป็นโทเค็น

อ่านไม่ทันแน่นอน Cerebras โชว์บริการ Llama 3.1 405B ความเร็ว 969 token/s โทเค็นแรกใช้เวลาแค่ 240ms

By lew

on 19 November 2024 - 13:49 Tag: Cerebras, LLM

Cerebras

Cerebras ผู้พัฒนาชิปเฉพาะทางในการรันโมเดลปัญญาประดิษฐ์ขนาดใหญ่ โชว์บริการ Cerebras Inference ที่ให้บริการโมเดล Llama 3.1 405B แบบความละเอียดเต็ม 16-bit แต่ได้ความเร็วสูงมากถึง 969 token/s และเริ่มตอบโทเค็นแรกในเวลาเพียง 240ms ใกล้เคียงการตอบแบบทันที

Subscribe to LLM