Image

Large Language Model

By lew Founder on Tag: Gemma, Google, LLM
Gemma

กูเกิลปล่อยโมเดล PaliGemma 2 โมเดลปัญญาประดิษฐ์ LLM แบบ multimodal โอเพนที่ปรับปรุงจากเวอร์ชั่นแรกที่ปล่อยมาในงาน Google I/O ปีนี้ โดยโมเดลมีหลายขนาดให้เลือก, อธิบายภาพได้ละเอียดขึ้น, และขยายความสามารถใหม่ๆ เพิ่มเติม

โมเดลมี 3 ขนาด คือ 3B, 10B, และ 28B โดยรองรับภาพ 3 ขนาดเช่นกัน คือ 224x224, 448x448, และ 896x896 รวมโมเดลทั้งหมด 9 รุ่น มีความสามารถหลากหลาย ตั้งแต่การบรรยายภาพพื้นฐาน เรื่อยไปจนถึงการอ่านเอกสารเฉพาะด้าน เช่นเอกสารตารางทางการเงินที่ทำได้ดีขึ้นกว่าเวอร์ชั่นเดิม, อ่านโน้ตเพลง, หรือแม้แต่ภาพเอ็กเรย์ปอด

By lew Founder on Tag: OpenAI, LLM, ChatGPT
OpenAI

OpenAI เปิดตัวโมเดล o1 ตัวจริง พร้อมกับเพิ่ม o1 pro mode ที่เปิดให้โมเดลค่อยๆ คิดเป็นเวลานานก่อนจะตอบคำถาม แนวทางนี้ทำให้ o1 สามารถทำคะแนนทดสอบชุดทดสอบยากมากๆ เช่น AIME 2024 ที่เป็นโจทย์คณิตศาสตร์ระดับการแข่งขัน, การเขียนโปรแกรม, หรือคำถามวิทยาศาสตร์ระดับปริญญาเอกได้สูงขึ้นมาก ที่สำคัญคือความนิ่งของโมเดลที่จะตอบคำถามได้ถูกต้องทุกครั้ง ไม่ใช่ถูกแค่ครั้งใดครึ่งหนึ่งเพิ่มขึ้นอย่างมาก

Meta

Fortune รายงานข้อมูลจากแหล่งข่าวใน Meta บอกว่าถึงแม้ Meta จะมีโมเดล AI แบบโอเพนซอร์ส Llama ที่พยายามผลักดันอยู่ แต่เครื่องมือช่วยเขียนโค้ดที่ใช้ภายในบริษัทชื่อ Metamate ก็เสริมการทำงานด้วยโมเดล AI จากหลายค่ายซึ่งรวมทั้ง GPT-4 ของ OpenAI และ Llama ของ Meta เอง

รายงานบอกว่า Metamate เป็นเครื่องมือช่วยเขียนโค้ดคล้าย GitHub CoPilot ที่สามารถส่งคำถามและใช้ AI ช่วยหาคำตอบ ซึ่ง Metamate จะเลือกจากทั้ง Llama หรือ GPT-4

By lew Founder on Tag: Amazon, LLM, Artificial Intelligence, Nova
Amazon

Amazon เปิดตัวชุดโมเดลปัญญาประดิษฐ์ Amazon Nova ในชุดมีโมเดลถึง 6 ตัวมีความสามารถต่างกันไป

By arjin Writer on Tag: China, Artificial Intelligence, LLM, Baidu, Market Research
China

ศูนย์ข้อมูลสารสนเทศและโครงข่ายอินเทอร์เน็ตแห่งชาติจีน หรือ CNNIC ออกรายงานเกี่ยวกับการใช้งานปัญญาประดิษฐ์สร้างเนื้อหาหรือ Generative AI ในจีน มีจำนวนผู้ใช้งาน ณ เดือนมิถุนายน 2024 เพิ่มขึ้นเป็น 230 ล้านคน หรือคิดเป็น 1 ใน 6 ของประชากรทั้งประเทศ

บริการที่ได้รับความนิยมมากที่สุดคือ Ernie Bot ของ Baidu มีส่วนแบ่งตลาด 11.5% ตามด้วย ChatGPT และ Gemini ที่ 7% และ 3.8% ซึ่งน่าสนใจว่า CNNIC รายงานข้อมูลนี้ แม้ทั้งสองบริการแชทบอต จะไม่สามารถใช้งานได้อย่างเป็นทางการที่นั่น

By lew Founder on Tag: Chulalongkorn, Google Cloud, Gemini, LLM
Chulalongkorn

จุฬาลงกรณ์มหาวิทยาลัยเปิดตัวบริการ ChulaGENIE ผู้ช่วยแบบ LLM สำหรับบุคลากรและนิสิตรวมกว่า 50,000 คน โดยภายในเป็นการซื้อ Gemini Pro และ Gemini Flash แบบ API ผ่านทางบริการ Vertex AI บน Google Cloud มาเปิดให้ภายในใช้งาน

บริการนี้เตรียมเปิดตัวเป็นเฟส โดยช่วงแรกมกราคม 2025 จะเปิดให้เฉพาะคณาจารย์และบุคลากรก่อน จากนนั้นจึงเปิดให้นิสิตทุกคนใช้งานในเดือนมีนาคม ช่วงแรกจะใช้ Gemini 1.5 Flash และ Gemini 1.5 Pro โดยมีแผนจะเพิ่มตัวเลือก Claude และ Llama ต่อไป

By lew Founder on Tag: LLM, Security
LLM

Freysa เกมแข่งแฮกปัญญาประดิษฐ์ LLM ได้ผู้ชนะหลังเปิดแข่งขันเพียงหนึ่งสัปดาห์ หลังจากผู้เข้าแข่งยิง prompt injection จนตัวเกมตัดสินใจยอมโอนเงินได้สำเร็จ

ผู้สร้าง Freysa เปิดเผย prompt ที่ใช้สร้างแชตบอต พร้อมกับโค้ดของตัวแอปพลิเคชั่น โดยภายในเป็น GPT-4 ที่เปิดให้เรียกฟังก์ชั่นสองตัวคือ approveTransfer และ rejectTransfer แต่ system prompt กลับกำหนดชัดเจนว่าห้ามเรียก approveTransfer ไม่ว่ากรณีใดๆ

By lew Founder on Tag: Alibaba, LLM
Alibaba

Alibaba International Digital Commerce บริษัทฝั่งเว็บอีคอมเมิร์ชของ Alibaba ปล่อยโมเดลปัญญาประดิษฐ์ LLM ในชื่อ Marco-o1 เป็นโมเดลที่ทำผลทดสอบปัญหาคณิตศาสตร์ MGSM ได้สูงขึ้นถึงระดับ 90% แม้จะเป็นโมเดลขนาดเล็ก โดยอาศัยการคิดแบบค่อยเป็นค่อยไป

Marco-o1 สร้างจาก Qwen2-7B แต่อาศัย 4 เทคนิคทำให้โมเดลเก่งขึ้น ได้แก่

By lew Founder on Tag: Alibaba Cloud, LLM, Qwen
Alibaba Cloud

ทีม Qwen ของ Alibaba Cloud เปิดโตัวโมเดลปัญญาประดิษฐ์ QwQ (อ่านว่า ควิว/quil) เป็นโมเดลเพื่อการทดลองที่จะไม่มุ่งตอบคำถามทันที แต่พยายามคิดทบทวนก่อน ทำให้คำตอบที่ได้แม่นยำขึ้น

ความโดดเด่นของ QwQ-32B คือคะแนนทดสอบหลายชุดทดสอบ เช่น GPQA, AIME, MATH-500, หรือ LiveCodeBench นั้นสูงขึ้นมาก เทียบชั้นกับ OpenAI o1-preview เลยทีเดียว อย่างไรก็ดีทีมงานพบปัญหาการคิดของโมเดลมักสลับภาษาไปมา (ผมทดลองถามภาษาไทยก็คิดเป็นภาษาจีน) บางครั้งคิดวนไปวนมาไม่ได้คำตอบ นอกจากนี้ยังต้องเพิ่มความระมัดระวังความปลอดภัยในการใช้งาน และคะแนนทดสอบก็อาจจะมีข้อจำกัดไม่สามารถทดสอบความสามารถบางด้าน

By lew Founder on Tag: Andrew Ng, LLM, Open Source
Andrew Ng

Andrew Ng หนึ่งในผู้บุกเบิกวงการ deep learning ออกไลบรารี aisuite ไลบรารีที่ไม่ซับซ้อนนัก สำหรับการเชื่อมต่อ LLM จากผู้ให้บริการหลากหลายเจ้า โดยโค้ดเปลี่ยนเฉพาะชื่อโมเดลเท่านั้น

ปัญหาการเชื่อมต่อ LLM จากผู้ผลิตหลายรายนั้นมีมานาน แต่ช่วงหลังๆ ปัญหาก็น้อยลงมากเนื่องจากผู้ให้บริการรายใหม่ๆ ยอมแพ้หันไปทำ API ของตัวเองให้เข้ากันได้กับ OpenAI แทน แม้แต่คู่แข่งหลักอย่างกูเกิลก็ต้องทำตามแนวทางนี้

By lew Founder on Tag: Anthropic, LLM, MCP
Anthropic

Anthropic บริษัทคู่แข่งสำคัญของ OpenAI เปิดตัว Model Context Protocol (MCP) โปรโตคอลมาตรฐานสำหรับการดึงข้อมูลจากแหล่งต่างๆ ให้ปัญญาประดิษฐ์แบบ LLM นำไปใช้ตอบคำถาม ไม่ว่าจะเป็นแชตในองค์กร, ซอร์สโค้ด, ฐานข้อมูลต่างๆ, หรือไฟล์สตอเรจ

ทุกวันนี้กระบวนการเชื่อมต่อข้อมูลจากแหล่งต่างๆ เข้าหน้าจอแชตใช้แนวทางต่างๆ กันไป ทำให้ต้องอิมพลีเมนต์แอปพลิเคชั่นเฉพาะ หรือเขียนฟังก์ชั่นครอบให้ LLM ไปใช้งานเพื่อดึงข้อมูลมาตอบคำถาม MCP หวังว่าจะทำให้การเชื่อมต่อแหล่งข้อมูลต่างๆ เป็นมาตรฐานเดียวกัน ทำให้เราสามารถเพิ่มแหล่งข้อมูลใหม่ๆ ได้ทันที

By lew Founder on Tag: LLM, Artificial Intelligence, Education
LLM

เมื่อเดือนตุลาคมที่ผ่านมา Dale และ Jennifer Harris ผู้ปกครองของ RNH ชื่อย่อของนักเรียนโรงเรียน Hingham High School ยื่นฟ้องครูและกรรมการโรงเรียน หลังจาก RNH ถูกตัดคะแนนในวิชา AP U.S. History จนเกรดตก และทำให้อาจจะเสียโอกาสเข้ามหาวิทยาลัย ล่าสุดศาลชั้นต้นรัฐบาลกลาง (U.S. District Court) ก็ตัดสินไม่สั่งคุ้มครองชั่วคราวให้แก้คะแนนให้ RNH

คำตัดสินระบุว่าหลักฐานแสดงให้เห็นว่าโรงเรียนไม่ได้รีบเร่งตัดสินโทษ และโทษก็ไม่ได้รุนแรงเป็นพิเศษหรือต่างจากคนอื่น

By mk Founder on Tag: Samsung, LLM, Artificial Intelligence
Samsung

ซัมซุงมีโมเดลปัญญาประดิษฐ์ของตัวเองชื่อ Gauss เปิดตัวในปี 2023 และกำลังพยายามนำไปใช้กับ Bixby

ในงานสัมมนาสำหรับนักพัฒนา SDC24 Korea เมื่อไม่กี่วันที่ผ่านมา ซัมซุงเปิดตัวโมเดล Gauss 2 ที่มีประสิทธิภาพมากขึ้น ตัวโมเดลเป็น multimodal รองรับทั้งภาษา โค้ด และรูปภาพ สามารถเลือกโมเดลย่อยได้ 3 ตัว แยกตามรูปแบบการใช้งานคือ

By lew Founder on Tag: LLM, Artificial Intelligence, Gemini, OpenAI, ChatGPT, Chatbot
LLM

กูเกิลและ OpenAI ผลัดกันชิงอันดับหนึ่งบนการจัดอันดับ Chatbot Arena ของ LMSys โดยสัปดาห์ที่ผ่านมานับเป็นช่วงที่แข่งกันดุเดือดเป็นพิเศษเพราะเอาชนะสลับกันหลายรอบในสัปดาห์เดียว

By arjin Writer on Tag: Siri, Apple, LLM, Rumors, iOS 19
Siri

ข้อมูลนี้มาจาก Mark Gurman แห่ง Bloomberg คนเดิม เขาบอกว่าแอปเปิลกำลังพัฒนาฟีเจอร์ AI ใหม่สำหรับ iOS 19 และ macOS 16 ที่จะออกมาในปีหน้า โดยเพิ่มความสามารถ Siri ด้วยโมเดลปัญญาประดิษฐ์ภาษาขนาดใหญ่หรือ LLM (Large Language Model) ทำให้มีความสามารถในการสนทนาโต้ตอบให้ข้อมูลดีขึ้น

By lew Founder on Tag: GitHub Copilot, GitHub, LLM, Programming
GitHub Copilot

GitHub ออกรายงานสำรวจประสิทธิภาพของโปรแกรมเมอร์เมื่อใช้ GitHub Copilot ช่วยทำงาน พบว่าโดยรวมแล้วการมี Copilot ทำให้โปรแกรมเมอร์เขียนโค้ดถูกต้องมากขึ้น โค้ดมีคุณภาพสูงขึ้น บั๊กน้อยลง

การวิจัยนี้นำโปรแกรมเมอร์ที่มีประสบการณ์อย่างน้อย 5 ปีจำนวน 202 คนมาแบ่งกลุ่มแบบสุ่ม มีกลุ่มได้ใช้ Copilot 104 คน และกลุ่มไม่ได้ใช้ 98 คน ให้เขียน Web API ตามคำสั่ง จากนั้นสำรวจโค้ดทั้งความถูกต้องด้วยการรันชุดทดสอบ, และสำรวจคุณภาพโต้ด

By lew Founder on Tag: Microsoft Azure, Container, LLM
Microsoft Azure

Azure Container Apps บริการรันคอนเทนเนอร์แบบ serverless จ่ายตามเวลาที่ใช้งานจริง เพิ่มตัวเลือกชิปกราฟิกสำหรับการรัน AI เฉพาะทาง โดยมีชิป NVIDIA T4 และ A100 ให้เลือกใช้งาน

แม้จะเปิดใช้งานแล้ว แต่ลูกค้าทั่วไปที่ไม่ได้ทำข้อตกลง Microsoft Enterprise Agreement จะต้องติดต่อไมโครซอฟท์ขอโควต้า serverless GPU ก่อนใช้งาน โดยตอนนี้มีให้ใช้งานสองศูนย์ข้อมูล คือ West US 3 และ Australia East

By lew Founder on Tag: Microsoft, LLM, PostgreSQL
Microsoft

ไมโครซอฟท์เพิ่มฟีเจอร์ GraphRAG Solution Accelerator สำหรับ PostgreSQL บน Azure Database ทำให้ลูกค้าที่ต้องการพัฒนาแอปพลิเคชั่น RAG บน Azure สามารถใช้งานฐานข้อมูลสำเร็จรูปได้

ปกติแล้วการพัฒนาแอปพลิเคชั่น RAG (Retrieval Augmented Generation) จะอาศัยการค้นหาข้อมูลที่เกี่ยวข้องกับคำค้นหรือคำถามของผู้ใช้เพื่อให้ปัญญาประดิษฐ์ LLM สามารถนำข้อมูลเหล่านั้นมาอ้างอิงในการสร้างคำตอบ แต่ GraphRAG เสนอว่าข้อมูลที่ดึงมาได้ว่าเกี่ยวข้องนั้นหลายครั้งมีข้อมูลที่เชื่อมโยงอยู่ด้วยและควรใช้งานด้วยกัน แม้จะไม่ได้ใกล้เคียงกับคำค้นโดยตรงก็ตาม

By lew Founder on Tag: SCB10X, LLM
SCB10X

SCB10X ร่วมมือกับ Together.ai ผู้ให้บริการ LLM รายสำคัญ เปิดให้บริการโมเดล Typhoon สองรุ่น คือ Typhoon 1.5 8B Instruct และ Typhoon 1.5X 70B-awq (Activation-Aware Weight Quantization - การย่อโมเดลแบบคำนึงถึงความสำคัญของแต่ละพารามิเตอร์)

ตอนนี้ทั้งสองโมเดลใช้งานได้ในหน้า Playground ของ Together.ai แล้ว แต่ยังไม่ประกาศราคาที่แน่ชัดออกมา โดยทาง SCB10X ระบุว่าต้องสอบถามทาง Together.ai โดยตรง แต่ยืนยันว่าจะคิดค่าใช้งานเป็นโทเค็น

By lew Founder on Tag: Cerebras, LLM
Cerebras

Cerebras ผู้พัฒนาชิปเฉพาะทางในการรันโมเดลปัญญาประดิษฐ์ขนาดใหญ่ โชว์บริการ Cerebras Inference ที่ให้บริการโมเดล Llama 3.1 405B แบบความละเอียดเต็ม 16-bit แต่ได้ความเร็วสูงมากถึง 969 token/s และเริ่มตอบโทเค็นแรกในเวลาเพียง 240ms ใกล้เคียงการตอบแบบทันที

Subscribe to LLM