LLM | Blognone

Large Language Model

ผลทดสอบ ChatGPT แก้โจทย์โปรแกรมมิ่ง ทำได้ค่อนข้างดีเฉพาะโจทย์ที่เก่ากว่าปี 2021

By mk

on 9 July 2024 - 20:53 Tag: ChatGPT, LLM, Programming, Research

ChatGPT

มีงานวิจัยจากคณะนักวิจัยชาวจีน ทดลองนำ ChatGPT ไปทำโจทย์โปรแกรมมิ่งจำนวน 728 ข้อ ที่เขียนด้วยภาษาโปรแกรมยอดนิยม 5 ภาษา (C, C++, Java, Python, JavaScript) รวมถึงวิเคราะห์ช่องโหว่ CWE จำนวน 18 ช่องโหว่ แล้วมาประเมินว่าได้ผลลัพธ์ดีแค่ไหน

จากการประเมินของทีมวิจัยพบว่า ChatGPT ทำผลลัพธ์ออกมาได้ค่อนข้างดี (fairly good) ทำโจทย์ระดับง่าย กลาง ยาก ได้คะแนนผ่าน 89%, 71%, 40% ตามลำดับ

VISTEC เปิดชุดข้อมูลฝึก LLM ภาษาไทยชุดแรก 5,014 ชุด วางเป้าหมายเพิ่มเป็น 40,000 ชุด

By lew

on 5 July 2024 - 12:56 Tag: VISTEC, LLM, Artificial Intelligence

VISTEC

สถาบันวิทยสิริเมธี หรือ VISTEC ประกาศปล่อยชุดข้อมูล WangchanThaiInstruct สำหรับทำ fine-tuning โมเดล LLM ชุดแรก โดยรวม 5,014 ชุด ครอบคลุมทั้งหัวข้อทางการแพทย์, การเงิน, การค้า, และกฎหมาย เป็นชุดข้อมูลที่สร้างโดยมนุษย์ทั้งหมด (human-annotated) พร้อมกับเปิดให้ใช้งานได้เสรีแบบ CC-BY-SA 4.0

Hugging Face จัดอันดับความสามารถ Open LLM พบ Qwen ของ Alibaba มาเป็นอันดับ 1

By arjin

on 29 June 2024 - 16:49 Tag: Hugging Face, LLM, Artificial Intelligence, Ranking, Alibaba

Hugging Face

Hugging Face เผยแพร่ผลการจัดอันดับ LLM leaderboard ครั้งที่สอง โดยนำโมเดล LLM แบบเปิด (open large language model) มาทดสอบในการทำงานด้านต่าง ๆ

การทดสอบของ Hugging Face สนใจใน 4 งานได้แก่ วัดความรู้, ให้เหตุผลจากเนื้อหาขนาดยาวมาก, การคำนวณคณิตศาสตร์ที่ซับซ้อน และการอธิบายวิธีการขั้นตอน โดยใช้ตัววัดผล 6 อย่าง ได้แก่ MMLU-Pro, GPQA, MuSR, MATH, IFEval และ BBH

Gemini เพิ่มฟีเจอร์รันโค้ดอัตโนมัติเมื่อต้องการคำนวณ ใช้ฟรีไม่คิดเงินเพิ่ม

By lew

on 28 June 2024 - 15:44 Tag: Gemini, Google, LLM

Gemini

Gemini API ประกาศเพิ่มฟีเจอร์สำคัญคือการโค้ด Python ในตัวหากผู้ใช้ส่งคำถามที่ต้องการการคำนวณผล เช่น การนับคำหรือการบวกเลขจากตาราง

ผู้ใช้ API สามารถเลือกเปิดฟีเจอร์ code execution ได้เองขณะเรียก API เมื่อคำถามต้องการการคำนวณผ่านโค้ด Gemini จะสร้างโค้ดขึ้นมาและส่งไปรันบนเซิร์ฟเวอร์ของกูเกิลเอง แล้วนำข้อความสุดท้ายกลับมาตอบกลับผู้ใช้

Python ที่กูเกิลเตรียมบนเซิร์ฟเวอร์ให้มี NumPy และ SymPy ติดตั้งไว้ให้แต่ไม่สามารถติดตั้งโมดูลอื่นๆ เพิ่มเติมลงไปได้

กูเกิลเปิดให้ใช้งาน Gemini 1.5 Pro ขนาดอินพุต 2 ล้านโทเคน, เพิ่ม Context Caching ช่วยลดราคาอินพุต

By mk

on 28 June 2024 - 09:25 Tag: Gemini, Google, LLM

Gemini

กูเกิลเปิดให้นักพัฒนาทั่วไปใช้งานโมเดล Gemini 1.5 Pro ความยาวอินพุต 2 ล้านโทเคน ที่เปิดตัวในงาน Google I/O 2024 เมื่อเดือนพฤษภาคม

กูเกิลปล่อย Gemma 2 โมเดล LLM โหลดไปใช้งานเองได้ เก่งกว่า Gemini 1.0

By lew

on 28 June 2024 - 00:15 Tag: Gemma, Gemini, Google, LLM

Gemma

กูเกิลปล่อยโมเดลปัญญาประดิษฐ์ LLM Gemma 2 ที่ประกาศในงาน Google I/O ที่ผ่านมา โดยมีสองขนาดให้เลือกใช้ คือ 9B และ 27B เน้นความฉลาดเพิ่มขึ้น, ความเร็วในการทำงานดีขึ้น, และฝึกให้ตอบอย่างปลอดภัย

รายงานการทดสอบ Gemma 2 บน Chatbot Arena แสดงให้เห็นว่าประสิทธิภาพตัว 27B นั้นแซงหน้า Gemini 1.0 Pro ไปเสียอีก (แม้ค่าจะแกว่งมาก เพราะจำนวนการทดสอบไม่มากพอ) ขณะที่รุ่น 9B นั้นก็มีคะแนนเฉลี่ยแซงหน้า Claude 3 Haiku ทีเดียว

Meta ปล่อยโมเดล AI โชว์โมเดล Multimodal สร้างภาพจากคำสั่งและภาพต้นแบบ

By lew

on 27 June 2024 - 22:23 Tag: Meta, Artificial Intelligence, LLM

Google Translate รองรับเพิ่มอีก 110 ภาษา ใช้โมเดล PaLM 2 ทำงานเบื้องหลัง

By mk

on 27 June 2024 - 18:26 Tag: Google Translate, LLM, Google, Translation

Google Translate

กูเกิลประกาศเพิ่มภาษาที่ Google Translate รองรับอีก 110 ภาษา โดยภาษาที่สำคัญคือ จีนกวางตุ้ง (Cantonese) ซึ่งกูเกิลบอกว่าเป็นหนึ่งในภาษาที่ถูกเรียกร้องมากที่สุด รวมภาษาชุดนี้มีผู้ใช้งานมากกว่า 614 ล้านคน คิดเป็น 8% ของประชากรโลก

ประเด็นที่น่าสนใจคือระบบแปลเบื้องหลัง ใช้โมเดลภาษา PaLM 2 ที่เปิดตัวในปี 2023 (ยังไม่ใช่ Gemini) และเป็นผลต่อเนื่องจากโครงการ 1,000 Languages Initiative ที่ต้องการพัฒนาระบบแปลภาษาให้ครอบคลุม 1,000 ภาษาทั่วโลก

Anthropic เปิดตัว "Projects" ฟีเจอร์ใหม่ใน Claude AI สำหรับแชร์ไอเดียทำงานร่วมกันในงาน AI

By arjin

on 26 June 2024 - 21:27 Tag: Anthropic, LLM, Claude, Collaboration

Anthropic

Anthropic เปิดตัว Projects ฟีเจอร์ใหม่บนแพลตฟอร์ม Claude AI สำหรับลูกค้าแผน Pro และ Team โดยมีแนวคิดให้ลูกค้าองค์กรสามารถแชร์การทำงานกับ Claude AI ร่วมกันในทีมได้อย่างมีประสิทธิภาพมากขึ้น

Projects รองรับการทำงานร่วมกัน (collaboration) ตั้งแต่การเริ่มกำหนดไอเดีย, การกำหนดกลยุทธ์ตัดสินใจ จนถึงการประเมินผลลัพธ์ที่ได้จาก Claude AI ซึ่งรองรับโมเดลล่าสุด Claude 3.5 Sonnet

Project Zero โชว์เฟรมเวิร์ค Naptime ปล่อยให้ LLM หาช่องโหว่ซอฟต์แวร์ระหว่างนักวิจัยหนีไปงีบ

By lew

on 24 June 2024 - 13:53 Tag: Project Zero, Security, LLM

Project Zero

Project Zero รายงานถึงแนวทางการทดสอบประสิทธิภาพ AI ในกลุ่ม LLM ว่าสามารถนำมาใช้ทดสอบความปลอดภัยซอฟต์แวร์ได้ดีเพียงใด โดยวางเฟรมเวิร์คให้ LLM เข้าถึงเครื่องมือที่จำเป็นสำหรับการเจาะระบบจริงๆ ได้แก่

Anthropic เปิดตัว Claude 3.5 Sonnet ฉลาดกว่า GPT-4o, Gemini 1.5 Pro เปิดให้ใช้ฟรี

By lew

on 21 June 2024 - 00:32 Tag: Anthropic, LLM, Claude

Anthropic

Anthropic บริษัท LLM เปิดตัว Claude 3.5 Sonnet โมเดล LLM ขนาดกลาง อัพเดตจาก Claude 3 ที่เพิ่งเปิดตัวเมื่อเดือนมีนาคมที่ผ่านมา โดยความพิเศษคือรอบนี้เปิดตัวเฉพาะรุ่นกลาง Sonnet แต่ก็มีความฉลาดเหนือกว่า Claude 3 Opus รุ่นใหญ่สุดที่เปิดตัวมาก่อนหน้านี้แล้ว

ผลการศึกษา เมื่อให้นักแสดงเดี่ยวไมโครโฟนใช้บทพูดที่สร้างจาก AI พบว่ามุกเก่า มีจังหวะน่าเบื่อ ยังแทนที่ไม่ได้

By arjin

on 20 June 2024 - 12:50 Tag: Artificial Intelligence, LLM

Artificial Intelligence

Piotr Mirowski นักวิจัยของ Google DeepMind ซึ่งใช้เวลาว่างฝึกทักษะการเป็นนักแสดงตลกเดี่ยวไมโครโฟนด้วย เผยแพร่ผลการศึกษา ว่านักแสดงตลกสามารถนำ AI มาช่วยเสริมการทำงานได้ดีแค่ไหน

ในการศึกษานี้ได้ร่วมมือกับนักแสดงตลกมืออาชีพ 20 คน ซึ่งทั้งหมดคุ้นเคยกับการนำ AI มาช่วยงานบางส่วนอยู่แล้ว เช่น เกลาเนื้อหา เขียนร่างแรกของบทพูด โดยครั้งนี้พวกเขาใช้เครื่องมือ LLM เช่น ChatGPT หรือ Gemini มาช่วยเขียนบทพูดที่นักแสดงสะดวกใจที่จะนำไปแสดง แล้วนำไปใช้จริงในงานหนึ่งโดยไม่มีการเปิดเผยกับผู้ชมว่าบททั้งหมดนี้เขียนด้วย AI

Lamini เสนอเทคนิค Memory Tuning ใส่ความรู้ให้ LLM โดยแทบไม่เหลืออาการหลอน

By lew

on 17 June 2024 - 23:12 Tag: LLM, Artificial Intelligence

LLM

Lamini บริษัทแพลตฟอร์มปัญญาประดิษฐ์แบบ LLM นำเสนอเทคนิคการปรับแต่งโมเดลปัญญาประดิษฐ์ที่ชื่อว่า Lamini Memory Tuning (LMT) โดยระบุว่าลดอาการหลอน (hallucinate) ของปัญญาประดิษฐ์แบบ LLM ได้ถึง 95%

ก่อนหน้านี้การลดอาการหลอนของ LLM นั้นอาศัยการวางข้อมูลอ้างอิงจากแหล่งที่น่าเชื่อถือต่างๆ เช่น องค์กรอาจจะมีชุดข้อมูลของตัวเองก็สามารถนำข้อมูลที่เกี่ยวข้องกับคำถามมาวางในพรอมพ์ เรียกว่า Retrieval Augmented Generation (RAG) เทคนิคนี้เพิ่มความแม่นยำได้จริง แต่ก็มีข้อจำกัดเพราะกระบวนการดึงข้อมูลไม่สมบูรณ์

NVIDIA เปิดตัวโมเดล Nemotron-4 340B สร้างข้อมูลสังเคราะห์สำหรับเทรน LLM อีกที

By mk

on 17 June 2024 - 10:18 Tag: NVIDIA, LLM, Artificial Intelligence, Nemotron

NVIDIA

NVIDIA เปิดตัวโมเดล Nemotron-4 340B เป็นโมเดลสำหรับสร้างข้อมูลสังเคราะห์ (synthetic data) เพื่อใช้เทรนโมเดลภาษาขนาดใหญ่ LLM อีกทีหนึ่ง

จุดเด่นของ Nemotron-4 340B คือการสร้างข้อมูลคุณภาพสูงในราคาถูก ตัวสัญญาอนุญาตเป็น NVIDIA Open Model ใช้งานในเชิงพาณิชย์ได้ฟรี นำโมเดลไปดัดแปลงต่อได้

สำนักพิมพ์ Wiley เผย เริ่มขายไลเซนส์ให้บริษัท Tech เข้าถึงเนื้อหาตำราเรียน สำหรับเทรน AI แล้ว

By arjin

on 17 June 2024 - 06:59 Tag: Textbooks, Artificial Intelligence, LLM

Textbooks

John Wiley & Sons หรือ Wiley สำนักพิมพ์ผู้ผลิตตำราเรียนรายใหญ่แห่งหนึ่ง เปิดเผยในรายงานผลประกอบการไตรมาสที่ผ่านมา ว่าบริษัทได้เริ่มโครงการให้บริษัทเทคโนโลยีขนาดใหญ่ ได้สิทธิ์เข้าถึงเนื้อหาหนังสือที่ได้รับอนุญาต สำหรับนำไปเทรนโมเดล Generative AI โดยตอนนี้มีหนึ่งบริษัทที่ไม่เปิดเผย และมูลค่ารายได้ส่วนนี้คือ 23 ล้านดอลลาร์

Wiley บอกว่าบริษัทยังมีการเจรจากับบริษัทเทคโนโลยีขนาดใหญ่อีกหนึ่งแห่ง คาดว่าดีลจะเริ่มต้นได้ในครึ่งหลังของปีนี้ ซึ่งมองว่าเป็นโอกาสอีกมากของบริษัทที่จะเพิ่มมูลค่าสินทรัพย์ที่มี

รายงานเผย Alexa ใหม่ที่มี LLM ยังไม่พร้อมตามกำหนดเดิม ยังห่างไกลความพร้อมให้บริการ

By sarisalily

on 14 June 2024 - 17:12 Tag: Amazon, Alexa, Artificial Intelligence, LLM

Amazon

จากกระแส LLM ที่กำลังมาแรง เจ้าตลาด AI Assistant เดิมอย่าง Amazon เหมือนจะยังคงตามหลังคู่แข่งอยู่ไกล และน่าจะถูกแซงไปเรื่อย ๆ เมื่อล่าสุดมีรายงานจากทั้งนิตยสาร Fortune และ Yahoo! Finance รายงานอ้างอิงการสัมภาษณ์คนในไปในทางเดียวกันว่า ความพร้อมของ Alexa LLM ยังคงห่างไกลความเป็นจริง หลังเคยเผยพรีวิว เมื่อปลายปีที่แล้ว

อดีตพนักงานของ Amazon ให้สัมภาษณ์กับทางนิตยสารว่า Alexa ตัวใหม่จะไม่มีวันตามใครทัน ถ้า Amazon ยังไม่ยอมทิ้ง Alexa ตัวเก่าเพื่อมาพัฒนาตัวใหม่ และถึงเปิดตัวออกมา ก็จะยังสู้คู่แข่งไม่ได้

KBTG แสดงผลการปรับโมเดล Qwen2-7B จนทำข้อสอบ CFA ผ่าน เปิดทางโมเดลขนาดเล็กแนะนำการเงิน

By lew

on 12 June 2024 - 20:44 Tag: KBTG, LLM

KBTG

NLP-Voice Research Lab, KBTG Labs ห้องวิจัยของ KASIKORN Business—Technology Group (KBTG) รายงานถึง THaLLE โมเดล LLM ที่ปรับแต่งเพื่อเพิ่มความสามารถด้านการเงิน โดยวัดจากการสอบ Chartered Financial Analyst (CFA)

เปิดสเปค LLM ภายใน Apple Intelligence รุ่นในอุปกรณ์ขนาด 3B, บนเซิร์ฟเวอร์เท่า GPT-3.5-Turbo

By lew

on 11 June 2024 - 10:01 Tag: Apple, LLM, Artificial Intelligence

Apple

แอปเปิลเปิดข้อมูลเพิ่มเติมของโมเดล LLM ภายใน Apple Intelligence ที่ใช้สำหรับการช่วยสรุปข้อความ, แก้คำผิด, ปรับคำ, หรือช่วยจัดลำดับความสำคัญของข้อความต่างๆ โดยส่วนประกอบพื้นฐานที่สุดคือ Apple Foundation Models ที่เป็นโมเดลของแอปเปิลเอง

Huawei โชว์ประสิทธิภาพชิป Ascend 910B โดยรวมประมาณ 80% ของ NVIDIA A100 แถมชนะบางการทดสอบ

By lew

on 9 June 2024 - 13:42 Tag: Huawei, China, LLM, Semiconductor

Huawei

ที่งาน World Semiconductor Conference Wang Tao COO ของศูนย์นวัตกรรม Jiangsu Kunpeng ขึ่้นเวทีบรรยายถึงประสิทธิภาพของชิป Huawei Ascend A910B อยู่ที่ประมาณ 80% ของชิป NVIDIA A100 สำหรับการฝึกปัญญาประดิษฐ์แบบ LLM นับว่าไม่ได้ห่างกันมากนัก

DuckDuckGo เปิดตัว AI Chat แชทบอตไม่ระบุตัวตน ให้ความเป็นส่วนตัวในการใช้งาน

By arjin

on 8 June 2024 - 15:12 Tag: DuckDuckGo, Artificial Intelligence, Chatbot, LLM, Privacy

DuckDuckGo

DuckDuckGo บริการเสิร์ชที่มีจุดขายเรื่องความเป็นส่วนตัว เปิดตัวบริการใหม่ DuckDuckGo AI Chat แชทบอตปัญญาประดิษฐ์ที่สามารถเลือกใช้งานได้หลายโมเดล ทั้ง GPT 3.5 Turbo ของ OpenAI, Claude 3 Haiku ของ Anthropic, Llama 3 ของ Meta และ Mixtral 8x7B ของ Mistral

จุดขายของ DuckDuckGo AI Chat ยังคงแนวทางเดิมคือบทสนทนาเป็นส่วนตัว, ถูกกำหนดไว้แบบนิรนาม (anonymous), ปลายทางไม่สามารถระบุตัวตนได้, IP ที่ส่งไปเป็นถูกแก้ไขเป็น IP ของ DuckDuckGo, และแชททั้งหมดไม่ถูกนำไปใช้เทรนโมเดล AI ต่อ

Subscribe to LLM