Image

Large Language Model

By mk Founder on Tag: ChatGPT, LLM, Programming, Research
ChatGPT

มีงานวิจัยจากคณะนักวิจัยชาวจีน ทดลองนำ ChatGPT ไปทำโจทย์โปรแกรมมิ่งจำนวน 728 ข้อ ที่เขียนด้วยภาษาโปรแกรมยอดนิยม 5 ภาษา (C, C++, Java, Python, JavaScript) รวมถึงวิเคราะห์ช่องโหว่ CWE จำนวน 18 ช่องโหว่ แล้วมาประเมินว่าได้ผลลัพธ์ดีแค่ไหน

จากการประเมินของทีมวิจัยพบว่า ChatGPT ทำผลลัพธ์ออกมาได้ค่อนข้างดี (fairly good) ทำโจทย์ระดับง่าย กลาง ยาก ได้คะแนนผ่าน 89%, 71%, 40% ตามลำดับ

By lew Founder on Tag: VISTEC, LLM, Artificial Intelligence
VISTEC

สถาบันวิทยสิริเมธี หรือ VISTEC ประกาศปล่อยชุดข้อมูล WangchanThaiInstruct สำหรับทำ fine-tuning โมเดล LLM ชุดแรก โดยรวม 5,014 ชุด ครอบคลุมทั้งหัวข้อทางการแพทย์, การเงิน, การค้า, และกฎหมาย เป็นชุดข้อมูลที่สร้างโดยมนุษย์ทั้งหมด (human-annotated) พร้อมกับเปิดให้ใช้งานได้เสรีแบบ CC-BY-SA 4.0

By arjin Writer on Tag: Hugging Face, LLM, Artificial Intelligence, Ranking, Alibaba
Hugging Face

Hugging Face เผยแพร่ผลการจัดอันดับ LLM leaderboard ครั้งที่สอง โดยนำโมเดล LLM แบบเปิด (open large language model) มาทดสอบในการทำงานด้านต่าง ๆ

การทดสอบของ Hugging Face สนใจใน 4 งานได้แก่ วัดความรู้, ให้เหตุผลจากเนื้อหาขนาดยาวมาก, การคำนวณคณิตศาสตร์ที่ซับซ้อน และการอธิบายวิธีการขั้นตอน โดยใช้ตัววัดผล 6 อย่าง ได้แก่ MMLU-Pro, GPQA, MuSR, MATH, IFEval และ BBH

By lew Founder on Tag: Gemini, Google, LLM
Gemini

Gemini API ประกาศเพิ่มฟีเจอร์สำคัญคือการโค้ด Python ในตัวหากผู้ใช้ส่งคำถามที่ต้องการการคำนวณผล เช่น การนับคำหรือการบวกเลขจากตาราง

ผู้ใช้ API สามารถเลือกเปิดฟีเจอร์ code execution ได้เองขณะเรียก API เมื่อคำถามต้องการการคำนวณผ่านโค้ด Gemini จะสร้างโค้ดขึ้นมาและส่งไปรันบนเซิร์ฟเวอร์ของกูเกิลเอง แล้วนำข้อความสุดท้ายกลับมาตอบกลับผู้ใช้

Python ที่กูเกิลเตรียมบนเซิร์ฟเวอร์ให้มี NumPy และ SymPy ติดตั้งไว้ให้แต่ไม่สามารถติดตั้งโมดูลอื่นๆ เพิ่มเติมลงไปได้

By mk Founder on Tag: Gemini, Google, LLM
Gemini

กูเกิลเปิดให้นักพัฒนาทั่วไปใช้งานโมเดล Gemini 1.5 Pro ความยาวอินพุต 2 ล้านโทเคน ที่เปิดตัวในงาน Google I/O 2024 เมื่อเดือนพฤษภาคม

By lew Founder on Tag: Gemma, Gemini, Google, LLM
Gemma

กูเกิลปล่อยโมเดลปัญญาประดิษฐ์ LLM Gemma 2 ที่ประกาศในงาน Google I/O ที่ผ่านมา โดยมีสองขนาดให้เลือกใช้ คือ 9B และ 27B เน้นความฉลาดเพิ่มขึ้น, ความเร็วในการทำงานดีขึ้น, และฝึกให้ตอบอย่างปลอดภัย

รายงานการทดสอบ Gemma 2 บน Chatbot Arena แสดงให้เห็นว่าประสิทธิภาพตัว 27B นั้นแซงหน้า Gemini 1.0 Pro ไปเสียอีก (แม้ค่าจะแกว่งมาก เพราะจำนวนการทดสอบไม่มากพอ) ขณะที่รุ่น 9B นั้นก็มีคะแนนเฉลี่ยแซงหน้า Claude 3 Haiku ทีเดียว

By lew Founder on Tag: Meta, Artificial Intelligence, LLM
Meta

Meta ปล่อยโมเดลปัญญาประดิษฐ์ในรูปแบบเปิดให้ใช้เพื่อการวิจัยเท่านั้น ได้แก่

  • Chameleon โมเดลปัญญาประดิษฐ์แบบ mixed-modal สามารถรับ/ตอบ ได้ทั้งภาพและข้อความทำให้สามารถใส่คำสั่งสร้างภาพพร้อมภาพตัวอย่าง ขณะที่ตัวโมเดลก็สามารถสร้างภาพตอบกลับมาพร้อมๆ กับข้อความได้ด้วย โมเดลแบบนี้อาจจะเปิดทางสำหรับรูปแบบการใช้งานใหม่ๆ เช่น สร้างภาพพร้อมเนื้อหาที่ต่อเนื่องกับภาพเดิมที่ผู้ใช้ใส่เข้ามา
  • Multi-Token Prediction โมเดล LLM สถาปัตยกรรมใหม่ที่สามารถทำนายคำล่วงหน้าได้ทีละหลายๆ คำ เร่งความเร็วการทำงานจากเดิมที่เราเห็น LLM พิมพ์คำตอบทีละคำแบบทุกวันนี้ โมเดลที่ปล่อยออกมาตอนนี้ใช้เพื่อการช่วยเติมโค้ดเท่านั้น
  • JASCO โมเดลสร้างเพลงจากอินพุตหลายรูปแบบ ทั้งข้อความตามปกติ, คอร์ดเพลง, จังหวะเพลง เปิดแนวทางการใช้งานให้ผู้ใช้สามารถควบคุมการทำงานได้ดีขึ้น
By mk Founder on Tag: Google Translate, LLM, Google, Translation
Google Translate

กูเกิลประกาศเพิ่มภาษาที่ Google Translate รองรับอีก 110 ภาษา โดยภาษาที่สำคัญคือ จีนกวางตุ้ง (Cantonese) ซึ่งกูเกิลบอกว่าเป็นหนึ่งในภาษาที่ถูกเรียกร้องมากที่สุด รวมภาษาชุดนี้มีผู้ใช้งานมากกว่า 614 ล้านคน คิดเป็น 8% ของประชากรโลก

ประเด็นที่น่าสนใจคือระบบแปลเบื้องหลัง ใช้โมเดลภาษา PaLM 2 ที่เปิดตัวในปี 2023 (ยังไม่ใช่ Gemini) และเป็นผลต่อเนื่องจากโครงการ 1,000 Languages Initiative ที่ต้องการพัฒนาระบบแปลภาษาให้ครอบคลุม 1,000 ภาษาทั่วโลก

By arjin Writer on Tag: Anthropic, LLM, Claude, Collaboration
Anthropic

Anthropic เปิดตัว Projects ฟีเจอร์ใหม่บนแพลตฟอร์ม Claude AI สำหรับลูกค้าแผน Pro และ Team โดยมีแนวคิดให้ลูกค้าองค์กรสามารถแชร์การทำงานกับ Claude AI ร่วมกันในทีมได้อย่างมีประสิทธิภาพมากขึ้น

Projects รองรับการทำงานร่วมกัน (collaboration) ตั้งแต่การเริ่มกำหนดไอเดีย, การกำหนดกลยุทธ์ตัดสินใจ จนถึงการประเมินผลลัพธ์ที่ได้จาก Claude AI ซึ่งรองรับโมเดลล่าสุด Claude 3.5 Sonnet

By lew Founder on Tag: Project Zero, Security, LLM
Project Zero

Project Zero รายงานถึงแนวทางการทดสอบประสิทธิภาพ AI ในกลุ่ม LLM ว่าสามารถนำมาใช้ทดสอบความปลอดภัยซอฟต์แวร์ได้ดีเพียงใด โดยวางเฟรมเวิร์คให้ LLM เข้าถึงเครื่องมือที่จำเป็นสำหรับการเจาะระบบจริงๆ ได้แก่

By lew Founder on Tag: Anthropic, LLM, Claude
Anthropic

Anthropic บริษัท LLM เปิดตัว Claude 3.5 Sonnet โมเดล LLM ขนาดกลาง อัพเดตจาก Claude 3 ที่เพิ่งเปิดตัวเมื่อเดือนมีนาคมที่ผ่านมา โดยความพิเศษคือรอบนี้เปิดตัวเฉพาะรุ่นกลาง Sonnet แต่ก็มีความฉลาดเหนือกว่า Claude 3 Opus รุ่นใหญ่สุดที่เปิดตัวมาก่อนหน้านี้แล้ว

By arjin Writer on Tag: Artificial Intelligence, LLM
Artificial Intelligence

Piotr Mirowski นักวิจัยของ Google DeepMind ซึ่งใช้เวลาว่างฝึกทักษะการเป็นนักแสดงตลกเดี่ยวไมโครโฟนด้วย เผยแพร่ผลการศึกษา ว่านักแสดงตลกสามารถนำ AI มาช่วยเสริมการทำงานได้ดีแค่ไหน

ในการศึกษานี้ได้ร่วมมือกับนักแสดงตลกมืออาชีพ 20 คน ซึ่งทั้งหมดคุ้นเคยกับการนำ AI มาช่วยงานบางส่วนอยู่แล้ว เช่น เกลาเนื้อหา เขียนร่างแรกของบทพูด โดยครั้งนี้พวกเขาใช้เครื่องมือ LLM เช่น ChatGPT หรือ Gemini มาช่วยเขียนบทพูดที่นักแสดงสะดวกใจที่จะนำไปแสดง แล้วนำไปใช้จริงในงานหนึ่งโดยไม่มีการเปิดเผยกับผู้ชมว่าบททั้งหมดนี้เขียนด้วย AI

By lew Founder on Tag: LLM, Artificial Intelligence
LLM

Lamini บริษัทแพลตฟอร์มปัญญาประดิษฐ์แบบ LLM นำเสนอเทคนิคการปรับแต่งโมเดลปัญญาประดิษฐ์ที่ชื่อว่า Lamini Memory Tuning (LMT) โดยระบุว่าลดอาการหลอน (hallucinate) ของปัญญาประดิษฐ์แบบ LLM ได้ถึง 95%

ก่อนหน้านี้การลดอาการหลอนของ LLM นั้นอาศัยการวางข้อมูลอ้างอิงจากแหล่งที่น่าเชื่อถือต่างๆ เช่น องค์กรอาจจะมีชุดข้อมูลของตัวเองก็สามารถนำข้อมูลที่เกี่ยวข้องกับคำถามมาวางในพรอมพ์ เรียกว่า Retrieval Augmented Generation (RAG) เทคนิคนี้เพิ่มความแม่นยำได้จริง แต่ก็มีข้อจำกัดเพราะกระบวนการดึงข้อมูลไม่สมบูรณ์

By mk Founder on Tag: NVIDIA, LLM, Artificial Intelligence, Nemotron
NVIDIA

NVIDIA เปิดตัวโมเดล Nemotron-4 340B เป็นโมเดลสำหรับสร้างข้อมูลสังเคราะห์ (synthetic data) เพื่อใช้เทรนโมเดลภาษาขนาดใหญ่ LLM อีกทีหนึ่ง

จุดเด่นของ Nemotron-4 340B คือการสร้างข้อมูลคุณภาพสูงในราคาถูก ตัวสัญญาอนุญาตเป็น NVIDIA Open Model ใช้งานในเชิงพาณิชย์ได้ฟรี นำโมเดลไปดัดแปลงต่อได้

By arjin Writer on Tag: Textbooks, Artificial Intelligence, LLM
Textbooks

John Wiley & Sons หรือ Wiley สำนักพิมพ์ผู้ผลิตตำราเรียนรายใหญ่แห่งหนึ่ง เปิดเผยในรายงานผลประกอบการไตรมาสที่ผ่านมา ว่าบริษัทได้เริ่มโครงการให้บริษัทเทคโนโลยีขนาดใหญ่ ได้สิทธิ์เข้าถึงเนื้อหาหนังสือที่ได้รับอนุญาต สำหรับนำไปเทรนโมเดล Generative AI โดยตอนนี้มีหนึ่งบริษัทที่ไม่เปิดเผย และมูลค่ารายได้ส่วนนี้คือ 23 ล้านดอลลาร์

Wiley บอกว่าบริษัทยังมีการเจรจากับบริษัทเทคโนโลยีขนาดใหญ่อีกหนึ่งแห่ง คาดว่าดีลจะเริ่มต้นได้ในครึ่งหลังของปีนี้ ซึ่งมองว่าเป็นโอกาสอีกมากของบริษัทที่จะเพิ่มมูลค่าสินทรัพย์ที่มี

By sarisalily Contributor on Tag: Amazon, Alexa, Artificial Intelligence, LLM
Amazon

จากกระแส LLM ที่กำลังมาแรง เจ้าตลาด AI Assistant เดิมอย่าง Amazon เหมือนจะยังคงตามหลังคู่แข่งอยู่ไกล และน่าจะถูกแซงไปเรื่อย ๆ เมื่อล่าสุดมีรายงานจากทั้งนิตยสาร Fortune และ Yahoo! Finance รายงานอ้างอิงการสัมภาษณ์คนในไปในทางเดียวกันว่า ความพร้อมของ Alexa LLM ยังคงห่างไกลความเป็นจริง หลังเคยเผยพรีวิว เมื่อปลายปีที่แล้ว

อดีตพนักงานของ Amazon ให้สัมภาษณ์กับทางนิตยสารว่า Alexa ตัวใหม่จะไม่มีวันตามใครทัน ถ้า Amazon ยังไม่ยอมทิ้ง Alexa ตัวเก่าเพื่อมาพัฒนาตัวใหม่ และถึงเปิดตัวออกมา ก็จะยังสู้คู่แข่งไม่ได้

By lew Founder on Tag: KBTG, LLM
KBTG

NLP-Voice Research Lab, KBTG Labs ห้องวิจัยของ KASIKORN Business—Technology Group (KBTG) รายงานถึง THaLLE โมเดล LLM ที่ปรับแต่งเพื่อเพิ่มความสามารถด้านการเงิน โดยวัดจากการสอบ Chartered Financial Analyst (CFA)

By lew Founder on Tag: Apple, LLM, Artificial Intelligence
Apple

แอปเปิลเปิดข้อมูลเพิ่มเติมของโมเดล LLM ภายใน Apple Intelligence ที่ใช้สำหรับการช่วยสรุปข้อความ, แก้คำผิด, ปรับคำ, หรือช่วยจัดลำดับความสำคัญของข้อความต่างๆ โดยส่วนประกอบพื้นฐานที่สุดคือ Apple Foundation Models ที่เป็นโมเดลของแอปเปิลเอง

By lew Founder on Tag: Huawei, China, LLM, Semiconductor
Huawei

ที่งาน World Semiconductor Conference Wang Tao COO ของศูนย์นวัตกรรม Jiangsu Kunpeng ขึ่้นเวทีบรรยายถึงประสิทธิภาพของชิป Huawei Ascend A910B อยู่ที่ประมาณ 80% ของชิป NVIDIA A100 สำหรับการฝึกปัญญาประดิษฐ์แบบ LLM นับว่าไม่ได้ห่างกันมากนัก

By arjin Writer on Tag: DuckDuckGo, Artificial Intelligence, Chatbot, LLM, Privacy
DuckDuckGo

DuckDuckGo บริการเสิร์ชที่มีจุดขายเรื่องความเป็นส่วนตัว เปิดตัวบริการใหม่ DuckDuckGo AI Chat แชทบอตปัญญาประดิษฐ์ที่สามารถเลือกใช้งานได้หลายโมเดล ทั้ง GPT 3.5 Turbo ของ OpenAI, Claude 3 Haiku ของ Anthropic, Llama 3 ของ Meta และ Mixtral 8x7B ของ Mistral

จุดขายของ DuckDuckGo AI Chat ยังคงแนวทางเดิมคือบทสนทนาเป็นส่วนตัว, ถูกกำหนดไว้แบบนิรนาม (anonymous), ปลายทางไม่สามารถระบุตัวตนได้, IP ที่ส่งไปเป็นถูกแก้ไขเป็น IP ของ DuckDuckGo, และแชททั้งหมดไม่ถูกนำไปใช้เทรนโมเดล AI ต่อ

Subscribe to LLM