Image

Large Language Model

By lew Founder on Tag: MDN, LLM, ChatGPT
MDN

สัปดาห์ที่ผ่านมา MDN เว็บคลังเอกสารสำหรับนักพัฒนาเว็บ เปิดฟีเจอร์ AI Help สำหรับการถามตอบข้อมูลจากเอกสารในเว็บ และ AI Explain สำหรับอธิบายโค้ด โดยใช้ API จาก OpenAI ในการประมวลผล ตอนนี้เหล่านักพัฒนาก็กำลังโวยว่าฟีเจอร์นี้สร้างความเข้าใจผิด อธิบายเนื้อหาผิดพลาด หรือหากสร้างตัวอย่างได้ก็มักเป็นตัวอย่างง่ายๆ เท่านั้น

นักพัฒนาหลายคนยกตัวอย่าง คำอธิบายของ AI Help ที่ตอบผิด บางฟีเจอร์เป็นฟังก์ชั่นมาตรฐานของ CSS แต่ AI ก็ตอบว่าไม่ใช่มาตรฐาน บางทีก็ตอบตรงข้ามกับเนื้อหาในเอกสารไปเลย

By lew Founder on Tag: Salesforce, Artificial Intelligence, LLM
Salesforce

Salesforce AI Research ประกาศผลงานการฝึกปัญญาประดิษฐ์ XGen-7B เป็นปัญญาประดิษฐ์แบบโอเพนซอร์สที่สามารถใช้งานได้อิสระ โดยชูจุดเด่นที่คุณภาพสูงเหนือปัญญาประดิษฐ์ในกลุ่มโอเพนซอร์สด้วยกัน เช่น MPT-7B หรือ Falcon-7B

XGen-7B เทรนบนชิป TPU-v4 ของ Google Cloud ต้นทุนต่อการเทรนด้วยข้อมูล 1 ล้านล้านโทเค็นอยู่ที่ 150,000 ดอลลาร์

By lew Founder on Tag: Artificial Intelligence, LLM, NVIDIA, Intel, CoreWeave
Artificial Intelligence

MLCommons หน่วยงานกลางสำหรับการจัดอันดับประสิทธิภาพคอมพิวเตอร์ในงานด้าน machine learning ประกาศผล MLPerf Training 3.0 แสดงประสิทธิภาพของการฝึกโมเดลปัญญาประดิษฐ์รูปแบบต่างๆ มีผู้ส่งระบบเข้าร่วม 250 ระบบ จากผู้ผลิตหรือคลาวด์รวม 16 ราย ภาพรวมแล้วระบบต่างๆ เร็วขึ้นกว่าการทดสอบรอบก่อนหน้านี้ 1.54 เท่าตัว ความพิเศษของรอบนี้คือมีการทดสอบฝึก GPT-3 เข้ามาด้วย เพื่อดูประสิทธิภาพของการฝึก LLM และรอบนี้มีเฉพาะ NVIDIA และ Intel เท่านั้นที่ส่งผลเข้ามา

By lew Founder on Tag: Baidu, LLM
Baidu

Baidu ประกาศว่าเริ่มปล่อย ERNIE 3.5 ปัญญาประดิษฐ์ภาษาขนาดใหญ่ (LLM) ให้ผู้ได้รับสิทธิ์ทดสอบได้เริ่มใช้งานแล้ว โดยผลทดสอบ AGIEval ของไมโครซอฟท์ และ C-EVAL ของนักวิจัยจีนแสดงให้เห็นว่า ERNIE 3.5 เริ่มมีประสิทธิภาพใกล้เคียง ChatGPT ที่ใช้ GPT-3.5 และเมื่อแยกเฉพาะชุดทดสอบภาษาจีนเอง ERNIE 3.5 ทำคะแนนทดสอบได้ดีกว่า GPT-4

By arjin Writer on Tag: DeepMind, Artificial Intelligence, LLM, Chatbot, Google, Gemini
DeepMind

Demis Hassabis ผู้ร่วมก่อตั้งและซีอีโอ DeepMind ให้ข้อมูลล่าสุดของโมเดล AI ที่ชื่อ Gemini ซึ่งตอนนี้อยู่ในขั้นตอนการพัฒนา และเป็นโมเดลแบบ Large Language ประเภทเดียวกับ GPT-4 ของ OpenAI ที่ปัจจุบันเป็น AI เบื้องหลังแชทบอต ChatGPT

By lew Founder on Tag: Databricks, Artificial Intelligence, LLM
Databricks

Databricks ผู้ให้บริการแพลตฟอร์มข้อมูล เข้าซื้อบริษัท MosaicML แพลตฟอร์มการเทรนและรันโมเดลปัญญาประดิษฐ์ ผู้สร้างโมเดลโอเพนซอร์ส MPT-7B และ MPT-30B ที่สามารถใช้งานในองค์กรได้

ซอฟต์แวร์ของ MosaicML ช่วยให้การฝึกปัญญาประดิษฐ์ขนาดใหญ่ใช้เวลาน้อยลง และรับมือกับปัญหาที่เกิดขึ้น เช่น บางเครื่องในระบบตายไประหว่างการฝึกได้ ทาง Databricks บอกแนวทางชัดเจนว่าจะใช้เทคโนโลยีของ MosaicML มารวมไว้ใน Databricks Lakehouse Platform เพื่อให้องค์กรสามารถฝึกโมเดลปัญญาประดิษฐ์ได้ด้วยตัวเอง

By arjin Writer on Tag: IBM, Wimbledon, Sport, LLM, Artificial Intelligence, Watson, Tennis
IBM

ไอบีเอ็มประกาศนำเทคโนโลยี Generative AI หรือ AI สร้างเนื้อหาอัตโนมัติจาก IBM watsonx มาใช้กับการแข่งขันเทนนิสวิมเบิลดัน ในการสร้างวิดีโอไฮไลท์การแข่งขันแต่ละแมตช์พร้อมเสียงพากย์ ซึ่งถือเป็นครั้งแรกในการแข่งขันเทนนิส

ในวิดีโอไฮไลท์ซึ่งสามารถรับชมได้ผ่านแอป Wimbledon หรือทางเว็บไซต์ wimbledon.com จะมีเสียงบรรยายในช่วงสำคัญของการแข่งขัน พร้อมกับตัวหนังสือคำบรรยาย ซึ่งผู้ชมสามารถเลือกปิด-เปิดส่วนนี้ได้ ทั้งนี้ส่วนไฮไลท์ที่สร้างด้วย AI จะเป็นส่วนเสริมเข้ามา โดยไฮไลท์แบบเดิมที่ใช้คนบรรยายของ Show Courts จะยังมีอยู่เหมือนเดิม

By lew Founder on Tag: Mercedes-Benz, LLM, OpenAI, Microsoft Azure, ChatGPT
Mercedes-Benz

Mercedes-Benz ประกาศเพิ่มฟีเจอร์ของ MBUX Voice Assistant ผู้ช่วยสั่งงานในรถด้วยเสียง ให้ใช้ความสามารถของ ChatGPT เพิ่มเข้ามาเพื่อรองรับคำสั่งที่หลากหลายกว่าเดิม

MBUX Voice Assistant เป็นผู้ช่วยในรถที่เรียกใช้ด้วยคำสั่ง “Hey Mercedes” โดยปกติแล้วผู้ช่วยในกลุ่มนี้ก็มักรับคำสั่งได้จำกัดตามที่ออกแบบไว้ แต่การใช้ ChatGPT เข้ามาจะช่วยให้ผู้ใช้ถามคำถามที่ซับซ้อนกว่าเดิม รวมถึงการขอรายละเอียดจุดหมายปลายทาง หรือการถามนอกเรื่องอย่างสูตรอาหาร

ทาง Mercedes-Benz ใช้โมเดลของ OpenAI ผ่านทาง Azure OpenAI Service ส่วนข้อมูลเสียงจะเก็บรักษาโดย Mercedes-Benz เอง

By lew Founder on Tag: OpenAI, LLM
OpenAI

OpenAI เปิดโมเดล GPT-3.5 (ChatGPT) และ GPT-4 เวอร์ชั่น 0613 ของเดือนนี้ โดยมีฟีเจอร์สำคัญคือการเปิดให้โมเดลสามารถร้องของข้อมูลภายนอกจากฟังก์ชั่นที่เรากำหนดให้ได้ ผ่านทาง Chat Completion API

นักพัฒนาต้องกำหนดข้อมูลฟังก์ชั่นที่ต้องการเรียกส่งไปพร้อมกับคำถามของผู้ใช้ เช่น กำหนดฟังก์ชั่นคิวรีสภาพอากาศปัจจุบัน เมื่อผู้ใช้ถามถึงสภาพอากาศ ค่าตอบกลับจาก Chat Completion API จะระบุว่า AI ต้องการเรียกฟังก์ชั่น แล้วนำอาร์กิวเมนต์ต่างๆ มารันฟังก์ชั่นแล้วส่งข้อมูลกลับไปให้ AI ตอบคำถามอีกทีหนึ่ง

By arjin Writer on Tag: Amazon, Artificial Intelligence, LLM
Amazon

Amazon เริ่มขยับสู่วงการ AI สร้างเนื้อหาหรือ Generative AI แล้ว โดยบริษัทเริ่มทดสอบฟีเจอร์ใหม่ในแอป นำ AI มาเขียนสรุปรีวิวที่ผู้ใช้งานเขียนรีวิวให้บางสินค้า เนื้อหาสรุปนี้ทำให้เห็นภาพรวมของสินค้า และ Amazon จะขึ้นข้อความกำกับด้วยว่าเป็นเนื้อหาที่ใช้ AI สรุปรีวิวอีกที

ส่วนการสรุปรีวิวนี้ทำให้ลูกค้าที่กำลังพิจารณาสินค้าอยู่ ไม่ต้องไล่อ่านทีละรีวิวทั้งหมด เพราะ AI จะสรุปมาให้เลยว่าลูกค้าส่วนใหญ่ชอบอะไร และเขียนรีวิวแง่ลบด้านใดบ้าง

By lew Founder on Tag: Artificial Intelligence, LLM, Open Source
Artificial Intelligence

Together บริษัทปัญญาประดิษฐ์ เปิดตัวโมเดลปัญญาประดิษฐ์ RedPajama 7B โมเดล LLM ขนาดเล็กที่มีคะแนนทดสอบชุดทดสอบ HELM เฉลี่ยสูงกว่า LLaMA ของ Meta และยังเปิดไลเซนส์ให้ใช้งานแบบ Apache 2.0 ที่ใช้งานได้ค่อนข้างอิสระ

ก่อนหน้านี้โมเดลปัญญาประดิษฐ์ขนาดใกล้เคียงกันที่เปิดให้ใช้งานได้อิสระมีมาแล้วหลายตัว เช่น MPT-7B หรือ Falcon 7B แต่โมเดลเหล่านี้ก็ยังทำคะแนนทดสอบสู้ LLaMA ของ Meta ที่ปล่อยออกมาให้ใช้สำหรับงานวิจัยเท่านั้นไม่ได้

By arjin Writer on Tag: WordPress, Automattic, Artificial Intelligence, LLM
WordPress

WordPress ประกาศเครื่องมือส่วนเสริมตัวใหม่ Jetpack AI Assistant ที่จะเพิ่มความสามารถให้กับเว็บไซต์ WordPress มากยิ่งขึ้น โดยเปิดให้ใช้งานแล้วทั้งบน WordPress.com และเว็บไซต์ที่มีเครื่องมือของ Jetpack

Automattic บริษัทแม่ของ WordPress.com อธิบายว่าเครื่องมือ Jetpack AI Assistant นี้จะเป็นส่วนหนึ่งของตัว Editor ใน WordPress ที่นำ AI มาช่วยทุ่นเวลาในการสร้างสรรค์เนื้อหาตามคำสั่ง เช่น ป้อน prompt ให้เขียนลิสต์สถานที่ท่องเที่ยวที่ต้องไปในโตเกียว พร้อมเขียนตารางอัตราแลกเปลี่ยนเงิน ก็จะได้เนื้อหาออกมาตามคำสั่งทันที

By arjin Writer on Tag: Bard, LLM, Google, Artificial Intelligence
Bard

กูเกิลประกาศเพิ่มความสามารถใหม่ให้แชตบอท Bard โดยรอบนี้เป็นการปรับปรุงความสามารถด้านคณิตศาสตร์และการวิเคราะห์ข้อมูล

โดยความสามารถแรก Bard สามารถตรวจสอบ prompt ที่ต้องอาศัยการคำนวณได้ การทำงานจะรันโค้ดเพื่อหาคำตอบโดยเฉพาะ ทำให้ตอบคำถามอย่างเช่น แยกตัวประกอบของตัวเลข, คำนวณอัตราดอกเบี้ย หรือสะกดคำกลับหลังได้ ทั้งนี้กูเกิลบอกว่า Bard อาจทำงานไม่ถูกต้องเสมอ ซึ่งยังต้องอาศัยฟีดแบ็กจากผู้ใช้งานเพื่อปรับปรุง

อีกความสามารถที่เพิ่มมา เมื่อ Bard สร้างคำตอบมาในรูปแบบตาราง ผู้ใช้งานสามารถส่งออกตารางนี้ไปยัง Google Sheets ได้เลย

By lew Founder on Tag: Artificial Intelligence, Chatbot, LLM
Artificial Intelligence

Technology Innovation Institute (TII) หน่วยงานวิจัยภายใต้รัฐบาลสหรัฐอาหรับเอมิเรตส์ปล่อยโมเดล Falcon 40B ที่เป็นโมเดลภาษาขนาดใหญ่ โดยทางสถาบันตัดสินใจยกเว้นการเก็บค่าใช้งานทั้งหมดแล้วปล่อยโมเดลเป็นสัญญาอนุญาตแบบ Apache 2.0 ซึ่งทำให้ผู้สนใจสามารถนำไปใช้งานได้อิสระ

ตัวโมเดล Falcon 40B ฝึกด้วยชุดข้อมูลขนาด 1 ล้านล้านโทเค็น ใช้ชิปกราฟิก 384 ชุดเป็นระยะเวลาสองเดือน โดยใช้ชุดข้อมูลจาก CommonCrawl แล้วลบข้อมูลซ้ำ, ข้อมูลที่สร้างโดยคอมพิวเตอร์, รวมถึงเนื้อหาสำหรับผู้ใหญ่ ออก คะแนนทดสอบตอนนี้ Falcon 40B นำ LLaMA 65B ที่มีขนาดใหญ่กว่าไปเสียอีก

By Chomsu Contributor on Tag: China, LLM, Artificial Intelligence, Chat Bot, OpenAI
China

องค์กรวิจัยของรัฐบาลจีนเปิดเผยรายงานว่า องค์กรจีนได้เปิดตัว large-language models (LLMs) ทั้งหมด 79 โมเดล ในประเทศช่วง 3 ปีที่ผ่านมา เพื่อเพิ่มการพัฒนาอัลกอริธึมของ AI ให้มากยิ่งขึ้น

รายงานได้บอกว่า การพัฒนา LLMs ต้องใช้การเทรนด้วยเทคนิคการเรียนรู้เชิงลึกกับข้อมูลจำนวนมหาศาลและถูกเร่งพัฒนาเร็วมากขึ้นเมื่อเข้าสู่ช่วงปี 2020

By arjin Writer on Tag: LINE, LLM, Artificial Intelligence
LINE

LINE ประกาศฟีเจอร์ใหม่ที่ใช้ความสามารถของ AI สร้างเนื้อหาหรือ Generative AI โดยผู้ใช้งานสามารถสร้างรูปโปรไฟล์ขึ้นมาด้วย AI Selfie ซึ่งใช้งานได้ผ่านส่วนการแก้ไขรูปโปรไฟล์

AI Selfie เป็นส่วนหนึ่งของแพลตฟอร์ม LINE Profile Studio ที่สามารถสร้างรูปโปรไฟล์หลากหลายรูปแบบด้วย AI โดยอาศัยข้อมูลพื้นฐานเล็กน้อย ซึ่งผู้ใช้งานต้องอัปโหลดรูปเซลฟี่หรือรูปที่เห็นใบหน้าชัดเจน ประมาณ 10-20 รูป แล้วเลือกแพ็คเกจสร้างรูปภาพจาก AI โดยรูปที่ได้จะมีหลากหลายธีม ทั้งภาพปกติ ภาพธีมแฟนตาซี หรือภาพวาด

Dell Technologies

Dell Technologies และ NVIDIA ประกาศความร่วมมือในโครงการชื่อว่า Project Helix เพื่อให้องค์กรสามารถรันซอฟต์แวร์ AI สร้างเนื้อหาหรือ Generative AI ใช้งานเองได้ภายในองค์กรแบบออนพรีมิส ซึ่งช่วยปกป้องข้อมูลขององค์กร ที่เป็นข้อกังวลสำคัญของการนำ AI มาใช้งาน

ชุดเครื่องมือของ Project Helix ประกอบด้วยเซิร์ฟเวอร์ของ Dell พร้อมซอฟต์แวร์บริหารจัดการ เช่นตระกูล PowerEdge XE9680 หรือ PowerEdge R760xa ติดตั้งชิป NVIDIA H100 Tensor Core GPUและซอฟต์แวร์ของ NVIDIA มาพร้อมรองรับการเทรน AI และสร้างยูสเคส

Google

กูเกิลเปิดตัวเครื่องมือสำหรับผู้ลงโฆษณาชุดใหม่ ที่ใช้ Generative AI มาช่วยปรับปรุงเนื้อหาโฆษณาให้สะดวกมากขึ้น ในงาน Google Marketing Live ที่จัดในซานฟรานซิสโก

เครื่องมือชุดแรกเป็นตัวช่วยสรุปเนื้อหาจากหน้าแลนดิ้งเพจ โดย Google AI จะสรุปคีย์เวิร์ด หัวข้อ คำอธิบาย และสิ่งต่าง ๆ ที่พบในหน้านั้น พร้อมระบบคำแนะนำในการตั้งค่าแคมเปญผ่านแชท และเพิ่มความสามารถระบบสร้าง Assets อัตโนมัติ (ACA) ซึ่งสามารถปรับคำหัวข้อ ให้ไปสอดคล้องกับคำที่ผู้ใช้งานเสิร์ชได้มากขึ้น (ดูตัวอย่างท้ายข่าว)

By arjin Writer on Tag: Neeva, Search Engine, LLM
Neeva

Neeva เสิร์ชเอ็นจินแนวคิดใหม่จากอดีตผู้บริหารกูเกิล ที่ให้ผู้ใช้งานจ่ายค่าสมาชิกรายเดือน เพื่อแลกกับผลค้นหาไม่มีโฆษณาและเป็นออร์แกนิคมากขึ้น ประกาศปิดให้บริการส่วนเสิร์ชสำหรับผู้ใช้งานทั่วไป โดยให้เหตุผลว่าการหายูสเซอร์ด้วยวิธีการนี้ยากมาก ๆ

Sridhar Ramaswamy และ Vivek Raghunathan สองผู้ร่วมก่อตั้ง Neeva บอกว่า นอกจากนี้ยังพบว่าปัญหาเศรษฐกิจโลกที่ผันผวนส่งผลกระทบด้วย ทำให้เสิร์ชสำหรับลูกค้าทั่วไป หากทำธุรกิจด้วยโมเดลดังกล่าวมีความไม่ยั่งยืน

By mk Founder on Tag: Google, LLM, Artificial Intelligence
Google

CNBC ได้เอกสารภายในของกูเกิล เผยรายละเอียดของโมเดล PaLM 2 ตัวใหม่ของกูเกิล

ขนาดของโมเดล PaLM 2 เทรนด้วยข้อมูล (token หรือจำนวนคำ) รวม 3.6 ล้านล้านคำ และจำนวนพารามิเตอร์ 3.4 แสนล้านพารามิเตอร์ หากเทียบกับโมเดล PaLM เวอร์ชันแรกที่ใช้ข้อมูลเทรน 7.8 แสนล้านคำ และพารามิเตอร์ 5.4 แสนล้านพารามิเตอร์ จะเห็นว่าจำนวนพารามิเตอร์ของ PaLM 2 น้อยกว่า สอดคล้องกับที่กูเกิลประกาศในงาน Google I/O ว่าโมเดลใหญ่กว่าไม่ได้ดีกว่าเสมอไป โดยกูเกิลใช้เทคนิคเรียกว่า compute-optimal scaling ช่วยลดจำนวนพารามิเตอร์และต้นทุนในการประมวลผลลง

Subscribe to LLM