LLM | Blognone

Large Language Model

นักพัฒนาโวย ChatGPT ใน MDN ตอบคำถามสร้างความเข้าใจผิด

By lew

on 4 July 2023 - 09:30 Tag: MDN, LLM, ChatGPT

MDN

สัปดาห์ที่ผ่านมา MDN เว็บคลังเอกสารสำหรับนักพัฒนาเว็บ เปิดฟีเจอร์ AI Help สำหรับการถามตอบข้อมูลจากเอกสารในเว็บ และ AI Explain สำหรับอธิบายโค้ด โดยใช้ API จาก OpenAI ในการประมวลผล ตอนนี้เหล่านักพัฒนาก็กำลังโวยว่าฟีเจอร์นี้สร้างความเข้าใจผิด อธิบายเนื้อหาผิดพลาด หรือหากสร้างตัวอย่างได้ก็มักเป็นตัวอย่างง่ายๆ เท่านั้น

นักพัฒนาหลายคนยกตัวอย่าง คำอธิบายของ AI Help ที่ตอบผิด บางฟีเจอร์เป็นฟังก์ชั่นมาตรฐานของ CSS แต่ AI ก็ตอบว่าไม่ใช่มาตรฐาน บางทีก็ตอบตรงข้ามกับเนื้อหาในเอกสารไปเลย

Salesforce โชว์ปัญญาประดิษฐ์ XGen-7B คุณภาพสูงสุดในกลุ่มโอเพนซอร์ส

By lew

on 29 June 2023 - 21:43 Tag: Salesforce, Artificial Intelligence, LLM

Salesforce

Salesforce AI Research ประกาศผลงานการฝึกปัญญาประดิษฐ์ XGen-7B เป็นปัญญาประดิษฐ์แบบโอเพนซอร์สที่สามารถใช้งานได้อิสระ โดยชูจุดเด่นที่คุณภาพสูงเหนือปัญญาประดิษฐ์ในกลุ่มโอเพนซอร์สด้วยกัน เช่น MPT-7B หรือ Falcon-7B

XGen-7B เทรนบนชิป TPU-v4 ของ Google Cloud ต้นทุนต่อการเทรนด้วยข้อมูล 1 ล้านล้านโทเค็นอยู่ที่ 150,000 ดอลลาร์

MLPerf ประกาศผลทดสอบการฝึก AI ภาพรวมเร็วขึ้น 1.54 เท่าตัว เริ่มทดสอบฝึก LLM ครั้งแรก

By lew

on 28 June 2023 - 01:11 Tag: Artificial Intelligence, LLM, NVIDIA, Intel, CoreWeave

Artificial Intelligence

MLCommons หน่วยงานกลางสำหรับการจัดอันดับประสิทธิภาพคอมพิวเตอร์ในงานด้าน machine learning ประกาศผล MLPerf Training 3.0 แสดงประสิทธิภาพของการฝึกโมเดลปัญญาประดิษฐ์รูปแบบต่างๆ มีผู้ส่งระบบเข้าร่วม 250 ระบบ จากผู้ผลิตหรือคลาวด์รวม 16 ราย ภาพรวมแล้วระบบต่างๆ เร็วขึ้นกว่าการทดสอบรอบก่อนหน้านี้ 1.54 เท่าตัว ความพิเศษของรอบนี้คือมีการทดสอบฝึก GPT-3 เข้ามาด้วย เพื่อดูประสิทธิภาพของการฝึก LLM และรอบนี้มีเฉพาะ NVIDIA และ Intel เท่านั้นที่ส่งผลเข้ามา

Baidu โชว์ ERNIE 3.5 เพิ่มฟีเจอร์ปลั๊กอิน แข่งภาษาจีนชนะ GPT-4, ภาษาอังกฤษใกล้เคียง GPT-3.5

By lew

on 27 June 2023 - 23:18 Tag: Baidu, LLM

Baidu

Baidu ประกาศว่าเริ่มปล่อย ERNIE 3.5 ปัญญาประดิษฐ์ภาษาขนาดใหญ่ (LLM) ให้ผู้ได้รับสิทธิ์ทดสอบได้เริ่มใช้งานแล้ว โดยผลทดสอบ AGIEval ของไมโครซอฟท์ และ C-EVAL ของนักวิจัยจีนแสดงให้เห็นว่า ERNIE 3.5 เริ่มมีประสิทธิภาพใกล้เคียง ChatGPT ที่ใช้ GPT-3.5 และเมื่อแยกเฉพาะชุดทดสอบภาษาจีนเอง ERNIE 3.5 ทำคะแนนทดสอบได้ดีกว่า GPT-4

ซีอีโอ DeepMind เผย Gemini จะเป็นโมเดล AI สำหรับแชทบอต ที่พัฒนาด้วยวิธีแบบ AlphaGo

By arjin

on 27 June 2023 - 06:42 Tag: DeepMind, Artificial Intelligence, LLM, Chatbot, Google, Gemini

DeepMind

Demis Hassabis ผู้ร่วมก่อตั้งและซีอีโอ DeepMind ให้ข้อมูลล่าสุดของโมเดล AI ที่ชื่อ Gemini ซึ่งตอนนี้อยู่ในขั้นตอนการพัฒนา และเป็นโมเดลแบบ Large Language ประเภทเดียวกับ GPT-4 ของ OpenAI ที่ปัจจุบันเป็น AI เบื้องหลังแชทบอต ChatGPT

Databricks เข้าซื้อ MosaicML ผู้สร้างปัญญาประดิษฐ์โอเพนซอร์ส MPT-7B

By lew

on 26 June 2023 - 22:24 Tag: Databricks, Artificial Intelligence, LLM

Databricks

Databricks ผู้ให้บริการแพลตฟอร์มข้อมูล เข้าซื้อบริษัท MosaicML แพลตฟอร์มการเทรนและรันโมเดลปัญญาประดิษฐ์ ผู้สร้างโมเดลโอเพนซอร์ส MPT-7B และ MPT-30B ที่สามารถใช้งานในองค์กรได้

ซอฟต์แวร์ของ MosaicML ช่วยให้การฝึกปัญญาประดิษฐ์ขนาดใหญ่ใช้เวลาน้อยลง และรับมือกับปัญหาที่เกิดขึ้น เช่น บางเครื่องในระบบตายไประหว่างการฝึกได้ ทาง Databricks บอกแนวทางชัดเจนว่าจะใช้เทคโนโลยีของ MosaicML มารวมไว้ใน Databricks Lakehouse Platform เพื่อให้องค์กรสามารถฝึกโมเดลปัญญาประดิษฐ์ได้ด้วยตัวเอง

IBM นำ Generative AI มาใช้ในเทนนิส Wimbledon ตัดไฮไลท์พร้อมเสียงบรรยายอัตโนมัติ

By arjin

on 23 June 2023 - 07:30 Tag: IBM, Wimbledon, Sport, LLM, Artificial Intelligence, Watson, Tennis

IBM

ไอบีเอ็มประกาศนำเทคโนโลยี Generative AI หรือ AI สร้างเนื้อหาอัตโนมัติจาก IBM watsonx มาใช้กับการแข่งขันเทนนิสวิมเบิลดัน ในการสร้างวิดีโอไฮไลท์การแข่งขันแต่ละแมตช์พร้อมเสียงพากย์ ซึ่งถือเป็นครั้งแรกในการแข่งขันเทนนิส

ในวิดีโอไฮไลท์ซึ่งสามารถรับชมได้ผ่านแอป Wimbledon หรือทางเว็บไซต์ wimbledon.com จะมีเสียงบรรยายในช่วงสำคัญของการแข่งขัน พร้อมกับตัวหนังสือคำบรรยาย ซึ่งผู้ชมสามารถเลือกปิด-เปิดส่วนนี้ได้ ทั้งนี้ส่วนไฮไลท์ที่สร้างด้วย AI จะเป็นส่วนเสริมเข้ามา โดยไฮไลท์แบบเดิมที่ใช้คนบรรยายของ Show Courts จะยังมีอยู่เหมือนเดิม

Mercedes-Benz เตรียมนำ ChatGPT มาใช้กับระบบสั่งงานด้วยเสียง

By lew

on 17 June 2023 - 12:01 Tag: Mercedes-Benz, LLM, OpenAI, Microsoft Azure, ChatGPT

Mercedes-Benz

Mercedes-Benz ประกาศเพิ่มฟีเจอร์ของ MBUX Voice Assistant ผู้ช่วยสั่งงานในรถด้วยเสียง ให้ใช้ความสามารถของ ChatGPT เพิ่มเข้ามาเพื่อรองรับคำสั่งที่หลากหลายกว่าเดิม

MBUX Voice Assistant เป็นผู้ช่วยในรถที่เรียกใช้ด้วยคำสั่ง “Hey Mercedes” โดยปกติแล้วผู้ช่วยในกลุ่มนี้ก็มักรับคำสั่งได้จำกัดตามที่ออกแบบไว้ แต่การใช้ ChatGPT เข้ามาจะช่วยให้ผู้ใช้ถามคำถามที่ซับซ้อนกว่าเดิม รวมถึงการขอรายละเอียดจุดหมายปลายทาง หรือการถามนอกเรื่องอย่างสูตรอาหาร

ทาง Mercedes-Benz ใช้โมเดลของ OpenAI ผ่านทาง Azure OpenAI Service ส่วนข้อมูลเสียงจะเก็บรักษาโดย Mercedes-Benz เอง

OpenAI เพิ่มฟีเจอร์ใส่ฟังก์ชั่นให้ AI เรียกใช้ เปิดทางพัฒนา AI ร่วมกับระบบภายในได้ง่ายขึ้น, ลดราคาหลายโมเดล

By lew

on 14 June 2023 - 00:34 Tag: OpenAI, LLM

OpenAI

OpenAI เปิดโมเดล GPT-3.5 (ChatGPT) และ GPT-4 เวอร์ชั่น 0613 ของเดือนนี้ โดยมีฟีเจอร์สำคัญคือการเปิดให้โมเดลสามารถร้องของข้อมูลภายนอกจากฟังก์ชั่นที่เรากำหนดให้ได้ ผ่านทาง Chat Completion API

นักพัฒนาต้องกำหนดข้อมูลฟังก์ชั่นที่ต้องการเรียกส่งไปพร้อมกับคำถามของผู้ใช้ เช่น กำหนดฟังก์ชั่นคิวรีสภาพอากาศปัจจุบัน เมื่อผู้ใช้ถามถึงสภาพอากาศ ค่าตอบกลับจาก Chat Completion API จะระบุว่า AI ต้องการเรียกฟังก์ชั่น แล้วนำอาร์กิวเมนต์ต่างๆ มารันฟังก์ชั่นแล้วส่งข้อมูลกลับไปให้ AI ตอบคำถามอีกทีหนึ่ง

Amazon ทดสอบใช้ Generative AI มาเขียนสรุปรีวิวสินค้าจากผู้ใช้งาน ไม่ต้องอ่านทีละรีวิว

By arjin

on 13 June 2023 - 18:17 Tag: Amazon, Artificial Intelligence, LLM

Amazon

Amazon เริ่มขยับสู่วงการ AI สร้างเนื้อหาหรือ Generative AI แล้ว โดยบริษัทเริ่มทดสอบฟีเจอร์ใหม่ในแอป นำ AI มาเขียนสรุปรีวิวที่ผู้ใช้งานเขียนรีวิวให้บางสินค้า เนื้อหาสรุปนี้ทำให้เห็นภาพรวมของสินค้า และ Amazon จะขึ้นข้อความกำกับด้วยว่าเป็นเนื้อหาที่ใช้ AI สรุปรีวิวอีกที

ส่วนการสรุปรีวิวนี้ทำให้ลูกค้าที่กำลังพิจารณาสินค้าอยู่ ไม่ต้องไล่อ่านทีละรีวิวทั้งหมด เพราะ AI จะสรุปมาให้เลยว่าลูกค้าส่วนใหญ่ชอบอะไร และเขียนรีวิวแง่ลบด้านใดบ้าง

บริษัท AI เปิดโมเดล RedPajama 7B ชนะ LLaMA ของ Meta ที่ขนาดเท่ากัน เปิดให้ใช้งานฟรี

By lew

on 8 June 2023 - 13:31 Tag: Artificial Intelligence, LLM, Open Source

Artificial Intelligence

Together บริษัทปัญญาประดิษฐ์ เปิดตัวโมเดลปัญญาประดิษฐ์ RedPajama 7B โมเดล LLM ขนาดเล็กที่มีคะแนนทดสอบชุดทดสอบ HELM เฉลี่ยสูงกว่า LLaMA ของ Meta และยังเปิดไลเซนส์ให้ใช้งานแบบ Apache 2.0 ที่ใช้งานได้ค่อนข้างอิสระ

ก่อนหน้านี้โมเดลปัญญาประดิษฐ์ขนาดใกล้เคียงกันที่เปิดให้ใช้งานได้อิสระมีมาแล้วหลายตัว เช่น MPT-7B หรือ Falcon 7B แต่โมเดลเหล่านี้ก็ยังทำคะแนนทดสอบสู้ LLaMA ของ Meta ที่ปล่อยออกมาให้ใช้สำหรับงานวิจัยเท่านั้นไม่ได้

WordPress ออกส่วนเสริมใหม่ Jetpack AI Assistant ช่วยในการเขียนเนื้อหา

By arjin

on 8 June 2023 - 07:12 Tag: WordPress, Automattic, Artificial Intelligence, LLM

WordPress

WordPress ประกาศเครื่องมือส่วนเสริมตัวใหม่ Jetpack AI Assistant ที่จะเพิ่มความสามารถให้กับเว็บไซต์ WordPress มากยิ่งขึ้น โดยเปิดให้ใช้งานแล้วทั้งบน WordPress.com และเว็บไซต์ที่มีเครื่องมือของ Jetpack

Automattic บริษัทแม่ของ WordPress.com อธิบายว่าเครื่องมือ Jetpack AI Assistant นี้จะเป็นส่วนหนึ่งของตัว Editor ใน WordPress ที่นำ AI มาช่วยทุ่นเวลาในการสร้างสรรค์เนื้อหาตามคำสั่ง เช่น ป้อน prompt ให้เขียนลิสต์สถานที่ท่องเที่ยวที่ต้องไปในโตเกียว พร้อมเขียนตารางอัตราแลกเปลี่ยนเงิน ก็จะได้เนื้อหาออกมาตามคำสั่งทันที

Bard เพิ่มความสามารถใหม่ ตอบคำถามคณิตศาสตร์ คำถามที่เป็นลอจิก ได้ดีมากขึ้น

By arjin

on 8 June 2023 - 06:26 Tag: Bard, LLM, Google, Artificial Intelligence

Bard

กูเกิลประกาศเพิ่มความสามารถใหม่ให้แชตบอท Bard โดยรอบนี้เป็นการปรับปรุงความสามารถด้านคณิตศาสตร์และการวิเคราะห์ข้อมูล

โดยความสามารถแรก Bard สามารถตรวจสอบ prompt ที่ต้องอาศัยการคำนวณได้ การทำงานจะรันโค้ดเพื่อหาคำตอบโดยเฉพาะ ทำให้ตอบคำถามอย่างเช่น แยกตัวประกอบของตัวเลข, คำนวณอัตราดอกเบี้ย หรือสะกดคำกลับหลังได้ ทั้งนี้กูเกิลบอกว่า Bard อาจทำงานไม่ถูกต้องเสมอ ซึ่งยังต้องอาศัยฟีดแบ็กจากผู้ใช้งานเพื่อปรับปรุง

อีกความสามารถที่เพิ่มมา เมื่อ Bard สร้างคำตอบมาในรูปแบบตาราง ผู้ใช้งานสามารถส่งออกตารางนี้ไปยัง Google Sheets ได้เลย

สถาบันวิจัยของสหรัฐอาหรับเอมิเรตส์ปล่อยโมเดล Falcon 40B เป็นโอเพนซอร์ส คะแนนนำ LLaMA ของ Meta

By lew

on 2 June 2023 - 00:57 Tag: Artificial Intelligence, Chatbot, LLM

Artificial Intelligence

Technology Innovation Institute (TII) หน่วยงานวิจัยภายใต้รัฐบาลสหรัฐอาหรับเอมิเรตส์ปล่อยโมเดล Falcon 40B ที่เป็นโมเดลภาษาขนาดใหญ่ โดยทางสถาบันตัดสินใจยกเว้นการเก็บค่าใช้งานทั้งหมดแล้วปล่อยโมเดลเป็นสัญญาอนุญาตแบบ Apache 2.0 ซึ่งทำให้ผู้สนใจสามารถนำไปใช้งานได้อิสระ

ตัวโมเดล Falcon 40B ฝึกด้วยชุดข้อมูลขนาด 1 ล้านล้านโทเค็น ใช้ชิปกราฟิก 384 ชุดเป็นระยะเวลาสองเดือน โดยใช้ชุดข้อมูลจาก CommonCrawl แล้วลบข้อมูลซ้ำ, ข้อมูลที่สร้างโดยคอมพิวเตอร์, รวมถึงเนื้อหาสำหรับผู้ใหญ่ ออก คะแนนทดสอบตอนนี้ Falcon 40B นำ LLaMA 65B ที่มีขนาดใหญ่กว่าไปเสียอีก

องค์กรจีนเปิดตัว AI โมเดลภาษาขนาดใหญ่ไปแล้วทั้งหมด 79 โมเดล ตั้งแต่ปี 2020

By Chomsu

on 31 May 2023 - 11:34 Tag: China, LLM, Artificial Intelligence, Chat Bot, OpenAI

China

องค์กรวิจัยของรัฐบาลจีนเปิดเผยรายงานว่า องค์กรจีนได้เปิดตัว large-language models (LLMs) ทั้งหมด 79 โมเดล ในประเทศช่วง 3 ปีที่ผ่านมา เพื่อเพิ่มการพัฒนาอัลกอริธึมของ AI ให้มากยิ่งขึ้น

รายงานได้บอกว่า การพัฒนา LLMs ต้องใช้การเทรนด้วยเทคนิคการเรียนรู้เชิงลึกกับข้อมูลจำนวนมหาศาลและถูกเร่งพัฒนาเร็วมากขึ้นเมื่อเข้าสู่ช่วงปี 2020

LINE เพิ่มฟีเจอร์ AI Selfie สร้างรูปโปรไฟล์ด้วย Generative AI

By arjin

on 30 May 2023 - 12:17 Tag: LINE, LLM, Artificial Intelligence

LINE

LINE ประกาศฟีเจอร์ใหม่ที่ใช้ความสามารถของ AI สร้างเนื้อหาหรือ Generative AI โดยผู้ใช้งานสามารถสร้างรูปโปรไฟล์ขึ้นมาด้วย AI Selfie ซึ่งใช้งานได้ผ่านส่วนการแก้ไขรูปโปรไฟล์

AI Selfie เป็นส่วนหนึ่งของแพลตฟอร์ม LINE Profile Studio ที่สามารถสร้างรูปโปรไฟล์หลากหลายรูปแบบด้วย AI โดยอาศัยข้อมูลพื้นฐานเล็กน้อย ซึ่งผู้ใช้งานต้องอัปโหลดรูปเซลฟี่หรือรูปที่เห็นใบหน้าชัดเจน ประมาณ 10-20 รูป แล้วเลือกแพ็คเกจสร้างรูปภาพจาก AI โดยรูปที่ได้จะมีหลากหลายธีม ทั้งภาพปกติ ภาพธีมแฟนตาซี หรือภาพวาด

Dell และ NVIDIA ประกาศความร่วมมือ Project Helix โซลูชัน Generative AI สำหรับลูกค้าองค์กร

By arjin

on 24 May 2023 - 12:52 Tag: Dell Technologies, NVIDIA, Artificial Intelligence, Enterprise, LLM

Dell Technologies

Dell Technologies และ NVIDIA ประกาศความร่วมมือในโครงการชื่อว่า Project Helix เพื่อให้องค์กรสามารถรันซอฟต์แวร์ AI สร้างเนื้อหาหรือ Generative AI ใช้งานเองได้ภายในองค์กรแบบออนพรีมิส ซึ่งช่วยปกป้องข้อมูลขององค์กร ที่เป็นข้อกังวลสำคัญของการนำ AI มาใช้งาน

ชุดเครื่องมือของ Project Helix ประกอบด้วยเซิร์ฟเวอร์ของ Dell พร้อมซอฟต์แวร์บริหารจัดการ เช่นตระกูล PowerEdge XE9680 หรือ PowerEdge R760xa ติดตั้งชิป NVIDIA H100 Tensor Core GPUและซอฟต์แวร์ของ NVIDIA มาพร้อมรองรับการเทรน AI และสร้างยูสเคส

Google เปิดตัวชุดเครื่องมือสำหรับผู้ลงโฆษณา Google Ad ที่นำ AI มาช่วยสร้างเนื้อหา

By arjin

on 24 May 2023 - 07:52 Tag: Google, Advertising, Artificial Intelligence, Digital Marketing, LLM

Google

กูเกิลเปิดตัวเครื่องมือสำหรับผู้ลงโฆษณาชุดใหม่ ที่ใช้ Generative AI มาช่วยปรับปรุงเนื้อหาโฆษณาให้สะดวกมากขึ้น ในงาน Google Marketing Live ที่จัดในซานฟรานซิสโก

เครื่องมือชุดแรกเป็นตัวช่วยสรุปเนื้อหาจากหน้าแลนดิ้งเพจ โดย Google AI จะสรุปคีย์เวิร์ด หัวข้อ คำอธิบาย และสิ่งต่าง ๆ ที่พบในหน้านั้น พร้อมระบบคำแนะนำในการตั้งค่าแคมเปญผ่านแชท และเพิ่มความสามารถระบบสร้าง Assets อัตโนมัติ (ACA) ซึ่งสามารถปรับคำหัวข้อ ให้ไปสอดคล้องกับคำที่ผู้ใช้งานเสิร์ชได้มากขึ้น (ดูตัวอย่างท้ายข่าว)

Neeva เสิร์ชเอ็นจินแบบจ่ายค่าสมาชิก ประกาศปิดบริการเสิร์ชดั้งเดิม เปลี่ยนมาเน้นเสิร์ชด้วย AI แทน

By arjin

on 21 May 2023 - 09:17 Tag: Neeva, Search Engine, LLM

Neeva

Neeva เสิร์ชเอ็นจินแนวคิดใหม่จากอดีตผู้บริหารกูเกิล ที่ให้ผู้ใช้งานจ่ายค่าสมาชิกรายเดือน เพื่อแลกกับผลค้นหาไม่มีโฆษณาและเป็นออร์แกนิคมากขึ้น ประกาศปิดให้บริการส่วนเสิร์ชสำหรับผู้ใช้งานทั่วไป โดยให้เหตุผลว่าการหายูสเซอร์ด้วยวิธีการนี้ยากมาก ๆ

Sridhar Ramaswamy และ Vivek Raghunathan สองผู้ร่วมก่อตั้ง Neeva บอกว่า นอกจากนี้ยังพบว่าปัญหาเศรษฐกิจโลกที่ผันผวนส่งผลกระทบด้วย ทำให้เสิร์ชสำหรับลูกค้าทั่วไป หากทำธุรกิจด้วยโมเดลดังกล่าวมีความไม่ยั่งยืน

หลุดเอกสารภายในกูเกิล เผยโมเดล PaLM 2 ขนาด 3.4 แสนล้านพารามิเตอร์ เล็กกว่า PaLM 1

By mk

on 18 May 2023 - 20:11 Tag: Google, LLM, Artificial Intelligence

Google

CNBC ได้เอกสารภายในของกูเกิล เผยรายละเอียดของโมเดล PaLM 2 ตัวใหม่ของกูเกิล

ขนาดของโมเดล PaLM 2 เทรนด้วยข้อมูล (token หรือจำนวนคำ) รวม 3.6 ล้านล้านคำ และจำนวนพารามิเตอร์ 3.4 แสนล้านพารามิเตอร์ หากเทียบกับโมเดล PaLM เวอร์ชันแรกที่ใช้ข้อมูลเทรน 7.8 แสนล้านคำ และพารามิเตอร์ 5.4 แสนล้านพารามิเตอร์ จะเห็นว่าจำนวนพารามิเตอร์ของ PaLM 2 น้อยกว่า สอดคล้องกับที่กูเกิลประกาศในงาน Google I/O ว่าโมเดลใหญ่กว่าไม่ได้ดีกว่าเสมอไป โดยกูเกิลใช้เทคนิคเรียกว่า compute-optimal scaling ช่วยลดจำนวนพารามิเตอร์และต้นทุนในการประมวลผลลง

Subscribe to LLM