LLM | Blognone

Large Language Model

เปิดตัว Duet AI สำหรับ Google Workspace รองรับชุดใหญ่ทั้ง Docs, Slides, Docs

By nismod

on 11 May 2023 - 17:09 Tag: Google Workspace, Google, Artificial Intelligence, LLM

Google Workspace

เมื่อเดือนมีนาคมที่ผ่านมา Google เปิดตัว Generative AI ที่นำมาใช้งานบน Google Workspace และเมื่อคืนในงาน Google I/O ที่ผ่านมา Google ประกาศฟีเจอร์ให้เพิ่มเติม พร้อมแบรนดิ้งตัวปัญญาประดิษฐ์แล้วในชื่อ Duet AI

โดยของใหม่ของ Duet AI ที่เปิดตัวเมื่อคืนนี้มีดังนี้

กูเกิลเผยข้อมูล Gemini โมเดลปัญญาประดิษฐ์รุ่นถัดไป

By mk

on 11 May 2023 - 14:12 Tag: Google, Artificial Intelligence, LLM, Gemini

Google

Sundar Pichai เปิดเผยในงาน Google I/O ว่ากูเกิลเริ่มพัฒนาโมเดล AI ตัวใหม่แล้ว ใช้ชื่อว่า Gemini

Gemini เป็นโมเดลพื้นฐาน (foundational model) ที่พัฒนาขึ้นมาใหม่ทั้งหมด มีประสิทธิภาพสูง ตอนนี้ยังอยู่ระหว่างการเทรน และหลังจากนี้จะปรับจูนเพื่อนำมาใช้งานจริงต่อไป

Google Cloud เปิด PaLM API ให้ใช้งานฟรีช่วงพรีวิว

By lew

on 11 May 2023 - 12:59 Tag: LLM, Google Cloud, Google

LLM

กูเกิลเปิด PaLM 2 ไปเมื่อวานนี้ ตอนนี้ก็เริ่มปล่อย API ฝั่งคลาวด์ออกมา ความพิเศษคือกูเกิลปล่อยช่วงพรีวิวให้ใช้งานได้ฟรี โดยโมเดลที่เปิดให้ใช้งานมี 3 โมเดล ได้แก่

Google เปิดตัว PaLM 2, AI ภาษารองรับกว่า 100 ภาษา รันได้แม้ในโทรศัพท์มือถือ

By lew

on 10 May 2023 - 23:52 Tag: Google, Artificial Intelligence, LLM

Google

กูเกิลเปิดตัว PaLM 2 ปัญญาประดิษฐ์ภาษาขนาดใหญ่รุ่นล่าสุดที่กูเกิลระบุว่าเป็นโมเดลที่ดีที่สุดในตอนนี้ โดยไม่ได้ระบุขนาดโมเดล แต่บอกว่าการศึกษาภายในพบว่าโมเดลที่ใหญ่ที่สุดไม่ได้ดีที่สุดเสมอไป และการที่ PaLM 2 ขนาดเล็กกว่าเป็นข้อดีเพราะรันได้เร็วกว่า และมีประสิทธิภาพสูงกว่า โดยฟีเจอร์สำคัญ 3 ด้านของ PaLM 2 ได้แก่

MosaicML เปิดตัวโมเดลปัญญาประดิษฐ์ MPT-7B ใกล้เคียง LLaMA ของเฟซบุ๊กแต่เป็นโอเพนซอร์ส

By lew

on 7 May 2023 - 22:35 Tag: Artificial Intelligence, Open Source, LLM

Artificial Intelligence

MosaicML บริการคลาวด์สำหรับปัญญาประดิษฐ์ ประกาศเปิดซอร์สของโมเดล MPT-7B โมเดลปัญญาประดิษฐ์ภาษาขนาดใหญ่ (LLM) แบบโอเพนซอร์สที่สามารถใช้งานเชิงการค้าได้เต็มรูปแบบ โดยมีขนาด 6,700 ล้านพารามิเตอร์ เทียบเท่ากับโมเดลเล็กที่สุดของ LLaMA ของ Meta/Facebook และคะแนนทดสอบใกล้เคียงกัน พร้อมกันฟีเจอร์สำคัญคือรองรับการประมวลผลข้อมูลขนาดใหญ่มาก

MPT-7B เป็นตระกูลปัญญาประดิษฐ์ที่มีหลายตัว ได้แก่

Google Cloud เปิดตัว Security AI Workbench ใช้โมเดลภาษา PaLM วิเคราะห์ข้อมูลความปลอดภัย

By mk

on 25 April 2023 - 07:29 Tag: Google Cloud, Security, Artificial Intelligence, Mandiant, Chronicle, VirusTotal, LLM

Google Cloud

กูเกิลเปิดตัวบริการความปลอดภัย Google Cloud Security AI Workbench ที่ใช้โมเดล Generative AI มาช่วยยกระดับประสิทธิภาพในการตรวจจับภัยคุกคาม

โมเดลที่ใช้งานคือ Sec-PaLM เป็นเวอร์ชันพิเศษของ PaLM โมเดลภาษาขนาดใหญ่ (LLM) ที่กูเกิลเปิดตัวเมื่อปีที่แล้ว และเริ่มนำมาใช้งานในวงกว้างขึ้นเรื่อยๆ (ล่าสุดคือเปิด API เชื่อมต่อแอพภายนอก)

Stability AI เปิดตัวโมเดลปัญญาประดิษฐ์ LLM ให้ใช้ฟรี เตรียมเปิดชุดข้อมูลด้วย

By lew

on 20 April 2023 - 09:44 Tag: Stability AI, Artificial Intelligence, Open Source, LLM

Stability AI

Stability AI ผู้สร้างโมเดล Stable Diffusion ปัญญาประดิษฐ์สร้างภาพ ประกาศเปิดตัว StableLM โมเดลปัญญาประดิษฐ์ด้านภาษา โดยมีขุดแข็งคือบริษัทเปิดให้ใช้งานทั้งสำหรับงานวิจัยและใช้งานเชิงการค้า

โมเดล StableLM มีขนาดเริ่มต้น 3 พันล้านและ 7 พันล้านพารามิเตอร์ และเตรียมจะปล่อยโมเดลขนาดใหญ่ขึ้นที่ 15 พันล้าน และ 65 พันล้านพารามิเตอร์ต่อไป ชุดข้อมูลที่ใช้ฝึกปัญญาประดิษฐ์พัฒนาจาก The Pile ที่มีขนาด 825GiB แต่ทาง Stability AI ขยายชุดข้อมูลจนมีขนาด 1.5 ล้านล้านโทเค็น และทางบริษัทเตรียมจะเปิดชุดข้อมูลให้ภายนอกใช้งานด้วย

รู้จัก Alpaca และ Koala โมเดล LLM ที่พัฒนาต่อจาก LLaMA ของ Meta, ขนาดเล็กกว่า GPT แต่แข่งขันได้

By mk

on 6 April 2023 - 11:59 Tag: Llama, Artificial Intelligence, Open Source, Meta, Research, Stanford, Berkeley, LLM

Llama

ถึงแม้ OpenAI เปลี่ยนมาใช้แนวทางปิด ไม่เปิดเผยรายละเอียดของโมเดล GPT-4 และฝั่งกูเกิลเองก็ยังค่อนข้างระมัดระวังในการปล่อย Bard ทีละนิด แต่โลกเราก็ยังมีโมเดลภาษาขนาดใหญ่ (Large Language Model หรือ LLM) ตัวอื่นให้ใช้งาน โดยเฉพาะ LLaMA ของ Meta ที่เปิดตัวในเดือนกุมภาพันธ์ 2023 ซึ่งเป็นโอเพนซอร์ส ใช้สัญญาอนุญาตแบบ GPLv3 และเปิดทางให้หน่วยงานวิจัยมาขอชุดข้อมูลที่ใช้เทรนไปศึกษาได้

โมเดลปัญญาประดิษฐ์ LLaMA ของ Meta หลุดออก Torrent แล้ว

By lew

on 4 March 2023 - 01:39 Tag: Llama, Meta, Artificial Intelligence, LLM

Llama

เมื่อสัปดาห์ที่ผ่านมา Meta เปิดตัว LLaMA ปัญญาประดิษฐ์ขนาดใหญ่สูงสุด 65 พันล้านพารามิเตอร์ โดยมีจุดเด่นคือ Meta แจกโมเดลที่ฝึกแล้วให้ไปใช้งานกันด้วย แต่จำกัดการใช้งานเฉพาะการศึกษาวิจัยเท่านั้น และนักวิจัยต้องไปขอใช้งานจาก Meta เป็นรายคน ล่าสุดก็มีคนที่ได้โมเดลไป นำโมเดลมาแจกบน torrent แล้ว

Microsoft เผยแพร่งานวิจัย Multimodal LLM เรียนรู้ อธิบาย ตอบคำถาม จากข้อมูลรูปภาพได้

By arjin

on 2 March 2023 - 17:40 Tag: Microsoft, Artificial Intelligence, Microsoft Research, LLM

Microsoft

ทีมงานนักวิจัยของไมโครซอฟท์ เผยแพร่งานวิจัย Kosmos-1 โมเดลสร้างภาษาบนข้อมูลสื่อผสมผสาน (Multimodal Large Language Model - MLLM) โดยสามารถเรียนรู้ข้อมูลทั้งตัวหนังสือ รูปภาพ แคปชันประกอบรูปภาพ มาประมวลผลจนสามารถให้ข้อมูลอธิบายได้ในหลากหลายมิติ

ตัวอย่างความสามารถของ Kosmos-1 ที่เผยแพร่ในงานวิจัย เช่น การตอบคำถามจากข้อมูลรูปภาพที่กำหนด ซึ่งโมเดลสามารถเข้าใจบริบทเรื่องราวที่มีอยู่ในภาพได้, สามารถแปลงข้อมูลตัวหนังสือในภาพ (OCR) เพื่อตอบคำถามได้, สามารถหารายละเอียดสำคัญในรูปภาพ และสืบค้นข้อมูลต่อได้ เป็นต้น

ไมโครซอฟท์เล่าเบื้องหลังโมเดล Prometheus เกิดขึ้นเพื่อแก้ปัญหาข้อมูลใน GPT เก่าเกินไป

By mk

on 26 February 2023 - 18:23 Tag: Bing, Microsoft, Artificial Intelligence, OpenAI, ChatGPT, Search Engine, LLM

Bing

Jordi Ribas ผู้บริหารฝ่าย Search & AI ของไมโครซอฟท์ เขียนบล็อกบน LinkedIn เล่ารายละเอียดของโมเดล Prometheus ที่ใช้ใน Bing เวอร์ชันใหม่เพิ่มอีกหน่อย

Ribas บอกว่าเมื่อกลางปี 2022 ทีม OpenAI โชว์โมเดล GPT เวอร์ชันใหม่ (ที่ยังไม่บอกว่า 4 แต่ใหม่กว่า 3.5) ให้ทีมไมโครซอฟท์ดู ทีมไมโครซอฟท์เห็นศักยภาพจึงเริ่มลงมือพัฒนาเพื่อใช้งานใน Bing แต่ข้อจำกัดของโมเดล LLM แนว GPT คือข้อมูลที่ใช้เทรนจะเก่าในระดับหนึ่ง ไม่มีวันเป็นข้อมูลเรียลไทม์ ไมโครซอฟท์จึงต้องแก้ปัญหาด้วยการนำข้อมูลเรียลไทม์จาก Bing เข้ามาเชื่อมกับ GPT และนี่คือ Prometheus

Meta เผยแพร่ LLaMA ชุดโมเดล AI สร้างภาษา LLM ที่พัฒนาขึ้นมา เพื่อให้ใช้ศึกษาวิจัยต่อ

By arjin

on 25 February 2023 - 07:49 Tag: Llama, Meta, Artificial Intelligence, Research, LLM

Llama

Meta เผยแพร่ชุดโมเดล AI สำหรับสร้างข้อความภาษา หรือ LLM (Large Language Model) โดยเรียกชื่อว่า LLaMA ย่อมาจาก Large Language Model Meta AI โดยมีเป้าหมายเพื่อให้องค์กรต่าง ๆ นำไปศึกษาวิจัยต่อ

LLM เป็นรูปแบบโมเดล AI สร้างข้อความ ที่ถูกนำมาใช้ในผลิตภัณฑ์แชตบอทที่เป็นกระแสในช่วงที่ผ่านมา ไม่ว่าจะเป็น ChatGPT, Bing Chat หรือ Bard ของกูเกิล และเป็นโมเดลที่มีการเปลี่ยนแปลงอย่างรวดเร็ว ต้องการทรัพยากรประมวลที่ใหญ่มาก ทำให้หลายองค์กรไม่มีโอกาสเข้าถึง โดย LLaMA ที่ Meta เผยแพร่มีหลายขนาดชุดข้อมูล ตั้งแต่ 7 พันล้านพารามิเตอร์ จนถึงชุด 65 พันล้านพารามิเตอร์

นักวิจัยไมโครซอฟท์เสนอ Language Model ขนาดเล็กสำหรับ Excel เน้นแนะนำ-แก้สูตรให้ผู้ใช้

By mk

on 6 February 2023 - 20:20 Tag: Excel, Artificial Intelligence, Microsoft, Research, LLM

Excel

ช่วงนี้ AI สายตระกูล Large Language Models (LLM) กำลังโด่งดังจากกระแส ChatGPT แต่ข้อเสียของโมเดลใหญ่ขนาดนี้คือขนาดของตัวมันเองที่ใหญ่มาก มีพารามิเตอร์หลักพันล้าน ใช้ข้อมูลการเทรน ทรัพยากรเครื่องจำนวนมหาศาล

ทีมนักวิจัยของไมโครซอฟท์จึงเสนอแนวทาง Language Model ที่มีขนาดเล็กลง แต่ทำงานเฉพาะด้านแทน โดยนำเสนองานวิจัย FLAME ที่ย่อมาจาก First LAnguage Model for Excel หน้าที่ของมันตรงตามชื่อคือเป็นโมเดลภาษาสำหรับ Excel ช่วยแนะนำหรือแก้ไขสูตรในตารางสเปรดชีท

กูเกิลเปิดตัว LaMDA 2 ปัญญาประดิษฐ์สนทนาเวอร์ชันใหม่ เตรียมเปิดเว็บให้ลองคุยโดยตรง

By mk

on 16 May 2022 - 11:43 Tag: Google, Artificial Intelligence, LLM

Google

ในงาน Google I/O สัปดาห์ที่ผ่านมา กูเกิลเปิดตัว LaMDA 2 ปัญญาประดิษฐ์เพื่อการสนทนา (conversation AI) เวอร์ชันอัพเกรดจาก LaMDA (Language Models for Dialog Applications) รุ่นแรกที่เปิดตัวในปี 2021

กูเกิลบอกว่า LaMDA 2 มีพารามิเตอร์มากกว่า 137 พันล้านรายการ เทรนด้วยข้อมูลขนาดใหญ่ 1.56 ล้านล้านคำ ได้โมเดลที่พัฒนาขึ้นจากเดิมใน 3 ด้านคือ

มันขำตรงไหน กูเกิลนำเสนอปัญญาประดิษฐ์ขนาดใหญ่ยักษ์ PaLM อธิบายมุกตลกได้แล้ว

By lew

on 5 April 2022 - 01:46 Tag: Google, Artificial Intelligence, LLM

Google

กูเกิลนำเสนอโมเดลปัญญาประดิษฐ์ PaLM โมเดลปัญญาประดิษฐ์ขนาด 540,000 ล้านพารามิเตอร์ โดยอาศัยสถาปัตยกรรม Pathway ที่ออกแบบมาให้ปัญญาประดิษฐ์ทำงานได้หลากหลายขึ้น

กูเกิลออกแบบ PaLM ไว้ 3 ขนาด ได้แก่ 8 พันล้านพารามิเตอร์, 64 พันล้านพารามิเตอร์, และ 540 พันล้านพารามิเตอร์ โดยพบว่าความสามารถของตัวปัญญาประดิษฐ์ขนาด 64 พันล้านพารามิเตอร์แซงหน้า GPT-3 ที่มีขนาด 175 พันล้านพารามิเตอร์ได้

กูเกิลสาธิตปัญญาประดิษฐ์ LaMDA รุ่นปรับปรุง คุยได้แทบเหมือนมนุษย์

By lew

on 19 May 2021 - 01:05 Tag: Google, Artificial Intelligence, LLM

Google

ในงาน Google I/O ปีนี้ กูเกิลสาธิตปัญญาประดิษฐ์ LaMDA ที่ออกแบบมาเพื่อบทสนทนาโดยเข้าใจเรื่องราวที่กำลังคุยกันอยู่ แม้กูเกิลจะสร้าง LaMDA และรายงานผลการพัฒนามาตั้งแต่ต้นปี 2020 แต่กูเกิลก็พบว่าสามารถนำโมเดลปัญญาประดิษฐ์มาฝึกเรื่องราวเฉพาะทางได้

กูเกิลสาธิตการใช้งานด้วยการให้ LaMDA เป็นเครื่องบินกระดาษ ผู้ใช้สามารถสนทนากับเครื่องบินกระดาษได้เหมือนเป็นตัวละครสมมติ เช่น ผู้ใช้ถามว่า "คุณเป็นเครื่องบินกระดาษที่ดีไหม" ตัว LaMDA จะถามกลับได้ว่า "ขึ้นกับคำว่าดีแปลว่าอะไร บางคนอาจจะแปลว่าบินได้ไกล บางคนอาจจะแปลว่าบินได้ตรง"

กูเกิลเริ่มใช้ Deep Learning ทำความเข้าใจคำค้นหา หาผลลัพธ์ตามรูปประโยค

By lew

on 25 October 2019 - 19:33 Tag: Google, Search Engine, Natural Language, LLM, Deep Learning, Artificial Intelligence

Google

กูเกิลประกาศเริ่มใช้งานโมเดลประมวลภาษาธรรมชาติ (natural language processing - NLP) แบบ deep learning ที่บริษัทโอเพนซอร์สออกมาเมื่อปีที่แล้วที่ชื่อว่า BERT ในการทำความเข้าใจคำค้นใน Google Search เพื่อให้เข้าใจความหมายของวลีที่ผู้ใช้กำลังค้นหาได้ดีขึ้น

ก่อนหน้านี้ผู้ใช้มักพยายามเพิ่มคำสำคัญที่ถูกต้อง เพราะเว็บค้นหามักใช้คำเหล่านี้ค้นฐานข้อมูล โดยไม่ได้ใช้คำขยายหรือคำบุพบทมาเป็นส่วนสำคัญ แต่การประมวลผลแบบ NLP ทำให้กูเกิลเข้าใจคำค้นได้ตรงความต้องการแม้จะค้นเหมือนพูดคุยกับคนอยู่ก็ตาม

Subscribe to LLM