LLM | Blognone

Large Language Model

Google Maps เพิ่มฟีเจอร์ค้นหา-แนะนำสถานที่ ด้วย Generative AI ทดสอบในอเมริกาก่อน

By arjin

on 2 February 2024 - 12:41 Tag: Google Maps, LLM

Google Maps

กูเกิลประกาศเพิ่มฟีเจอร์ใหม่ด้าน Generative AI ให้กับบริการ Google Maps ส่วนของการค้นหาสถานที่ใหม่ที่น่าสนใจ ซึ่งกูเกิลบอกว่าเป็นการนำข้อมูลสถานที่กว่า 250 ล้านแห่ง และข้อมูลจากชุมชนมาประมวลผลด้วย LLM

ฟีเจอร์ Generative AI ใน Google Maps จะเริ่มเปิดใช้งานสำหรับผู้ใช้งานในสหรัฐอเมริกาก่อน ในส่วน Local Guides โดยสามารถค้นหาด้วยคำถามแบบกว้าง ๆ เพื่อขอไอเดีย เช่น เที่ยงนี้กินอะไรดี หรือเจาะจงหมวดของร้านให้ Maps แนะนำออกมาก็ทำได้เช่นกัน

สถานะของ Local Guides แบบใหม่นี้ยังอยู่ในขั้นทดสอบ แต่กูเกิลคาดหวังว่าจะสามารถเปลี่ยนวิธีใช้งาน Maps ไปอีกขั้นหนึ่งได้

กูเกิลปล่อย Gemini Pro ลง Bard ทุกภาษารวมภาษาไทย, เพิ่มฟีเจอร์สร้างภาพในตัว

By lew

on 1 February 2024 - 23:01 Tag: Bard, LLM, Gemini, Google, Artificial Intelligence, Imagen

Bard

กูเกิลปล่อย Gemini Pro ใน Bard ทุกภาษาแล้ว หลังจากเมื่อปีที่แล้วจำกัดเฉพาะภาษาอังกฤษ ส่วนภาษาอื่นๆ ยังใช้ PaLM-2 มาตลอด การเปลี่ยนแปลงครั้งนี้ทำให้ Bard สามารถสรุป, ทำความเข้าใจ, และให้เหตุผลได้ดีขึ้น

นอกจากการเปลี่ยนโมเดลด้านหลังแล้ว Bard ยังเพิ่มอีกสองฟีเจอร์ ได้แก่

Meta ปล่อยโมเดล Code Llama ขนาด 70B คะแนนทดสอบ HumanEval แซง GPT-4, Gemini Pro

By lew

on 30 January 2024 - 00:55 Tag: Llama, Meta, LLM, Programming

Llama

Meta ปล่อยโมเดล Code Llama ขนาด 70B หลังจากปีที่แล้วปล่อยรุ่นใหญ่สุดอยู่ที่ 34B เท่านั้น โดยตอนนี้ยังไม่บอกรายละเอียดนัก นอกจากระบุว่าคะแนนทดสอบ HumanEval อยู่ที่ 67.8 แซงหน้า GPT-4 (67.0) และ Gemini Pro (67.7) โดยระบบอื่นๆ ที่ได้คะแนนสูงกว่านี้มักใช้ GPT-4/GPT-3.5 ร่วมกับเทคนิคอื่นๆ เพื่อให้ทำคะแนนได้สูงขึ้น

โมเดลที่ปล่อยออกมามี 3 รุ่นย่อย ได้แก่ รุ่นพื้นฐานสำหรับใช้งานทั่วไป, รุ่นภาษาไพธอนโดยเฉพาะ, และรุ่น Instruct สำหรับรับคำสั่งเพื่อเขียนโปรแกรมตาม รุ่นที่รายงานคะแนน HumanEval นั้นคือรุ่น Instruct

Bard ขึ้นอันดับสองตารางแชตบอท LMSYS เป็นรองเพียง GPT-4 Turbo

By lew

on 27 January 2024 - 12:41 Tag: Bard, LLM, Chat Bot, Gemini, Artificial Intelligence

Bard

LMSYS ผู้จัดอันดับแชตบอทโดยอาศัย Chatbot Arena เป็นการ "ต่อสู้" ระหว่างแชตบอทสองตัวให้ตอบคำถามเดียวกันแล้วให้ผู้ใช้เลือกว่าชอบคำตอบฝั่งใด รายงานผลรอบล่าสุดวันที่ 26 มกราคม 2024 และพบว่า Bard รุ่นที่ใช้ Gemini Pro นั้นแซงหน้า GPT-4 ขึ้นมาเป็นรองเพียง GPT-4 Turbo เท่านั้น

กูเกิลเปิดตัว Gemini โดยระบุว่าทดสอบวงปิดกับผู้ทดอบแล้วว่า Bard รุ่นใหม่นี้เป็นแชตบอทฟรีที่คุณภาพสูงสุดในตลาด ผลการทดลองนี้ก็ดูจะสนับสนุนว่า Gemini ให้ผลโดยรวมที่ดีในภาพรวมจริงๆ

Baidu จะนำ AI Ernie มาใส่ใน Samsung Galaxy S24 รุ่นที่ขายในจีน

By arjin

on 26 January 2024 - 21:59 Tag: Baidu, LLM, Artificial Intelligence, Galaxy S24, China

Baidu

Baidu ประกาศความร่วมมือ นำความสามารถด้าน AI ใส่ใน Samsung Galaxy S24 รุ่นที่ขายในจีน ซึ่งจะใช้แชทบอต Ernie ของ Baidu ที่มีฟีเจอร์ทั้งการแปลภาษาระหว่างสนทนาแบบเรียลไทม์ และฟีเจอร์อื่นเช่น การแปลภาษาและสรุปเนื้อหา Note Assistant

การเข้ามาร่วมมือของ Baidu นี้มีความน่าสนใจ เพราะปัจจุบันในตลาดจีนซัมซุงเป็นสมาร์ทโฟนที่ไม่ติดใน 5 อันดับแรก ขณะที่แอปเปิลเป็นอันดับ 1 ในปีล่าสุด

OpenAI อัพเดตโมเดลรอบใหม่ โมเดล embbedding ลดขนาดเวคเตอร์ลง, แก้ปัญหาโมเดลขี้เกียจทำงาน

By lew

on 26 January 2024 - 10:10 Tag: OpenAI, LLM

OpenAI

OpenAI ประกาศอัพเดตโมเดลทั้ง LLM และ embedding โดย LLM นั้นเป็นการปรับตามรอบเป็นเวอร์ชั่น 0125 พร้อมกับลดราคาบางส่วน

โมเดล embedding ของ OpenAI ที่ผ่านมาเป็นโมเดล Ada ที่ใช้งานมานาน และมีขนาดเวคเตอร์ขาออกถึง 1536 มิติ ในโมเดล text-embedding-3 จะมีขนาดเวคเตอร์ให้เลือกตั้งแต่ 256, 512, 1024, 1536, 3072 มิติ โดยเวคเตอร์ขนาดเล็กที่สุดก็ยังมีคะแนน ดีกว่า Ada ตัวเดิม

โมเดล GPT-3.5 Turbo ปรับเวอร์ชั่นเป็น 0125 แก้บั๊กการเรียกฟังก์ชั่นด้วยภาษาอื่นนอกจากภาษาอังกฤษ ขณะที่โมเดล GPT-4 แก้ปัญหาโมเดล "ขี้เกียจ" ไม่ยอมทำงานตามที่สั่ง และแก้ปัญหาการตอบภาษาอื่นนอกจากภาษาอังกฤษเช่นกัน

Google Research เผยแพร่งานวิจัย Lumiere โมเดล AI สร้างคลิปวิดีโอ ที่คงสไตล์ต้นแบบไว้ได้ครบ

By arjin

on 25 January 2024 - 22:11 Tag: Google, Google Research, LLM, Artificial Intelligence

Google

Google Research เปิดตัว Lumiere โมเดล AI สำหรับสร้างวิดีโอขึ้นจาก Prompt ตัวหนังสือ หรือรูปภาพต้นแบบ มีจุดเด่นคือโมเดลทำงาน โดยดูองค์ประกอบในภาพข้อมูลตั้งต้น และสร้างวิดีโอต่อเนื่องขึ้นจากสิ่งเหล่านั้น ทำให้รักษาภาพรวมและสไตล์ไว้ได้มากกว่าโมเดลอื่น

ตัวอย่างวิดีโอที่สร้างขึ้นมาจาก Lumiere มีหลายรูปแบบทั้ง Text-to-Video สร้างคลิปสั้นตามข้อความอินพุท, Image-to-Video ให้รูปภาพตั้งต้นแล้วใส่อินพุทสิ่งที่ต้องการให้ภาพเคลื่อนไหว, Stylized Generation กำหนดภาพรูปแบบตั้งต้น แล้วสร้างผลลัพธ์ตามอินพุทที่ต้องการให้ได้โทนเดียวกัน

Ollama ซอฟต์แวร์รันปัญญาประดิษฐ์บนพีซีออกไลบรารี Python/JavaScript

By lew

on 25 January 2024 - 10:08 Tag: LLM, Artificial Intelligence, Open Source

LLM

Ollama ซอฟต์แวร์สำหรับรันโมเดลปัญญาประดิษฐ์ในกลุ่ม LLM ปล่อยไลบรารีสำหรับพัฒนาแอปพลิเคชั่นบนภาษา Python และ JavaScript จากเดิมที่ต้องเขียน REST API โดยตรง

ไลบรารีทั้งสองตัวรองรับฟีเจอร์ของ Ollama ครบชุด ได้แก่ streaming สำหรับการคืนคำตอบทีละส่วน, multi-modal ใส่ภาพเป็นอินพุต, text completion สำหรับถามตอบปกติ, และ custom models สำหรับการกำหนด system prompt ด้วยตัวเอง

Google Arts & Culture อัพเดต Art Selfie 2 แปลงรูปภาพเป็นธีมงานศิลปะด้วยพลัง GenAI

By arjin

on 24 January 2024 - 22:30 Tag: Google Arts & Culture, Google, Arts, Artificial Intelligence, LLM

Google Arts & Culture

Google Arts & Culture ประกาศอัพเดตฟีเจอร์ Art Selfie ที่แปลงรูปถ่ายเซลฟี่ให้เป็นภาพงานศิลปะหรือฉากอื่น ๆ โดยเวอร์ชันใหม่ Art Selfie 2 นี้ เป็นการแปลงภาพถ่ายด้วยพลัง Generative AI มีทั้งทำให้เป็นภาพฉากหลังเขาเอเวอเรสต์, บรรยากาศใน Monet's Garden และอื่น ๆ ซึ่งตอนนี้มีให้เลือกมากกว่า 25 รูปแบบ และจะเพิ่มเติมอีกในอนาคต

สู่ยุคเบราว์เซอร์แข่งกันบวม Chrome เตรียมใส่ AI สร้างภาพ, ช่วยเขียนงาน, จัดแท็บอัตโนมัติ

By lew

on 24 January 2024 - 00:55 Tag: Chrome, LLM, Artificial Intelligence, Browser

Chrome

กูเกิลประกาศเพิ่มฟีเจอร์ให้กับ Google Chrome โดยอาศัยพลัง generative AI 3 รายการ โดยเฉพาะการเพิ่มฟีเจอร์ช่วยเขียนและสร้างภาพ แบบเดียวกับที่ Microsoft Edge ใส่ Copilot เข้ามา โดย 3 ฟีเจอร์ได้แก่

Stability AI เปิดตัวโมเดลภาษาขนาดเล็ก Stable LM 2 ผลทดสอบชนะโมเดล SLM ตัวอื่นๆ

By mk

on 22 January 2024 - 08:47 Tag: Stability AI, Artificial Intelligence, LLM

Stability AI

Stability AI บริษัทเจ้าของโมเดลสร้างภาพ Stable Diffusion เปิดตัวโมเดลภาษาเวอร์ชันใหม่ Stable LM 2 ซึ่งเป็นเวอร์ชันปรับปรุงจาก Stable LM เวอร์ชันแรกที่เปิดตัวในเดือนเมษายน 2023

ความน่าสนใจของ Stable LM 2 คือตัวโมเดลมีขนาดเล็กลงเหลือเพียง 1.6 พันล้านพารามิเตอร์ (เวอร์ชันแรกเริ่มต้น 3 ล้านพารามิเตอร์) ถือเป็นโมเดลภาษาขนาดเล็ก small language model (SLM) ที่นำไปรันบนฮาร์ดแวร์สเปกต่ำได้กว้างขวางกว่าโมเดลภาษาขนาดใหญ่ (LLM)

Meta เผยกำลังเทรน Llama 3, จะมีจีพียู H100 3.5 แสนตัว, เป้าหมายคือ Open Source AGI

By mk

on 19 January 2024 - 08:36 Tag: Llama, Meta, Artificial Intelligence, LLM, GPU

Llama

Mark Zuckerberg เปิดเผยว่าตอนนี้ทีม AI ของบริษัท Meta กำลังเทรนโมเดล Llama 3 บนโครงสร้างพื้นฐานคอมพิวเตอร์ขนาดใหญ่ ที่จะมีจีพียู NVIDIA H100 เพิ่มเป็น 350,000 ตัวภายในสิ้นปี 2024 และถ้านับจีพียูตัวอื่นๆ มารวมด้วย จะเทียบได้กับการมี H100 จำนวนรวม 600,000 ตัว

ตอนนี้ Meta มีทีมพัฒนา AI สองทีมคือ Fundamental AI Research (FAIR) ที่เน้นงานวิจัย และ GenAI ที่เพิ่งตั้งเมื่อต้นปี 2023 เน้นพัฒนาฟีเจอร์ AI ให้กับบริการในเครือ อย่าง WhatsApp, Messenger, Instagram

LangChain V0.1.0 มาแล้ว เฟรมเวิร์กสร้างแอป LLM ยอดนิยมเปิดตัวเวอร์ชันเสถียรรุ่นแรก

By Phantip

on 15 January 2024 - 16:23 Tag: Artificial Intelligence, LLM, Python, JavaScript

Artificial Intelligence

LangChain เปิดตัวเฟรมเวิร์กเวอร์ชัน 0.1.0 แล้ว หลังจากพัฒนามา 1 ปี

LangChain เป็นเฟรมเวิร์กโอเพนซอร์สยอดนิยมที่ออกแบบมาเพื่อช่วยสร้างแอปที่ใช้ LLM โดยเวอร์ชันนี้จะมีทั้ง Python และ JavaScript ซึ่งเป็นการปรับปรุงและเพิ่มความสามารถต่าง ๆ ดังนี้

DeepLearning.AI เปิดตัวคอร์สเรียน Generative AI ในภาษา JavaScript ด้วย LangChain.js

By Phantip

on 11 January 2024 - 20:55 Tag: Andrew Ng, Artificial Intelligence, LLM, JavaScript, Education, Training

Andrew Ng

DeepLearning.AI แพลตฟอร์มการเรียนรู้ AI และ Deep Learning ที่ก่อตั้งโดย Andrew Ng เปิดตัวหลักสูตรระยะสั้น Generative AI ในภาษา JavaScript ฟรีในช่วงเวลาจำกัด สอนการสร้างแอป LLM ด้วย LangChain โดย Jacob Lee วิศวกรซอฟต์แวร์ผู้ก่อตั้งและหัวหน้าผู้ดูแลโครงการ LangChain.js ใช้เวลาเรียน 1 ชม. เหมาะสำหรับนักพัฒนาเว็บที่มีพื้นฐานเกี่ยวกับ JavaScript ระดับกลาง

[ลือ] Parag Agrawal อดีตซีอีโอ Twitter กำลังตั้งบริษัทใหม่ด้าน AI ทำ LLM

By mk

on 11 January 2024 - 09:58 Tag: Parag Agrawal, Twitter, Artificial Intelligence, Startup, LLM

Parag Agrawal

Parag Agrawal อดีตซีอีโอเชื้อสายอินเดียของ Twitter ที่ลงจากตำแหน่ง หลัง Elon Musk ซื้อกิจการแล้วปลดออกเป็นคนแรก หลังจากนั้นเขาก็เงียบหายไปเลย (โพสต์สุดท้ายในบัญชีทวิตเตอร์ @paraga เมื่อเดือนตุลาคม 2022)

ล่าสุดเว็บไซต์ Information รายงานว่า Parag กำลังตั้งบริษัทสตาร์ตอัพด้าน AI โดยหาเงินทุนก้อนแรกมูลค่า 30 ล้านดอลลาร์ได้แล้ว จากกลุ่มนักลงทุนที่มี Khosla Ventures เป็นนักลงทุนหลัก

OpenAI ชี้แจง ChatGPT ละเมิดลิขสิทธิ์ ระบุเป็นบั๊กที่เกิดยาก พยายามแก้ปัญหามาตลอด

By lew

OpenAI

OpenAI ออกมาเขียนบล็อกชี้แจงกรณี The New York Times (NYT) ยื่นฟ้องละเมิดลิขสิทธิ์ โดยระบุว่าเป็นบั๊กที่เกิดได้ยากแล้ว และกำลังแก้ไขให้ไม่มีเหตุการณ์แบบนี้อีก พร้อมกับยืนยันว่าต้องการเป็นพันธมิตรกับสำนักข่าวต่างๆ

นักพัฒนาพบ Bard Advanced ที่ใช้ Gemini Ultra จะต้องเสียเงินใช้

By nismod

on 5 January 2024 - 12:49 Tag: Bard, Google, Gemini, LLM

Bard

หลัง Google เปิดตัว Gemini 1.0 โดยมี 3 เวอร์ชันคือ Nano ที่ใช้ใน Pixel แล้ว, Pro ที่ใช้ใน Bard และ Ultra ที่กำลังจะใช้บน Bard Advanced และจะเปิดตัวในปีนี้

ล่าสุดมีนักพัฒนาค้นพบว่า Bard Advanced จะเป็นแบบเสียเงิน (แบบเดียวกับ GPT Plus) โดยจะผูกอยู่กับบริการ Google One ซึ่งช่วงแรกจะเป็นการให้ทดลองใช้ฟรี 3 เดือน

ที่มา - @bedros_p, @evowizz

Baidu เผยแชทบอต ERNIE มีผู้ใช้งานมากกว่า 100 ล้านบัญชีแล้ว

By arjin

on 28 December 2023 - 21:44 Tag: Baidu, Artificial Intelligence, LLM

Baidu

Wang Haifeng ซีทีโอ Baidu เปิดเผยว่าแชทบอต ERNIE ตอนนี้มีผู้ใช้งานรวมมากกว่า 100 ล้านบัญชีแล้ว หลังจาก ERNIE เปิดให้ใช้งานแบบสาธารณะตั้งแต่ต้นเดือนกันยายนที่ผ่านมา

Baidu เปิดตัว ERNIE มาตั้งแต่เดือนมีนาคม ซึ่งเป็นเวลาไม่นานหลังจากกระแส ChatGPT ของ OpenAI มีมากขึ้น ในช่วงแรก Baidu ยังเปิดให้ใช้งาน ERNIE แบบทดสอบจำกัดกลุ่มเฉพาะบริษัทที่ได้รับอนุญาต เนื่องจากกระแสตอบรับมีสูงมาก

New York Times ฟ้อง Microsoft และ OpenAI ฐานละเมิดลิขสิทธิ์บทความ

By lew

on 27 December 2023 - 22:23 Tag: OpenAI, Microsoft, LLM, New York Times, Lawsuits, Copyright Infringement

OpenAI

หนังสือพิมพ์ The New York Times (NYT) ยื่นฟ้องไมโครซอฟท์และ OpenAI ฐานใช้งานบทความของหนังสือพิมพ์โดยไม่ได้รับอนุญาต ทั้งการใช้งานไปในชุดข้อมูลสำหรับฝึก LLM และตัว ChatGPT/Copilot เองก็ตอบบทความแทบทั้งบทความของ NYT ออกมาให้ผู้ใช้ได้

Apple โอเพนซอร์ส Ferret โมเดล AI MLLM ที่สามารถถอดรายละเอียดในรูปภาพได้

By arjin

on 25 December 2023 - 08:20 Tag: Apple, Artificial Intelligence, LLM, Open Source

Apple

แอปเปิลเผยแพร่ Ferret โมเดล AI ภาษาขนาดใหญ่บนข้อมูลสื่อผสม (Multimodal Large Language Model - MLLM) ใน GitHub ซึ่งพบว่าปล่อยออกมาตั้งแต่ 30 ตุลาคม แต่เพิ่งถูกพบและรายงานข่าวออกมา

Ferret มีจุดเด่นคือความสามารถการแยกข้อมูลภาพในรูปทรง-พื้นที่ใดก็ได้ แล้วให้รายละเอียดเจาะเฉพาะส่วนที่เห็น ตัวอย่างที่นำเสนอ เช่น สามารถระบุพื้นที่หางแมวได้ หรือรูปที่มีสัตว์ 2 ตัวซ้อนกัน ก็แยกตัวที่ 1 กับตัวที่ 2 ได้

Subscribe to LLM