LLM | Blognone

Large Language Model

OpenAI พัฒนาเครื่องมือตรวจจับบทความที่เขียนด้วย ChatGPT แต่ยังไม่เผยแพร่ มองมีความเสี่ยงหลายอย่าง

By arjin

on 5 August 2024 - 06:48 Tag: ChatGPT, OpenAI, LLM, Artificial Intelligence, Watermarking

ChatGPT

The Wall Street Journal มีรายงานพิเศษอ้างแหล่งข่าวภายใน OpenAI ว่าบริษัทมีโครงการพัฒนาเครื่องมือตรวจจับ ว่าบทความหรือเอกสารงานวิจัยนั้นใช้ ChatGPT เขียนให้หรือไม่

โครงการดังกล่าวเริ่มพัฒนาและหารือกันตั้งแต่เมื่อสองปีที่แล้ว ตัวเครื่องมือนั้นพร้อมใช้งานได้ตั้งแต่หนึ่งปีก่อน เหลือแค่ OpenAI อยากจะปล่อยออกมาเมื่อใดเท่านั้น

อ่านถึงตรงนี้อาจมีคำถามว่าแล้วทำไม OpenAI ไม่เผยแพร่เครื่องมือที่ดูเป็นประโยชน์นี้?

กูเกิลลดราคา Gemini 1.5 Flash ลง 80% เหลือประมาณครึ่งหนึ่งของ GPT-4o mini

By lew

on 3 August 2024 - 21:46 Tag: Gemini, LLM

Gemini

กูเกิลประกาศลดราคา Gemini 1.5 Flash ที่เพิ่งเปิดตัวมาเพียงสามเดือนลง 80% (อินพุต) ด้วยราคาระดับนี้ทำให้สามารถใช้งานได้หลากหลายขึ้น เช่น การใช้ถอดข้อความจากเสียงนั้นหลายครั้ง Gemini ทำได้ดีกว่าโมเดลแแปลงเสียงเป็นข้อความแล้ว

Gemini 1.5 Flash รองรับทั้งข้อความ, วิดีโอ, เสียง, และภาพ ราคาใหม่ อยู่ที่ 0.01875 ดอลลาร์ต่อ 1 ล้านตัวอักษร หากนับเป็นโทเค็นจะอยู่ที่ประมาณ 0.075 ดอลลาร์ต่อ 1 ล้านโทเค็น ประมาณครึ่งหนึ่งของ GPT-4o mini ที่ราคาถูกที่สุดตอนนี้ ราคาฝั่งเอาท์พุตของ Gemini 1.5 Flash อยู่ที่ 0.15 ดอลลาร์ต่อ 1 ล้านโทเค็น เทียบกับ GPT-4o mini อยู่ที่ 0.60 ดอลลาร์ต่อ 1 ล้านโทเค็น

ผลทดสอบ Chatbot Arena สัปดาห์ล่าสุด Gemini 1.5 Pro เวอร์ชั่นทดลองแซงหน้า GPT-4o

By lew

on 2 August 2024 - 17:31 Tag: Gemini, LLM

Gemini

LMSYS เว็บจัดอันดับแชตบอตแบบอาศัยการส่งคำตอบจากแชตบอตหลายตัวให้ผู้ใช้เลือกตัวที่ดีกว่า เปิดผลสัปดาห์ล่าสุดพบว่า Gemini 1.5 Pro รุ่นทดสอบ 0801 เอาชนะ GPT-4o จนขึ้นที่หนึ่งได้เป็นครั้งแรก

โมเดลเวอร์ชั่น 0801 นี้สามารถใช้งานได้ใน AI Studio ยังไม่ได้เปิดใช้ใช้งานเป็นวงกว้างนัก ขณะที่ Gemini Advanced ก็ตามมาอยู่อันดับ 4 ร่วมกับ Claude 3.5 Sonnet และ Llama 3.1 405B ซึ่งเป็นครั้งแรกๆ ที่โมเดลแบบโอเพนซอร์สขึ้นอันดับสูงขนาดนี้

รายงาน Upwork ระบุผู้บริหารพยายามให้ใช้ AI แล้วเรียกร้องประสิทธิภาพมากขึ้น แต่พนักงานกลับทำงานยากกว่าเดิม

By lew

on 2 August 2024 - 12:13 Tag: Employment, LLM, Artificial Intelligence

Employment

Upwork แพลตฟอร์มจัดหางานออกรายงานสำรวจคนทำงานในองค์กร 2,500 คนตั้งแต่ระดับบริหาร, พนักงาน, ไปจนถึงฟรีแลนซ์ ถึงการใช้เครื่องมือ AI ในการทำงาน พบว่าผู้บริหารตื่นเต้นกับ AI และสร้างความคาดหวังกับตัวพนักงานว่าจะต้องสามารถทำงานได้เพิ่มขึ้นขณะที่ตัวพนักงานนั้นอาจจะไม่ได้พร้อมใช้งานเครื่องมือเหล่านั้น และหลายครั้งการใส่เครื่องมือเข้ามาก็ทำให้ทำงานยากกว่าเดิม

กูเกิลปล่อยโมเดล Gemma 2 2B โมเดลขนาดเล็กประสิทธิภาพดีกว่า GPT-3.5 เข้าใจภาษาไทย

By lew

on 1 August 2024 - 10:33 Tag: Gemma, Gemini, Google, LLM

Gemma

กูเกิลปล่อยโมเดล LLM Gemma 2 2B โมเดลขนาดเล็กเพื่อการรันบนอุปกรณ์โดยตรง ชูความสามารถที่เหนือกว่า GPT-3.5 นับว่าเป็นโมเดลที่ประสิทธิภาพดีที่สุดในขนาดใกล้เคียงกัน

ผลสำรวจ StackOverflow พบนักพัฒนาส่วนใหญ่ชอบ AI เขียนโค้ดแม้ยังทำงานซับซ้อนไม่ได้

By lew

on 30 July 2024 - 13:44 Tag: Stack Overflow, LLM

Stack Overflow

StackOverflow ออกรายงานสำรวจนักพัฒนากว่า 65,000 คนในปี 2024 โดยปีนี้มีหมวดการสำรวจด้านปัญญาประดิษฐ์โดยเฉพาะ พบว่าอัตราการใช้งาน AI ช่วยเขียนโค้ดเพิ่มขึ้นอย่างรวดเร็วเป็น 62% มี 14% วางแผนว่าจะใช้งานเร็วๆ นี้ เทียบกับปีที่แล้วที่มีคนใช้ 44% โดยส่วนใหญ่ยังพึงพอใจกับการใช้งานอยู่

OpenAI เปิดตัว SearchGPT เสิร์ชเอ็นจินพลัง Generative AI ตอนนี้สถานะเป็นต้นแบบ ทดสอบกลุ่มจำกัด

By arjin

on 26 July 2024 - 03:36 Tag: OpenAI, SearchGPT, Search Engine, LLM, Artificial Intelligence

OpenAI

OpenAI เปิดตัวบริการค้นหาหรือเสิร์ชพลัง AI ในชื่อ SearchGPT โดยระบุว่าเป็นเสิร์ชเอ็นจินที่ค้นหาและให้ข้อมูลแบบเรียลไทม์ได้จากบนอินเทอร์เน็ต สถานะของบริการตอนนี้เป็นต้นแบบ (Prototype) ทดสอบกับผู้ใช้งานจำนวนจำกัด หากสนใจต้องลงชื่อเป็น waitlist

Mistral เปิดตัวโมเดล Large 2 123B ประสิทธิภาพใกล้ Llama 3.1 แต่ขนาดเล็กกว่า

By mk

on 25 July 2024 - 10:52 Tag: Mistral, LLM, Artificial Intelligence

Mistral

คล้อยหลังการเปิดตัวโมเดล Mistral NeMo 12B รุ่นเล็กเพียงไม่กี่วัน ทาง Mistral AI ก็เปิดตัวโมเดลขนาดใหญ่ระดับเรือธง Mistral Large 2 ขนาดพารามิเตอร์ 123B เป็นเวอร์ชันอัพเกรดของ Mistral Large 1 ที่ออกเมื่อต้นปี 2024

สิ่งที่เพิ่มเข้ามาคือการขยายขนาด context window จาก 32K เป็น 128K, รองรับภาษาอื่นๆ ที่ไม่ใช่ภาษาตระกูลละติน ได้แก่ อารบิก ฮินดี จีน ญี่ปุ่น เกาหลี, รองรับภาษาโปรแกรมมิ่งอีกกว่า 80 ภาษา

คลาวด์รายหลักเปิดให้บริการ Llama 3.1 โดยพร้อมเพรียง, Meta อนุญาตให้นำ output ไปฝึกโมเดลของตัวเองได้

By lew

on 24 July 2024 - 15:35 Tag: Llama, Meta, LLM

Llama

หลังจากเมื่อคืนที่ผ่านมา Meta เปิดตัว Llama 3.1 โมเดลปัญญาประดิษฐ์ บรรดาคลาวด์รายเล็กและรายใหญ่ก็ประกาศเปิดบริการ Llama 3.1 โดยพร้อมเพรียงกัน โดยบริการที่ครบถ้วนที่สุดคือ Microsoft Azure เปิดให้บริการพร้อมกับประกาศราคาออกมาพร้อมกันทั้งสามขนาด Google Cloud นั้นเปิดให้ใช้งานโมเดล 405B แล้วแต่ยังไม่ประกาศราคา ขณะที่ AWS นั้นประกาศราคาเฉพาะรุ่น 70B และ 8B โดยรุ่น 405B ต้องเปิดเคสขอใช้งาน

Meta เปิดตัว Llama 3.1 พร้อมรุ่นใหญ่สุด 405B ความสามารถใกล้เคียง GPT-4o เข้าใจภาษาไทยแล้ว

By lew

on 23 July 2024 - 23:03 Tag: Meta, Artificial Intelligence, LLM, Llama

Proton เปิดตัว Proton Scribe ตัวช่วยเขียนอีเมลพลัง AI ที่ทำงานบนโลคอล

By arjin

on 19 July 2024 - 22:01 Tag: Proton, LLM

Proton

Proton เปิดตัวบริการใหม่ Proton Scribe ตัวช่วยเขียนอีเมลสำหรับ Proton Mail พลัง AI ที่ชูจุดเด่นเรื่องความเป็นส่วนตัวของผู้ใช้งาน เพราะตัวช่วยนี้รันโลคอลบนเครื่อง ไม่มีการส่งข้อมูลไปยัง 3rd Party และไม่นำข้อมูลอีเมลของผู้ใช้งานมาเทรนด้วย

Proton Scribe มีตัวช่วยในการเขียนอีเมลแบบเครื่องมือ AI อื่นทั้ง ตรวจคำสะกด ตรวจไวยากรณ์ ปรับระดับเนื้อหาของอีเมล ผู้ใช้งานสามารถปรับแต่งค่าได้ตามที่ต้องการ

เครื่องมือ Proton Scribe เปิดให้ใช้งานแล้วสำหรับลูกค้า Mail Essentials, Mail Professional และ Proton Business Suite

ไมโครซอฟท์เปิดให้องค์กรธุรกิจใช้งาน GPT-4o mini ใหม่ใน Azure AI แล้ว

By Phantip

on 19 July 2024 - 16:53 Tag: Microsoft, Microsoft Azure, OpenAI, Artificial Intelligence, LLM, Enterprise

Microsoft

ไมโครซอฟท์ร่วมมือกับ OpenAI เปิดให้องค์กรธุรกิจใช้งาน GPT-4o mini ใหม่ใน Azure AI แล้ว

GPT-4o mini เป็นโมเดลขนาดเล็กรุ่นใหม่ที่ชาญฉลาด เร็วขึ้น และราคาไม่แพง ซึ่ง OpenAI เพิ่งประกาศเปิดตัววันนี้ โดยผสานรวมความสามารถด้านข้อความและการมองเห็น (เสียงและวิดีโอจะตามมาในภายหลัง)

Mistral เปิดตัวโมเดลภาษา NeMo 12B ใช้แทน Mistral 7B ได้เลย, 128k context window

By mk

on 19 July 2024 - 14:05 Tag: Mistral, LLM, Artificial Intelligence, NVIDIA

Mistral

Mistral AI บริษัทปัญญาประดิษฐ์จากฝรั่งเศส เปิดตัวโมเดลภาษาเวอร์ชันใหม่ Mistral NeMo 12B ขนาด 12 พันล้านพารามิเตอร์ รองรับ context window ขนาดใหญ่ถึง 128K (โมเดลระดับเดียวกันรองรับ 8k) และสามารถนำมาใช้แทน Mistral 7B ตัวเดิมได้เลย (drop-in replacement)

Mistral NeMo 12B ออกแบบมาให้รองรับหลายภาษาตั้งแต่แรก โดยทำผลงานได้ดีในภาษาอังกฤษ ฝรั่งเศส เยอรมัน สเปน อิตาลี โปรตุเกส จีน ญี่ปุ่น เกาหลี อารบิก ฮินดี ผลการรันสามารถเอาชนะได้ทั้ง Llama 3 8B และ Gemma 2 9B ในเกือบทุกชุดทดสอบ

OpenAI เปิดตัว GPT-4o mini โมเดล AI ขนาดเล็กที่ระบุว่า Cost-Efficient ที่สุด

By arjin

on 19 July 2024 - 04:47 Tag: OpenAI, ChatGPT, LLM, Artificial Intelligence

OpenAI

OpenAI เปิดตัว GPT-4o mini โมเดลปัญญาประดิษฐ์ขนาดเล็กสำหรับนักพัฒนาที่ระบุว่า มีประสิทธิภาพเทียบกับต้นทุน (Cost-Efficient) คุ้มค่าที่สุดของ OpenAI ซึ่งน่าจะทำให้ต้นทุนสำหรับแอพพลิเคชัน AI ต่าง ๆ สามารถเข้าถึงได้มากขึ้น โดยยังได้ประสิทธิภาพที่สูง

GPT-4o mini คิดค่าบริการที่ 15 เซนต์ต่อ 1 ล้านอินพุทโทเค็น และ 60 เซนต์ต่อ 1 ล้านเอาท์พุทโทเค็น ถูกกว่า GPT-3.5 Turbo 60% ในตอนนี้รองรับ API ส่วน text และ vision โดยจะรองรับข้อมูลรวมตั้งแต่ text, image, video และ audio ในอนาคต เอาท์พุทรองรับสูงสุด 16k โทเค็นต่อรีเควส ข้อมูลปรับปรุงถึงตุลาคม 2023

Meta บอกโมเดล Llama ตัวใหม่ จะไม่เผยแพร่ให้ผู้ใช้งานในกลุ่มประเทศ EU เพื่อเลี่ยงปัญหาจากหน่วยงานกำกับดูแล

By arjin

on 18 July 2024 - 17:56 Tag: Llama, Meta, LLM, Artificial Intelligence, Europe, EU

Llama

Meta เปิดเผยว่าบริษัทมีแผนออกโมเดลปัญญาประดิษฐ์ Llama ที่รองรับข้อมูลผสมผสาน (Multimodal) ในอีกไม่กี่เดือนข้างหน้า แต่ประเด็นสำคัญนั้น Meta บอกว่าโมเดล Llama ตัวใหม่นี้จะไม่เผยแพร่ให้กับผู้ใช้งานในกลุ่มประเทศสหภาพยุโรปหรือ EU

โดยเหตุผลที่ Meta ตัดสินใจเช่นนั้นเป็นเพราะ Meta มองว่าทิศทางของหน่วยงานกำกับดูแลของ EU มีลักษณะที่คาดเดาได้ยาก จึงเลือกไม่เผยแพร่โมเดลไปเลยดีกว่า

OpenAI เผยแพร่งานวิจัย ให้โมเดล AI อธิบายผลลัพธ์ให้อีกโมเดลที่ด้อยกว่าเข้าใจได้อย่างถูกต้อง

By arjin

on 18 July 2024 - 08:11 Tag: OpenAI, Artificial Intelligence, LLM

OpenAI

OpenAI เผยแพร่งานวิจัยในการพัฒนาอัลกอริทึม เพื่อทำให้โมเดล AI ภาษาขนาดใหญ่หรือ LLM พัฒนาความสามารถในการอธิบายสิ่งต่าง ๆ ให้คนอื่นเข้าใจได้ดีขึ้น เรียกวิธีการนี้ว่า Prover-Verifier Games

การทำงานนั้นผู้วิจัยใช้โมเดล AI สองโมเดล โมเดลหนึ่งมีประสิทธิภาพสูงกว่าเป็น Prover หรือคนอธิบายคำตอบ และโมเดลที่ประสิทธิภาพน้อยกว่าเป็น Verifier ทำหน้าตรวจสอบความถูกต้องของคำตอบที่ได้รับ หน้าที่ของ Prover คือให้คำตอบที่ทำให้อีกฝ่ายเชื่อว่าถูกต้องที่สุด ส่วน Verifier ต้องตอบว่าคำตอบที่ได้นั้นถูกต้องหรือไม่ ซึ่งหลายกรณีเป็นคำตอบที่มั่ว แต่ Prover ใช้คำอธิบายทำให้ไขว้เขว

Claude บน Android มาแล้ว รองรับโมเดล Claude 3.5 Sonnet

By arjin

on 17 July 2024 - 07:41 Tag: Claude, Anthropic, Artificial Intelligence, LLM, Mobile App

Claude

Anthropic บริษัทด้านปัญญาประดิษฐ์ผู้พัฒนา Claude เปิดตัวแอปบนระบบปฏิบัติ iOS สำหรับคนใช้ iPhone และ iPad นอกจากนี้ยังเปิดตัวแพ็คเกจจ่ายเงินสำหรับลูกค้าองค์กรด้วย

โดยแพ็คเกจสำหรับลูกค้าองค์กรมีชื่อว่า Team plan เพื่อเพิ่มการปกป้องข้อมูลและความปลอดภัยสำหรับองค์กรที่ต้

Anthropic เปิดตัวแอป Claude บน Android แล้ว หลังจากออกเวอร์ชัน iOS เมื่อเดือนพฤษภาคมที่ผ่านมา สามารถดาวน์โหลดได้ผ่าน Google Play

Mistral AI เปิดตัวโมเดล LLM สำหรับการแก้ปัญหาคณิตศาสตร์ และการเขียนโค้ด

By arjin

on 17 July 2024 - 07:29 Tag: Mistral, LLM, Artificial Intelligence, Math, Code

Mistral

Mistral AI บริษัทปัญญาประดิษฐ์จากฝรั่งเศสเผยแพร่โมเดล LLM แบบโอเพนซอร์สสองโมเดลใหม่ สำหรับการแก้ปัญหาทางคณิตศาสตร์และการเขียนโค้ดโดยเฉพาะ

โมเดลแรกคือ Codestral Mamba ขนาด 7B พารามิเตอร์ ทำงานได้ดีสำหรับงานการเขียนโค้ด มีจุดเด่นรองรับการประมวลผลที่รวดเร็วสำหรับงานโค้ดที่รันบน local ผลทดสอบทำงานได้ดีกว่า LLM ทั่วไปเท่าตัว และดีกว่าโมเดลที่ออกแบบมาสำหรับงานเขียนโค้ดขนาดเท่ากันอย่าง CodeLlama 7B, CodeGemma-1.17B หรือ DeepSeek v1.5 7B

Microsoft เผยแพร่งานวิจัย SpreadsheetLLM โมเดล AI แกะข้อมูลสเปรดชีทที่ซับซ้อน ให้ LLM เข้าใจได้ดีขึ้น

By arjin

on 16 July 2024 - 10:12 Tag: Microsoft Research, Microsoft, Artificial Intelligence, LLM, Excel, Google Sheets

Microsoft Research

ทีมนักวิจัยของไมโครซอฟท์ เผยแพร่งานวิจัย SpreadsheetLLM โมเดล AI ที่ทำหน้าที่แปลงข้อมูลสเปรดชีท (Excel, Google Sheets) ให้เป็นฟอร์แมตที่ทำงานได้ดีบนโมเดลภาษาขนาดใหญ่ (LLM - Large Language Model) เพื่อให้ LLM เข้าใจเนื้อหาในสเปรดชีทได้ดีขึ้น และทำงานตรงกับสิ่งที่ต้องการ

DAMO Academy ของ Alibaba เปิดตัว SeaLLM3 โมเดลขนาด 7B เก่งภาษาไทยกว่า Qwen2

By lew

on 11 July 2024 - 00:05 Tag: Alibaba, LLM

Alibaba

DAMO Academy สถาบันวิจัยของ Alibaba เปิดตัว SeaLLM เวอร์ชั่นที่ 3 เป็นโมเดล LLM เน้นความสามารถในภาษาแถบอาเซียนสูงกว่าโมเดลในขนาดใกล้เคียงกันตัวอื่นๆ แถมยังเอาชนะ Qwen2 ของ Alibaba Cloud ไปได้

Subscribe to LLM