Image

Large Language Model

By arjin Writer on Tag: ChatGPT, OpenAI, LLM, Artificial Intelligence, Watermarking
ChatGPT

The Wall Street Journal มีรายงานพิเศษอ้างแหล่งข่าวภายใน OpenAI ว่าบริษัทมีโครงการพัฒนาเครื่องมือตรวจจับ ว่าบทความหรือเอกสารงานวิจัยนั้นใช้ ChatGPT เขียนให้หรือไม่

โครงการดังกล่าวเริ่มพัฒนาและหารือกันตั้งแต่เมื่อสองปีที่แล้ว ตัวเครื่องมือนั้นพร้อมใช้งานได้ตั้งแต่หนึ่งปีก่อน เหลือแค่ OpenAI อยากจะปล่อยออกมาเมื่อใดเท่านั้น

อ่านถึงตรงนี้อาจมีคำถามว่าแล้วทำไม OpenAI ไม่เผยแพร่เครื่องมือที่ดูเป็นประโยชน์นี้?

By lew Founder on Tag: Gemini, LLM
Gemini

กูเกิลประกาศลดราคา Gemini 1.5 Flash ที่เพิ่งเปิดตัวมาเพียงสามเดือนลง 80% (อินพุต) ด้วยราคาระดับนี้ทำให้สามารถใช้งานได้หลากหลายขึ้น เช่น การใช้ถอดข้อความจากเสียงนั้นหลายครั้ง Gemini ทำได้ดีกว่าโมเดลแแปลงเสียงเป็นข้อความแล้ว

Gemini 1.5 Flash รองรับทั้งข้อความ, วิดีโอ, เสียง, และภาพ ราคาใหม่ อยู่ที่ 0.01875 ดอลลาร์ต่อ 1 ล้านตัวอักษร หากนับเป็นโทเค็นจะอยู่ที่ประมาณ 0.075 ดอลลาร์ต่อ 1 ล้านโทเค็น ประมาณครึ่งหนึ่งของ GPT-4o mini ที่ราคาถูกที่สุดตอนนี้ ราคาฝั่งเอาท์พุตของ Gemini 1.5 Flash อยู่ที่ 0.15 ดอลลาร์ต่อ 1 ล้านโทเค็น เทียบกับ GPT-4o mini อยู่ที่ 0.60 ดอลลาร์ต่อ 1 ล้านโทเค็น

By lew Founder on Tag: Gemini, LLM
Gemini

LMSYS เว็บจัดอันดับแชตบอตแบบอาศัยการส่งคำตอบจากแชตบอตหลายตัวให้ผู้ใช้เลือกตัวที่ดีกว่า เปิดผลสัปดาห์ล่าสุดพบว่า Gemini 1.5 Pro รุ่นทดสอบ 0801 เอาชนะ GPT-4o จนขึ้นที่หนึ่งได้เป็นครั้งแรก

โมเดลเวอร์ชั่น 0801 นี้สามารถใช้งานได้ใน AI Studio ยังไม่ได้เปิดใช้ใช้งานเป็นวงกว้างนัก ขณะที่ Gemini Advanced ก็ตามมาอยู่อันดับ 4 ร่วมกับ Claude 3.5 Sonnet และ Llama 3.1 405B ซึ่งเป็นครั้งแรกๆ ที่โมเดลแบบโอเพนซอร์สขึ้นอันดับสูงขนาดนี้

By lew Founder on Tag: Employment, LLM, Artificial Intelligence
Employment

Upwork แพลตฟอร์มจัดหางานออกรายงานสำรวจคนทำงานในองค์กร 2,500 คนตั้งแต่ระดับบริหาร, พนักงาน, ไปจนถึงฟรีแลนซ์ ถึงการใช้เครื่องมือ AI ในการทำงาน พบว่าผู้บริหารตื่นเต้นกับ AI และสร้างความคาดหวังกับตัวพนักงานว่าจะต้องสามารถทำงานได้เพิ่มขึ้นขณะที่ตัวพนักงานนั้นอาจจะไม่ได้พร้อมใช้งานเครื่องมือเหล่านั้น และหลายครั้งการใส่เครื่องมือเข้ามาก็ทำให้ทำงานยากกว่าเดิม

By lew Founder on Tag: Gemma, Gemini, Google, LLM
Gemma

กูเกิลปล่อยโมเดล LLM Gemma 2 2B โมเดลขนาดเล็กเพื่อการรันบนอุปกรณ์โดยตรง ชูความสามารถที่เหนือกว่า GPT-3.5 นับว่าเป็นโมเดลที่ประสิทธิภาพดีที่สุดในขนาดใกล้เคียงกัน

By lew Founder on Tag: Stack Overflow, LLM
Stack Overflow

StackOverflow ออกรายงานสำรวจนักพัฒนากว่า 65,000 คนในปี 2024 โดยปีนี้มีหมวดการสำรวจด้านปัญญาประดิษฐ์โดยเฉพาะ พบว่าอัตราการใช้งาน AI ช่วยเขียนโค้ดเพิ่มขึ้นอย่างรวดเร็วเป็น 62% มี 14% วางแผนว่าจะใช้งานเร็วๆ นี้ เทียบกับปีที่แล้วที่มีคนใช้ 44% โดยส่วนใหญ่ยังพึงพอใจกับการใช้งานอยู่

By arjin Writer on Tag: OpenAI, SearchGPT, Search Engine, LLM, Artificial Intelligence
OpenAI

OpenAI เปิดตัวบริการค้นหาหรือเสิร์ชพลัง AI ในชื่อ SearchGPT โดยระบุว่าเป็นเสิร์ชเอ็นจินที่ค้นหาและให้ข้อมูลแบบเรียลไทม์ได้จากบนอินเทอร์เน็ต สถานะของบริการตอนนี้เป็นต้นแบบ (Prototype) ทดสอบกับผู้ใช้งานจำนวนจำกัด หากสนใจต้องลงชื่อเป็น waitlist

By mk Founder on Tag: Mistral, LLM, Artificial Intelligence
Mistral

คล้อยหลังการเปิดตัวโมเดล Mistral NeMo 12B รุ่นเล็กเพียงไม่กี่วัน ทาง Mistral AI ก็เปิดตัวโมเดลขนาดใหญ่ระดับเรือธง Mistral Large 2 ขนาดพารามิเตอร์ 123B เป็นเวอร์ชันอัพเกรดของ Mistral Large 1 ที่ออกเมื่อต้นปี 2024

สิ่งที่เพิ่มเข้ามาคือการขยายขนาด context window จาก 32K เป็น 128K, รองรับภาษาอื่นๆ ที่ไม่ใช่ภาษาตระกูลละติน ได้แก่ อารบิก ฮินดี จีน ญี่ปุ่น เกาหลี, รองรับภาษาโปรแกรมมิ่งอีกกว่า 80 ภาษา

By lew Founder on Tag: Llama, Meta, LLM
Llama

หลังจากเมื่อคืนที่ผ่านมา Meta เปิดตัว Llama 3.1 โมเดลปัญญาประดิษฐ์ บรรดาคลาวด์รายเล็กและรายใหญ่ก็ประกาศเปิดบริการ Llama 3.1 โดยพร้อมเพรียงกัน โดยบริการที่ครบถ้วนที่สุดคือ Microsoft Azure เปิดให้บริการพร้อมกับประกาศราคาออกมาพร้อมกันทั้งสามขนาด Google Cloud นั้นเปิดให้ใช้งานโมเดล 405B แล้วแต่ยังไม่ประกาศราคา ขณะที่ AWS นั้นประกาศราคาเฉพาะรุ่น 70B และ 8B โดยรุ่น 405B ต้องเปิดเคสขอใช้งาน

By lew Founder on Tag: Meta, Artificial Intelligence, LLM, Llama
Meta

Meta ปล่อยโมเดล Llama 3.1 โมเดล LLM รุ่นล่าสุดที่รีดความสามารถได้สูงขึ้นมาก พร้อมกับปล่อยโมเดลขนาดใหญ่ที่สุด 405B ความสามารถจากการทดสอบหลายอย่างไปอยู่ระดับเดียวกับ GPT-4o แล้ว แม้ว่ายังไม่มีความสามารถ multimodal ที่รองรับภาพและเสียงได้ก็ตาม

ผลทดสอบหลายด้านของ Llama 3.1 แสดงให้เห็นว่าทาง Meta ยังรีดความสามารถในโมเดลขนาดเล็กได้เพิ่มขึ้นเรื่อยๆ โดยผลทดสอบหลายชุด Llama 3.1 8B สามารถทำคะแนนได้ใกล้ Llama 3.0 70B มากขึ้น ขณะที่ Llama 3.1 70B นั้นทำคะแนนเพิ่มเติมได้แทบทุกชุดยกเว้นบ้างเช่นชุดทดสอบเขียนโปรแกรม HumanEval ที่คะแนนลดลง

By arjin Writer on Tag: Proton, LLM
Proton

Proton เปิดตัวบริการใหม่ Proton Scribe ตัวช่วยเขียนอีเมลสำหรับ Proton Mail พลัง AI ที่ชูจุดเด่นเรื่องความเป็นส่วนตัวของผู้ใช้งาน เพราะตัวช่วยนี้รันโลคอลบนเครื่อง ไม่มีการส่งข้อมูลไปยัง 3rd Party และไม่นำข้อมูลอีเมลของผู้ใช้งานมาเทรนด้วย

Proton Scribe มีตัวช่วยในการเขียนอีเมลแบบเครื่องมือ AI อื่นทั้ง ตรวจคำสะกด ตรวจไวยากรณ์ ปรับระดับเนื้อหาของอีเมล ผู้ใช้งานสามารถปรับแต่งค่าได้ตามที่ต้องการ

เครื่องมือ Proton Scribe เปิดให้ใช้งานแล้วสำหรับลูกค้า Mail Essentials, Mail Professional และ Proton Business Suite

Microsoft

ไมโครซอฟท์ร่วมมือกับ OpenAI เปิดให้องค์กรธุรกิจใช้งาน GPT-4o mini ใหม่ใน Azure AI แล้ว

GPT-4o mini เป็นโมเดลขนาดเล็กรุ่นใหม่ที่ชาญฉลาด เร็วขึ้น และราคาไม่แพง ซึ่ง OpenAI เพิ่งประกาศเปิดตัววันนี้ โดยผสานรวมความสามารถด้านข้อความและการมองเห็น (เสียงและวิดีโอจะตามมาในภายหลัง)

By mk Founder on Tag: Mistral, LLM, Artificial Intelligence, NVIDIA
Mistral

Mistral AI บริษัทปัญญาประดิษฐ์จากฝรั่งเศส เปิดตัวโมเดลภาษาเวอร์ชันใหม่ Mistral NeMo 12B ขนาด 12 พันล้านพารามิเตอร์ รองรับ context window ขนาดใหญ่ถึง 128K (โมเดลระดับเดียวกันรองรับ 8k) และสามารถนำมาใช้แทน Mistral 7B ตัวเดิมได้เลย (drop-in replacement)

Mistral NeMo 12B ออกแบบมาให้รองรับหลายภาษาตั้งแต่แรก โดยทำผลงานได้ดีในภาษาอังกฤษ ฝรั่งเศส เยอรมัน สเปน อิตาลี โปรตุเกส จีน ญี่ปุ่น เกาหลี อารบิก ฮินดี ผลการรันสามารถเอาชนะได้ทั้ง Llama 3 8B และ Gemma 2 9B ในเกือบทุกชุดทดสอบ

By arjin Writer on Tag: OpenAI, ChatGPT, LLM, Artificial Intelligence
OpenAI

OpenAI เปิดตัว GPT-4o mini โมเดลปัญญาประดิษฐ์ขนาดเล็กสำหรับนักพัฒนาที่ระบุว่า มีประสิทธิภาพเทียบกับต้นทุน (Cost-Efficient) คุ้มค่าที่สุดของ OpenAI ซึ่งน่าจะทำให้ต้นทุนสำหรับแอพพลิเคชัน AI ต่าง ๆ สามารถเข้าถึงได้มากขึ้น โดยยังได้ประสิทธิภาพที่สูง

GPT-4o mini คิดค่าบริการที่ 15 เซนต์ต่อ 1 ล้านอินพุทโทเค็น และ 60 เซนต์ต่อ 1 ล้านเอาท์พุทโทเค็น ถูกกว่า GPT-3.5 Turbo 60% ในตอนนี้รองรับ API ส่วน text และ vision โดยจะรองรับข้อมูลรวมตั้งแต่ text, image, video และ audio ในอนาคต เอาท์พุทรองรับสูงสุด 16k โทเค็นต่อรีเควส ข้อมูลปรับปรุงถึงตุลาคม 2023

By arjin Writer on Tag: Llama, Meta, LLM, Artificial Intelligence, Europe, EU
Llama

Meta เปิดเผยว่าบริษัทมีแผนออกโมเดลปัญญาประดิษฐ์ Llama ที่รองรับข้อมูลผสมผสาน (Multimodal) ในอีกไม่กี่เดือนข้างหน้า แต่ประเด็นสำคัญนั้น Meta บอกว่าโมเดล Llama ตัวใหม่นี้จะไม่เผยแพร่ให้กับผู้ใช้งานในกลุ่มประเทศสหภาพยุโรปหรือ EU

โดยเหตุผลที่ Meta ตัดสินใจเช่นนั้นเป็นเพราะ Meta มองว่าทิศทางของหน่วยงานกำกับดูแลของ EU มีลักษณะที่คาดเดาได้ยาก จึงเลือกไม่เผยแพร่โมเดลไปเลยดีกว่า

By arjin Writer on Tag: OpenAI, Artificial Intelligence, LLM
OpenAI

OpenAI เผยแพร่งานวิจัยในการพัฒนาอัลกอริทึม เพื่อทำให้โมเดล AI ภาษาขนาดใหญ่หรือ LLM พัฒนาความสามารถในการอธิบายสิ่งต่าง ๆ ให้คนอื่นเข้าใจได้ดีขึ้น เรียกวิธีการนี้ว่า Prover-Verifier Games

การทำงานนั้นผู้วิจัยใช้โมเดล AI สองโมเดล โมเดลหนึ่งมีประสิทธิภาพสูงกว่าเป็น Prover หรือคนอธิบายคำตอบ และโมเดลที่ประสิทธิภาพน้อยกว่าเป็น Verifier ทำหน้าตรวจสอบความถูกต้องของคำตอบที่ได้รับ หน้าที่ของ Prover คือให้คำตอบที่ทำให้อีกฝ่ายเชื่อว่าถูกต้องที่สุด ส่วน Verifier ต้องตอบว่าคำตอบที่ได้นั้นถูกต้องหรือไม่ ซึ่งหลายกรณีเป็นคำตอบที่มั่ว แต่ Prover ใช้คำอธิบายทำให้ไขว้เขว

By arjin Writer on Tag: Claude, Anthropic, Artificial Intelligence, LLM, Mobile App
Claude

Anthropic บริษัทด้านปัญญาประดิษฐ์ผู้พัฒนา Claude เปิดตัวแอปบนระบบปฏิบัติ iOS สำหรับคนใช้ iPhone และ iPad นอกจากนี้ยังเปิดตัวแพ็คเกจจ่ายเงินสำหรับลูกค้าองค์กรด้วย

โดยแพ็คเกจสำหรับลูกค้าองค์กรมีชื่อว่า Team plan เพื่อเพิ่มการปกป้องข้อมูลและความปลอดภัยสำหรับองค์กรที่ต้

Anthropic เปิดตัวแอป Claude บน Android แล้ว หลังจากออกเวอร์ชัน iOS เมื่อเดือนพฤษภาคมที่ผ่านมา สามารถดาวน์โหลดได้ผ่าน Google Play

By arjin Writer on Tag: Mistral, LLM, Artificial Intelligence, Math, Code
Mistral

Mistral AI บริษัทปัญญาประดิษฐ์จากฝรั่งเศสเผยแพร่โมเดล LLM แบบโอเพนซอร์สสองโมเดลใหม่ สำหรับการแก้ปัญหาทางคณิตศาสตร์และการเขียนโค้ดโดยเฉพาะ

โมเดลแรกคือ Codestral Mamba ขนาด 7B พารามิเตอร์ ทำงานได้ดีสำหรับงานการเขียนโค้ด มีจุดเด่นรองรับการประมวลผลที่รวดเร็วสำหรับงานโค้ดที่รันบน local ผลทดสอบทำงานได้ดีกว่า LLM ทั่วไปเท่าตัว และดีกว่าโมเดลที่ออกแบบมาสำหรับงานเขียนโค้ดขนาดเท่ากันอย่าง CodeLlama 7B, CodeGemma-1.17B หรือ DeepSeek v1.5 7B

Microsoft Research

ทีมนักวิจัยของไมโครซอฟท์ เผยแพร่งานวิจัย SpreadsheetLLM โมเดล AI ที่ทำหน้าที่แปลงข้อมูลสเปรดชีท (Excel, Google Sheets) ให้เป็นฟอร์แมตที่ทำงานได้ดีบนโมเดลภาษาขนาดใหญ่ (LLM - Large Language Model) เพื่อให้ LLM เข้าใจเนื้อหาในสเปรดชีทได้ดีขึ้น และทำงานตรงกับสิ่งที่ต้องการ

By lew Founder on Tag: Alibaba, LLM
Alibaba

DAMO Academy สถาบันวิจัยของ Alibaba เปิดตัว SeaLLM เวอร์ชั่นที่ 3 เป็นโมเดล LLM เน้นความสามารถในภาษาแถบอาเซียนสูงกว่าโมเดลในขนาดใกล้เคียงกันตัวอื่นๆ แถมยังเอาชนะ Qwen2 ของ Alibaba Cloud ไปได้

Subscribe to LLM