Image

Large Language Model

By mk Founder on Tag: Claude, Anthropic, LLM, Artificial Intelligence, AWS
Claude

Anthropic เปิดให้บริการโมเดล Claude 3 Haiku ซึ่งเป็นโมเดลขนาดเล็กสุดในชุด Claude 3 ที่เปิดตัวไปเมื่อต้นเดือน

จุดเด่นของ Claude 3 Haiku คือการเป็นโมเดลขนาดเล็ก ราคาถูก แต่ให้คำตอบคุณภาพดีกว่าโมเดลคู่แข่งในระดับเดียวกัน (GPT-3.5 และ Gemini 1.0 Pro) และออกแบบโครงสร้างราคาให้เหมาะกับการใช้งานองค์กร ที่ต้องการใส่ prompt ยาวกว่าผู้ใช้ทั่วไป (เช่น ยัดเอกสารขององค์กรเข้าไปทั้งก้อน) ทาง Anthropic ยกตัวอย่างการประมวลผลเอกสารคำตัดสินของศาลความยาว 400 ชิ้น ชิ้นละประมาณ 10,000 โทเคน ในราคาเพียง 1 ดอลลาร์

By arjin Writer on Tag: Microsoft Copilot, Microsoft, LLM, Artificial Intelligence
Microsoft Copilot

Microsoft Copilot มีการปรับปรุงใหญ่ โดยผู้ใช้งานทั่วไปได้ใช้ GPT-4 Turbo แทนที่ GPT-4 เดิม ซึ่งมีจุดเด่นคือโมเดลถูกเทรนด้วยชุดความรู้ใหม่กว่าถึงเมษายน 2023 และมีความสามารถอื่นเพิ่มเติมจาก GPT-4 เดิม

ข้อมูลนี้ถูกเปิดเผยโดย Mikhail Parakhin หัวหน้าทีม Windows ซึ่งโพสต์ใน X

GPT-4 Turbo จะถูกใช้งานใน Copilot เวอร์ชันฟรี รองรับทั้งโหมด Creative และ Precise แต่หากยังต้องการใช้ GPT-4 เดิม ต้องเป็นลูกค้า Copilot Pro จึงจะได้ปุ่มปิดให้ไปใช้ GPT-4 เดิม

By lew Founder on Tag: LLM, Artificial Intelligence, Programming
LLM

Cognition Labs สตาร์ตอัพปัญญาประดิษฐ์เปิดตัว Devin ปัญญาประดิษฐ์แบบ agent ที่วางแผนการทำงาน จากนั้นเขียนโค้ด, ดูผลลัพธ์, และแก้ปัญหาได้ในตัวเองจนกว่างานจะเสร็จ

Devin ทำงานในสภาพแวดล้อมปิด มี shell ของเซิร์ฟเวอร์ส่วนตัว, ตัวแก้ไขโค้ด, และเบราว์เซอร์ และมีหน้าจอรายงานผลการทำงานว่าถึงขั้นตอนไหน หรือกำลังทำอะไรอยู่ โดยรวมแล้ว Devin ทำงานเหมือนนักพัฒนาคนหนึ่งในทีมงานและผู้ควบคุมยังสามารถแนะนำแนวทางการทำงานระหว่างทางได้

By lew Founder on Tag: Google, ASEAN, LLM
Google

กูเกิลร่วมมือกับโครงการ AI Singapore เปิดโครงการ SEALD (Southeast Asian Languages in One Network Data) สร้างชุดข้อมูลภาษาสำหรับใช้งานกับ large language model (LLM) ที่เน้นชาติอาเซียนโดยเฉพาะ โดยภาษาชุดแรกได้แก่ อินโดนีเซีย, ไทย, ทมิฬ, ฟิลิปปินส์, และพม่า

ตัวโครงการไม่ได้จำกัดเฉพาะชุดข้อมูล แต่รวมถึงการพัฒนาโมเดลแปลภาษา, สร้างแนวปฎิบัติในการสร้างชุดข้อมูล, สร้างเครื่องมือแปลงภาษา (translocalization), และเผยแพร่แนวทางการสร้างโมเดลในภาษาในชาติเอเชียตะวันออกเฉียงใต้ โดยขุดข้อมูลที่ได้จากโครงการนี้จะเป็นโอเพนซอร์สให้หน่วยงานอื่นๆ นำไปสร้าง LLM ได้ต่อไป

By lew Founder on Tag: LLM, Kai Fu Lee, Artificial Intelligence
LLM

01.AI บริษัทปัญญาประดิษฐ์จีนที่ก่อตั้งโดย Kai-Fu Lee อดีตผู้บริหารกูเกิล ออกโมเดล LLM ในชื่อ Yi รุ่นล่าสุดที่ปรับปรุงหลายด้านโดยเฉพาะการรองรับข้อมูลขนาดใหญ่ จากเดิมสูงสุด 32,000 โทเค็น เป็น 200,000 โทเค็นตามที่ประกาศไว้ก่อนหน้านี้

ระหว่างทางนับแต่วันประกาศเปิดตัวครั้งแรก Yi มีออกเวอร์ชั่นย่อยๆ มาอีกหลายเวอร์ชั่น เช่นโมเดลแบบแชต, โมเดลขนาด 9B, และโมเดลรองรับรูปภาพในตัว

By arjin Writer on Tag: Gemini, LLM, Google, Artificial Intelligence
Gemini

กูเกิลประกาศเพิ่มความสามารถใหม่ให้ Gemini โดยผู้ใช้งานสามารถเลือกบางส่วน หรือทั้งหมดของคำตอบจาก Gemini เพื่อปรับแก้ไข ให้ Gemini ตอบใหม่ให้ตรงกับความต้องการมากขึ้น โดยหากคำตอบนั้นสามารถใช้งานฟีเจอร์นี้ได้ ไอคอนดินสอพร้อมประกายจะปรากฎให้ Modify selected text

ตัวอย่างการแก้ไขคำตอบ เช่น เมื่อให้ Gemini วางแผนทริป 3 วัน ก็จะได้คำตอบแบบ 3 วัน แต่เราสามารถแก้ไขคำตอบโดยบอกว่า ขอระยะเวลาที่ยาวกว่านั้นเป็น 4 วัน Gemini ก็จะปรับปรุงคำตอบบนเงื่อนไข 4 วันให้ ซึ่งเป็นผลลัพธ์ที่ตรงกับความต้องการมากขึ้น และอยู่ในประเด็นเดิม

By lew Founder on Tag: Cloudflare, LLM
Cloudflare

Cloudflare ประกาศเตรียมเปิดบริการ Firewall for AI ชุดความสามารถใหม่สำหรับลูกค้าองค์กรที่เริ่มใช้งานแชตบอตในกลุ่ม LLM เพิ่มขึ้น โดยพยายามป้องกันทั้งการยิงเกินกำหนด, การส่งข้อมูลส่วนบุคคลเข้าออก, และการยิง prompt injection เพื่อเปลี่ยนพฤติกรรมของแชตบอต

บริการชุดนี้จะปิดให้ผู้ใช้คอนฟิกว่าส่วนใดของ JSON เป็น prompt สำหรับ LLM เพื่อมาวิเคราะห์เพิ่มเติม สามารถตั้งไฟร์วอลล์ให้บล็อคแชตได้ตามหัวข้อ เช่น เกี่ยวกับศาสนา, การเมือง, หรือเรื่องทางเพศ

By lew Founder on Tag: Claude, Anthropic, LLM
Claude

Anthropic บริษัทปัญญาประดิษฐ์ด้าน LLM เปิดตัวโมเดล Claude 3 โดยจุดเด่นสำคัญคือรุ่นสูงสุดนั้นทำคะแนนชนะ GPT-4 แทบทุกชุดทดสอบ และยังชนะ Gemini Ultra อีกด้วย

Claude 3 ประกอบด้วยรุ่นย่อย 3 รุ่น จากใหญ่ไปเล็กได้แก่ Opus ที่ชนะ GPT-4, Sonnet ใกล้เคียงกับ GPT-4, และ Haiku ที่อยู่ระดับเหนือกว่า GPT-3.5 โดยตัว Haiku นั้นออกแบบให้รันงานได้เร็ว เช่นการอ่านเอกสารความยาวเกินหมื่นโทเค็นก็ยังใช้เวลาไม่ถึง 3 วินาที โมเดลทั้งสามรุ่นรองรับการอ่านภาพ, ไฟล์เอกสาร, และ flowchart ต่างๆ โดยทำคะแนนใกล้เคียงกับ Gemini Ultra

By arjin Writer on Tag: Brave, LLM, Browser, Android
Brave

เบราว์เซอร์ Brave ที่ชูจุดขายเรื่องความเป็นส่วนตัว ประกาศว่าฟีเจอร์ Leo ปัญญาประดิษฐ์ผู้ช่วย ที่เปิดตัวก่อนหน้านี้สำหรับผู้ใช้งานงานเดสก์ท็อป ตอนนี้ขยายมายังผู้ใช้ Brave บน Android แล้ว

Leo บน Android มีความสามารถเหมือนกันบนเดสก์ท็อป เช่น สรุปเนื้อหาเว็บเพจหรือวิดีโอแบบเรียลไทม์, ตอบคำถามที่อิงคำตอบจากเนื้อหาในคอนเทนต์นั้น, สร้างเนื้อหาแบบยาว, แปลเว็บเพจหรือวิเคราะห์, เขียนทรานสคริปต์ของวิดีโอหรือเสียง ตลอดจนสามารถเขียนโค้ดได้ด้วย ซึ่งทั้งหมดยังคงรักษาความเป็นส่วนตัว ข้อมูลถูกกำหนดเป็นนิรนาม

By arjin Writer on Tag: Hugging Face, Artificial Intelligence, NVIDIA, ServiceNow, LLM, Programming
Hugging Face

ServiceNow, Hugging Face และ NVIDIA เปิดตัว StarCoder2 ชุดโมเดลภาษาขนาดใหญ่ (LLM) ที่เปิดให้ใช้งานได้ฟรี (open-access) สำหรับงานเขียนโค้ด ซึ่งมีจุดเด่นคือประสิทธิภาพการทำงาน ความโปร่งใสของ AI และช่วยในการจัดการต้นทุน

StarCoder2 เป็นโครงการของชุมชน BigCode ที่ให้การสนับสนุนโดย ServiceNow และ Hugging Face โมเดลถูกเทรนบนภาษาเขียนโปรแกรม 619 ภาษา ออกแบบมาให้สามารถทำงานร่วมกับแอพพลิเคชันภายในองค์กร สำหรับงานต่าง ๆ เช่น ช่วยสร้างซอร์สโค้ด, สร้างเวิร์กโฟลว์, เขียนสรุปเนื้อหา และอื่น ๆ องค์กรสามารถนำไปใช้งาน โดยอาศัยการปรับแต่งด้วยทรัพยากรที่ไม่ต้องสูงมาก

By arjin Writer on Tag: Apple, Tim Cook, LLM, Artificial Intelligence
Apple

แอปเปิลได้จัดการประชุมสามัญประจำปีผู้ถือหุ้นเมื่อวานนี้ ซึ่งประเด็นที่ผู้ถือหุ้นสอบถามกันเป็นจำนวนมากคือทิศทางของบริษัทกับ AI โดยเฉพาะ Generative AI ซึ่งเป็นหัวข้อหลักในโลกเทคโนโลยีตอนนี้ แต่แอปเปิลยังไม่มีผลิตภัณฑ์โดยตรงเรื่องนี้ออกมา

ซีอีโอ Tim Cook บอกว่า แอปเปิลได้เทเงินจำนวนมากสำหรับการพัฒนาผลิตภัณฑ์ AI และมองเห็นโอกาสที่เป็นนวัตกรรมใหม่ทั้งหมดจาก Generative AI เขาเชื่อว่ามันจะเปลี่ยนแปลงและมอบโอกาสใหม่กับผู้ใช้งานในทุกด้าน

เมื่อถามว่าแล้วผลิตภัณฑ์ด้าน AI จากแอปเปิลจะออกมาเมื่อใด Cook บอกว่ารายละเอียดต่าง ๆ จะเปิดเผย__ภายในปีนี้__

By arjin Writer on Tag: Sundar Pichai, Google, Artificial Intelligence, Gemini, LLM
Sundar Pichai

Sundar Pichai ซีอีโอกูเกิล ออกอีเมลถึงพนักงานในประเด็นที่ Gemini Image Generation โปรแกรมสร้างรูปภาพด้วย AI ทำงานผิดพลาด โดยพยายามให้ผลลัพธ์รูปบุคคลที่แสดงความหลากหลายจนผิดเจตนาของผู้ใช้งาน หรือสร้างรูปที่ผิดไปจากประวัติศาสตร์

Pichai บอกว่าสิ่งที่เกิดขึ้นเป็นเรื่องที่ไม่สามารถยอมรับได้ และเราทำผิดจริง ๆ ตอนนี้ทีมงานต่างทำงานกันต่อเนื่องทั้งคืนทั้งวันเพื่อแก้ไขปัญหา ซึ่งเริ่มเห็นผลลัพธ์ที่ดีขึ้นเรื่อย ๆ ไม่มี AI ตัวใดที่สมบูรณ์แบบ พวกเรายังอยู่ในช่วงเริ่มต้นของอุตสาหกรรม แต่มาตรฐานที่เราต้องทำนั้นสูง และกูเกิลก็ต้องไปให้ถึงตรงนั้น

By lew Founder on Tag: LLM, Mistral
LLM

Mistral บริษัทปัญญาประดิษฐ์ LLM จากฝรั่งเศสเปิดตัวโมเดลใหม่สองโมเดล โดยไม่ได้เปิดเผยโครงสร้างภายในให้คนภายนอกใช้งานผ่านคลาวด์ สองโมเดล ได้แก่

By lew Founder on Tag: Brave, LLM
Brave

เบราว์เซอร์ Brave เพิ่มฟีเจอร์ให้ปัญญาประดิษฐ์ Leo ผู้ช่วยที่มาพร้อมกับเบราว์เซอร์ โดยในเวอร์ชั่นใหม่ Leo จะสามารถอ่านข้อมูลบนเบราว์เซอร์ได้หลากหลายขึ้น ทำให้ขอความช่วยเหลือเพิ่มเติมได้หลากหลาย

Leo สามารถอ่านข้อมูลในเอกสาร ได้แก่ 1) PDF อ่านข้อมูลไฟล์เอกสาร งานวิจัยต่างๆ เพื่อคุยกับเอกสาร 2) Google Docs สามารถอ่านและแก้ไขเอกสาร 3) Google Sheet วิเคราะห์ตารางและช่วยเขียนสูตรสมการ 4) Slack อ่านข้อความใน thread เพื่อสรุป 5) YouTube แปลงวิดีโอเป็นทรานสคริปต์และสรุปเนื้อหา

By lew Founder on Tag: Stanford, Medical, LLM, Research
Stanford

ทีมวิจัยจากสถาบัน Human-Centered Artificial Intelligence (HAI) ของมหาวิทยาลัยสแตนฟอร์ด รายงานถึงผลทดสอบการใช้งานปัญญาประดิษฐ์ในกลุ่ม LLM ว่าแม้จะมีข่าวว่า LLM สามารถวินิจฉัยโรคได้อย่างน่าทึ่งแต่ก็มีความผิดพลาดสูง ต้องระมัดระวัง

ทีมงานทดสอบการใช้งาน LLM โดยใช้โมเดล 4 ตัว ได้แก่ GPT-4, Claude 2.1, Mistral Medium, และ Gemini Pro เฉพาะ GPT-4 นั้นสร้างแอป retrieval augmented generation (RAG) ครอบอีกชั้นเพื่อทดสอบ โดยวัดว่าเวลาที่ LLM เหล่านี้ตอบคำถามแล้ว สามารถสร้างคำตอบโดยมีการอ้างอิงอย่างถูกต้องหรือไม่

By lew Founder on Tag: AWS, LLM, Mistral
AWS

AWS ประกาศเพิ่มโมเดล Mistral 7B และ Mixtral 8x7B ให้ใช้งานบน AWS Bedrock เร็วๆ นี้ โดยระบุว่าทั้งสองโมเดลมีจุดเด่นเรื่องของความเร็วและค่าใช้จ่ายที่ถูกกว่า นอกจากนี้องค์กรบางส่วนยังอาจต้องการโมเดลที่ตรวจสอบได้ การใช้โมเดลโอเพนซอร์สจึงเป็นทางเลือกสำคัญ

Mixtral 8x7B นั้นมีคะแนนทดสอบค่อนข้างใกล้เคียงกับ GPT-3.5 แต่มีจุดเด่นที่รันได้เร็วมาก โดยตอนนี้ผู้ให้บริการที่เน้นความเร็วอย่าง Groq นั้นโชว์ว่าสามารถรันได้ที่ระดับ 500 token/s เลยทีเดียว

By mk Founder on Tag: MediaTek, Gemini, LLM, SoC, Dimensity
MediaTek

MediaTek ประกาศความสำเร็จในการปรับแต่งโมเดล Google Gemini Nano และ Meta Llama 2 7B ให้รันบนชิป Dimensity 9300 และ 8300 เปิดทางให้ใช้งานฟีเจอร์ Generative AI แบบออฟไลน์ ไม่ต้องผ่านคลาวด์

การรันโมเดลเหล่านี้บนชิป เกิดขึ้นได้เพราะใช้ APU (AI processing unit ตามภาษาของ MediaTek) รุ่นใหม่ที่มีประสิทธิภาพสูงขึ้น

MediaTek ประกาศว่าจะร่วมมือกับกูเกิลเปิดตัวแอพ APK ที่ช่วยให้นักพัฒนาและแบรนด์ OEM รันโมเดล Gemini Nano ของตัวเองบนชิป Dimensity ในเร็วๆ นี้

By lew Founder on Tag: LLM, Programming, Artificial Intelligence
LLM

Phind บริษัทปัญญาประดิษฐ์ LLM สำหรับการช่วยเขียนโค้ดเป็นหลัก เปิดตัวโมเดลของตัวเอง Phind-70B ที่วัดเฉพาะความสามารถในการเขียนโค้ด HumanEval และ CRUXEval ใกล้เคียงกับ GPT-4 มาก แต่ชูความเด่นกว่าที่ความเร็วในการตอบและโมเดลถูกฝึกให้ขยันตอบมากกว่า GPT-4 ที่เคยมีปัญหาไม่ยอมตอบบางคำถาม

ความเร็วในการตอบของ Phind-70B อยู่ที่ 80 token/s เร็วกว่า GPT-4 Turbo ประมาณสี่เท่าตัว และคาดว่าจะเร่งความเร็วได้สูงกว่านี้อีก

By arjin Writer on Tag: Stability AI, Artificial Intelligence, LLM
Stability AI

Stability AI เปิดตัวเครื่องมือสร้างรูปภาพจากข้อความด้วย AI เวอร์ชันล่าสุด Stable Diffusion 3 ตอนนี้อยู่ในสถานะพรีวิวขั้นต้น จึงยังไม่เปิดให้ใช้งานทั่วไปในวงกว้าง แต่ผู้ใช้งานสามารถเข้าร่วมใน waitlist เพื่อทดสอบได้ที่นี่

Stable Diffusion 3 เป็นโมเดลที่มีพารามิเตอร์ตั้งแต่ 800M ถึง 8B พารามิเตอร์ จึงรองรับตัวเลือกและคุณภาพของผลลัพธ์ที่มากยิ่งขึ้น

By mk Founder on Tag: Gemma, Google, LLM, Open Source, Gemini
Gemma

กูเกิลเปิดตัว Gemma โมเดลภาษาแบบโอเพนซอร์ส ที่ได้แรงบันดาลใจมาจาก Gemini โมเดลเชิงพาณิชย์ของตัวเอง และพัฒนาโดยทีม Google DeepMind เหมือนกัน มีโครงสร้างทางเทคนิคบางส่วนเหมือนกัน

กูเกิลปล่อย Gemma ออกมา 2 ขนาดคือ 2B และ 7B (ดาวน์โหลดได้จาก Kaggle หรือ Hugging Face) โดยระบุว่าโมเดลขนาด 7B สามารถเอาชนะคู่แข่งที่ระดับเดียวกันคือ Llama 7B ในเบนช์มาร์คต่างๆ ได้ค่อนข้างทิ้งห่าง และเอาชนะได้แม้กระทั่ง Llama 13B ที่มีขนาดใหญ่กว่าได้ด้วยซ้ำ

Subscribe to LLM