Image

Large Language Model

By mk Founder on Tag: JetBrains, IDE, Development, Programming, LLM
JetBrains

JetBrains ออกอัพเดตเวอร์ชัน 2024.1 ให้กับ IDE ทุกตัวในสังกัด เพิ่มฟีเจอร์ใหม่ full line code completion ใช้พลัง AI คาดเดาโค้ดบรรทัดต่อไปที่เราจะพิมพ์ใน editor โดยเป็นการคาดเดา "ทั้งบรรทัด" และสามารถทำงานได้แบบออฟไลน์ ไม่ต้องต่อเน็ต

การทำงานของ full line code completion จะแสดงข้อความสีเทาในบรรทัดถัดไป และสามารถกด tab เพื่อให้ editor เติมบรรทัดนั้นให้เราได้ ฟีเจอร์นี้รองรับโค้ดในภาษา Java, Kotlin, Python, JavaScript, TypeScript, CSS, PHP, Go, Ruby

By mk Founder on Tag: Replit, LLM, Programming
Replit

Replit บริษัทผู้สร้าง IDE ผ่านเบราว์เซอร์ ที่ช่วงหลังเริ่มใช้งาน AI ช่วยเขียนโค้ด เปิดตัวฟีเจอร์ Code Repair ที่นำ LLM มาปรับแต่งเพื่อเน้นการแก้บั๊กโดยเฉพาะ

Replit บอกว่าการนำ LLM มาช่วยเขียนโค้ดที่ใช้กันอยู่ทุกวันนี้ เกิดจากการเทรนด้วยข้อมูลซอร์สโค้ด ผสมกับข้อมูลการพูดคุยกันของมนุษย์ เช่น กระทู้ใน StackExchange หรือ GitHub issue จึงมีข้อจำกัดเรื่องการขาดบริบทด้านสภาพแวดล้อมในการพัฒนา (development environment) ที่โปรแกรมเมอร์แต่ละคนใช้งาน

By arjin Writer on Tag: Apple, Artificial Intelligence, Siri, LLM
Apple

ทีมนักวิจัยของแอปเปิลเผยแพร่ผลงาน AI ที่เพิ่มความสามารถเข้าใจบริบท (context) ของคำถามจากผู้ใช้งาน โดยอ้างอิงจากสิ่งที่ปรากฏบนหน้าจอของผู้ใช้งาน

ระบบ AI นี้มีชื่อเรียกว่า ReALM ย่อมาจาก Reference Resolution As Language Modeling เป็นโมเดล LLM ที่สามารถเข้าใจคำถามซึ่งไม่ชัดเจนหรือกำกวม ด้วยการหาข้อมูลเพิ่มเติมจากสิ่งที่ปรากฏบนหน้าจอโทรศัพท์ ทำให้บทสนทนามีความลื่นไหลและเป็นธรรมชาติมากยิ่งขึ้น

By arjin Writer on Tag: Anthropic, LLM, Artificial Intelligence
Anthropic

ทีมนักวิจัยของ Anthropic บริษัท AI เจ้าของแชทบอต Claude เผยแพร่รายงานเกี่ยวกับช่องโหว่ของโมเดล AI ภาษาขนาดใหญ่ (LLM - large language model) ซึ่งสามารถทำให้ LLM ให้คำตอบที่ไม่เหมาะสมหรือเป็นอันตรายออกมาได้ แม้ผู้พัฒนาจะเขียนกฎป้องกันไว้แล้วก็ตาม

ช่องโหว่ที่รายงานเกิดจากการสร้างบทสนทนาถามตอบกับ LLM ที่ต่อเนื่องเป็นชุด จน LLM เกิดการเรียนรู้บริบท (in-context learning) ของเนื้อหาที่ถาม ทำให้กรอบหัวข้อที่สนใจแคบลงเรื่อย ๆ และยอมตอบคำถามที่ไม่เหมาะสมหรืออันตรายออกมา

By lew Founder on Tag: Cloudflare, LLM, Artificial Intelligence
Cloudflare

Cloudflare ปรับบริการ Workers AI สำหรับการรันโมเดลปัญญาประดิษฐ์เข้าสู่สถานะให้บริการทั่วไป (generally available - GA) โดยจะเริ่มคิดเงินกับ 10 โมเดลที่เข้าสู่สถานะ GA เช่นกัน แต่ไม่คิดเงินสำหรับโมเดลที่ยังอยู่ในสถานะเบต้า

ความแตกต่างของ Workers AI จากบริการอื่นๆ คือ Cloudflare มีศูนย์ข้อมูลพร้อมชิปกราฟิกติดตั้งอยู่ทั่วโลก รวมถึงกรุงเทพมหานครด้วย การปรับสถานะ GA ครั้งนี้ทางบริษัทกระจายโหลดข้ามเมืองให้โดยอัตโนมัติในกรณีที่ชิปกราฟิกบางเมืองเต็ม ทำให้โดยรวมสามารถเปิดโควต้าให้นักพัฒนาใช้งานได้อิสระขึ้น

By mk Founder on Tag: Amazon, LLM, Artificial Intelligence, Anthropic, Rumors, Claude
Amazon

เราเห็น Amazon แก้ปัญหาเรื่องการขาดโมเดล LLM ความสามารถสูง ด้วยการลงทุน 4 พันล้านดอลลาร์ใน Anthropic เพื่อเข้าถึงการใช้งานโมเดล Claude ที่เวอร์ชันล่าสุดทำคะแนนได้ดีกว่า GPT-4

ถึงแม้เงินแก้ปัญหาในระยะสั้นได้ แต่ก็เกิดคำถามตามมา (ในหมู่พนักงานเองด้วย) ว่าบริษัทยักษ์ใหญ่ระดับ Amazon ไม่มีศักยภาพสร้างโมเดล LLM ของตัวเองได้เลยหรือ (ปัจจุบัน Amazon มีโมเดลของตัวเองชื่อ Titan ให้ใช้งานบน AWS แม้ยังอาจสู้ Claude ไม่ได้ก็ตาม)

By tontan Contributor on Tag: Grok, xAI, Elon Musk, LLM, Artificial Intelligence
Grok

xAI บริษัท AI ของ Elon Musk ได้เปิดตัวโมเดล Grok-1.5 โดยเพิ่มความสามารถรองรับข้อความขนาดยาวสูงสุด 128,000 โทเคน

นอกจากนี้ ผลการวัดประสิทธิภาพบนชุดทดสอบ (benchmark) ของโมเดล Grok-1.5 เช่น MATH ทำได้ถึง 50.6% (4-shot) และ GSM8K ทำได้ 90% (8-shot) สามารถเอาชนะโมเดล Mistral Large ของบริษัท Mistral รวมถึงโมเดล Grok-1 ที่เพิ่งแจกจ่ายโมเดลออกไป แต่ยังคงแพ้ Claude 3 Opus กับ GPT-4 ในหลายชุดทดสอบ

By lew Founder on Tag: Databricks, LLM
Databricks

Databricks ปล่อยโมเดล DBRX ที่เป็น LLM ระดับความสามารถใกล้เคียงกับ Gemini Pro 1.0 แต่ชูจุดเด่นด้านความเร็วในการตอบคำถาม และความสามารถด้านการเขียนโปรแกรมหรือแก้ปัญหาคณิตศาสตร์

DBRX อาศัยโครงสร้างแบบ mixture-of-experts (MoE) ภายในมีโมเดลย่อยเชี่ยวชาญแต่ละหัวข้อทั้งหมด 16 ชุด และระหว่างการทำงานจะรันทีละ 4 ชุด รวมโมเดลรวม 132 พันล้านพารามิเตอร์แต่รันจริงทีละ 36 พันล้านพารามิเตอร์ ชุดข้อมูลที่ใช้ขนาด 12 ล้านล้านโทเค็น ฝึกด้วย context windows ขนาด 32k โทเค็น

By arjin Writer on Tag: OpenAI, Artificial Intelligence, Video, LLM, Sora
OpenAI

OpenAI นำเสนอตัวอย่างผลงานที่สร้างขึ้นจาก Sora เครื่องมือสร้างคลิปวิดีโอสั้นคุณภาพสูงด้วย AI จากการป้อน prompt ซึ่งร่วมมือกับผู้ผลิตผลงานหลายราย ตามที่มีข่าวก่อนหน้านี้ โดยมีทั้งศิลปิน, นักออกแบบ, ครีเอทีฟ จนถึงผู้ผลิตภาพยนตร์

ผลงานแรกคือหนังสั้น "Air Head" โดยสตูดิโอ shy kids จากแคนาดา เล่าเรื่องราวของมนุษย์หัวลูกโป่ง ซึ่งทีมผู้ผลิตบอกว่า Sora ทำให้พวกเขาสามารถผลิตผลงานแนวเซอร์เรียลที่เดิมทำได้ยาก จึงเป็นโอกาสของผู้ผลิตที่จะนำเสนอเนื้อหาแบบใหม่

By arjin Writer on Tag: Apple, Baidu, Rumors, Artificial Intelligence, LLM, China
Apple

The Wall Street Journal รายงานโดยอ้างแหล่งข่าวที่เกี่ยวข้อง บอกว่าแอปเปิลได้เริ่มเจรจากับ Baidu เพื่อนำ Generative AI มาใส่ใน iPhone และอุปกรณ์อื่น สำหรับเวอร์ชันที่ขายในจีน เพื่อให้เป็นไปตามกฎหมายที่โมเดล AI ที่นำมาใช้งาน ต้องผ่านการรับรองของหน่วยงานในจีนก่อน

ปัจจุบันมีโมเดล AI ที่ทางการจีนอนุมัติมากกว่า 40 โมเดล ซึ่งรวมทั้งแชทบอต Ernie ของ Baidu โดยยังไม่มีโมเดลที่พัฒนาจากบริษัทนอกจีนที่ได้รับการอนุมัติ

By arjin Writer on Tag: Artificial Intelligence, LLM, Sakana AI
Artificial Intelligence

Sakana AI บริษัทวิจัยด้าน AI จากญี่ปุ่น ที่ก่อตั้งโดย David Ha และ Llion Jones อดีตนักวิจัยจากกูเกิล ซึ่งมีผลงานการออกแบบโครงสร้าง Deep Learning เปิดตัว "Evolutionary Model Merge" ระบุว่าเป็นวิธีพัฒนาโมเดล AI โดยใช้แนวทางให้รวมโมเดลให้มีวิวัฒนาการ ได้ออกมาเป็นโมเดลใหม่ตามการใช้งานแต่ละประเภทที่ดีที่สุด และสามารถพัฒนาตัวเองขึ้นได้

By lew Founder on Tag: Jensen Huang, NVIDIA, LLM
Jensen Huang

ในงาน GTC 2024 ระหว่างช่วงถามตอบนักข่าว Jensen Huang ระบุถึงผลกระทบของ generative AI ว่าสามารถใช้งานได้มากกว่าแค่แชตบอตอย่าง ChatGPT ในทุกวันนี้เพราะเราสามารถแปลงข้อมูลให้อยู่ในรูปแบบเดียวกับที่ ChatGPT มองเห็น

By arjin Writer on Tag: Apple, Artificial Intelligence, LLM, Google, Gemini, Rumors
Apple

จากรายงานข่าวก่อนหน้านี้ของ Bloomberg ว่าแอปเปิลกำลังเจรจากับกูเกิล รวมทั้งผู้พัฒนา AI รายอื่น เพื่อนำ Generative AI หรือ AI สร้างเนื้อหา มาใส่ใน iPhone ล่าสุด The New York Times ก็ร่วมยืนยันข่าวนี้จากแหล่งข่าวของตนเอง ว่าแอปเปิลกำลังเจรจากับกูเกิลจริง

The New York Times อ้างแหล่งข่าว 3 ราย บอกว่าการเจรจาของสองฝ่ายตอนนี้ยังเป็นขั้นต้น รายละเอียดข้อตกลงยังไม่มีการกำหนดออกมา ขณะเดียวกันแอปเปิลก็พูดคุยกับบริษัท AI อื่นด้วยเช่นกัน เป้าหมายเพื่อนำโมเดลภาษาขนาดใหญ่หรือ LLM มาใช้เรียนรู้ข้อมูลใน iPhone แล้วจัดการกับสร้างเนื้อหาขึ้นมา

By mk Founder on Tag: Gemini, Fitbit, Google, Health, LLM, Artificial Intelligence
Gemini

กูเกิลประกาศความคืบหน้าเรื่อง AI เพื่อการแพทย์หลายอย่าง โดยมีทั้งการใช้โมเดลรุ่นเดิม PaLM 2 และโมเดลรุ่นใหม่ Gemini

PaLM 2

ปีที่แล้วกูเกิลนำ PaLM 2 โมเดลภาษารุ่นของปี 2023 มาปรับแต่ง (fine-tune) เพื่อการแพทย์ในชื่อ Med-PaLM 2 แล้วพัฒนาต่อเป็นชุดของโมเดลหลายๆ ตัวชื่อ MedLM เปิดให้เช่าใช้งานบนบริการ Vertex AI ของ Google Cloud

ล่าสุดกูเกิลออก MedLM for Chest X-ray นำโมเดลไปช่วยอ่านฟิล์มเอกซเรย์หน้าอก (เช่น ปอดและหัวใจ) ตอนนี้เริ่มเปิดให้ลูกค้าทดสอบแบบจำกัดวงแล้ว

By arjin Writer on Tag: Snapdragon, Qualcomm, SoC, Processor, Artificial Intelligence, LLM
Snapdragon

Qualcomm เปิดตัวชิปรุ่นใหม่ Snapdragon 8s Gen 3 สำหรับสมาร์ทโฟน โดยมีจุดเด่นทั้งการรันโมเดล AI แบบ On Device รวมทั้งงานถ่ายภาพและเกมมิ่ง

Snapdragon 8s Gen 3 พัฒนาบนเทคโนโลยี 4 นาโนเมตร มีซีพียู 8 คอร์ สูตร 1+4+3 คอร์หลัก Cortex X4, 4 คอร์ Performance และ 3 คอร์ Efficiency รองรับการรันโมเดล AI แบบ LLM ยอดนิยมหลายตัว สูงสุดถึงระดับ 10 พันล้านพารามิเตอร์ เช่น Baichuan-7B, Llama 2, Gemini Nano และ Zhipu ChatGLM

By lew Founder on Tag: LLM, Security, Hong Kong
LLM

ทีมวิจัยจาก Hong Kong Polytechnic University รายงานถึงการพัฒนาโมเดลปัญญาประดิษฐ์ LLM4Decompile โมเดลเฉพาะทางสำหรับการแปลงไฟล์ assembly ให้กลับมาเป็นโค้ดภาษา C อีกครั้ง จากเดิมที่เคยมีรายงานกันก่อนหน้านี้แล้วว่า LLM ทั่วไป เช่น GPT-4 ก็สามารถ decompile โค้ดได้

By arjin Writer on Tag: Apple, Research, Artificial Intelligence, LLM
Apple

นักวิจัยของแอปเปิลเผยแพร่งานวิจัยของ MM1 ซึ่งเกี่ยวกับกระบวนการเทรนข้อมูลแบบผสมผสาน ว่าการเทรนข้อมูลแต่ละรูปแบบที่ต่างกัน ตลอดจนโครงสร้างโมเดล ส่งผลต่อประสิทธิภาพในการทดสอบ AI นั้นอย่างไร

ส่วนหนึ่งของงานวิจัยนี้พบว่าตัวเลือกวิธีเข้ารหัสรูปภาพ และความละเอียดของภาพที่ใช้เทรน มีผลกระทบมากต่อประสิทธิภาพของโมเดล มากกว่าการออกแบบส่วนเชื่อมต่อต่าง ๆ ของข้อมูล นอกจากนี้ยังพบโมเดลขนาด 30 พันล้านพารามิเตอร์ ตัวหนึ่งของ MM1 มีความสามารถในการเรียนรู้จากบริบทข้อมูลดีที่สุด รองรับการ prompt ที่ต่อเนื่องไปเรื่อย ๆ ได้

By arjin Writer on Tag: Grok, xAI, Elon Musk, Artificial Intelligence, Open Source, LLM
Grok

xAI สตาร์ทอัพด้าน AI ของ Elon Musk โอเพนซอร์ส Grok-1 โมเดล LLM ของบริษัท ซึ่งในซอร์สมีทั้งค่าพื้นฐานจำเป็นคือ Weight และโครงสร้างเครือข่าย ตามที่ Musk เคยประกาศไว้ก่อนหน้านี้

Grok-1 เป็นโมเดลขนาด 314 พันล้านพารามิเตอร์ ใช้เทคนิคการเรียนรู้แบบ Mixture-of-Experts (MoE) ตัวโอเพนซอร์สนี้เป็นโมเดลในระยะก่อนการเทรน (Pre-training) สถานะ ณ เดือนตุลาคม 2023 จึงยังไม่ได้ถูกปรับแต่งเพื่อแอพพลิเคชันหรือลักษณะการนำไปใช้งานใดโดยเฉพาะ

สามารถดูรายละเอียดเพิ่มเติมได้ที่ github.com/xai-org/grok

ที่มา: xAI

By lew Founder on Tag: LLM, Artificial Intelligence, AMD, ROCm
LLM

Ollama ซอฟต์แวร์สำหรับรันปัญญประดิษฐ์ในกลุ่ม LLM ออกเวอร์ชั่น 0.1.29 รองรับการ์ด AMD ผ่านซอฟต์แวร์ ROCm ตั้งแต่รุ่นใช้งานตามบ้าน Radeon, รุ่นเวิร์คสเตชั่น, และรุ่นเซิร์ฟเวอร์ในกลุ่ม Instinct

ที่จริงแล้ว Ollama รองรับ ROCm มาระยะหนึ่งแล้วอย่างเงียบๆ แต่ยังมีบั๊กอยู่จำนวนหนึ่ง และเวอร์ชั่นนี้เป็นเวอร์ชั่นแรกที่โครงการรองรับเป็นทางการ สามารถใช้งานบนเวอร์ชั่น ลินุกซ์, วินโดวส์, และ Docker

By arjin Writer on Tag: OpenAI, Artificial Intelligence, Video, LLM, Sora
OpenAI

เมื่อเดือนที่แล้ว OpenAI ได้เปิดตัว Sora โมเดล AI สร้างวิดีโอสั้นแบบ Text-to-Video ที่ให้ผลลัพธ์ความละเอียดสูง และคลิปยาวสูงสุดถึง 1 นาที จนเป็นที่พูดถึงในวงกว้างที่ผลกระทบที่อาจเกิดขึ้นจากนี้ แต่ OpenAI ก็บอกว่า Sora ยังมีสถานะขั้นต้น ต้องประเมินความเสี่ยงอีกหลายอย่างก่อนเปิดให้ใช้งานทั่วไป

ล่าสุด The Wall Street Journal ได้สัมภาษณ์พิเศษ Mira Murati ซีทีโอ OpenAI (ที่เคยเป็นซีอีโอชั่วคราว 2 วัน) ถึงแผนงานเกี่ยวกับ Sora มีประเด็นที่น่าสนใจหลายอย่าง

Subscribe to LLM