LLM | Blognone

Large Language Model

JetBrains เพิ่มฟีเจอร์ใช้ AI เติมโค้ดบรรทัดถัดไป ทำงานแบบออฟไลน์ไม่ต้องต่อเน็ต

By mk

on 5 April 2024 - 09:22 Tag: JetBrains, IDE, Development, Programming, LLM

JetBrains

JetBrains ออกอัพเดตเวอร์ชัน 2024.1 ให้กับ IDE ทุกตัวในสังกัด เพิ่มฟีเจอร์ใหม่ full line code completion ใช้พลัง AI คาดเดาโค้ดบรรทัดต่อไปที่เราจะพิมพ์ใน editor โดยเป็นการคาดเดา "ทั้งบรรทัด" และสามารถทำงานได้แบบออฟไลน์ ไม่ต้องต่อเน็ต

การทำงานของ full line code completion จะแสดงข้อความสีเทาในบรรทัดถัดไป และสามารถกด tab เพื่อให้ editor เติมบรรทัดนั้นให้เราได้ ฟีเจอร์นี้รองรับโค้ดในภาษา Java, Kotlin, Python, JavaScript, TypeScript, CSS, PHP, Go, Ruby

Replit เปิดตัวโมเดลแก้บั๊กโปรแกรม Code Repair เทรนด้วยข้อมูล Error จริง ชนะ GPT-4

By mk

on 4 April 2024 - 11:14 Tag: Replit, LLM, Programming

Replit

Replit บริษัทผู้สร้าง IDE ผ่านเบราว์เซอร์ ที่ช่วงหลังเริ่มใช้งาน AI ช่วยเขียนโค้ด เปิดตัวฟีเจอร์ Code Repair ที่นำ LLM มาปรับแต่งเพื่อเน้นการแก้บั๊กโดยเฉพาะ

Replit บอกว่าการนำ LLM มาช่วยเขียนโค้ดที่ใช้กันอยู่ทุกวันนี้ เกิดจากการเทรนด้วยข้อมูลซอร์สโค้ด ผสมกับข้อมูลการพูดคุยกันของมนุษย์ เช่น กระทู้ใน StackExchange หรือ GitHub issue จึงมีข้อจำกัดเรื่องการขาดบริบทด้านสภาพแวดล้อมในการพัฒนา (development environment) ที่โปรแกรมเมอร์แต่ละคนใช้งาน

Apple เผยแพร่งานวิจัย AI ที่เข้าใจคำถามกำกวม โดยอาศัยบริบทเพิ่มเติมจากข้อมูลในหน้าจอโทรศัพท์

By arjin

on 3 April 2024 - 17:33 Tag: Apple, Artificial Intelligence, Siri, LLM

Apple

ทีมนักวิจัยของแอปเปิลเผยแพร่ผลงาน AI ที่เพิ่มความสามารถเข้าใจบริบท (context) ของคำถามจากผู้ใช้งาน โดยอ้างอิงจากสิ่งที่ปรากฏบนหน้าจอของผู้ใช้งาน

ระบบ AI นี้มีชื่อเรียกว่า ReALM ย่อมาจาก Reference Resolution As Language Modeling เป็นโมเดล LLM ที่สามารถเข้าใจคำถามซึ่งไม่ชัดเจนหรือกำกวม ด้วยการหาข้อมูลเพิ่มเติมจากสิ่งที่ปรากฏบนหน้าจอโทรศัพท์ ทำให้บทสนทนามีความลื่นไหลและเป็นธรรมชาติมากยิ่งขึ้น

Anthropic เผยแพร่รายงานช่องโหว่ AI ยอมตอบคำถามอันตรายไม่เหมาะสม ถ้ายิงคำถามซ้ำ ๆ ในบริบทที่เกี่ยวข้อง

By arjin

on 3 April 2024 - 15:17 Tag: Anthropic, LLM, Artificial Intelligence

Anthropic

ทีมนักวิจัยของ Anthropic บริษัท AI เจ้าของแชทบอต Claude เผยแพร่รายงานเกี่ยวกับช่องโหว่ของโมเดล AI ภาษาขนาดใหญ่ (LLM - large language model) ซึ่งสามารถทำให้ LLM ให้คำตอบที่ไม่เหมาะสมหรือเป็นอันตรายออกมาได้ แม้ผู้พัฒนาจะเขียนกฎป้องกันไว้แล้วก็ตาม

ช่องโหว่ที่รายงานเกิดจากการสร้างบทสนทนาถามตอบกับ LLM ที่ต่อเนื่องเป็นชุด จน LLM เกิดการเรียนรู้บริบท (in-context learning) ของเนื้อหาที่ถาม ทำให้กรอบหัวข้อที่สนใจแคบลงเรื่อย ๆ และยอมตอบคำถามที่ไม่เหมาะสมหรืออันตรายออกมา

Cloudflare ปรับบริการ Workers AI เข้าเป็น GA เริ่มคิดเงินบางส่วน, นำโมเดลที่ fine-tune เองมาใช้งานได้

By lew

on 2 April 2024 - 23:17 Tag: Cloudflare, LLM, Artificial Intelligence

Cloudflare

Cloudflare ปรับบริการ Workers AI สำหรับการรันโมเดลปัญญาประดิษฐ์เข้าสู่สถานะให้บริการทั่วไป (generally available - GA) โดยจะเริ่มคิดเงินกับ 10 โมเดลที่เข้าสู่สถานะ GA เช่นกัน แต่ไม่คิดเงินสำหรับโมเดลที่ยังอยู่ในสถานะเบต้า

ความแตกต่างของ Workers AI จากบริการอื่นๆ คือ Cloudflare มีศูนย์ข้อมูลพร้อมชิปกราฟิกติดตั้งอยู่ทั่วโลก รวมถึงกรุงเทพมหานครด้วย การปรับสถานะ GA ครั้งนี้ทางบริษัทกระจายโหลดข้ามเมืองให้โดยอัตโนมัติในกรณีที่ชิปกราฟิกบางเมืองเต็ม ทำให้โดยรวมสามารถเปิดโควต้าให้นักพัฒนาใช้งานได้อิสระขึ้น

[ลือ] Amazon กำลังพัฒนาโมเดล Olympus ของตัวเอง ขนาดใหญ่มาก เอาชนะ Claude ได้

By mk

on 31 March 2024 - 09:39 Tag: Amazon, LLM, Artificial Intelligence, Anthropic, Rumors, Claude

Amazon

เราเห็น Amazon แก้ปัญหาเรื่องการขาดโมเดล LLM ความสามารถสูง ด้วยการลงทุน 4 พันล้านดอลลาร์ใน Anthropic เพื่อเข้าถึงการใช้งานโมเดล Claude ที่เวอร์ชันล่าสุดทำคะแนนได้ดีกว่า GPT-4

ถึงแม้เงินแก้ปัญหาในระยะสั้นได้ แต่ก็เกิดคำถามตามมา (ในหมู่พนักงานเองด้วย) ว่าบริษัทยักษ์ใหญ่ระดับ Amazon ไม่มีศักยภาพสร้างโมเดล LLM ของตัวเองได้เลยหรือ (ปัจจุบัน Amazon มีโมเดลของตัวเองชื่อ Titan ให้ใช้งานบน AWS แม้ยังอาจสู้ Claude ไม่ได้ก็ตาม)

xAI เปิดตัว Grok-1.5 รองรับ 128,000 โทเคน, เตรียมใช้กับ 𝕏

By tontan

on 30 March 2024 - 21:43 Tag: Grok, xAI, Elon Musk, LLM, Artificial Intelligence

Grok

xAI บริษัท AI ของ Elon Musk ได้เปิดตัวโมเดล Grok-1.5 โดยเพิ่มความสามารถรองรับข้อความขนาดยาวสูงสุด 128,000 โทเคน

นอกจากนี้ ผลการวัดประสิทธิภาพบนชุดทดสอบ (benchmark) ของโมเดล Grok-1.5 เช่น MATH ทำได้ถึง 50.6% (4-shot) และ GSM8K ทำได้ 90% (8-shot) สามารถเอาชนะโมเดล Mistral Large ของบริษัท Mistral รวมถึงโมเดล Grok-1 ที่เพิ่งแจกจ่ายโมเดลออกไป แต่ยังคงแพ้ Claude 3 Opus กับ GPT-4 ในหลายชุดทดสอบ

Databricks ปล่อย DBRX โมเดล LLM เน้นเขียนโปรแกรม ความเร็วสูง ประหยัดจีพียู

By lew

on 28 March 2024 - 10:30 Tag: Databricks, LLM

Databricks

Databricks ปล่อยโมเดล DBRX ที่เป็น LLM ระดับความสามารถใกล้เคียงกับ Gemini Pro 1.0 แต่ชูจุดเด่นด้านความเร็วในการตอบคำถาม และความสามารถด้านการเขียนโปรแกรมหรือแก้ปัญหาคณิตศาสตร์

DBRX อาศัยโครงสร้างแบบ mixture-of-experts (MoE) ภายในมีโมเดลย่อยเชี่ยวชาญแต่ละหัวข้อทั้งหมด 16 ชุด และระหว่างการทำงานจะรันทีละ 4 ชุด รวมโมเดลรวม 132 พันล้านพารามิเตอร์แต่รันจริงทีละ 36 พันล้านพารามิเตอร์ ชุดข้อมูลที่ใช้ขนาด 12 ล้านล้านโทเค็น ฝึกด้วย context windows ขนาด 32k โทเค็น

OpenAI นำเสนอวิดีโอที่สร้างจาก AI Sora ซึ่งร่วมมือกับศิลปิน-ครีเอทีฟ หลายวงการ

By arjin

on 26 March 2024 - 07:06 Tag: OpenAI, Artificial Intelligence, Video, LLM, Sora

OpenAI

OpenAI นำเสนอตัวอย่างผลงานที่สร้างขึ้นจาก Sora เครื่องมือสร้างคลิปวิดีโอสั้นคุณภาพสูงด้วย AI จากการป้อน prompt ซึ่งร่วมมือกับผู้ผลิตผลงานหลายราย ตามที่มีข่าวก่อนหน้านี้ โดยมีทั้งศิลปิน, นักออกแบบ, ครีเอทีฟ จนถึงผู้ผลิตภาพยนตร์

ผลงานแรกคือหนังสั้น "Air Head" โดยสตูดิโอ shy kids จากแคนาดา เล่าเรื่องราวของมนุษย์หัวลูกโป่ง ซึ่งทีมผู้ผลิตบอกว่า Sora ทำให้พวกเขาสามารถผลิตผลงานแนวเซอร์เรียลที่เดิมทำได้ยาก จึงเป็นโอกาสของผู้ผลิตที่จะนำเสนอเนื้อหาแบบใหม่

[ลือ] Apple เจรจากับ Baidu เพื่อนำ AI มาใส่ iPhone เวอร์ชันขายในจีน

By arjin

on 23 March 2024 - 07:30 Tag: Apple, Baidu, Rumors, Artificial Intelligence, LLM, China

Apple

The Wall Street Journal รายงานโดยอ้างแหล่งข่าวที่เกี่ยวข้อง บอกว่าแอปเปิลได้เริ่มเจรจากับ Baidu เพื่อนำ Generative AI มาใส่ใน iPhone และอุปกรณ์อื่น สำหรับเวอร์ชันที่ขายในจีน เพื่อให้เป็นไปตามกฎหมายที่โมเดล AI ที่นำมาใช้งาน ต้องผ่านการรับรองของหน่วยงานในจีนก่อน

ปัจจุบันมีโมเดล AI ที่ทางการจีนอนุมัติมากกว่า 40 โมเดล ซึ่งรวมทั้งแชทบอต Ernie ของ Baidu โดยยังไม่มีโมเดลที่พัฒนาจากบริษัทนอกจีนที่ได้รับการอนุมัติ

Sakana AI เปิดตัว Method ในการสร้าง AI แบบใหม่ ผสมความสามารถแล้ววิวัฒนาการออกมาเป็นโมเดลใหม่

By arjin

on 22 March 2024 - 12:48 Tag: Artificial Intelligence, LLM, Sakana AI

Artificial Intelligence

Sakana AI บริษัทวิจัยด้าน AI จากญี่ปุ่น ที่ก่อตั้งโดย David Ha และ Llion Jones อดีตนักวิจัยจากกูเกิล ซึ่งมีผลงานการออกแบบโครงสร้าง Deep Learning เปิดตัว "Evolutionary Model Merge" ระบุว่าเป็นวิธีพัฒนาโมเดล AI โดยใช้แนวทางให้รวมโมเดลให้มีวิวัฒนาการ ได้ออกมาเป็นโมเดลใหม่ตามการใช้งานแต่ละประเภทที่ดีที่สุด และสามารถพัฒนาตัวเองขึ้นได้

ทุกอย่างคือโทเค็น ซีอีโอ NVIDIA ชี้ Generative AI ใช้งานได้หลากหลาย เปิดทางปฎิวัติอุตสาหกรรมรอบใหม่

By lew

on 21 March 2024 - 15:00 Tag: Jensen Huang, NVIDIA, LLM

Jensen Huang

ในงาน GTC 2024 ระหว่างช่วงถามตอบนักข่าว Jensen Huang ระบุถึงผลกระทบของ generative AI ว่าสามารถใช้งานได้มากกว่าแค่แชตบอตอย่าง ChatGPT ในทุกวันนี้เพราะเราสามารถแปลงข้อมูลให้อยู่ในรูปแบบเดียวกับที่ ChatGPT มองเห็น

ข้อมูลเพิ่มเติมดีล Apple-Google นำ Gemini มาใส่ iPhone - ยังเป็นขั้นต้น - คุยกับบริษัท AI อื่นด้วย

By arjin

on 20 March 2024 - 07:47 Tag: Apple, Artificial Intelligence, LLM, Google, Gemini, Rumors

Apple

จากรายงานข่าวก่อนหน้านี้ของ Bloomberg ว่าแอปเปิลกำลังเจรจากับกูเกิล รวมทั้งผู้พัฒนา AI รายอื่น เพื่อนำ Generative AI หรือ AI สร้างเนื้อหา มาใส่ใน iPhone ล่าสุด The New York Times ก็ร่วมยืนยันข่าวนี้จากแหล่งข่าวของตนเอง ว่าแอปเปิลกำลังเจรจากับกูเกิลจริง

The New York Times อ้างแหล่งข่าว 3 ราย บอกว่าการเจรจาของสองฝ่ายตอนนี้ยังเป็นขั้นต้น รายละเอียดข้อตกลงยังไม่มีการกำหนดออกมา ขณะเดียวกันแอปเปิลก็พูดคุยกับบริษัท AI อื่นด้วยเช่นกัน เป้าหมายเพื่อนำโมเดลภาษาขนาดใหญ่หรือ LLM มาใช้เรียนรู้ข้อมูลใน iPhone แล้วจัดการกับสร้างเนื้อหาขึ้นมา

กูเกิลนำ Gemini ทำข้อสอบใบอนุญาตแพทย์ ได้คะแนน 91.1%, จับมือ Fitbit พัฒนาโมเดลสุขภาพส่วนบุคคล

By mk

on 20 March 2024 - 07:18 Tag: Gemini, Fitbit, Google, Health, LLM, Artificial Intelligence

Gemini

กูเกิลประกาศความคืบหน้าเรื่อง AI เพื่อการแพทย์หลายอย่าง โดยมีทั้งการใช้โมเดลรุ่นเดิม PaLM 2 และโมเดลรุ่นใหม่ Gemini

PaLM 2

ปีที่แล้วกูเกิลนำ PaLM 2 โมเดลภาษารุ่นของปี 2023 มาปรับแต่ง (fine-tune) เพื่อการแพทย์ในชื่อ Med-PaLM 2 แล้วพัฒนาต่อเป็นชุดของโมเดลหลายๆ ตัวชื่อ MedLM เปิดให้เช่าใช้งานบนบริการ Vertex AI ของ Google Cloud

ล่าสุดกูเกิลออก MedLM for Chest X-ray นำโมเดลไปช่วยอ่านฟิล์มเอกซเรย์หน้าอก (เช่น ปอดและหัวใจ) ตอนนี้เริ่มเปิดให้ลูกค้าทดสอบแบบจำกัดวงแล้ว

Qualcomm เปิดตัว Snapdragon 8s Gen 3 ชิปรุ่นใหม่รองรับการรัน AI แบบ On Device

By arjin

on 18 March 2024 - 21:59 Tag: Snapdragon, Qualcomm, SoC, Processor, Artificial Intelligence, LLM

Snapdragon

Qualcomm เปิดตัวชิปรุ่นใหม่ Snapdragon 8s Gen 3 สำหรับสมาร์ทโฟน โดยมีจุดเด่นทั้งการรันโมเดล AI แบบ On Device รวมทั้งงานถ่ายภาพและเกมมิ่ง

Snapdragon 8s Gen 3 พัฒนาบนเทคโนโลยี 4 นาโนเมตร มีซีพียู 8 คอร์ สูตร 1+4+3 คอร์หลัก Cortex X4, 4 คอร์ Performance และ 3 คอร์ Efficiency รองรับการรันโมเดล AI แบบ LLM ยอดนิยมหลายตัว สูงสุดถึงระดับ 10 พันล้านพารามิเตอร์ เช่น Baichuan-7B, Llama 2, Gemini Nano และ Zhipu ChatGLM

ทีมวิจัยฮ่องกงสร้าง LLM สำหรับ decompile โค้ดโดยเฉพาะ มุ่งวัดเป้ารันได้เหมือนโค้ดเดิม

By lew

on 18 March 2024 - 21:53 Tag: LLM, Security, Hong Kong

LLM

ทีมวิจัยจาก Hong Kong Polytechnic University รายงานถึงการพัฒนาโมเดลปัญญาประดิษฐ์ LLM4Decompile โมเดลเฉพาะทางสำหรับการแปลงไฟล์ assembly ให้กลับมาเป็นโค้ดภาษา C อีกครั้ง จากเดิมที่เคยมีรายงานกันก่อนหน้านี้แล้วว่า LLM ทั่วไป เช่น GPT-4 ก็สามารถ decompile โค้ดได้

Apple เผยแพร่งานวิจัย MM1 โมเดล AI แบบผสมผสาน ที่รองรับ prompt ต่อเนื่องได้ดี

By arjin

on 18 March 2024 - 06:38 Tag: Apple, Research, Artificial Intelligence, LLM

Apple

นักวิจัยของแอปเปิลเผยแพร่งานวิจัยของ MM1 ซึ่งเกี่ยวกับกระบวนการเทรนข้อมูลแบบผสมผสาน ว่าการเทรนข้อมูลแต่ละรูปแบบที่ต่างกัน ตลอดจนโครงสร้างโมเดล ส่งผลต่อประสิทธิภาพในการทดสอบ AI นั้นอย่างไร

ส่วนหนึ่งของงานวิจัยนี้พบว่าตัวเลือกวิธีเข้ารหัสรูปภาพ และความละเอียดของภาพที่ใช้เทรน มีผลกระทบมากต่อประสิทธิภาพของโมเดล มากกว่าการออกแบบส่วนเชื่อมต่อต่าง ๆ ของข้อมูล นอกจากนี้ยังพบโมเดลขนาด 30 พันล้านพารามิเตอร์ ตัวหนึ่งของ MM1 มีความสามารถในการเรียนรู้จากบริบทข้อมูลดีที่สุด รองรับการ prompt ที่ต่อเนื่องไปเรื่อย ๆ ได้

xAI โอเพนซอร์ส Grok-1 โมเดล LLM แล้ว ตามที่ Elon Musk สัญญาไว้

By arjin

on 18 March 2024 - 05:29 Tag: Grok, xAI, Elon Musk, Artificial Intelligence, Open Source, LLM

Grok

xAI สตาร์ทอัพด้าน AI ของ Elon Musk โอเพนซอร์ส Grok-1 โมเดล LLM ของบริษัท ซึ่งในซอร์สมีทั้งค่าพื้นฐานจำเป็นคือ Weight และโครงสร้างเครือข่าย ตามที่ Musk เคยประกาศไว้ก่อนหน้านี้

Grok-1 เป็นโมเดลขนาด 314 พันล้านพารามิเตอร์ ใช้เทคนิคการเรียนรู้แบบ Mixture-of-Experts (MoE) ตัวโอเพนซอร์สนี้เป็นโมเดลในระยะก่อนการเทรน (Pre-training) สถานะ ณ เดือนตุลาคม 2023 จึงยังไม่ได้ถูกปรับแต่งเพื่อแอพพลิเคชันหรือลักษณะการนำไปใช้งานใดโดยเฉพาะ

สามารถดูรายละเอียดเพิ่มเติมได้ที่ github.com/xai-org/grok

ที่มา: xAI

Ollama ระบบรันปัญญาประดิษฐ์ LLM รองรับการ์ด AMD

By lew

on 16 March 2024 - 05:15 Tag: LLM, Artificial Intelligence, AMD, ROCm

LLM

Ollama ซอฟต์แวร์สำหรับรันปัญญประดิษฐ์ในกลุ่ม LLM ออกเวอร์ชั่น 0.1.29 รองรับการ์ด AMD ผ่านซอฟต์แวร์ ROCm ตั้งแต่รุ่นใช้งานตามบ้าน Radeon, รุ่นเวิร์คสเตชั่น, และรุ่นเซิร์ฟเวอร์ในกลุ่ม Instinct

ที่จริงแล้ว Ollama รองรับ ROCm มาระยะหนึ่งแล้วอย่างเงียบๆ แต่ยังมีบั๊กอยู่จำนวนหนึ่ง และเวอร์ชั่นนี้เป็นเวอร์ชั่นแรกที่โครงการรองรับเป็นทางการ สามารถใช้งานบนเวอร์ชั่น ลินุกซ์, วินโดวส์, และ Docker

ซีทีโอ OpenAI บอก AI Text-to-Video Sora จะมีให้ใช้งานภายในปีนี้

By arjin

on 15 March 2024 - 08:36 Tag: OpenAI, Artificial Intelligence, Video, LLM, Sora

OpenAI

เมื่อเดือนที่แล้ว OpenAI ได้เปิดตัว Sora โมเดล AI สร้างวิดีโอสั้นแบบ Text-to-Video ที่ให้ผลลัพธ์ความละเอียดสูง และคลิปยาวสูงสุดถึง 1 นาที จนเป็นที่พูดถึงในวงกว้างที่ผลกระทบที่อาจเกิดขึ้นจากนี้ แต่ OpenAI ก็บอกว่า Sora ยังมีสถานะขั้นต้น ต้องประเมินความเสี่ยงอีกหลายอย่างก่อนเปิดให้ใช้งานทั่วไป

ล่าสุด The Wall Street Journal ได้สัมภาษณ์พิเศษ Mira Murati ซีทีโอ OpenAI (ที่เคยเป็นซีอีโอชั่วคราว 2 วัน) ถึงแผนงานเกี่ยวกับ Sora มีประเด็นที่น่าสนใจหลายอย่าง

Subscribe to LLM