LLM | Blognone

Large Language Model

OpenAI พิจารณาเพิ่มโหมดผู้ใหญ่ อาจยอมให้คุยเรื่องเพศได้มากขึ้น

By lew

on 17 February 2025 - 12:13 Tag: OpenAI, LLM

OpenAI

หลังจาก OpenAI เผยแพร่เอกสาร Model Spec เวอร์ชั่นล่าสุด ที่ระบุแนวทางกำกับการใช้งาน มีหมวดหนึ่งที่ถูกระบุว่ากำลังมีการปรับปรุงคือหมวดเนื้อหาทางเพศ เนื่องจากนักพัฒนาและผู้ใช้ทั่วไปเรียกร้องโหมดสำหรับผู้ใหญ่ที่ไม่ต้องฟิลเตอร์ข้อความเข้มข้นแบบเดิม

Model Spec เวอร์ชั่นใหม่ระบุชัดเจนว่าปัญญาประดิษฐ์สามารถสร้างเนื้อหาทางเพศได้ในบางกรณี แต่กรณีที่ห้ามชัดเจนคือเนื้อหาทางเพศเกี่ยวกับผู้เยาว์

Amazon อาจเลื่อนปล่อย Alexa เวอร์ชันใหม่พลัง LLM จากกำหนดเดิม เพราะเจอบั๊กทำงานผิดพลาดจำนวนมาก

By arjin

on 16 February 2025 - 16:13 Tag: Alexa, Amazon, Rumors, Artificial Intelligence, LLM

Alexa

Amazon เตรียมแถลงข่าวเปิดตัวผู้ช่วยอัจฉริยะ Alexa เวอร์ชันใหม่ที่มี LLM ในวันที่ 26 กุมภาพันธ์ แต่มีรายงานล่าสุดว่าบริการดังกล่าวจะยังไม่เปิดให้ใช้งานทันที ... เพราะยังเจอบั๊กจำนวนมาก

The Washington Post อ้างแหล่งข่าวใน Amazon บอกว่าการทดสอบ Alexa ใหม่นี้ยังเจอปัญหาการให้คำตอบที่ไม่แม่นยำ ทำให้แผนเปิดใช้งานถูกเลื่อนออกไปเร็วที่สุดคือ 31 มีนาคม หรือหลังจากนั้น แต่กำหนดการแถลงข่าวเปิดตัวยังเป็นวันเดิม

Perplexity เปิดตัวเครื่องมือค้นหา Deep Research บอกได้ผลลัพธ์เร็วกว่าคู่แข่ง และลูกค้าฟรีก็ใช้ได้ด้วย

By arjin

on 16 February 2025 - 09:34 Tag: Perplexity, Research, LLM, Search Engine, Artificial Intelligence

Perplexity

การแข่งขันในเครื่องมือค้นหาข้อมูลเชิงลึกด้วย AI สำหรับการศึกษาวิจัยดูจะร้อนแรงมากขึ้น ล่าสุด Perplexity เปิดตัวคุณสมบัติใหม่ Deep Research ซึ่งทำงานตามชื่อ ในการค้นหาข้อมูลจากเว็บไซต์ที่หลากหลายและเขียนสรุป โดยตอนนี้ทั้งกูเกิลมีความสามารถนี้ใน Gemini 2.0 และ OpenAI มีฟังก์ชันชื่อเหมือนกันใน ChatGPT

ไมโครซอฟท์พบคนเชื่อมั่นใน AI จะมั่นใจใน critical thinking ของตัวเองน้อยลง

By lew

on 15 February 2025 - 22:50 Tag: LLM, Artificial Intelligence, Research, Microsoft

LLM

ทีมวิจัยร่วมระหว่างไมโครซอฟท์และมหาวิทยาลัยคาร์เนกีเมลลอน รายงานถึงการสำรวจคนทำงานแบบใช้ความรู้ 319 คนถึงผลกระทบของ generative AI ต่อการทำาน พบว่ายิ่งพนักงานมั่นใจในปัญญาประดิษฐ์ขึ้นแค่ไหนก็ส่งผลลบต่อความมั่นใจในการคิดเชิงวิพากษ์ (critical thinking) ของตัวเอง

กลุ่มตัวอย่าง 319 คนที่ใช้ GenAI ทำงานอยู่แล้ว เป็นชายหญิงอย่างละครึ่ง (ไม่ใช่ชายหญิง 5 คนและไม่ระบุ 2 คน) ส่วนใหญ่ใช้ ChatGPT 96.87% ที่เหลือใช้ Microsoft Copilot 23.20%, Gemini 21.63%, Copilot ใน Office 18.81%, และ Gemini ใน Workspace 15.36% ตัวงานหาคำตอบสองคำถามคือ

Anthropic เผย มีคนเจาะระบบป้องกัน jailbreak โมเดลได้ 4 คน, มี 1 คนเจาะขั้นสูงสุดได้

By mk

on 14 February 2025 - 16:55 Tag: Anthropic, LLM, Artificial Intelligence

Anthropic

Jan Leike นักวิจัยของ Anthropic อัพเดตข้อมูลเรื่อง ระบบป้องกัน jailbreak โมเดลที่ Anthropic ท้าให้ลองเจาะดู ว่ามีสถิติดังนี้

[ลือ] Anthropic อาจเปิดตัวโมเดล AI ใหม่สัปดาห์หน้า ทำงานโหมดไฮบริด ได้ทั้งแบบตอบเร็วและแบบคิดเป็นขั้นตอน

By arjin

on 14 February 2025 - 12:35 Tag: Anthropic, LLM, Artificial Intelligence, Rumors

Anthropic

มีรายงานว่า Anthropic จะเปิดตัวโมเดลปัญญาประดิษฐ์รุ่นใหม่ในสัปดาห์หน้า โดยโมเดลนี้จะทำงานแบบไฮบริด นั่นคือสามารถสลับโหมดระหว่างการถามมาตอบไปอย่างรวดเร็ว และการค่อย ๆ คิดเชิงลึก โดยเปิดให้นักพัฒนาสามารถปรับระดับความเร็วช้าในการคิดคำตอบได้ เพราะมีต้นทุนการประมวลผลที่ต่างกัน

ถึงแม้โมเดลนี้จะยังไม่เปิดตัวออกมา แต่รายงานบอกว่าผลการทดสอบเบื้องต้นทำคะแนนได้สูงกว่า o3-mini-high ซึ่งเป็นโมเดล AI คิดเป็นขั้นตอนของ OpenAI

OpenAI มีแผนนำเครื่องมือ Deep Research ให้ลูกค้า Plus และฟรีได้ใช้งานด้วย แต่จำกัดจำนวน "ต่อเดือน"

By arjin

on 13 February 2025 - 07:43 Tag: OpenAI, Research, ChatGPT, LLM, Search Engine, Artificial Intelligence

OpenAI

นอกจากประกาศแผนการออกโมเดล GPT4.5, GPT-5 และยกเลิกการออก o3 แล้ว Sam Altman ซีอีโอ OpenAI ได้อธิบายแผนเกี่ยวกับบริการค้นหาข้อมูลเชิงลึกสำหรับงานวิจัย Deep Research ของ ChatGPT ด้วย

มีผู้ใช้งานชื่อ seconds_0 บอกว่าสำหรับเขาแล้ว Deep Research เป็นเครื่องมือที่ดีมากระดับพร้อมจ่าย 1,000 ดอลลาร์ต่อเดือนเลย ซึ่งตอนนี้ Deep Research ยังจำกัดการใช้งานไว้ 100 คิวรีต่อ__วัน__เฉพาะลูกค้า Pro ซึ่ง Altman โควทโพสต์นี้และบอกว่าเขาเตรียมเปิดให้ลูกค้ากลุ่มอื่นใช้ Deep Research ได้ด้วย โดยลูกค้า Plus ใช้ได้ 10 คิวรีต่อ__เดือน__ และผู้ใช้งานฟรี 2 คิวรีต่อเดือน ซึ่งตัวเลขนี้จะเพิ่มขึ้นในอนาคต

OpenAI ยกเลิกการปล่อยโมเดล o3, เตรียมออก GPT-4.5 และรวมโมเดลทั้งหมดเป็นชุดเดียวใน GPT-5

By arjin

on 13 February 2025 - 05:54 Tag: OpenAI, Sam Altman, Artificial Intelligence, LLM, ChatGPT

OpenAI

Sam Altman ซีอีโอ OpenAI ประกาศโร้ดแมปการออกโมเดลปัญญาประดิษฐ์รุ่นใหม่ของบริษัท โดยมีเป้าหมายลดความซับซ้อน ไม่ต้องการให้ผู้ใช้งานต้องมาเลือกว่าจะใช้โมเดลใดทำงาน ต้องการรวมโมเดล AI เป็นชุดเดียว เพิ่มความสะดวกกับผู้ใช้งาน

Langchain ทดสอบการใช้ LLM แบบ Agentic พบ o1, o3-mini, Claude Sonnet ทำได้ดี

By lew

on 12 February 2025 - 20:25 Tag: LLM, Artificial Intelligence

LLM

Langchain ทดสอบความสามารถการใช้งานปัญญาประดิษฐ์ LLM ที่หลายองค์กรเริ่มต้องการใช้งานแบบ agentic ที่ปัญญาประดิษฐ์สามารถเรียกใช้เครื่องมือต่างๆ ได้หลากหลาย และตัดสินใจกระบวนการทำงานเพิ่มเติมได้เอง และพบว่าบางโมเดลนั้นทำได้แย่ลงมากหากใส่เครื่องมือให้ปัญญาประดิษฐ์ใช้งานมากเกินไป

ชุดทดสอบเป็นคำสั่งสำหรับงานในหมวดการจัดการปฎิทินและการซัพพอร์ตลูกค้า อย่างละ 30 ข้อ โดยการทดสอบจะรันข้อละ 3 ครั้ง ทำให้แต่ละชุดรัน 90 ครั้ง กระบวนการทดสอบจะเริ่มจากการรันโดยใส่เฉพาะเครื่องมือที่เกี่ยวข้อง จากนั้นจะเพิ่มเครื่องมืองานด้านอื่นๆ ไปเรื่อยๆ เพื่อดูประสิทธิภาพการทำงาน

Honor นำ DeepSeek เข้ามาใช้กับผู้ช่วยส่วนตัวในสมาร์ทโฟน ยังมีเฉพาะในจีน

By mk

on 11 February 2025 - 09:05 Tag: Honor, DeepSeek, LLM, Artificial Intelligence

Honor

Honor ประกาศความร่วมมือกับ DeepSeek นำโมเดล DeepSeek-R1 เข้ามาใช้กับผู้ช่วยส่วนตัว Yoyo สำหรับลูกค้าในประเทศจีน

ผู้ใช้ Honor ในจีนมีบริการ Yoyo อยู่แล้ว (เปิดตัวมาตั้งแต่ปี 2018) การใส่ DeepSeek-R1 เข้ามาจะช่วยให้การสนทนาไหลลื่นเป็นธรรมชาติมากขึ้น เป็นเหตุเป็นผลมากขึ้น

สมาร์ทโฟน Honor ที่ใช้ระบบปฏิบัติการ MagicOS 8.0 ขึ้นไปจะสามารถอัพเกรด Yoyo เพิ่มพลัง DeepSeek ได้ ส่วนผู้ใช้นอกจีนยังไม่มีข้อมูลว่าจะได้ใช้งานด้วยหรือไม่

ที่มา - Android Central, GSM Arena

O2 รายงานการใช้บอตคุยกับแก๊งคอลเซ็นเตอร์ ล่อให้คุยวนไปมาได้ถึง 40 นาที พบส่วนมากคนร้ายอ่านตามบท

By lew

on 10 February 2025 - 17:09 Tag: O2, LLM, Scam

O2 ผู้ให้บริการเครือข่ายโทรศัพท์มือถือในสหราชอาณาจักร รายงานผลการเปิดตัว Daisy แชตบอตที่ปลอมตัวเป็นผู้สูงอายุเพื่อล่อให้แก๊งคอลเซ็นเตอร์คุยกับบอตยาวๆ โดยหลังจากเปิดตัวมาสองเดือน ตอนนี้ Daisy ก็คุยกับคนร้ายเกินหนึ่งพันสายแล้ว สามารถล่อคนร้ายให้คุยไปเรื่อยๆ แม้หลายครั้งคนร้ายจะหงุดหงิดที่ไม่ได้เงิน แต่ก็ล่อให้คุยได้นานถึง 40 นาที

ทาง O2 มีบันทึกการสนทนากับคนร้ายจำนวนมาก จึงสามารถสรุปข้อสังเกตได้ 3 ประเด็น ได้แก่

Google แก้ไขหนังโฆษณา Gemini AI นำตัวเลขการบริโภคชีสเกาด้า 50-60% ออกไป

By arjin

on 10 February 2025 - 06:13 Tag: Gemini, Google, Artificial Intelligence, LLM, Advertising, Super Bowl

Gemini

กูเกิลแก้ไขหนังโฆษณาสำหรับฉายในช่วงการแข่งขัน Super Bowl ที่เป็นประเด็น เนื่องจากแสดงข้อมูลที่ Gemini ช่วยเขียนรายละเอียดสินค้าให้กับธุรกิจ ว่าชีสเกาด้ามีส่วนแบ่ง 50-60% ของการบริโภคชีสทั่วโลก

ในหนังโฆษณาที่แก้ไขรายละเอียดใหม่ ยังเป็นการใช้ Gemini เขียนรายละเอียดสินค้าชีสเกาด้าเหมือนเดิม แต่ผลลัพธ์นั้นระบุเพียงชีสเกาด้าเป็นหนึ่งในชีสยอดนิยม และนำตัวเลขสถิติออกไป

GitHub Copilot เปิดตัว Agent mode แก้โค้ดจนเสร็จแล้วค่อยส่ง อนาคตผู้ใช้เปิด issue แล้วรอตรวจโค้ดได้เลย

By lew

on 7 February 2025 - 09:19 Tag: GitHub Copilot, GitHub, LLM

GitHub Copilot

GitHub Copilot เพิ่มฟีเจอร์ทดลองใหม่ Agent mode ที่ทำงานแบบ agentic มากขึ้น โดยมันสามารถแก้โค้ดและรอดูผลลัพธ์และแก้ไขเป็นรอบๆ จนสำเร็จตามที่ได้รับมอบหมายจึงส่งงาน

ในกรณีที่ต้องรันคำสั่งในเทอร์มินัลเพิ่มเติม Copilot จะร้องขอผู้ใช้ให้รันเป็นรอบๆ ก่อนจะแก้ไขโค้ดต่อ

ผู้ใช้ต้องเปิดฟีเจอร์นี้ด้วยตัวเองก่อน และเมื่อเปิดใช้งานแล้วการแชตแต่ละรอบที่แชตถามก็ต้องเลือกตัวเลือกการทำงานแบบ Agent อีกรอบ โดยยังเลือกโมเดลที่ต้องการได้เหมือนเดิม

กูเกิลเปิดตัว Gemini 2.0 Pro โมเดลรุ่นใหญ่สุด และ Gemini 2.0 Flash-Lite รุ่นเล็ก ตอบเร็ว ราคาถูก

By mk

on 6 February 2025 - 07:43 Tag: Gemini, LLM, Google, Artificial Intelligence

Gemini

หลังจากอยู่แต่กับ Gemini 2.0 Flash ตัวเล็ก มาตั้งแต่เดือนธันวาคม 2024 ในที่สุดกูเกิลก็เปิดตัวโมเดลรุ่นใหญ่ Gemini 2.0 Pro ที่สถานะยังเป็นรุ่นทดสอบ (Experimental) ให้ทดลองใช้ผ่าน Google AI Studio และ Vertex AI

กูเกิลบอกว่า Gemini 2.0 Pro มีความสามารถสูงเรื่องการเขียนโค้ด การตอบพรอมต์ที่ซับซ้อน มีความเข้าใจโลกและคิดอย่างเป็นเหตุเป็นผลสูงสุดของโมเดล Gemini ทั้งหมด และยังรองรับ context window ขนาดใหญ่ 2 ล้านโทเค็น เท่ากับ Gemini 1.5 Pro รุ่นก่อนหน้า

แบบสำรวจพบพนักงานบริษัทใช้ AI ทำงานโดยไม่ได้รับอนุญาตจำนวนมาก ครึ่งหนึ่งบอกว่าบริษัทห้ามก็ไม่หยุดใช้

By lew

on 6 February 2025 - 00:02 Tag: LLM, Employment, Artificial Intelligence

LLM

Software AG สำรวจพนักงานบริษัทที่ทำงานแบบใช้ความรู้ (knowledge worker) จำนวน 6000 คน พบว่ามีอัตราการใช้งานค่อนข้างสูง และพนักงานมีแนวโน้มติดเครื่องมือเหล่านี้ แต่ที่น่ากังวลคือพนักงานเหล่านี้มักไม่ใช้เครื่องมือที่บริษัทอนุญาตแต่เป็นการจัดหามาใช้งานเองเป็น Shadow AI ขององค์กร

ในกลุ่มผู้ตอบแบบสำรวจพบว่าพนักงาน 75% ใช้งานเครื่องมือ AI อยู่แล้ว มากกว่าครึ่งหนึ่งในกลุ่มผู้ใช้งาน ไม่ได้ใช้เครื่องมือที่บริษัทจัดหาให้ โดยในกลุ่มผู้ใช้นี้ครึ่งหนึ่งระบุว่าติดเครื่องมือเหล่านี้มาก แม้บริษัทจะสั่งแบนก็จะใช้งานต่อไป

Anthropic เปิดตัวระบบป้องกัน jailbreak โมเดลแบบใหม่ ท้าให้ลองเจาะ ทำสำเร็จมีเงินรางวัล

By mk

on 5 February 2025 - 20:47 Tag: Anthropic, LLM, Claude, Artificial Intelligence

Anthropic

Anthropic เปิดตัวระบบป้องกันการเจาะ (jailbreak) โมเดลปัญญาประดิษฐ์แบบใหม่ชื่อว่า Constitutional Classifiers

โมเดลภาษาขนาดใหญ่มีระบบ safety ป้องกันการนำโมเดลไปใช้สร้างเนื้อหาอันตราย แต่มนุษย์ก็สามารถใช้ช่องโหว่บางอย่าง เช่น พรอมต์ขนาดยาวมากๆ หรือ การเขียนอินพุตที่ต่างไปจากข้อความที่พบเจอทั่วไป (ตัวอย่าง uSiNg uNuSuAl cApItALiZaTiOn) มาเจาะระบบป้องกันของโมเดล เพื่อหลอกล่อให้ได้คำตอบแบบที่ต้องการ

เนื่องจากช่องโหว่ของโมเดลมีหลายรูปแบบมาก วิธีการป้องกันย่อมแตกต่างกันไป ทำให้ Anthropic พัฒนากลไกแบบใหม่ที่ป้องกันการเจาะโมเดลได้ทุกแบบ (universal jailbreak)

Adobe เพิ่มความสามารถวิเคราะห์เอกสารสัญญาข้อตกลงใน Acrobat AI Assistant

By arjin

on 5 February 2025 - 05:19 Tag: Acrobat, Adobe, Artificial Intelligence, LLM, PDF

Acrobat

Adobe เพิ่มความสามารถใหม่ให้กับ Acrobat AI Assistant ผู้ช่วยปัญญาประดิษฐ์ใน Acrobat สำหรับเอกสาร PDF โดยสามารถทำความเข้าใจและให้รายละเอียดเอกสารประเภทสัญญาข้อตกลงที่มีความซับซ้อน ให้ง่ายขึ้นสำหรับผู้ใช้งาน เมื่อต้องลงนามทำข้อตกลงนี้

NVIDIA โชว์ผลทดสอบโต้กลับบอก GeForce 4090 รัน DeepSeek R1 เร็วกว่า Radeon 7900

By arjin

on 4 February 2025 - 06:02 Tag: NVIDIA, Radeon, LLM, DeepSeek, GeForce, GPU

NVIDIA

NVIDIA โพสต์บล็อกผลการทดสอบรันโมเดล DeepSeek R1 Distill ด้วย llama-bench ที่ขนาดพารามิเตอร์ต่าง ๆ โดยบอกว่า GeForce RTX 4090 เร็วกว่า AMD Radeon RX 7900 XTX ถึง 47% และถ้าใช้ RTX 5090 จะเร็วมากกว่า 100% เลย

การทดสอบนี้คาดว่าเพื่อตอบโต้ AMD ที่เผยแพร่ผลทดสอบการรัน DeepSeek ก่อนหน้านี้ว่า Radeon RX 7900 XTX เร็วกว่า RTX 4090 อย่างไรก็ตามด้วยตัวเลขที่ออกแตกต่างกัน จึงอาจมีความแตกต่างในทดสอบของแต่ละค่าย ก็ต้องรอดูรายละเอียดเพิ่มเติมกันต่อไป

Mistral Small 3 โมเดล AI ขนาด 24B ระดับเดียวกับ GPT-4o-mini

By lew

on 3 February 2025 - 11:01 Tag: Mistral, LLM

Mistral

Mistral บริษัทปัญญาประดิษฐ์จากฝรั่งเศสเปิดตัวโมเดล LLM ในชื่อ Mistral Small 3 โมเดลแบบโอเพนซอร์สขนาด 24B แต่มีความสามารถใกล้เคียง GPT-4o-mini ที่เป็นโมเดลปิด

แนวทางการออกแบบของ Mistral Small 3 เน้นการลดชั้น (layer) ของโมเดล ทำให้มี latency ต่ำส่งผลถึงความเร็วในการตอบที่ระดับ 150 โทเค็นต่อวินาที

ผลการทดสอบของ Mistral Small 3 ทำได้ดีกว่าโมเดลขนาดใหญ่กว่าหลายตัว เช่น Gemma2-27B, Qwen-2.5-32B โดยรวมเข้าใกล้ GPT-4o-mini แนวทางการ

OpenAI เปิดตัว Deep Research เครื่องมือช่วยค้นหาข้อมูลสำหรับงานวิจัยเชิงลึก

By arjin

on 3 February 2025 - 07:33 Tag: OpenAI, Research, ChatGPT, LLM, Search Engine, Artificial Intelligence

OpenAI

OpenAI เปิดตัวความสามารถใหม่ของ ChatGPT เรียกชื่อว่า Deep Research สำหรับการค้นหา วิเคราะห์ รวบรวมข้อมูลในเชิงลึก ที่มาพร้อมผลลัพธ์ซึ่งอธิบายเป็นลำดับขั้นตอน และให้แหล่งอ้างอิงประกอบ

OpenAI บอกว่า Deep Research เหมาะสำหรับคนทำงานที่ต้องอาศัยความรู้เชิงลึกเฉพาะด้าน เช่น การเงิน วิทยาศาสตร์ วิศวกรรม กฎหมาย ซึ่งวิธีการค้นหาข้อมูลเชิงลึกเดิมนั้นใช้เวลามาก เพราะต้องยืนยันความน่าเชื่อถือข้อมูลอย่างเป็นขั้นตอน นอกจากนี้ Deep Research ยังสามารถประยุกต์ใช้กับการค้นหาเปรียบเทียบข้อมูลสินค้าที่มีรายละเอียดเปรียบเทียบเยอะ เช่น รถยนต์ เครื่องใช้ไฟฟ้า

Subscribe to LLM