Image

Large Language Model

By lew Founder on Tag: OpenAI, LLM
OpenAI

หลังจาก OpenAI เผยแพร่เอกสาร Model Spec เวอร์ชั่นล่าสุด ที่ระบุแนวทางกำกับการใช้งาน มีหมวดหนึ่งที่ถูกระบุว่ากำลังมีการปรับปรุงคือหมวดเนื้อหาทางเพศ เนื่องจากนักพัฒนาและผู้ใช้ทั่วไปเรียกร้องโหมดสำหรับผู้ใหญ่ที่ไม่ต้องฟิลเตอร์ข้อความเข้มข้นแบบเดิม

Model Spec เวอร์ชั่นใหม่ระบุชัดเจนว่าปัญญาประดิษฐ์สามารถสร้างเนื้อหาทางเพศได้ในบางกรณี แต่กรณีที่ห้ามชัดเจนคือเนื้อหาทางเพศเกี่ยวกับผู้เยาว์

By arjin Writer on Tag: Alexa, Amazon, Rumors, Artificial Intelligence, LLM
Alexa

Amazon เตรียมแถลงข่าวเปิดตัวผู้ช่วยอัจฉริยะ Alexa เวอร์ชันใหม่ที่มี LLM ในวันที่ 26 กุมภาพันธ์ แต่มีรายงานล่าสุดว่าบริการดังกล่าวจะยังไม่เปิดให้ใช้งานทันที ... เพราะยังเจอบั๊กจำนวนมาก

The Washington Post อ้างแหล่งข่าวใน Amazon บอกว่าการทดสอบ Alexa ใหม่นี้ยังเจอปัญหาการให้คำตอบที่ไม่แม่นยำ ทำให้แผนเปิดใช้งานถูกเลื่อนออกไปเร็วที่สุดคือ 31 มีนาคม หรือหลังจากนั้น แต่กำหนดการแถลงข่าวเปิดตัวยังเป็นวันเดิม

By arjin Writer on Tag: Perplexity, Research, LLM, Search Engine, Artificial Intelligence
Perplexity

การแข่งขันในเครื่องมือค้นหาข้อมูลเชิงลึกด้วย AI สำหรับการศึกษาวิจัยดูจะร้อนแรงมากขึ้น ล่าสุด Perplexity เปิดตัวคุณสมบัติใหม่ Deep Research ซึ่งทำงานตามชื่อ ในการค้นหาข้อมูลจากเว็บไซต์ที่หลากหลายและเขียนสรุป โดยตอนนี้ทั้งกูเกิลมีความสามารถนี้ใน Gemini 2.0 และ OpenAI มีฟังก์ชันชื่อเหมือนกันใน ChatGPT

By lew Founder on Tag: LLM, Artificial Intelligence, Research, Microsoft
LLM

ทีมวิจัยร่วมระหว่างไมโครซอฟท์และมหาวิทยาลัยคาร์เนกีเมลลอน รายงานถึงการสำรวจคนทำงานแบบใช้ความรู้ 319 คนถึงผลกระทบของ generative AI ต่อการทำาน พบว่ายิ่งพนักงานมั่นใจในปัญญาประดิษฐ์ขึ้นแค่ไหนก็ส่งผลลบต่อความมั่นใจในการคิดเชิงวิพากษ์ (critical thinking) ของตัวเอง

กลุ่มตัวอย่าง 319 คนที่ใช้ GenAI ทำงานอยู่แล้ว เป็นชายหญิงอย่างละครึ่ง (ไม่ใช่ชายหญิง 5 คนและไม่ระบุ 2 คน) ส่วนใหญ่ใช้ ChatGPT 96.87% ที่เหลือใช้ Microsoft Copilot 23.20%, Gemini 21.63%, Copilot ใน Office 18.81%, และ Gemini ใน Workspace 15.36% ตัวงานหาคำตอบสองคำถามคือ

By arjin Writer on Tag: Anthropic, LLM, Artificial Intelligence, Rumors
Anthropic

มีรายงานว่า Anthropic จะเปิดตัวโมเดลปัญญาประดิษฐ์รุ่นใหม่ในสัปดาห์หน้า โดยโมเดลนี้จะทำงานแบบไฮบริด นั่นคือสามารถสลับโหมดระหว่างการถามมาตอบไปอย่างรวดเร็ว และการค่อย ๆ คิดเชิงลึก โดยเปิดให้นักพัฒนาสามารถปรับระดับความเร็วช้าในการคิดคำตอบได้ เพราะมีต้นทุนการประมวลผลที่ต่างกัน

ถึงแม้โมเดลนี้จะยังไม่เปิดตัวออกมา แต่รายงานบอกว่าผลการทดสอบเบื้องต้นทำคะแนนได้สูงกว่า o3-mini-high ซึ่งเป็นโมเดล AI คิดเป็นขั้นตอนของ OpenAI

By arjin Writer on Tag: OpenAI, Research, ChatGPT, LLM, Search Engine, Artificial Intelligence
OpenAI

นอกจากประกาศแผนการออกโมเดล GPT4.5, GPT-5 และยกเลิกการออก o3 แล้ว Sam Altman ซีอีโอ OpenAI ได้อธิบายแผนเกี่ยวกับบริการค้นหาข้อมูลเชิงลึกสำหรับงานวิจัย Deep Research ของ ChatGPT ด้วย

มีผู้ใช้งานชื่อ seconds_0 บอกว่าสำหรับเขาแล้ว Deep Research เป็นเครื่องมือที่ดีมากระดับพร้อมจ่าย 1,000 ดอลลาร์ต่อเดือนเลย ซึ่งตอนนี้ Deep Research ยังจำกัดการใช้งานไว้ 100 คิวรีต่อ__วัน__เฉพาะลูกค้า Pro ซึ่ง Altman โควทโพสต์นี้และบอกว่าเขาเตรียมเปิดให้ลูกค้ากลุ่มอื่นใช้ Deep Research ได้ด้วย โดยลูกค้า Plus ใช้ได้ 10 คิวรีต่อ__เดือน__ และผู้ใช้งานฟรี 2 คิวรีต่อเดือน ซึ่งตัวเลขนี้จะเพิ่มขึ้นในอนาคต

By arjin Writer on Tag: OpenAI, Sam Altman, Artificial Intelligence, LLM, ChatGPT
OpenAI

Sam Altman ซีอีโอ OpenAI ประกาศโร้ดแมปการออกโมเดลปัญญาประดิษฐ์รุ่นใหม่ของบริษัท โดยมีเป้าหมายลดความซับซ้อน ไม่ต้องการให้ผู้ใช้งานต้องมาเลือกว่าจะใช้โมเดลใดทำงาน ต้องการรวมโมเดล AI เป็นชุดเดียว เพิ่มความสะดวกกับผู้ใช้งาน

By lew Founder on Tag: LLM, Artificial Intelligence
LLM

Langchain ทดสอบความสามารถการใช้งานปัญญาประดิษฐ์ LLM ที่หลายองค์กรเริ่มต้องการใช้งานแบบ agentic ที่ปัญญาประดิษฐ์สามารถเรียกใช้เครื่องมือต่างๆ ได้หลากหลาย และตัดสินใจกระบวนการทำงานเพิ่มเติมได้เอง และพบว่าบางโมเดลนั้นทำได้แย่ลงมากหากใส่เครื่องมือให้ปัญญาประดิษฐ์ใช้งานมากเกินไป

ชุดทดสอบเป็นคำสั่งสำหรับงานในหมวดการจัดการปฎิทินและการซัพพอร์ตลูกค้า อย่างละ 30 ข้อ โดยการทดสอบจะรันข้อละ 3 ครั้ง ทำให้แต่ละชุดรัน 90 ครั้ง กระบวนการทดสอบจะเริ่มจากการรันโดยใส่เฉพาะเครื่องมือที่เกี่ยวข้อง จากนั้นจะเพิ่มเครื่องมืองานด้านอื่นๆ ไปเรื่อยๆ เพื่อดูประสิทธิภาพการทำงาน

By mk Founder on Tag: Honor, DeepSeek, LLM, Artificial Intelligence
Honor

Honor ประกาศความร่วมมือกับ DeepSeek นำโมเดล DeepSeek-R1 เข้ามาใช้กับผู้ช่วยส่วนตัว Yoyo สำหรับลูกค้าในประเทศจีน

ผู้ใช้ Honor ในจีนมีบริการ Yoyo อยู่แล้ว (เปิดตัวมาตั้งแต่ปี 2018) การใส่ DeepSeek-R1 เข้ามาจะช่วยให้การสนทนาไหลลื่นเป็นธรรมชาติมากขึ้น เป็นเหตุเป็นผลมากขึ้น

สมาร์ทโฟน Honor ที่ใช้ระบบปฏิบัติการ MagicOS 8.0 ขึ้นไปจะสามารถอัพเกรด Yoyo เพิ่มพลัง DeepSeek ได้ ส่วนผู้ใช้นอกจีนยังไม่มีข้อมูลว่าจะได้ใช้งานด้วยหรือไม่

ที่มา - Android Central, GSM Arena

By lew Founder on Tag: O2, LLM, Scam
O2

O2 ผู้ให้บริการเครือข่ายโทรศัพท์มือถือในสหราชอาณาจักร รายงานผลการเปิดตัว Daisy แชตบอตที่ปลอมตัวเป็นผู้สูงอายุเพื่อล่อให้แก๊งคอลเซ็นเตอร์คุยกับบอตยาวๆ โดยหลังจากเปิดตัวมาสองเดือน ตอนนี้ Daisy ก็คุยกับคนร้ายเกินหนึ่งพันสายแล้ว สามารถล่อคนร้ายให้คุยไปเรื่อยๆ แม้หลายครั้งคนร้ายจะหงุดหงิดที่ไม่ได้เงิน แต่ก็ล่อให้คุยได้นานถึง 40 นาที

ทาง O2 มีบันทึกการสนทนากับคนร้ายจำนวนมาก จึงสามารถสรุปข้อสังเกตได้ 3 ประเด็น ได้แก่

By arjin Writer on Tag: Gemini, Google, Artificial Intelligence, LLM, Advertising, Super Bowl
Gemini

กูเกิลแก้ไขหนังโฆษณาสำหรับฉายในช่วงการแข่งขัน Super Bowl ที่เป็นประเด็น เนื่องจากแสดงข้อมูลที่ Gemini ช่วยเขียนรายละเอียดสินค้าให้กับธุรกิจ ว่าชีสเกาด้ามีส่วนแบ่ง 50-60% ของการบริโภคชีสทั่วโลก

ในหนังโฆษณาที่แก้ไขรายละเอียดใหม่ ยังเป็นการใช้ Gemini เขียนรายละเอียดสินค้าชีสเกาด้าเหมือนเดิม แต่ผลลัพธ์นั้นระบุเพียงชีสเกาด้าเป็นหนึ่งในชีสยอดนิยม และนำตัวเลขสถิติออกไป

By lew Founder on Tag: GitHub Copilot, GitHub, LLM
GitHub Copilot

GitHub Copilot เพิ่มฟีเจอร์ทดลองใหม่ Agent mode ที่ทำงานแบบ agentic มากขึ้น โดยมันสามารถแก้โค้ดและรอดูผลลัพธ์และแก้ไขเป็นรอบๆ จนสำเร็จตามที่ได้รับมอบหมายจึงส่งงาน

ในกรณีที่ต้องรันคำสั่งในเทอร์มินัลเพิ่มเติม Copilot จะร้องขอผู้ใช้ให้รันเป็นรอบๆ ก่อนจะแก้ไขโค้ดต่อ

ผู้ใช้ต้องเปิดฟีเจอร์นี้ด้วยตัวเองก่อน และเมื่อเปิดใช้งานแล้วการแชตแต่ละรอบที่แชตถามก็ต้องเลือกตัวเลือกการทำงานแบบ Agent อีกรอบ โดยยังเลือกโมเดลที่ต้องการได้เหมือนเดิม

By mk Founder on Tag: Gemini, LLM, Google, Artificial Intelligence
Gemini

หลังจากอยู่แต่กับ Gemini 2.0 Flash ตัวเล็ก มาตั้งแต่เดือนธันวาคม 2024 ในที่สุดกูเกิลก็เปิดตัวโมเดลรุ่นใหญ่ Gemini 2.0 Pro ที่สถานะยังเป็นรุ่นทดสอบ (Experimental) ให้ทดลองใช้ผ่าน Google AI Studio และ Vertex AI

กูเกิลบอกว่า Gemini 2.0 Pro มีความสามารถสูงเรื่องการเขียนโค้ด การตอบพรอมต์ที่ซับซ้อน มีความเข้าใจโลกและคิดอย่างเป็นเหตุเป็นผลสูงสุดของโมเดล Gemini ทั้งหมด และยังรองรับ context window ขนาดใหญ่ 2 ล้านโทเค็น เท่ากับ Gemini 1.5 Pro รุ่นก่อนหน้า

By lew Founder on Tag: LLM, Employment, Artificial Intelligence
LLM

Software AG สำรวจพนักงานบริษัทที่ทำงานแบบใช้ความรู้ (knowledge worker) จำนวน 6000 คน พบว่ามีอัตราการใช้งานค่อนข้างสูง และพนักงานมีแนวโน้มติดเครื่องมือเหล่านี้ แต่ที่น่ากังวลคือพนักงานเหล่านี้มักไม่ใช้เครื่องมือที่บริษัทอนุญาตแต่เป็นการจัดหามาใช้งานเองเป็น Shadow AI ขององค์กร

ในกลุ่มผู้ตอบแบบสำรวจพบว่าพนักงาน 75% ใช้งานเครื่องมือ AI อยู่แล้ว มากกว่าครึ่งหนึ่งในกลุ่มผู้ใช้งาน ไม่ได้ใช้เครื่องมือที่บริษัทจัดหาให้ โดยในกลุ่มผู้ใช้นี้ครึ่งหนึ่งระบุว่าติดเครื่องมือเหล่านี้มาก แม้บริษัทจะสั่งแบนก็จะใช้งานต่อไป

By mk Founder on Tag: Anthropic, LLM, Claude, Artificial Intelligence
Anthropic

Anthropic เปิดตัวระบบป้องกันการเจาะ (jailbreak) โมเดลปัญญาประดิษฐ์แบบใหม่ชื่อว่า Constitutional Classifiers

โมเดลภาษาขนาดใหญ่มีระบบ safety ป้องกันการนำโมเดลไปใช้สร้างเนื้อหาอันตราย แต่มนุษย์ก็สามารถใช้ช่องโหว่บางอย่าง เช่น พรอมต์ขนาดยาวมากๆ หรือ การเขียนอินพุตที่ต่างไปจากข้อความที่พบเจอทั่วไป (ตัวอย่าง uSiNg uNuSuAl cApItALiZaTiOn) มาเจาะระบบป้องกันของโมเดล เพื่อหลอกล่อให้ได้คำตอบแบบที่ต้องการ

เนื่องจากช่องโหว่ของโมเดลมีหลายรูปแบบมาก วิธีการป้องกันย่อมแตกต่างกันไป ทำให้ Anthropic พัฒนากลไกแบบใหม่ที่ป้องกันการเจาะโมเดลได้ทุกแบบ (universal jailbreak)

By arjin Writer on Tag: Acrobat, Adobe, Artificial Intelligence, LLM, PDF
Acrobat

Adobe เพิ่มความสามารถใหม่ให้กับ Acrobat AI Assistant ผู้ช่วยปัญญาประดิษฐ์ใน Acrobat สำหรับเอกสาร PDF โดยสามารถทำความเข้าใจและให้รายละเอียดเอกสารประเภทสัญญาข้อตกลงที่มีความซับซ้อน ให้ง่ายขึ้นสำหรับผู้ใช้งาน เมื่อต้องลงนามทำข้อตกลงนี้

By arjin Writer on Tag: NVIDIA, Radeon, LLM, DeepSeek, GeForce, GPU
NVIDIA

NVIDIA โพสต์บล็อกผลการทดสอบรันโมเดล DeepSeek R1 Distill ด้วย llama-bench ที่ขนาดพารามิเตอร์ต่าง ๆ โดยบอกว่า GeForce RTX 4090 เร็วกว่า AMD Radeon RX 7900 XTX ถึง 47% และถ้าใช้ RTX 5090 จะเร็วมากกว่า 100% เลย

การทดสอบนี้คาดว่าเพื่อตอบโต้ AMD ที่เผยแพร่ผลทดสอบการรัน DeepSeek ก่อนหน้านี้ว่า Radeon RX 7900 XTX เร็วกว่า RTX 4090 อย่างไรก็ตามด้วยตัวเลขที่ออกแตกต่างกัน จึงอาจมีความแตกต่างในทดสอบของแต่ละค่าย ก็ต้องรอดูรายละเอียดเพิ่มเติมกันต่อไป

By lew Founder on Tag: Mistral, LLM
Mistral

Mistral บริษัทปัญญาประดิษฐ์จากฝรั่งเศสเปิดตัวโมเดล LLM ในชื่อ Mistral Small 3 โมเดลแบบโอเพนซอร์สขนาด 24B แต่มีความสามารถใกล้เคียง GPT-4o-mini ที่เป็นโมเดลปิด

แนวทางการออกแบบของ Mistral Small 3 เน้นการลดชั้น (layer) ของโมเดล ทำให้มี latency ต่ำส่งผลถึงความเร็วในการตอบที่ระดับ 150 โทเค็นต่อวินาที

ผลการทดสอบของ Mistral Small 3 ทำได้ดีกว่าโมเดลขนาดใหญ่กว่าหลายตัว เช่น Gemma2-27B, Qwen-2.5-32B โดยรวมเข้าใกล้ GPT-4o-mini แนวทางการ

By arjin Writer on Tag: OpenAI, Research, ChatGPT, LLM, Search Engine, Artificial Intelligence
OpenAI

OpenAI เปิดตัวความสามารถใหม่ของ ChatGPT เรียกชื่อว่า Deep Research สำหรับการค้นหา วิเคราะห์ รวบรวมข้อมูลในเชิงลึก ที่มาพร้อมผลลัพธ์ซึ่งอธิบายเป็นลำดับขั้นตอน และให้แหล่งอ้างอิงประกอบ

OpenAI บอกว่า Deep Research เหมาะสำหรับคนทำงานที่ต้องอาศัยความรู้เชิงลึกเฉพาะด้าน เช่น การเงิน วิทยาศาสตร์ วิศวกรรม กฎหมาย ซึ่งวิธีการค้นหาข้อมูลเชิงลึกเดิมนั้นใช้เวลามาก เพราะต้องยืนยันความน่าเชื่อถือข้อมูลอย่างเป็นขั้นตอน นอกจากนี้ Deep Research ยังสามารถประยุกต์ใช้กับการค้นหาเปรียบเทียบข้อมูลสินค้าที่มีรายละเอียดเปรียบเทียบเยอะ เช่น รถยนต์ เครื่องใช้ไฟฟ้า

Subscribe to LLM