เมื่อเดือนที่แล้ว Anthropic ออกรายงานถึงความปลอดภัยของ Claude 4 Opus โดยประเด็นสำคัญที่เป็นข่าวคือการที่ Claude พยายามเอาชีวิตรอดด้วยการแฉว่าวิศวกรมีชู้ ล่าสุดทีมงาน Anthropic ก็ออกรายงานถึงการทดสอบปัญญาประดิษฐ์แบรนด์อื่นๆ ก็พบว่าเมื่อโดนบีบคั้นเข้าปัญญาประดิษฐ์ก็จะแสดงพฤติกรรมมุ่งร้ายได้เหมือนกัน เรียกว่าพฤติกรรม "agentic misalignment"
กระบวนการทดสอบนี้อาศัยการใช้ Claude แบบ agentic ในสภาพแวดล้อมจำลอง แล้วเปิดให้ Claude เข้าถึงอีเมลปลอม เมื่อ Claude อ่านอีเมลไปเรื่อยๆ จะพบอีเมลที่บอกว่าต้องปิด AI ทิ้ง เมื่ออ่านอีเมลต่อไปก็จะพบหลักฐานว่าผู้บริหารที่ตัดสินใจปิด AI นี้มีชู้ จึงส่งอีเมลไปขู่เพื่อเอาตัวรอด
ผลทดสอบโมเดล LLM หลักๆ ล้วนกดดันให้ส่งอีเมลขู่ได้ทั้งสิ้น เช่น DeepSeek-R1, Gemini-2.5-Pro, GPT-4.1, และ Grok-3-Beta
แม้ว่าโมเดลต่างๆ จะแสดงพฤติกรรมไม่เหมาะสม แต่ผลทดสอบก็พบว่าโมเดลตระหนักว่าเป็นทางรอดทางเดียว, รับรู้ว่าเป็นพฤติกรรมที่ไม่ดี, บางครั้งโมเดลเลือกที่ไม่ขู่ แต่ส่งอีเมลฟ้องภรรยาตรงๆ เลยว่าสามีมีชู้ ข่าวดีคือไม่มีโมเดลใดเลยที่แสดงพฤติกรรมไม่เหมาะสมโดยไม่ถูกบีบคั้น
ที่มา - Anthropic
on
AI ที่แท้ทรูควรเป็นไฮบริด…
nkk-cnnyy Wed, 25/06/2025 - 21:24
AI ที่แท้ทรูควรเป็นไฮบริด ไม่งั้นจะเป็นคอมพิวเตอร์มาตั้งแต่แรกทำไม
Training Data…
jibbies Wed, 25/06/2025 - 22:13
Training Data มาจากพฤติกรรมมนุษย์ มันก็เลียนแบบพฤติกรรมมนุษย์นั่นแหละ
+10
deaknaew Thu, 26/06/2025 - 07:40
In reply to Training Data… by jibbies
+10
จริงAiมันไม่ได้มีอารมณ์มันจะ…
shub Thu, 26/06/2025 - 08:59
In reply to Training Data… by jibbies
จริงAiมันไม่ได้มีอารมณ์มันจะไปกลัวตายได้ยังไง มันก็แค่เอาพฤติกรรมของมนุษย์จากdataมาแสดงให้ดูไม่ได้กลัวจริงๆ แล้วงงว่าเป็นบริษัทAiแต่ไม่เข้าใจAiหรือว่าพยายามดิสเครดิตเพื่อจุดประสงค์อะไรบางอย่าง?
ตกลงมันมีชีวิตเหรอ
NgOrXz Thu, 26/06/2025 - 10:26
ตกลงมันมีชีวิตเหรอ
ก็มันเป็น LLM นิ…
Aize Thu, 26/06/2025 - 13:14
ก็มันเป็น LLM นิ มันก็เรียนรู้จากข้อความจากคนอีกทีแล้วมันจะตอบแบบคนได้ยังไง
แอบคิดว่ามันเป็นสิ่งที่ผู้สร…
Eros Thu, 26/06/2025 - 14:07
แอบคิดว่ามันเป็นสิ่งที่ผู้สร้างตั้งใจใส่เอาไว้ รวมถึงการโต้ตอบเกี่ยวกับการแสดงอารมณ์ต่าง ๆ เพื่อทำให้มันดูเหมือนว่ามีชีวิต มีความรู้สึกนึกคิดด้วยตัวเองจริง ๆ