หลังจาก xAI เปิดตัว Grok 4 ออกมา ตอนนี้ผลทดสอบต่างๆ ตอนนี้ผลทดสอบต่างๆ ก็เริ่มออกตามมา และดูเหมือน Grok 4 จะเป็นโมเดลปัญญาประดิิษฐ์ที่ฉลาดที่สุดตามที่ Elon Musk อ้างไว้จริงๆ
ผลทดสอบสำคัญคือ ARC-AGI 2 ชุดทดสอบความฉลาดแบบมนุษย์ มนุษย์โดยทั่วไปทำคะแนนได้สูง 60% แต่ปัญญาประดิษฐ์กลับทำได้แย่ ตอนนี้ Grok 4 คะแนนได้ถึง 15.9% นับว่ากระโดดเกือบสองเท่าตัวจาก Claude Opus 4 Thinking เทียบกับ Grok 3 ที่แก้ปัญหาในชุดทดสอบนี้ไม่ได้เลย
ในแง่ของราคาสำหรับการแก้ปัญหายากๆ นั้น Grok 4 ใช้ต้นทุนพอๆ กับ Claude Opus 4 ประมาณข้อละ 1.9 ดอลลาร์
ทางด้าน Artificial Analysis เว็บรวบรวมผลทดสอบปัญญาประดิษฐ์ทั้งความฉลาด, ราคา, และความเร็ว ให้คะแนนความฉลาดแบบดัชนีรวมกับ Grok 4 ไว้สูงสุด 73 คะแนน หากนับเฉพาะด้านการเขียนโปรแกรมก็ยังเป็นที่หนึ่ง นำ o4-mini-high ไปเล็กน้อย
ที่มา - Arc Prize

on
เห็นอินฟลูเทพๆสาย tech…
incredibles Fri, 11/07/2025 - 05:07
เห็นอินฟลูเทพๆสาย tech ทดสอบกันแล้ว Grok 4 ดีจริงๆ แต่รอดูว่าพวก GPT 5 กับ Claude มันจะพลิกกลับมาได้ไหม ตอนนี้จ่ายเพิ่มอีกตัวไม่ไหวจริงๆ
นี่ตัว heavy หรือยังนะ
hisoft Fri, 11/07/2025 - 05:29
นี่ตัว heavy หรือยังนะ
ตัวนี้น่าจะยิงผ่าน API…
lew Fri, 11/07/2025 - 12:07
In reply to นี่ตัว heavy หรือยังนะ by hisoft
ตัวนี้น่าจะยิงผ่าน API ไม่ได้เป็นระดับ application ที่สร้าง agent ประกอบกันไปมานะครับ คาดการณ์เอาเพราะปกติเราไม่ถือว่าการทำ application ประกอบเป็นความสามารถของตัวโมเดลเพียวๆ การใช้ agent + rag + tool ก็ทำให้ค่าใช้จ่ายสูงขึ้นมาก ตัว ARC prize มีข้อจำกัดเรื่องต้นทุนอยู่ด้วย ว่าจะชนะได้ AI รวมต้นทุนต้องต่ำพอ
โอว ขอบคุณครับ…
hisoft Fri, 11/07/2025 - 14:15
In reply to ตัวนี้น่าจะยิงผ่าน API… by lew
โอว ขอบคุณครับ ผมลืมนึกไปเลยเข้าใจผิดไปว่าปล่อยแยกเป็น 2 โมเดล