Anthropic ออกโมเดล Claude 4 โดยชูจุดเด่นเป็นปัญญาประดิษฐ์เขียนโค้ดที่ดีที่สุดในโลก สามารถทำคะแนนทดสอบ SWE-Bench Verified ได้ถึง 72.5% และยังทำงานได้แม้จะเป็นการทำงานแบบ agent ที่ต้องทำงานต่อเนื่องหลายพันขั้นตอน กินเวลายาวหลายชั่วโมง
ผลทดสอบที่ Anthropic นำมาโชว์แสดงแนวทางการใช้งานชัดเจน เช่น การเขียนโค้ด หรือการเรียกเครื่องมือในการให้บริการธุรกิจ
ตัว Claude 4 มีสองรุ่น คือ Opus รุ่นใหญ่ และ Sonnet รุ่นกลาง จุดเด่นของ Opus ในรอบนี้คือความสามารถสร้างหน่วยความจำได้ในตัว โดยผู้ใช้ต้องสร้างแอปพลิเคชั่นที่เปิดให้เขียนไฟล์ได้ จากนั้น Claude จะสร้างไฟล์หน่วยความจำและตอบสนองต่องานที่ต้องการความจำยาวๆ ได้ต่อเนื่อง
ความเปลี่ยนแปลงอีกอย่างคือการแสดงโทเค็นความคิด โดย Claude 4 จะแสดงเฉพาะความคิดแบบสรุปเท่านั้น ลูกค้าที่ต้องการโทเค็นการคิดก่อนตอบแบบเต็มต้องติดต่อเซลล์โดยตรงเพื่อเปิดสิทธิ์ใช้งาน
ที่มา - Anthropic

on
SWE-Bench Verified , sonnet…
tontpong Fri, 23/05/2025 - 03:57
SWE-Bench Verified , sonnet ดีกว่า opus ? .. ฝึกกับโจทย์มาแล้ว , คิดได้ไม่เยอะ ก็ไม่งงเอง ?
ไปสืบดูจาก Reddit…
Pinery Fri, 23/05/2025 - 09:24
ไปสืบดูจาก Reddit คนเทสกันเยอะละ บ่นกันเยอะมากคือเรื่องสูบ limit โดยเฉพาะ Opus ถามได้ไม่เกิน 5-7 prompt ก็ติดลิมิตละ บางคนใช้ Clause Pro ยังถามได้ไม่เยอะก็ติด limit
สงสัยจะผลักดันให้ซื้อ Max package แน่เลย 🤣
อันนี้บ่นกันมาตั้งแต่ claude…
checkmate95 Fri, 23/05/2025 - 11:01
In reply to ไปสืบดูจาก Reddit… by Pinery
อันนี้บ่นกันมาตั้งแต่ claude 3.5 แล้วครับ แต่ส่วนตัวผมใช้ pro ไม่เคยถึง limit นะ เคยทีเดียวแต่ใช้แบบเยอะมากๆจริงๆ เขียนโค๊ดได้ประมาณ หมื่นสองหมื่นบรรทัดนู้นแหละ
ส่วน free ติดอยู่แล้วครับ เหมือนเป็น trial มากกว่า
ที่บ่นกันคือคนใช้ Pro…
Pinery Fri, 23/05/2025 - 22:32
In reply to อันนี้บ่นกันมาตั้งแต่ claude… by checkmate95
ที่บ่นกันคือคนใช้ Pro นี่ล่ะครับ (Claude 4) ลอง search ที่ Reddit ได้ บ่นกันทั้งวัน
โมเดลรายเดือนในโลก LLM…
lew Sat, 24/05/2025 - 13:30
In reply to ไปสืบดูจาก Reddit… by Pinery
โมเดลรายเดือนในโลก LLM นี่ตอนนี้ยากจริงครับ ทุกคนเสพติดความฉลาด สมมติวันนี้ทำ Claude 3.7 ต้นทุนต่ำลง 10 เท่า คนก็ไม่ยอมใช้จะใช้ Claude 4 อย่างเดียว ถ้าเจอปัญหาบางอย่างที่ Sonnet ทำไม่ได้แล้ว Opus ทำได้ ก็พยายามใช้ Opus กัน
ลองใช้เมื่อเช้า…
tomyum Fri, 23/05/2025 - 17:23
ลองใช้ Opus เมื่อเช้า เงินไหลเป็นน้ำเลยครับ ไหลไปเทไป🥲
ยังไม่เคยได้ใช้ Claude…
orchidkit Sat, 24/05/2025 - 15:39
ยังไม่เคยได้ใช้ Claude แบบต่อเนื่องในโปรเจคไหนเลย
ใช้ช่วยได้นิดนึง ติด limit