Tristan Hume หัวหน้าทีม Performance Optimization ของคลัสเตอร์จีพียูและทีพียู Trainium ของ Anthropic โพสต์เนื้อหาเล่าถึงความท้าทายในการออกข้อสอบคัดเลือกพนักงานเพื่อมาร่วมงานในฝ่าย เพราะเป้าหมายคือต้องการได้คนที่มีความรู้ความสามารถ แต่ AI ก็เก่งมากจนการทดสอบอาจไม่มีความหมายถ้าคนใช้คำตอบจาก AI
อ่านถึงตรงนี้ถ้าจะบอกว่าทำไมไม่ทดสอบโดยห้ามใช้ AI ไปเลย Hume บอกว่าเขาต้องการทดสอบในสถานการณ์ที่เหมือนการทำงานจริง ที่วิศวกรต้องปรับแต่งการทำงานกับตัวเร่งประมวลผล AI ด้วยวิธีการต่าง ๆ ซึ่งการใช้ AI มาช่วยทำงานเป็นเรื่องที่ควรทำอยู่แล้ว โจทย์ที่ทดสอบจึงต้องการมองหาสัญญาณบางอย่างว่าบุคคลนั้นมีความสามารถเชิงลึกที่จะแก้ปัญหาได้อย่างสร้างสรรค์ โดยข้อสอบเป็นแบบ Take-home เพื่อให้เหมือนสถานการณ์จริงที่คนทำงานมีอิสระ
อย่างไรก็ตามเมื่อใช้ Claude แก้ปัญหาข้อสอบนี้ ความสามารถที่มากขึ้นเรื่อย ๆ ก็ทำให้ Claude เขียนโค้ดได้ดีมากในเวลาที่สั้น เขาลองสร้างโจทย์ที่ยากขึ้นระดับที่พบว่า Claude เวอร์ชันตอนนั้นแก้ไม่ได้ แต่เมื่อเวลาผ่านไป Claude รุ่นใหม่ ๆ ก็เก่งขึ้นและให้ผลลัพธ์ได้ดีกว่าคนอยู่ดี
ในตอนนี้ Hume เลยรื้อวิธีการออกข้อสอบใหม่ จากเดิมเป็นโจทย์ที่มาจากสถานการณ์การทำงานจริง เป็นโจทย์แนวพัซเซิลที่ใส่เงื่อนไขข้อจำกัดมากในรูปแบบเกม และไม่มีชุดข้อมูลฝึกฝนที่ Claude เคยเห็นมาก่อนคล้ายเกม SHENZHEN I/O ของ Zachtronics ซึ่งแม้เป็นการทดสอบที่ไม่ได้จำลองสถานการณ์การทำงานจริง แต่ก็ช่วยคัดเลือกคนได้ดีในตอนนี้
Hume ปิดท้ายด้วยการเผยแพร่ข้อสอบคัดเลือกพนักงานเวอร์ชันแรกใน GitHub ซึ่งต้องการให้เขียนโค้ดปรับแต่งประสิทธิภาพการทำงานให้ได้รอบสัญญาณนาฬิกาต่ำที่สุด โดยถ้าใครทำได้น้อยกว่า 1487 รอบ ซึ่งเป็นตัวเลขที่ AI Claude Opus 4.5 ใช้เวลา 11.5 ชั่วโมง ในการคิดออกมาได้ ก็ยื่นใบสมัครงานมาได้เลย
ที่มา: Anthropic
on
555 อันนี้จริง…
Tasksenger Sun, 25/01/2026 - 07:21
555 อันนี้จริง แต่ใช้กับคนไทยยาก สมัยผมทำงานใหม่ๆ ก็โดนทดสอบด้วยโจทย์พัชเซิลแบบนี้แหล่ะ พอบอกว่าต้องกมีการทดสอบ คนอื่นหนีเรียบ เหลือผมกับอีกคนนั่งแก้กันจนเกือบทุ่มนึง ซึ่งก็แก้ไม่ได้หรอกนะ ได้แค่ solution ที่เป็นไปได้ แล้วไปนั่งอธิบายให้พี่เขาฟัง แล้วก็ได้งาน ทั้งๆ ที่เรียนไม่ตรงสายงาน แล้วพี่เขาก็มาเฉลยว่า กรูก็แก้ไม่ออกเหมือนกัน แค่อยากทดสอบไหวพริบ การหาวิธีการ แล้วก็ความอึด
ปัญหาผู้สมัครใช้ AI…
au8ust Sun, 25/01/2026 - 12:32
ปัญหาผู้สมัครใช้ AI นี่เป็นเรื่องน่าปวดหัวมาก โดยเฉพาะกับคนที่ไม่รู้ว่าคำตอบของ AI เชื่อถือได้แค่ไหน บางคนเถียงข้างๆ คูๆ ว่าต้องเปิดใจรับฟัง และใช้ AI โดยไม่ดูเลยว่ามันเอาไปใช้จริงไม่ได้ คำตอบมันหลอนมาก 555
ผมสังเกตได้เลยว่าคอมเม้นในโซ…
shub Mon, 26/01/2026 - 11:11
ผมสังเกตได้เลยว่าคอมเม้นในโซเชี่ยลพักหลังดูตอบแบบมีความรู้มากขึ้นส่วนหนึ่งเพราะคนใช้เอไอไปช่วยหาคำตอบมาให้ ถึงแม้เอไอมันยังหลอนตอบผิดอยู่บ่อยๆก็เถอะแต่ก็ยังดีกว่าคอมเม้นของคนทั่วไปโดยเฉลี่ยอยู่มาก บางคนก็ไปให้เอไอมันช่วยแถยับๆก็มีซึ่งก็ยังดีกว่าพวกเถียงไม่ออกแล้วด่ากลับอยู่อีกขั้นนึง รวมถึงช่วงนี้ที่ฮิตมากๆคือioที่ใช้เอไอช่วยสแปมคอมเม้นไปทั่วก็ดูมีคุณภาพมากขึ้นเพียงแต่ช่วยดูหัวข้อที่คุยกันก่อนนิดนึงจะดีมากบางทีหัวข้อโพสไม่เกี่ยวการเมืองก็โยงไปได้หมด55