วิศวกร Anthropic เล่าปัญหาการออกข้อสอบคัดเลือกพนักงาน ตอนนี้ต้องแปลกมากพอที่ Claude ยังตอบไม่ได้

By arjin

on 24 January 2026 - 19:27 Tag: Anthropic, Claude, Artificial Intelligence, Employment

Anthropic

Tristan Hume หัวหน้าทีม Performance Optimization ของคลัสเตอร์จีพียูและทีพียู Trainium ของ Anthropic โพสต์เนื้อหาเล่าถึงความท้าทายในการออกข้อสอบคัดเลือกพนักงานเพื่อมาร่วมงานในฝ่าย เพราะเป้าหมายคือต้องการได้คนที่มีความรู้ความสามารถ แต่ AI ก็เก่งมากจนการทดสอบอาจไม่มีความหมายถ้าคนใช้คำตอบจาก AI

อ่านถึงตรงนี้ถ้าจะบอกว่าทำไมไม่ทดสอบโดยห้ามใช้ AI ไปเลย Hume บอกว่าเขาต้องการทดสอบในสถานการณ์ที่เหมือนการทำงานจริง ที่วิศวกรต้องปรับแต่งการทำงานกับตัวเร่งประมวลผล AI ด้วยวิธีการต่าง ๆ ซึ่งการใช้ AI มาช่วยทำงานเป็นเรื่องที่ควรทำอยู่แล้ว โจทย์ที่ทดสอบจึงต้องการมองหาสัญญาณบางอย่างว่าบุคคลนั้นมีความสามารถเชิงลึกที่จะแก้ปัญหาได้อย่างสร้างสรรค์ โดยข้อสอบเป็นแบบ Take-home เพื่อให้เหมือนสถานการณ์จริงที่คนทำงานมีอิสระ

อย่างไรก็ตามเมื่อใช้ Claude แก้ปัญหาข้อสอบนี้ ความสามารถที่มากขึ้นเรื่อย ๆ ก็ทำให้ Claude เขียนโค้ดได้ดีมากในเวลาที่สั้น เขาลองสร้างโจทย์ที่ยากขึ้นระดับที่พบว่า Claude เวอร์ชันตอนนั้นแก้ไม่ได้ แต่เมื่อเวลาผ่านไป Claude รุ่นใหม่ ๆ ก็เก่งขึ้นและให้ผลลัพธ์ได้ดีกว่าคนอยู่ดี

ในตอนนี้ Hume เลยรื้อวิธีการออกข้อสอบใหม่ จากเดิมเป็นโจทย์ที่มาจากสถานการณ์การทำงานจริง เป็นโจทย์แนวพัซเซิลที่ใส่เงื่อนไขข้อจำกัดมากในรูปแบบเกม และไม่มีชุดข้อมูลฝึกฝนที่ Claude เคยเห็นมาก่อนคล้ายเกม SHENZHEN I/O ของ Zachtronics ซึ่งแม้เป็นการทดสอบที่ไม่ได้จำลองสถานการณ์การทำงานจริง แต่ก็ช่วยคัดเลือกคนได้ดีในตอนนี้

Hume ปิดท้ายด้วยการเผยแพร่ข้อสอบคัดเลือกพนักงานเวอร์ชันแรกใน GitHub ซึ่งต้องการให้เขียนโค้ดปรับแต่งประสิทธิภาพการทำงานให้ได้รอบสัญญาณนาฬิกาต่ำที่สุด โดยถ้าใครทำได้น้อยกว่า 1487 รอบ ซึ่งเป็นตัวเลขที่ AI Claude Opus 4.5 ใช้เวลา 11.5 ชั่วโมง ในการคิดออกมาได้ ก็ยื่นใบสมัครงานมาได้เลย

ที่มา: Anthropic

Hiring! บริษัทที่น่าสนใจ

Carmen Software

Hotel Financial Solutions

Next Innovation (Thailand) Co., Ltd.

We are web design with consulting & engineering services driven the future stronger and flexibility.

KKP Dime

KKP Dime บริษัทในเครือเกียรตินาคินภัทร

Kiatnakin Phatra Financial Group

Financial Service

Fastwork Technologies

Fastwork.co เว็บไซต์ที่รวบรวม ฟรีแลนซ์ มืออาชีพจากหลากหลายสายงานไว้ในที่เดียวกัน

Thoughtworks Thailand

Thoughtworks เป็นบริษัทที่ปรึกษาด้านเทคโนโยลีระดับโลกที่คว้า Great Place to Work 3 ปีซ้อน

Iron Software

Iron Software is an American company providing a suite of .NET libraries by engineer for engineers.

CLEVERSE

Cleverse is a Venture Builder. Our team builds several tech companies.

Nipa Cloud

#1 OpenStack cloud provider in Thailand with our own data center and software platform.

Bangmod Enterprise

The leader in Cloud Server and Hosting in Thailand.

CIMB THAI Bank

MOVING FORWARD WITH YOU - CIMB is the leading ASEAN Bank

Bangkok Bank

Bangkok Bank is one of Southeast Asia's largest regional banks, a market leader in business banking

MuvMi (Urban Mobility Tech Co.,Ltd.)

Shape the future of urban mobility towards affordable, clean, and safe solutions

T.N. Digital Solution Co., Ltd.

TNDS has been involving in every first move of banking’s major digital transformation.

KBTG - KASIKORN Business-Technology Group

KBTG - "The Technology Company for Digital Business Innovation"

Siam Commercial Bank Public Company Limited

"Let's start a brighter career future together"

Icon Framework co.,Ltd.

Global Standard Platform for Real Estate แพลตฟอร์มสำหรับธุรกิจอสังหาริมทรัพย์ครบวงจร มาตรฐานระดับโลก

REFINITIV

The Financial and Risk business of Thomson Reuters is now Refinitiv

H LAB

Re-engineering healthcare systems through intelligent platforms and system design.

The Gang Technology Co., Ltd.

We're a Digital Agency that helps our customers transform their business into digital with ease.

LTMH

LTMH มุ่งเน้นการพัฒนาผลิตภัณฑ์ที่สามารถช่วยพันธมิตรของเราให้บรรลุเป้าหมาย

Seven Peaks

We Drive Digital Transformation

Wisesight (Thailand) Co., Ltd.

The Best Choice For Handling Social Media · High Expertise in Social Data · Most Advanced and Secure

MOLOG Tech

We are Modern Logistic Platform, Specialize in WMS, OMS and TMS.

Data Wow Co.,Ltd

We enable our clients to realize increased productivity by solving their most complex issues by Data

LINE Company Thailand

LINE, the world's hottest mobile messaging platform, offers free text and voice messaging + Call

LINE MAN Wongnai

Join our journey to becoming No.1 food platform in Thailand

555 อันนี้จริง…

Tasksenger Sun, 25/01/2026 - 07:21

555 อันนี้จริง แต่ใช้กับคนไทยยาก สมัยผมทำงานใหม่ๆ ก็โดนทดสอบด้วยโจทย์พัชเซิลแบบนี้แหล่ะ พอบอกว่าต้องกมีการทดสอบ คนอื่นหนีเรียบ เหลือผมกับอีกคนนั่งแก้กันจนเกือบทุ่มนึง ซึ่งก็แก้ไม่ได้หรอกนะ ได้แค่ solution ที่เป็นไปได้ แล้วไปนั่งอธิบายให้พี่เขาฟัง แล้วก็ได้งาน ทั้งๆ ที่เรียนไม่ตรงสายงาน แล้วพี่เขาก็มาเฉลยว่า กรูก็แก้ไม่ออกเหมือนกัน แค่อยากทดสอบไหวพริบ การหาวิธีการ แล้วก็ความอึด

ปัญหาผู้สมัครใช้ AI…

au8ust Sun, 25/01/2026 - 12:32

ปัญหาผู้สมัครใช้ AI นี่เป็นเรื่องน่าปวดหัวมาก โดยเฉพาะกับคนที่ไม่รู้ว่าคำตอบของ AI เชื่อถือได้แค่ไหน บางคนเถียงข้างๆ คูๆ ว่าต้องเปิดใจรับฟัง และใช้ AI โดยไม่ดูเลยว่ามันเอาไปใช้จริงไม่ได้ คำตอบมันหลอนมาก 555

ผมสังเกตได้เลยว่าคอมเม้นในโซ…

shub Mon, 26/01/2026 - 11:11

ผมสังเกตได้เลยว่าคอมเม้นในโซเชี่ยลพักหลังดูตอบแบบมีความรู้มากขึ้นส่วนหนึ่งเพราะคนใช้เอไอไปช่วยหาคำตอบมาให้ ถึงแม้เอไอมันยังหลอนตอบผิดอยู่บ่อยๆก็เถอะแต่ก็ยังดีกว่าคอมเม้นของคนทั่วไปโดยเฉลี่ยอยู่มาก บางคนก็ไปให้เอไอมันช่วยแถยับๆก็มีซึ่งก็ยังดีกว่าพวกเถียงไม่ออกแล้วด่ากลับอยู่อีกขั้นนึง รวมถึงช่วงนี้ที่ฮิตมากๆคือioที่ใช้เอไอช่วยสแปมคอมเม้นไปทั่วก็ดูมีคุณภาพมากขึ้นเพียงแต่ช่วยดูหัวข้อที่คุยกันก่อนนิดนึงจะดีมากบางทีหัวข้อโพสไม่เกี่ยวการเมืองก็โยงไปได้หมด55