OpenAI ออกโมเดลปัญญาประดิษฐ์ใหม่ o3-pro บอกว่าที่เป็นรุ่นฉลาดในตระกูลโมเดล o3 สามารถคิดได้นานมากขึ้น และให้คำตอบที่แม่นยำมากกว่า ซึ่งเป็นรุ่นถัดจาก o1-pro ที่ออกมาก่อนหน้านี้ เหมาะสำหรับการใช้งานด้านคณิตศาสตร์ วิทยาศาสตร์ เขียนโค้ด
เนื่องจาก o3-pro ใช้เวลาในการคิดคำตอบโดยเฉลี่ยนานมากกว่า o1-pro OpenAI จึงแนะนำให้ใช้งานกับคำถามที่ยากและท้าทาย ต้องการได้คำตอบที่ถูกต้องมากกว่าต้องการความเร็วของคำตอบ
OpenAI ประเมินความพอใจของการใช้งาน o3-pro เมื่อเทียบกับ o3 ในด้านต่าง ๆ พบว่าคะแนนความพอใจคำตอบออกมาสูงกว่าทุกด้าน ส่วนความแม่นยำของคำตอบทำได้สูงกว่าทั้ง o1-pro และ o3


o3-pro เพิ่มเป็นโมเดลให้เลือกใช้งานใน ChatGPT แล้ววันนี้สำหรับลูกค้า Pro และ Team แทนที่โมเดล o1-pro ส่วนลูกค้า Enterprise และ Edu จะได้ใช้งานเร็ว ๆ นี้ ส่วนลูกค้า API สามารถใช้งาน o3-pro ได้แล้วเช่นกัน คิดราคา 20 ดอลลาร์ต่อล้านโทเค็นของอินพุต และ 80 ดอลลาร์ต่อล้านโทเค็นของเอาท์พุต ถูกลงกว่าราคา 01-pro ถึง 87%
ราคา API ของโมเดล o3 ก็ลดลงราคาลง 80% เช่นกัน อยู่ที่ 2 และ 8 ดอลลาร์ ต่อล้านโทเค็นอินพุตและเอาท์พุต
ที่มา: OpenAI และ Maginative
on
“…
langisser Wed, 11/06/2025 - 12:57
“ ต้องการได้คำตอบที่ถูกต้องมากกว่าต้องการความเร็วของคำตอบ”
เคสแบบไหนที่เราต้องการความเร็วมากกว่าความถูกต้องนะ
ตอนนี้เราใช้ GPT 4.1-mini…
hisoft Wed, 11/06/2025 - 13:47
In reply to “… by langisser
ตอนนี้เราใช้ GPT 4.1-mini เป็นตัวหลักเลยฮะเพราะมันเร็วจัดมาก แล้วเราเป็นคนเช็คความถูกต้องก่อนเอาไปใช้อยู่แล้ว จะเป็นเรื่องโค้ดหรือการเขียนเราเป็นคน approve ก่อนมันเอาไปใช้อยู่แล้ว มันเขียนเร็วเราก็ได้เริ่มตรวจเร็ว แล้วมันผิดน้อยมากอยู่แล้วด้วย
ตอนลืมทำการบ้าน ❌…
tontpong Thu, 12/06/2025 - 06:00
In reply to “… by langisser
ตอนลืมทำการบ้าน ❌
ตอนทำข้อสอบ ❌
ตอนนายสั่งงานแล้วขอส่งด่วน , ใช้พรุ่งนี้ ❌
ตอนแฟนถามว่า , กินอะไรดี ซื้ออันไหนดี ❌
เอ้ย ถูกละ ✅ .. อันนี้ คำถามตอบด่วน , ไม่มีเวลาพอให้ไล่เทียบสเป็คเทียบคะแนนแล้วสรุปเป็นรายงานเหมือนตอนเราจะขออนุมัติงบซื้อของจาก ผบ 🪖
จริงจังๆ ละ 😅 , ต้นทางใช้คำว่า reliability ( ความน่าเชื่อถือ ) และก็มีคำว่า tradeoff ด้วย .. คือผลลัพธ์ก็ยังเหมือนที่มักมีหมายเหตุกำกับ ว่า , ผลลัพธ์อาจผิดพลาดไม่ถูกต้อง ผู้ใช้ควรตรวจสอบอีกครั้ง
แต่พวก model ที่จัดเป็นพวก reasoning , จะ ตรวจสอบผลลัพธของตัวเอง มาก่อนประมาณนึงแล้ว ( self-reflection / cross-check / double check ประมาณนั้น ) .. ความน่าเชื่อถือก็จะน่ามีมากกว่า ไม่ใช่ตอบแบบหัวไปทางหางไปทาง ( ตอบไม่คิด vs คิดก่อนตอบ / คิดน้อยไป vs คิดมากไป , ประมาณนั้น แม้จะมีประเด็นว่ามันได้ "คิด" จริงมั้ย )
แล้วพอมีคำว่า tradeoff ด้วย , มันจะไม่ใช่ on/off ศูนย์/หนึ่ง หน้า/หลัง บน/ล่าง ซ้าย/ขวา บี/เอ select/start ( เอ้ะ 😶 ) .. แปลไทยที่นิยมกันก็น่าจะประมาณ ชั่งน้ำหนักเลือกระหว่าง , คือจะเป็น scale ที่เลือกผสมๆ กันได้
อนึ่ง , ส่วนตัวมักถามตัวเร็วก่อน , เพื่อเก็บ keyword/context .. ถ้าไปเจอ keyword/context ที่ลืมระบุตอนถามตัวคิดเยอะที่ตอบช้า , บางทีต้องโละถามใหม่เพราะต้องปรับเป้า พอมันช้าก็จะพลอยยิ่งเสียเวลา(และโควตา)
หรือบางที คำ หรือ ค่า , มันจำเพาะ .. แต่นึกเป้ะๆ ไม่ออก , มีภาพในหัวอยู่ประมาณนึง ก็บรรยายหรือยกตัวอย่างไปให้มันตอบ ( เดา ) .. แล้วค่อยแงะ คำ หรือ ค่า , ไปจิ้มเพื่อ check ใน search engine อีกที
ปล. มี ai vendor เจ้าไหนที่ เอกสารทางการ ตั้งใจใช้คำว่า ความถูกต้อง , มั้ยนะ .. จะทำให้ตัวเองเสี่ยงโดน claim มากเกินจำเป็น , รึป่าว