OpenCV ไลบรารีด้านการประมวลผลภาพ (CV - Computer Vision) ออกเวอร์ชัน 5.0 หลังจากออกเวอร์ชัน 4.0 มาตั้งแต่ปี 2018 โดยเวอร์ชั่นนี้แสดงแนวทางว่า OpenCV จะหันไปรองรับมาตรฐาน ONNX มากขึ้น ทำให้รองรับโมเดลรุ่นใหม่ๆ เช่น YOLOv8 รวมถึงโมเดลภาษาอีกด้วย
OpenCV มีเอนจิน DNN ของตัวเองที่ปรับปรุงใหม่ แต่ API สำหรับเรียกใช้ยังคงเหมือนเดิม และค่ามาตรฐานจะระบุให้เลือกใช้เอนจินอัตโนมัติ เพราะเอนจินใหม่ของเวอร์ชั่นนี้ยังรองรับเฉพาะ CPU เท่านั้น ไม่รองรับ CUDA/OpenVINO เหมือนเอนจินเดิมจาก OpenCV 4.x ที่ยังใช้งานได้อยู่ โดยเอนจิน DNN ใหม่รองรับมาตรฐาน ONNX แล้วมากกว่า 80% และทำงานเร็วกว่า ONNX Runtime มาตรฐานอย่างชัดเจน
การรองรับมาตรฐาน ONNX ทำให้สามารถใช้โมเดลภาษาได้ด้วย เช่น Qwen 2.5, Gemma 3, PaliGemma, และ GPT-2 แม้โดยรวมเป้าหมายโครงการจะไม่ได้พยายามรองรับโมเดลเหล่านี้โดยตรง แต่บางกรณี เช่น ต้องการคำบรรยายภาพก็สามารถรันโมเดลง่ายๆ ได้เลยใน API เดียวกัน
หลังจากนี้ OpenCV มีแนวทางที่จะปรับการประมวลผลทั้งหมดให้รองรับชิปเร่งความเร็ว โดยตอนนี้ก็มี Hardware Acceleration Layer (HAL) ใหม่ที่ทำให้ใช้งานส่วนเร่งความเร็วบนซีพียูได้แทบทุกเจ้าแล้ว ทั้ง x86, Arm, และ RISC-V
ที่มา - OpenCV
on