คุณโจเซฟีน เตียว (Josephine Teo) รัฐมนตรีกระทรวงการสื่อสารและสารสนเทศแห่งสิงคโปร์ เปิดตัว AI Verify - Project Moonshot เวอร์ชันเบต้าเป็นชุดเครื่องมือทดสอบปัญญาประดิษฐ์ ออกแบบมาประเมินความปลอดภัยที่เกี่ยวข้องกับการใช้โมเดลภาษาขนาดใหญ่ (LLM) ซึ่งเป็น Open-source เจ้าแรกๆ ที่สามารถจำลองการโจมตี (red-teaming) การเปรียบเทียบมาตรฐาน และการทดสอบพื้นฐานมารวมกันในแพลตฟอร์มเพื่อรับมือกับความเสี่ยงด้าน AI

Project Moonshot ถูกพัฒนาจากพันธมิตรเช่น DataRobot, IBM, Singtel และ Temasek และเพื่อใช้เป็นมาตรฐานการทดสอบระดับโลก องค์กรทดสอบ AI ชั้นนำสองแห่ง ได้แก่ มูลนิธิตรวจสอบปัญญาประดิษฐ์ (AI Verify Foundation หรือ AIVF) และ MLCommons ได้ลงนามในบันทึกแสดงเจตจำนง (MOI) เพื่อร่วมมือกันสร้างชุดมาตรฐานความปลอดภัยร่วมกัน
สิ่งที่ Project Moonshot สามารถทำได้
- ตรวจสอบประสิทธิภาพและความปลอดภัยของโมเดลด้วยมาตรฐานเช่น Hugging Face หรือชุดทดสอบของ MLCommons เพื่อประเมินประสิทธิภาพของโมเดล
- ช่วยประเมินและให้คะแนนโมเดล AI เพื่อเพิ่มความมั่นใจในการนำโมเดลไปใช้งานจริง
- ชุดยิง prompt จำนวนมากพร้อมกัน เพื่อทดสอบความปลอดภัยแบบ Red Teaming
ตอนนี้เปิดให้นักพัฒนาสามารถใช้เข้างาน Project Moonshot เวอร์ชันเบต้าได้ที่ GitHub

ที่มา: PR Newswire, AI Verify Foundation
on