Tags:
Node Thumbnail

Meta โชว์งานวิจัยปัญญาประดิษฐ์ 2 ตัวสำคัญ คือ Emu Edit สำหรับการแก้ไขภาพตามคำสั่ง และ Emu Video ที่แปลงภาพนิ่งกลายเป็นภาพเคลื่อนไหวโดยทั้งสองโมเดลอาศัยโมเดลแปลงข้อความเป็นภาพที่ชื่อว่า Emu ที่ Meta เคยรายงานมาก่อนหน้านี้แล้ว

Emu Video สามารถสร้างภาพเคลื่อนไหวได้จากข้อความอย่างเดียว, ภาพอย่างเดียว, หรือสองอย่างร่วมกันก็ได้ โดยภายในโครงสร้างเรียบง่ายกว่าโมเดลเดิม เช่น Make-A-Video ทำให้ทำงานได้เร็วกว่ามาก ขณะที่ผลทดสอบด้วยคนให้เลือกวิดีโอที่สวยกว่า Emu Video ก็ถูกเลือกมากกว่าทุกโมเดล โดยเฉลี่ยสูงถึง 96% มีเพียง Imagen-Video ที่ได้คะแนนความถูกต้อง (faithfulness) พอๆ กับ Emu Video

Emu Edit นั้นปรับแต่งภาพได้อย่างละเอียด โดยสามารถสร้างดึงวัตถุกที่ต้องการออกมาจากพื้นหลังได้ ปรับแต่งสไตล์ได้ตามใจชอบ ทีมวิจัยพบว่าต้องสอน Emu Edit ให้ทำตามคำสั่งพื้นฐานของงาน computer vision ไปด้วย เช่น การตรวจจับวัตถุ, การหาพื้นที่ของวัตถุ (segmentation) ซึ่งการทำให้ปัญญาประดิษฐ์มีความสามารถนี้ทำให้สามารถรับคำสั่งได้อย่างละเอียด สามารถเปลี่ยนแปลงท่าทางของตัวละครได้อย่างแม่นยำ

ทาง Meta ยังไม่เปิดให้คนนอกเข้าใช้งานโมเดล Emu แต่อย่างใด

ที่มา - Meta

No Description

Get latest news from Blognone