Tags:
Node Thumbnail

กูเกิลเปิดตัว Imagen งานวิจัย AI สร้างรูปภาพเสมือนจริงที่ใช้ input เป็นคำบรรยาย แบบเดียวกับ DALL·E ของ OpenAI โดยมีขั้นตอนการทำงานคือแปลงข้อมูล text ออกมาเป็นภาพความละเอียดต่ำ จากนั้นใช้เครื่องมือแปลงให้เป็นภาพที่มีความละเอียดมากขึ้น

จุดเด่นที่กูเกิลระบุว่า Imagen เหนือกว่าเครื่องมือประเภทเดียวกัน คือการพัฒนาเครื่องมือวัดผลที่ชื่อ DrawBench ซึ่งใช้การเทียบข้อมูล text แบบเดียวกัน สร้างรูปภาพจากเครื่องมือหรือโมเดลอื่นมาเปรียบเทียบได้แก่ VQ-GAN+CLIP, Latent Diffusion Models และ DALL-E 2 ซึ่งประเมินคุณภาพของรูปโดยใช้คนตัดสิน พบว่า Imagen มีคะแนนที่ดีกว่า

อย่างไรก็ตามงานวิจัยและเครื่องมือนี้ กูเกิลบอกว่ายังไม่เหมาะสมที่จะเปิดรายละเอียดทั้งหมดต่อสาธารณะ (เช่นเดียวกับ DALL·E) เนื่องจากชุดข้อมูลรูปภาพตั้งต้นที่ใช้ ต้องประมวลผลและตรวจสอบอีกมาก ว่าไม่มีความลำเอียงของข้อมูล หรือประเด็นที่อ่อนไหว

ที่มา: Imagen ผ่าน The Verge

alt="Imagen Image"

alt="Imagen Image"

Get latest news from Blognone

Comments

By: Whisper
iPhoneWindows PhoneAndroidBlackberry
on 25 May 2022 - 09:52 #1249850

ตามเข้าใปดูรูปจาก Imagen แล้วรู้สึกขนลุกไงไม่รู้

สิ่งที่คนเรามั่นใจมาตลอดว่าเหนือกว่าเครื่องจักรคือจินตนาการ
แต่มา ณ ตอนนี้มันสั่นคลอนแล้ว

By: TheOrbital
iPhoneWindows PhoneAndroidSymbian
on 25 May 2022 - 11:23 #1249862 Reply to:1249850
TheOrbital's picture

ยังไงผมว่าสำหรับงานศิลปะมันไม่ได้อยู่แค่จินตนาการแต่ขึ้นกับอารมณ์ด้วย
และจินตนาการของ AI ก็ยังมี Pattern อยู่ (แต่จุดนี้อนาคตอาจจะพัฒนาขึ้นก็ได้)

AI พอจะสร้างภาพให้ได้ แต่สำหรับภาพวาด อารมณ์จะทำให้ภาพต่างออกไปในแต่ละครั้งที่วาด
และจินตนาการของมนุษย์ไม่มีแพทเทิร์นที่แน่นอน เช่นถ้าให้วาดรูปตามสั่งเหมือนๆกันวันละรูป
สำหรับมนุษย์อาจจะได้ภาพที่ใกล้เคียงแต่ไม่มีทางเหมือนกันเป๊ะๆแน่
แต่ AI มันอาจจะวนลูปภาพเดิมๆเป๊ะๆกลับมาให้ได้

By: Fasndee
ContributorAndroidWindows
on 25 May 2022 - 10:51 #1249858
Fasndee's picture

stock photo เจ๊งแน่ ถ้าสามารถนำไปเปิดใช้ในวงกว้างได้ระดับนั้น


เพจตัวอย่างผลงานถ่ายภาพ / วีดีโอ

By: deaknaew on 25 May 2022 - 11:58 #1249873

เราก็จะ imagen 18+ แบบที่ชอบได้ใช่ไหม

By: KuLiKo
ContributoriPhoneWindows PhoneAndroid
on 25 May 2022 - 13:41 #1249891 Reply to:1249873
KuLiKo's picture

ผมรู้ผมมันบาป แต่ก็คิดแว่บแรกเหมือนท่าน...

By: max212
AndroidRed HatSUSEUbuntu
on 26 May 2022 - 00:27 #1249981
max212's picture

แต่ละรูปเค้าใช้ประโยคว่าอะไร ถ้าไม่ดูเฉลย มีงงแน่นอน 555+
นึกถึงถ้าเอาไปสร้างฉากจากนิยายได้ จะเจ๋งมากๆ เลย