Tags:

คุณศุภศรณ์ สุวจนกรณ์ จากห้องวิจัย GRAIL นำเสนองานวิจัยในการสร้างวิดีโอของบารัก โอบามา ตามเสียงที่ใส่เข้าไปได้อย่างสมจริง โดยอาศัยข้อมูลเสียงนำมาสร้างเป็นรูปแบบของปากแล้วจึงใส่รายละเอียดลงไปก่อนจะนำภาพปากเคลื่อนไหวนี้ไปใส่วิดีโอเป้าหมาย

งานวิจัยนี้ทำให้สามารถนำเสียงของโอบามาเองมาสร้างภาพวิดีโอใหม่ โดยไม่ต้องอาศัยวิดีโอของการพูดครั้งนั้นจริงๆ แม้แต่เสียงที่สร้างขึ้นมา เช่น เสียงของคนที่เลียนแบบโอบามา หรือเสียงของโอบามาที่ถูกตัดต่อ

การสร้างรูปแบบปากที่เข้ากับเสียง ใช้ recurrent neural network โดยใช้ข้อมูลวิดีโอ 14 ชั่วโมง จากนั้นจึงสร้างภาพปากอย่างละเอียด (รายงานระบุว่าส่วนที่ยากกลับเป็นฟัน) แล้วทำมาปรับเวลากับวิดีโอเพื่อให้การเคลื่อนไหวของหัวสัมพันธ์กับปาก

ตอนนี้คุณศุภศรณ์ทำงานวิจัยอยู่กับ Google Brain ในงานผสม deep learning, computer vision, และ VR

ที่มา - GRAIL

Get latest news from Blognone

Comments

By: MrThursday
ContributorRed HatUbuntuWindows
on 15 July 2017 - 22:29 #998013

ถ้านำไปรวมกับ GAN ได้ดีๆเมื่อไหร่นี่คือสร้างหนังใหม่ ดาราใหม่ได้เลย

By: hisoft
ContributorWindows PhoneWindows
on 15 July 2017 - 22:58 #998015
hisoft's picture

ในคลิปเห็นอ้างอิง Face2face ที่เคยลงข่าวเก่าด้วย น่าจะอ้างอิงไว้ด้วยนะครับ

By: Be1con
ContributorWindows PhoneWindowsIn Love
on 16 July 2017 - 00:10 #998021
Be1con's picture

เนี่ยแหละคือโปรเจกต์หนึ่งที่ผมเคยคิดจะทำ มันน่ากลัวมากครับถ้าหากทำสำเร็จจริง ๆ


Coder | Designer | Thinker | Blogger

By: maxmin on 16 July 2017 - 07:53 #998027

วิดีโอหรือรูปที่โพสลงในเฟสบุ๊คสามารถใช้เป็นพยานหลักฐานในชั้นศาลได้มั๊ย แล้วเค้าจะรู้ได้ไงว่าสิ่งนั้นเป็นของแท้ไม่มีการแต่งเติม

By: ash_to_ash
AndroidWindows
on 16 July 2017 - 08:54 #998032 Reply to:998027

อันนี้ผมไม่มีความรู้ลึกๆนะครับ
ปรกติเวลาภาพที่ถูก Edited มันจะมี
format ใน properties ว่าโดนแก้ไขอะไร
ส่วนวิดีโอก็จะปรกฎในโค้ด ซึ่งบางทีมือสมัครเล่นก็ดูออกบางอันก็ต้องผู้เชี่ยวชาญ
ต้องถามว่าในกรณีนี้โค้ดมีเปลี่ยนแปลงหรือไม่?

By: Fourpoint
Windows PhoneAndroidSymbian
on 16 July 2017 - 11:30 #998044 Reply to:998032

ผมเข้าใจว่า ถ้าไม่ได้เข้ารหัสด้วยkeyเฉพาะยังไงก็แก้ไขข้อมูลที่ซ่อนอยู่โดยตรงได้ครับ

เหมือน exif ก็แก้ไขโดยตรง ยากสุดก็เข้าไปแก้แบบ binary,hex mode จาก file โดยตรงเลย หา header ให้เจอก็จบ

ส่วนในทางศาล ภาพถ่าย คลิปวิดีโอ ต้องนับเป็นพยานแวดล้อมครับ แต่น่ากลัวมากๆ เพราะหลายคดีตัดสินจากพยานแวดล้อมล้วนๆ....

By: Hadakung
iPhoneWindows PhoneAndroidWindows
on 16 July 2017 - 10:33 #998040 Reply to:998027

อีกไม่นานก็จะมีการทำ signature วีดีโอกันนะครับถ้ามาถึงยุคที่ภาพตัดต่อกันเนียนมากๆ วิธีนี้ก็การันตีได้ว่าไฟล์วีดีโอเป็น origin ได้

By: lew
FounderJusci's WriterMEconomicsAndroid
on 16 July 2017 - 13:37 #998057 Reply to:998027
lew's picture

ถ้า "ตอนนี้" ยังพอตรวจได้ครับ ใน paper ก็พูดถึงความไม่สมบูรณ์ ที่ยังมีช่วงเวลาแปลกๆ อยู่

แต่ถึงจุดหนึ่งมันก็คงหายไปเรื่อยๆ ถึงตอนนั้นจะทำยังไงกันต่อก็เป็นคำถามที่ต้องถามในระยะยาว


lewcpe.com, @wasonliw

By: Sephanov
iPhoneUbuntu
on 16 July 2017 - 08:45 #998030
Sephanov's picture

อันนี้แหล่ะ น่ากลัวสุดๆ เกิดใครเอาวิดีโอผู้นำไปพูดเผยแพร่ในทางที่ไม่ดี เช่นก่อหรือเข้าร่วมสงครามจะน่ากลัวเอามากๆ

By: MaxDOL
iPhoneWindows
on 16 July 2017 - 13:18 #998056

ปัจุบัน Fake News ถือว่าเป็นเรื่องที่น่ากลัวมากๆ

ด้วยเทคโนโลยีแบบนี้ยิ่งอันตราย สามารถชักจูงคนได้ง่ายขึ้นไปอีก

By: aUnderscore_ on 16 July 2017 - 17:00 #998062

ความน่ากลัวของ AI อยู่ที่คนเอาใช้เนี่ยแหละครับ เอาไปใช้ในเชิงสร้างสรรค์มันก็เกิดประโยชน์ เอาไปในเชิงทำลาย มันก็สร้างความเสียหายอย่างน่ากลัว

By: yamaha111
Contributor
on 16 July 2017 - 17:58 #998072
yamaha111's picture

คงเป็นได้แค่ Fake News สำหรับยุยงม๊อบให้กระทำอะไรก็ตามตามที่ต้องการ ซึ่งความจริงม๊อบก็พร้อมจะทำอยู่แล้วไม่ว่าจะมี Fake News หรือไม่มีก็ตาม

ส่วนเรื่องสงคราม "เป็นไปไม่ได้เลย" ทหารจะทำภารกิจหรือไม่ มาจากคำสั่งตามลำดับการบัญชาการเท่านั้น แค่คุณบุกเข้าไปในกองทัพบกแล้วเอาปืนจ่อหัวให้ผบ.ทบ.สั่งบุก เท่านี้ก็เพียงพอที่จะเกิดสงครามแล้ว ไม่จำเป็นต้องพึ่งพาเทคโนโลยีอะไรหรอก

กรณีมีใครก็ตามสั่งให้ทำสงครามผ่านคลิปวีดีโอ ในยุค 2017 คงมีแต่ ISIS หรืออัลกออิดะห์เท่านั้นแหละครับ ซึ่งใช้คลิปห่วย ๆ หรือเอาตัวปลอมมาพูด คนทำก็ยินดีทำตามอยู่แล้ว

By: makeithard
iPhoneAndroid
on 16 July 2017 - 20:21 #998081 Reply to:998072

น่าจะหมายถึงยุยงให้เกิดสงครามระหว่างประเทศมากกว่าครับ

By: clayzizer
Windows PhoneAndroidBlackberryWindows
on 16 July 2017 - 19:39 #998075

ดีครับจะได้ไม่ต้อง Sync แบบทีละเฟรม เหนื่อย

By: jibbies
iPhone
on 16 July 2017 - 20:54 #998084

อยากเห็นโอบาม่าพูดไทย
-- อย่างงี้เพจ พากษ์นรก ก็ตกงานเลยสิคับ

By: CyTrix
Windows
on 17 July 2017 - 09:00 #998120

น่ากลัวคนใช้ในทางที่ผิด

By: btoy
ContributorAndroidWindows
on 17 July 2017 - 09:43 #998147
btoy's picture

มาไกลถึงขนาดนี้แล้วเหรอเนี่ย


..: เรื่อยไป