Tags:
Node Thumbnail

Disney Research ได้เผยแพร่ผลงานการวิจัยใหม่ ว่าด้วยเรื่องของซอฟต์แวร์ที่ช่วยตัดต่อคลิปวิดีโอที่ถูกถ่ายจากกล้องหลายตัวเข้าเป็นคลิปเดียวกัน

ซอฟต์แวร์ที่ Disney Research พัฒนาขึ้นมานี้ สามารถนำคลิปจากกล้องหลายตัวที่บันทึกภาพเหตุการณ์เดียวกันจากหลายมุมมองเข้าเป็นคลิปเดียวกัน โดยมันจะเลือกเอาภาพที่ดีจากกล้องแต่ละตัวในแต่ละขณะมาประกอบกัน ทั้งยังสามารถตัดภาพแบบซูมเจาะเฉพาะส่วนที่สำคัญในแต่ละขณะได้ด้วย

ซอฟต์แวร์ที่ว่านี้อาศัยการประมวลผลจากภาพของกล้องแต่ละตัว ด้วยเทคนิคการวิเคราะห์ที่เรียกว่า "3D Joint Attention" จนสามารถเข้าใจได้ว่าในขณะที่บันทึกคลิปวิดีโอนั้น กล้องแต่ละตัวอยู่ในมุมและตำแหน่งไหนของสถานที่ถ่ายทำ และรู้ได้ว่าสิ่งใดคือจุดรวมความสนใจของการถ่ายทำ (หากกล้องทุกตัวจับภาพเด็กที่กำลังวิ่ง ซอฟต์แวร์ก็จะรู้ว่าการตัดต่อคลิปต้องทำโดยเลือกภาพที่ดีที่แสดงให้เห็นถึงการวิ่งของเด็ก) และเนื่องจากมันรู้ถึงตำแหน่งของกล้อง ทำให้ซอฟต์แวร์สามารถเลือกตัดต่อภาพจากกล้องต่างๆ ได้โดยไม่ฝ่าฝืน "กฎ 180 องศา" ซึ่งหมายถึงหลักการถ่ายทำภาพยนตร์ที่ผู้ตัดต่อไม่ควรตัดสลับภาพไปมาระหว่างกล้องที่ถ่ายจากด้านหน้าและด้านหลัง (หรือระหว่างด้านซ้ายและด้านขวา) ของเหตุการณ์ เพราะจะทำให้ผู้ชมรู้สึกสับสนถึงตำแหน่งและทิศทางการเคลื่อนที่ของสิ่งที่อยู่ในคลิปวิดีโอ

เมื่อซอฟต์แวร์รู้แล้วว่าสิ่งที่ต้องเป็นจุดรวมความสนใจของคลิปคืออะไร มันก็สามารถเลือกจังหวะที่จะตัดสลับภาพจากกล้องตัวแรกไปใช้ภาพจากกล้องตัวอื่นได้ อธิบายเป็นตัวอย่างได้ว่า ซอฟต์แวร์จะตัดภาพจากกล้อง 1 ไปใช้ภาพจากกล้อง 2 ก็ต่อเมื่อจุดรวมความสนใจหลุดออกจากตำแหน่งภาพที่ดีในกล้อง 1 ไปแล้ว หรือเมื่อมุมมองจากกล้อง 2 สามารถเห็นลักษณะการเคลื่อนไหวของจุดรวมความสนใจได้ดีกว่ามุมมองจากกล้อง 1 เป็นต้น โดยการตัดภาพนั้นจะเลือกทำในช่วงจังหวะที่ไม่ใช่การเคลื่อนไหวสำคัญของคนหรือสิ่งของในภาพด้วย

นอกจากนี้ซอฟต์แวร์ของ Disney Research ยังสามารถตัดต่อคลิปโดยเลือกตัดเจาะเอาเฉพาะส่วนที่น่าสนใจของคลิปนั้นได้ ยกตัวอย่างเช่น ในการถ่ายคลิปการแข่งขันฟุตบอลจากระยะไกล ซึ่งทำให้ได้ภาพมุมกว้างมานั้น ตัวซอฟต์แวร์สามารถตัดเจาะภาพโดยเลือกเอาเฉพาะส่วนของผู้เล่นและสนามให้อยู่ในเฟรมภาพของชิ้นงานได้ เพราะรู้ว่าส่วนของอัฒจันทร์สนามและท้องฟ้าเบื้องหลังนั้นไม่ใช่จุดรวมความสนใจของการถ่ายทำ

ความสามารถอื่นของซอฟต์แวร์ที่ถูกพัฒนาขึ้นนี้ยังมีการเรียบเรียงภาพจากคลิปเพื่อแยกแยะ "เนื้อเรื่องย่อย" ของการถ่ายทำออกจากกันให้ด้วย ตัวอย่างเช่นในงานเลี้ยงสังสรรค์ที่มีการบันทึกคลิปวิดีโอไว้ด้วยกล้องหลายตัวภายในงาน โดยกล้องส่วนหนึ่งเน้นถ่ายภาพบนเวที ในขณะที่ที่อีกส่วนหนึ่งเน้นถ่ายภาพบนโต๊ะอาหาร เมื่อนำภาพทั้งหมดมาตัดต่อรวมกัน ซอฟต์แวร์ของ Disney Research จะหลีกเลี่ยงการตัดภาพสลับไปมาระหว่างบนเวทีกับบนโต๊ะอาหาร (เพราะมันทราบดีว่าเนื้อหาของคลิปเหล่านั้น สนใจในคนละเรื่องกัน) แต่จะพยายามเรียบเรียงคลิปส่วนบนเวที และคลิปในส่วนของโต๊ะอาหาร แยกเป็นคนละช่วงออกจากกัน

ผลประโยชน์ที่เล็งเห็นได้ชัดของซอฟต์แวร์นี้ คงเป็นการนำไปประยุกต์ใช้เป็นเครื่องมือตัดต่อวิดีโอสำหรับผู้ใช้ที่ไม่ใช่มืออาชีพด้านการถ่ายทำหรือตัดต่อภาพ ซึ่งก็ไม่แน่ว่าวันหนึ่งเราอาจเห็นแอพตัดต่อคลิปที่สุดฉลาดจาก Disney ก็เป็นได้

ที่มา - Mashable, เอกสารงานวิจัย

Get latest news from Blognone

Comments

By: Jaddngow
AndroidUbuntuWindows
on 18 August 2014 - 01:32 #732633
Jaddngow's picture

Disney นี่งานวิจัยitเยอะจัง

By: pongmile
ContributorAndroidSymbianWindows
on 18 August 2014 - 01:46 #732636
pongmile's picture

โหดมากครับ =0=

By: kookai
AndroidWindows
on 18 August 2014 - 02:08 #732640

ยังไม่ทันได้อ่านตัว paper แต่ดู footage อยู่ พอถึงฉากสาธิตใน Gym มีคนเล่นบาสกันอยู่ หัวเราะก๊ากเลย ...

ตีแบตในนั้นประจำทุกอาทิตย์ :)

By: put4558350
ContributorAndroidUbuntuWindows
on 18 August 2014 - 03:04 #732645
put4558350's picture

น่าจะช่วยในงานถ่ายทอดสดใด้โรเลยทีเดียว


samsung ใหญ่แค่ใหน ?
https://youtu.be/6Afpey7Eldo

By: panurat2000
ContributorSymbianUbuntuIn Love
on 18 August 2014 - 07:12 #732652
panurat2000's picture

เพราะรู้ว่าส่วนของอัฒจันทน์สนามและท้องฟ้าเบื้องหลังนั้นไม่ใช่จุดรวมความสนใจของการถ่ายทำ

อัฒจันทน์ => อัฒจันทร์

By: pepporony
ContributorAndroid
on 18 August 2014 - 08:06 #732655

เอ้ย แจ่มอะ

By: adamy
iPhoneAndroidBlackberryUbuntu
on 19 August 2014 - 23:34 #733267

ต่อไปคือการทำ J Cut-L Cut Technique เพื่อให้ได้สูตรการเล่าเรื่องผ่านการตัดต่อที่ดีครับ แล้วก็แก้สีเพื่อ Match Color ในตัว

ปัญหาคือเราจะรู้ได้อย่างไรว่า Tension ของซีนนั้นๆคืออะไร แล้วการตัดอัตโนมัติจะจับส่วนสำคัญของการสนทนา/การกระทำได้อย่างไร เพื่อจับกริยาที่สำคัญที่สุด

ถ้าเป็นกริยาทั่วไปเช่นการเล่นบาส เราพอจะมองออกจากการขยับและการจับภาพ แต่การแสดงออก (เช่นการเล่นตลกรับลูกไปมาระหว่างสองคน หรือนักมายากลกับผู้ช่วย) จังหวะที่ดีนั่นจะจับได้อย่างไรให้ดูลื่นไหลครับ

คงจะต้องใช้เทคโนโลยีในตลาดหลายๆตัวมาเสริมและเกื้อหนุนกันอีกครับ

แต่น่าจะช่วยได้มากเรื่องการติดตามพฤติกรรมสัตว์ในสวนสัตว์ หรืออะไรทำนองนี้นะครับ : )

ขอบคุณครับ สวัสดีครับ