Tags:
Node Thumbnail

Hao Li ผู้ช่วยศาสตราจารย์ด้านคอมพิวเตอร์กราฟิกจาก University of Southern California และผู้อำนวยการห้องวิจัยกราฟิกและการมองเห็นให้สัมภาษณ์กับช่อง CNBC ว่าเขาเชื่อว่าเทคโนโลยี Deepfake ที่ใช้แปลงใบหน้าคนลงบนวิดีโออื่นนั้นจะไปสู่จุดที่คนทั่วไปสามารถสร้างวิดีโอที่สมจริงได้ภายในระยะเวลา 6 เดือนถึง 1 ปีข้างหน้า

Hao ระบุว่าด้วยเทคโนโลยีปัจจุบันก็เพียงพอที่จะสร้างวิดีโอที่น่าเชื่อถือได้อยู่แล้ว แต่สำหรับโปรแกรม Deepfake ที่แจกออกมานั้น คนทั่วไปยังคงสามารถมองออกได้โดยง่ายว่าเป็นวิดีโอปลอม

Tags:
Node Thumbnail

อินเทลเปิดตัวบอร์ด Pohoiki Beach บอร์ดพัฒนาที่เป็นชิป Loihi จำนวน 64 ชิป แต่ละชิปมีคอร์ 128 คอร์ ทำให้ตัวบอร์ดสามารทำงานเทียบเท่าสมองที่มีขนาด 8 ล้านนิวรอน และคาดว่าจะสามารถพัฒนาบอร์ดที่จำลองการทำงานสมองขนาด 100 ล้านนิวรอนได้ในปีนี้

บอร์ด Pohoiki Beach ไม่ได้วางขาย แต่ส่งมอบให้กับกลุ่มนักวิจัย โดยตัวชิป Loihi เองก็เปิดตัวมาตั้งแต่ปี 2017

อินเทลยังอยู่ระหว่างการทดสอบแนวทาง neuromorphic-computing ว่ามีแนวทางการใช้งานที่เหมาะกับการค้าหรือไม่ แม้ว่าผลตอนนี้จะสามารถสาธิตได้ว่าใช้พลังงานน้อยกว่าชิปกราฟิกอย่างมาก แต่สามารถประมวลผลตามเวลาจริงได้

Tags:
Node Thumbnail

เราเคยเห็นโมเดลการสร้างวิดีโอปลอม หรือคลิปเสียงปลอม ที่พัฒนาจากการเทรนข้อมูลคลิปวิดีโอและคลิปเสียงจำนวนมาก หรือ Deepfake แต่งานวิจัยล่าสุดที่เผยแพร่โดย Samsung AI Center สามารถพัฒนาผลลัพธ์ได้ไกลกว่านั้น โดยอาจใช้ข้อมูลเริ่มต้นด้วยรูปภาพเพียง 1 รูปเท่านั้น

รูปแบบการสร้างคลิปดังกล่าว อาศัยการเทรนข้อมูลคลิปวิดีโออื่นที่เป็นการถ่ายเจาะเฉพาะใบหน้าจำนวนหนึ่งก่อน จากนั้นจับเฉพาะตำแหน่งสำคัญบนใบหน้าเพื่อใช้ในการสร้างคลิปวิดีโอ เช่น คิ้ว ตา จมูก ปาก เมื่อเราให้ข้อมูลภาพถ่ายใบหน้า ก็สามารถสร้างวิดีโอปลอมขึ้นมา โดยอาศัยการจับตำแหน่งสำคัญเหล่านั้น แล้วทำการขยับส่วนต่าง ๆ บนใบหน้าออกมานั่นเอง

Tags:
Node Thumbnail

AWS เปิดตัวฟีเจอร์ใหม่ Deep Learning Containers หรือ DL Containers เป็นฟีเจอร์ที่ AWS จะทำอิมเมจของ Docker สำหรับใช้งานประเภท deep learning พร้อมกับคอนฟิกด้านในอิมเมจไว้ให้เรียบร้อย เพื่อให้หยิบมาใช้งานได้โดยไม่ต้องเริ่มทำอิมเมจเองใหม่ตั้งแต่ต้น

สำหรับอิมเมจเหล่านี้ AWS ได้ทำการคอนฟิกให้เรียบร้อยแล้ว เพื่อให้ผู้ใช้หยิบมาใช้งานได้เลย ทั้งผ่าน ECS, EKS หรือ EC2 ในเวลาเพียงไม่กี่นาที ซึ่งอิมเมจเหล่านี้มีให้เลือกบน AWS Marketplace และ ECR ซึ่งผู้ใช้สามารถนำมาใช้โดยไม่มีค่าใช้จ่ายเพิ่มเติม ซึ่งจะนำมาใช้เลยก็ได้ หรือจะคอนฟิก, ใส่ไลบรารี, ใส่แพคเกจเพิ่มก็ได้เช่นกัน

Tags:
Node Thumbnail

สองปีก่อนกูเกิลเคยเสนองานวิจัย AutoML ที่สามารถ "ออกแบบ" โมเดล deep learning สำหรับงานเฉพาะทางได้โดยไม่ต้องอาศัยนักวิจัยมานั่งปรับโมเดล แต่ระบบเหล่านี้มักใช้พลังประมวลผลสูงมาก จนคนทั่วไปไม่สามารถลงทุนได้ ล่าสุดทีมวิจัยจาก MIT เสนอแนวทางใหม่ที่สร้างระบบออกแบบโมเดลโดยใช้พลังประมวลผลระดับเดียวกับการฝึกโมเดล deep learning ไม่ได้ต่างกันเป็นร้อยเท่าพันเท่าเหมือนแต่ก่อน

ระบบ neural architecture search (NAS) ที่ใช้ระบบอัตโนมัติออกแบบสถาปัตยกรรม deep learning แต่ระบบนี้อาศัยการปรับปรุงโมเดลไปเรื่อยๆ และฝึกโมเดลใหม่ทุกครั้ง ทำให้กินระยะเวลาประมวลผลสูงมาก

Tags:
Node Thumbnail

TensorFlow ประกาศเปิดตัววิชาเรียนฟรี 2 ชุดพร้อมกันบนสองแพลตฟอร์ม คือ Coursera และ Udacity

บน Coursera คือวิชา Intro to TensorFlow for AI, ML and DL เป็นการสอน TensorFlow ระดับเริ่มต้น เวลารวมชั่วโมงกว่าๆ เท่านั้น โดยวิชานี้เป็นวิชาแรกในชุดวิชา TensorFlow: from Basics to Mastery ที่จะเปิดวิชาอื่นเพิ่มภายหลัง

Tags:
Node Thumbnail

PyTorch ไลบรารี deep learning จากค่าย Facebook ออกเวอร์ชัน 1.0 stable แล้ว หลังออกเวอร์ชัน 1.0 dev มาตั้งแต่เดือนพฤษภาคม และรุ่นพรีวิวก่อนตัวจริงเมื่อเดือนตุลาคม

PyTorch เป็นไลบรารีที่พัฒนาจาก Torch ที่ได้รับความนิยมในสายงานวิจัย แต่รองรับภาษา Python เป็นหลัก ทำให้ใช้งานง่ายกว่า Torch (ที่เขียนด้วย Lua เป็นหลัก) ทีมพัฒนาหลักของ PyTorch คือพนักงานของ Facebook และเป็นไลบรารีที่ได้รับความนิยมมากขึ้นเรื่อยๆ ในช่วงหลัง โดยเป็นโครงการที่เติบโตเร็วเป็นอันดับสองบน GitHub (อันดับหนึ่งคือ Azure Docs)

Tags:
Node Thumbnail

ช่วงนี้เป็นมีการประชุมวิชาการ NeurIPS 2018 ( ที่เพิ่งเปลี่ยนชื่อย่อไป) Andrew Ng ก็ระบุว่าเป็นการครบรอบ 10 ปีพอดี ที่รายงานวิจัย "Learning Large Deep Belief Networks using Graphics Processors" ตีพิมพ์ออกมา ถือเป็นจุดเปลี่ยนของการใช้ชิปกราฟิกเพื่อรันโมเดลปัญญาประดิษฐ์

การใช้ชิปกราฟิกรันโมเดลปัญญาประดิษฐ์ทำให้โมเดลที่เคยมีขนาดเล็ก ใช้งานได้จำกัด สามารถขยายเป็นขนาดใหญ่ที่มีประโยชน์มากกว่า สามารถใช้งานที่ซับซ้อน

Tags:
Node Thumbnail

เฟซบุ๊กเปิดตัว PyTorch 1.0 ตั้งแต่เดือนพฤษภาคมที่ผ่านมา โดยตอนนี้ก็ยังเป็นเพียงรุ่นพรีวิวอยู่ อย่างไรก็ตามที่งาน PyTorch Developer Conference เมื่อวานนี้ก็มีการประกาศความก้าวหน้าของโครงการเพิ่มเติม

ฟีเจอร์ที่เพิ่มมาคือการทำงานในโหมด eager ที่ช่วยให้นักพัฒนาสามารถทดลองกับกราฟประมวลผลได้ง่ายขึ้น และมีการปรับปรุงไลบรารี torch.distributed โดยตอนนี้รองรับทั้ง Python และ C++

Tags:
Node Thumbnail

NVIDIA เผยแพร่งานวิจัย Video-to-Video Synthesis หรือ vid2vid โครงการสังเคราะห์วิดีโอในรูปแบบต่างๆ โดยมีความเหนือกว่าโมเดลเดิมๆ คือสามารถสร้างวิดีโอความละเอียดสูงระดับ 2K (2018x1024)

นักวิจัยลองฝึกโมเดลด้วยชุดข้อมูลต่างๆ เช่น ชุดข้อมูล Cityscape มาจัดส่วนต่างๆ ของภาพ (segmentation) ด้วย Mask R-CNN แล้วฝึกให้โมเดลสร้างวิดีโอจากภาพ segmentation ผลที่ได้คือวิดีโอที่สามารถแปลงสภาพแวดล้อม จากพื้นถนนปูนให้เป็นพื้นอิฐ หรือแปลงสภาพแวดล้อมจากต้นไม้ให้เหลือแต่ตึก

Tags:
Node Thumbnail

การใช้ปัญญาประดิษฐ์สร้างหนังโป๊โดยใส่หน้าคนดังเข้าไปแทนที่ตัวแสดงจริง นับเป็นปัญหาใหม่ของโลกในช่วงปีที่ผ่านมา จากเทคโนโลยี Deep Learning ที่สามารถเปลี่ยนใบหน้าคนแสดงได้เริ่มสมจริง การนำภาพคนดังไปใส่ในวิดีโอกลายเป็นสิ่งที่คนทั่วไปสามารถทำได้เองหากสามารถรวบรวมข้อมูลได้มากพอ จนเว็บต่างๆ นับแต่เว็บโป๊จนถึงเว็บบอร์ดอย่าง Reddit ต้องแสดงท่าทีจัดการเนื้อหาเช่นนี้ ตอนนี้บริษัทหนังโป๊อย่าง Naughty America ก็หันมาทำธุรกิจจากเทคโนโลยีนี้แทน

Tags:
Node Thumbnail

กูเกิลเปิดตัวชิป Edge TPU สำหรับการพัฒนาปัญญาประดิษฐ์ในอุปกรณ์ IoT ขนาดเล็กเช่นกล้องวงจรปิด สำหรับการตรวจจับการจราจรโดยไม่ต้องส่งภาพกลับไปยังศูนย์กลาง

สำหรับฝั่งซอฟต์แวร์ Cloud IoT Edge เป็นชุดซอฟต์แวร์ที่สามารถรันได้บน Android Things หรือลินุกซ์อื่นๆ โดยมันมาพร้อมกับ Edge ML รันไทม์สำหรับรัน TensorFlow Lite มันสามารถรันบนซีพียู หรือเร่งความเร็วด้วยกราฟิกหรือ TPU ก็ได้

ตัวชิปจะมาพร้อมกับบอร์ดจาก NXP ให้สั่งได้ภายในเดือนตุลาคมนี้

ที่มา - Google Blog

Tags:
Node Thumbnail

บริการ AutoML เปิดตัวตั้งแต่ต้นปีที่ผ่านมา ทำให้คนทั่วไปสามารถสร้างโมเดล deep learning ได้โดยไม่ต้องมีความรู้เฉพาะทาง เพียงแต่จัดรูปข้อมูลให้ถูกต้องก็เพียงพอ ตอนนี้บริการเข้าสู่สถานะเบต้าทำให้คนทั่วไปสามารถเข้าใช้งานได้แล้ว โดยเปิดตัวพร้อมกัน 3 บริการได้แก่ AutoML Vision จัดหมวดหมู่ภาพ, AutoML Natural Language จัดหมวดหมู่ข้อความ, และ AutoML Translation สร้างโมเดลแปลภาษา

ค่าบริการ AutoML แตกต่างกันไป Vision ค่าเทรนโมเดลชั่วโมงละ 20 ดอลลาร์, Natural Language ค่าเทรนโมเดลชั่วโมงละ 3 ดอลลาร์, ส่วน Translation ค่าเทรนโมเดลชั่วโมงละ 76 ดอลลาร์ ส่วนค่า predict ก็คิดแยกมาอีกต่างหาก

Tags:
Node Thumbnail

ในช่วงปีที่ผ่านมามีการสร้างโมเดล deep learning แบบ generative adversarial network (GAN) เพื่อ "สร้าง" ภาพหรือข้อมูลใหม่ขึ้นมาเรื่อยๆ โครงการที่สำคัญๆ เช่น deepfakes, งานวิจัยของ NVIDIA ที่สามารถเปลี่ยนฤดูในวิดีโอได้ ตอนนี้งานวิจัยล่าสุดก็เริ่มศึกษาความเป็นไปได้ของการสร้างภาพระดับสายตา จากภาพถ่ายทางอากาศ โดยทีมวิจัยจาก University of California, Merced

ข้อมูลที่ใช้ฝึกเป็นแผนที่จากชุดข้อมูล LCM2015 และใช้ภาพระดับสายตาจาก Geograph API รวม 16,000 ภาพ

Tags:
Node Thumbnail

ทีมวิจัยจาก MIT สร้างโมเดล deep learning ที่ชื่อว่า PixelPlayer ที่สามารถแยกเสียงเครื่องดนตรีในเพลงออกมาทีละชิ้น เปิดทางให้เราสามารถปรับปรุงคุณภาพเพลงเก่าๆ ที่มิกซ์เสียงมาแล้วได้

Tags:
Node Thumbnail

NVIDIA สร้างโมเดล deep learning ที่สามารถเติมเฟรมให้กับวิดีโอจนกลายเป็นวิดีโอสโลโมชั่น เปิดทางการอัดวิดิโอธรรมดาแล้วมาสร้างเป็นวิดิโดสโลโมชั่นภายหลัง โดยไม่ต้องเสียพื้นที่จัดเก็บวิดีโอขนาดใหญ่

ข้อมูลเริ่มต้นใช้วิดีโอที่อัดมาที่ 240 เฟรมต่อวินาที จำนวน 11,000 ชุด มาฝึก

โมเดลของ NVIDIA มีจุดเด่นคือสามารถสร้างเฟรมแทรกกลางระหว่างเฟรมได้จำนวนมากๆ ทำให้สามารถทำให้วิดีโอช้าลง จาก 30 เฟรมต่อวินาทีกลายเป็นช้าลง 8 เท่าเป็น 240 เฟรมต่อวินาทีได้เลย

ที่มา - NVIDIA

Tags:
Node Thumbnail

ช่วงต้นเดือนพฤษภาคมที่ผ่านมา Google ได้โชว์ผลงานวิจัยพัฒนาหลายอย่างในงาน Google I/O 2018 ซึ่งหนึ่งในนั้นก็คืองานพัฒนาปัญญาประดิษฐ์โดยใช้ Deep Learning สร้างโมเดลเพื่อการทำนายว่าผู้ป่วยจะเสียชีวิตในเวลาใด โดยอาศัยข้อมูลต่างๆ ของร่างกายผู้ป่วยมาใช้ในการวิเคราะห์ ทั้งนี้จากการทดสอบในหลายโอกาสพบว่าการทำนายมีความแม่นยำสูงกว่า 90% ซึ่งตอนนี้ Google ก็ได้เปิดเผยเอกสารงานวิจัยผ่านทาง Nature ให้คนที่สนใจเข้าไปดูรายละเอียดเพิ่มเติมได้แล้ว

Tags:
Node Thumbnail

ในการทดลองนี้ได้ใช้ neural networks แบบ LSTM มาเรียนรู้แบบจำลองภาษาระดับอักขระจากวรรณคดีเรื่องพระอภัยมณีที่มีประมาณสองล้านตัวอักษร โดยเมื่อเรียนรู้แล้วแบบจำลองภาษาให้ค่า bit per character ในชุดข้อมูลทดสอบเท่ากับ 2.0631

เมื่อให้แบบจำลองนี้ทำการผลิตลำดับของตัวอักษรตามความน่าจะเป็นที่ได้จากการเรียนรู้มา พบว่าผลลัพธ์ที่ได้มีความละม้ายคล้ายคลึงกับบทกลอนที่อยู่ในวรรณคดีเรื่องพระอภัยมณีอยู่พอสมควร ในด้านฉันทลักษณ์มีการจัดวรรคตอนได้ถูกต้อง จำนวนพยางค์ในแต่ละวรรคตรงตามข้อกำหนด และมีสัมผัสใน

Tags:
Node Thumbnail

Facebook เผยแพร่งานวิจัย ของระบบในการแก้ไขภาพถ่าย ที่ผู้ถูกถ่ายภาพเผลอหลับตา โดยสามารถเติมดวงตาเข้าไปได้ด้วย AI อาศัยข้อมูลพื้นฐานจากภาพถ่ายอื่นประกอบ ซึ่งแตกต่างจากงานแก้ไขภาพแบบอื่น ที่มักอาศัยองค์ประกอบโดยรอบในภาพ แต่หากคนในภาพหลับตาแล้ว ก็จำเป็นต้องใช้ข้อมูลอดีตมาช่วย

วิธีการแก้ไขภาพนี้อาศัยเครือข่ายแบบ Generative Adversarial Networks (GAN) ทำให้เรียนรู้ได้ว่าดวงตาที่ควรนำไปใส่ในภาพที่ต้องการแก้ไข เป็นของใคร และควรปรับสี และรูปทรงให้เข้าภาพนั้นอย่างไร

ดาวน์โหลดเปเปอร์เพิ่มเติมได้ที่นี่

Tags:
Node Thumbnail

Google Translate ประกาศอัพเดต โดยเพิ่มการแปลภาษาแบบออฟไลน์สำหรับแอปมือถือด้วย Neural Machine Translation ใน 59 ภาษา ที่ทำให้การแปลระดับประโยคถูกต้องมากขึ้น (จากที่แปลเป็นคำ) ซึ่งปัจจุบันวิธีการนี้มีใช้แล้วอยู่ในแบบออนไลน์ แต่ในระดับออฟไลน์ยังไม่มี

Tags:
Node Thumbnail

The Linux Foundation มูลนิธิผู้ดูแลเคอร์เนลลินุกซ์เปิดตัวโครงการย่อย LF Deep Learning Foundation สำหรับดูแลโครงการทางด้านปัญญาประดิษฐ์, คอมพิวเตอร์เรียนรู้ได้ (machine learning), และ deep learning

ช่วงหลังๆ Linux Foundation เปิดโครงการย่อยมาดูแลโครงการกลุ่มต่างๆ อยู่เรื่อยๆ เช่นโครงการ Hyperledger ที่ดูแลโครงการด้านบล็อคเชน, โครงการ Let's Encrypt หรือ Node.js ก็เป็นโครงการภายใต้มูลนิธิเช่นกัน

ตอนนี้ยังไม่มีโครงการใดเข้ามาอยู่ใต้ LF Deep Learning Foundation อย่างเป็นทางการ

Tags:
Node Thumbnail

ก่อนหน้านี้ ทีม DeepMind ของกูเกิลประกาศสร้าง AI ด้านวิดีโอเกม (ร่วมมือกับ Blizzard) ล่าสุดมีงานวิจัยชิ้นหนึ่งของ DeepMind เผยแพร่ออกมา แสดงให้เห็นแนวทางบางอย่างแล้ว

ช่วงหลังงานวิจัยด้าน Deep Learning เริ่มมาในทาง reinforcement learning หรือการให้ AI หัดเรียนรู้ด้วยตัวเอง (จากข่าว AlphaGo Zero ที่หัดเล่นโกะเองโดยไม่ต้องพึ่งพามนุษย์) รายละเอียดของเทคนิคนี้คือ ผู้สร้าง AI จะต้องสร้างระบบแรงจูงใจ (reward) เพื่อชักจูงให้ AI ให้ลองทำในสิ่งที่สอดคล้องกับกฎของเกม และ AI จะค่อยๆ ลองผิดลองถูกไปเรื่อยๆ จนเอาชนะเกมนั้นได้สำเร็จ

Tags:
Node Thumbnail

หัวข้อหนึ่งที่น่าสนใจในงาน Google I/O 2018 คือ TensorFlow Lite เอนจินสำหรับประมวลผล deep learning ในอุปกรณ์พกพา ที่ทำงานได้ทั้งบน Android, iOS และลินุกซ์

กูเกิลเปิดตัว TensorFlow Lite ตั้งแต่งาน I/O ปี 2017 แต่ตอนนั้นยังไม่ค่อยมีใครเห็นภาพมากนักว่ามันคืออะไร เป้าหมายมีไว้ทำไม แต่เมื่อเวลาผ่านมาอีก 1 ปี ความชัดเจนก็เริ่มตามมา

Tags:
Node Thumbnail

Waymo บริษัทลูกของ Alphabet ขึ้นนำเสนอในงาน Google I/O เป็นครั้งแรก โดยย้ำว่าจะเปิดบริการจริงภายในปี 2018 นี้

สิ่งที่น่าสนใจคือ Waymo เล่าว่าพัฒนาอัลกอริทึมของตัวเองได้อย่างรวดเร็ว เพราะได้หน่วยงานอื่นภายในกูเกิลช่วยสนับสนุน ตั้งแต่ได้ทีม Google Brain ร่วมพัฒนาระบบ AI ช่วยให้ตรวจจับคนข้ามถนนได้ดีขึ้นถึง 100 เท่าจากเดิม, ใช้หน่วยประมวลผล TPU ของกูเกิลช่วยให้ประมวลผลได้เร็วขึ้น 15 เท่า, สามารถรันซิมูเลชันจากข้อมูลของตัวเอง ได้ผลเทียบเท่ากับการใช้รถยนต์วิ่งจริง 25,000 คันต่อวัน

Tags:
Node Thumbnail

สถาบัน MIT เปิดเนื้อหาวิชา "6.S191: Introduction to Deep Learning" เรียนรู้การสร้างซอฟต์แวร์แบบ machine learning ด้วยเทคนิค deep learning เบื้องต้น ให้คนทั่วไปเข้าถึงได้ฟรี โดยเปิดเผยทั้งวิดีโอเลคเชอร์, สไลด์เนื้อหา และที่แล็บสำหรับฝึกการใช้งาน TensorFlow เบื้องต้น

Pages