Tags:
Node Thumbnail

เมื่อปลายปีที่ผ่านมาวิดีโอโป๊ปลอมที่มีคนนำหน้าของ Gal Gadot ไปแปะกับวิดีโอโป๊ทำให้โดยใช้ deep learning ทำให้เริ่มทำได้สมจริง ตอนนี้ผู้ใช้ Reddit ที่ชื่อ deepfakeapp ก็เปิดให้ดาวน์โหลดแอปพร้อมหน้าจอ GUI สำหรับการวางใบหน้าคนเป้าหมายลงบนวิดีโอใดๆ

deepfakeapp ระบุว่าโมเดล deeplearning ที่ใช้เป็นโมเดลเดียวกับที่ deepfakes ใช้สร้างวิดีโอ Gal Gadot เมื่อปีที่แล้ว

Tags:
Node Thumbnail

เมื่อปลายปีที่แล้วไมโครซอฟท์ออกอัพเดตให้กับ Microsoft Pix แอพถ่ายภาพบน iOS ที่ใช้พลัง AI ช่วยคำนวณ, คาดเดาและปรับแต่งให้ได้ภาพและวิดีโอที่ออกมาสวยโดยอัตโนมัติ โดยในครั้งนี้ได้เพิ่มลูกเล่นใหม่เข้ามาถึงสองอย่าง

อย่างแรกคือฟีเจอร์ถ่ายภาพพาโนรามาด้วยเทคนิค Photosynth (ซึ่งมาจากการหยิบยืมเทคโนโลยีจากแอพและเว็บ Photosynth เดิมที่หยุดให้บริการไปแล้วมาพัฒนาต่อ) ช่วยให้ได้ภาพในมุมที่กว้างกว่าเดิมทั้งในแนวตั้งและแนวนอน โดยในขณะถ่ายภาพผู้ใช้จะสามารถเอียงกล้องขึ้นบนลงล่าง, เอียงซ้ายเอียงขวา เพื่อขยายมุมมองของภาพได้อย่างอิสระ

Tags:
Node Thumbnail

เมื่อเดือน พ.ย. ปีที่แล้ว ซัมซุงเปิดตัว Exynos 9810 สำหรับ Galaxy S9 แต่ยังไม่เผยรายละเอียดทางเทคนิคมากนัก คราวนี้ในงาน CES 2018 ก็มีรายละเอียดเพิ่มเติมออกมาดังนี้

Tags:
Node Thumbnail

NVIDIA ปรับสัญญาอนุญาตของไดร์เวอร์การ์ดกราฟิกตระกูล GeForce อย่างเงียบๆ โดยเพิ่มเงื่อนไขห้ามใช้งานในศูนย์ข้อมูล ยกเว้นการประมวลผลบล็อคเชน

ผู้ที่ได้รับผลกระทบจากการปรับเช่นนี้คงเป็นผู้ที่ใช้การ์ดกราฟิกตระกูล GeForce มาประมวลผลสำหรับงานปัญญาประดิษฐ์ หรืองานจำลองระบบที่ต้องการการประมวลผลสูงๆ แต่ไม่ต้องการใช้การ์ดประมวลผลเฉพาะอย่าง Tesla

Tags:
Node Thumbnail

ปัญญาประดิษฐ์ในช่วงหลังๆ เริ่มมุ่งปัญหาใหม่ๆ ที่เครือข่ายแบบเดิมๆ แก้ไขไม่ได้ เช่น กระบวนการเพิ่มความละเอียดภาพ, สร้างภาพจากคำบอกเล่า, ไปจนถึงการเปลี่ยนฤดูกาลในภาพถ่าย แนวทางเช่นนี้ทำให้เครือข่ายประเภท Generative Adversarial Networks (GANs) ได้รับความนิยมขึ้นมา ตอนนี้กูเกิลก็เพิ่มไลบรารี TFGAN เพื่อการพัฒนาเครือข่าย GAN บน Tensorflow เข้ามาแล้ว

ไลบรารีมาพร้อมตัวอย่าง และ Python notebook สำหรับฝึกการสร้างภาพเลข 0-9 ตามลายมือคนจากชุดข้อมูล MNIST

Tags:
Node Thumbnail

ประเด็นการสร้างภาพปลอมหรือวิดีโอตัดต่อเริ่มมีมากขึ้นเรื่อยๆ ในช่วงหลัง งานวิจัยหลายงานเริ่มแสดงให้เห็นว่าการสร้างภาพตกแต่งที่สมจริงมากๆ เริ่มทำได้ง่ายขึ้นเรื่อยๆ เหยื่อรายล่าสุดคือ Gal Gadot นางเอกภาพยนต์เรื่อง Wonder Woman ที่ถูกตัดต่อหน้าใส่วิดีโอโป๊

Tags:
Node Thumbnail

Open Neural Network Exchange (ONNX) ฟอร์แมตกลางสำหรับแลกเปลี่ยนข้อมูลโมเดล deep learning ระหว่างเฟรมเวิร์คหลากหลายค่าย ที่ริเริ่มโดย Microsoft/Facebook และภายหลังได้พันธมิตรเข้าร่วม หลายราย ออกเวอร์ชัน 1.0 แล้ว

ตอนนี้ ONNX รองรับเฟรมเวิร์ค Caffe2, Microsoft Cognitive Toolkit, Apache MXNet, PyTorch, NVIDIA TensorRT และชุมชนนักพัฒนากำลังพยายามรองรับ TensorFlow ของกูเกิล (ที่ไม่ได้อยู่ในกลุ่มพันธมิตร) ต่อไป

Tags:
Node Thumbnail

IBM เปิดตัวเซิร์ฟเวอร์ Power Systems AC922 เป็นเครื่องมือสำหรับใช้งานด้านการประมวลผลในศูนย์ข้อมูล โดยระบบนี้ออกแบบมาเพื่อรองรับเวิร์คโหลดด้าน AI โดยเฉพาะ ใช้หน่วยประมวลผล IBM Power9 ซึ่งพัฒนามาแล้วกว่า 4 ปี

IBM กล่าวว่า ระบบ Power9 สามารถปรับปรุงประสิทธิภาพในด้านการเทรนนิ่งของ deep learning neural networks ได้ถึง 4 เท่า เพื่อให้องค์กรสามารถสร้างแอพพลิเคชั่นที่ใช้งาน AI ที่ทำงานได้อย่างแม่นยำและรันได้ไวยิ่งขึ้น รวมถึงการนำ PCI-Express 4.0, NVIDIA NVLink และ OpenCAPI มาใช้งาน จะทำให้ระบบสามารถโยกย้ายข้อมูลได้อย่างรวดเร็วยิ่งขึ้น ซึ่ง IBM กล่าวว่า AC922 นี้เร็วกว่าระบบที่ใช้ PCI-Express 3.0 และชิพ x86 ของ Intel ของคู่แข่งมากถึง 9.5 เท่า

Tags:
Node Thumbnail

Stanford ได้เผยแพร่งานวิจัยด้านการพัฒนาปัญญาประดิษฐ์เพื่อวินิจฉัยอาการเจ็บป่วยชื่อว่า CheXNet ซึ่งสามารถวิเคราะห์ภาพถ่าย X-ray ทรวงอก และตรวจหาอาการโรคปอดบวมได้ดีกว่านักรังสีวิทยาด้วย

ทีมวิจัยซึ่งนำโดย Andrew Ng ได้สร้างอัลกอริธึมปัญญาประดิษฐ์แบบ deep learning และใช้ข้อมูลภาพถ่าย X-ray ทรวงอกกว่า 112,000 ภาพ มาเทรนให้กับ CheXNet โดยนอกจากมันจะสามารถตรวจสอบโรคปอดบวมแล้ว CheXNet ยังสามารถตรวจสอบอาการเจ็บป่วยอื่นๆ ในช่องอกได้อีก 13 โรค

Tags:
Node Thumbnail

เมื่อวานนี้เป็นงาน IBM 65 ปีในประเทศไทย ในงานมีสาธิตสินค้าและบริการของอินเทลใหม่ๆ หลายอย่าง แต่อย่างหนึ่งที่มีการนำมาสาธิตคือ PowerAI Vision ซอฟต์แวร์ที่มากับเซิร์ฟเวอร์ PowerAI ของไอบีเอ็มเอง โดยในแง่เทคโนโลยีแล้วภายในเป็นการใช้งานเฟรมเวิร์คที่เราเห็นกันมาก่อนแล้ว แต่ PowerAI Vision เลือกงานสองประเภทคือการค้นหาวัตถุในภาพ (object detection) และการจัดหมวดหมู่ภาพ (image labelling) มาสร้างเป็นเว็บที่รองรับกระบวนการทำงานตั้งแต่การสร้างชุดข้อมูลไปจนถึงการเปิด API โดยไม่ต้องโค้ดแม้แต่น้อย

Tags:
Node Thumbnail

ONNX (Open Neural Network Exchange) เป็นโครงการสร้างฟอร์แมตกลางสำหรับแลกเปลี่ยนโมเดล AI ที่ริเริ่มโดยไมโครซอฟท์และเฟซบุ๊ก และมีบริษัทอื่นๆ เข้าร่วมอีกหลายราย

ล่าสุด ONNX ได้สมาชิกรายสำคัญคือ Amazon Web Services (AWS) โดยเข้ามาช่วยทำแพกเกจสำหรับ Apache MXNet ซึ่งเป็นเฟรมเวิร์คด้าน deep learning ที่ได้รับความนิยมอีกตัว (และเป็นเฟรมเวิร์คหลักที่ AWS เลือกใช้) ตอนนี้โครงการ ONNX-MXNet เปิดเผยซอร์สโค้ดแล้วบน GitHub

Tags:
Node Thumbnail

ไมโครซอฟท์ปล่อยส่วนเสริม Microsoft Visual Studio Tools for AI เพิ่มฟังก์ชั่นด้านปัญญาประดิษฐ์ให้กับ Visual Studio โดยมีฟีเจอร์ตั้งแต่การพัฒนาโค้ดที่เพิ่ม IntelliSense ให้กับเฟรมเวิร์คดังๆ และการดีบั๊กบนเครื่องของเราเอง ไปจนถึงการเชื่อมต่อกับ Auzre ML เพื่อส่งงานขึ้นไปรันบนคลาวด์

การเชื่อมต่อคลาวด์ทำให้การเทรนเน็คเวิร์คขนาดใหญ่ทำได้ง่ายขึ้น เพียงเลือกเฟรมเวิร์ค, จำนวนเครื่อง, และใส่ที่เก็บผลลัพธ์ก็ส่งงานขึ้นไปรันบนเครื่องที่มีชิปกราฟิกได้เลย

ตัวส่วนเสริมนี้รองรับทั้ง Visual Studio 2015 และ 2017 แต่ต้องใช้งานบนวินโดวส์ 64 บิตเท่านั้น

ที่มา - eWeek

Tags:
Node Thumbnail

ทีมวิจัยจากมหาวิทยาลัยสแตนฟอร์ดพัฒนาระบบวิเคราะห์ภาพ CheXNet ที่เป็น deep learning ลึกถึง 121 ชั้น วิเคราะห์ภาพเอ็กซ์เรย์ปอดโดยฝึกจากฐานข้อมูล 112,120 ภาพ (ชุดข้อมูล ChestX)

CheXNet สามารถตรวจพบโรค 14 โรคจากภาพเอ็กซ์เรย์ ChestX ได้ดีกว่าระบบอัตโนมัติอื่นที่เคยมีการพัฒนามาก่อนหน้านี้ ความแม่นยำต่ำสุดคือ Infiltration สามารถตรวจได้ถูกต้อง 72.04% แต่ก็ยังดีกว่างานวิจัยก่อนหน้านี้มาก

ทีมวิจัยทดสอบภาพเอ็กซ์เรย์ตัวอย่างอีก 420 ภาพกับรังสีแพทย์ 4 คนที่มีประสบการณ์ทำงาน 4, 7, 25, และ 28 ปี พบว่าเมื่อ CheXNet และแพทย์วิเคราะห์ภาพด้วยข้อมูลเท่าๆ กัน (เห็นภาพด้านหน้าอย่างเดียว, ไม่รู้ประวัติคนไข้) CheXNet มีความสามารถในการวิเคราะห์ภาพได้แม่นยำกว่า

Tags:
Node Thumbnail

ตามคาด Sony เปิดตัวหุ่นยนต์ในชื่อว่า Aibo เป็นหุ่นยนต์สุนัขที่ร่วมกับนักพัฒนาที่เคยเข้าร่วมโครงการ Aibo ตั้งแต่ปี 1999 (รุ่นใหม่ใช้โมเดล ERS-1000)

สำหรับ Aibo นั้น Sony กล่าวว่า ตัวหุ่นยนต์มีปฏิกิริยาตอบโต้กับสมาชิกในบ้านได้ เพียงแค่ให้ความรักความเอาใจใส่ มีตา OLED สำหรับแสดงอารมณ์ มี actuator แบบใหม่ ทำให้ตัวหุ่นยนต์เคลื่อนไหวได้อย่างนุ่มนวลขึ้น Sony ใช้เทคโนโลยี deep learning ในการวิเคราะห์เสียงและภาพโดยรอบ Aibo ด้วยเซนเซอร์หลายตัว และใช้ข้อมูลจากคลาวด์เพื่อเรียนรู้จากประสบการณ์ของ Aibo ตัวอื่นและผู้ใช้คนอื่น ซึ่งนอกจากนี้ Sony ยังมีอุปกรณ์เสริม Aibone เป็นกระดูกสำหรับ Aibo โดยเฉพาะ

Tags:
Node Thumbnail

TensorFlow ใกล้ออกเวอร์ชั่น 1.4 เต็มที โดยตอนนี้ release candidate 1 (rc1) ก็ออกมาแล้วทำให้เริ่มแน่ชัดว่าจะมีฟีเจอร์อะไรเข้ามาบ้าง โดยส่วนสำคัญที่สุดคงเป็นการรวม Keras เข้ามาเป็นโมดูลหลักของโครงการ

Keras ถูกสร้างครั้งแรกเพื่อสร้าง API ระดับสูงให้กับ Theano และรองรับทั้ง CNTK และ TensorFlow ในภายหลัง แต่โครงการได้รับความนิยมในการใช้ร่วมกับ TensorFlow อย่างสูง ทำให้ตอนนี้มักใช้ร่วมกันเสมอๆ

อีกโครงการที่รวมเข้ามาคือ tf.data ที่เดิมอยู่ใน tf.contrib.data

Tags:
Node Thumbnail

Microsoft และ AWS ร่วมมือกันเปิดตัว Gluon ส่วนประสานงาน deep learning ซึ่งออกแบบมาเพื่อนักพัฒนาทั่ว ๆ ไปที่ไม่ใช่ผู้เชี่ยวชาญด้าน AI สามารถสร้างและรันโมเดล machine learning สำหรับแอพและบริการต่าง ๆ ได้ง่ายขึ้น

Gluon นั้นถือเป็นก้าวใหญ่ของการพัฒนาระบบที่ใช้ AI โดยการนำส่วนสำคัญของระบบ deep learning ซึ่งได้แก่อัลกอริทึมสำหรับเทรนนิ่ง และโมเดล neural network มารวมกัน สามารถดูแลตั้งแต่การโปรโตไทป์, การสร้าง, การเทรน ไปจนถึงการ deploy machine learning model สำหรับคลาวด์และอุปกรณ์ต่าง ๆ

Tags:
Node Thumbnail

ไมโครซอฟท์ออกอัพเดตให้กับ Microsoft Pix แอพถ่ายภาพพลัง AI บน iOS (ข่าวเก่า) โดยได้เพิ่มความสามารถให้กับ AI ภายในแอพให้สามารถตรวจจับเอกสาร, ไวท์บอร์ดและนามบัตร ด้วยเทคนิค deep learning และช่วยปรับแต่งภาพถ่ายข้างต้นให้ได้ภาพที่มีผลลัพธ์เสมือนการสแกนโดยอัตโนมัติ

ในส่วนของการช่วยปรับแต่งภาพถ่ายเอกสารแล้วแปลงเป็นภาพสแกนนั้นไม่ต่างอะไรกันกับแอพ Office Lens ที่มีความสามารถคล้ายกันแต่มีจุดประสงค์เพื่อนำไฟล์เอกสารไปใช้งานร่วมกับแอพตระกูล Office เท่าไรนัก

Tags:
Node Thumbnail

ไมโครซอฟท์ประกาศความร่วมมือกับเฟซบุ๊ก ตั้งกลุ่มพัฒนาเทคโนโลยี AI ร่วมกัน ประเด็นสำคัญคือการกำหนดฟอร์แมตไฟล์แบบใหม่ชื่อ Open Neural Network Exchange (ONNX) เป็นฟอร์แมตกลางสำหรับเก็บข้อมูลโมเดล AI

ความสำคัญของ ONNX คือทำให้เฟรมเวิร์คด้าน deep learning หลายตัวสามารถแลกเปลี่ยนข้อมูลระหว่างกันได้ ไม่ถูกผูกกับเฟรมเวิร์คของค่ายใดค่ายหนึ่ง ภายใต้ความร่วมมือนี้ เฟรมเวิร์คของทั้งสองบริษัทคือ Cognitive Toolkit ของไมโครซอฟท์, Caffe2 กับ PyTorch ของเฟซบุ๊ก (มาจากทีมวิจัยคนละทีมกัน) จะรองรับ ONNX ในเร็วๆ นี้

Tags:
Node Thumbnail

Facebook มีความพยายามผลักดันภาพ 360 องศามาโดยตลอด สำหรับคนที่ชอบถ่ายภาพแบบ 360 อาจเคยเจอปัญหาว่าภาพจะมีตำแหน่งสูงต่ำไม่เท่ากัน (ดูรายละเอียดด้านล่าง) ซึ่งเกิดจากการหมุนกล้องไม่อยู่ในระดับที่เสมอกันตลอดทั้งภาพ ล่าสุด Matt Uyttendaele วิศวกรของ Facebook ได้เขียนบล็อกอธิบายแนวทางที่ Facebook จะแก้ปัญหานี้

เขาบอกว่าปัญหาภาพมีระดับไม่เสมอกันนั้น หากเป็นภาพถ่ายทั่วไปก็มีซอฟต์แวร์ที่สามารถปรับหมุนแก้ไขภาพได้ แต่พอเป็นภาพ 360 นั้นมีซอฟต์แวร์ที่แก้ไขได้ไม่มาก และวิธีปรับก็ไม่ตรงไปตรงมา เนื่องจากต้องปรับภาพใน 2 มิติคือการเอียงและการหมุน (แกน x และ z)

Tags:
Node Thumbnail

ไมโครซอฟท์โชว์ผลงาน Project Brainwave ระบบประมวลผลสำหรับเร่งความเร็ว AI ที่งานสัมมนาด้านซีพียู Hot Chips 2017

Project Brainwave ประกอบด้วยส่วนประกอบ 3 อย่างคือ ชิป FPGA สำหรับประมวลผลงานด้าน deep neural network (DNN), สถาปัตยกรรมการประมวลผลแบบกระจาย, ระบบคอมไพเลอร์และรันไทม์สำหรับใช้งานโมเดลที่เทรนแล้ว

Tags:
Node Thumbnail

Andrew Ng ออกจาก Baidu ตั้งแต่เดือนมีนาคมที่ผ่านมาและประกาศเมื่อกลางปีว่าจะกลับมาทำโครงการ deeplearning.ai โดยไม่ได้บอกว่าเป็นโครงการอะไร ตอนนี้โครงการแรกของ deeplearning.ai ก็เปิดตัวแล้ว เป็นวิชา "Deep Learning Specialization" บน Coursera

วิชานี้ใช้ Python และ TensorFlow เป็นเครื่องมือหลักเรียนตั้งแต่ส่วนประกอบพื้นฐานของ deep learning ได้แก่ convolutional network, RNN, LSTM, Adam, dropout, BatchNorm, Xavier/He initialization ศัพท์เหล่านี้มันเป็นส่วนประกอบที่พบได้บ่อยๆ ในงานวิจัย deep learning ช่วงหลังโดยมีการปรับขนาดพารามิเตอร์ต่างๆ และสถาปัตยกรรมของเครือข่ายต่างกันไป

Tags:
Node Thumbnail

ทีมวิจัยจาก MIT ตีพิมพ์งานวิจัย DeepMoji ที่สามารถวิเคราะห์อารมณ์ของคำพูดต่างๆ ได้อย่างแม่นยำ ด้วยการสร้างฐานข้อมูลจากทวีต 1,200 ล้านรายการ (กรองจากที่สะสมไว้ 55,000 ล้านทวีต) ทีมวิจัยพบว่าข้อมูลการใช้อิโมจิแสดงอารมณ์ของคำพูดได้เป็นอย่างดี โดยสามารถแบ่งกลุ่มอารมณ์ของอิโมจิ 64 ภาพยอดนิยมออกเป็นกลุ่มๆ แล้วแยกทวีตที่มีอีโมจิภาพละหมื่นทวีตเอาไว้เป็นข้อมูลทดสอบ

โมเดลของ DeepMoji แบ่งออกเป็น 5 ชั้น embedding, BiLSM สองชั้น, Attention, และปิดด้วย Softmax เทคนิคการฝึกทีมงานเสนอเทคนิค chain-thaw ที่หยุดบางชั้นเอาไว้เพื่อฝึกทีละชั้นไปเรื่อยๆ แล้วค่อยฝึกทุกชั้นพร้อมกันในรอบสุดท้าย

Tags:
Node Thumbnail

เมื่อวันอาทิตย์ที่ 6 สิงหาคมที่ผ่านมาทางหน้าเพจ PyTorch ใน Facebook ได้ประกาศการอัพเดท PyTorch เวอร์ชัน 0.2

ก่อนเข้าเนื้อหา อยากแนะนำ PyTorch ให้ทุกคนรู้จักซักนิด

PyTorch เป็น Deep Learning Library ซึ่ง Facebook พัฒนาบนภาษา Python (เมื่อก่อนอยู่บนภาษา Lua) จุดเด่นอยู่ที่การทำ Dynamic Computation และระบบการหาอนุพันธ์แบบ Automatic Differentiation นอกจากนี้ยังเป็นไลบรารีที่เป็นระบบ Define by run (ไม่ต้องเปิด-ปิด Session เพื่อการรัน) ปัจจุบันรองรับระบบปฏิบัติการ Linux และ macOS เท่านั้น

การอัพเดทที่สำคัญมีดังนี้

1.การ Broadcasting ของ Tensor โดยฟังก์ชันนี้หลายคนจะคุ้นเคยใน Numpy Array

Tags:
Node Thumbnail

ปกติแล้วการทำใบหน้าขณะพูดของตัวละครในเกมหรือภาพยนตร์ CG ให้ดูเหมือนมนุษย์ จะต้องใช้ต้นแบบเป็นวิดีโอของนักแสดงที่เป็นคนจริงๆ มาผ่านซอฟต์แวร์แปลงใบหน้า แล้วค่อยให้ฝ่ายศิลป์ตรวจสอบและแก้ไขอีกครั้ง ซึ่งกระบวนการทั้งหมดสิ้นเปลืองเวลามาก

งานวิจัยล่าสุดของ NVIDIA ที่โชว์ในงาน SIGGRAPH นำเทคนิค deep learning มาช่วยแก้ปัญหา ให้แปลงวิดีโอคนจริงมาเป็นโมเดล 3D ได้รวดเร็วและแม่นยำขึ้น โดยใช้ข้อมูลเพื่อเทรนเป็นวิดีโอยาวแค่ 5 นาทีเท่านั้น

เท่านั้นยังไม่พอ ทีมวิจัยของ NVIDIA ยังสามารถสร้างโมเดลใบหน้า 3D โดยไม่ต้องใช้ภาพวิดีโอ แต่ใช้แค่เสียงพูดเท่านั้น วิธีการคือนำกราฟคลื่นเสียงมาโยงกับจุดขยับต่างๆ ของโมเดลใบหน้า เพื่อให้ใบหน้าขยับตามเสียงได้

Tags:
Node Thumbnail

เมื่อไม่กี่วันก่อน เราเพิ่งเห็นข่าว นักวิจัยใช้ AI สร้างมัลแวร์ที่หลบแอนตี้ไวรัสได้แล้ว ในงานสัมมนา Black Hat ที่จัดในช่วงเดียวกัน ผู้พัฒนาซอฟต์แวร์แอนตี้ไวรัสก็ประกาศนำเทคนิค AI มาใช้ตรวจจับมัลแวร์ด้วยเช่นกัน

McAfee ประกาศว่า McAfee Advanced Threat Defense (ATD) เวอร์ชันใหม่ 4.0 นำเทคนิค deep learning มาช่วยวิเคราะห์พฤติกรรมของมัลแวร์ที่ฝังตัวมากับอีเมลแล้ว ช่วยให้การตรวจจับมัลแวร์มีประสิทธิภาพมากขึ้น

Pages