Tags:
Node Thumbnail

กูเกิลร่วมกับโรงพยาบาล Apolllo สร้างชุดข้อมูลภาพเอกซเรย์พร้อมป้ายกำกับ โดยภาพจากทางโรงพยาบาลอยู่ในบันทึกการรักษาที่ไม่ได้ติดป้ายกำกับพร้อมสำหรับการใช้ฝึกปัญญาประดิษฐ์

แนวทางของกูเกิลคือการใช้ปัญญาประดิษฐ์อ่านข้อความไปอ่านบันทึกการรักษาเพื่อสร้างป้ายกำกับภาพเอกซเรย์ปอดอีกที กระบวนการนี้ทำให้ได้ภาพพร้อมป้ายกำกับถึง 560,000 ภาพ จากนั้นนำภาพบางส่วนให้รังสีแพทย์มาตรวจสอบอีกครั้งเพื่อให้แน่ใจว่าคุณภาพชุดข้อมูลดีพอ

Tags:
Node Thumbnail

AWS เปิดตัวบริการ AWS DeepComposer บริการปัญญาประดิษฐ์ช่วยแต่งเพลง โดยผู้แต่งเพียงแต่งทำนองหลักเท่านั้น ที่เหลือโมเดลปัญญาประดิษฐ์จะเล่นเครื่องดนตรีอื่นๆ ให้เข้ากันอัตโนมัติ

DeepComposer ขายคู่กันทั้งคีย์บอร์ด MIDI ขนาด 32 คีย์และบริการคลาวด์ แม้บริการจะไม่จำเป็นต้องใช้คีย์บอร์ด แต่แต่งเพลงผ่านคีย์บอร์ดบนจอภาพได้ก็ตาม

โมเดลปัญญาประดิษฐ์มีให้เลือกแต่งเพลงได้ 4 สไตล์ ได้แก่ ร็อก, ป๊อบ, แจ๊ส, และคลาสสิค นอกจากนั้นยังสามารถปรับโมเดลเป็นรูปแบบเพลงเฉพาะตัวได้

บริการคิดค่ารันเป็นรายชั่วโมง ตอนนี้ยังอยู่ช่วงทดสอบวงปิดเท่านั้น

ที่มา - AWS Blog

Tags:
Node Thumbnail

Amazon เปิดตัวชุดพัฒนารถไร้คนขับจิ๋ว DeepRacer Evo ที่เป็นรถขนาด 1/18 แต่มีคอมพิวเตอร์ในตัวสำหรับประมวลผลปัญญาประดิษฐ์เพื่อสร้างระบบควบคุมอัตโนมัติ โดยรุ่น Evo นี้จะต่างจากรุ่นแรกที่เปิดตัวปีที่แล้ว คือเพิ่มเซ็นเซอร์ LIDAR สำหรับการวัดระยะห่างจากรอบข้าง และกล้องหน้ากลายเป็นกล้องคู่สำหรับเก็บภาพสามมิติ

นอกจากการอัพเดตตัวรถจริงแล้ว DeepRacer Console บริการจำลองรถและสนาม สำหรับฝึกปัญญาประดิษฐ์ก็อัพเดตฟีเจอร์เหล่านี้พร้อมกัน

ตัวรถจะขายจริงต้นปี 2020 โดยยังไม่ระบุราคา ผู้ที่ซื้อรุ่นเดิมไปแล้ว จะมีชุดเซ็นเซอร์ขายแยกให้ไปอัพเกรดด้วย

Tags:
Node Thumbnail

เฟซบุ๊กรายงานงานวิจัยการบีบอัดวิดีโอที่อาศัยการลดความละเอียดของภาพนอกส่วนที่ผู้ใช้กำลังจ้องมอง (foveated rendering) โดยอาศัยโมเดล deep learning ที่ชื่อว่า DeepFovea มาสร้างภาพความละเอียดเต็มจากอินพุตที่ลดความละเอียดภาพนอกส่วนสำคัญ

DeepFovea สามารถสร้างภาพความละเอียดเต็มจากข้อมูลพิกเซลเพียงเล็กน้อย ประมาณ 6-10% ของพิกเซลรวมในภาพต้นฉบับ

แนวทางการบีบอัดภาพนี้อาศัยความจริงที่ว่ามนุษย์เรารับรู้ภาพความละเอียดสูงเพียงมุมภาพแคบๆ ประมาณ 5.2 องศาตรงกลางภาพเท่านั้น หรือคิดเป็นจำนวนพิกเซล 4% ของพิกเซลทั้งหมดที่จอภาพต้องเรนเดอร์ภาพออกมา

Tags:
Node Thumbnail

กูเกิลอธิบายถึงสถาปัตยกรรมของการใช้ deep learning ในฟีเจอร์ Live Caption ที่เป็นการทำคำบรรยายเสียงในจากโทรศัพท์ทั้งหมด โดยใช้โมเดล deep learning ทำหน้าที่ต่างกันถึง 3 ชุดในฟีเจอร์นี้

โมเดลแรกที่รันอยู่ตลอดเวลาที่ฟีเจอร์ทำงานคือโมเดลจัดหมวดหมู่เสียง (sound event recognition) โดยภายในเป็นโมเดลแบบ convolutional neural network (CNN) ทำหน้าที่จัดหมวดหมู่ว่าเสียงตอนนี้เป็นเหตุการณ์แบบใด เช่น เสียงหัวเราะ, เสียงดนตรี, หรือเป็นเสียงพูด

Tags:
Node Thumbnail

Hao Li ผู้ช่วยศาสตราจารย์ด้านคอมพิวเตอร์กราฟิกจาก University of Southern California และผู้อำนวยการห้องวิจัยกราฟิกและการมองเห็นให้สัมภาษณ์กับช่อง CNBC ว่าเขาเชื่อว่าเทคโนโลยี Deepfake ที่ใช้แปลงใบหน้าคนลงบนวิดีโออื่นนั้นจะไปสู่จุดที่คนทั่วไปสามารถสร้างวิดีโอที่สมจริงได้ภายในระยะเวลา 6 เดือนถึง 1 ปีข้างหน้า

Hao ระบุว่าด้วยเทคโนโลยีปัจจุบันก็เพียงพอที่จะสร้างวิดีโอที่น่าเชื่อถือได้อยู่แล้ว แต่สำหรับโปรแกรม Deepfake ที่แจกออกมานั้น คนทั่วไปยังคงสามารถมองออกได้โดยง่ายว่าเป็นวิดีโอปลอม

Tags:
Node Thumbnail

อินเทลเปิดตัวบอร์ด Pohoiki Beach บอร์ดพัฒนาที่เป็นชิป Loihi จำนวน 64 ชิป แต่ละชิปมีคอร์ 128 คอร์ ทำให้ตัวบอร์ดสามารทำงานเทียบเท่าสมองที่มีขนาด 8 ล้านนิวรอน และคาดว่าจะสามารถพัฒนาบอร์ดที่จำลองการทำงานสมองขนาด 100 ล้านนิวรอนได้ในปีนี้

บอร์ด Pohoiki Beach ไม่ได้วางขาย แต่ส่งมอบให้กับกลุ่มนักวิจัย โดยตัวชิป Loihi เองก็เปิดตัวมาตั้งแต่ปี 2017

อินเทลยังอยู่ระหว่างการทดสอบแนวทาง neuromorphic-computing ว่ามีแนวทางการใช้งานที่เหมาะกับการค้าหรือไม่ แม้ว่าผลตอนนี้จะสามารถสาธิตได้ว่าใช้พลังงานน้อยกว่าชิปกราฟิกอย่างมาก แต่สามารถประมวลผลตามเวลาจริงได้

Tags:
Node Thumbnail

เราเคยเห็นโมเดลการสร้างวิดีโอปลอม หรือคลิปเสียงปลอม ที่พัฒนาจากการเทรนข้อมูลคลิปวิดีโอและคลิปเสียงจำนวนมาก หรือ Deepfake แต่งานวิจัยล่าสุดที่เผยแพร่โดย Samsung AI Center สามารถพัฒนาผลลัพธ์ได้ไกลกว่านั้น โดยอาจใช้ข้อมูลเริ่มต้นด้วยรูปภาพเพียง 1 รูปเท่านั้น

รูปแบบการสร้างคลิปดังกล่าว อาศัยการเทรนข้อมูลคลิปวิดีโออื่นที่เป็นการถ่ายเจาะเฉพาะใบหน้าจำนวนหนึ่งก่อน จากนั้นจับเฉพาะตำแหน่งสำคัญบนใบหน้าเพื่อใช้ในการสร้างคลิปวิดีโอ เช่น คิ้ว ตา จมูก ปาก เมื่อเราให้ข้อมูลภาพถ่ายใบหน้า ก็สามารถสร้างวิดีโอปลอมขึ้นมา โดยอาศัยการจับตำแหน่งสำคัญเหล่านั้น แล้วทำการขยับส่วนต่าง ๆ บนใบหน้าออกมานั่นเอง

Tags:
Node Thumbnail

AWS เปิดตัวฟีเจอร์ใหม่ Deep Learning Containers หรือ DL Containers เป็นฟีเจอร์ที่ AWS จะทำอิมเมจของ Docker สำหรับใช้งานประเภท deep learning พร้อมกับคอนฟิกด้านในอิมเมจไว้ให้เรียบร้อย เพื่อให้หยิบมาใช้งานได้โดยไม่ต้องเริ่มทำอิมเมจเองใหม่ตั้งแต่ต้น

สำหรับอิมเมจเหล่านี้ AWS ได้ทำการคอนฟิกให้เรียบร้อยแล้ว เพื่อให้ผู้ใช้หยิบมาใช้งานได้เลย ทั้งผ่าน ECS, EKS หรือ EC2 ในเวลาเพียงไม่กี่นาที ซึ่งอิมเมจเหล่านี้มีให้เลือกบน AWS Marketplace และ ECR ซึ่งผู้ใช้สามารถนำมาใช้โดยไม่มีค่าใช้จ่ายเพิ่มเติม ซึ่งจะนำมาใช้เลยก็ได้ หรือจะคอนฟิก, ใส่ไลบรารี, ใส่แพคเกจเพิ่มก็ได้เช่นกัน

Tags:
Node Thumbnail

สองปีก่อนกูเกิลเคยเสนองานวิจัย AutoML ที่สามารถ "ออกแบบ" โมเดล deep learning สำหรับงานเฉพาะทางได้โดยไม่ต้องอาศัยนักวิจัยมานั่งปรับโมเดล แต่ระบบเหล่านี้มักใช้พลังประมวลผลสูงมาก จนคนทั่วไปไม่สามารถลงทุนได้ ล่าสุดทีมวิจัยจาก MIT เสนอแนวทางใหม่ที่สร้างระบบออกแบบโมเดลโดยใช้พลังประมวลผลระดับเดียวกับการฝึกโมเดล deep learning ไม่ได้ต่างกันเป็นร้อยเท่าพันเท่าเหมือนแต่ก่อน

ระบบ neural architecture search (NAS) ที่ใช้ระบบอัตโนมัติออกแบบสถาปัตยกรรม deep learning แต่ระบบนี้อาศัยการปรับปรุงโมเดลไปเรื่อยๆ และฝึกโมเดลใหม่ทุกครั้ง ทำให้กินระยะเวลาประมวลผลสูงมาก

Tags:
Node Thumbnail

TensorFlow ประกาศเปิดตัววิชาเรียนฟรี 2 ชุดพร้อมกันบนสองแพลตฟอร์ม คือ Coursera และ Udacity

บน Coursera คือวิชา Intro to TensorFlow for AI, ML and DL เป็นการสอน TensorFlow ระดับเริ่มต้น เวลารวมชั่วโมงกว่าๆ เท่านั้น โดยวิชานี้เป็นวิชาแรกในชุดวิชา TensorFlow: from Basics to Mastery ที่จะเปิดวิชาอื่นเพิ่มภายหลัง

Tags:
Node Thumbnail

PyTorch ไลบรารี deep learning จากค่าย Facebook ออกเวอร์ชัน 1.0 stable แล้ว หลังออกเวอร์ชัน 1.0 dev มาตั้งแต่เดือนพฤษภาคม และรุ่นพรีวิวก่อนตัวจริงเมื่อเดือนตุลาคม

PyTorch เป็นไลบรารีที่พัฒนาจาก Torch ที่ได้รับความนิยมในสายงานวิจัย แต่รองรับภาษา Python เป็นหลัก ทำให้ใช้งานง่ายกว่า Torch (ที่เขียนด้วย Lua เป็นหลัก) ทีมพัฒนาหลักของ PyTorch คือพนักงานของ Facebook และเป็นไลบรารีที่ได้รับความนิยมมากขึ้นเรื่อยๆ ในช่วงหลัง โดยเป็นโครงการที่เติบโตเร็วเป็นอันดับสองบน GitHub (อันดับหนึ่งคือ Azure Docs)

Tags:
Node Thumbnail

ช่วงนี้เป็นมีการประชุมวิชาการ NeurIPS 2018 ( ที่เพิ่งเปลี่ยนชื่อย่อไป) Andrew Ng ก็ระบุว่าเป็นการครบรอบ 10 ปีพอดี ที่รายงานวิจัย "Learning Large Deep Belief Networks using Graphics Processors" ตีพิมพ์ออกมา ถือเป็นจุดเปลี่ยนของการใช้ชิปกราฟิกเพื่อรันโมเดลปัญญาประดิษฐ์

การใช้ชิปกราฟิกรันโมเดลปัญญาประดิษฐ์ทำให้โมเดลที่เคยมีขนาดเล็ก ใช้งานได้จำกัด สามารถขยายเป็นขนาดใหญ่ที่มีประโยชน์มากกว่า สามารถใช้งานที่ซับซ้อน

Tags:
Node Thumbnail

เฟซบุ๊กเปิดตัว PyTorch 1.0 ตั้งแต่เดือนพฤษภาคมที่ผ่านมา โดยตอนนี้ก็ยังเป็นเพียงรุ่นพรีวิวอยู่ อย่างไรก็ตามที่งาน PyTorch Developer Conference เมื่อวานนี้ก็มีการประกาศความก้าวหน้าของโครงการเพิ่มเติม

ฟีเจอร์ที่เพิ่มมาคือการทำงานในโหมด eager ที่ช่วยให้นักพัฒนาสามารถทดลองกับกราฟประมวลผลได้ง่ายขึ้น และมีการปรับปรุงไลบรารี torch.distributed โดยตอนนี้รองรับทั้ง Python และ C++

Tags:
Node Thumbnail

NVIDIA เผยแพร่งานวิจัย Video-to-Video Synthesis หรือ vid2vid โครงการสังเคราะห์วิดีโอในรูปแบบต่างๆ โดยมีความเหนือกว่าโมเดลเดิมๆ คือสามารถสร้างวิดีโอความละเอียดสูงระดับ 2K (2018x1024)

นักวิจัยลองฝึกโมเดลด้วยชุดข้อมูลต่างๆ เช่น ชุดข้อมูล Cityscape มาจัดส่วนต่างๆ ของภาพ (segmentation) ด้วย Mask R-CNN แล้วฝึกให้โมเดลสร้างวิดีโอจากภาพ segmentation ผลที่ได้คือวิดีโอที่สามารถแปลงสภาพแวดล้อม จากพื้นถนนปูนให้เป็นพื้นอิฐ หรือแปลงสภาพแวดล้อมจากต้นไม้ให้เหลือแต่ตึก

Tags:
Node Thumbnail

การใช้ปัญญาประดิษฐ์สร้างหนังโป๊โดยใส่หน้าคนดังเข้าไปแทนที่ตัวแสดงจริง นับเป็นปัญหาใหม่ของโลกในช่วงปีที่ผ่านมา จากเทคโนโลยี Deep Learning ที่สามารถเปลี่ยนใบหน้าคนแสดงได้เริ่มสมจริง การนำภาพคนดังไปใส่ในวิดีโอกลายเป็นสิ่งที่คนทั่วไปสามารถทำได้เองหากสามารถรวบรวมข้อมูลได้มากพอ จนเว็บต่างๆ นับแต่เว็บโป๊จนถึงเว็บบอร์ดอย่าง Reddit ต้องแสดงท่าทีจัดการเนื้อหาเช่นนี้ ตอนนี้บริษัทหนังโป๊อย่าง Naughty America ก็หันมาทำธุรกิจจากเทคโนโลยีนี้แทน

Tags:
Node Thumbnail

กูเกิลเปิดตัวชิป Edge TPU สำหรับการพัฒนาปัญญาประดิษฐ์ในอุปกรณ์ IoT ขนาดเล็กเช่นกล้องวงจรปิด สำหรับการตรวจจับการจราจรโดยไม่ต้องส่งภาพกลับไปยังศูนย์กลาง

สำหรับฝั่งซอฟต์แวร์ Cloud IoT Edge เป็นชุดซอฟต์แวร์ที่สามารถรันได้บน Android Things หรือลินุกซ์อื่นๆ โดยมันมาพร้อมกับ Edge ML รันไทม์สำหรับรัน TensorFlow Lite มันสามารถรันบนซีพียู หรือเร่งความเร็วด้วยกราฟิกหรือ TPU ก็ได้

ตัวชิปจะมาพร้อมกับบอร์ดจาก NXP ให้สั่งได้ภายในเดือนตุลาคมนี้

ที่มา - Google Blog

Tags:
Node Thumbnail

บริการ AutoML เปิดตัวตั้งแต่ต้นปีที่ผ่านมา ทำให้คนทั่วไปสามารถสร้างโมเดล deep learning ได้โดยไม่ต้องมีความรู้เฉพาะทาง เพียงแต่จัดรูปข้อมูลให้ถูกต้องก็เพียงพอ ตอนนี้บริการเข้าสู่สถานะเบต้าทำให้คนทั่วไปสามารถเข้าใช้งานได้แล้ว โดยเปิดตัวพร้อมกัน 3 บริการได้แก่ AutoML Vision จัดหมวดหมู่ภาพ, AutoML Natural Language จัดหมวดหมู่ข้อความ, และ AutoML Translation สร้างโมเดลแปลภาษา

ค่าบริการ AutoML แตกต่างกันไป Vision ค่าเทรนโมเดลชั่วโมงละ 20 ดอลลาร์, Natural Language ค่าเทรนโมเดลชั่วโมงละ 3 ดอลลาร์, ส่วน Translation ค่าเทรนโมเดลชั่วโมงละ 76 ดอลลาร์ ส่วนค่า predict ก็คิดแยกมาอีกต่างหาก

Tags:
Node Thumbnail

ในช่วงปีที่ผ่านมามีการสร้างโมเดล deep learning แบบ generative adversarial network (GAN) เพื่อ "สร้าง" ภาพหรือข้อมูลใหม่ขึ้นมาเรื่อยๆ โครงการที่สำคัญๆ เช่น deepfakes, งานวิจัยของ NVIDIA ที่สามารถเปลี่ยนฤดูในวิดีโอได้ ตอนนี้งานวิจัยล่าสุดก็เริ่มศึกษาความเป็นไปได้ของการสร้างภาพระดับสายตา จากภาพถ่ายทางอากาศ โดยทีมวิจัยจาก University of California, Merced

ข้อมูลที่ใช้ฝึกเป็นแผนที่จากชุดข้อมูล LCM2015 และใช้ภาพระดับสายตาจาก Geograph API รวม 16,000 ภาพ

Tags:
Node Thumbnail

ทีมวิจัยจาก MIT สร้างโมเดล deep learning ที่ชื่อว่า PixelPlayer ที่สามารถแยกเสียงเครื่องดนตรีในเพลงออกมาทีละชิ้น เปิดทางให้เราสามารถปรับปรุงคุณภาพเพลงเก่าๆ ที่มิกซ์เสียงมาแล้วได้

Tags:
Node Thumbnail

NVIDIA สร้างโมเดล deep learning ที่สามารถเติมเฟรมให้กับวิดีโอจนกลายเป็นวิดีโอสโลโมชั่น เปิดทางการอัดวิดิโอธรรมดาแล้วมาสร้างเป็นวิดิโดสโลโมชั่นภายหลัง โดยไม่ต้องเสียพื้นที่จัดเก็บวิดีโอขนาดใหญ่

ข้อมูลเริ่มต้นใช้วิดีโอที่อัดมาที่ 240 เฟรมต่อวินาที จำนวน 11,000 ชุด มาฝึก

โมเดลของ NVIDIA มีจุดเด่นคือสามารถสร้างเฟรมแทรกกลางระหว่างเฟรมได้จำนวนมากๆ ทำให้สามารถทำให้วิดีโอช้าลง จาก 30 เฟรมต่อวินาทีกลายเป็นช้าลง 8 เท่าเป็น 240 เฟรมต่อวินาทีได้เลย

ที่มา - NVIDIA

Tags:
Node Thumbnail

ช่วงต้นเดือนพฤษภาคมที่ผ่านมา Google ได้โชว์ผลงานวิจัยพัฒนาหลายอย่างในงาน Google I/O 2018 ซึ่งหนึ่งในนั้นก็คืองานพัฒนาปัญญาประดิษฐ์โดยใช้ Deep Learning สร้างโมเดลเพื่อการทำนายว่าผู้ป่วยจะเสียชีวิตในเวลาใด โดยอาศัยข้อมูลต่างๆ ของร่างกายผู้ป่วยมาใช้ในการวิเคราะห์ ทั้งนี้จากการทดสอบในหลายโอกาสพบว่าการทำนายมีความแม่นยำสูงกว่า 90% ซึ่งตอนนี้ Google ก็ได้เปิดเผยเอกสารงานวิจัยผ่านทาง Nature ให้คนที่สนใจเข้าไปดูรายละเอียดเพิ่มเติมได้แล้ว

Tags:
Node Thumbnail

ในการทดลองนี้ได้ใช้ neural networks แบบ LSTM มาเรียนรู้แบบจำลองภาษาระดับอักขระจากวรรณคดีเรื่องพระอภัยมณีที่มีประมาณสองล้านตัวอักษร โดยเมื่อเรียนรู้แล้วแบบจำลองภาษาให้ค่า bit per character ในชุดข้อมูลทดสอบเท่ากับ 2.0631

เมื่อให้แบบจำลองนี้ทำการผลิตลำดับของตัวอักษรตามความน่าจะเป็นที่ได้จากการเรียนรู้มา พบว่าผลลัพธ์ที่ได้มีความละม้ายคล้ายคลึงกับบทกลอนที่อยู่ในวรรณคดีเรื่องพระอภัยมณีอยู่พอสมควร ในด้านฉันทลักษณ์มีการจัดวรรคตอนได้ถูกต้อง จำนวนพยางค์ในแต่ละวรรคตรงตามข้อกำหนด และมีสัมผัสใน

Tags:
Node Thumbnail

Facebook เผยแพร่งานวิจัย ของระบบในการแก้ไขภาพถ่าย ที่ผู้ถูกถ่ายภาพเผลอหลับตา โดยสามารถเติมดวงตาเข้าไปได้ด้วย AI อาศัยข้อมูลพื้นฐานจากภาพถ่ายอื่นประกอบ ซึ่งแตกต่างจากงานแก้ไขภาพแบบอื่น ที่มักอาศัยองค์ประกอบโดยรอบในภาพ แต่หากคนในภาพหลับตาแล้ว ก็จำเป็นต้องใช้ข้อมูลอดีตมาช่วย

วิธีการแก้ไขภาพนี้อาศัยเครือข่ายแบบ Generative Adversarial Networks (GAN) ทำให้เรียนรู้ได้ว่าดวงตาที่ควรนำไปใส่ในภาพที่ต้องการแก้ไข เป็นของใคร และควรปรับสี และรูปทรงให้เข้าภาพนั้นอย่างไร

ดาวน์โหลดเปเปอร์เพิ่มเติมได้ที่นี่

Tags:
Node Thumbnail

Google Translate ประกาศอัพเดต โดยเพิ่มการแปลภาษาแบบออฟไลน์สำหรับแอปมือถือด้วย Neural Machine Translation ใน 59 ภาษา ที่ทำให้การแปลระดับประโยคถูกต้องมากขึ้น (จากที่แปลเป็นคำ) ซึ่งปัจจุบันวิธีการนี้มีใช้แล้วอยู่ในแบบออนไลน์ แต่ในระดับออฟไลน์ยังไม่มี

Pages