Tags:
Node Thumbnail

ถึงแม้ HoloLens รุ่นใหม่ยังไม่น่าจะมาเร็วๆ นี้ แต่ทางไมโครซอฟท์ได้ออกมาเปิดเผยรายละเอียดของ HoloLens รุ่นใหม่คร่าวๆ แล้วว่าจะมาพร้อมกับชิปประมวลผล Deep Learning โดยเฉพาะ ซึ่งก็ดูสอดคล้องกับวิสัยทัศน์ Intelligent Cloud, Intelligent Edge ของซีอีโอเองด้วย

สำหรับหน่วยประมวลผลดังกล่าว ทางไมโครซอฟท์จะเป็นคนออกแบบซิลิคอนเอง เพื่อให้รองรับการทำงานของ Deep Neural Network ผ่านแว่น Mixed Reality ได้อย่างมีประสิทธิภาพและใช้แบตเตอรี่น้อยที่สุด โดยชิปตัวนี้จะฝังอยู่ใน HPU 2.0 (Holographic Processing Unit) หน่วยประมวลผลรุ่นใหม่ของ HoloLens ที่กำลังอยู่ระหว่างการพัฒนา

Tags:

คุณศุภศรณ์ สุวจนกรณ์ จากห้องวิจัย GRAIL นำเสนองานวิจัยในการสร้างวิดีโอของบารัก โอบามา ตามเสียงที่ใส่เข้าไปได้อย่างสมจริง โดยอาศัยข้อมูลเสียงนำมาสร้างเป็นรูปแบบของปากแล้วจึงใส่รายละเอียดลงไปก่อนจะนำภาพปากเคลื่อนไหวนี้ไปใส่วิดีโอเป้าหมาย

งานวิจัยนี้ทำให้สามารถนำเสียงของโอบามาเองมาสร้างภาพวิดีโอใหม่ โดยไม่ต้องอาศัยวิดีโอของการพูดครั้งนั้นจริงๆ แม้แต่เสียงที่สร้างขึ้นมา เช่น เสียงของคนที่เลียนแบบโอบามา หรือเสียงของโอบามาที่ถูกตัดต่อ

Tags:
Node Thumbnail

ทีมวิจัยของกูเกิล พัฒนาระบบ AI ด้วยเทคนิค deep learning โดยให้เรียนรู้กระบวนการทำงานของช่างภาพระดับมืออาชีพ

ระบบ AI ของกูเกิลศึกษาภาพถ่ายพานอรามาของสถานที่ท่องเที่ยวตามธรรมชาติชื่อดังทั่วโลกจาก Google Street View กว่า 40,000 ภาพ แล้วดูว่าแต่ละภาพมีแง่มุมด้านความสวยงามอย่างไรบ้าง เช่น การจัดวางภาพ ระดับของแสง (HDR) และความอิ่มสี (saturation) จากนั้นก็นำโมเดลที่ได้มา "ต่อภาพ" จาก Street View แล้วแต่งภาพให้ออกมาสวยงามราวกับช่างภาพมืออาชีพ

Tags:
Node Thumbnail

งานวิจัยด้านคอมพิวเตอร์เรียนรู้ด้วยตัวเอง (machine learning) ถูกกระแส deep learning กลบแนวทางอื่นแทบทั้งหมด เพราะคนจำนวนมากค้นพบว่าหากข้อมูลมากพอ โมเดล deep learning นั้นสามารถเรียนรู้ได้มากขึ้นเรื่อย ความแม่นยำจะสูงขึ้นเรื่อยๆ ตามปริมาณข้อมูล แต่ในวงการวิจัย ชุดข้อมูลกลับไม่เติบโตขึ้นเท่าใดนัก ชุดข้อมูลภาพ ImageNet จำนวน 1 ล้านภาพใช้งานมาตั้งแต่ปี 2011 แม้ว่าโมเดล deep learning จะซับซ้อนขึ้นอย่างมากในช่วง 5 ปีที่ผ่านมา

Tags:
Node Thumbnail

Andrew Ng ผู้บุกเบิกวงการ deep learning เพิ่งประกาศลาออกจาก Baidu เมื่อเดือนมีนาคม ล่าสุดเมื่อสัปดาห์ก่อนเขาทวีตเปิดตัวโครงการใหม่ชื่อ deeplearning.ai แล้ว

ตอนนี้ยังไม่มีข้อมูลแน่ชัดว่า deeplearning.ai เป็นองค์กรประเภทไหน (Ng ใช้คำว่า project ไม่ใช่ company) และมีภารกิจด้านใด ในหน้าเว็บไซต์ของ deeplearning.ai ก็บอกเพียงว่าจะเปิดตัวอย่างเป็นทางการในเดือนสิงหาคมนี้

โดเมนเนม deeplearning.ai มี Andrew Ng เป็นผู้จดทะเบียน แต่ใช้ที่อยู่เป็นของ Baidu ซึ่งโฆษกของ Baidu ก็ออกมาชี้แจงในภายหลังว่าบริษัทไม่มีความเกี่ยวข้องกับโครงการนี้

Tags:
Node Thumbnail

NVIDIA มีซอฟต์แวร์ชื่อ TensorRT สำหรับรีดประสิทธิภาพ (optimization) ของการรันโมเดล deep learning ที่พัฒนามาได้สักระยะหนึ่งแล้ว ล่าสุด NVIDIA เปิดให้นักพัฒนาสามารถดาวน์โหลด TensorRT 2.0 ไปใช้งานกัน

ปกติแล้วในโลกของ AI เราแยกงานของการเทรนหรือสร้างโมเดล (training) และการนำโมเดลไปใช้งาน (interference) ออกจากกัน

แนวคิดของ TensorRT คือการรีดประสิทธิภาพในตอนรัน (RT = runtime) ให้มีประสิทธิภาพสูงสุด มันออกแบบมาสำหรับปรับแต่งประสิทธิภาพก่อน เพื่อตอนรันงานจริง (production) จะได้ใช้งานทรัพยากรเครื่องอย่างคุ้มค่าที่สุด (เทคนิคจะคล้ายกับการแปลง bytecode ของ Java หรือการคอมไพล์แบบ ahead-of-time)

Tags:
Node Thumbnail

คุณรักพงษ์ กิตตินราดร และคุณกรกฎ เชาวะวณิช Data Scientist จาก True Corporation เปิดซอร์สโครงการ deepcut ระบบตัดคำแบบ deep learning โดยพัฒนาด้วย Keras

ข้อมูลที่ใช้เทรนเป็นชุดข้อมูล BEST ของ NECTEC โดยแบ่งข้อมูลสำหรับฝึก 90% และข้อมูลสำหรับทดสอบอีก 10% โมเดลพยายามระบุว่าแต่ละตัวอักษรเป็นจุดเริ่มต้นของคำหรือไม่ (ตามโค้ดคือค่ามากกว่า 0.5) โดยเมื่อทดสอบกับข้อมูลทดสอบได้ความแม่นยำ f1 score 98.8%, precision score 98.6%, และ recall score 99.1%

Tags:
Node Thumbnail

กูเกิลปล่อยโครงการ Tensor2Tensor (T2T) ชุดเครื่องมือสำหรับช่วยแยกปัญหาออกจากการออกแบบโมเดล deep learning ทำให้สามารถทดลองปัญหาเดิมกับโมเดลใหม่ๆ ได้มากขึ้น ช่วยให้นักวิจัยสามารถออกแบบโมเดลได้อย่างมีประสิทธิภาพ พร้อมกับสาธิตการใช้งานด้วยรายงานวิจัย MultiModel โมเดล deep learning ที่ทำงานหลายอย่างได้พร้อมกัน ได้แก่ บรรยายภาพ, จัดหมวดหมู่ภาพ, แปลภาษา, แปลงเสียงเป็นข้อความ, และวิเคราะห์โครงสร้างประโยค

MultiModel เป็นโมเดล deep learning ที่มีความซับซ้อนสูง มีกระบวนการเข้ารหัสข้อมูลและถอดรหัสเอาผลลัพธ์ได้หลายทางตามงานประเภทต่างๆ โดยยังสามารถทำงานประเภทต่างๆ ได้ความแม่นยำในระดับดีพอใช้ แถมการฝึกปัญหาหลายอย่างไปพร้อมกันกลับเพิ่มความแม่นยำในงานประเภทต่างๆ ได้

Tags:
Node Thumbnail

ไมโครซอฟท์มีชุดพัฒนา deep learning ของตัวเองชื่อ CNTK ที่ออกมาตั้งแต่เดือนมกราคม 2016 ล่าสุดไมโครซอฟท์อัพเกรดเป็นเวอร์ชัน 2.0 พร้อมเปลี่ยนชื่อมาใช้ชื่อเต็ม Microsoft Cognition Toolkit แทนชื่อย่อแล้ว

การเปลี่ยนแปลงสำคัญของเวอร์ชัน 2.0 คือการรองรับ Keras ไลบรารีด้าน neural network ยอดนิยมอีกตัวหนึ่ง (Keras เป็นของกูเกิล โดยอีกทีมที่แยกจาก TensorFlow และทำงานได้บนเฟรมเวิร์คหลายตัว เช่น TensorFlow, Theano และล่าสุดคือ CNTK 2.0 ที่ตอนนี้ยังมีสถานะเป็นรุ่นพรีวิว)

Tags:
Node Thumbnail

อินเทลเปิดตัวการ์ด Intel DLIA (Deep Learning Inference Accelerator) ที่ใช้ชิป Arria 10 ตามแผนการที่ประกาศไว้ตั้งแต่ปีที่แล้ว โดยมีจุดขายที่เป็นการ์ดเร่งความเร็วที่มาพร้อมกับงานปัญญาประดิษฐ์พร้อมใช้บางส่วน

ตามสเปคของอินเทล พลังประมวลผลของ DLIA ไม่สูงนัก อยู่ที่ 1.5 TFLOPS เท่านั้น (ไม่บอก precision แต่เทียบกับ Tesla P100 ที่รันได้ 5 TFLOPS ที่ double-precision แล้วก็ยังห่างกันอยู่ดี)

Node Thumbnail

ในคีย์โน้ตงาน Google I/O 2017 เมื่อสัปดาห์ที่ผ่านมา ธีมหลักของงานนั้นชัดเจนมากว่าเป็นเรื่องของ AI ที่มีความสำคัญเหนือทุกสิ่งอย่าง (Android และ VR ถูกนำไปพูดช่วงท้ายๆ และแทบไม่พูดถึงบริการตัวเก่าๆ อย่าง Google Maps หรือ Chrome เลย)

ซีอีโอ Sundar Pichai ขึ้นเวทีพร้อมกับย้ำว่าโลกกำลังเปลี่ยนผ่านจากยุค Mobile First มาเป็น AI First (เขาพูดเรื่องนี้มาตั้งแต่ปีที่แล้ว) พร้อมกับอธิบายผลงานด้าน AI ของกูเกิลในปัจจุบันว่ามีอะไรบ้าง

บทความนี้จะสรุปประเด็นและวิเคราะห์ผลงานด้าน AI ของกูเกิลว่าไปไกลแค่ไหน และเปรียบเทียบกับคู่แข่งแล้ว กูเกิลยืนอยู่ตรงไหนในโลกของ AI

Tags:
Node Thumbnail

เป็นทิศทางของโลกการประมวลผลที่เริ่มนำ GPU มาช่วยประมวลผลงานด้าน AI และ Deep Learning ซึ่งกำลังได้รับความนิยมมากขึ้นเรื่อยๆ ส่งผลให้บริการคลาวด์หลายตัวต้องเปิด instance ที่มี GPU รุ่นใหม่ๆ ให้ลูกค้าใช้งานกัน

ก่อนหน้านี้ Google Cloud Platform เพิ่งอัพเดต GPU โดยมี GPU รุ่นใหม่ๆ อย่าง NVIDIA Tesla P100 ที่ใช้สถาปัตยกรรม Pascal ให้เลือก

วันนี้ฝั่ง Microsoft Azure ก็ทำแบบเดียวกัน โดยมี GPU ให้เลือกใช้งานสองตัวคือ NVIDIA Tesla P100 และ Tesla P40 ซึ่งเป็น Pascal ทั้งคู่

Tags:
Node Thumbnail

คนที่ติดตามวงการ deep learning คงรู้จัก Caffe เฟรมเวิร์คสำหรับเทรน AI ให้เรียนรู้ด้วยเทคนิค deep learning

Caffe ถูกสร้างโดย Yangqing Jia อดีตนักวิจัยปริญญาเอกของมหาวิทยาลัย UC Berkeley ปัจจุบันมันเป็นซอฟต์แวร์โอเพนซอร์สที่ดูแลโดย Berkeley AI Research

ตัวของ Yangqing Jia ตอนนี้มีสถานะเป็นพนักงานของ Facebook (ก่อนหน้านี้เขาเคยทำงานกับกูเกิล และอยู่ในทีม TensorFlow ด้วย) สิ่งที่เกิดขึ้นคือ Jia พัฒนาเฟรมเวิร์คตัวใหม่ Caffe2 ที่ดีกว่าของเดิม

Tags:
Node Thumbnail

นักวิจัยจาก Adobe และ Cornell University ได้ร่วมกันพัฒนาเทคโนโลยีด้านภาพถ่ายใหม่ คือการนำสไตล์ภาพหนึ่ง ไปใส่อีกภาพ คือจะมีภาพสองภาพ ภาพหนึ่งเป็นภาพหลัก และอีกภาพเป็นภาพอ้างอิง ภาพผลลัพธ์จะเป็นการนำโครงสร้างของภาพหลัก มาทำการตกแต่งด้วยสีและแสงในลักษณะเหมือนกับภาพอ้างอิง โดยจะดูเป็นธรรมชาติและไม่ทำให้โครงสร้างของภาพหลักเปลี่ยนแปลงไป

งานวิจัยนี้ ใช้วิธีการ deep learning จากแสงและสีจากภาพอ้างอิง จากนั้นก็จะนำแสงและสีในลักษณะเดียวกันไปใช้กับภาพหลัก ดังนั้นภาพที่ได้จึงดูเป็นธรรมชาติ โดยรายละเอียดของงานวิจัย สามารถอ่านได้จากที่นี่ ส่วนโค้ดสามารถดูได้จาก GitHub

Tags:
Node Thumbnail

กูเกิลเคยเปิดบริการ Cloud Vision API ลูกค้าสามารถส่งไฟล์ภาพขึ้นคลาวด์ แล้วให้ AI ของกูเกิลแยกแยะกลับมาให้ว่าในภาพมีวัตถุอะไรบ้าง

ปีนี้ระบบของกูเกิลพัฒนาไปอีกขั้น เพราะมันสามารถแยกแยะวัตถุในวิดีโอได้แล้ว ภายใต้ชื่อว่า Cloud Video Intelligence API

หลักการของ Cloud Video Intelligence API ก็เหมือนกันคือใช้เอนจินเรียนรู้ deep-learning ของตัวเอง TensorFlow แล้วให้ฝึกเรียนรู้จากวิดีโอบน YouTube ตอนนี้มันเก่งพอที่จะแยกแยะเนื้อหาในวิดีโอได้แล้ว จากภาพตัวอย่างที่กูเกิลนำมาโชว์ มันสามารถแยกแยะได้ว่าในวิดีโอมี "เสือ" และถ้าค้นด้วยคำว่า Tiger เราก็จะได้คำตอบกลับมาเป็นช่วงเวลาทั้งหมดในวิดีโอที่มีเสืออยู่ในภาพ

Tags:
Node Thumbnail

Google Translate ปรับปรุงฟีเจอร์การแปลเพิ่มเติม ใช้ deep learning เพิ่มความถูกต้องแม่นยำเวลาแปลทั้งประโยค แทนที่จะแปลแค่วลีมาประกอบกัน ก่อนหน้านี้อัพเดทเฉพาะ 8 ภาษาก่อนคือ อังกฤษ ฝรั่งเศส เยอรมัน สเปน โปรตุเกส จีน ญี่ปุ่น เกาหลี และตุรกี ล่าสุดเพิ่มมาอีกสามภาษาคือ ฮินดี รัสเซีย และเวียดนาม

ช่วงเดือนพฤศจิกายนปีที่แล้ว Google เปลี่ยนเอนจินการแปลใหม่ ขยายผลเทคนิค Neural Machine Translation ไปยังภาษาอื่นๆ ผลคือสามารถแปลทั้งประโยคได้ถูกต้อง และทำความเข้าใจได้มากขึ้นเมื่ออ่านรวมกันทั้งประโยค

ทาง Google ระบุว่าจะมีอัพเดทภาษาอื่นเพิ่มเติมภายใน 2-3 สัปดาห์นี้

Tags:
Node Thumbnail

Baidu Research รายงานความสำเร็จของโครงการ Deep Voice แปลงจากข้อความเป็นเสียง (text-to-speech - TTS) นอกจากความแม่นยำของเสียงที่ออกมาเป็นธรรมชาติแล้ว ระบบนี้ยังมีความเร็วสูงกว่าระบบก่อนๆ ทำให้ใช้เวลาไม่กี่วินาทีในการสังเคราะห์เสียง

Deep Voice ยังไม่ใช่ระบบแบบ end-to-end ที่ใช้เครือข่ายประสาทเทียมในการวิเคราะห์ทั้งหมด แต่ต้องการตัวแปลงข้อความเป็น phoneme เสียก่อน จากนั้นจึงฝึกสามระบบแยกจากกัน ได้แก่ ระบบสังเคราะห์เสียง (audio synthesis), ระบบทำนายระยะเวลาเสียง (duration prediction), และระบบทำนายความถี่พื้นฐาน (fundamental frequency prediction)

ตัวอย่างเสียงที่สังเคราะห์ได้มีให้ฟังในที่มา

Tags:
Node Thumbnail

Deepgram บริษัทสร้างระบบวิเคราะห์ข้อมูลเสียงเพื่อธุรกิจโอเพนซอร์สซอฟต์แวร์ Kur สำหรับการสร้างเครือข่ายประสาทเทียมแบบ Deep Learning โดยไม่ต้องโค้ดแต่อาศัยการคอนฟิกไฟล์ YAML เท่านั้น

ทาง Deepgram ยังเตรียมสร้างเว็บ Kurhub สำหรับให้นักวิจัยและผู้สนใจมาแชร์โมเดลเครือข่ายประสาทเทียมที่ออกแบบไว้สำหรับงานต่างๆ

สำหรับผู้ที่ใช้งานหรือพัฒนาเครือข่ายประสาทเทียมเช่นนี้อยู่แล้ว สิ่งที่ Kur พิเศษกว่าคือมันมีชุดข้อมูลของ Deepgram สำหรับการฝึกระบบจดจำเสียงมาให้ในตัวด้วย โดยชุดข้อมูลเสียงมีจำนวน 10 ชั่วโมง แบ่งออกเป็นไฟล์ๆ ละ 10 วินาที การเทรนเครือข่ายตัวอย่างจะใช้เวลาประมาณหนึ่งวันเต็มบนชิปกราฟิก

Tags:
Node Thumbnail

ตั้งแต่เดือนเมษายน 2016 ที่ผ่านมา เมื่อเราอัพโหลดภาพขึ้นไปยัง Facebook ทางระบบจะวิเคราะห์และติด tag ให้กับภาพของเราแบบอัตโนมัติ โดยพิจารณาจาก “เนื้อหา” ของสิ่งที่อยู่ในภาพ ซึ่ง Facebook ใช้ระบบ deep learning ที่ชื่อว่า Deep ConvNet ซึ่งพัฒนาขึ้นมาโดยทีม FAIR ของ Facebook

แต่ผู้ใช้ทั่วไปกลับไม่รู้ว่า Deep ConvNet มองเห็นอะไรในภาพของเราบ้าง จึงมีคนทำ “Show Facebook Computer Vision Tags” เป็น Extension ฟรีสำหรับ Google Chrome โชว์ให้เราได้รู้ว่า Facebook เห็นอะไรและ tag อะไรในภาพของเรา ตรงมุมขวาบนของภาพ ซึ่ง tag เหล่านี้เราไม่สามารถมองเห็นได้จากการใช้งานตามปกติ

Tags:
Node Thumbnail

ตลาดปัญญาประดิษฐ์เป็นตลาดที่ NVIDIA ได้เปรียบอย่างมากในช่วงปีที่ผ่านมา เพราะเฟรมเวิร์คหลักๆ ล้วนรองรับการ์ด GeForce แต่ตอนนี้เอเอ็มดีก็ประกาศชิงตลาดนี้อย่างเป็นทางการ โดยการประกาศชุดฮาร์ดแวร์และซอฟต์แวร์ออกมาพร้อมกัน

ฮาร์ดแวร์ชุดใหม่ของเอเอ็มดีเป็นการ์ดประมวลผล Radeon Instinct การ์ดสำหรับประมวลผลที่ผลิตโดยเอเอ็มดีเองโดยตรง โดยการ์ดที่เปิดตัวครั้งนี้มีสามรุ่น ได้แก่

Tags:
Node Thumbnail

AWS ประกาศเลือก MXNet เฟรมเวิร์คสำหรับการพัฒนา Deep Learning เป็นเฟรมเวิร์คหลัก แม้ว่าตัวบริการ AWS เองจะยังรองรับเฟรมเวิร์คตัวอื่นๆ เช่น Tensorflow หรือ Caffe ต่อไปก็ตาม

การเลือกเฟรมเวิร์คหลักหมายถึง AWS จะส่งโค้ดเข้าไปช่วย MXNet ในการพัฒนา และโครงการของ AWS เองจะใช้ MXNet ในการพัฒนาด้วยเช่นสกัน

ทาง AWS ระบุเหตุผลที่เลือก MXNet เป็นเพราะโครงการนี้รองรับภาษาในการพัฒนาที่หลากหลาย ตัวโค้ดจะถูกแปลงเป็น C++ เพื่อทำงานบนซีพียูและจีพียู และการสเกลระบบยังทำได้โดยมีประสิทธิภาพค่อนข้างดี AWS ระบุว่าในเครื่องที่กระจายการประมวลผลไปยังการ์ดกราฟิก 16 ใบจะได้ประสิทธิภาพถึง 91% ขณะที่การกระจายงานไป 16 เครื่องรวมการ์ด 256 ใบยังได้ประสิทธิภาพถึง 88%

Tags:
Node Thumbnail

เทคโนโลยี FPGA กำลังได้รับความนิยมมากขึ้นเรื่อยๆ ในงานประมวลผลเฉพาะทาง (เช่น งานด้าน AI) บริษัทหนึ่งที่มีความเคลื่อนไหวด้าน FPGA ค่อนข้างเยอะในช่วงหลังคืออินเทล ที่เพิ่งควบรวม Altera เมื่อปีที่แล้ว

เทคโนโลยีที่อินเทลได้จาก Altera มีชื่อเรียกว่า Deep Learning Inference Accelerator (DLIA) เป็นการนำ FPGA รุ่น Arria 10 ของ Altera มาใช้งานด้านการประมวลผลงานด้าน AI แขนง convolutional neural network (CNN) ซึ่งอินเทลตั้งเป้าว่า จะเพิ่มประสิทธิภาพการประมวลผลให้ได้ 100 เท่าในปี 2020

Tags:
Node Thumbnail

อินเทลประกาศมุ่งรองรับเทคโนโลยีปัญญาประดิษฐ์เต็มรูปแบบ หลังจากฝั่งซอฟต์แวร์ประกาศร่วมมือกับกูเกิลพัฒนา TensorFlow ฝั่งฮาร์ดแวร์ก็ประกาศแผนการชิปรุ่นต่อไปในปีหน้าอีกสองรุ่น

Lake Crest จะเป็นชิปตัวแรกที่ใช้เทคโนโลยีจาก Nervana ที่อินเทลเพิ่งซื้อมา โดยจะเริ่มทดสอบระดับซิลิกอนในต้นปีหน้า และจะส่งมอบให้กับลูกค้าสำคัญก่อนภายในปี 2017

Knights Crest เป็นชิปรุ่นต่อไป ที่ฝังเทคโนโลยีจาก Nervana เข้าไปในชิป Xeon ยังไม่มีกำหนดส่งมอบสินค้า แต่อินเทลก็ตั้งเป้าว่าชิปของตัวเองจะมีประสิทธิภาพในการฝึกโมเดล deep learning ได้ดีกว่าชิปกราฟิกถึง 100 เท่าตัวก่อนปี 2020

Tags:
Node Thumbnail

ประโยชน์สำคัญของปัญญาประดิษฐ์คือการใช้อธิบายภาพถ่ายและวิดีโอ ทำให้คอมพิวเตอร์สามารถค้นหาภาพจากคำอธิบายได้อย่างแม่นยำ แต่ผู้ใช้ ryanjay0 บน GitHub ก็เสนอแนวทางการพัฒนาปัญญาประดิษฐ์เพื่อการอธิบายแต่ละช่วงเวลาของภาพยนตร์สำหรับผู้ใช้ ที่ชื่อระบบว่า Miles Deep

Miles Deep เป็นเครือข่ายประสาทแบบ CNN ที่ใช้โมเดลที่ฝึกด้วย ImageNet มาล่วงหน้า จากนั้นจึงสร้างโมเดลเพิ่มเติมด้วยภาพอีก 36,000 ภาพ และข้อมูลทดสอบอีก 2,500 ภาพ โดยภาพที่ใช้ฝึกเป็นภาพ 6 ประเภท ได้แก่ (ขออนุญาตไม่แปล) blowjob_handjob, cunnilingus, sex_back, sex_front, titfuck, และ other

Tags:
Node Thumbnail

เมื่อต้นปี ไมโครซอฟท์ออกชุดเครื่องมือพัฒนา Deep Learning สำหรับเทรน AI ในชื่อ CNTK (ย่อมาจาก Microsoft Cognition Toolkit) พร้อมเปิดซอร์สขึ้นบน GitHub

ล่าสุดไมโครซอฟท์ออกชุดเครื่องมือเวอร์ชันใหม่ 2.0 Beta แล้ว พร้อมเปลี่ยนชื่อมันจากตัวย่อ มาเป็นชื่อเต็มๆ คือ Microsoft Cognitive Toolkit แทน

ของใหม่ที่สำคัญในเวอร์ชันนี้คือรองรับภาษา Python เพิ่มเข้ามาจากรุ่นแรกที่รองรับแต่ C++ (ในอนาคตจะรองรับภาษาอื่นๆ อย่าง R และ C#), ปรับปรุงประสิทธิภาพ และทำงานร่วมกับ Visual Studio ได้แล้ว

Pages