Image
By mk Founder on Tag: YouTube, Google, Artificial Intelligence, Research
YouTube

เมื่อปี 2016 กูเกิลเปิดฐานข้อมูลวิดีโอบน YouTube 8 ล้านคลิป (YouTube-8M) เพื่อใช้เทรน AI ประมวลผลวิดีโอ และมีทีมวิจัยด้าน AI กว่า 1,000 ทีมเข้ามาร่วมแข่งขันพัฒนา AI ให้เข้าใจความหมายของวิดีโอมากที่สุด

ปี 2019 กูเกิลกลับมาพร้อมฐานข้อมูลชุดใหม่ชื่อ YouTube-8M Segments ที่พัฒนาจากฐานข้อมูลเดิม โดยตัดวิดีโอเป็นท่อนๆ (segment) ยาวท่อนละประมาณ 5 วินาที จำนวนทั้งหมดประมาณ 237,000 ท่อน ซึ่งใช้คนช่วยแยกแยะข้อมูลแล้วว่าวิดีโอแต่ละท่อนเกี่ยวข้องกับอะไรบ้าง

By lew Founder on Tag: Artificial Intelligence
Artificial Intelligence

เว็บ Vice.com เผยแพร่บทสัมภาษณ์ผู้สร้าง DeepNude ซอฟต์แวร์ที่สร้างจากโมเดลปัญญาประดิษฐ์ที่สร้างภาพโป๊จากภาพผู้หญิงที่สวมเสื้อผ้าอยู่ โดยมีรุ่นฟรีที่เซ็นเซอร์ และรุ่นเสียเงิน 50 ดอลลาร์ไม่มีเซ็นเซอร์ มีเพียงตราตรงมุมภาพว่าเป็นภาพปลอมเท่านั้น

By nismod Writer on Tag: Artificial Intelligence, United Nations
Artificial Intelligence

นักวิจัยจาก Global Pulse โครงการวิจัยด้าน Big Data, AI ของ UN ได้เผยแพร่เปเปอร์งานวิจัยที่ว่าด้วยการฝึก AI ให้สามารถเขียนสุนทรพจน์สำหรับในการประชุมสามัญของ UN ได้ภายใน 13 ชั่วโมงและงบประมาณเพียง 7.8 เหรียญ ซึ่งเป็นค่าใช้จ่ายในการใช้งานแพลตฟอร์มคลาวด์

เครื่องมือที่ Global Pulse ใช้เป็นเครื่องมือโอเพนซอสทั้งหมด ส่วนข้อมูลที่ป้อนเอาจากสุนทรพจน์ทั้งหมดที่ถูกพูดในการประชุมสามัญของ UN ตั้งแต่ปี 1970 ถึง 2015 ก่อนจะแบ่งออกมาเป็น 3 หมวดใหญ่ๆ คือหัวข้อทั่วไป (อาทิ โลกร้อน), สุนทรพจน์เปิดประชุมของเลขาธิการ UN และประเด็นที่อ่อนไหว อาทิ ชมกลุ่มน้อย โดยใช้โมเดล Deep Learning

By lew Founder on Tag: PyTorch, Artificial Intelligence
PyTorch

ทีมงาน PyTorch เปิดตัวบริการ PyTorch Hub บริการเชื่อมงานวิจัยเข้ากับโมเดลปัญญาประดิษฐ์เพื่อให้นักวิจัยภายนอกสามารถตรวจการทำงานของโมเดลที่เผยแพร่ออกมาได้ดีขึ้น

PyTorch Hub ทำให้ผู้ใช้สามารถค้นหาและดาวน์โหลดโมเดลได้ง่ายๆ เหมือนการดาวน์โหลดอิมเมจของ Docker เช่น การรันโค้ด torch.hub.list('pytorch/vision') ก็จะได้รายการโมเดลของ PyTorch สำหรับการประมวลผลภาพออกมา และสามารถสั่งดาวน์โหลดได้ด้วยคำสั่งเดียว

By lew Founder on Tag: Google, Artificial Intelligence, Football
Google

ทีมงาน Google Brain เปิดตัวเอนจิน Google Research Football เกมเอนจินที่เปิด API ให้นักวิจัยสร้างปัญญาประดิษฐ์มาแข่งเกมฟุตบอลแบบ reinforcement learning (RL) หรือการพัฒนาปัญญาประดิษฐ์ที่ตัวปัญญาประดิษฐ์เรียนรู้ว่าต้องชิง "รางวัล" ให้ดีที่สุด

By lew Founder on Tag: Australia, Artificial Intelligence, Medical
Australia

ทีมวิจัยร่วมระหว่างมหาวิทยาลัย Curtin และมหาวิทยาลัย Queensland สร้างปัญญาประดิษฐ์ที่สามารถจำแนกโรคทางเดินหายใจจากเสียงไอในเด็กได้ โดยหากใช้เสียงอย่างเดียวมีความแม่นยำสูงกว่าทีมแพทย์ที่ฟังเสียงไออย่างเดียวเหมือนกัน

ปัญญาประดิษฐ์สามารถแยกโรค หอบหืด (asthma), ปอดบวม (pneumonia), โรคครูป (croup), โรคหลอดลมอักเสบ (bronchiolitis), และโรคติดเชื้อระบบทางเดินหายใจส่วนล่าง (lower respiratory tract disease) โดยทีมแพทย์และปัญญาประดิษฐ์ได้ฟังเสียงไออย่างเดียวเหมือนๆ กัน

By sunnywalker Writer on Tag: Amazon, Artificial Intelligence, Fashion
Amazon

เชื่อว่าผู้หญิงหลายคนต้องอยากใส่เสื้อผ้าตามคนดัง แต่เมื่อเห็นแต่รูปก็ไม่รู้ว่าจะไปหาเสื้อผ้าสไตล์นี้ได้ที่ไหน ล่าสุด Amazon เปิดตัว StyleSnap ฟีเจอร์ให้ AI ช่วยหาชุดให้ใน Amazon App โดยผู้ใช้สามารถอัพโหลดรูปเสื้อผ้าที่ไปเจอมาเข้าไปในแอพ ระบบจะช่วยหาเสื้อผ้าที่มีดีไวน์คล้ายกับในรูปที่สามารถหาซื้อได้บน Amazon ให้

เว็บไซต์ The Verge ระบุว่า ฟีเจอร์ดังกล่าวยังทำงานได้ไม่ดีนัก ยังไม่สามารถระบุรายละเอียดต่างๆ ของเสื้อผ้าได้ และยังเสนอไอเท็มซ้ำๆ เดิมๆ นอกจากนี้ยังมีสตาร์ทอัพเจ้าอื่นที่ทำฟีเจอร์ในทำนองเดียวกันนี้ รวมถึง Asos ยักษ์ใหญ่แฟชั่นออนไลน์

By lew Founder on Tag: Google I/O, Thailand, Artificial Intelligence
Google I/O

เดือนที่แล้วในงาน Google I/O นอกจากการเปิดตัว API ต่างๆ ของกูเกิลเองแล้ว ในงานส่วนนิทรรศการยังมีการแสดงสาธิตการใช้เทคโนโลยีรูปแบบต่างๆ โดยในนิทรรศการทั้งหมด บริษัท bit.studio จากประเทศไทยไทยก็ได้จัดนิทรรศการในงานด้วย

By lew Founder on Tag: Artificial Intelligence, Google, Research
Artificial Intelligence

โลกเครือข่ายสังคมออนไลน์มักมีการทำอะไรตามๆ กันเป็นระยะ เช่น การเต้นโคฟเวอร์เพลง Gangnam Style, หรือการท้า Ice Bucket Challenge เป็นต้น งานวิจัยล่าสุดของกูเกิลสามารถสร้างชุดข้อมูลจากการท้ากันเช่นนี้ ทำให้ได้โมเดลแปลงวิดีโอเป็นวิดีโอสามมิติที่มีความแม่นยำสูง

By mk Founder on Tag: NVIDIA, Server, Hardware, GPU, Artificial Intelligence, Edge Computing
NVIDIA

ช่วงนี้แนวคิด Edge Server หรือการตั้งเซิร์ฟเวอร์ประมวลผล AI ที่ปลายทาง (แล้วค่อยส่งขึ้นคลาวด์) กำลังมาแรง เราเริ่มเห็นโซลูชันจากหลายๆ บริษัทออกสู่ตลาด เช่น ฮาร์ดแวร์ Coral ของกูเกิล, ซอฟต์แวร์จากไมโครซอฟท์, คอมพิวเตอร์อุตสาหกรรมของ Lenovo เป็นต้น

NVIDIA ในฐานะผู้สร้างหน่วยประมวลผลจีพียูสำหรับงาน AI ก็ไม่พลาดสงครามนี้เช่นกัน ล่าสุดเปิดตัว NVIDIA EGX โดยเรียกตัวเองว่าเป็น "GPU Edge Server"

By lew Founder on Tag: Artificial Intelligence, Microsoft, Text-to-Speech
Artificial Intelligence

ทีมวิจัยร่วมระหว่างไมโครซอฟท์และมหาวิทยาลัยเจ้อเจียง (Zhejiang University) รายงานความสำเร็จในการออกแบบปัญญาประดิษฐ์ที่สามารถแปลงข้อความเป็นเสียงพูด (text-to-speech - TTS) และแปลงเสียงพูดเป็นข้อความ (automatic speech recognition - ASR) โดยใช้ข้อมูลปริมาณน้อยมาก คิดเป็นเสียงพูดประมาณ 20 นาทีเท่านั้น แต่ยังความแม่นยำของการสร้างเสียงพูดที่ฟังออก (intelligible rate) สูงถึง 99.84%

By arjin Writer on Tag: Deep Learning, Artificial Intelligence
Deep Learning

เราเคยเห็นโมเดลการสร้างวิดีโอปลอม หรือคลิปเสียงปลอม ที่พัฒนาจากการเทรนข้อมูลคลิปวิดีโอและคลิปเสียงจำนวนมาก หรือ Deepfake แต่งานวิจัยล่าสุดที่เผยแพร่โดย Samsung AI Center สามารถพัฒนาผลลัพธ์ได้ไกลกว่านั้น โดยอาจใช้ข้อมูลเริ่มต้นด้วยรูปภาพเพียง 1 รูปเท่านั้น

รูปแบบการสร้างคลิปดังกล่าว อาศัยการเทรนข้อมูลคลิปวิดีโออื่นที่เป็นการถ่ายเจาะเฉพาะใบหน้าจำนวนหนึ่งก่อน จากนั้นจับเฉพาะตำแหน่งสำคัญบนใบหน้าเพื่อใช้ในการสร้างคลิปวิดีโอ เช่น คิ้ว ตา จมูก ปาก เมื่อเราให้ข้อมูลภาพถ่ายใบหน้า ก็สามารถสร้างวิดีโอปลอมขึ้นมา โดยอาศัยการจับตำแหน่งสำคัญเหล่านั้น แล้วทำการขยับส่วนต่าง ๆ บนใบหน้าออกมานั่นเอง

By arjin Writer on Tag: Google Assistant, Artificial Intelligence
Google Assistant

กูเกิลเปิดให้บริการ Google Duplex ฟีเจอร์ที่ให้ผู้ใช้ Google Assistant ช่วยคุยโทรศัพท์เป็นเลขาแทนเราตั้งแต่ต้นปีที่ผ่านมา ทั้งบน Android และ iOS (จำกัดพื้นที่ในสหรัฐฯ) ฟีเจอร์นี้เปิดตัวครั้งแรกในงาน Google I/O ปี 2018 และเป็นที่ฮือฮามาก เพราะสาธิตการให้ Google Duplex คุยโทรศัพท์จองร้านอาหาร และร้านตัดผมได้ โดยปลายสายเป็นคนจริงที่สนทนาด้วย

อย่างไรก็ตามผลทดสอบของ The New York Times พบว่า Google Duplex ยังไม่สมบูรณ์แบบนัก หลายครั้งต้องใช้คนจริงเข้ามาช่วยสนทนาแทน

By lew Founder on Tag: Artificial Intelligence, Medical
Artificial Intelligence

กูเกิลเผยแพร่งานวิจัยประกาศความสำเร็จในการสร้างโมเดลปัญญาประดิษฐ์ที่สามารถวินิจฉัยการถ่ายภาพรังสีส่วนตัดอาศัยคอมพิวเตอร์ (computerized tomography - CT) เพื่อหามะเร็งปอด ที่เป็นระบบอัตโนมัติที่ดีที่สุดในตอนนี้ สามารถวินิจฉัยจากชุดข้อมูล National Lung Cancer Screening Trial เป็นภาพ CT ปอดจากผู้ป่วย 45,856 คน ได้แม่นยำ 94.4%

By mk Founder on Tag: Google, Artificial Intelligence, Machine Learning
Google

ปีที่แล้วเราเห็น กูเกิลเปิดคอร์สวิชา Machine Learning ที่ใช้สอนพนักงาน ให้คนทั่วไปเรียนฟรีออนไลน์ ออกมาหลายคอร์ส และได้รับความนิยมอย่างมาก

ปีนี้กูเกิลเปิดคอร์ส Machine Learning ชั้นสูง เจาะลึกในด้านต่างๆ เพิ่มมาอีก 3 คอร์ส ได้แก่

By lew Founder on Tag: Google, Artificial Intelligence
Google

กูเกิลนำเสนอสถาปัตยกรรมปัญญาประดิษฐ์สำหรับแปลภาษาในชื่อ Translatotron ที่เป็นการแปลภาษาโดยตรงจากเสียงพูดไปยังเสียงพูด (end-to-end) แทนที่จะเป็นการแปลงเสียงเป็นข้อความ แปลข้อความ แล้วจึงนำมาแปลงเป็นเสียง (cascade) เหมือนเช่นทุกวันนี้

Translatotron เป็นปัญญาประดิษฐ์แบบ sequence-to-sequence โดยนำข้อมูล spectrogram ของเสียงพูดภาษาต้นทางและปลายทาง

By sunnywalker Writer on Tag: Android 10, Artificial Intelligence, Google I/O, Google
Android 10

อีกหนึ่งฟีเจอร์น่าตื่นเต้นของ Android Q คือ Live Caption ที่สามารถแปลงเสียงเป็นข้อความได้ทั้งเสียงจากในโทรศัพท์และเสียงจากภายนอก ช่วยให้ผู้ที่มีความบกพร่องทางการได้ยินใช้งานโทรศัพท์ได้ง่ายขึ้น

การทำงานของ Live Caption กดปุ่มเดียวให้ระบบตรวจจับเสียงจากที่ต่างๆ ทั้งเสียงที่อัดจากเครื่อง เสียงจากแอพพอดคาสต์ ข้อความเสียง วิดีโอ หรือเสียงอะไรก็ตามที่มาจากแอพอื่นๆ ระบบจะถอดเป็นข้อความแบบเรียลไทม์ โดยไม่ต้องใช้อินเทอร์เน็ต

By nismod Writer on Tag: Google, Artificial Intelligence, Research
Google

เรื่อง Speech Recognition ของ Google อาจจะค่อนข้างแม่นยำ จากเสียงหรือคำพูดของคนปกติทั่วไป ทว่าการตรวจจับคำพูดของ AI ก็ยังคงมีปัญหาหากเป็นคำสั่งที่มาจากผู้ที่มีปัญหาด้านการสื่อสาร จากปัญหาด้านระบบประสาทเช่น ผู้ป่วยเส้นเลือดอุดตันในสมองหรือผู้ป่วยกล้ามเนื้ออ่อนแรง (ALS) เนื่องจากไม่สามารถใช้โมเดลเดียวกับคนทั่วไปได้

By lew Founder on Tag: Google Assistant, Google, Artificial Intelligence, Google I/O
Google Assistant

กูเกิลประกาศฟีเจอร์ของ Google Assistant รุ่นต่อไปที่จะมากับโทรศัพท์ Pixel รุ่นใหม่ โดยโมเดลปัญญาประดิษฐ์ถูกย่อลงเหลือไม่ถึง 500MB ทำให้สามารถรันบนโทรศัพท์ได้โดยตรงไม่ต้องส่งข้อมูลเสียงผ่านอินเทอร์เน็ตอีกต่อไป

การทำงานบนโทรศัพท์ทำให้ Assistant ทำงานเร็วขึ้น 10 เท่าตัว สามารถสั่่งงานข้ามแอป เช่น สร้างนัดหมายใหม่ในแอป Calendar, ส่งอีเมล, ตอบแชต, แชร์ภาพ และนอกจากการเชื่อมต่อกับแอปต่างๆ ในโทรศัพท์แล้ว Assistant ยังสามารถเชื่อมต่อกับเว็บด้วยคำสั่งเช่น "เช่ารถสำหรับทริปต่อไป" ตัว Assistant สามารถเข้าเว็บ, กรอกแบบฟอร์มเช่ารถ, และขอยืนยันคำสั่งสุดท้ายจากผู้ใช้โดยอัตโนมัติ

By mk Founder on Tag: Visual Studio, Development, Microsoft, Artificial Intelligence, IDE
Visual Studio

Visual Studio มีฟีเจอร์ IntelliCode ใช้ AI ช่วยแนะนำการเขียนโค้ด มาได้สักพักใหญ่ๆ โดยช่วงแรกยังมีสถานะเป็นรุ่นพรีวิว และยังรองรับแค่ภาษา C# กับโมเดล XAML เท่านั้น
ในงาน Build 2019 ปีนี้ ไมโครซอฟท์ประกาศว่า IntelliCode มีสถานะเป็น GA เรียบร้อยแล้ว พร้อมประกาศฟีเจอร์เพิ่มอีกชุดใหญ่ ตั้งแต่การรองรับภาษาที่เพิ่มขึ้นคือ C++ และ TypeScript/JavaScript (ตอนนี้ยังเป็นรุ่นพรีวิวใน Visual Studio 2019 Version 16.1)

Subscribe to Artificial Intelligence