Baidu

การใช้งานคอมพิวเตอร์ทุกวันนี้เรายังคงใช้งานคอมพิวเตอร์ในรูปแบบที่ตรงไปตรงมา เช่น คำนวณสมการคณิตศาสตร์ หรือการประมวลข้อความที่เป็นมีกฎตรงไปตรงมา ข้อดีของคอมพิวเตอร์ที่เราใช้ตลอดมาคือความเร็วที่คอมพิวเตอร์สามารถทำงานซ้ำๆ ได้อย่างรวดเร็วเกินกว่าคนจะทำได้ แต่ในงานที่คนเราทำได้ง่ายๆ เช่น การทำความเข้าใจภาพถ่ายสักภาพมีอะไรอยู่ในภาพบ้างสำหรับคนทั่วไปสามารถทำได้โดยง่าย เราสามารถวงได้ว่าภาพใดมีบ้าน, รถ, หรือวัตถุอื่นๆ ในบ้านได้อย่างรวดเร็วและแม่นยำ แต่กระบวนการเหล่านี้กลับยากมากสำหรับคอมพิวเตอร์

Feature จุดเริ่มต้นของการเรียนรู้

ความพยายามในการพัฒนาให้คอมพิวเตอร์สามารถทำงานได้เหมือนมนุษย์หรือดีกว่าเป็นงานวิจัยที่มีมายาวนาน สิ่งที่เราเรียนรู้คือหากต้องการให้คอมพิวเตอร์ทำความเข้าใจกับข้อมูลที่เราป้อนให้เข้าไป เราต้องสอนให้คอมพิวเตอร์เข้าใจข้อมูลในแบบเดียวกับเรา เช่นว่าหากเรากำลังมองตัวอักษร เราไม่ได้มองจุดขาวหรือจุดดำจุดใดจุดหนึ่งในภาพ แต่เรากำลังมองเส้นของตัวตัวอักษรที่ลากไป แล้วเราจึงเริ่มทำความเข้าใจว่าลายเส้นแบบใด เป็นตัวอักษรใด เราเรียกคุณสมบัติของข้อมูลเช่นนี้ว่าฟีเจอร์ (feature)

ตัวอย่างเช่นใบหน้าคน คนเราสามารถแยกใบหน้าคนออกจากกัน หรือสามารถจำหน้าได้จากรูปวาดที่เป็นการ์ตูน โดยเราแยกแยะจากลักษณะบางอย่างของใบหน้า อาจจะเป็น สัดส่วนระหว่างจมูกกับรูปหน้าโดยรวม ระยะห่างระหว่างตา และข้อมูลอื่นๆ

เราใช้คุณสมบัติคล้ายๆ กันนี้ในการเรียนรู้ข้อมูลอีกหลายอย่าง เช่น เสียงพูด เมื่อเราได้ยินเสียงพูดของคนๆ หนึ่ง เราสามารถบอกได้ว่าเป็นเสียงของเพื่อนของเรา แม้ว่าเราไม่เคยได้ยินเพื่อนของเราพูดประโยคเดียวกันมาก่อนในชีวิต แต่เพราะเราสามารถรับรู้ฟีเจอร์ของเสียง เช่น ความต่ำสูง, ระยะเวลาการออกเสียงต่างๆ, และลักษณะอื่นๆ ที่นักวิจัยก็ยังต้องเรียนรู้กันต่อไป

ที่ผ่านมา นักวิจัยพยายามสอนคอมพิวเตอร์ให้เข้าใจข้อมูลในโลกความเป็นจริง ด้วยการสร้างกฎของการสร้างฟีเจอร์ให้กับข้อมูลแบบต่างๆ ทั้งเรื่องของภาษา, ภาพ, เสียง แต่ละหมวดของข้อมูลเป็นหัวข้อการวิจัยขนาดใหญ่ มีนักวิจัยทั่วโลกนับพันนับหมื่นทำงานวิจัยมาต่อเนื่องนับสิบปีเพื่อให้คอมพิวเตอร์สามารถเข้าข้อมูลได้ใกล้

แต่ Deep Learning ก็เป็นความหวังใหม่ที่จะรวบเอากระบวนวิธีที่คอมพิวเตอร์จะสามารถเข้าใจข้อมูลคล้ายคนมากขึ้น ภายใต้กระบวนการพื้นฐานเดียวกัน

Sparse Coding

จากเดิมที่เราต้องสร้างกระบวนการหาฟีเจอร์ของข้อมูลแต่ละอย่างเป็นการเฉพาะ มีการเสนอกระบวนการหาฟีเจอร์ของข้อมูลที่เรียกว่า Sparse Coding จากข้อมูลที่เราใช้ เช่น ภาพ, เสียง, ภาษา, ไปจนถึงข้อมูลแปลกๆ เช่น สัมผัส

[![upic.me](//upic.me/i/4z/baidu01.png)](http://upic.me/show/54755730)

กระบวนวิธี Sparse Coding สามารถสร้างข้อมูลที่เป็นตัวแทนของข้อมูลที่เราแสนใส่เข้า ทำให้ข้อมูลง่ายลง เช่นในภาพจากการนำเสนอของ Andrew Ng นักวิจัยชื่อดังในสาย Deep Learning ในปี 2011 ที่กูเกิล (ขณะนั้น Andrew ยังเป็นอาจารย์ในมหาวิทยาลัยสแตนฟอร์ด) เราสามารถใช้ภาพเพียง 64 ภาพที่สร้างจากการเรียนรู้ข้อมูลแทนข้อมูลที่เป็นพิกเซลได้ เมื่อเราได้ภาพใดๆ มาก็สามารถตัดแบ่งเป็นภาพเล็กๆ แล้วแทนแต่ละส่วนของภาพด้วยตัวเลขของฟีเจอร์

upic.me

เมื่อเราแปลงภาพจากระดับพิกเซล เป็นส่วนของภาพที่แสดงด้วยข้อมูลที่ง่ายลง เราสามารถทำกระบวนการนี้ซ้ำไปเรื่อยๆ เพื่อหาความหมายของภาพในระดับที่สูงขึ้นไปได้

Deep Learning ความหวังใหม่

ในกระบวนการเดิมที่เราแปลงภาพให้กลายเป็นฟีเจอร์แบบต่างๆ เมื่อเราทำซ้ำไปเรื่อๆ เราสามารถสร้างโครงข่าย เช่นในภาพของ Andrew Ng เขาแปลงภาพจากระดับพิกเซล เป็นรูปร่างต่างๆ ในภาพเล็กๆ แล้วค่อยๆ แปลงมันเป็นส่วนต่างๆ ของใบหน้า จากนั้นจึงแปลงเป็นใบหน้า

Andrew พบว่าในในความเป็นจริงแล้วเราสามารถใช้ฟีเจอร์ของข้อมูลชนิดเดียวกันในข้อมูลที่ต่างกันไปได้ เช่น เราสามารถใช้ข้อมูลการตรวจจับใบหน้าคน ร่วมกับข้อมูลตรวจจับภาพรถยนต์ เมื่อรวมกันเราสามารถสามารถสร้างโครงข่าย Deep Learning ที่แยกระหว่างรถยนต์ออกจากใบหน้าคนได้

เขานำเสนองานวิจัน โดยสร้างโครงข่ายเรียนรู้ "กิจกรรม" เช่น ภาพคนกำลังกอดกัน, ภาพคนกำลังเดิน ฯลฯ เมื่อนำมาทดสอบพบว่ามีความแม่นยำถึง 52% ดีกว่างานก่อนๆ อย่างมาก

กระบวนการ Deep Learning เดียวกันสามารถใช้เพื่อจดจำและเข้าใจเสียง จากการแปลงภาพ spectrogram ของเสียง และได้กระบวนวิธีจดจำเสียงที่ได้ความแม่นยำดีขึ้นจากงานวิจัยนานนับสิบปีได้อย่างมีนัยสำคัญ Deep Learning สามารถสร้างระบบตรวจเพศของผู้พูด, ตรวจสอบประเภทของเพลง, หรือกระทั่งบอกเจ้าของเพลง โดย Andrew ระบุว่าในทีมวิจัยไม่มีใครเป็นผู้เชี่ยวชาญด้านเสียง มีเพียงนักวิจัยด้าน machine learning อย่างเดียว

การใช้งาน Deep Learning ในโลกความเป็นจริง

upic.me

กระบวนการ Deep Learning สามารถสร้างแนวทางการใช้งานใหม่ๆ ให้กับคอมพิวเตอร์ได้มากมาย เราสามารถสร้างระบบจดจำเสียงที่ทนทานต่อเสียงรบกวน เช่น ในกรณีของ Baidu สามารถสร้างระบบจดจำเสียงที่แมนยำกว่า 80% แม้จะทำงานในภาพเสียงที่มีเสียงรบกวน

upic.me

กระบวนการค้นหาจะสามารถหาข้อมูลในรูปแบบที่เราไม่เคยทำได้ในอดีต เราสามารถหาภาพที่ "คล้าย" กับภาพที่ใส่ให้กับระบบ แทนที่จะเป็นการหาภาพที่เหมือนกัน เช่นในตัวอย่าง ระบบค้นหาสามารถค้นหาภาพทุ่งดอกไม้และท้องฟ้าได้ แม้ทุ่งดอกไม้อาจจะเป็นทุ่งดอกไม้คนละสี และท้องฟ้าจะเป็นท้องฟ้าลักษณะต่างกัน เพราะระบบค้นหาทำความเข้าใจกับภาพได้คล้ายมนุษย์มากขึ้น

upic.me

การแปลภาษาในอนาคตอาจจะแปลภาษาได้ใกล้เคียงนักแปลมืออาชีพขึ้นมาก ทุกวันนี้กระบวนการ Deep Learning สามารถค้นหาประโยคที่คล้ายกัน เช่น สามารถจัดหมวดหมู่ได้ว่าประโยคใดเป็นข่าวร้ายหรือข่าวดี, ประโยคใดเป็นประโยคบอกเล่า กระบวนการเหล่านี้ทำให้เรามีโอกาสเปรียบเทียบกระบวนการแปลจากนักแปลมืออาชีพในแปลประโยคแบบเดียวกัน

DARPA หน่วยงานวิจัยของกองทัพสหรัฐฯ ประกาศระบบ Deep Learning ของตัวเอง ที่ชื่อว่า Deep Exploration and Filtering of Text (DEFT) สามารถวิเคราะห์ถึงภัยจากข้อความที่ได้รับมา ตัวอย่างที่ DARPA แสดงคือคนสองคนสนทนากัน หากคนหนึ่งระบุว่า "ผมแพ้แอปเปิล" และอีกคนเตือนว่า "อย่ากินเค้ก" DEFT จะรับรู้ได้ทันทีว่าในเค้กนั้นมีแอปเปิลผสมอยู่

Deep Learning กับโลกความจริง

การทำงานของ Deep Learning ทุกวันนี้ที่เราเห็นยังคงเป็นบริการออนไลน์ที่เราใช้ผ่านเว็บหรือแอพพลิเคชั่นต่างๆ แต่ในอนาคตเราอาจะจะเริ่มเห็นอุปกรณ์รอบตัวของเราเชื่อมต่อกับคลาวด์ เพื่อเข้าถึงกระบวนการ Deep Learning แล้วสามารถพัฒนาการทำงานไปได้

ตัวอย่างการใช้งานเช่นหุ่นยนต์ในคลังสินค้าที่สามารถเรียนรู้ที่จะปรับแต่งเส้นทางการเดินทางให้สั้นที่สุด เพื่อให้สามารถขนสินค้าได้อย่างมีประสิทธิภาพ หุ่นยนต์ยุคใหม่จะไม่ต้องอยู่บนเส้นที่กำหนดไว้เฉพาะแบบในโรงงานทุกวันนี้อีกต่อไป แต่สามารถใช้ทางเดินร่วมกับคนทั่วไปแต่ยังทำงานได้อย่างรวดเร็วและปลอดภัย

อีกแนวทางการใช้งาน เช่น การแนะนำมนุษย์ให้ทำกิจกรรมบางอย่างได้อย่างมีประสิทธิภาพ เมื่อเดือนที่แล้วทาง Baidu เพิ่งเปิดโครงการ DuBike OS ที่จะช่วยในการขับขี่จักรยาน ตัวจักรยานจะสามารถเลือกเส้นทางให้เราจากแผนที่ไปพร้อมๆ กับความต้องการบางอย่าง เช่น ไม่อยากผ่านเส้นทางที่หนาแน่น, หรือต้องการออกกำลังกายก่อนที่จะไปถึงที่หมาย Deep Learning จะทำให้คอมพิวเตอร์เข้าใจความต้องการที่ซับซ้อนเช่นนี้ จากเดิมที่คอมพิวเตอร์จะเน้นเงื่อนไขที่ตรงไปตรงมาเช่นระยะทางสั้นที่สุด หรือเดินทางเร็วที่สุด การสื่อสารกับผู้ใช้ยังสามารถใช้ระบบจดจำเสียงที่มีความแม่นยำสูง

กระบวนการ Deep Learning เป็นงานที่กำลังเข้ามาในชีวิตประจำวัน เมื่อคอมพิวเตอร์สามรถเข้าใจบริบทที่มนุษย์เข้าใจได้ไม่ยากนัก แต่ยังคงความสามารถในการทำงานทำงานอัตโนมัติที่รวดเร็วและมีประสิทธิภาพ ในอนาคตนวัตกรรมที่เกิดขึ้นใหม่ๆ คงมีอะไรให้เราเรียนรู้กันอีกมา

Hiring! บริษัทที่น่าสนใจ

Carmen Software company cover
Carmen Software
Hotel Financial Solutions
Next Innovation (Thailand) Co., Ltd. company cover
Next Innovation (Thailand) Co., Ltd.
We are web design with consulting & engineering services driven the future stronger and flexibility.
KKP Dime company cover
KKP Dime
KKP Dime บริษัทในเครือเกียรตินาคินภัทร
Kiatnakin Phatra Financial Group company cover
Kiatnakin Phatra Financial Group
Financial Service
Fastwork Technologies company cover
Fastwork Technologies
Fastwork.co เว็บไซต์ที่รวบรวม ฟรีแลนซ์ มืออาชีพจากหลากหลายสายงานไว้ในที่เดียวกัน
Thoughtworks Thailand company cover
Thoughtworks Thailand
Thoughtworks เป็นบริษัทที่ปรึกษาด้านเทคโนโยลีระดับโลกที่คว้า Great Place to Work 3 ปีซ้อน
Iron Software company cover
Iron Software
Iron Software is an American company providing a suite of .NET libraries by engineer for engineers.
CLEVERSE company cover
CLEVERSE
Cleverse is a Venture Builder. Our team builds several tech companies.
Nipa Cloud company cover
Nipa Cloud
#1 OpenStack cloud provider in Thailand with our own data center and software platform.
Bangmod Enterprise company cover
Bangmod Enterprise
The leader in Cloud Server and Hosting in Thailand.
CIMB THAI Bank company cover
CIMB THAI Bank
MOVING FORWARD WITH YOU - CIMB is the leading ASEAN Bank
Bangkok Bank company cover
Bangkok Bank
Bangkok Bank is one of Southeast Asia's largest regional banks, a market leader in business banking
MuvMi (Urban Mobility Tech Co.,Ltd.) company cover
MuvMi (Urban Mobility Tech Co.,Ltd.)
Shape the future of urban mobility towards affordable, clean, and safe solutions
T.N. Digital Solution Co., Ltd. company cover
T.N. Digital Solution Co., Ltd.
TNDS has been involving in every first move of banking’s major digital transformation.
KBTG - KASIKORN Business-Technology Group company cover
KBTG - KASIKORN Business-Technology Group
KBTG - "The Technology Company for Digital Business Innovation"
Siam Commercial Bank Public Company Limited company cover
Siam Commercial Bank Public Company Limited
"Let's start a brighter career future together"
Icon Framework co.,Ltd. company cover
Icon Framework co.,Ltd.
Global Standard Platform for Real Estate แพลตฟอร์มสำหรับธุรกิจอสังหาริมทรัพย์ครบวงจร มาตรฐานระดับโลก
REFINITIV company cover
REFINITIV
The Financial and Risk business of Thomson Reuters is now Refinitiv
H LAB company cover
H LAB
Re-engineering healthcare systems through intelligent platforms and system design.
The Gang Technology Co., Ltd. company cover
The Gang Technology Co., Ltd.
We're a Digital Agency that helps our customers transform their business into digital with ease.
LTMH company cover
LTMH
LTMH มุ่งเน้นการพัฒนาผลิตภัณฑ์ที่สามารถช่วยพันธมิตรของเราให้บรรลุเป้าหมาย
Seven Peaks company cover
Seven Peaks
We Drive Digital Transformation
Wisesight (Thailand) Co., Ltd. company cover
Wisesight (Thailand) Co., Ltd.
The Best Choice For Handling Social Media · High Expertise in Social Data · Most Advanced and Secure
MOLOG Tech company cover
MOLOG Tech
We are Modern Logistic Platform, Specialize in WMS, OMS and TMS.
Data Wow Co.,Ltd company cover
Data Wow Co.,Ltd
We enable our clients to realize increased productivity by solving their most complex issues by Data
LINE Company Thailand company cover
LINE Company Thailand
LINE, the world's hottest mobile messaging platform, offers free text and voice messaging + Call
LINE MAN Wongnai company cover
LINE MAN Wongnai
Join our journey to becoming No.1 food platform in Thailand

การใช้ไม้ยมก

เมื่อเราทำซ้ำไปเรื่อๆ => เมื่อเราทำซ้ำไปเรื่อย ๆ
แม้จะทำงานในภาพเสียงที่มีเสียงรบกวน => แม้จะทำงานในสภาพเสียงที่มีเสียงรบกวน
เมื่อคอมพิวเตอร์สามรถเข้าใจ => เมื่อคอมพิวเตอร์สามารถเข้าใจ
คงมีอะไรให้เราเรียนรู้กันอีกมา => คงมีอะไรให้เราเรียนรู้กันอีกมาก

ผมว่า ไปตู้ นี่เป็น บ.ที่มีนวัตกรรม มากเหมือนกันนะ
หลายๆอย่างใช้ได้เลย เสียตรงชื่อฉาวนี่ละ

อะไรที่มาจากแบรนด์นี้เห็นแล้วไม่กล้าใช้อ่ะ ต่อให้ทำมาดีแค่ไหนก็ไม่เอาจริงๆ กลัวลงตัวเดียวแล้วเพื่อนๆจะตามมาทั้งโคลง

kiva Wed, 25/02/2015 - 13:44

Baidu Anti Virus ยังไม่เคลียร์เลยครับ

เคลียร์ตรงไหนครับ ออกมาแถลงข่าวโบ๊ยคนอื่น ไม่ได้รับผิดชอบอะไร ก่อนหน้าก็ให้รายการไอทีมาด่าชาวบ้านว่าลงวินโดว์เถื่อนอีก แบบนี้มันเคลียร์เหรอครับ

มี Deep Speech แล้ว รอบนี้มี Deep Learning...
ต่อไปจะ Deep อะไร...?
แต่ต่อให้ Deep แค่ไหนก็ไม่กล้าใช้...
เพราะความประทับใจแรกของเจ้าน่ะ มันตายไปแล้ว!!

ดูจาก Alpha Go นี่ยอมรับเลย ต่อไปก็เริ่มเล่นเกมที่ซับซ้อนขึ้น
อย่าง Dota2 / LOL เล่นได้นี่นับถือเลยฮะ เล่นดีดีนะ 555