Interview

เทคโนโลยี Big Data กำลังมาแรงมากขึ้นเรื่อยๆ และซอฟต์แวร์ที่ได้รับการยอมรับว่าเป็นมาตรฐานในวงการแล้วคือ Apache Hadoop (และโครงการที่เกี่ยวข้องอื่นๆ) ซึ่งมีบริษัทมากมายเข้าไปช่วยกันพัฒนากันอย่างเต็มที่

อย่างไรก็ตาม การที่ Hadoop เป็นโครงการโอเพนซอร์สแปลว่ามันยังมีความ "ดิบ" อยู่พอสมควรในการนำมาใช้งานจริง จึงมีบริษัทหน้าใหม่หลายแห่งที่นำ Hadoop มาจัดแพ็กเกจใหม่ ทำระบบติดตั้งและบริหารจัดการ บวกกับฟีเจอร์เสริมอื่นๆ ในลักษณะเดียวกับดิสโทรของลินุกซ์ในอดีต

บริษัทหนึ่งที่เข้ามาทำ Hadoop ในเชิงพาณิชย์เป็นรายแรกๆ คือ MapR (ดูจากชื่อก็น่าจะพอนึกออกว่ามาจาก MapReduce) ซึ่งผมมีโอกาสสัมภาษณ์ทางอีเมลกับคุณ Martin Darling ซึ่งเป็นผู้บริหารดูแลภูมิภาคเอเชียแปซิฟิกของ MapR ครับ (ตำแหน่งอย่างเป็นทางการคือ Vice President, Asia Pacific & Japan) ถึงแนวโน้มของโลก Big Data ครับ

MapR

อยากให้ช่วยเล่าประวัติของ MapR แบบสั้นๆ

MapR เป็นบริษัทที่ให้บริการ Apache Hadoop สำหรับตลาดองค์กร โดยผลิตภัณฑ์แบ่งออกเป็น 3 ระดับคือ M3, M5, M7 (รุ่น M3 แจกฟรี รุ่นอื่นๆ คิดราคา)

ปัจจุบันนี้ Hadoop มีข้อจำกัดตรงที่ใช้งานยาก ซึ่งภารกิจของ MapR คือทำอย่างไรก็ได้ให้ Hadoop ใช้งานง่ายขึ้น มีประสิทธิภาพดีขึ้น 2-5 เท่าจากรุ่นโอเพนซอร์ส ในราคาที่จับต้องได้ ผลก็คือ MapR เหมาะสำหรับคนที่อยากสกัดข้อมูลจาก Big Data แบบง่ายๆ ในราคาไม่แพง

ต้นกำเนิดของ MapR ต้องการนำนวัตกรรมด้านเทคโนโลยีอย่างการวิเคราะห์ข้อมูลจาก big data มาสู่ภาคธุรกิจ โดยบริษัทใช้วิธีเพิ่มฟีเจอร์ให้กับ Hadoop รุ่นปกติที่พัฒนาโดยชุมชน และบริษัทก็เข้าร่วมการพัฒนา Hadoop แบบโอเพนซอร์สในหลายโครงการย่อย ตอนแรก MapR เน้นไปที่ Hadoop และ HBase API เป็นหลัก แต่ช่วงหลังก็ขยับขยายมายังฟีเจอร์อื่นๆ ในโลกของ Hadoop ด้วย

ผู้ร่วมก่อตั้ง MapR คือ M.C. Srivas เป็นหนึ่งในหัวหน้าทีมโครงสร้างพื้นฐานด้านเซิร์ฟเวอร์ของกูเกิล เคยเข้าร่วมโครงการอย่าง GFS, BigTable, MapReduce ที่เป็นต้นกำเนิดไอเดียของ Hadoop ส่วนผู้ก่อตั้งอีกคนหนึ่งคือ John Schroeder (ซีอีโอของ MapR) ก็เคยมีประสบการณ์การเป็นซีอีโอให้กับบริษัทด้านไอทีองค์กรหลายแห่งที่ขายกิจการให้ไมโครซอฟท์และ EMC

ทำไมเราถึงควรใช้ Big Data? มันมีประโยชน์อะไรกับเรา?

การพัฒนา Hadoop ในช่วงแรกๆ เกิดจากบริษัทอินเทอร์เน็ตชื่อดังอย่าง Facebook/Twitter เหตุเพราะว่าบริษัทนี้มีผู้ใช้เป็นจำนวนมาก และผลิตข้อมูลจำนวนมหาศาลในแต่ละวัน

ข้อมูลเหล่านี้มีค่ามากเพราะมันบอกได้ว่าผู้ใช้งานชอบไม่ชอบอะไร บริโภคอะไร และสามารถนำมาใช้ประกอบการคัดเลือกเนื้อหา (target content) ให้เหมาะกับผู้ใช้แต่ละคนได้ ตัวบริการเองก็จะสร้างประโยชน์กับผู้ใช้งานมากขึ้น และการลงโฆษณาก็แม่นยำมากขึ้น ดังนั้นโค้ดของ Hadoop ในยุคแรกๆ จึงออกแบบมาสำหรับการใช้งานลักษณะนี้เป็นหลัก

แต่ภายหลัง Hadoop ก็พัฒนาขึ้นมาก สามารถนำมาใช้วิเคราะห์ข้อมูลลักษณะอื่นๆ ได้ด้วย โดยโลกไอทีไม่เคยวิเคราะห์ข้อมูลแบบนี้ได้มาก่อน

  • สามารถวิเคราะห์ข้อมูลขนาดใหญ่ๆ ได้ทั้งหมด ไม่ต้องแบ่งวิเคราะห์เฉพาะกลุ่มตัวอย่างขนาดจำกัด
  • สามารถวิเคราะห์ข้อมูลจากหลายๆ แหล่ง (multiple data sources) ได้เลย ไม่จำกัดเฉพาะฐานข้อมูลที่จัดเก็บข้อมูลอย่างเป็นระบบ (structured records) แบบที่องค์กรเคยใช้ในอดีต
  • สามารถวิเคราะห์ข้อมูลที่ไม่มี schema ได้ เหมาะสำหรับงานที่เราไม่รู้ฟอร์แมตหรือแพทเทิร์นของข้อมูลจนกว่าจะเริ่มการวิเคราะห์

ดังนั้น Hadoop จึงกลายเป็นเครื่องมือที่ขาดไม่ได้สำหรับภาคธุรกิจที่ต้องตัดสินใจโดยอิงกับเทรนด์ใหม่ๆ ที่สกัดมาจากแหล่งข้อมูลที่หลากหลาย

Martin Darling, Vice President, Asia Pacific & Japan, MapR

Martin Darling, Vice President, Asia Pacific & Japan, MapR

Big Data เป็นเรื่องขององค์กรขนาดใหญ่เท่านั้นหรือเปล่า? ธุรกิจ SME ขนาดเล็กจะใช้งาน Big Data ได้อย่างไรบ้าง?

ใครก็ตามที่ต้องการวิเคราะห์ข้อมูลขนาดใหญ่ก็สามารถใช้งาน MapR ได้ และเรามีลูกค้าขนาดเล็กๆ หลายรายที่ธุรกิจเน้นหนักไปที่ข้อมูล (extremely data centric)

ลูกค้าขนาดเล็กของเราเริ่มใช้งานแพ็กเกจ MapR ขนาดเล็กๆ (เริ่มที่ 4-5 โหนดประมวลผลก่อน) และค่อยๆ ขยายแพ็กเกจเพิ่มในภายหลังเมื่อสามารถวิเคราะห์ข้อมูลได้ลงลึกมากขึ้น

สำหรับคนทำงานด้านไอทีที่อยากทำงานสาย Big Data จะต้องมีทักษะอะไรบ้าง?

ถ้าอยากทำงานด้าน Hadoop ทักษะที่ต้องมีเป็นอย่างแรกคือการดูแลระบบลินุกซ์ และควรพัฒนาทักษะด้าน Hadoop โดยเฉพาะ จะมีใบรับรองด้าน Hadoop ด้วยก็ยิ่งดี

นอกจากนี้ถ้าอยากเติบโตในสายงานด้าน Big Data ก็ควรมีทักษะด้านการวิเคราะห์ข้อมูล (data science) เพิ่มเข้ามาด้วย งานสายนักวิเคราะห์ข้อมูล (data scientist) กำลังรุ่งเรืองมาก ถึงขนาดว่า Harvard Business Review ยกให้เป็น "งานที่เซ็กซี่ที่สุดในศตวรรษที่ 21" ซะด้วย

ตลาด Big Data ในเอเชียตะวันออกเฉียงใต้เป็นอย่างไรบ้าง? MapR มองเห็นอะไรในภูมิภาคนี้?

ตลาด Big Data ในเอเชียตะวันออกเฉียงใต้เติบโตเร็วมากในทุกวงการ ไม่ว่าจะเป็นภาครัฐบาล ค้าปลีก การเงิน การผลิต เว็บ-เกม ฯลฯ

เอเชียตะวันออกเฉียงใต้เป็นภูมิภาคที่น่าสนใจมากทั้งในแง่การปรับตัวเข้ากับเทคโนโลยีใหม่ๆ และการพัฒนาทักษะเพื่อรองรับเทคโนโลยีนั้นๆ ปัจจุบัน MapR เพิ่งเจาะตลาดนี้ได้ในระดับหนึ่งและรู้ดีว่าตลาดมีศักยภาพอีกมาก

วิดีโอแนะนำ MapR

Hiring! บริษัทที่น่าสนใจ

Carmen Software company cover
Carmen Software
Hotel Financial Solutions
Next Innovation (Thailand) Co., Ltd. company cover
Next Innovation (Thailand) Co., Ltd.
We are web design with consulting & engineering services driven the future stronger and flexibility.
KKP Dime company cover
KKP Dime
KKP Dime บริษัทในเครือเกียรตินาคินภัทร
Kiatnakin Phatra Financial Group company cover
Kiatnakin Phatra Financial Group
Financial Service
Fastwork Technologies company cover
Fastwork Technologies
Fastwork.co เว็บไซต์ที่รวบรวม ฟรีแลนซ์ มืออาชีพจากหลากหลายสายงานไว้ในที่เดียวกัน
Thoughtworks Thailand company cover
Thoughtworks Thailand
Thoughtworks เป็นบริษัทที่ปรึกษาด้านเทคโนโยลีระดับโลกที่คว้า Great Place to Work 3 ปีซ้อน
Iron Software company cover
Iron Software
Iron Software is an American company providing a suite of .NET libraries by engineer for engineers.
CLEVERSE company cover
CLEVERSE
Cleverse is a Venture Builder. Our team builds several tech companies.
Nipa Cloud company cover
Nipa Cloud
#1 OpenStack cloud provider in Thailand with our own data center and software platform.
Bangmod Enterprise company cover
Bangmod Enterprise
The leader in Cloud Server and Hosting in Thailand.
CIMB THAI Bank company cover
CIMB THAI Bank
MOVING FORWARD WITH YOU - CIMB is the leading ASEAN Bank
Bangkok Bank company cover
Bangkok Bank
Bangkok Bank is one of Southeast Asia's largest regional banks, a market leader in business banking
MuvMi (Urban Mobility Tech Co.,Ltd.) company cover
MuvMi (Urban Mobility Tech Co.,Ltd.)
Shape the future of urban mobility towards affordable, clean, and safe solutions
T.N. Digital Solution Co., Ltd. company cover
T.N. Digital Solution Co., Ltd.
TNDS has been involving in every first move of banking’s major digital transformation.
KBTG - KASIKORN Business-Technology Group company cover
KBTG - KASIKORN Business-Technology Group
KBTG - "The Technology Company for Digital Business Innovation"
Siam Commercial Bank Public Company Limited company cover
Siam Commercial Bank Public Company Limited
"Let's start a brighter career future together"
Icon Framework co.,Ltd. company cover
Icon Framework co.,Ltd.
Global Standard Platform for Real Estate แพลตฟอร์มสำหรับธุรกิจอสังหาริมทรัพย์ครบวงจร มาตรฐานระดับโลก
REFINITIV company cover
REFINITIV
The Financial and Risk business of Thomson Reuters is now Refinitiv
H LAB company cover
H LAB
Re-engineering healthcare systems through intelligent platforms and system design.
The Gang Technology Co., Ltd. company cover
The Gang Technology Co., Ltd.
We're a Digital Agency that helps our customers transform their business into digital with ease.
LTMH company cover
LTMH
LTMH มุ่งเน้นการพัฒนาผลิตภัณฑ์ที่สามารถช่วยพันธมิตรของเราให้บรรลุเป้าหมาย
Seven Peaks company cover
Seven Peaks
We Drive Digital Transformation
Wisesight (Thailand) Co., Ltd. company cover
Wisesight (Thailand) Co., Ltd.
The Best Choice For Handling Social Media · High Expertise in Social Data · Most Advanced and Secure
MOLOG Tech company cover
MOLOG Tech
We are Modern Logistic Platform, Specialize in WMS, OMS and TMS.
Data Wow Co.,Ltd company cover
Data Wow Co.,Ltd
We enable our clients to realize increased productivity by solving their most complex issues by Data
LINE Company Thailand company cover
LINE Company Thailand
LINE, the world's hottest mobile messaging platform, offers free text and voice messaging + Call
LINE MAN Wongnai company cover
LINE MAN Wongnai
Join our journey to becoming No.1 food platform in Thailand

neonicus Tue, 08/10/2013 - 17:31

น่าสนใจมาก แต่ยังนึกโจทย์ไม่ออกว่าจะทำอะไรกับระบบเล็กๆทั่วไป
ทดลองลง hadoop,mongodb แล้วก็นึกไม่ออกว่าจะทำอะไรกับมันต่อแล้ว

ข้อมูลที่เป็น garbage หลายตัวมีคุณค่าภายในแต่อาจจะยังมองไม่เห็นครับ หลายๆองค์กรเก็บข้อมูลก็เก็บแบบยังไม่ทราบว่านำไปทำอะไรดี หรือนำไปใช้แต่ยังไม่ถึงจุดที่จะคั้นเอาทองออกมาได้ ก็เลยต้องการ big data analytics หรือ big data science มาช่วย ถ้าพวกนักวิจัยทางสายนี้ เขาจะสนว่ามีข้อมูล น่าจะมีคุณค่าข้างใน ข้อมูลจะเป็นขยะ จะไร้โครงสร้างอย่างไร ไม่ได้เป็นปัญหา แต่ถือว่าเป็นความท้าทายครับ