Tags:
Node Thumbnail

เทคโนโลยี Big Data กำลังมาแรงมากขึ้นเรื่อยๆ และซอฟต์แวร์ที่ได้รับการยอมรับว่าเป็นมาตรฐานในวงการแล้วคือ Apache Hadoop (และโครงการที่เกี่ยวข้องอื่นๆ) ซึ่งมีบริษัทมากมายเข้าไปช่วยกันพัฒนากันอย่างเต็มที่

อย่างไรก็ตาม การที่ Hadoop เป็นโครงการโอเพนซอร์สแปลว่ามันยังมีความ "ดิบ" อยู่พอสมควรในการนำมาใช้งานจริง จึงมีบริษัทหน้าใหม่หลายแห่งที่นำ Hadoop มาจัดแพ็กเกจใหม่ ทำระบบติดตั้งและบริหารจัดการ บวกกับฟีเจอร์เสริมอื่นๆ ในลักษณะเดียวกับดิสโทรของลินุกซ์ในอดีต

บริษัทหนึ่งที่เข้ามาทำ Hadoop ในเชิงพาณิชย์เป็นรายแรกๆ คือ MapR (ดูจากชื่อก็น่าจะพอนึกออกว่ามาจาก MapReduce) ซึ่งผมมีโอกาสสัมภาษณ์ทางอีเมลกับคุณ Martin Darling ซึ่งเป็นผู้บริหารดูแลภูมิภาคเอเชียแปซิฟิกของ MapR ครับ (ตำแหน่งอย่างเป็นทางการคือ Vice President, Asia Pacific & Japan) ถึงแนวโน้มของโลก Big Data ครับ

alt="MapR"

อยากให้ช่วยเล่าประวัติของ MapR แบบสั้นๆ

MapR เป็นบริษัทที่ให้บริการ Apache Hadoop สำหรับตลาดองค์กร โดยผลิตภัณฑ์แบ่งออกเป็น 3 ระดับคือ M3, M5, M7 (รุ่น M3 แจกฟรี รุ่นอื่นๆ คิดราคา)

ปัจจุบันนี้ Hadoop มีข้อจำกัดตรงที่ใช้งานยาก ซึ่งภารกิจของ MapR คือทำอย่างไรก็ได้ให้ Hadoop ใช้งานง่ายขึ้น มีประสิทธิภาพดีขึ้น 2-5 เท่าจากรุ่นโอเพนซอร์ส ในราคาที่จับต้องได้ ผลก็คือ MapR เหมาะสำหรับคนที่อยากสกัดข้อมูลจาก Big Data แบบง่ายๆ ในราคาไม่แพง

ต้นกำเนิดของ MapR ต้องการนำนวัตกรรมด้านเทคโนโลยีอย่างการวิเคราะห์ข้อมูลจาก big data มาสู่ภาคธุรกิจ โดยบริษัทใช้วิธีเพิ่มฟีเจอร์ให้กับ Hadoop รุ่นปกติที่พัฒนาโดยชุมชน และบริษัทก็เข้าร่วมการพัฒนา Hadoop แบบโอเพนซอร์สในหลายโครงการย่อย ตอนแรก MapR เน้นไปที่ Hadoop และ HBase API เป็นหลัก แต่ช่วงหลังก็ขยับขยายมายังฟีเจอร์อื่นๆ ในโลกของ Hadoop ด้วย

ผู้ร่วมก่อตั้ง MapR คือ M.C. Srivas เป็นหนึ่งในหัวหน้าทีมโครงสร้างพื้นฐานด้านเซิร์ฟเวอร์ของกูเกิล เคยเข้าร่วมโครงการอย่าง GFS, BigTable, MapReduce ที่เป็นต้นกำเนิดไอเดียของ Hadoop ส่วนผู้ก่อตั้งอีกคนหนึ่งคือ John Schroeder (ซีอีโอของ MapR) ก็เคยมีประสบการณ์การเป็นซีอีโอให้กับบริษัทด้านไอทีองค์กรหลายแห่งที่ขายกิจการให้ไมโครซอฟท์และ EMC

ทำไมเราถึงควรใช้ Big Data? มันมีประโยชน์อะไรกับเรา?

การพัฒนา Hadoop ในช่วงแรกๆ เกิดจากบริษัทอินเทอร์เน็ตชื่อดังอย่าง Facebook/Twitter เหตุเพราะว่าบริษัทนี้มีผู้ใช้เป็นจำนวนมาก และผลิตข้อมูลจำนวนมหาศาลในแต่ละวัน

ข้อมูลเหล่านี้มีค่ามากเพราะมันบอกได้ว่าผู้ใช้งานชอบไม่ชอบอะไร บริโภคอะไร และสามารถนำมาใช้ประกอบการคัดเลือกเนื้อหา (target content) ให้เหมาะกับผู้ใช้แต่ละคนได้ ตัวบริการเองก็จะสร้างประโยชน์กับผู้ใช้งานมากขึ้น และการลงโฆษณาก็แม่นยำมากขึ้น ดังนั้นโค้ดของ Hadoop ในยุคแรกๆ จึงออกแบบมาสำหรับการใช้งานลักษณะนี้เป็นหลัก

แต่ภายหลัง Hadoop ก็พัฒนาขึ้นมาก สามารถนำมาใช้วิเคราะห์ข้อมูลลักษณะอื่นๆ ได้ด้วย โดยโลกไอทีไม่เคยวิเคราะห์ข้อมูลแบบนี้ได้มาก่อน

  • สามารถวิเคราะห์ข้อมูลขนาดใหญ่ๆ ได้ทั้งหมด ไม่ต้องแบ่งวิเคราะห์เฉพาะกลุ่มตัวอย่างขนาดจำกัด
  • สามารถวิเคราะห์ข้อมูลจากหลายๆ แหล่ง (multiple data sources) ได้เลย ไม่จำกัดเฉพาะฐานข้อมูลที่จัดเก็บข้อมูลอย่างเป็นระบบ (structured records) แบบที่องค์กรเคยใช้ในอดีต
  • สามารถวิเคราะห์ข้อมูลที่ไม่มี schema ได้ เหมาะสำหรับงานที่เราไม่รู้ฟอร์แมตหรือแพทเทิร์นของข้อมูลจนกว่าจะเริ่มการวิเคราะห์

ดังนั้น Hadoop จึงกลายเป็นเครื่องมือที่ขาดไม่ได้สำหรับภาคธุรกิจที่ต้องตัดสินใจโดยอิงกับเทรนด์ใหม่ๆ ที่สกัดมาจากแหล่งข้อมูลที่หลากหลาย

alt="Martin Darling, Vice President, Asia Pacific & Japan, MapR"

Martin Darling, Vice President, Asia Pacific & Japan, MapR

Big Data เป็นเรื่องขององค์กรขนาดใหญ่เท่านั้นหรือเปล่า? ธุรกิจ SME ขนาดเล็กจะใช้งาน Big Data ได้อย่างไรบ้าง?

ใครก็ตามที่ต้องการวิเคราะห์ข้อมูลขนาดใหญ่ก็สามารถใช้งาน MapR ได้ และเรามีลูกค้าขนาดเล็กๆ หลายรายที่ธุรกิจเน้นหนักไปที่ข้อมูล (extremely data centric)

ลูกค้าขนาดเล็กของเราเริ่มใช้งานแพ็กเกจ MapR ขนาดเล็กๆ (เริ่มที่ 4-5 โหนดประมวลผลก่อน) และค่อยๆ ขยายแพ็กเกจเพิ่มในภายหลังเมื่อสามารถวิเคราะห์ข้อมูลได้ลงลึกมากขึ้น

สำหรับคนทำงานด้านไอทีที่อยากทำงานสาย Big Data จะต้องมีทักษะอะไรบ้าง?

ถ้าอยากทำงานด้าน Hadoop ทักษะที่ต้องมีเป็นอย่างแรกคือการดูแลระบบลินุกซ์ และควรพัฒนาทักษะด้าน Hadoop โดยเฉพาะ จะมีใบรับรองด้าน Hadoop ด้วยก็ยิ่งดี

นอกจากนี้ถ้าอยากเติบโตในสายงานด้าน Big Data ก็ควรมีทักษะด้านการวิเคราะห์ข้อมูล (data science) เพิ่มเข้ามาด้วย งานสายนักวิเคราะห์ข้อมูล (data scientist) กำลังรุ่งเรืองมาก ถึงขนาดว่า Harvard Business Review ยกให้เป็น "งานที่เซ็กซี่ที่สุดในศตวรรษที่ 21" ซะด้วย

ตลาด Big Data ในเอเชียตะวันออกเฉียงใต้เป็นอย่างไรบ้าง? MapR มองเห็นอะไรในภูมิภาคนี้?

ตลาด Big Data ในเอเชียตะวันออกเฉียงใต้เติบโตเร็วมากในทุกวงการ ไม่ว่าจะเป็นภาครัฐบาล ค้าปลีก การเงิน การผลิต เว็บ-เกม ฯลฯ

เอเชียตะวันออกเฉียงใต้เป็นภูมิภาคที่น่าสนใจมากทั้งในแง่การปรับตัวเข้ากับเทคโนโลยีใหม่ๆ และการพัฒนาทักษะเพื่อรองรับเทคโนโลยีนั้นๆ ปัจจุบัน MapR เพิ่งเจาะตลาดนี้ได้ในระดับหนึ่งและรู้ดีว่าตลาดมีศักยภาพอีกมาก

วิดีโอแนะนำ MapR

Get latest news from Blognone

Comments

By: neonicus
Android
on 8 October 2013 - 17:31 #638765

น่าสนใจมาก แต่ยังนึกโจทย์ไม่ออกว่าจะทำอะไรกับระบบเล็กๆทั่วไป
ทดลองลง hadoop,mongodb แล้วก็นึกไม่ออกว่าจะทำอะไรกับมันต่อแล้ว

By: tajmahals
Windows PhoneWindows
on 8 October 2013 - 20:38 #638877
tajmahals's picture

องค์กรในไทยระดับกลางๆ เก็บข้อมูลได้ค่อนข้างห่วยเลยทีเดียว
Garbage in, garbage out.

By: kanchen
AndroidUbuntu
on 9 October 2013 - 11:38 #639183 Reply to:638877

ไม่ใช้แค่องค์กรระดับกลางหรอกครับ องค์กรใหญ่ๆ อย่างข้าราชการก็ห่วยครับ

By: javaboom
WriteriPhone
on 9 October 2013 - 12:32 #639243 Reply to:638877
javaboom's picture

ข้อมูลที่เป็น garbage หลายตัวมีคุณค่าภายในแต่อาจจะยังมองไม่เห็นครับ หลายๆองค์กรเก็บข้อมูลก็เก็บแบบยังไม่ทราบว่านำไปทำอะไรดี หรือนำไปใช้แต่ยังไม่ถึงจุดที่จะคั้นเอาทองออกมาได้ ก็เลยต้องการ big data analytics หรือ big data science มาช่วย ถ้าพวกนักวิจัยทางสายนี้ เขาจะสนว่ามีข้อมูล น่าจะมีคุณค่าข้างใน ข้อมูลจะเป็นขยะ จะไร้โครงสร้างอย่างไร ไม่ได้เป็นปัญหา แต่ถือว่าเป็นความท้าทายครับ


My Blog

By: pepporony
ContributorAndroid
on 9 October 2013 - 08:39 #639067

มาร์ติน ดาลิงค์~

มาร์ตินที่รัก :D

By: boatboat001
iPhoneWindows
on 9 October 2013 - 12:41 #639258
boatboat001's picture

ใครอยากลองเล่น Hadoop ไปลอง Hortonworks Sandbox ได้เลยฮะ แทบไม่ต้องติดตั้งอะไรเลย Hortonworks Sandbox

By: Zeball
iPhoneWindows PhoneAndroidUbuntu
on 9 October 2013 - 16:57 #639413

ต้นกำหนดของ MapR -> ต้นกําเนิดของ MapR

ใช่หรือเปล่าครับ

By: mk
FounderAndroid
on 9 October 2013 - 17:50 #639443 Reply to:639413
mk's picture

แก้แล้ว ขอบคุณครับ

By: btoy
ContributorAndroidWindows
on 9 October 2013 - 17:17 #639420
btoy's picture

มันเป็นงานที่ท้าทายและน่าสนุกจริงเลยแฮะ


..: เรื่อยไป