Twitter ยังคงเข้าซื้อบริษัทมาเสริมทัพในธุรกิจของตนเองอย่างต่อเนื่อง ล่าสุดเป็น Lucky Sort ที่มีผลงานด้านการวิเคราะห์ และเก็บข้อมูลขนาดใหญ่ พร้อมทั้งพล็อตเป็นกราฟให้เข้าใจได้ง่าย
ผลงานเด่นของ Lucky Sort คือเครื่องมือชื่อว่า TopicWatch สำหรับเก็บข้อมูลจากทวีต และนำมาพล็อตเป็นกราฟแบ่งตามเทรนด์ต่างๆ ได้ โดยจะออกมาหน้าตาแบบนี้ และยังถูกนำไปใช้ในแอพวิเคราะห์หุ้นอย่าง StockTwits อีกด้วย
ที่มา - The Next Web
IBM ประกาศลงทุนเพื่อพัฒนาเทคโนโลยี flash storage เป็นจำนวนเงินถึง 1 พันล้านดอลลาร์ โดยให้เหตุผลว่า flash เป็นเทคโนโลยีเก็บข้อมูลแห่งอนาคต และจะพลิกโฉมการเก็บข้อมูลของตลาดไอทีองค์กรอย่างสิ้นเชิง
IBM บอกว่าประสิทธิภาพและราคาของ flash อยู่ในระดับที่ใกล้นำมาใช้งานในระบบไอทีองค์กรอย่างจริงจัง โดยเฉพาะในงานที่ต้องการ transaction มากๆ การเปลี่ยนมาใช้ flash ช่วยให้อ่านข้อมูลมาวิเคราะห์ได้เร็วขึ้น ในขณะเดียวกันก็ตอบโจทย์เรื่องการใช้พลังงานที่ลดลง
นอกจากการวิจัยในเทคโนโลยี flash ตามปกติแล้ว IBM ยังจะเปิดศูนย์วิจัยพิเศษอีก 12 แห่งทั่วโลก เพื่อทดสอบโซลูชันระบบคอมพิวเตอร์ที่ใช้ flash ของตัวเองกับข้อมูลจริงของลูกค้า และวัดผลประสิทธิภาพที่เพิ่มขึ้นจากระบบแบบใหม่ด้วย
ที่มา - IBM
แนวทาง MapReduce ถูกเสนอครั้งแรกในรายงานของกูเกิลและได้รับความสนใจอย่างสูงจากทั้งงานวิชาการและภาคธุรกิจ ที่แปลงเป็นคำว่า BigData ขายกันทั่วไปทุกวันนี้ แต่เทคโนโลยี MapReduce ถูกจดสิทธิบัตรไว้จำนวน 10 ฉบับแยกจากกัน โดยที่ผ่านมาแม้จะมีการเขียนซอฟต์แวร์โอเพนซอร์สอย่าง Hadoop โดยไม่ได้ขออนุญาตจากกูเกิล แต่ก็ไม่มีการดำเนินคดีใดๆ และวันนี้กูเกิลก็ประกาศสัญญาว่าจะไม่ใช้สิทธิบัตรเหล่านั้นนำเดินคดีอย่างเป็นทางการกับโครงการโอเพนซอร์สทุกโครงการ
ด้วยประกาศนี้ โครงการเช่น Hadoop ทั้งนักพัฒนา, ผู้จัดจำหน่าย, และผู้ใช้จะปลอดภัยจากการถูกฟ้องด้วยสิทธิบัตรทั้งสิบฉบับ ตราบใดก็ตามที่หน่วยงานเหล่านี้ยังไม่ได้ฟ้องบริการใดๆ ของกูเกิล หรือทำกำไรจากการฟ้องร้องกูเกิล
ประกาศนี้จะมีผลผูกพันแม้กูเกิลจะโอนสิทธิบัตรไปให้บริษัทอื่นใช้งานต่อแล้วก็ตาม ดังนั้นถ้าใครมีไอเดียอยากทำโครงการเกี่ยวกับ MapReduce แล้วกลัวจะถูกฟ้อง ทางออกง่ายๆ ก็คือทำเป็นโครงการโอเพนซอร์ส ก็จะได้รับความคุ้มครองตามประกาศนี้ทันที
ที่มา - Google Open Source Blog, Open Patent Non-Assertion Pledge
อินเทลประกาศเปิดตัว Hadoop เฟรมเวิร์ค MapReduce โอเพนซอร์สรุ่นพิเศษของตัวเอง ที่ใช้ฟีเจอร์ของชิป Xeon อย่างเต็มประสิทธิภาพ ด้วยการใช้ชุดคำสั่งพิเศษอย่าง AES-NI หรือ SSE เพื่อเพิ่มประสิทธิภาพการเข้ารหัสและการบีบอัด รวมถึงการจูนระบบไฟล์ HDFS ให้ทำงานเข้ากับ Intel SSD และการ์ด 10Gbps ของอินเทลได้ดีขึ้น
Hadoop เป็นซอฟต์แวร์ในกลุ่มการประมวลผลข้อมูลขนาดใหญ่ (Big Data) ที่ได้รับความนิยมจากภาคธุรกิจจำนวนมาก บริษัทขนาดใหญ่อย่าง EMC ไปจนถึงบริษัทสตาร์ตอัพจำนวนมาก
อินเทลระบุว่าจะโอเพนซอร์ส Hadoop รุ่นพิเศษของตัวเองออกมาทั้งหมด ดังนั้นเป็นไปได้ว่าแพตซ์ของอินเทลอาจจะได้รับกลับเข้าไปยัง Apache ผู้ดูแลโครงการหลัก แต่ส่วนที่อินเทลขายคือ Intel Manager for Apache Hadoop ที่ช่วยเรื่องการจัดการเครื่อง ซึ่งแนวทางนี้ก็คล้ายกับผู้ผลิตซอฟต์แวร์รายอื่นๆ ที่เน้นการขายเครื่องมือเป็นหลัก แต่ผู้ผลิตรายอื่นนั้นไม่ได้สัญญาว่าจะเปิดซอร์สแพตซ์ของตัวเองออกมา และตัวสัญญาอนุญาตของ Apache ก็ไม่ได้บังคับให้บริษัทต่างๆ ที่นำซอฟต์แวร์ไปพัฒนาต่อต้องโอเพนซอร์สแต่อย่างใด
Cisco ออกรายงาน Cisco Global Cloud Index ประเมินสถานการณ์ของ "ข้อมูล" ที่ศูนย์ข้อมูลทั่วโลกระหว่างปี 2011-2016
ตัวเลขของ Cisco ระบุว่า "ปริมาณ" ข้อมูลในศูนย์ข้อมูลจะเพิ่มขึ้นจากปัจจุบันอีกเกือบ 4 เท่าตัว จาก 2.6ZB (1 ZB = 1 พันล้าน TB) ในปี 2012 เป็น 6.6ZB ในปี 2016 (อัตราเติบโตปีละ 31%)
ที่น่าสนใจคือ "ประเภท" ของข้อมูลในศูนย์ข้อมูลหนึ่งแห่ง ถูกส่งออกไปนอกศูนย์ข้อมูลเพียง 24% เท่านั้น โดย 76% ของข้อมูลทั้งหมดจะวิ่งวนอยู่ภายในศูนย์ข้อมูลเอง (ข้ามระหว่างเซิร์ฟเวอร์กัน) ส่วนตัวเลข 24% ก็ยังแบ่งเป็น 7% เป็นการส่งข้อมูลระหว่างศูนย์ข้อมูลคนละแห่ง (เช่น replication) เหลือเพียง 17% ที่ส่งข้อมูลไปยังผู้ใช้ที่ปลายทางจริงๆ
เมื่อสัปดาห์ที่แล้ว EMC ยักษ์ใหญ่โซลูชันทางด้านธุรกิจได้มาจัดงานสัมมนากึ่งเวิร์คช็อปในประเทศไทยในชื่องาน EMC Forum 2012 ภายใต้คอนเซปของงานว่า "TRANSFORM IT + BUSINESS + YOURSELF" ซึ่งภายในงานจะมีการเวิร์คช็อปในหัวข้อต่างๆ ที่ครอบคลุมผลิตภัณฑ์ของ EMC ยกตัวอย่างที่หลายคนรู้จักได้แก่ VMware หรือ Greenplum เป็นต้น (ถ้าใครยังไม่คุ้นกับ EMC ลองอ่านบทสัมภาษณ์ผู้บริหารก่อนได้)
EMC Forum 2012 ปฏิรูปธุรกิจด้วยเทคโนโลยี
งาน EMC Forum 2012 ในประเทศไทยครั้งนี้จัดเป็นแห่งที่สองต่อจากสิงคโปร์ ด้วยหัวข้อที่เป็นใจความสำคัญของการจัดงานครั้งนี้คือการเชิญชวนให้ฝั่งธุรกิจหันมาสนใจความเปลี่ยนแปลงทางด้านโซลูชันสำหรับองค์กรไปสู่เทคโนโลยีที่หลายบริษัทกำลังให้ความสนใจทั้ง virtualization และระบบกลุ่มเมฆสำหรับองค์กร
ในระหว่างงาน EMC ได้แสดงวิสัยทัศน์อนาคตของโซลูชันองค์กร โดยมีคุณเดวิด เวิร์ท รองประธานฝ่ายโกลบอล เซอร์วิส ประจำ EMC ภูมิภาคเอเชียแปซิฟิก และญี่ปุ่นมาเป็นผู้อธิบายรายละเอียดต่างๆ อีกด้วย
IBM บริษัทแม่เปิดตัวไปตั้งแต่เดือนเมษา แต่เรายังไม่ได้ลงข่าว ดังนั้นพอ IBM ประเทศไทยเปิดตัวบ้างก็ลงรวบยอดเป็นข่าวเดียวไปเลยนะครับ แถวนี้น่าจะมีคนทำ DB2 อยู่พอสมควร
ภาพรวมก็คือ IBM ออกระบบฐานข้อมูล DB2 เวอร์ชันใหม่ที่นับเป็นเวอร์ชัน 10 แล้ว (รวมถึงคลังข้อมูล InfoSphere Warehouse 10 ด้วย) ของใหม่ก็คงไม่ต่างอะไรจากคู่แข่งมากคือเน้นไปที่ Big Data เป็นหลัก สำหรับฟีเจอร์ตาม press มีดังนี้
- ประสิทธิภาพดีกว่า DB2 ของเดิม สูงสุด 3.3 เท่าตัว
- เทคโนโลยีการบีบอัดข้อมูล เพิ่มพื้นที่จัดเก็บได้สูงสุด 90% ทำงานได้เร็วขึ้น 10 เท่า แถมใช้กับฐานข้อมูลของ Oracle ได้ 98%
- การบีบอัดข้อมูลปรับเปลี่ยนได้ตามความสำคัญของข้อมูล และความถี่ในการเรียกใช้ข้อมูลนั้นๆ (อันไหนใช้บ่อยก็บีบน้อยๆ จะได้เรียกใช้เร็วๆ)
- วิเคราะห์ข้อมูลแบบเรียลไทม์ ใช้งานร่วมกับ Hadoop ได้ตามสมัยนิยม รองรับ NoSQL Graph Store และ SPARQL query language
- Time Travel Query สืบค้นและหาความสัมพันธ์ของข้อมูลตามช่วงเวลาต่างๆ ได้ในตัว จากเดิมที่ต้องเขียนโค้ดวิเคราะห์กันเอง
ที่มา - IBM
Blognone รายงานข่าวเรื่อง Big Data มาพอสมควร พอดีเมื่อวันก่อน Dell ประเทศไทยมีแถลงข่าวเรื่อง Storage + Big Data (ซึ่งเป็นเรื่องที่เกี่ยวข้องกัน) ผมเลยไปฟังหน่อยเผื่อว่าจะได้ภาพรวมของตลาด Big Data ในประเทศไทยนะครับ
การนำเสนอของ Dell เริ่มจากโชว์คำพยากรณ์ของ Gartner ที่ประเมินว่าอัตราการเติบโตของข้อมูลในองค์กรจะเติบโตสูงมากในอนาคต ตัวเลขปีล่าสุดคือ 47 เท่าในปี 2011 (ข้อมูลที่สร้างในปี 2011 คิดเป็น 1.8 ล้านล้าน GB)
ในแง่การเก็บข้อมูลระดับคอนซูเมอร์ก็เรื่องนึง แต่ในระดับองค์กร ต่อไปความสามารถในการนำข้อมูลมาใช้งานจะเป็นตัวชี้วัดความสามารถในการแข่งขันขององค์กรได้ องค์กรไหนที่นำข้อมูล (ที่มีอยู่แล้ว) มาสกัดออกเป็นยุทธศาสตร์ได้ก็จะประสบความสำเร็จ
foursquare ได้อัพเดทแอพสู่รุ่น 5.0 โดยในรุ่นนี้อินเตอร์เฟสทั้งหมดได้ถูกดีไซน์ใหม่ให้ดูเรียบง่าย สะอาดสะอ้าน และเช็คอินได้ง่ายขึ้นกว่าที่เคย ในหน้าแรกจะแสดงความเคลื่อนไหวของเพื่อนๆ ในรูปแบบ Timeline คล้ายเดิม แต่เราสามารถกด Like และคอมเม้นต์การเช็คอินของเพื่อน หรือสถานที่ใดๆ ได้ด้วย
ส่วนหลักที่ถูกปรับปรุงไปมากอีกอย่างคือ "Explore" ที่จะสามารถค้นหาสถานที่ที่น่าสนใจรอบๆ ตำแหน่งปัจจุบันของเรา สามารถเลือกให้แบ่งตามหมวดหมู่, สถานที่ที่เป็นที่นิยม (Top Pick) หรือสถานที่แสดงสถานที่ที่มีการเช็คอินอยู่จำนวนมาก (Trending) โดยเมื่อเรา Explore ในเวลาต่างๆ ข้อมูลที่ถูกแสดงก็จะต่างกันไปด้วย เช่นช่วงเที่ยงจะแสดงร้านอาหารที่น่าสนใจ ช่วงดึกจะแสดงบาร์ หรือสถานที่เที่ยวกลางคืน
BigQuery เป็นบริการฐานข้อมูลขนาดใหญ่ของกูเกิล มันใช้หลักการ big data ที่สร้างตารางข้อมูลที่ไม่ซับซ้อนแต่มีขนาดใหญ่มากๆ (ระดับ 1 พันล้านแถว) ซึ่งต่างไปจากแนวทางของ relational database มาก
BigQuery คือการออกแบบคำสั่งคล้ายๆ SQL (แต่ฟีเจอร์ไม่ครบเท่า SQL) เพื่อให้ค้นหรือวิเคราะห์ข้อมูลในตารางได้ง่ายๆ และกูเกิลทำหน้าเว็บให้เราป้อนคำสั่ง BigQuery แล้วรับข้อมูลกลับได้จากหน้าเว็บเลย (อัพโหลด/ดาวน์โหลดข้อมูลผ่าน CSV)
BigQuery จะคิดค่าบริการตามอัตราการใช้งานเหมือน Google App Engine (แต่มันไม่ได้อยู่ภายใต้ App Engine) โดยคิดพื้นที่เก็บข้อมูล $0.12 ต่อ GB และคิดค่า query ข้อมูลนับเป็น GB ละ $0.035
กูเกิลเปิดตัว BigQuery ครั้งแรกในงาน Google I/O 2010 เมื่อประมาณ 2 ปีก่อน และเปิดทดสอบรุ่นเบต้าเมื่อเดือนพฤศจิกายน 2011 ที่ผ่านมากูเกิลบอกว่ามีบริษัทวิเคราะห์ข้อมูลหลายแห่งนำข้อมูลมาวิเคราะห์ผ่าน BigQuery
ที่มา - Google Enterprise
เมื่อเดือนที่แล้ว ผมมีโอกาสได้นั่งคุยกับคุณนฐกร พจนสัจ ผู้จัดการประจำประเทศไทยของ EMC ที่มาแถลงข่าวเรื่องผลประกอบการปี 2011 และทิศทางการทำธุรกิจของ EMC ในประเทศไทยปี 2012 ซึ่งก็ได้ข้อมูลเกี่ยวกับสภาพตลาดไอทีองค์กรในประเทศไทยมาพอสมควร เลยสรุปเนื้อหามาบางส่วนครับ
(จริงๆ สัมภาษณ์ตั้งนานแล้วแต่เพิ่งมีเวลาเรียบเรียง)
ซูเปอร์คอมพิวเตอร์ Watson ของไอบีเอ็มเริ่มขยายงานสู่กลุ่มธุรกิจอื่นเพิ่มเติม จากก่อนหน้านี้ได้ลูกค้ารายแรกเป็นหมวดประกันภัย-สาธารณสุข โดยคราวนี้ไอบีเอ็มได้ Citigroup มาเป็นลูกค้าของ Watson ในกลุ่มบริการการเงินการลงทุนรายแรก
Citigroup กล่าวว่าจะใช้ Watson ในการประมวลผลวิเคราะห์ความเสี่ยง ความต้องการของลูกค้า เพื่อให้สามารถออกแบบแผนการลงทุนที่เหมาะสมกับลูกค้าที่สุด ซึ่งงานชนิดปัจจุบันใช้คนในการพิจารณาและอาจเกิดการหลุดหลงในบางประเด็นได้ แต่ Watson นั้นสามารถประมวลผลข้อมูลที่เกี่ยวกับการเงินได้รวดเร็วและแม่นยำกว่ามาก
Manoj Saxena ผู้ดูแลการนำ Watson มาใช้ในเชิงพาณิชย์ของไอบีเอ็มกล่าวว่าการเข้าสู่โลกการเงินของ Watson ถือเป็นงานใหญ่อีกครั้งของไอบีเอ็ม ซึ่งจะช่วยสร้างความแตกต่างให้กับลูกค้าได้เพราะมันไม่ใช่การขายซอฟต์แวร์ทั่วไป แต่เป็นการขายคำตอบที่เหมาะสมที่สุดให้ลูกค้าผ่านการรวบรวมข้อมูลใหม่จำนวนมากที่ไหลเข้ามาทุกวันในโลกการเงิน อย่างไรก็ตามความสามารถวันนี้ของ Watson ยังคงจำกัดในการจัดพอร์ตการลงทุนมากกว่าการช่วยซื้อขายหุ้นที่ต้องใช้ข้อมูลที่เรียลไทม์มากกว่ามาก
ไอบีเอ็มคาดว่า Watson จะสร้างรายได้ให้ในส่วนธุรกิจซอฟต์แวร์วิเคราะห์ข้อมูลราว 2.65 พันล้านดอลลาร์ในปี 2015
ที่มา: Bloomberg
Greenplum เป็นบริษัทลูกของ EMC ที่ทำซอฟต์แวร์สำหรับประมวลผลด้าน Data Warehouse/Big Data โดยเฉพาะ บริษัทมีผลิตภัณฑ์หลักในมือ 2 ตัวคือ
- Greenplum Database มันคือ PostgreSQL เวอร์ชันปรับแต่งสำหรับการประมวลผลแบบขนานหลายๆ ชุด (massively parallel processing - MPP) เอาไว้ประมวลผลข้อมูลที่เป็น structured data โดย Greenplum โฆษณาว่ามันทำงานได้เร็วกว่า RDBMS ทั่วๆ ไป 10-100 เท่า
- Greenplum HD มันคือ Hadoop เวอร์ชันของ Greenplum เอง เอาไว้ประมวลผลข้อมูลแบบ unstructured data โดยปรับแต่งให้ทำงานกับระบบ storage ของ EMC ได้ดีขึ้น
ล่าสุดทาง EMC ได้ออก Greenplum Database เวอร์ชันใหม่ 4.2 ที่เชื่อมการทำงานของฝั่ง Database เข้ากับฝั่ง Hadoop ได้ดีกว่าเดิม ผลคือประหยัดแรงประมวลผลไปได้มาก เพราะงานจะอยู่ใน Hadoop ที่ทำผ่านเทคนิค MapReduce
ลูกค้าของ Greenplum ส่วนใหญ่เป็นองค์กรขนาดใหญ่ และโมเดลธุรกิจของ Greenplum มีทั้งการขายเฉพาะซอฟต์แวร์ และการขายเซิร์ฟเวอร์สำเร็จรูป (appliance) ที่ติดตั้งซอฟต์แวร์มาให้เรียบร้อย
ผมไม่แน่ใจว่าบ้านเรามีลูกค้าของ Greenplum มากน้อยแค่ไหน แต่ไหนๆ มีข่าวออกซอฟต์แวร์รุ่นใหม่ก็เอามาลงเสียหน่อย จะได้รับรู้ทิศทางของโลก Big Data กันมากขึ้นครับ
ที่มา - Greenplum, The Register
ราชาแห่งวงการ Big Data คือ Apache Hadoop และที่ผ่านมาเราก็เห็นบริษัทมากมายที่เชื่อมระบบของตัวเองให้ทำงานร่วมกับ Hadoop ได้
ซอฟต์แวร์รายล่าสุดที่ประกาศตัวในเรื่องนี้คือ Spring เฟรมเวิร์คยอดนิยมในภาษาจาวา (ปัจจุบันเป็นของ VMware) ก็เปิดตัว Spring Hadoop ที่ช่วยให้แอพที่เขียนด้วย Spring สามารถคำนวณ MapReduce ใน Hadoop ได้ และเชื่อมต่อไปยังบริการอื่นๆ อย่าง Hive และ Pig ได้ด้วย
ทางผู้บริหารของ Spring ให้สัมภาษณ์ว่า Spring Hadoop จะช่วยเปิดประตูให้แอพจาวาที่อยู่ในโลกองค์กร สามารถเชื่อมต่อกับ Apache Hadoop ที่เป็นเทรนด์ใหม่ของซอฟต์แวร์องค์กรขนาดใหญ่ได้
คนที่ติดตามวงการ Big Data คงทราบดีว่าซอฟต์แวร์มาตรฐานของวงการคือ Hadoop ซึ่งตัวซอฟต์แวร์เป็นโอเพนซอร์ส แต่ก็มีบริษัทหลายแห่งพัฒนาเวอร์ชันเชิงพาณิชย์ให้บริการ
ยักษ์ใหญ่อย่างไมโครซอฟท์เองก็หนุน Hadoop เต็มตัว โดยถึงกับยกเลิกแผนพัฒนาซอฟต์แวร์มาแข่ง และเปลี่ยนมาสนับสนุน Hadoop แทน ที่ผ่านมาเราเห็นข่าวผลิตภัณฑ์ของไมโครซอฟท์หลายตัวอย่าง SQL Server และ Windows Azure สนับสนุน Hadoop คราวนี้มันเดินทางมาถึง Excel แล้ว
งานนี้ไมโครซอฟท์จับมือกับบริษัท Hortonworks ซึ่งเป็นผู้สร้าง Hadoop ตั้งแต่แรก (แยกออกมาจาก Yahoo! ในภายหลัง) พัฒนาตัวเชื่อมต่อ ODBC เชื่อมต่อระหว่าง Apache Hive (ระบบ data warehouse ที่ใช้ร่วมกับ Hadoop) เพื่อนำข้อมูลมาวิเคราะห์ต่อ Excel
นอกจากนี้ไมโครซอฟท์ก็กำลังพัฒนาเฟรมเวิร์คภาษาจาวาสคริปต์ ที่ช่วยให้โปรแกรมภาษาจาวาสคริปต์สามารถเชื่อมต่อกับ Hadoop ได้เช่นกัน
ที่มา - InfoWorld
ทิศทางที่ชัดเจนในโลกไอทีองค์กรขณะนี้คือ "Big Data" หรือการประมวลผลข้อมูลปริมาณมหาศาล ซึ่งบริษัทขนาดใหญ่อย่าง IBM หรือ Oracle ก็ลงมาเล่นในตลาดนี้กันแล้ว
บริษัทล่าสุดที่เข้ามาร่วมวงคือ Cray เจ้าพ่อแห่งซูเปอร์คอมพิวเตอร์ ที่ประกาศตั้งฝ่ายใหม่ชื่อ YarcData ขึ้นมาลุยตลาดเกิดใหม่นี้โดยเฉพาะ
ยุทธศาสตร์นี้ถือว่าน่าสนใจเพราะ Cray ขายเครื่องคอมพิวเตอร์สำหรับประมวลผลในระดับสูงอยู่ก่อนแล้ว และบริษัทเองก็มีรากฐานในสายธุรกิจนี้อยู่บ้าง (เดิมทีเรียกฝ่าย Knowledge Management) ซึ่งการตั้งฝ่ายใหม่ครั้งนี้ Cray จะนำเทคโนโลยีจากโลกซูเปอร์คอมพิวเตอร์เข้าสู่ตลาดองค์กร และให้บริการวิเคราะห์ข้อมูลที่ครบวงจรมากขึ้น
YarcData ยังจะได้ Arvind Parthasarathi อดีตผู้บริหารของบริษัท Informatica Corporation ที่เชี่ยวชาญด้านการบริหารจัดการข้อมูล มานั่งเป็นหัวหน้าฝ่ายด้วย
เมื่อต้นปีที่แล้ว หลายคนคงจำข่าว IBM Watson ซูเปอร์คอมพิวเตอร์ที่ชนะมนุษย์ในการแข่งเกมโชว์ Jeopardy! กันได้
การนำ Watson มาแข่งเกมโชว์ไม่ได้แค่การประชาสัมพันธ์ความสามารถของ IBM แต่เป็นหนึ่งในแผนการทำตลาดระยะยาวของ Watson เพราะความสามารถด้านการวิเคราะห์ข้อมูลขนาดมหาศาล (big data) ของมันสามารถนำมาใช้ในธุรกิจต่างๆ ได้มากมาย เช่น ประกันภัยหรือสาธารณสุข
Manoj Saxena ผู้บริหารฝ่าย Watson Solutions ของ IBM ให้สัมภาษณ์ว่า ตอนนี้ IBM กำลังเริ่มทดสอบระบบของ Watson กับลูกค้าบางรายแล้ว โดยลูกค้ารายแรกคือบริษัทประกันภัย WellPoint และจะมีลูกค้าทดสอบรุ่นเบต้าในอุตสาหกรรมประกันภัยและประกันสุขภาพตามมาอีกจำนวนหนึ่งในเร็วๆ นี้
Manoj Saxena ให้สัมภาษณ์ว่าการวิเคราะห์ข้อมูล (data analytics) ไม่ใช่เรื่องใหม่ แต่การวิเคราะห์ข้อมูลจำนวนมหาศาลเป็นเรื่องใหม่ เพราะปัจจุบันการสร้าง/ผลิตข้อมูล (data producing) ง่ายขึ้นมาก และ 90% ของข้อมูลในปัจจุบันเพิ่งถูกสร้างขึ้นมาภายใน 2 ปีนี้เอง ทำให้เป็นโอกาสตลาดของ Watson และระบบวิเคราะห์ข้อมูลรุ่นใหม่ๆ จะได้แจ้งเกิด
ที่มา - Fortune
ข่าวนี้ต่อเนื่องจากข่าวเก่า ออราเคิลร่วมวง NoSQL ออกผลิตภัณฑ์ใหม่ Oracle Big Data Appliance จะให้รู้เรื่องต้องย้อนกลับไปอ่านก่อนครับ
สรุปสั้นๆ ก็คือ ออราเคิลเริ่มขายเซิร์ฟเวอร์สำเร็จรูป Big Data Appliance สำหรับงานประมวลผลจำพวก NoSQL/Big Data แล้ว
โครงการโอเพนซอร์สอย่าง Hadoop กลายเป็นมาตรฐานของอุตสาหกรรมไอที โดยเฉพาะการประมวลผลข้อมูลขนาดใหญ่ (big data) มากขึ้นเรื่อยๆ
เดิมทียักษ์ใหญ่อย่างไมโครซอฟท์มีแผนจะทำซอฟต์แวร์ big data ของตัวเองชื่อ "Dryad" (LINQ to HPC) ควบคู่ไปกับการสนับสนุน Hadoop ในผลิตภัณฑ์ของตัวเอง (ข่าวเก่า 1, ข่าวเก่า 2)
แต่ล่าสุดทีมของไมโครซอฟท์ประกาศบนบล็อก TechNet แล้วว่าจะหยุดพัฒนา Dryad แล้ว โดยจะคงไว้ในสถานะพรีวิวบน HPC Pack 2008 R2 SP3 เท่านั้น จากนี้ต่อไปไมโครซอฟท์จะมุ่งเน้นไปที่ Apache Hadoop แทน โดยโฟกัสกับการทำงานทั้งบน Windows Server และ Windows Azure
ใครที่สนใจเรื่อง big data ที่จะเป็นกระแสในเร็วๆ นี้ ได้เวลาหัดใช้ Hadoop กันแล้วนะครับ
ที่งาน Oracle OpenWorld 2011 ยักษ์ใหญ่แห่งวงการฐานข้อมูลอย่างออราเคิล ก็เปิดตัว "แนวรบ" ใหม่ของบริษัทที่จะมาลุยตลาด NoSQL/Big Data ที่ได้รับความนิยมมากขึ้นเรื่อยๆ ในช่วงหลัง (คู่แข่งอย่าง IBM ลุยไปก่อนแล้ว)
พระเอกของงานคือ "Oracle Big Data Appliance" ชุดเซิร์ฟเวอร์+ซอฟต์แวร์ครบวงจรสำหรับงานสาย Big Data (เช่น การประมวลผลข้อความหรือรูปภาพบนอินเทอร์เน็ตจำนวนมากๆ) เซิร์ฟเวอร์ตัวนี้จะเหมือนเซิร์ฟเวอร์เฉพาะทางตัวอื่นๆ ของออราเคิล (เช่น Oracle Database Machine) คือติดตั้งซอฟต์แวร์ของออราเคิลมาเป็นชุด ปรับแต่งมาให้เรียบร้อยพร้อมใช้งาน










