Tags:
Node Thumbnail

IBM เปิดตัวแพลตฟอร์มวิเคราะห์ข้อมูลสำหรับภาคธุรกิจ Watson Analytics ให้ใช้งานฟรี (มีโมเดลหาเงินแบบ freemium จากฟีเจอร์เพิ่มเติม) โดยองค์กรสามารถนำข้อมูลต่างๆ มาใส่ Watson เพื่อให้ช่วยวิเคราะห์และพยากรณ์ให้ได้

ตอนนี้ Watson Analytics ยังไม่เปิดให้ทดลองใช้งาน แต่ IBM คุยว่าการใช้ Watson Analytics ไม่จำเป็นต้องเตรียมข้อมูลให้พร้อมหรือมีทักษะการวิเคราะห์เหมือนกับซอฟต์แวร์วิเคราะห์อื่นๆ ในท้องตลาด มันถูกออกแบบมาให้ใช้งานได้ง่ายและรวดเร็ว แถมยังรองรับคำถามที่เป็นภาษาธรรมชาติ เช่น Which deals are most likely to close? หรือ What are the key drivers of my product sales? ได้เลย

Tags:

ในช่วงเช้าที่การประชุม Internet Governance Forum ครั้งที่ 9 ประจำปี 2014 ณ กรุงอิสตันบูล ประเทศตุรกี หนึ่งในหัวข้อการสนทนาเป็นเรื่องของเทคโนโลยีอินเทอร์เน็ตกับการหาจุดสมดุลระหว่างข้อมูลส่วนบุคคลและการทำตามกฎหมายของประเทศต่างๆ ที่มักจะแตกต่างกัน โดยในหัวข้อดังกล่าวนี้มีตัวแทนจากภาคธุรกิจเข้าร่วมเป็นส่วนใหญ่ (เช่น AT&T, Deutsche Telekom, Oracle เป็นต้น)

Tags:
Node Thumbnail

อินเทลประกาศความร่วมมือกับ Michael J. Fox Foundation for Parkinson's Research (ก่อตั้งโดย Michael J. Fox นักแสดงชื่อดังที่ป่วยเป็นโรคพาร์กินสัน) เพื่อนำเทคโนโลยี wearable และ big data เข้ามาช่วยวิเคราะห์พฤติกรรมของผู้ป่วยโรคนี้

Tags:
Node Thumbnail

ช่วงนี้กระแส Big Data กำลังมาแรงในตลาดไอทีองค์กรทั่วโลก แต่องค์กรจำนวนมากก็เจอปัญหาคล้ายๆ กันคือเห็นความสำคัญของ Big Data แต่ยังไม่เห็นภาพชัดเจนว่าจะนำมันมาใช้ประโยชน์กับองค์กรได้อย่างไร

ค่าย Dell ซึ่งเป็นหนึ่งในผู้เล่นของตลาด Big Data จึงทำรายงานสำรวจความเห็นของผู้บริหารฝ่ายไอทีในองค์กรขนาดใหญ่ทั่วโลก 300 แห่ง (แบ่งเป็นอเมริกา 200 แห่ง และประเทศอื่นๆ อีก 100 แห่ง) เพื่อดูว่ามุมมองของคนที่ดูแลด้านไอทีในปัจจุบัน มองเรื่อง Big Data อย่างไรบ้าง

ผมคัดประเด็นที่น่าสนใจมาให้ดูกันดังนี้ครับ

การนำ Big Data มาใช้งาน

Tags:
Node Thumbnail

IBM เปิดตัวซอฟต์แวร์ในกลุ่ม Software Defined Storage (ตามแนวทาง Software Defined Everything หรือ SDx) โดยใช้โค้ดเนมว่า Elastic Storage (ยังไม่มีชื่อทางการค้า แต่จะทำตลาดใต้แบรนด์ SoftLayer)

ซอฟต์แวร์ชุดนี้เป็นผลงานของ IBM Research Labs ที่มีโจทย์ว่าต้องการใช้ประโยชน์จากข้อมูลจำนวนมหาศาลในยุค Big Data โดยต้องบริหารจัดการข้อมูลอย่างอัตโนมัติในอัตราเร็วที่มากพอ และต้นทุนที่ต่ำพอสำหรับการใช้งานจริง อีกทั้งต้องทำงานร่วมกับระบบสตอเรจได้ทุกค่าย

Node Thumbnail

หลังจาก SQL Server 2014 เข้าสถานะ RTM เมื่อวานนี้ไมโครซอฟท์ก็จัดงานเปิดตัวอย่างเป็นทางการ รายละเอียดฟีเจอร์อ่านได้ในข่าวเก่า สามารถดาวน์โหลดรุ่น Express มาใช้งานได้ฟรีเช่นเดิม

ที่น่าสนใจกว่าคือในงานเดียวกัน ไมโครซอฟท์ยังเปิดตัวเครื่องมือวิเคราะห์ข้อมูลใหม่อีก 2 ตัว

Tags:
Node Thumbnail

อินเทลประกาศเข้าซื้อหุ้นในบริษัทซอฟต์แวร์ Cloudera จำนวน 18% คิดเป็นจำนวนเงิน 740 ล้านดอลลาร์ ถือเป็นการลงทุนครั้งใหญ่ที่สุดของอินเทลในบริษัทด้านเทคโนโลยีศูนย์ข้อมูล

Cloudera เป็นบริษัทผู้พัฒนาซอฟต์แวร์ต่อยอดจาก Apache Hadoop ซึ่งเป็นซอฟต์แวร์มาตรฐานในวงการ Big Data โดยใช้ชื่อผลิตภัณฑ์ว่า CDH (Cloudera Distribution Including Apache Hadoop)

หลังจากที่อินเทลเข้ามาถือหุ้น Cloudera จะพัฒนา CDH ให้เหมาะกับเทคโนโลยีของอินเทลในอนาคต ทั้งด้านแฟลช ความปลอดภัย (McAfee) และการเชื่อมต่อ (Intel Fabric) ส่วนอินเทลเองจะหยุดทำ Intel Hadoop (IHP/IDP) และรวมโครงการเข้ากับ CDH แทน

Tags:
Node Thumbnail

เอเอ็มดีย้ายฐานข้อมูลการผลิตและการทดสอบสินค้าจาก Oracle DB ไปยัง Hadoop เพราะประสิทธิภาพและเสถียรภาพของระบบฐานข้อมูลเมื่อข้อมูลมีขนาดใหญ่ๆ มากๆ โดยเอเอ็มดีมีปัญหากับข้อจำกัดกับฐานข้อมูลของออราเคิลที่จำกัดผลการคิวรีไว้ที่ 100,000 ชุด (ที่มาไม่ระบุว่าเอเอ็มดีใช้ฐานข้อมูลรุ่นไหนของออราเคิล) ขณะที่ Hadoop นั้นไม่มีข้อจำกัดแบบนี้ และตอนนี้การคิวรี 99% สามารถทำเสร็จใน 15 นาที ขณะที่การคิวรีเฉลี่ยใช้เวลา 23 วินาที

เอเอ็มดีใช้ Hadoop รุ่นของบริษัท Cloudera ซึ่งในแง่หนึ่ง Cloudera ก็เป็นคู่ค้าของออราเคิลที่จับมือกันมาตั้งแต่ต้นปี 2012

Tags:
Node Thumbnail

โลกของซอฟต์แวร์และเทคโนโลยีเริ่มหมุนไปรับมือกับสิ่งที่เรียกว่า big data กันมากขึ้น ทำให้บทบาทของ data scientist’ หรือคนที่ทำหน้าที่เอาข้อมูลเหล่านี้มาประมวลผลเพื่อที่จะสร้างการคำนวณและวาดแนวโน้มได้อย่างแม่นยำ กลายเป็นสิ่งที่สำคัญมากขึ้นเช่นกัน

ในระยะหลังเราพบเห็นบรรดานักประมวลผลข้อมูลเหล่านี้เริ่มจัดตั้งบริษัท แสวงหาเงินทุน และนำเสนอผลิตภัณฑ์หรือเครื่องมือที่เป็นไปในลักษณะโซลูชั่น หรือชุดของการบริการที่มุ่งจะตอบโจทย์ของบริษัทขนาดใหญ่ที่ต้องการใช้ประโยชน์จากข้อมูลเหล่านี้อย่างเต็มที่

Tags:
Node Thumbnail

ตลาดซีพียูสำหรับเซิร์ฟเวอร์ยังมีความเคลื่อนไหวอยู่เรื่อยๆ ล่าสุดอินเทลได้เปิดตัว Xeon E7 v2 สำหรับเซิร์ฟเวอร์ขนาดใหญ่ (32 ซ็อคเก็ต) ที่เน้นงานด้าน big data โดยเฉพาะ

Xeon E7 v2 จะยังใช้สถาปัตยกรรม Ivy Bridge (ตามชื่อห้อย v2, ถ้า v3 ถึงจะเป็น Haswell) โดยแบ่งเป็น 3 รุ่นย่อยคือ 8800/4800/2800

จุดเด่นของมันคือการรองรับหน่วยความจำปริมาณมากๆ (ซึ่งเป็นสิ่งจำเป็นสำหรับการประมวลผลข้อมูลจำนวนมากๆ ในการทำ in-memory analytics) ซึ่ง Xeon E7 v2 รองรับหน่วยความจำสูงถึง 1.5TB ต่อซ็อคเก็ต, นอกจากนี้ยังมีฟีเจอร์ด้าน I/O คือ Intel Data Direct I/O ช่วยให้การอ่านเขียนข้อมูลจากดิสก์ดีขึ้นถึง 4 เท่าเมื่อเทียบกับ Xeon E7 รุ่นแรก

Node Thumbnail

ไมโครซอฟท์เปิดตัว Power BI (Business Intelligence) for Office 365 ชุดเครื่องมือสำหรับวิเคราะห์ข้อมูลขนาดใหญ่เพื่อภาคธุรกิจ โดยจะเป็นส่วนเสริมของเครื่องมือวิเคราะห์ตัวเลขที่ทุกคนคุ้นเคยอย่าง Excel

Power BI ประกอบด้วยส่วนเสริมของ Excel ในการวิเคราะห์ข้อมูล (query/pivot) ทำชาร์ท ทำแผนที่ visualization (เอนจินเดียวกับ GeoFlow) แต่ก็ยังเชื่อมโยงกับกลุ่มเมฆ ทั้งในแง่การแชร์ข้อมูลกับเพื่อนร่วมงานผ่าน Office 365, การประมวลผลข้อมูลขนาดใหญ่บน Windows Azure และการสร้างรายงานที่สวยงามบนแอพ Windows 8 เพื่อนำเสนอ

Tags:
Node Thumbnail

ที่งาน re:Invent ของอเมซอนปีนี้ นอกจาก WorkSpaces และ Postgresql แล้ว วันนี้ก็มีการเปิดตัว Amazon Kinesis บริการประมวลผลข้อมูลตามเวลาจริงในขนาดใหญ่มาก โดยรับข้อมูลได้สูงสุด 1 เมกกะไบต์ต่อวินาที หรือ 1000 ชุดข้อมูลต่อวินาที

บริการ Amazon Kinesis จะเปิดให้เซ็นเซอร์หรือหน่วยเก็บข้อมูลต่างๆ สามารถใส่ข้อมูลเข้ามาในระบบได้อย่างรวดเร็ว จากนั้นนักพัฒนาจะต้องใช้เครื่องบน EC2 มาดูดข้อมูลไปประมวลผล

Tags:
Node Thumbnail

อธิบายสั้นๆ มันคือคู่แข่งของ Apache Hive ที่พัฒนาโดย Facebook ครับ

อธิบายแบบยาวๆ คือบริษัทแบบ Facebook ที่ต้องยุ่งเกี่ยวกับข้อมูลจำนวนมหาศาลระดับ petabyte มีงานเบื้องหลังที่ต้องดึงข้อมูลเก่าที่เก็บใน data warehouse (ที่เก็บด้วย Hadoop/HFS) มาวิเคราะห์อยู่บ่อยๆ ปัญหาคือระบบคิวรีข้อมูลอย่าง Hive ที่พัฒนาอยู่บนแนวคิด MapReduce นั้นออกแบบโดยเน้นสมรรถภาพโดยรวม (overall throughput) เป็นสำคัญ แต่สิ่งที่ Facebook ต้องการคือระบบคิวรีข้อมูลที่มีการตอบสนองรวดเร็ว (low query latency)

Tags:
Node Thumbnail

เทคโนโลยี Big Data กำลังมาแรงมากขึ้นเรื่อยๆ และซอฟต์แวร์ที่ได้รับการยอมรับว่าเป็นมาตรฐานในวงการแล้วคือ Apache Hadoop (และโครงการที่เกี่ยวข้องอื่นๆ) ซึ่งมีบริษัทมากมายเข้าไปช่วยกันพัฒนากันอย่างเต็มที่

อย่างไรก็ตาม การที่ Hadoop เป็นโครงการโอเพนซอร์สแปลว่ามันยังมีความ "ดิบ" อยู่พอสมควรในการนำมาใช้งานจริง จึงมีบริษัทหน้าใหม่หลายแห่งที่นำ Hadoop มาจัดแพ็กเกจใหม่ ทำระบบติดตั้งและบริหารจัดการ บวกกับฟีเจอร์เสริมอื่นๆ ในลักษณะเดียวกับดิสโทรของลินุกซ์ในอดีต

Tags:
Node Thumbnail

Facebook เป็นเครือข่ายสังคมที่เชื่อมโยง "ความสัมพันธ์" ของผู้คนและวัตถุต่างๆ ซึ่งบริษัทได้ออกแบบแพลตฟอร์ม Open Graph มารองรับฟีเจอร์นี้ (ข่าวเปิดตัวเมื่อปี 2010) ระยะหลัง Facebook จึงมองข้อมูลต่างๆ ในระบบของตัวเองเป็น "กราฟ" (ในความหมายทางคณิตศาสตร์ ไม่ใช้กราฟเส้นแบบราคาหุ้นนะครับ) ไปซะเยอะ

ล่าสุด Facebook ออกมาอธิบายสถาปัตยกรรมเบื้องหลัง Open Graph ที่สามารถประมวลผลข้อมูลกราฟขนาดมหาศาล (Facebook มองไกลถึงระดับ "ล้านล้าน" ความสัมพันธ์)

Tags:
Node Thumbnail

หลายคนคงได้ยินชื่อเสียงของกระบวนการสัมภาษณ์งานกูเกิลที่มีคำถามสุดหินและประลองปัญญา ซึ่งก็ถือเป็นเสน่ห์อย่างหนึ่งของกูเกิลที่ช่วยดึงดูดให้คนเก่งๆ อยากเข้ามาสัมภาษณ์งาน

แต่ Laszlo Bock รองประธานอาวุโสฝ่ายทรัพยากรบุคคลของกูเกิล ให้สัมภาษณ์ว่าจากสถิติของกูเกิลเอง (ที่บ้า big data เป็นทุนอยู่แล้ว) กลับพบว่าคำถามประลองปัญญาเหล่านี้ไม่มีความสัมพันธ์กับประสิทธิภาพของพนักงานที่รับเข้ามาแม้แต่น้อย (Bock ใช้คำว่า "เสียเวลาอย่างสิ้นเชิง" a complete waste of time) ประโยชน์ของมันมีแค่ให้ฝ่ายที่เป็นคนสัมภาษณ์รู้สึกฉลาดเท่านั้น

Tags:
Node Thumbnail

Twitter ยังคงเข้าซื้อบริษัทมาเสริมทัพในธุรกิจของตนเองอย่างต่อเนื่อง ล่าสุดเป็น Lucky Sort ที่มีผลงานด้านการวิเคราะห์ และเก็บข้อมูลขนาดใหญ่ พร้อมทั้งพล็อตเป็นกราฟให้เข้าใจได้ง่าย

ผลงานเด่นของ Lucky Sort คือเครื่องมือชื่อว่า TopicWatch สำหรับเก็บข้อมูลจากทวีต และนำมาพล็อตเป็นกราฟแบ่งตามเทรนด์ต่างๆ ได้ โดยจะออกมาหน้าตาแบบนี้ และยังถูกนำไปใช้ในแอพวิเคราะห์หุ้นอย่าง StockTwits อีกด้วย

Tags:
Node Thumbnail

IBM ประกาศลงทุนเพื่อพัฒนาเทคโนโลยี flash storage เป็นจำนวนเงินถึง 1 พันล้านดอลลาร์ โดยให้เหตุผลว่า flash เป็นเทคโนโลยีเก็บข้อมูลแห่งอนาคต และจะพลิกโฉมการเก็บข้อมูลของตลาดไอทีองค์กรอย่างสิ้นเชิง

IBM บอกว่าประสิทธิภาพและราคาของ flash อยู่ในระดับที่ใกล้นำมาใช้งานในระบบไอทีองค์กรอย่างจริงจัง โดยเฉพาะในงานที่ต้องการ transaction มากๆ การเปลี่ยนมาใช้ flash ช่วยให้อ่านข้อมูลมาวิเคราะห์ได้เร็วขึ้น ในขณะเดียวกันก็ตอบโจทย์เรื่องการใช้พลังงานที่ลดลง

นอกจากการวิจัยในเทคโนโลยี flash ตามปกติแล้ว IBM ยังจะเปิดศูนย์วิจัยพิเศษอีก 12 แห่งทั่วโลก เพื่อทดสอบโซลูชันระบบคอมพิวเตอร์ที่ใช้ flash ของตัวเองกับข้อมูลจริงของลูกค้า และวัดผลประสิทธิภาพที่เพิ่มขึ้นจากระบบแบบใหม่ด้วย

Tags:
Node Thumbnail

แนวทาง MapReduce ถูกเสนอครั้งแรกในรายงานของกูเกิลและได้รับความสนใจอย่างสูงจากทั้งงานวิชาการและภาคธุรกิจ ที่แปลงเป็นคำว่า BigData ขายกันทั่วไปทุกวันนี้ แต่เทคโนโลยี MapReduce ถูกจดสิทธิบัตรไว้จำนวน 10 ฉบับแยกจากกัน โดยที่ผ่านมาแม้จะมีการเขียนซอฟต์แวร์โอเพนซอร์สอย่าง Hadoop โดยไม่ได้ขออนุญาตจากกูเกิล แต่ก็ไม่มีการดำเนินคดีใดๆ และวันนี้กูเกิลก็ประกาศสัญญาว่าจะไม่ใช้สิทธิบัตรเหล่านั้นนำเดินคดีอย่างเป็นทางการกับโครงการโอเพนซอร์สทุกโครงการ

ด้วยประกาศนี้ โครงการเช่น Hadoop ทั้งนักพัฒนา, ผู้จัดจำหน่าย, และผู้ใช้จะปลอดภัยจากการถูกฟ้องด้วยสิทธิบัตรทั้งสิบฉบับ ตราบใดก็ตามที่หน่วยงานเหล่านี้ยังไม่ได้ฟ้องบริการใดๆ ของกูเกิล หรือทำกำไรจากการฟ้องร้องกูเกิล

Tags:
Node Thumbnail

อินเทลประกาศเปิดตัว Hadoop เฟรมเวิร์ค MapReduce โอเพนซอร์สรุ่นพิเศษของตัวเอง ที่ใช้ฟีเจอร์ของชิป Xeon อย่างเต็มประสิทธิภาพ ด้วยการใช้ชุดคำสั่งพิเศษอย่าง AES-NI หรือ SSE เพื่อเพิ่มประสิทธิภาพการเข้ารหัสและการบีบอัด รวมถึงการจูนระบบไฟล์ HDFS ให้ทำงานเข้ากับ Intel SSD และการ์ด 10Gbps ของอินเทลได้ดีขึ้น

Hadoop เป็นซอฟต์แวร์ในกลุ่มการประมวลผลข้อมูลขนาดใหญ่ (Big Data) ที่ได้รับความนิยมจากภาคธุรกิจจำนวนมาก บริษัทขนาดใหญ่อย่าง EMC ไปจนถึงบริษัทสตาร์ตอัพจำนวนมาก

Tags:
Node Thumbnail

Cisco ออกรายงาน Cisco Global Cloud Index ประเมินสถานการณ์ของ "ข้อมูล" ที่ศูนย์ข้อมูลทั่วโลกระหว่างปี 2011-2016

ตัวเลขของ Cisco ระบุว่า "ปริมาณ" ข้อมูลในศูนย์ข้อมูลจะเพิ่มขึ้นจากปัจจุบันอีกเกือบ 4 เท่าตัว จาก 2.6ZB (1 ZB = 1 พันล้าน TB) ในปี 2012 เป็น 6.6ZB ในปี 2016 (อัตราเติบโตปีละ 31%)

ที่น่าสนใจคือ "ประเภท" ของข้อมูลในศูนย์ข้อมูลหนึ่งแห่ง ถูกส่งออกไปนอกศูนย์ข้อมูลเพียง 24% เท่านั้น โดย 76% ของข้อมูลทั้งหมดจะวิ่งวนอยู่ภายในศูนย์ข้อมูลเอง (ข้ามระหว่างเซิร์ฟเวอร์กัน) ส่วนตัวเลข 24% ก็ยังแบ่งเป็น 7% เป็นการส่งข้อมูลระหว่างศูนย์ข้อมูลคนละแห่ง (เช่น replication) เหลือเพียง 17% ที่ส่งข้อมูลไปยังผู้ใช้ที่ปลายทางจริงๆ

Tags:
Node Thumbnail

เมื่อสัปดาห์ที่แล้ว EMC ยักษ์ใหญ่โซลูชันทางด้านธุรกิจได้มาจัดงานสัมมนากึ่งเวิร์คช็อปในประเทศไทยในชื่องาน EMC Forum 2012 ภายใต้คอนเซปของงานว่า "TRANSFORM IT + BUSINESS + YOURSELF" ซึ่งภายในงานจะมีการเวิร์คช็อปในหัวข้อต่างๆ ที่ครอบคลุมผลิตภัณฑ์ของ EMC ยกตัวอย่างที่หลายคนรู้จักได้แก่ VMware หรือ Greenplum เป็นต้น (ถ้าใครยังไม่คุ้นกับ EMC ลองอ่านบทสัมภาษณ์ผู้บริหารก่อนได้)

EMC Forum 2012 ปฏิรูปธุรกิจด้วยเทคโนโลยี

Tags:
Node Thumbnail

IBM บริษัทแม่เปิดตัวไปตั้งแต่เดือนเมษา แต่เรายังไม่ได้ลงข่าว ดังนั้นพอ IBM ประเทศไทยเปิดตัวบ้างก็ลงรวบยอดเป็นข่าวเดียวไปเลยนะครับ แถวนี้น่าจะมีคนทำ DB2 อยู่พอสมควร

ภาพรวมก็คือ IBM ออกระบบฐานข้อมูล DB2 เวอร์ชันใหม่ที่นับเป็นเวอร์ชัน 10 แล้ว (รวมถึงคลังข้อมูล InfoSphere Warehouse 10 ด้วย) ของใหม่ก็คงไม่ต่างอะไรจากคู่แข่งมากคือเน้นไปที่ Big Data เป็นหลัก สำหรับฟีเจอร์ตาม press มีดังนี้

Tags:
Node Thumbnail

Blognone รายงานข่าวเรื่อง Big Data มาพอสมควร พอดีเมื่อวันก่อน Dell ประเทศไทยมีแถลงข่าวเรื่อง Storage + Big Data (ซึ่งเป็นเรื่องที่เกี่ยวข้องกัน) ผมเลยไปฟังหน่อยเผื่อว่าจะได้ภาพรวมของตลาด Big Data ในประเทศไทยนะครับ

การนำเสนอของ Dell เริ่มจากโชว์คำพยากรณ์ของ Gartner ที่ประเมินว่าอัตราการเติบโตของข้อมูลในองค์กรจะเติบโตสูงมากในอนาคต ตัวเลขปีล่าสุดคือ 47 เท่าในปี 2011 (ข้อมูลที่สร้างในปี 2011 คิดเป็น 1.8 ล้านล้าน GB)

ในแง่การเก็บข้อมูลระดับคอนซูเมอร์ก็เรื่องนึง แต่ในระดับองค์กร ต่อไปความสามารถในการนำข้อมูลมาใช้งานจะเป็นตัวชี้วัดความสามารถในการแข่งขันขององค์กรได้ องค์กรไหนที่นำข้อมูล (ที่มีอยู่แล้ว) มาสกัดออกเป็นยุทธศาสตร์ได้ก็จะประสบความสำเร็จ

Pages