Tags:

เคล็ดลับความว่องไวในการค้นหาผ่านกูเกิลคือระบบคอมพิวเตอร์สมรรถนะสูง ซึ่งประกอบด้วยเทคโนโลยีหลายตัวอย่าง MapReduce หรือ GFS แน่นอนว่ากูเกิลเก็บไว้ใช้เองคนเดียว อย่างไรก็ตามมีคนเขียนโปรแกรมที่ทำงานลักษณะเดียวกันออกมา (โดยดูจากเปเปอร์ของกูเกิล) ชื่อว่า Hadoop ซึ่งปัจจุบันอยู่ใต้โครงการ Apache ผมทราบมาบ้างว่าคนแถวๆ นี้ก็เล่น Hadoop กันอยู่หลายคน

Yahoo! เป็นหนึ่งในผู้ใช้ Hadoop รายใหญ่ของโลก (Facebook กับ IBM ก็ใช้) อาจเป็นเพราะต้องไล่กูเกิลให้ทันในเรื่องสมรรถนะ แต่อีกเหตุผลก็คือ Doug Cutting นักพัฒนาหลักของ Hadoop (รวมถึง Lucene และ Nutch) ปัจจุบันมาทำงานกับ Yahoo!

ล่าสุด Yahoo! ประกาศแจกซอร์สโค้ดของ Hadoop เวอร์ชันที่ใช้ภายในบริษัทแล้ว (ใต้ชื่อ Yahoo! Distribution of Hadoop) โดย Yahoo! Hadoop ก็มีแพตช์ต่างๆ เพิ่มมาจาก Apache Hadoop ซึ่ง Yahoo! อ้างว่าได้ปรับปรุงประสิทธิภาพ เสถียรภาพเพิ่มขึ้นมาอีกมาก

Yahoo! Distribution of Hadoop ใช้สัญญาอนุญาตแบบโอเพนซอร์สเหมือนกับ Apache Hadoop ดังนั้นแพตช์ทั้งหลายก็สามารถกลับเข้า Hadoop หลักได้ง่าย

ที่มา - Yahoo! Developer Network Blog

Comments

By: demon69gt
demon69gt's blog
on 11/06/09 8:47 #107818 toggle
demon69gt's picture

ยาฮู ฮาดู๊ป .... อ่านงี้ป่าวคร้าบ

By: tekkasit
ContributorAndroidWindows
tekkasit's blog
on 11/06/09 9:39 #107835 toggle
tekkasit's picture

แล้วทำไมยาฮูไม่แพทช์กลับเข้าไปที่ต้นทางล่ะครับ?

By: wiennat
Writer
wiennat's blog
on 11/06/09 10:06 #107856 Reply to:107835 toggle
By: zerocool
iPhone
zerocool's blog
on 11/06/09 10:34 #107863 Reply to:107835 toggle
zerocool's picture

ผมไม่แน่ใจว่าอย่างนี้เรียกว่าคนละ Branch หรือเปล่านะครับ


That is the way things are.

By: EThaiZone
ContributorSymbian
EThaiZone's blog
on 11/06/09 11:00 #107867 Reply to:107835 toggle
EThaiZone's picture

คิดว่าเพื่อให้เครดิตตัวเองว่าเขาพัฒนาแยกได้ดีมากกว่าของเดิม มั้ง?

By: mk
FounderAndroidRed HatWindows
mk's blog
on 11/06/09 18:42 #107927 Reply to:107835 toggle
mk's picture

บางทีต้นทางเค้าไม่รับครับ อาจจะมีแนวทางที่ไม่ตรงกัน

ตัวอย่างคล้ายๆ กันนี้คือ Novell ที่กินเกาเหลากับ Sun เรื่อง OpenOffice ก็เลยมีโครงการ Go OOo ที่เป็น OOo เวอร์ชันรวมแพตช์ Novell ออกมา

By: nontster
iPhoneAndroidUbuntu
nontster's blog
on 12/06/09 9:11 #108050 Reply to:107835 toggle
nontster's picture

เค้าส่งเข้าไปแล้วนะครับ http://github.com/yahoo/hadoop/blob/54428cc8dd437b4de9efe070e777023ec171a498/YAHOO-CHANGES.txt

ที่เหลือก็อยู่ที่ต้นทางแล้วล่ะว่าจะเอาเข้าไปรวมหรือไม่ จะเลือก patch ของใคร ก็เหมือนที่ mk บอกไว้ครับ

By: SilliCon
Android
SilliCon's blog
on 11/06/09 10:13 #107860 toggle
SilliCon's picture

เพิ่งเคยได้ยินชื่อนี้ครั้งแรก แล้ว Apache Hadoop แตกต่างจาก Apache ธรรมดาตรงไหนครับ

By: icez
ContributoriPhoneAndroid
icez's blog
on 11/06/09 20:42 #107956 Reply to:107860 toggle
icez's picture

Apache เองจริงๆ เป็นชื่อโครงการ opensource software หลายตัวเลยครับ อย่าง Apache Ant นี่ก็ใช่ SpamAssassin ก็อยู่ใน project apache เหมือนกัน

ส่วนถ้าเข้าใจคำว่า Apache เป็น Web Server มันคือ Apache HTTPD (หรือ Apache Web Server) ครับ

By: nontster
iPhoneAndroidUbuntu
nontster's blog
on 12/06/09 9:05 #108049 Reply to:107860 toggle
nontster's picture

Apache = ป้าชุลี Hadoop = นางงามคนหนึ่ง

By: mk
FounderAndroidRed HatWindows
mk's blog
on 12/06/09 9:24 #108053 Reply to:108049 toggle
mk's picture

+1 เท่สุดในรอบวัน

By: ipas
Ubuntu
ipas's blog
on 25/12/10 7:14 #244848 Reply to:108049 toggle
ipas's picture

ชอบครับ ++1

By: nontster
iPhoneAndroidUbuntu
nontster's blog
on 11/06/09 14:44 #107900 toggle
nontster's picture

เลิกยุ่งกับ Hadoop มาสักพักแล้วครับ เนื่องจากงานที่เคยคิดว่าจะเอามาใช้มันเป็นแบบ Realtime ไว้เก็บไฟล์เล็กๆจำนวนมาก ซึ่ง HDFS ของ Hadoop ไม่ได้ถูกออกแบบมาเพื่องานแบบนี้ มันเหมาะกับงานแบบ batch ที่ต้อง process ไฟล์ขนาดใหญ่มากๆอย่างพวก log file ซึ่งใช้ร่วมกับ MapReduce มันถึงเหมาะกับ search engine ซึ่งมีข้อมูลขนาดใหญ่มากๆ ถ้าใครอยากทำบริการพวก log management/analysis ผมว่า Hadoop น่าสนใจมากเลย

มีคนบอกว่างานแบบของผมให้ใช้ Cassandra แทน :) ปล. Cassandra นี่ของ Facebook นะครับ ในขณะที่ Facebook ก็ใช้ Hadoop สำหรับงานบางประเภท