Tags:
Node Thumbnail

เมื่อปีก่อนผมเคยเขียนเกี่ยวกับ Caffeine ระบบดัชนีเว็บ (web index) รุ่นใหม่ของกูเกิลไปบ้าง (ข่าวเก่า กูเกิลเปิดให้ทดสอบ Caffeine ระบบดัชนีเว็บรุ่นใหม่)

ตอนนี้ Caffeine เสร็จสมบูรณ์แล้ว และกูเกิลก็นำมันมาใช้งานจริงแล้วในศูนย์ข้อมูลทุกแห่ง และกูเกิลทุกภาษา

กูเกิลบอกว่าระบบดัชนีแบบเก่า เก็บข้อมูลเว็บเป็นเลเยอร์ที่มีความถี่ในการอัพเดตไม่เท่ากัน (ดูภาพประกอบ) ส่วนของเลเยอร์หลักมีขนาดใหญ่มาก และการอัพเดตข้อมูลทั้งหมดของเลเยอร์หลักต้องใช้เวลาหลายสัปดาห์ ทำให้ข้อมูลในดัชนีของกูเกิลเก่าเกินไป เริ่มล้าสมัยสำหรับความต้องการของผู้ใช้ยุคนี้แล้ว

แต่ Caffeine จะแยกดัชนีเป็นส่วนๆ เป็นอิสระต่อกัน เมื่อส่ง crawler วิ่งไปดูดข้อมูลแล้ว สามารถอัพเดตลงในดัชนีได้ทันที ทำให้ข้อมูลในผลการค้นหาทันสมัย แถมรองรับข้อมูลแบบเรียลไทม์อย่าง Twitter/Facebook ได้ กูเกิลบอกว่า Caffeine มีขนาดข้อมูลประมาณ 100 PB (เพตะไบต์) ต่อหนึ่งฐานข้อมูล

ที่มา - Google Blog, Search Engine Land

No Description

Get latest news from Blognone

Comments

By: gotobanana
iPhoneAndroidBlackberrySymbian
on 9 June 2010 - 10:54 #182642
gotobanana's picture

100GB/1db
สุดๆๆ

By: dq-pb
AndroidWindows
on 9 June 2010 - 13:55 #182661

ดูจากภาพประกอบแล้วรู้สึกว่า
index แบบเก่าทำให้ติดขัดเหมือนมีอะไรมาขวาง ทำให้ช้าลง
แต่ Caffeine ทำให้ออกอาการเมายา มากกว่าแฮะ

By: zantales
Android
on 9 June 2010 - 13:54 #182662
zantales's picture

แล้วมีกี่ฐานข้อมูลละเนี่ย ไม่อยากจะคิด 0.0

By: gbweb
iPhone
on 9 June 2010 - 14:15 #182663

ทำมาเพื่อ social media จริงๆ

By: natt_han
ContributoriPhoneAndroid
on 9 June 2010 - 14:17 #182664

ต่อหนึ่งฐานข้อมูลนี่คือยังไงเหรอครับ แล้วมีกี่ฐาน แยกยังไง

By: bean3g
Windows PhoneUbuntu
on 9 June 2010 - 14:19 #182665

แบบเดิมเป็น Layer 2D
แบบใหม่เป็น Layer 3D

By: kittipat
ContributorAndroidUbuntu
on 9 June 2010 - 14:36 #182668

กูเกิลบอกว่า Caffeine มีขนาดข้อมูลประมาณ 100 GB ต่อหนึ่งฐานข้อมูล

แปลผิดนะครับ ในที่มาบอกว่า 100 million gigabytes = 100*10^6 GB = 100 PB

By: mk
FounderAndroid
on 9 June 2010 - 19:10 #182712 Reply to:182668
mk's picture

โอ้ แก้ไขแล้วครับ

By: azx
iPhoneWindows
on 26 July 2010 - 13:38 #182684
azx's picture

100 PB ต่อหนึ่งฐานข้อมูล มันยังไงครับ

By: kittipat
ContributorAndroidUbuntu
on 9 June 2010 - 19:11 #182713

มีหลายคนพูดถึงขนาดข้อมูลต่อหนึ่งฐานข้อมูล ผมไปพยายาม google "google caffeine" มาแต่ก็ไม่ได้ข้อมูลทางเทคนิคอะไรเพิ่มเลย คาดว่าก็คงจะเป็นความลับของบริษัท แต่จากการอ่านที่มาโดยละเอียดและความรู้เกี่ยวกับการทำ search engine ที่พอมีอยู่บ้าง ผมขอตอบว่าคุณ mk เขียนข่าวไม่ตรงครับ จริงๆแล้วควรจะเขียนว่า

ฐานข้อมูลของ Caffeine มีขนาดเกือบ 100 PB (100 ล้าน GB)

เพราะใน Google Blog เขียนว่า

Caffeine takes up nearly 100 million gigabytes of storage in one database

แปลตรงๆว่า "Caffeine ใช้พื้นที่เกือบ 100 ล้าน GB ในฐานข้อมูล(หนึ่ง)" คำว่า one ไม่ได้มีนับสำคัญอะไร มีแค่ให้ถูก syntax ภาษาอังกฤษ

By: ayeweb
Android
on 9 June 2010 - 21:01 #182736
ayeweb's picture

โห นัก seo ทั้งหลาย

By: slotpro
iPhone
on 9 June 2010 - 21:11 #182743

ขอบคุณสำหรับข้อมูล :)

By: kurodo99
iPhoneWindowsIn Love
on 9 June 2010 - 21:12 #182746

100 ล้าน GB

โอ้ว

By: trendy
Android
on 10 June 2010 - 00:44 #182760

no comment

By: shikima
Windows PhoneAndroidUbuntu
on 10 June 2010 - 01:29 #182804

ดีแล้วจะได้เพลาๆ SEO ลงไปบ้าง เน้นเนื้อหากันดีกว่า

By: OXYGEN2
ContributoriPhoneAndroidWindows
on 6 November 2011 - 02:39 #351123
OXYGEN2's picture

แสดงความคิดเห็นผิดอัน -_-"


oxygen2.me, panithi's blog

Device: ThinkPad T480s, iPad Pro, iPhone 11 Pro Max, Pixel 6