Tags:
Node Thumbnail

ต่อจาก กูเกิลปรับอัลกอริทึมใหม่ ลดอันดับ content farm ทางเว็บไซต์ Wired.com มีโอกาสคุยกับวิศวกรด้านการค้นหาของกูเกิลสองคนคือ Amit Singhal และ Matt Cutts ทำให้เราได้ข้อมูลเบื้องลึกของการปรับอัลกอริทึมครั้งนี้

Amit Singhal อธิบายว่าการปรับระบบดัชนีเว็บตัวใหม่ Caffeine เมื่อกลางปี 2010 ทำให้กูเกิลทำดัชนีเว็บได้เร็วและเยอะขึ้นมาก และได้เว็บพวก content farm ที่เนื้อหาคุณภาพต่ำเยอะตามมาด้วย

ส่วนมาตรการการจัดการกับ content farm กูเกิลพยายามสร้างอัลกอริทึมที่เป็นอัตโนมัติและเป็นวิทยาศาสตร์ แทนการใช้คนเข้าแทรกแซง ขั้นตอนสร้างอัลกอริทึมของกูเกิลคือให้ผู้ใช้ตอบแบบสอบถามจำนวนมาก เต็มไปด้วยคำถามหลายรูปแบบ เช่น คิดว่าเว็บนี้มีโฆษณาเยอะเกินไปหรือไม่, เว็บนี้เป็นของแท้หรือลอกเนื้อหาจากที่อื่นมา ฯลฯ แล้วจึงสร้างกฎทางคณิตศาสตร์ที่ใช้แยกแยะเว็บไซต์เหล่านี้

กูเกิลทดสอบอัลกอริทึมนี้เป็นการภายใน โดยมีรายการของเว็บไซต์ที่ "รู้สึกแน่" ว่าเป็น content farm และไม่เป็น content farm (เช่น Wikipedia หรือ The New York Times) มาทดสอบ นอกจากนี้ยังทดสอบกับคนนอกผ่าน Chrome Extension โดยรายการเว็บจากอัลกอริทึมของกูเกิลเอง ตรงกับการแจ้งของคนนอก 84% ซึ่งทำให้กูเกิลมั่นใจว่าอัลกอริทึมของตัวเองใช้งานได้

อัลกอริทึมต่อต้าน content farm รอบนี้มีรหัสเรียกกันภายในว่า "Panda" ตามชื่อของวิศวกรคนหนึ่งในทีมค้นหา

Wired.com ยังถามประเด็นว่าอัลกอริทึมสำหรับผลการค้นหาของกูเกิล ควรเปิดเผยต่อสาธารณะเพื่อความโปร่งใสหรือไม่ เพราะกูเกิลก็โดนโจมตีว่ารับเงินค่าโฆษณาจากเว็บต่างๆ และอาจทำให้เว็บที่จ่ายค่าโฆษณามีอันดับสูง

กูเกิลยืนยันว่าเงินไม่มีผลต่ออันดับการค้นหา แต่ก็ไม่มีหลักฐานมาพิสูจน์เช่นกัน ส่วนประเด็นเรื่องการเปิดอัลกอริทึม กูเกิลอธิบายว่าในอัลกอริทึมมีปัจจัย (signal) บางอย่างที่เปิดเผยออกไปแล้ว จะมีคนใช้ประโยชน์และโกงอันดับในผลการค้นหาได้ และถ้าในอนาคตเกิดมีอัลกอริทึมที่เปิดเผยออกไป แต่ป้องกันการโกงอันดับได้ กูเกิลก็ยินดีเปิดเผย

Wired.com ถามประเด็น ห้าง JCPenny ทำ Blackhat SEO ว่าทำไมกูเกิลจัดการปัญหาช้า

คำตอบของกูเกิลคือดัชนีเว็บมีขนาดใหญ่มาก ดูแลได้ไม่ทั่วถึง และกูเกิลไม่กล้าลงโทษแรงเพราะเคยโดนเว็บไซต์ในยุโรปไปฟ้องคณะกรรมการของ EU ว่ากูเกิลกีดกันการแข่งขัน เลยถูกโจมตีจากทั้งสองฝั่ง คือฝั่งที่บอกว่ากูเกิลลงโทษแรงเกินไป และฝั่งที่บอกว่ากูเกิลไม่ยอมทำอะไรเลย

ที่มา - Wired

Get latest news from Blognone

Comments

By: polaromonas
ContributorWindows PhoneWindows
on 5 March 2011 - 18:12 #266169

"อัลกอริทึมต่อต้าน content farm รอบนี้มีรหัสเรียกกันภายในว่า "Panda" ตามชื่อของวิศวกรคนหนึ่งในทีมค้นหา"

ชื่อเท่ห์ดีวุ้ย วิศวกรคนนี้ :D

By: CPECHRIS
Windows PhoneWindows
on 5 March 2011 - 18:31 #266171 Reply to:266169
CPECHRIS's picture

กำลังจะมาตอบเลย

ชื่อเต็มๆของเค้าคือ Pandaren Battlemaster หรือเปล่าครับ 555+

By: -Rookies-
ContributorAndroidWindowsIn Love
on 5 March 2011 - 21:08 #266203 Reply to:266171

Pandaren Brewmaster ครับ


เทคโนโลยีไม่ผิด คนใช้มันในทางที่ผิดนั่นแหละที่ผิด!?!

By: hisoft
ContributorWindows PhoneWindows
on 5 March 2011 - 21:12 #266207 Reply to:266203
hisoft's picture

ผมยังจำไม่ได้เลย แสดงว่าเล่นบ่อย O_o

By: -Rookies-
ContributorAndroidWindowsIn Love
on 5 March 2011 - 21:29 #266213 Reply to:266207

เล่นไม่บ่อยครับ ปีนึงเล่นแค่สองสามเดือนเอง (เวลารวมที่ใช้เล่นนะ ;P)


เทคโนโลยีไม่ผิด คนใช้มันในทางที่ผิดนั่นแหละที่ผิด!?!

By: Not Available a...
ContributoriPhoneAndroidWindows
on 5 March 2011 - 22:57 #266226 Reply to:266207
Not Available at this Moment's picture

เฉลี่ยวันละ 6 ชม. !!


ชื่อ : Not Available at this Moment (N/A)

By: hisoft
ContributorWindows PhoneWindows
on 5 March 2011 - 21:12 #266206 Reply to:266171
hisoft's picture

น่าจะใช่นะครับ มีญาติห่างๆ ชื่อธันเดอร์เก็ก

By: horakung
iPhoneAndroidWindows
on 5 March 2011 - 20:19 #266192
horakung's picture

แพนด้าน้อยจอมโหดผู้แบนเว็บ?

By: khajochi
WriteriPhoneIn Love
on 6 March 2011 - 00:08 #266251
khajochi's picture

ผมชอบไอเดียที่สร้างอัลกอริทึมที่มันโตด้วยตัวเอง เหมือนตอน priority inbox ก็ใช้ลักษณะนี้ พวก machine learning


แฟนพันธุ์แท้สตีฟจ็อบส์ | MacThai.com

By: mormmam
AndroidUbuntuIn Love
on 6 March 2011 - 10:23 #266314
mormmam's picture

สำหรับคนทำ SEO เราเรียกการอัพเดทในรอบนี้ว่า

"Farmer Update"