ต่อจาก กูเกิลปรับอัลกอริทึมใหม่ ลดอันดับ content farm ทางเว็บไซต์ Wired.com มีโอกาสคุยกับวิศวกรด้านการค้นหาของกูเกิลสองคนคือ Amit Singhal และ Matt Cutts ทำให้เราได้ข้อมูลเบื้องลึกของการปรับอัลกอริทึมครั้งนี้
Amit Singhal อธิบายว่าการปรับระบบดัชนีเว็บตัวใหม่ Caffeine เมื่อกลางปี 2010 ทำให้กูเกิลทำดัชนีเว็บได้เร็วและเยอะขึ้นมาก และได้เว็บพวก content farm ที่เนื้อหาคุณภาพต่ำเยอะตามมาด้วย
ส่วนมาตรการการจัดการกับ content farm กูเกิลพยายามสร้างอัลกอริทึมที่เป็นอัตโนมัติและเป็นวิทยาศาสตร์ แทนการใช้คนเข้าแทรกแซง ขั้นตอนสร้างอัลกอริทึมของกูเกิลคือให้ผู้ใช้ตอบแบบสอบถามจำนวนมาก เต็มไปด้วยคำถามหลายรูปแบบ เช่น คิดว่าเว็บนี้มีโฆษณาเยอะเกินไปหรือไม่, เว็บนี้เป็นของแท้หรือลอกเนื้อหาจากที่อื่นมา ฯลฯ แล้วจึงสร้างกฎทางคณิตศาสตร์ที่ใช้แยกแยะเว็บไซต์เหล่านี้
กูเกิลทดสอบอัลกอริทึมนี้เป็นการภายใน โดยมีรายการของเว็บไซต์ที่ "รู้สึกแน่" ว่าเป็น content farm และไม่เป็น content farm (เช่น Wikipedia หรือ The New York Times) มาทดสอบ นอกจากนี้ยังทดสอบกับคนนอกผ่าน Chrome Extension โดยรายการเว็บจากอัลกอริทึมของกูเกิลเอง ตรงกับการแจ้งของคนนอก 84% ซึ่งทำให้กูเกิลมั่นใจว่าอัลกอริทึมของตัวเองใช้งานได้
อัลกอริทึมต่อต้าน content farm รอบนี้มีรหัสเรียกกันภายในว่า "Panda" ตามชื่อของวิศวกรคนหนึ่งในทีมค้นหา
Wired.com ยังถามประเด็นว่าอัลกอริทึมสำหรับผลการค้นหาของกูเกิล ควรเปิดเผยต่อสาธารณะเพื่อความโปร่งใสหรือไม่ เพราะกูเกิลก็โดนโจมตีว่ารับเงินค่าโฆษณาจากเว็บต่างๆ และอาจทำให้เว็บที่จ่ายค่าโฆษณามีอันดับสูง
กูเกิลยืนยันว่าเงินไม่มีผลต่ออันดับการค้นหา แต่ก็ไม่มีหลักฐานมาพิสูจน์เช่นกัน ส่วนประเด็นเรื่องการเปิดอัลกอริทึม กูเกิลอธิบายว่าในอัลกอริทึมมีปัจจัย (signal) บางอย่างที่เปิดเผยออกไปแล้ว จะมีคนใช้ประโยชน์และโกงอันดับในผลการค้นหาได้ และถ้าในอนาคตเกิดมีอัลกอริทึมที่เปิดเผยออกไป แต่ป้องกันการโกงอันดับได้ กูเกิลก็ยินดีเปิดเผย
Wired.com ถามประเด็น ห้าง JCPenny ทำ Blackhat SEO ว่าทำไมกูเกิลจัดการปัญหาช้า
คำตอบของกูเกิลคือดัชนีเว็บมีขนาดใหญ่มาก ดูแลได้ไม่ทั่วถึง และกูเกิลไม่กล้าลงโทษแรงเพราะเคยโดนเว็บไซต์ในยุโรปไปฟ้องคณะกรรมการของ EU ว่ากูเกิลกีดกันการแข่งขัน เลยถูกโจมตีจากทั้งสองฝั่ง คือฝั่งที่บอกว่ากูเกิลลงโทษแรงเกินไป และฝั่งที่บอกว่ากูเกิลไม่ยอมทำอะไรเลย
ที่มา - Wired
Comments
"อัลกอริทึมต่อต้าน content farm รอบนี้มีรหัสเรียกกันภายในว่า "Panda" ตามชื่อของวิศวกรคนหนึ่งในทีมค้นหา"
ชื่อเท่ห์ดีวุ้ย วิศวกรคนนี้ :D
กำลังจะมาตอบเลย
ชื่อเต็มๆของเค้าคือ Pandaren Battlemaster หรือเปล่าครับ 555+
Pandaren Brewmaster ครับ
เทคโนโลยีไม่ผิด คนใช้มันในทางที่ผิดนั่นแหละที่ผิด!?!
ผมยังจำไม่ได้เลย แสดงว่าเล่นบ่อย O_o
เล่นไม่บ่อยครับ ปีนึงเล่นแค่สองสามเดือนเอง (เวลารวมที่ใช้เล่นนะ ;P)
เทคโนโลยีไม่ผิด คนใช้มันในทางที่ผิดนั่นแหละที่ผิด!?!
เฉลี่ยวันละ 6 ชม. !!
ชื่อ : Not Available at this Moment (N/A)
น่าจะใช่นะครับ มีญาติห่างๆ ชื่อธันเดอร์เก็ก
แพนด้าน้อยจอมโหดผู้แบนเว็บ?
ผมชอบไอเดียที่สร้างอัลกอริทึมที่มันโตด้วยตัวเอง เหมือนตอน priority inbox ก็ใช้ลักษณะนี้ พวก machine learning
แฟนพันธุ์แท้สตีฟจ็อบส์ | MacThai.com
สำหรับคนทำ SEO เราเรียกการอัพเดทในรอบนี้ว่า
"Farmer Update"