“คลังเนื้อหา Google API” นี้ประกอบด้วยเอกสารประกอบ API ภายในที่อธิบายให้พนักงานทราบถึงการทำงานของส่วนประกอบต่างๆ ที่สร้างผลการค้นหา มีหน้าทั้งหมดมากกว่า 2,500 หน้า บางส่วนอธิบายถึงระบบที่เก่ากว่า แต่เอกสารอื่นๆ ดูเหมือนว่าจะเป็นข้อมูลล่าสุดแล้ว
จากข้อมูลที่ถูกเผยแพร่ ดูเหมือนว่า Google จะเผยแพร่เอกสารดังกล่าวต่อสาธารณะผ่านทาง GitHub ตั้งแต่วันที่ 27 มีนาคม โดยอาจเป็นไปโดยบังเอิญ จากนั้นเอกสารคำอธิบายก็ได้รับการเผยแพร่ในวันที่ 7 พฤษภาคม อย่างไรก็ตาม เนื่องจากเอกสารดังกล่าวได้รับการจัดทำดัชนีโดยบริการของบุคคลที่สามในช่วงเวลาดังกล่าว สำเนาของเอกสารดังกล่าวจึงยังคงสามารถเข้าถึงได้แม้ว่า Google จะลบเอกสารดังกล่าวออกไปแล้วก็ตาม
แม้ว่าข้อมูลนี้จะแสดงให้เห็นปัจจัยต่างๆ ที่การค้นหาของ Google อาจพิจารณาเมื่อจัดอันดับผลการค้นหา แต่ไม่ได้เปิดเผยว่าปัจจัยแต่ละประการมีความสำคัญต่อการจัดอันดับสุดท้ายมากเพียงใด
ผู้ที่อยู่ในชุมชน SEO ที่พยายามปรับตัวให้เข้ากับการเปลี่ยนแปลงในการจัดอันดับการค้นหาของ Google และปรากฏให้ปรากฏในอันดับที่สูงขึ้นบนเพจอาจพบว่าข้อมูลนี้มีประโยชน์ หลังจากตรวจสอบเอกสารนี้แล้ว พวกเขาพบว่าเอกสารดังกล่าวขัดแย้งกับสิ่งที่ Google กล่าวต่อสาธารณะเกี่ยวกับการทำงานของการค้นหา
Google ยังไม่ได้แสดงความคิดเห็นต่อสาธารณะเกี่ยวกับการรั่วไหลครั้งนี้ บริษัทได้ประกาศการอัปเดตครั้งสำคัญครั้งล่าสุดสำหรับการค้นหาในเดือนมีนาคม โดยมีเป้าหมายเพื่อแสดงเนื้อหาที่มีความน่าเชื่อถือและ "เป็นประโยชน์" มากขึ้น ระบบการจัดอันดับหลักได้รับการอัปเดตเพื่อตรวจสอบว่าหน้าเว็บนั้น"สร้างมาสำหรับเครื่องมือค้นหาหรือสำหรับผู้คน "
การค้นพบครั้งใหญ่ที่สุดจากการรั่วไหล
สิ่งหนึ่งที่ชัดเจน: อัลกอริทึมการค้นหาของ Google ไม่ได้รั่วไหล และผู้เชี่ยวชาญด้าน SEO ก็ไม่ได้มีคำตอบสำหรับทุกอย่างทันที แต่ข้อมูลที่รั่วไหลจากเอกสารภายในของ Google นับพันฉบับยังคงมีขนาดใหญ่มาก นี่เป็นการสำรวจระบบการทำงานภายในของ Google ที่ได้รับการปกป้องอย่างใกล้ชิด ซึ่งไม่เคยเกิดขึ้นมาก่อน
ในช่วงหลายปีที่ผ่านมา โฆษกของ Google ปฏิเสธซ้ำแล้วซ้ำเล่าว่าการคลิกของผู้ใช้มีอิทธิพลต่อการจัดอันดับเว็บไซต์ แต่เอกสารที่รั่วไหลออกมาได้ระบุว่าการคลิกของผู้ใช้บางประเภทมีผลต่อการจัดอันดับการค้นหาด้วย คำให้การจากคดีต่อต้านการผูกขาดของกระทรวงยุติธรรมสหรัฐฯ ในอดีตเผยให้เห็นปัจจัยการจัดอันดับที่เรียกว่า Navboost ซึ่งใช้การคลิกของผู้ใช้เพื่อยกระดับเนื้อหาในการค้นหา
Rand Fishkin ผู้เชี่ยวชาญในอุตสาหกรรมการเพิ่มประสิทธิภาพเครื่องมือค้นหา (SEO) บอกกับ The Verge ทางอีเมลว่า“สำหรับผม บทเรียนที่สำคัญที่สุดคือคำชี้แจงต่อสาธารณะของ Google หลายประการเกี่ยวกับสิ่งที่พวกเขาเก็บรวบรวมและการทำงานของเครื่องมือค้นหานั้นขัดแย้งกับความเป็นจริง ”
การรั่วไหลดังกล่าวแพร่ระบาดทางอินเทอร์เน็ตเป็นครั้งแรกหลังจากที่ผู้เชี่ยวชาญด้าน SEO อย่าง Fishkin และ Mike King เผยแพร่เนื้อหาบางส่วนของเอกสารลับเมื่อต้นสัปดาห์นี้ พร้อมด้วยการวิเคราะห์ที่เกี่ยวข้อง เอกสาร API ที่รั่วไหลประกอบไปด้วยที่เก็บข้อมูลและคำจำกัดความเกี่ยวกับข้อมูลที่ Google รวบรวม โดยบางส่วนสามารถบอกได้ว่าเว็บไซต์ต่างๆ ได้รับการจัดอันดับอย่างไรในผลการค้นหา ในตอนแรก Google หลบเลี่ยงคำถามเกี่ยวกับความถูกต้องของเอกสารที่รั่วไหล ก่อนที่จะยืนยันอย่างเป็นทางการเมื่อวันพุธที่ผ่านมา
เดวิส ทอมป์สัน โฆษกของ Google บอกกับ The Verge ทางอีเมลเมื่อวันพุธว่า"เราขอเตือนอย่าทำการคาดเดาที่ไม่ถูกต้องเกี่ยวกับการค้นหาโดยใช้ข้อมูลที่ไม่ตรงบริบท ล้าสมัย หรือไม่ครบถ้วน" “เราได้แบ่งปันข้อมูลมากมายเกี่ยวกับวิธีการทำงานของการค้นหาและปัจจัยต่างๆ ที่ระบบของเราพิจารณา และเราทำงานเพื่อปกป้องความสมบูรณ์ของผลลัพธ์ของเราจากการถูกดัดแปลง ”
“นักข่าวและผู้จัดพิมพ์ที่ทำข่าวเกี่ยวกับ SEO และการค้นหาของ Google ควรจะหยุดพูดซ้ำคำแถลงต่อสาธารณะของ Google และหันมาพิจารณาถ้อยคำของยักษ์ใหญ่ด้านการค้นหาอย่างใกล้ชิดและโต้แย้งมากกว่านี้” Fishkinกล่าว“สิ่งพิมพ์ที่ทำซ้ำคำกล่าวอ้างของ Google ราวกับว่าเป็นข้อเท็จจริงนั้น ช่วยให้ Google สร้างเรื่องราวที่เป็นประโยชน์ต่อบริษัทเท่านั้น ไม่ได้เป็นประโยชน์ต่อผู้ประกอบวิชาชีพ ผู้ใช้ หรือสาธารณชน”