เจาะเอกสารรั่วไหลของ Google Search ในการจัดอันดับ Google ถือมีการเปลี่ยนเเปลงครั้งใหญ่เผยให้เห็นการทำงานภายในของอัลกอริทึมการจัดอันดับ
เอกสารดังกล่าวเปิดเผยว่า Google Search ใช้หรือใช้งานการคลิก ลิงก์ เนื้อหา เอนทิตี ข้อมูล Chrome และอื่นๆ อย่างไรในการจัดอันดับ
ขั้นตอนการจัดอันดับของ Google
ขั้นตอนการจัดอันดับเอกสาร Google ที่รั่วไหลจำนวนมากทำให้เรามีมุมมองที่ไม่เคยมีมาก่อนใน Google Search และเปิดเผยองค์ประกอบที่สำคัญที่สุดบางประการที่ Google ใช้ในการจัดอันดับเนื้อหา
เกิดอะไรขึ้น. เอกสารหลายพันฉบับซึ่งดูเหมือนว่ามาจาก Content API Warehouse ภายในของ Google ได้รับการเผยแพร่เมื่อวันที่ 13 มีนาคมบน Github โดยบอทอัตโนมัติที่เรียกว่า yoshi-code-bot เอกสารเหล่านี้ถูกแชร์กับ Rand Fishkin ผู้ร่วมก่อตั้ง SparkToro เมื่อต้นเดือนนี้
อ่านต่อเพื่อค้นหาสิ่งที่เราได้เรียนรู้จาก Fishkin รวมถึง Michael King ซีอีโอของ iPullRank ผู้ตรวจสอบและวิเคราะห์เอกสารด้วย (และวางแผนที่จะจัดทำการวิเคราะห์เพิ่มเติมสำหรับ Search Engine Land ในไม่ช้า)
ทำไมเราถึงสนใจ เราได้รับข้อมูลคร่าวๆ ว่าอัลกอริธึมการจัดอันดับของ Google ทำงานอย่างไร ซึ่งถือเป็นสิ่งล้ำค่าสำหรับ SEO ที่สามารถเข้าใจความหมายทั้งหมดได้ ในปี 2023 เราได้เห็นปัจจัยการจัดอันดับของ Yandex Search อย่างที่ไม่เคยมีมาก่อนผ่านการรั่วไหล ซึ่งเป็นหนึ่งในเรื่องราวที่ยิ่งใหญ่ที่สุดของปีนั้น
เอกสาร Google นี้รั่วไหล? มันอาจจะเป็นหนึ่งในเรื่องราวที่ยิ่งใหญ่ที่สุดในประวัติศาสตร์ของ SEO และ Google Search
การจัดอันดับของ Google ถือเกณฑ์อย่างไร นี่คือสิ่งที่เรารู้เกี่ยวกับเอกสารภายใน ต้องขอบคุณ Fishkin และ King:
ปัจจุบัน: เอกสารระบุว่าข้อมูลนี้ถูกต้อง ณ เดือนมีนาคม
คุณสมบัติการจัดอันดับ: มีการแสดงโมดูล 2,596 โมดูลในเอกสาร API พร้อมแอตทริบิวต์ 14,014 รายการ
การถ่วงน้ำหนัก: เอกสารไม่ได้ระบุว่าคุณลักษณะการจัดอันดับใดๆ มีการถ่วงน้ำหนักอย่างไร เพียงแต่มีอยู่เท่านั้น
Twiddlers: เหล่านี้เป็นฟังก์ชันการจัดอันดับใหม่ซึ่ง “สามารถปรับคะแนนการดึงข้อมูลของเอกสารหรือเปลี่ยนการจัดอันดับของเอกสารได้” ตามที่ King กล่าว
การลดระดับ: เนื้อหาสามารถลดระดับได้ด้วยเหตุผลหลายประการ เช่น:
ลิงก์ไม่ตรงกับไซต์เป้าหมาย
สัญญาณ SERP บ่งบอกถึงความไม่พอใจของผู้ใช้
รีวิวสินค้า.
ที่ตั้ง.
โดเมนการทำงานแบบตรงทั้งหมด
พร
ประวัติการเปลี่ยนแปลง: เห็นได้ชัดว่า Google เก็บสำเนาของทุกเวอร์ชันของทุกหน้าที่เคยจัดทำดัชนีไว้ หมายความว่า Google สามารถ “จดจำ” ทุกการเปลี่ยนแปลงที่เกิดขึ้นกับเพจได้ อย่างไรก็ตาม Google จะใช้เฉพาะการเปลี่ยนแปลง 20 รายการล่าสุดของ URL ในการวิเคราะห์ลิงก์
ลิงค์มีความสำคัญ ฉันรู้น่าตกใจ เอกสารแสดงความหลากหลายและความเกี่ยวข้องของลิงก์ยังคงเป็นกุญแจสำคัญ และเพจแรงก์ยังคงมีชีวิตอยู่อย่างมากในฟีเจอร์การจัดอันดับของ Google PageRank สำหรับหน้าแรกของเว็บไซต์จะได้รับการพิจารณาในทุกเอกสาร
สิ่งนี้ไม่ได้พิสูจน์ว่าโฆษกของ Google โกหกเกี่ยวกับลิงก์ที่ไม่ได้เป็น “ปัจจัยอันดับ 3 อันดับแรก” หรือลิงก์ที่มีความสำคัญน้อยกว่าในการจัดอันดับ สองสิ่งสามารถเป็นจริงได้ในคราวเดียว ขอย้ำอีกครั้งว่าเราไม่รู้ว่าฟีเจอร์เหล่านี้มีน้ำหนักอย่างไร
การคลิกที่ประสบความสำเร็จมีความสำคัญ สิ่งนี้ไม่ควรเป็นเรื่องที่น่าตกใจ แต่ถ้าคุณต้องการอันดับที่ดี คุณต้องสร้างเนื้อหาและประสบการณ์ผู้ใช้ที่ยอดเยี่ยมต่อไปตามเอกสาร Google ใช้การวัดที่หลากหลาย รวมถึง badClicks, goodClicks, LastLongestClicks และ UnsquashedClicks
นอกจากนี้ เอกสารที่ยาวอาจถูกตัดทอน ในขณะที่เนื้อหาที่สั้นกว่าจะได้รับคะแนน (ตั้งแต่ 0-512) โดยพิจารณาจากความเป็นต้นฉบับ นอกจากนี้ คะแนนยังมอบให้กับเนื้อหา Your Money Your Life เช่น สุขภาพและข่าวสาร
มันไม่สิ่งที่ทุกคนหมายถึงอะไร? ตามที่เขาได้กล่าว:
“[Y] คุณต้องเพิ่มจำนวนคลิกที่ประสบความสำเร็จโดยใช้ชุดข้อความค้นหาที่กว้างขึ้น และได้รับลิงก์ที่หลากหลายมากขึ้น หากคุณต้องการรักษาอันดับต่อไป ตามแนวคิดแล้ว มันสมเหตุสมผลแล้วเพราะเนื้อหาที่แข็งแกร่งมากจะทำแบบนั้น การมุ่งเน้นที่การเพิ่มปริมาณการเข้าชมที่มีคุณสมบัติเหมาะสมเพื่อประสบการณ์ผู้ใช้ที่ดีขึ้นจะส่งสัญญาณไปยัง Google ว่าเพจของคุณสมควรได้รับการจัดอันดับ”
เอกสารและคำให้การจากการทดลองต่อต้านการผูกขาดระหว่างสหรัฐฯ กับ Google ยืนยันว่า Google ใช้การคลิกในการจัดอันดับ โดยเฉพาะอย่างยิ่งกับระบบ Navboost ซึ่งเป็น “หนึ่งในสัญญาณสำคัญ” ที่ Google ใช้สำหรับการจัดอันดับ ดูเพิ่มเติมจากความครอบคลุมของเรา:
7 เอกสารการจัดอันดับ Google Search ที่ต้องดูในการจัดแสดงการทดลองต่อต้านการผูกขาด
การค้นหาและการจัดอันดับของ Google ทำงานอย่างไร ตามข้อมูลของ Pandu Nayak ของ Google
เรื่องของแบรนด์ การซื้อครั้งใหญ่ของ Fishkin? แบรนด์มีความสำคัญมากกว่าสิ่งอื่นใด:
“หากมีคำแนะนำที่เป็นสากลข้อหนึ่งที่ฉันมีสำหรับนักการตลาดที่ต้องการปรับปรุงการจัดอันดับการค้นหาทั่วไปและการเข้าชมในวงกว้าง นั่นก็คือ: ‘สร้างแบรนด์ที่โดดเด่น เป็นที่นิยม และเป็นที่รู้จักในพื้นที่ของคุณ นอกเหนือจากการค้นหาของ Google’”
การสร้าง Backlink มีอิทธิพลหรือไหมอ่านที่นี้
หน่วยงานมีความสำคัญ ชีวิตนักเขียน Google จัดเก็บข้อมูลผู้เขียนที่เกี่ยวข้องกับเนื้อหาและพยายามพิจารณาว่าบุคคลนั้นเป็นผู้เขียนเอกสารหรือไม่
SiteAuthority: Google ใช้สิ่งที่เรียกว่า “siteAuthority”
Google บอกเราว่าสิ่งนี้เกิดขึ้นในปี 2554 หลังจากที่เปิดตัวการอัปเดต Panda โดยระบุต่อสาธารณะว่า “เนื้อหาคุณภาพต่ำในส่วนหนึ่งของไซต์อาจส่งผลกระทบต่อการจัดอันดับของไซต์โดยรวม”
อย่างไรก็ตาม Google ปฏิเสธว่าไม่มีคะแนนอำนาจเว็บไซต์ในช่วงหลายปีที่ผ่านมา
ข้อมูลโครเมียม โมดูลที่เรียกว่า ChromeInTotal บ่งบอกว่า Google ใช้ข้อมูลจากเบราว์เซอร์ Chrome ในการจัดอันดับ
รายการที่อนุญาต โมดูลสองสามรายการระบุว่า Google อนุญาตบางโดเมนที่เกี่ยวข้องกับการเลือกตั้งและโควิด – isElectionAuthority และ isCovidLocalAuthority แม้ว่าเราจะรู้มานานแล้วว่า Google (และ Bing) มี “รายการข้อยกเว้น” เมื่อ “อัลกอริทึมเฉพาะส่งผลกระทบต่อเว็บไซต์โดยไม่ได้ตั้งใจ”
ไซต์ขนาดเล็ก คุณสมบัติอีกอย่างคือ smallPersonalSite – สำหรับเว็บไซต์หรือบล็อกส่วนตัวขนาดเล็ก King คาดเดาว่า Google สามารถเพิ่มหรือลดระดับไซต์ดังกล่าวผ่าน Twiddler อย่างไรก็ตาม นั่นยังคงเป็นคำถามเปิดอยู่ ขอย้ำอีกครั้งว่าเราไม่ทราบแน่ชัดว่าฟีเจอร์เหล่านี้มีน้ำหนักเท่าใด
ข้อค้นพบที่น่าสนใจอื่นๆ ตามเอกสารภายในของ Google:
ความสดใหม่มีความสำคัญ – Google ดูวันที่ทางสายย่อย (bylineDate), URL (syntacticDate) และเนื้อหาบนเพจ (semanticDate)
ในการพิจารณาว่าเอกสารเป็นหรือไม่เป็นหัวข้อหลักของเว็บไซต์ Google จะกำหนดเวกเตอร์หน้าและไซต์ จากนั้นเปรียบเทียบการฝังหน้า (siteRadius) กับการฝังไซต์ (siteFocusScore)
Google จัดเก็บข้อมูลการจดทะเบียนโดเมน (RegistrationInfo)
ชื่อหน้ายังคงมีความสำคัญ Google มีฟีเจอร์ชื่อ titlematchScore ซึ่งเชื่อกันว่าใช้วัดว่าชื่อหน้าตรงกับข้อความค้นหาได้ดีเพียงใด
Google วัดขนาดตัวอักษรแบบถ่วงน้ำหนักโดยเฉลี่ยของคำศัพท์ในเอกสาร (avgTermWeight) และ Anchor Text
บทความต่างๆ
ความลับจากอัลกอริทึม: เอกสารทางวิศวกรรมภายในของ Google Search รั่วไหลโดย King บน iPullRank
แหล่งที่ไม่ระบุชื่อแบ่งปันเอกสาร Google Search API ที่รั่วไหลนับพันฉบับกับฉัน ทุกคนใน SEO ควรเห็นพวกเขาโดย Fishkin บน SparkToro
อัปเดต 29 พฤษภาคม Google ได้ออกแถลงการณ์ต่อ Search Engine Land อ่านผลติดตามของเรา: Google ตอบสนองต่อการรั่วไหล: เอกสารขาดบริบท
ชี้แจงด่วน. มีข้อโต้แย้งบางประการว่าเอกสารเหล่านี้ “รั่วไหล” หรือ “ถูกค้นพบ” ฉันได้รับแจ้งว่ามีแนวโน้มว่าเอกสารภายในจะถูกรวมไว้ในการตรวจสอบโค้ดโดยไม่ได้ตั้งใจ และเผยแพร่จริงจากฐานโค้ดภายในของ Google ซึ่งเป็นที่ที่พวกเขาถูกค้นพบ
แหล่งที่มา Erfan Azimi ซีอีโอและผู้อำนวยการ SEO สำหรับเอเจนซี่การตลาดดิจิทัล EA Eagle Digital โพสต์วิดีโอโดยอ้างความรับผิดชอบในการแบ่งปันเอกสารกับ Fishkin Azimi ไม่ได้รับการว่าจ้างจาก Google