Google Leak 2024: Die Google API-Dokumentation geht viral. wie – wann - warum

Piratin entdeckt Google-Truhe

Google bekommt derzeit mehr Presse, als erwünscht: Fehler in der Search Console, Produktveröffentlichungen lange vor der MVP-Phase und eine K"I" in der Suche, die teilweise verheerende Antworten liefert (Käse mit Klebstoff und Steine ​​essen), sind alles Beispiele für eine grundlegend problematische Situation. Und jetzt gab es den größten Leak zum Thema "wie funktioniert Google?" und den Bestandteilen des Google-Suchalgorithmus seit der Einführung von Suchmaschinen.

Die Bedeutung vom Google Leak 2024 kann nicht hoch genug eingeschätzt werden. Seit Jahren diskutiert die SEO Community über Rankingfaktoren und SEO-Mythen. Während einige Websitebetreiber*innen und SEOs völlig schockiert sind, weil Google hat angeblich gelogen andere können sich entspannt zurücklehnen, da sie ihre Aktivitäten ohnehin auf Tests und Erfahrungen basieren. Dieser Artikel soll einen umfassenden Überblick über die Ereignisse rund um den Google Leak geben. Dis umfasst die wichtigsten Inhalte und den Diskurs um den leak.

TLDR: Google Leak 2024 kompakt 

Im März 2024 wurden versehentlich interne Google-Dokumente veröffentlicht, die den Google-Ranking-Algorithmus detailliert beschreiben. Diese über 2,500 Seiten umfassenden Dokumente wurden am 7. Mai 2024 entfernt. Sie gelangten in die Hände des SEO-Experten Rand Fishkin von SparkToro (Audience Research Software und Thought Leader) durch Erfan Azimi, den CEO von EA Eagle Digital (digitale Marketingagentur mit Rückerstattungsversprechen), die es dann zur weiteren Analyse mit Mike King für iPullRank (Agentur mit Schwerpunkt auf fortgeschrittenem technischem SEO). Azimi erhielt die Dokumente von einem ehemaligen Google-Mitarbeiter und beschloss, sie zu veröffentlichen, um Transparenz zu fördern. Der Datenschatz enthielt über 14,000 Attribute, die Google zur Bewertung von Websites verwendet, einschließlich potenzieller Rankingfaktoren. Wichtige Enthüllungen umfassen die Verwendung von Klickmetriken, die Interpretation von Chrome-Daten, die Präferenz für bekannte Marken und die Bewertung der Qualität und Aktualität von Inhalten. Besonders bemerkenswert ist die Offenlegung des „siteAuthority“-Scores. Rand Fishkin hat jahrelang die Bedeutung von Klickdaten und Site-Autorität durch seine Konzepte „Pogo Sticking“ und „Domain Authority“ vertreten. Trotz seines Engagements für dieses Thema ist es angebracht zu erwähnen, dass Google Fishkins Ideen öffentlich kritisiert hat. In diesem Zusammenhang kann das Ergebnis als eine Geschichte der ultimativen Fairness betrachtet werden. Google bestätigte die Echtheit der leak betonte aber, dass es sich nur um einen kleinen Teil eines komplexen Systems handelt. Dieser Einblick in die Funktionsweise der Suchmaschine bietet SEOs die Möglichkeit, ihre Strategien zu optimieren und besser zu verstehen, wie Google Websites bewertet. Die Bedeutung dieser leak liegt darin, dass Google seine Algorithmen streng geheim hält und solch umfassende Einblicke SEO-Strategien nachhaltig beeinflussen könnten.

Der Anfang: die Google API-Dokumentation gelangt an die Öffentlichkeit 

Die schnelle Abfolge bedeutender events zum Leak der Google API-Dokumentation begann am 27. März 2024, als die Dateien irrtümlicherweise auf GitHub veröffentlicht wurden. Das leak mit über 2,500 Seiten detaillierten Angaben zu den komplexen Attributen der Google-Such-API, die bisher nur internen Teams bekannt waren. Die Offenlegung blieb bis zum 7. Mai 2024 unbemerkt. Danach hat Google die Files schließlich aus der öffentlichen Domain entfernt. Doch nun war Pandorra der Büchse bereits entflohen. In einem Repository namens „Google API Content Warehouse“ befindet sich die interne API-Dokumentation. Diese Dokumentation ist für Mitarbeiter*innen konzipiert und soll ein detailliertes Verständnis dafür vermitteln, wie verschiedene Komponenten des Systems zur Generierung von Suchergebnissen und Rankings beitragen. Das Originaldokument ist noch immer recht einfach zu finden. (Quelle: https://searchengineland.com/google-search-document-leak-ranking-442617, https://9to5google.com/2024/05/28/how-google-search-works-leaked-docs/)​​

Entdeckung und Verbreitung

Die SEO-Community entdeckte schnell den leak. Rand Fishkin, eine bekannte Persönlichkeit in der SEO-Welt, spielte eine bedeutende Rolle bei der Veröffentlichung der Inhalte der Dokumente. Die jüngeren SEOs werden es nicht wissen, aber von den mittleren 2000ern bis Ende der 2010er Jahre war er bei MOZ so etwas wie ein SEO-Superstar. Ich erinnere mich sogar daran, 2017 bei der SMX in der Schlange gestanden zu haben, nur um ein Foto mit Rand zu bekommen. Heutzutage ein bisschen peinlich, ich weiß.. Mit seinem langjährigen Ruf und seiner Expertise verlieh Rand Fishkins der Dokumenten Glaubwürdigkeit und erhöhte somit auch die Aufmerksamkeit. Fishkin erhielt die geleakten Dateien aus einer zunächst anonymen Quelle. Da er die Bedeutung erkannte, teilte er erste Erkenntnisse aus den Dokumenten mit der breiteren digitalen Marketing-Community in einem sehr aufschlussreichen Artikel auf SparkToro

Verifizierung und Analyse

Rand wandte sich an Mike King und fragte nach seiner Meinung bezüglich Authentizität und Inhalt. Als einer der besten tech-SEOs ist er hierfür prädistiniert. Schließlich schrieb er einen hervorragenden Artikel über das Dokument. Andere prominente SEO-Persönlichkeiten wie Aleyda Solis und Cyrus Shepard analysierten die Dokumente ebenfalls und diskutierten die möglichen Auswirkungen der offengelegten Informationen auf SEO-Strategien und das Verständnis der Ranking-Faktoren von Google. Der Artikel von Mike King ist besonders bemerkenswert in Bezug auf Tiefe und Einsichten. Persönlich bin ich besonders fasziniert von Mikes Engagement, denn wenn ich ihn als Gast in einem Podcast höre, sagt er eigentlich immer etwas ziemlich Beeindruckendes. Und ich bin nicht leicht zu beeindrucken. In der Zwischenzeit enthüllte die zuvor anonyme Quelle, Erfan Azimi, seine Identität in einem sehr emotionalen Video.

Bestätigung von Google

Die Situation wurde noch komplexer, als Google am 30. Mai 2024 offiziell die Echtheit der geleakten Dokumente bestätigte. Ich hätte erwartet, dass John Müller eine Stellungnahme auf Twitter, äh X, abgibt. Nun, ich habe mich geirrt. Google schrieb eine E-Mail an The Verge. Ironisch, nicht wahr?

„Wir möchten davor warnen, auf Grundlage von kontextlosen, veralteten oder unvollständigen Informationen falsche Annahmen über die Suche zu treffen.“

Google-Sprecher Davis Thompson

Diese Bestätigung erfolgte inmitten weit verbreiteter Spekulationen und Analysen innerhalb der Online Marketing Community über die potentiellen Auswirkungen dieser Informationen auf SEO-Praktiken, wie zusammengefasst in Search Engine Journal.

Beteiligte Schlüsselfiguren

  • Rand Fishkin: Nutzte seine Plattform, Netzwerk und Fachwissen, um das geleakte Dokument zu analysieren und die Kernaussagen zu verbreiten.
  • Mike King : Beitrag zur technischen Aufschlüsselung und öffentlichen Diskussion der detaillierten Attribute im geleakten Dokument.
  • Erfan Azimi: Der Edward Snowden unter den SEOs

Anatomie eines Leaks

2024-03-13:

Beginn des Leaks – Die Google API-Dokumentation wurde zunächst unbeabsichtigt auf Github geleaked. Das Ausbleiben einr Stellungnahme bzgl. eines etwaigen Hacks, gepaart mit dem allgemeinen Konsens in der Berichterstattung, führt zur Annahme eines zufälligen leaks.

2024-03-27:

Veröffentlichung – Ein automatisierter Bot auf Github macht eine Kopie der Content Warehouse API von Google öffentlich und stellt die geleakten Dokumente damit einem breiteren Publikum zur Verfügung.

2024-05-05:

Leak Geteilt – Efran Azimi, ein SEO-Experte, entdeckt die geleakten Dokumente und teilt sie mit Rand Fishkin, dem Gründer von Moz und SparkToro.

2024-05-07:

Dokumente entfernt – Google wird auf den leak aufmerksam und die Dokumente werden vom öffentlichen Bereich auf Github entfernt.

2024-05-27:

Öffentliche Ankündigung – Rand Fishkin und Mike King (iPullRank) veröffentlichen eine Reihe von Blogbeiträgen und Videos mit detaillierten Informationen zu den geleakten Dokumenten, um das Thema mit der gesamten SEO-Community und der Öffentlichkeit zu teilen.

2024-05-29:

Die Antwort von Google – Google veröffentlicht eine Erklärung, in der die Bedeutung der leaks heruntergespielt wird und warnt davor, Annahmen auf der Grundlage möglicherweise veralteter oder unvollständiger Informationen zu treffen.

Entschlüsselung des Leaks

Erste Einschätzungen zeigen, dass die Qualität der Inhalte (content quality) und das Verhalten der Webseitebesuchenden (user) und deren Interaktion mit der Webseite (user engagement, user metrics) eine wichtige Rolle bei Suchmaschinen-Rankings spielen. Der Google API-Dokumention 2024 leak bestätigte die entscheidende Rolle von Kennzahlen zur Benutzerinteraktion wie Klicks, einschließlich der Unterscheidung zwischen guten und schlechten Klicks, sowie die Bedeutung langer Klicks, was auf eine umfassende Auswertung der Benutzerinteraktionen schließen lässt. Insbesondere Kennzahlen wie „guteKlicks“ und „letztelängsteKlicks“ spielen eine entscheidende Rolle und unterstreichen die Bedeutung von Inhalten, die die Aufmerksamkeit der Benutzer fesseln und aufrechterhalten. ​Google legt Wert auf Markenbekanntheit und maßgebliche Links und deutet darauf hin, dass etablierte Unternehmen, die wertvolle Inhalte anbieten, bevorzugt werden. (Quellen:https://ipullrank.com/google-algo-leak, https://searchengineland.com/google-search-document-leak-ranking-442617, https://contentatscale.ai/blog/google-search-document-leak/, (https://www.ranktracker.com/blog/major-leak-of-google-search-documents-unveils-ranking-algorithm-secrets/). 

Gewichtung der Rankingfaktoren

Obwohl die leakDie Dokumente enthielten eine umfassende Liste zahlreicher Ranking-Faktoren, lieferten jedoch keine spezifischen Informationen zur relativen Bedeutung jedes Faktors innerhalb des Ranking-Algorithmus. Diese Auslassung hat unter SEO-Expert*innenen zu Spekulationen über die vergleichende (relative) Bedeutung dieser Faktoren geführt, obwohl ihre Aufnahme in die Dokumente ihre Relevanz im Ranking-Prozess anzeigt. Als ABsolventin der Kulturwissenschaften finde ich es ziemlich amüsant zu sehen, dass die Rezeptionsästhetik (reader-response theory) sogar auf eine API-Dokumentation angewendet werden kann. Darüber hinaus ist die Aktualität des Dokuments ungewiss, was die Möglichkeit aufwirft, dass einige der im Dokument erwähnten Rankingfaktoren nicht mehr verwendet werden. Insgesamt scheint das Dokument jedoch einigermaßen aktuell zu sein. Ich sehe das Fehlen expliziter Gewichtungsinformationen nicht als großes Problem, da ich glaube, dass die Zuweisung einer bestimmten Gewichtung zu jedem Faktor möglicherweise nicht praktisch machbar oder vorteilhaft ist. Eine solche Gewichtung würde ein hohes Maß an Granularität erfordern, um Fairness über verschiedene Branchen hinweg zu gewährleisten. Ich finde die Idee, dass einem Rankingfaktor eine feste numerische Gewichtung zugewiesen werden könnte, ziemlich veraltet und spiegelt eine frühere Ära wider, als wir mit einfachen, linearen Algorithmen arbeiteten. 

Neue Erkenntnisse und missverstandene Elemente

200 Rankingfaktoren waren gestern, heute sind es 14,000+ Attribute – Google Leak 2024

Das leak enthüllte ein kompliziertes System bestehend aus 14,014 Attributen verteilt auf 2,596 Modulen, was auf die Komplexität der Suchalgorithmen von Google hinweist. Diese umfangreiche Liste unterstreicht die ausgefeilte Natur der Suchmaschine von Google, die eine breite Palette von Signalen einbezieht, um die relevantesten Suchergebnisse zu liefern. Falls ihr euch jetzt fragt, was Attribute und Module im Bereich SEO zu Suchen haben - eine berechtigte Frage. Die meisten Tech-SEO Expert*innen können wahrscheinlich HTML, CSS, JSON-LD und, je nach Tiefe der analytischen Fähigkeiten und Nachfrage, auch SQL und sogar Python. Aber das Google API-Dokument hat eine andere Syntax. Das Dokument ist für Elixir geschrieben, daher etwas komplizierter zu lesen, aber durchaus machbar! (Quelle: https://www.seroundtable.com/google-search-data-leak-37462.html)​​ 

Herausforderungen bei der Sichtung der Informationen

Bei der Analyse der geleakten Google API-Dokumente, stellen sich mehrere Herausforderungen. Eine Schwierigkeit liegt in der weniger bekannten Syntax. Das schiere Volumen des Inhalts stellt ein weiteres Hindernis dar. Die umfangreiche und komplexe Natur der geleakten Daten erschwert es, das Dokument zu durchdringen und effektiv zu nutzen. Die größte Hürde ergibt sich meiner Meinung nach jedoch aus der Insidersprache, den Akronymen und Abkürzungen, die im gesamten Dokument verwendet werden. Beispielsweise wird das System, das für die Verwendung von Klickdaten verantwortlich ist, als „Navboost“ bezeichnet, und die Hochwertung der Aktualität von Inhalten wird als „RealtimeBoost“ bezeichnet. Darüber hinaus beziehen sich nicht alle Inhalte im Dokument ausschließlich auf die Google-Suche. Um umsetzbare Erkenntnisse zu gewinnen, müssen Analysten und SEO-Experten diese Details sorgfältig analysieren und interpretieren, was ein tiefgreifendes Verständnis sowohl der technischen Aspekte als auch der praktischen Anwendungen von Suchmaschinenoperationen erfordert. Um Euch eine Vorstellung vom Erscheinungsbild der geleakten Daten zu geben, füge in diesem Dokument einen Screenshot eines Teils der Google API-Dokumentation ein. 

Screenshot von leaked Google API-Dokumentation. Hier ein Teil über den Wissensgraphen. Aufgenommen von Lydia Einenkel 2024-06-12

Screenshot vom Leak der Google API-Dokumentation. Hier ist ein Ausug über den Knowledge Graph. Von Lydia Einenkel 2024.

Reaktionen und Diskurs zur Google API Leak

Schock und Unglaube

Die Veröffentlichung der Google API-Dokumente hat in der SEO-Community für einige Schockwellen gesorgt und viele desillusioniert zurückgelassen. Der Inhalt der Google Leak Dokumente schienen den seit langem von Google öffentlich gemachten Aussagen über Rankingmethoden zu widersprechen, insbesondere gilt dies in Bezug auf die (nicht-)Verwendung bestimmter Kennzahlen wie Klickdaten und Domain-Autorität in den Algorithmen. Diese Enthüllung führte zu lautstarker Kritik auf social media Plattformen. Auch einflussreiche Persönlichkeiten wie Rand Fishkin äußerten sich. Dieser wies besonders auf die Diskrepanz zwischen Googles öffentlichen Behauptungen und den in den Dokumenten offenbarten Praktiken hin - und fühlte sich irregeführt.

Validierung und Rechtfertigung

Auf der anderen Seite, die leak war ein Moment der Bestätigung für viele SEO-Experten, die sich bestätigt fühlten, dass die Strategien, die sie auf der Grundlage empirischer Daten und Tests verwendet hatten, tatsächlich wirksam waren. Die leakhat die Relevanz vieler solcher Taktiken bestätigt und die Bedeutung von Engagement-Metriken und die Auswirkungen von Benutzerinteraktionen auf Suchrankings unterstrichen. Dies hat eine Diskussion über die Gültigkeit und Bedeutung von SEO-Experten angeregt, die sich auf ihre eigenen Tests und Erfahrungen verlassen, anstatt sich ausschließlich auf offizielle Richtlinien von Suchmaschinen zu verlassen. Ich denke, dies ist ein großer Schritt nach vorne für unser Feld. Es sollte endlich dem Stereotyp ein Ende setzen, dass wir unsere ganze Zeit damit verbringen, Links zu kaufen und Inhalte mit Schlüsselwörtern vollzustopfen. Naja, abgesehen von YouTube-Transkripten :-).

Googles Antwort auf das Leak

Googles Antwort auf die leak war vorsichtig, aber bestätigend und erkannte die Echtheit einiger der leaked-Dokumente, rieten der Öffentlichkeit und der SEO-Community jedoch, nicht ohne vollständigen Kontext voreilige Schlussfolgerungen zu ziehen. Sie betonten, dass die Dokumente möglicherweise nicht vollständig sind oder nicht den aktuellsten Stand ihrer ihrer Algorithmen widerspiegeln. Sie warnten davor, voreilige Annahmen auf der Grundlage möglicherweise veralteter oder unvollständiger Informationen zu treffen. Diese Reaktion wurde als etwas defensiv angesehen, zielte aber auch darauf ab, die Integrität ihrer Suchergebnisse und das Vertrauen von Benutzern und Vermarktern zu wahren. (Quelle: Artikel auf Searchengineland)

Weitreichende Bedeutung des Google API Leak 2024

SEO-Mythen zerstört

Das Google Leak hat mehrere seit langem bestehende Mythen über Googles Suchalgorithmen effektiv entlarvt, insbesondere den Mythos, dass Klickdaten keinen Einfluss auf das Suchranking haben. Wenn man einen Schritt weiter denkt, bedeutet das auch, dass wir SEO-Rankings tatsächlich mit SEA / bezahltem Marketing / Performance Marketing beeinflussen können. Die Dokumente enthüllten die Verwendung von Systemen wie NavBoost, die auf Klickraten und andere Metriken über das Verhalten der user zurückgreifen, um Rankings anzupassen. Das widerspricht den früheren öffentlichen Aussagen von Google. Diese Klarheit könnte die Debatte zwischen „White Hat“- und „Black Hat“-SEO-Praktiken neu entfachen und die Notwendigkeit ethischer SEO-Strategien unterstreichen, die sich auf die Schaffung eines echten Nutzen oder Mehrwerts für die user zu konzentrieren, anstatt algorithmische Schlupflöcher auszunutzen.

Die Zukunft von SEO

Für einige werden die Erkenntnisse aus dem Google leak wahrscheinlich zu erheblichen Änderungen in der SEO-Praxis führen. Das sind die, die auch XNUMX noch immer auf Keywords-first und Linkkauf geschworen haben. Für die meisten SEOs wird die leak der Google API-Dokumente ihre Arbeit erleichtern, weil es den stakeholder-buyin vereinfachen sollte. Was mein SEO-Leben angeht, bin ich mit Moz und Rands legendärem Whiteboard Friday aufgewachsen. Domain Authority und Click Data mit Fokus auf Absprungrate waren schon immer eine echte Sache. An meinen SEO-Strategien und -Taktiken hat sich also nichts geändert. Aber ich werde viel leichter Zustimmung bekommen. Außerdem können wir unsere Diskussionen auf etwas Besseres als Glauben stützen. Die Bestätigung der Bedeutung des Benutzerengagements und der Rolle von Chrome-Daten bei Rankings deutet darauf hin, dass SEO-Strategien sich zunehmend auf die Verbesserung der Nutzer*innenerfahrung und Chrome-Daten konzentrieren müssen, um bei Google erfolgreich zu sein. Jenn Grennleave gibt einige hilfreiche Praxistipps. Und natürlich versuchen die ersten Black Hats bereits, das System auszutricksen, indem sie beispielsweise versuchen, die Klickrate künstlich zu erhöhen.

Mein Senf dazu: Evolution, nicht Revolution

Insgesamt ist die leak unterstreicht die Komplexität der Suchalgorithmen von Google und die dynamische Natur von SEO und verstärkt die Notwendigkeit einer kontinuierlichen Anpassung von SEO-Strategien. Da neue Informationen verfügbar werden und Google seine Algorithmen ständig aktualisiert und verfeinert, müssen SEOs flexibel bleiben. Die Vorstellung, dass SEO nicht dasselbe ist wie Keyword-Stuffing und Spam-Inhalte, sollte jedoch nicht neu sein. Googles große Algorithmus-Updates, Patente im Zusammenhang mit Transformer-Technologie und maschinellem Lernen deuten alle auf ein ausgefeiltes Verständnis von Sprache, Absicht, Kontext und semantischem SEO hin, das sich auf Entitätsbeziehungen konzentriert. Der Aufstieg der KI und die Inhalte dieser leakDas Dokument sollte für einen erfahrenen SEO-Spezialisten keine Überraschung sein. Trotzdem ist es immer erfreulich, eine Bestätigung schwarz auf weiß zu sehen. 😉

Wie nützlich war dieser Beitrag?

Klicken Sie auf einen Stern, um den Text zu bewerten!

Bisherige Durchschnittsbewertung 5 / 5. Stimmenanzahl: 3

Bisher keine Stimmen! Sei der Erste, der diesen Beitrag bewertet.

Lydia Einenkel Schwarz-Weiß-Bild

Autorin: Lydia Einenkel

Lydia Einenkel ist eine internationale SEO-Beraterin mit über 10 Jahren Erfahrung. Sie verfolgt einen ganzheitlichen, datengesteuerten und produktorientierten Ansatz und verfügt über Fachwissen in den Bereichen E-Commerce und Verlagswesen sowohl im B2C- als auch im B2B-Markt. Sie ist kompetent in der eigennützigen Marketinganalyse mit GTM, GA4 und Looker Studio und sorgt für datengesteuerte Entscheidungsfindung.


Lydia erforscht außerdem KI und hört leidenschaftlich gern Podcasts. Sie bleibt immer über die neuesten Technologietrends auf dem Laufenden.
M.Phil Universität Cambridge.

Hauptsächlich menschlich.