• Datensicherheit & Google-Dienste

Klarstellung zum Google-Datenleck: Was Sie wissen müssen

  • Felix Rose-Collins
  • 3 min read
Klarstellung zum Google-Datenleck: Was Sie wissen müssen

Intro

Während der letzten Feiertage tauchten in den sozialen Medien Beiträge über ein angebliches Datenleck in Bezug auf die Ranking-Algorithmen von Google auf. Die ersten Diskussionen über diese Lecks konzentrierten sich auf die "Bestätigung" lang gehegter Überzeugungen von Personen wie Rand Fishkin, aber es fehlte der Kontext über die wahre Natur der Daten.

Der Kontext ist wichtig: Dokument-KI-Warehouse

Die durchgesickerten Daten scheinen sich auf das Document AI Warehouse von Google zu beziehen, eine öffentliche Google-Cloud-Plattform, die für die Analyse, Organisation, Suche und Speicherung von Daten verwendet wird. Diese öffentliche Dokumentation trägt den Titel "Document AI Warehouse overview". Beiträge auf Plattformen wie Facebook deuten darauf hin, dass es sich bei den durchgesickerten Daten um eine "interne Version" dieser öffentlich zugänglichen Dokumentation handelt, was darauf hindeutet, dass sie möglicherweise nicht ausschließlich für die Google-Suche verwendet werden.

Leck bei internen Suchdaten?

Der ursprüngliche Beitrag auf SparkToro behauptete nicht, dass die Daten von Google Search stammten, sondern gab an, dass die Quelle, die Rand Fishkin die Daten zur Verfügung stellte, diese Behauptung aufstellte. Fishkin, der für seine akribische Vorgehensweise bekannt ist, merkte an, dass die Behauptung, die Daten stammten aus der Google-Suche, von der Person stammte, die ihm eine E-Mail geschickt hatte, und nicht von verifizierten Quellen.

Fishkin zitierte die E-Mail:

"Ich habe eine E-Mail von einer Person erhalten, die behauptet, Zugang zu einem massiven Leck in der API-Dokumentation innerhalb der Suchabteilung von Google zu haben."

Trotzdem konnten die von Fishkin befragten Ex-Googler nur bestätigen, dass die Daten internen Google-Informationen ähneln, aber nicht ausdrücklich bestätigen, dass sie von der Google-Suche stammen.

Einblicke von Ex-Googlern

Ex-Googler kommentierten:

  • "Als ich dort gearbeitet habe, hatte ich keinen Zugang zu diesem Code. Aber das sieht auf jeden Fall legitim aus."

  • "Sie hat alle Merkmale einer internen Google-API".

  • "Es ist eine Java-basierte API. Und jemand hat viel Zeit damit verbracht, die Google-internen Standards für Dokumentation und Benennung einzuhalten."

  • "Ich bräuchte mehr Zeit, um sicher zu sein, aber das stimmt mit den internen Unterlagen überein, die ich kenne.

  • "Nichts, was ich bei einer kurzen Überprüfung gesehen habe, deutet darauf hin, dass dies alles andere als legal ist."

Diese Aussagen machen deutlich, dass die Daten zwar echt aussehen, es aber keinen endgültigen Beweis dafür gibt, dass sie von der Google-Suche stammen.

Unvoreingenommen bleiben

Es ist von entscheidender Bedeutung, diesen Daten gegenüber aufgeschlossen zu bleiben, da ein großer Teil von ihnen ungeprüft bleibt. Voreilige Schlussfolgerungen oder die Verwendung der Daten zur Bestätigung bereits bestehender Überzeugungen können zu einem "Confirmation Bias" führen, bei dem man Informationen so interpretiert, dass sie die eigenen Ansichten bestätigen.

Definition von Confirmation Bias:

"Confirmation bias ist die Tendenz, Informationen in einer Weise zu suchen, zu interpretieren, zu bevorzugen und abzurufen, die die eigenen früheren Überzeugungen oder Werte bestätigt oder unterstützt.

Wichtige Fragen zum Google-Datenleck

  1. Kontext der durchgesickerten Informationen: Beziehen sich die Daten auf die Google-Suche oder auf andere Zwecke?

  2. Zweck der Daten: Wurden sie für tatsächliche Suchergebnisse oder für die interne Datenverwaltung oder -manipulation verwendet?

  3. Bestätigung von Ex-Googlern: Die Ex-Googler haben nicht bestätigt, dass die Daten spezifisch für die Google-Suche sind, sondern nur, dass sie von Google zu stammen scheinen.

  4. Unvoreingenommene Analyse: Vermeiden Sie es, die Daten zur Bestätigung lang gehegter Überzeugungen zu verwenden, um Bestätigungsfehler zu vermeiden.

  5. Beziehung zum Document AI Warehouse: Es gibt Hinweise darauf, dass sich die Daten auf eine externe API für den Aufbau eines Document Warehouse und nicht auf die Google-Suche beziehen könnten.

Expertenmeinungen zu den "geleakten" Daten

SEO-Experte Ryan Jones teilte:

  • Ungewissheit, ob die Daten für die Produktion oder für Tests bestimmt sind.

  • Unklarheit darüber, ob es sich um die Websuche oder andere vertikale Bereiche wie Google Home oder News handelt.

  • Vermutung, dass einige Felder nur für Trainingsdatensätze und nicht für alle Standorte gelten.

DavidGQuaid getwittert:

Treffen Sie Ranktracker

Die All-in-One-Plattform für effektives SEO

Hinter jedem erfolgreichen Unternehmen steht eine starke SEO-Kampagne. Aber bei den zahllosen Optimierungstools und -techniken, die zur Auswahl stehen, kann es schwierig sein, zu wissen, wo man anfangen soll. Nun, keine Angst mehr, denn ich habe genau das Richtige, um zu helfen. Ich präsentiere die Ranktracker All-in-One-Plattform für effektives SEO

Wir haben endlich die Registrierung zu Ranktracker absolut kostenlos geöffnet!

Ein kostenloses Konto erstellen

Oder melden Sie sich mit Ihren Anmeldedaten an

"Wir wissen nicht, ob dies für die Google-Suche oder die Google-Cloud-Dokumentenabfrage ist. APIs scheinen wählerisch zu sein - so erwarte ich nicht, dass der Algorithmus ausgeführt wird - was ist, wenn ein Ingenieur all diese Qualitätsprüfungen überspringen will - das sieht so aus, als ob ich eine Content-Warehouse-App für meine Unternehmens-Wissensdatenbank bauen möchte."

Schlussfolgerung

Derzeit gibt es keine konkreten Hinweise darauf, dass die "durchgesickerten" Daten aus der Google-Suche stammen. Kontext und Zweck der Daten sind nach wie vor unklar. Es gibt Hinweise darauf, dass es sich um eine externe API für die Dokumentenverwaltung handelt und nicht um eine Kernkomponente von Googles Suchalgorithmus. Es ist wichtig, diese Informationen mit Vorsicht zu genießen und ohne weitere Überprüfung keine endgültigen Schlüsse zu ziehen.

Felix Rose-Collins

Felix Rose-Collins

Ranktracker's CEO/CMO & Co-founder

Felix Rose-Collins is the Co-founder and CEO/CMO of Ranktracker. With over 15 years of SEO experience, he has single-handedly scaled the Ranktracker site to over 500,000 monthly visits, with 390,000 of these stemming from organic searches each month.

Starten Sie mit Ranktracker... kostenlos!

Finden Sie heraus, was Ihre Website vom Ranking abhält.

Ein kostenloses Konto erstellen

Oder melden Sie sich mit Ihren Anmeldedaten an

Different views of Ranktracker app