Įvadas
Per pastarąsias atostogas socialinėje žiniasklaidoje pasirodė pranešimų apie tariamą duomenų, susijusių su "Google" reitingavimo algoritmais, nutekėjimą. Pradinėse diskusijose apie šį nutekėjimą daugiausia dėmesio buvo skiriama tokių veikėjų kaip Randas Fishkinas (Rand Fishkin) seniai išsakytiems įsitikinimams "patvirtinti", tačiau trūko konteksto apie tikrąjį duomenų pobūdį.
Svarbus kontekstas: Dokumentų AI saugykla
Atrodo, kad nutekinti duomenys yra susiję su " Google" "Document AI Warehouse"- vieša "Google Cloud" platforma, naudojama duomenims analizuoti, tvarkyti, ieškoti ir saugoti. Ši vieša dokumentacija vadinasi "Document AI Warehouse overview" ("Dokumentų AI saugyklos apžvalga"). Iš pranešimų tokiose platformose kaip "Facebook" galima spręsti, kad nutekinti duomenys yra šios viešai prieinamos dokumentacijos "vidinė versija", o tai rodo, kad jie gali būti susiję ne tik su "Google" paieškos operacijomis.
Vidaus paieškos duomenų nutekėjimas?
Pradiniame "SparkToro" pranešime nebuvo teigiama, kad duomenys buvo gauti iš "Google" paieškos, bet buvo nurodyta, kad tai teigė šaltinis, kuris pateikė duomenis Randui Fishkinui. Fishkinas, garsėjantis savo kruopštumu, pažymėjo, kad teiginį apie duomenis, gautus iš "Google Search", pateikė jam elektroniniu paštu atsiuntęs asmuo, o ne patikrinti šaltiniai.
"Fishkin" citavo el. laišką:
"Gavau el. laišką iš asmens, teigiančio, kad turi prieigą prie didžiulės API dokumentacijos nutekėjimo iš "Google" paieškos padalinio."
Nepaisant to, buvę "Google" darbuotojai, su kuriais konsultavosi Fishkinas, galėjo tik patvirtinti, kad duomenys buvo panašūs į "Google" vidaus informaciją, tačiau aiškiai nepatvirtino, kad jie buvo gauti iš "Google" paieškos.
Buvusių "Google" darbuotojų įžvalgos
Buvusių "Google" vartotojų komentarai:
-
"Kai ten dirbau, neturėjau prieigos prie šio kodo. Bet tai tikrai atrodo teisėta."
-
"Ji turi visus "Google" vidinės API požymius."
-
"Tai "Java" pagrįsta API. Kažkas daug laiko skyrė tam, kad būtų laikomasi "Google" vidaus dokumentų ir pavadinimų standartų."
-
"Norėdamas įsitikinti, turėčiau skirti daugiau laiko, bet tai atitinka man žinomus vidaus dokumentus."
-
"Niekas, ką pamačiau trumpoje apžvalgoje, nerodo, kad tai yra kas nors, bet teisėta."
Šie teiginiai rodo, kad nors duomenys atrodo tikri, nėra galutinio įrodymo, kad jie gauti iš "Google" paieškos.
Atviras požiūris
Labai svarbu išlikti atviriems šiems duomenims, nes daugelis jų dar nepatikrinti. Darydami skubotas išvadas arba naudodamiesi duomenimis, kad patvirtintumėte jau turimus įsitikinimus, galite susidurti su patvirtinimo šališkumu, kai informaciją interpretuojate taip, kad ji sustiprintų jūsų turimą požiūrį.
Patvirtinimo šališkumo apibrėžimas:
"Patvirtinimo šališkumas - tai polinkis ieškoti, interpretuoti, palankiai vertinti ir prisiminti informaciją taip, kad ji patvirtintų ar paremtų ankstesnius įsitikinimus ar vertybes."
Pagrindiniai klausimai apie "Google" duomenų nutekėjimą
-
Nutekintos informacijos kontekstas: Ar duomenys susiję su "Google" paieška, ar kitais tikslais?
-
Duomenų paskirtis: Ar duomenys buvo naudojami faktiniams paieškos rezultatams gauti, ar vidiniam duomenų valdymui ar manipuliavimui?
-
Buvusių "Google" darbuotojų patvirtinimas: Buvę "Google" darbuotojai nepatvirtino, kad šie duomenys yra susiję su "Google" paieška, tik patvirtino, kad jie yra gauti iš "Google".
-
Atvira analizė: Venkite naudoti duomenis tam, kad patvirtintumėte seniai turimus įsitikinimus ir išvengtumėte patvirtinimo šališkumo.
-
Ryšys su dokumentų AI saugykla: Įrodymai rodo, kad duomenys gali būti susiję ne su "Google" paieška, o su išorine API, skirta dokumentų saugyklai kurti.
Ekspertų nuomonės apie "nutekintus" duomenis
SEO ekspertas Ryanas Jonesas pasidalijo:
-
Neaišku, ar duomenys skirti gamybai, ar bandymams.
-
Neaišku, ar tai skirta internetinei paieškai, ar kitoms vertikalioms sritims, pavyzdžiui, "Google Home" ar naujienoms.
-
Spėjama, kad kai kurie laukai taikomi tik mokymo duomenų rinkiniams, o ne visoms svetainėms.
DavidGQuaid tviteryje:
Efektyvaus SEO "viskas viename" platforma
Už kiekvieno sėkmingo verslo slypi stipri SEO kampanija. Tačiau turint daugybę optimizavimo priemonių ir metodų, iš kurių galima rinktis, gali būti sunku žinoti, nuo ko pradėti. Na, nebijokite, nes turiu ką padėti. Pristatome "Ranktracker" "viskas viename" platformą, skirtą efektyviam SEO
Pagaliau pradėjome registruotis į "Ranktracker" visiškai nemokamai!
Sukurti nemokamą paskyrąArba Prisijunkite naudodami savo įgaliojimus
"Nežinome, ar tai skirta "Google" paieškai, ar "Google" dokumentų paieškai debesyje. Atrodo, kad API pasirenka ir pasirenka - nesitikiu, kad algoritmas bus vykdomas būtent taip - kas, jei inžinierius nori praleisti visus tuos kokybės patikrinimus - atrodo, kad noriu sukurti turinio sandėlio programą savo įmonės žinių bazei."
Išvada
Šiuo metu nėra konkrečių įrodymų, kad "nutekinti" duomenys yra iš "Google" paieškos. Duomenų kontekstas ir paskirtis tebėra dviprasmiški, nes esama požymių, kad tai yra išorinė dokumentų valdymo API, o ne pagrindinis "Google" paieškos algoritmo komponentas. Šią informaciją būtina vertinti atsargiai ir vengti daryti galutines išvadas, kol ji nepatikrinta.