Massiv Yandex-kodläcka avslöjar ryska sökmotorrankningsfaktorer

Massiv Yandex-kodläcka avslöjar ryska sökmotorrankningsfaktorer

Nästan 45 GB källkodsfiler som påstås ha stulits av en före detta anställd har avslöjat grunden för många av apparna och tjänsterna från den ryska teknikjätten Yandex. Det avslöjade också viktiga rankningsfaktorer för Yandex sökmotor som nästan aldrig offentliggörs.

Yandex git-källor ” publicerades som en torrentfil den 25 januari och visar filer som påstås ha tagits i juli 2022 och går tillbaka till februari 2022. Mjukvaruingenjören Arseniy Shestakov hävdar att han kontrollerade med nuvarande och tidigare Yandex-anställda att några av arkiven ”förmodligen innehålla uppdaterad källkod för företagets tjänster.” Yandex berättade för säkerhetsbloggen BleepingComputer att ”Yandex inte hackades” och att läckan kom från en tidigare anställd. Yandex uppgav att de ”inte ser något hot mot användardata eller plattformsprestanda.”

Närmare bestämt går filerna tillbaka till februari 2022, när Ryssland inledde en fullskalig invasion av Ukraina. Den tidigare Yandex-chefen sa till BleepingComputer att läckan var ”politisk” och noterade att den tidigare anställde inte försökte sälja koden till Yandex konkurrenter. Anti-spam-koden har inte heller läckt ut.

Även om det är oklart om avslöjandet av Yandex källkod har säkerhetsmässiga eller strukturella implikationer, gjorde läckan av 1 922 rankningsfaktorer i Yandex sökalgoritm verkligen mycket brus. SEO-konsulten Martin McDonald beskrev Twitter-hacket som ”förmodligen det mest intressanta som hänt inom SEO på flera år” ( som noterats av Search Engine Land) . I en tråd som beskriver några av de mest anmärkningsvärda faktorerna, föreslår forskaren Alex Buraks att ”det finns mycket användbar information för Google SEO också.”

Yandex, den fjärde största sökmotorn, påstås anställa flera tidigare Google-anställda. Yandex spårar många av Googles rankningsfaktorer som identifieras i dess kod och konkurrerar aggressivt med Google. Den ryska divisionen av Google ansökte nyligen om konkurs efter att ha förlorat sina bankkonton och betaltjänster. Burax noterar att den första faktorn på Yandex lista över rankningsfaktorer är ”PAGE_RANK”, som verkar vara relaterad till den underliggande algoritmen skapad av medgrundarna av Google .

Som Burax berättade i detalj (i två ämnen ) föredrar Yandex-motorn sidor som:

  • inte för gammal
  • Har mycket organisk trafik (unika besökare) och mindre söktrafik.
  • Deras webbadress ska innehålla färre siffror och snedstreck.
  • Ha optimerad kod, inte ”hård pessimisering” med ”PR = 0”.
  • Hosted på säkra servrar
  • Vara Wikipedia-sidor eller länkar från Wikipedia
  • Hostad eller länkad till sidor på högre nivå i domänen
  • Ha sökord i din webbadress (upp till tre)

Du kan söka och klicka på alla faktorer i Rob Osbys sammanställda sökverktyg . Du kanske har märkt att nästan 1 000 rankningsfaktorer har ”TG_DEPRECATED”-taggen och mer än 200 är listade som ”TG_UNUSED”. Eftersom koden är daterad februari 2022 och mottogs i juli 2022, har Yandex-sökningen verkligen förändrats sedan dess. Men läckan ger en sällsynt inblick i hur sökrankningar sammanställs på en sajt som betjänar ett av världens största länder.

Tidigare försvann Yandex sökmotorkod 2015 när en före detta anställd försökte sälja den på den svarta marknaden för $28 000 för att finansiera sin egen start. Den förvånansvärt låga siffran för Yandex huvudprodukts kärnkod visade att han inte var medveten om dess verkliga värde. Den här anställde fick ett två års villkorligt fängelsestraff och koden offentliggjordes aldrig.

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *