Yandexの大規模なコード漏洩により、ロシアの検索エンジンのランキング要素が明らかに
元従業員によって盗まれたとされる約45GBのソースコードファイルにより、ロシアのテクノロジー大手ヤンデックスの多くのアプリやサービスの基盤が暴露された。また、ほとんど公開されることのない、Yandex 検索エンジンの主要なランキング要素も明らかになりました。
「Yandex git ソース」は 1 月 25 日に torrent ファイルとして公開され、2022 年 7 月に撮影されたとされるファイルと 2022 年 2 月まで遡るファイルが示されています。ソフトウェアエンジニアの Arseniy Shestakov 氏は、Yandex の現従業員と元従業員に確認したところ、アーカイブの一部は「おそらく」会社のサービスの最新のソース コードが含まれています。」YandexはセキュリティブログBleepingComputerに対し、「Yandexはハッキングされていない」とし、漏洩は元従業員からのものであると述べた。Yandex は、「ユーザー データやプラットフォームのパフォーマンスに対する脅威は認識していない」と述べています。
具体的には、ファイルの日付はロシアがウクライナへの本格的な侵攻を開始した2022年2月まで遡る。Yandexの元幹部はBleepingComputerに対し、漏洩は「政治的」なものであり、元従業員はYandexの競合他社にコードを売ろうとしたわけではないと述べた。スパム対策コードも漏洩していません。
Yandexのソースコードの公開がセキュリティや構造に影響を与えるかどうかは不明だが、 Yandexの検索アルゴリズムに含まれる1,922のランキング要素の漏洩は確かに大きな騒ぎになった。SEO コンサルタントのMartin McDonald 氏は、Twitter のハッキングについて、「おそらくここ数年で SEO で起こった中で最も興味深い出来事」と述べています ( Search Engine Land の指摘)。研究者のAlex Buraks氏は、最も注目すべき要素のいくつかを詳述したスレッドの中で、「Google SEOにも役立つ情報がたくさんある」と示唆している。
第 4 位の検索エンジンである Yandex は、Google の元従業員を数名雇用していると言われています。Yandex は、コード内で特定された Google ランキング要素の多くを追跡し、Google と積極的に競争します。グーグルのロシア部門は最近、銀行口座と決済サービスを失ったとして破産を申請した。Burax 氏は、Yandex のランキング要素リストの最初の要素は「PAGE_RANK」であり、これはGoogle の共同創設者によって作成された基礎となるアルゴリズムに関連しているようだと指摘しています。
Burax が詳しく述べたように ( 2 つの トピック)、Yandex エンジンは次のようなページを好みます。
- あまり古くない
- オーガニック トラフィック (ユニーク訪問者) が多く、検索トラフィックが少ない。
- URL に含まれる数字とスラッシュは少なくする必要があります。
- 「PR = 0」による「ハードな悲観」ではなく、コードを最適化してください。
- 安全なサーバーでホストされている
- ウィキペディアのページまたはウィキペディアからのリンクであること
- ドメイン内の上位レベルのページにホストまたはリンクされている
- URL にキーワードを含めます (最大 3 つ)
Rob Osby のコンパイルされた検索ツールで、すべての要素を検索してクリックできます。1,000 近くのランキング要素に「TG_DEPRECATED」タグが付けられ、200 以上が「TG_UNUSED」としてリストされていることに気づいたかもしれません。コードの日付は 2022 年 2 月で、2022 年 7 月に受信されたため、Yandex 検索はそれ以来確かに変化しています。しかし今回のリークでは、世界最大規模の国の一つにサービスを提供するサイトで検索ランキングがどのように集計されているかを垣間見ることができる稀な事例となった。
以前、Yandex検索エンジンのコードは2015年に元従業員が自身のスタートアップに資金を提供するために闇市場で2万8000ドルで売ろうとした際に消失した。Yandex の主要製品のコア コードの数値が驚くほど低いことは、彼がその本当の価値を認識していないことを示していました。この従業員には執行猶予2年の懲役刑が言い渡されたが、規範は決して公表されなかった。
コメントを残す