Данные Яндекса по-прежнему доступны в Сети, их можно найти по запросу “yandex git sources”
Согласно утечке Яндекс осуществляет прослушивание своих пользователей, что является негативным моментом для репутации компании. Из исходного кода компании также стало известно о наличии других проблемных моментов, которые могут повлиять на ее имидж. Изначально эти файлы не представляли угрозы, но эксперты нашли несколько настораживающих деталей.
Заметим, что Яндекс сам сообщил прессе об утечке данных, не ожидая скандальных публикаций. С точки зрения PR — это самый правильный выход из сложившейся ситуации.


Насколько опасна утечка данных из Яндекса в 2023?

Яндекс моментально отреагировал на инцидент, заверив, что в утечке части git-репозитория нет персональных данных пользователей. Представители компании также заявили, что алгоритмы поисковика не были взломаны. Утечку данных объяснили действиями бывшего недобросовестного сотрудника, который опубликовал устаревшую информацию.
Каждая компания, занимающаяся разработкой программного обеспечения, не обходится без использования репозитория. Он позволяет хранить и управлять исходным кодом проектов, а также делать его доступным для совместной работы. Поэтому для программистов репозиторий — ключевой рабочий инструмент.
Важно, что репозитории не предназначены для хранения личных данных пользователей, а служат для эффективной работы с кодом и совместной разработки проектов. 
Представители Яндекс заявили, что ведут внутреннее разбирательство причин утечки фрагментов исходного кода во Всемирную паутину, однако не видят угрозы для данных пользователей или работоспособности своих сервисов. Эксперты утверждают, что утечка не представляет никакой угрозы ни для внутренних ресурсов компании, ни для личных сведений пользователей. 
То есть запустить «свой Яндекс» дома не получится — коды являются лишь небольшой частью огромной структуры. Но пытливым умам программистов данные репозитория могут помочь получить представление о рабочих процессах компании и раскрыть некоторые интересные решения.

Что любопытного в исходном коде Яндекса

  • В утекших данных находится раздел Security — он указывает на продвинутые инструменты аутентификации и защиты информации в Яндексе.
  • Исходный код не содержит уязвимостей и даже намеков на таковые, которыми могут воспользоваться злоумышленники.
  • Алгоритмы Яндекс разрабатывает преимущественно самостоятельно с нуля вместо использования общедоступных решений с открытым исходным кодом.
  • Для корпоративного общения в Яндексе используют Telegram (ну, это мы знали и без анонимных хакеров).

Специфика работы разработчиков в Яндексе

Как оказалось, каждый разработчик в Яндексе имеет доступ к коду из огромного внутреннего хранилища, называемого «Аркадия» (по-видимому, в честь основателя компании Аркадия Воложа). «Аркадия» содержит и исходный код, и другие корпоративные данные. Бывший сотрудник просто скачал код из хранилища и опубликовал в Сети. Категорически осуждаем бывшего сотрудника Яндекса за такие действия.
Программисты отмечают, что модель работы, при которой у каждого разработчика компании есть доступ ко всему исходному коду, удобна и практична. Такая модель позволяет быстро и эффективно разрабатывать код. При этом ключевые файлы, необходимые для работы всех служб, загружаются из других мест, доступ к которым есть не у всех разработчиков. Это позволяет даже при утечке кода обезопасить информацию, так как ключевые файлы будут недоступны для злоумышленников.
Яндекс провел проверку своих алгоритмов после того, как в Интернете были опубликованы фрагменты, используемые для тестирования. Одним из таких алгоритмов было включение микрофона умной колонки "Алиса" без голосовой команды пользователя. По словам компании, эта функция была предназначена для улучшения качества активации "Алисы" и была использована только во время тестирования.
После утечки исходного кода Яндекса выяснилось, что некоторые личные сведения в нём всё-таки присутствовали. К примеру, контактная информация водителей Яндекс.Такси.
И ещё немного интересных выводов из анализа исходного кода Яндекса:
  • В Яндекс.Такси и Яндекс.Еда есть группы пользователей, которые получают приоритетную поддержку.
  • Некоторые сервисы можно настроить, изменив параметры поиска изображений и видео. Например, фотографии В.В. Путина были заблокированы в ответ на популярные мемы.
  • Исходный код содержал расистские высказывания, не относящиеся к услугам компании.

Секреты алгоритма ранжирования Яндекса

Благодаря тщательному анализу исходного кода поисковика, исследователи выявили список реальных факторов, которые влияют на позиции сайтов в поисковой выдаче на текущий 2023 год. И теперь SEO-оптимизаторам и другим специалистам, занимающимся разработкой и продвижением сайтов, доступен полный список этих параметров.

После утечки данных Яндекс объявил о намерении разработать собственные стандарты и принципы техноэтики, которые будут опубликованы на сайте компании и станут частью её общих политик. В рамках этой инициативы российский техногигант обещает исправить все фрагменты кода, которые нарушают эти принципы.

Мы не знаем, была ли утечка данных произведена недобросовестным бывшим сотрудником Яндекса или это была спланированная PR-кампания. Но в любом случае это сыграло на руку техногиганту. Яндекс не только справился с направленным на него негативом, но и повернул всю ситуацию в свою пользу. Нам только остаётся учиться!