Twitter публикует код, который, как утверждается, определяет, какие твиты люди видят и почему.

Twitter публикует код, который, как утверждается, определяет, какие твиты люди видят и почему.

Twitter выполнил одно из многих обещаний генерального директора Илона Маска, опубликовав в пятницу днем ​​то, что, как он утверждает, является кодом для его алгоритма рекомендации твитов на GitHub .

Код, опубликованный под Стандартной общественной лицензией GNU Affero v3.0 , содержит множество подробностей о том, какие факторы делают твит более или менее вероятным для появления на временной шкале пользователя.

В сообщении в блоге, сопровождающем выпуск кода , команда инженеров Twitter (без конкретной подписи) отмечает, что система для определения того, какие «твиты являются самыми популярными, которые в конечном итоге отображаются на временной шкале вашего устройства» включает в себя множество взаимосвязанных сервисов и заданий.

Крупнейшим источником этих твитов являются «онлайн-источники» или пользователи, за которыми кто-то следит. Лучшие твиты из этого стека ранжируются по вероятности взаимодействия пользователя с автором этого твита; тем больше вероятность того, что их твиты появятся в For You. Для «офлайн-источников», за которыми не следит пользователь, Twitter считает твиты, которые привлекают внимание людей, на которых подписан пользователь, и твиты, которые нравятся тем, кому нравятся твиты, похожие на пользователя.

Уже те, кто смотрел код, заметили соображения, которые вызывают еще много вопросов. Многие выложили их, разумеется, в сам Твиттер.

Twitter только что опубликовал исходный код «алгоритма».

О, что это за файл? Предикаты для твитов на домашней временной шкале?

О, что за вторая картинка? pic.twitter.com/UE3dU8e3Os

31 марта 2023 г.

Олафур Вааге, старший инженер-программист норвежской консультационной службы по программному обеспечению TurtleSec, отметил, что внутри « HomeTweetTypePredicates.scala » некоторые из возможных соображений, по которым твит может быть кандидатом в раздел «Для вас», следующие:

  • author_is_elon
  • author_is_power_user
  • author_is_democrat
  • author_is_republican

В другом месте кода комментарий к коду, якобы оставленный инженером Twitter, поясняет, что эти идентификационные значения «используются исключительно для сбора метрик». Комментарий звучит так:

Эти списки идентификаторов авторов используются исключительно для сбора показателей. Мы отслеживаем, как часто мы обслуживаем твиты этих авторов и как часто их твиты производят впечатление на пользователей. Это помогает нам подтвердить на нашей экспериментальной платформе A/B, что мы не отправляем изменения, которые негативно влияют на одну группу по сравнению с другими.

Имена рассматриваемых объектов, такие как «DDGStatsDemocratsFeature» или «DDGStatsElonFeature», похоже, поддерживают эту интерпретацию, но это может быть невозможно подтвердить с помощью доступного кода. Однако интересно, что Twitter проверяет и сопоставляет эти переменные. Во время аудиосессии Twitter Spaces инженер Twitter отметил, что ярлыки, используемые для показателей, были демократами и республиканцами. Маск, который утверждал, что не знал о этикетках до сегодняшнего дня, предположил, что их там быть не должно.

Другие вещи, которые рассматриваются в отношении твита, включают в себя, является ли он менее 30-минутной давности, есть ли в нем изображения и является ли он «опытным пользователем», что, по словам некоторых, означает «устаревшую» проверенную учетную запись .

Сегодня большая часть алгоритма рекомендаций будет сделана с открытым исходным кодом. Остальные последуют.

Серьезным испытанием является то, что независимые третьи стороны должны иметь возможность с достаточной точностью определить, что может быть показано пользователям.

Наверняка будет много неловких моментов… https://t.co/41U4oexIev

31 марта 2023 г.

Маск написал в Твиттере вместе с сообщением в блоге компании, что алгоритм рекомендаций, утверждая, что это будет «кислотный тест», если «независимые третьи лица» смогут «определить с разумной точностью то, что, вероятно, будет показано пользователям».

Выпуск Twitter кода своего алгоритма происходит всего через несколько дней после того, как более широкий исходный код социальной сети был обнаружен на GitHub, который, по данным New York Times , может находиться там в течение нескольких месяцев . Затем Twitter получил повестку в суд, вынуждающую GitHub раскрыть информацию о плакате GitHub.

В отчете Platformer ранее на этой неделе говорилось, что Twitter использовал секретный список из 35 самых популярных пользователей Twitter, включая президента Байдена, Леброна Джеймса, Бена Шапиро и Маска. Доказательства реализации этого списка, который, как сообщается, частично вызван недовольством Маска своим собственным участием, еще не найдены в кодовой базе, размещенной в Твиттере.

В частности, код поступает всего за несколько часов до того, как «проверенные устаревшие» пользователи — те, кто был отмечен синей галочкой, чтобы указать на подлинность или известность до того, как Маск купил услугу, — должны быть прекращены в пользу платных подписчиков Twitter Blue. В то время как некоторые пользователи, связанные с правительствами и крупными организациями, могут подавать заявки на другие цветные галочки , только подписчики Twitter Blue за 8 долларов в месяц получат, среди прочего, «приоритетный рейтинг в разговорах».

Все эти изменения происходят 1 апреля, или в День дурака.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *