Twitter zpřístupnil část svého zdrojového kódu, včetně algoritmu, který sociální síť používá k doporučování tweetů svým uživatelům. Šéf Twitteru Elon Musk napřed slíbil kód zveřejnit do 5. března, později tento závazek posunul na konec března.





Twitter na server GitHub nahrál dva repozitáře obsahující kód několika částí, díky nimž sociální síť funguje. Provozovatelé v příspěvku na blogu tento postup charakterizovali jako „první krok k větší transparentnosti“ a zároveň jako „prevenci rizik“ pro samotný Twitter a uživatele zapojené do platformy.





Sám Musk na Twitter Spaces připustil, že kód má své mouchy. „Naše první zveřejnění algoritmu bude docela rozpačité a lidé v něm najdou spoustu chyb, ale my je velmi rychle opravíme,“ dušoval se Musk. „Alespoň budete vědět, že s vámi nikdo tajně nemanipuluje,“ dodal. Vlastník Twitteru tento postup přirovnal k vývoji unixových operačních systémů s otevřeným zdrojovým kódem. „Lidé mohou teoreticky objevit mnoho zranitelností pro Linux. Komunita pak tyto zjištěné exploity identifikuje a opraví,“ vysvětlil Musk.

Twitter dále uvedl, že pracuje na nástrojích pro správu návrhů kódu od komunity a synchronizaci změn s interním úložištěm. Ty by měly být zpřístupněny v budoucnu. „Budeme přijímat návrhy změn, a to nejen kvůli zjištěným chybám, ale i kvůli dalším vylepšením algoritmů,“ řekl Musk na Twitter Spaces.

Zveřejněný algoritmus je na první pohled poměrně složitý. Skládá se z několika modulů, včetně modelu pro detekci závadného či urážlivého obsahu, či výpočtu „reputace“ uživatele Twitteru.

Několik neuronových sítí je pak zodpovědných za řazení tweetů a doporučování účtů ke sledování. Filtrovací komponenta pak naopak některé tweety skrývá, aby „podpořila dodržování právních předpisů, zlepšila kvalitu produktů, zvýšila důvěru uživatelů a ochránila příjmy sociální sítě“.

V příspěvku na technickém blogu Twitter prozradil více o doporučování. Algoritmus každý den čeká přibližně pět miliard spuštění.

„Dnes se časová osa For You skládá půl na půl z příspěvků lidí, které sledujete, a lidí, které nesleduje. U jednotlivých uživatelů se to může lišit,“ uvedl Twitter. „Řazení [tweetů] je dosaženo pomocí neuronové sítě o přibližně 48 milionech parametrů, která je průběžně trénována na interakcích tweetů s cílem optimalizovat pozitivní zapojení (např. lajky, retweety a odpovědi).“

Server Gizmodo poznamenal, že Twitter zřejmě úmyslně nezveřejnil kód k seznamu VIP. Další server Platformer totiž informoval, že Twitter má rotující seznam sledováníhodných uživatelů, včetně YouTubera Mr. Beasta a zakladatele Daily Wire Bena Shapira, který používá k monitorování změn v doporučovacím algoritmu tím, že zdánlivě libovolně zvyšuje viditelnost těchto „VIP uživatelů“.

Existují další důkazy, že algoritmus může s tweety zacházet rozdílně v závislosti na jejich zdroji. Výzkumnice Jane Manchun Wongová poznamenala, že algoritmus Twitteru výslovně označuje, zda je autorem tweetu Elon Musk, a má i další štítky, které uvádějí, zda je autor „influencer“, republikán nebo demokrat.

Tyto štítky se pak podle Muska prý používají pouze pro měření. Musk ale dodal, že o štítcích předtím a že by existovat do budoucna neměly.