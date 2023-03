Kvanta článků předpovídajících, které profese jsou nástupem AI nejvíce ohroženy, jsou povětšinou jen ukázkou clickbaitu. Hrají na strunu strachu ze ztráty zaměstnání a z nedostatečných informací vyvozují nepodložené závěry. Oblíbeným tématem je bohužel i věštění, kolik novinářů AI připraví o práci. Nástup veřejně dostupných velkých jazykových modelů (LLM) přitom je z hlediska médií skutečně zajímavým tématem, které jde daleko za plytké předpovědi dalšího vyprázdnění redakcí.

Generátory obsahu, jako jsou v obrázcích DALL-E, Midjourney či Stable Diffusion a v textech ChatGPT či LaMDA (Google Bard), nejsou inteligentní v pravém smyslu slova. Jde o statistické modely, které se snaží na základě obrovského množství dat a slovního zadání dotazu odhadnout nejpravděpodobnější pokračování věty či podobu obrázku. Kvalita jejich výstupu je závislá na množství trénovacích dat, na syntaxi dotazu, na opravných mechanismech, které mají zajistit, že aplikace nebude dávat nepřijatelné výsledky, a řadě dalších faktorů. Zatímco podobu dotazu ovlivňuje uživatel, natrénování a korekce jdou za provozovateli LLM.

Z těchto vlastností vychází řada nedostatků, které dnes generátory vykazují. ChatGPT často dává nepřesné nebo přímo vymyšlené odpovědi (tzv. halucinuje). Jazykový model totiž nemá skutečné znalosti, jen se snaží poskládat slovní odpověď, která mu vychází jako pravděpodobná. Podobné je to u obrázků: pokud nevíte, jak správně strukturovat slovní zadání, budete nejspíš z výsledků často dost zklamaní. Fungování a limity LLM v nedávném textu Deník N velmi dobře popsal Petr Koubský (paywall).

Jak mohou generátory změnit média? Psát články místo novinářů zatím nejspíš nebudou. Experimenty s automatickým vytvářením krátkých textů už probíhají delší dobu (viz pokusy české zpravodajské agentury ČTK) a je čím dál jasnější, že jejich publikováním bez přísné editorské kontroly si médium zadělává na nehezký problém. Nedávno to ukázal případ serveru CNET, který používal generátor pro vytváření krátkých textů sloužících k průniku na čelní pozice ve výsledcích vyhledávání. Texty ale obsahovaly řadu faktických chyb, které před vydáním nikdo neodhalil: z 77 vydaných článků musel server následně opravit celkem 41.

Strojové texty CNETu byly primárně určeny k získávání návštěvnosti z vyhledávačů. Server Futurism citoval ex-zaměstnance CNETu, podle kterého automat přibližně každé dva týdny přepisoval úvody těchto krátkých článků, aby ošálil algoritmy Googlu a udržel je ve výsledcích hledání co nejvíc nahoře. Nevím, jestli se podobné postupy uchytí právě v oblasti SEO, vyhledávače se totiž pravděpodobně budou zneužívání svých algoritmů bránit, ale automatizace distribuce obsahu (nebo odkazů na něj) s pomocí generátorů textu, obrazu a časem i videa by myslím mohla být pro redakce přínosem.





Doručování obsahu čtenářům je dnes totiž jedním z největších problémů médií. Vstupními portály na internet jsou hlavně vyhledávače, sociální sítě či velké e-commerce platformy, které díky tomu inkasují nejvíc peněz z digitální reklamy. Jak přitom ukazují výzkumy, organická návštěvnost ze sociálních sítí se postupně snižuje. V Česku si k tomu můžete přičíst nešťastnou novelu autorského zákona, po které Google a Facebook přestaly zobrazovat u článků médií tzv. snippety. Po prvních dvou měsících velcí tuzemští vydavatelé zaznamenali propady návštěvnosti především z Facebooku, u Googlu zatím tvrdí, že žádné větší změny nepozorují.

Kdyby například média kombinací AI aplikací získala nástroj, který by z dlouhého redakčního textu, podcastu či videa dokázal automaticky vygenerovat krátký souhrn do mobilní aplikace, ještě kratší upoutávku (nebo třeba fotku s grafem, krátký zvuk, GIF, komiksový strip či videosekvenci) pro newsletter nebo ke sdílení na sociálních sítích (různou variantu na různé sítě, podle toho, jaké publikum se na nich vyskytuje), jejich potenciál oslovit čtenáře/posluchače/diváky by se výrazně zvýšil. Připočtěte si k tomu, že se dnes všechny tyto výstupy dají rovnou automaticky překládat do různých jazyků. Bez lidské kontroly výstupu se však stále neobejdeme.

Vytváření přímého kontaktu a vztahu se čtenáři je pro média a novináře stále důležitější. Každý uživatel, který na web média přijde napřímo, třeba kliknutím na odkaz v newsletteru, snižuje závislost redakce na vyhledávačích, sociálních sítích či hlavní stránce Seznamu. Věrným čtenářům se také dá lépe nabízet předplatné. A s ústupem cookies třetích stran se na uživatele, kteří se na webu přihlásili, dají lépe cílit reklamy.

S nástupem jazykových modelů se v online médiích dají očekávat také experimenty s novými formáty. Nejde jen o možnost nechat si „převyprávět“ článek v rámci textové (či časem hlasové) konverzace. AI asistent může nabízet kontext v závislosti na tom, kterou část textu uživatel právě čte, odpovídat na otázky, které ho u článku zrovna napadly, nebo nabízet další obsah, který by ho mohl zajímat. V zásadě nejde o nic nového, LLM ale mohou podobné nástroje vylepšit. Bude také hodně záležet na tom, jak moc se nové konverzační rozhraní mezi lidmi uchytí.

Jazykové modely se samozřejmě budou v redakcích používat i jako pomůcky při psaní článků. Skoro bych se vsadil, že řada novinářů je už dnes víc či méně otevřeně testuje. Když se ale dnes o LLM píše hlavně jako o generátorech obsahu, je to velké nedocenění jejich skutečného potenciálu. Dokáží totiž především „přečíst“ velké množství textů (dat) a zpracovat je do uživatelem požadovaného formátu. Modely se navíc už dnes dají doladit (fine-tune) vlastními daty tak, aby u konkrétního tématu byly schopné dávat konkrétnější a přesnější odpovědi. Opět však platí, že bez lidské kontroly výsledku to (zatím) fungovat nebude.

Ukázka možné implementace LLM do vyhledávače Microsoft Bing Autor: Microsoft

Není ale všechno zlato, co se AI. Plány na nasazení konverzačních neuronových sítí ve vyhledávání či v prohlížečích pravděpodobně budou znamenat další ránu pro návštěvnost mediálních webů. Google či Bing si od nich jasně slibují prohloubení dlouholeté snahy o to, aby uživatelé z výsledku hledání pokud možno nikam nedocházeli. Konverzační rozhraní nabízí místo seznamu odkazů odpovědi formulované do celistvého textu a linky na zdroje jsou výrazně omezené. Pokud zůstane v této podobě, mohou média očekávat pokles návštěvnosti z těchto zdrojů. Tedy – pokud neskončí s nesmyslným tažením za zpoplatnění snippetů a nezačnou se aktivněji bránit skutečnému vytěžování svého obsahu.

Potenciálně nebezpečná je také možná závislost na globálních tvůrcích velkých jazykových modelů. Jejich natrénování, dotrénování, nasazení korekcí a provoz jsou velmi nákladné a dá se zvládat jen na cloudových superpočítačích. Vývoj takových aplikací si tak může dovolit jen pár firem, jako jsou Google, Meta, Amazon, Baidu či Microsoftem financovaná organizace OpenAI. Objevují se sice první vlaštovky LLM, které slibují mnohem nižší nároky na výpočetní výkon – jeden takový nedávno představila firma Meta, přístup k nim je ale zatím omezený.

Berte tuto glosu jako nástřel témat, která by vydavatele měla zajímat. Určitě existuje řada dalších využití, která mě zatím ani nenapadla. Jedna věc je ale myslím jasná: i když jsou vydavatelé médií obvykle v přijímání nových technologických trendů velmi konzervativní a neustále opakují analogovou mantru „obsah je král“, měli by se možnostmi a riziky velkých jazykových modelů vážně zabývat. Pokud totiž nenabídnou na nich založené služby, prohlížeče, vyhledávače či rychle vznikající startupy to udělají za ně.