AI chatbot Grok firmy xAI má za sebou další incident se zmanipulováním svých odpovědí. Řada uživatelů si v minulých dnech stěžovala na to, že Grok do odpovědí na dotazy na sociální síti X začal často přidávat zmínky o údajné genocidě bílé populace v Jihoafrické republice. Tuto konspirační teorii přitom zmiňoval i u naprosto nesouvisejících témat.
Podle xAI za podivnými reakcemi stála neoprávněná úprava tzv. systémového promptu chatbota. „Tato změna přiměla Grok poskytovat na politické téma konkrétní reakce a porušila naše interní pravidla a firemní hodnoty. Zahájili jsme důkladné vyšetřování a zavádíme opatření, která zvýší Grokovu důvěryhodnost a transparentnost,“ přiznala firma.
K oněm opatřením patří například to, že xAI začala na GitHubu zveřejňovat znění systémových promptů Groka. Firma také přislíbila změny v procesech, které souvisejí s kontrolou kódu před jeho ostrým nasazením a vytvoření týmu, který bude kontinuálně monitorovat případné incidenty s Grokovými reakcemi a bude shcopný na ně rychle reagovat.
Podobný problém řešila společnost také letos v únoru. V systémovém promptu se tehdy objevila instrukce, aby Grok ignoroval všechny zdroje, které zmiňují, že majitel xAI Elon Musk či americký prezident Donald Trump šíří dezinformace. Také tehdy to firma vysvětlovala neschválenou aktivitou svých zaměstnanců.
Konkurenční OpenAI zase letos v dubnu stáhla nejnovější verzi svého modelu GPT-4o, protože se její chatbot ChatGPT začal k uživatelům chovat příliš podlézavě.