Do AI chatbotu Gemini od Googlu přichází nová možnost generovat krátké hudební skladby. Stará se o to generativní model Lyria 3, který firma do chatbotu přidala. V betaverzi dokáže vytvořit skladbu o maximální délce 30 sekund.
Gemini umí hudbu vytvářet na základě textového zadání, nahraného obrázku nebo videa. Uživatel může v promptu popsat, jak má skladba znít, v jakém má být žánru či náladě. Chatbot ji pak vygeneruje včetně doprovodného obrázku (o ten se stará obrázkový generátor Nano Banana) a textu písně (funguje to i v češtině).
Podobné služby (Suno, Udio, ElevenLabs Music a další) fungují už řadu let a nabízejí méně omezení. jsou ale obvykle placené. Google zpřístupnil svůj generátor i neplatícím uživatelům Gemini.
Podle Googlu generátor není určen k tomu, aby kopíroval hudbu existujících autorů. Pokud uživatel v zadání použije jméno konkrétního umělce, Lyria 3 mu nabídne jen hudbu, která má podobný styl nebo náladu, slibuje Google s tím, že Gemini obsahuje filtry, které mají být schopné rozpoznat už existující písně.
Všechny vytvořené skladby jsou opatřeny zvukovým vodoznakem (pomocí systému SynthID od Googlu), který označuje hudbu generovanou umělou inteligencí. Gemini nově dokáže tento vodoznak rozpoznat i u audia, stačí jen skladbu nahrát a chatbota se zeptat. Funguje to samozřejmě jen u nahrávek vytvořených právě se SynthID.
Po testovacím provozu jen v USA Google také uvolnil model Lyria 3 tvůrcům obsahu na YouTube. Mohou ho využít k vytváření doprovodné hudby v krátkých videích YouTube Shorts.