Hlavní navigace

Midjourney zkouší webové rozhraní. Jak vypadá a co umí?

6. 5. 2024
Doba čtení: 4 minuty

Sdílet

Obrázkový generátor Midjourney testuje webové rozhraní. V čem je lepší než dosavadní zadávání promptů přes Discord?

V posledních dvou letech se generativní AI stala jedním z nejvýznamnějších trendů v technologickém světě. Nástroje jako Midjourney způsobily revoluci v tom, jak kreativci přistupují k vizuálnímu obsahu. Ačkoliv mnozí uživatelé znají Midjourney především skrze jeho původní integraci s Discordem, pokud jste v něm vygenerovali aspoň 100 obrázků, máte čerstvě možnost tvořit přes jejich webové rozhraní (ještě nedávno přitom byla podmínka aspoň 1000 vygenerovaných obrázků). 

Webový interface nabízí daleko příjemnější ovládání, které zaslouží bližší pohled. Jedním z jeho hlavních přínosů je jeho uživatelská přívětivost. Na rozdíl od Discordu, kde se noví uživatelé mohou snadno ztratit v množství kanálů a zpráv a musí umět zadávat příkazy a parametry v podobě jednoduchého kódu, webové rozhraní nabízí čisté a intuitivní prostředí. 

Uživatelé mají na jednom místě možnost prohlížet výtvory ostatních tvůrců v záložce „Explore“, přímočarý přístup k nástrojům pro tvorbu obsahu přes „Create“, mají také přehled o svých projektech v „Archivu“, kde je možné třídit výtvory podle lajků, data, verze a dalších parametrů a mohou snadno spravovat své předplatné a nastavení. 

Vybraný obrázek je možné samozřejmě dále upravovat – dělat varianty, upscalovat, zoomovat apod. Pro detailní popis všech funkcí webu doporučuji zhlédnout tohle video:

Mezi Midjourney na Discordu a ve webovém rozhraní mi přijdou jako nejzajímavější tyto rozdíly: 

  • možnost vytvářet obrázky na webu (klikněte na „Create“)
  • můžu si v archivu uspořádávat obrázky do složek
  • možnost testovat první veřejné místnosti a společně vytvářet obrázky (klikněte na „Rooms“)
  • vytváření soukromých a vlastních místností přijde v průběhu příštích týdnů. 

Ačkoliv je Discord stále populární platformou pro uživatele Midjourney a třeba mně osobně se v něm pracuje dobře, nové webové rozhraní přináší zjednodušení a zefektivňuje tvorbu digitálního obsahu. Hlavní výhoda webu spočívá v centralizaci a organizaci práce. Zatímco Discord je primárně komunikační platforma, webové rozhraní je navrženo specificky pro práci s generativní AI. To znamená, že všechny nástroje a funkce jsou navrženy s ohledem na efektivitu a uživatelský komfort. 

Uživatelé samozřejmě mohou používat obě platformy souběžně. I ve webové verzi mohou například používat parametry stejným způsobem jako v Discordu (tzn. na konec za prompt přidat –parametr xx). Je tu ovšem jeden rozdíl: zatímco obsah vygenerovaný v Discordu se objevuje v archivu na webu Midjourney, obrázky vygenerované na webu se v Discordu neobjevují. 

Podívejte se, jak vypadá nové webové rozhraní Midjourney:

ebf - tip - debata

Na závěr ještě několik obecnějších tipů k používání Midjourney: 

  1. Využijte galerii. Nebojte se prohlížet a inspirovat se v galerii Midjourney, kde najdete výtvory jiných uživatelů. Může to být skvělý způsob, jak se naučit nové techniky nebo najít zajímavou inspiraci. Já sám jako filmař, fotograf a ilustrátor sice znám všemožné výtvarné techniky, umělce, druhy renderů, ohniskové vzdálenosti a světelnosti objektivů a podobně, a navíc jsem postupem času nasbíral hromadu promptů a fíglů, jak je psát, nicméně pokud potřebuju něco rychle vytvořit, osvědčilo se mi vyhledat, jak podobné téma ztvárnili ostatní, a prozkoumat, jaké vychytávky v promptu použili. 
  2. Drobnost, kterou moc lidí neví: pokud nemůžete promptem zaboha dosáhnout nějakého kýženého výsledku, zkuste změnit aspect ratio (–ar XX), dokáže to dost výrazně ovlivnit výsledek.
  3. Naopak věc, která je asi docela v povědomí lidí (aspoň v mé bublině AI nadšenců): z Midjourney lezou hezčí obrázky (forma), ale DALL-E z textu lépe pochopí, co po něm chcete, a přesněji trefí výsledek obsahově. DALL-E také líp umí generovat texty, i když i Midjourney se v tom poslední dobou zlepšilo.
  4. Dost často slýchám, že Midjourney umí jen líbivé obrázky a všechny jsou na jedno brdo. Tady platí pravidlo „shit in – shit out“. Pokud do promptu dám jen popis motivu, ale nic dalšího k výtvarné technice a podobně, dostanu zprůměrovaný výsledek, který si většina uživatelů vybere na základě nerozvinutého promptu. Což bývají líbivé až fotorealistické věci. Pokud chci něco specifického, musím to dost podrobně zadat. Můj prompt k podkladovému obrázku k videu Star Wars by Karel Zeman vypadá například takto: „Group of Stormtroopers with few mandalorians watching screen inside star destroyer in the style of a Victorian illustration in the style of 1900 Jules Verne engraved illustrations, Intaglio, fine detail etching by Giovanni Battista Piranesi. Line drawing and hatching in black and white in the manner of Alphonse Marie de Neuville like the engravings of the books of Jules Verne. An 18th century engraving, detailed monochrome, intricate woodwork, victorian, machine-like precision.“ A to si ještě následně hraju s různými parametry, chaosem, stylizací a tak dále.
  5. Komplexnější návod k použití obrázků vygenerovaných v Midjourney pomocí funkce zoom out ve videu. Pokud chcete tvořit „infinite zoom videa“ vhodná pro průlety časem a prostorem, podívejte se tady na making ofvideu z loňského ročníku AI konference pro kreativce Pravidla se změnila
  6. Pokud se někdo budete chtít do tématu ponořit hlouběji, mrkněte na dvoudenní intenzivní kurz AI pro kreativce. Během 16 hodin koukneme na zub všem aktuálním nástrojům potřebným k vytváření nabušených videí pomocí umělé inteligence (a že jich je, od tvorby konceptu videa, scénáře, přes zvuk – voiceover, ruchy, hudbu až po obraz a následné rozanimování, případně lipsync a jednoduché rozhýbání 3D postav). Jen na Midjourney máme vyhrazenou hodinu a půl času.

Do budoucna jsem hodně zvědavý na ohlášené Midjourney video a 3D (protože do AI videa jsem nejvíc zavrtaný). Pravděpodobně bude fungovat na podobném principu jako Runway Gen2 a PikaLabs, takže to během pár vteřin bude nějak iterovat obrázek a trefovat se víceméně náhodně, ale třeba se dočkáme překvapení.

Byl pro vás článek přínosný?

Autor článku

Vizionář, digitální vypravěč, umělec. Věnuje se platformě pravidlasezmenila.cz, která pořádá mimo jiné konferenci o využití AI pro kreativce, vede animační studio 60seconds.cz.

Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).