Hlavní navigace

OpenAI uvedla nový multimodální model GPT-4o, bude dostupný i neplatícím uživatelům

13. 5. 2024

Sdílet

AI - OpenAI - ChatGPT - multimodalita Autor: OpenAI

Nová verze jazykového modelu OpenAI nese označení GTP-4o („o“ pochází z výrazu „omni“). Firma ji začíná postupně zpřístupňovat jak uživatelům s předplatným (Plus a Teams, později Enterprise), tak lidem, kteří používají verzi ChatGPT zdarma. Používání bude omezeno limitem, který má být u platících (Plus) uživatelů 5× vyšší než u free verze (u Teams ještě vyšší). Konkrétnější čísla firma neuvedla.

S novým jazykovým modelem přichází pravá multimodalita, slibuje OpenAI. GPT-4o podle firmy dokáže na vstupu pracovat s jakoukoli kombinací textu, zvuku a obrazu a stejně tak umí jakoukoli kombinaci vygenerovat na výstupu. Reakční doba se přitom blíží odezvám při konverzacích lidí, dodává. 

Předchozí modely zpracovávaly zvukové povely postupně: nejdřív přepsaly zvuk do textu, pak GPT-3.5 nebo GPT-4 text zpracovaly a vygenerovaly textový výstup, a ten pak bylo nutné znovu „přečíst“ jako audio. Průměrné odezvy modelů se tak pohybovaly v řádu sekund. GPT-4o měří odezvy v milisekundách (průměr je podle OpenAI 320 ms), což hlasovou konverzaci dále přibližuje zážitku z rozhovoru s člověkem.

Podívejte se na ukázku některých schopností GPT-4o, jak je v krátkém demu ukázal spoluzakladatel OpenAI Greg Brockman:

OpenAI také oznámila desktopovou aplikaci ChatGPT, která ale zatím bude k dispozici jen pro systém macOS a vyvolávat se bude klávesovou zkratkou Option + Space. Aplikace bude nejprve dostupná platícím uživatelům, na free verzi se dostane později.

Řešení matematických úloh s novou verzí ChatGPT:

Našli jste v článku chybu?

Byl pro vás článek přínosný?

Autor aktuality

Šéfredaktor Lupa.cz a externí spolupracovník Českého rozhlasu Plus. Dříve editor IHNED.cz, předtím Aktuálně.cz a Českého rozhlasu. Najdete mě na Twitteru nebo na LinkedIn

Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).