Hlavní navigace

Český překladač CUBBITT dokáže v přesnosti překonat člověka. Podívejte se na srovnání s konkurencí

22. 6. 2021
Doba čtení: 11 minut

Sdílet

 Autor: Depositphotos
Dosahují už strojové překladače úrovně lidského překladu? Otestovali jsme trojici překladačů – Google Translate, DeepL a CUBBITT 2018.

Německý překladač DeepL vzbudil v minulých týdnech mezi odborníky a novináři velké nadšení. Na rozdíl od Google Translate a podobných „mainstreamových“ překladačů totiž dokáže text z několika cizích jazyků převést do češtiny tak, že se výsledku skutečně dá rozumět. Věc je to natolik přelomová, že po automatickém překladu už prý začínají pokukovat i někteří nakladatelé, a zdá se, že práce lidských překladatelů je vůbec poprvé v historii v ohrožení.

Úspěchy v mezinárodním srovnání zaznamenal i český překladač CUBBITT, za kterým stojí odborníci z Matematicko-fyzikální fakulty Univerzity Karlovy. V tomto článku si porovnáme, jak si DeepL, Google Translate a CUBBITT poradí s překladem delšího literárního textu, a poté se podrobněji zaměříme na to, jak český zástupce ve světě automatického překladu funguje.

Aby to překladače měly těžší, vybral jsem jako ukázku překlad beletrie, a to knihy Brave New World od Aldouse Huxleyho, která je v češtině známá jako Konec civilizace. Ačkoliv český překlad pochází z roku 1970 a je tak více než 50 let starý, působí stále moderně. Záludnost sci-fi beletrie tkví v tom, že oproti novinovým článkům se v ní objevuje mnohem více neologismů. A navíc autoři pracuji s mnohem květnatějším jazykem, což v případě Huxleyho platí dvojnásob. „Překlad beletrie je nejtěžší, protože překladatelé se musí držet literárního překladu, navíc zejména u sci-fi bývá řada novotvarů,“ řekl Lupě produktový designér Jura Ibl.

Překladače dostaly za úkol přeložit do češtiny následující text. Pochází z vydání z roku 2014 a má rozsah více než jedna normostrana (celkem 1806 znaků s mezerami):

Přepis anglického znění Brave New World od Aldouse Huxleyho.
Autor: Lupa.cz

Přepis anglického znění Brave New World od Aldouse Huxleyho.

Jako referenční překlad jsem využil vydání od nakladatelství Maťa z roku 2020.

Originální překlad z českého vydání knihy.
Autor: Printscreen, Lupa.cz

Originální překlad z českého vydání knihy.

Strojové překlady si můžete prohlédnout zde:

Google Translate

Překlad od překladače Google Translate.
Autor: Printscreen, Lupa.cz

Překlad od překladače Google Translate.

DeepL

Předklad od překladače DeepL
Autor: Printscreen, Lupa.cz

Předklad od překladače DeepL.

CUBBITT 2018

Překlad z překladače CUBBITT verze 2018 dostupné na webu https://lindat.mff.cuni.cz/services/translation/ .
Autor: Printscreen, Lupa.cz

Překlad z překladače CUBBITT verze 2018 dostupné na webu https://lindat.mff.cuni.cz/ser­vices/translation/ .

CUBBITT 2020 Document-level

Překlad z neveřejné verze překladače CUBBITT 2020 Document-level.
Autor: Lupa.cz

Překlad z neveřejné verze překladače CUBBITT 2020 Document-level.

Pro srovnání jsme přidali i neveřejnou verzi překladače CUBBITT 2020 Document-level, která je modernější verzí CUBBITTu dostupného na webu. Z porovnání s originálem je zřejmé, že i letitému lidskému překladu od Josefa Kostohryza a Stanislava Berounského bychom mohli vytknout pár faktických nepřesností. Nejvíce do očí bijící je zřejmě překlad caffeine-solution party na posezení u šálku kávy, kdy doslovný strojový překlad na „kofeinový roztok“ bude v tomto případě blíže tomu, co chtěl autor říci. V dystopickém Londýně totiž káva zřejmě nepatřila mezi běžné nápoje

Naopak všechny tři překladače chybovaly v překladech jmen, kdy Google a DeepL shodně přeložili Ford jako brod. U jména Divocha pak Google a DeepL špatně odhadly, že nejde o vlastní jméno, ale o přezdívku. Zřejmě je zmátlo, že v některých pasážích je uveden jako Mr. Savage, v jiných jako The Savage. V tomto ohledu správně uspěl jen CUBBITT. Subjektivně se pak dá říci, že nejhůře dopadl Google Translator, byť i jeho výsledek můžeme označit za slušný. Rozdíly mezi DeepL a CUBBITT jsou jasně patrné, nicméně v některých větách byl přesnější německý překladač, v jiných zase český.

Jak to funguje?

Přesný způsob práce překladače DeepL jeho autoři zatím neodtajnili, nicméně je známo, že využívá neuronové sítě, což je u moderních překladačů nejčastější způsob překladu. CUBBIT vznikl konkrétně na bázi technologie Google Transformer, jejíž kód dal Google v roce 2017 k volnému užití. Výzkumníci z Matfyzu kód postupně vylepšovali do dnešní podoby. Google má pro svůj překladač k dispozici obrovské množství dat takřka z celého internetu. CUBBITT využívá menší datové soubory, ale důkladně je čistí.

„Od běžného strojového učení se překlad liší tím, že není úplně jasné, co má být správný výsledek, protože správných překladů existuje víc a někdy je těžké rozlišit, který je lepší,“ vysvětluje autor překladače CUBBITT Martin Popel z Ústavu formální a aplikované lingvistiky Matematicko-fyzikální fakulty Univerzity Karlovy. „A stejně jako v jiných oblastech strojového učení je i zde spousta problémů kvůli trénovacím datům. Překlad trénujeme na velkém množství přeložených vět v češtině a angličtině, v menší míře pak zkoušíme i další jazyky. Máme 60 milionů anglicko-českých vět z různých zdrojů, většinou stažených z internetu. Našli jsme jich mnohem víc a část toho know how je, jak ta data vyčistit, tedy smazat z nich chybné překlady, ze kterých by se mohl překladač naučit něco špatně,“ vysvětluje Popel.

Stejně jako konkurenční překladače i CUBBITT využívá tzv. Back-translation. Jde o proces, kdy překladač využívá k trénování české nebo anglické věty, ke kterým není k dispozici překlad. „Jde o vlastně velmi jednoduchý trik, kdy nejdříve české věty přeložíme do angličtiny a potom se učíme z těchto anglických vět překládat zpět do češtiny. Takže zdrojové anglické věty jsou sice přeložené strojem, ale ty cílové, které se učíme vytvářet, jsou ty původní české. Toto přidáme k trénovacím datům, takže jejich soubor zvětšíme. Tuto technologii předpokládám využívají ostatní překladače, které jsou založené na neuronových sítích, ale v čem se ten náš liší, je speciální způsob vyvážení těchto dvou zdrojů dat, jednojazyčných a bilingvních.“

Autoři překladače tímto způsobem zněkolikanásobili zdrojová trénovací data a rozšířili počet textových domén. Dalším krokem je iterovaný back-translation, kdy se při překladu trénovacích dat používá překladač, který byl sám trénován pomocí předchozí generace back-translation. „CUBBITT se od ostatních překladačů liší speciálním způsobem míchání těch dvou zdrojů dat při back-translation, tedy autentických, přeložených lidmi, a syntetických, původně jednojazyčných, které následně přeložil stroj. Tu speciální metodu jsme nazvali Block back-translation.“

„Mimo to jsme zjistili, že autentická data a syntetická data mají jiné výhody a nevýhody, kvality a problémy. Většina anglicko-českých trénovacích dat, které máme, byla původně napsaná v angličtině a přeložená do češtiny. To znamená, že jsou v nich chyby, protože i lidé při překladech chybují, navíc kvalita trénovacích dat je velmi různá. My vlastně většinou nevíme, kdo to překládal a jestli měl nějakou kvalifikaci. U původně českých dat tento problém není, ty jsou samozřejmě z definice správně, i když tam mohou být překlepy. Problém je, že když to přeložíme do angličtiny, tak potom zdrojová anglická strana může obsahovat nějaké chyby, právě tím, že jsme to překládali strojovým překladačem. Ale když udělám takto několik iterací back-translation tam a nazpátek, tak se kvalita zvýší.“

Lepší než člověk?

Srovnat jednotlivé překladače podle jedné konkrétní metriky je obtížné, protože některé jsou lepší v plynulosti překladu, jiné zase ve formální správnosti. Autoři CUBBITTu se v roce 2018 zúčastnili soutěže, o jejímž výsledku vydali loni článek v odborném žurnále Nature Communications

„Systém, který v něm popisujeme, je z roku 2018. Od té doby jsme ho trochu vylepšili. V soutěži se porovnávaly nejznámější strojové překladače, jejichž autoři tehdy chtěli zůstat v anonymitě, a jako referenční se používal překlad od profesionální překladatelské agentury. Nejlépe se umístil náš systém CUBBITT, který byl hodnocen jako signifikantně lepší než lidský překlad, což mě samotného hodně překvapilo. Na stejné úrovni s lidským překladem pak skončil systém z University of Edinburgh. Komerční překladače byly hodnoceny jako horší než lidský překlad.“

Při zpětné analýze hodnocení pak Popel zjistil, že jeho CUBBITT překonal člověka v přesnosti překladu. Naopak v plynulosti zaostával. „Záleželo také, jestli to hodnotili neprofesionálové, nebo profesionální překladatelé a také na jejich osobních preferencích. Velká otázka byla prokázat, že je ten překvapivý výsledek pravda, že to není nějaká chyba evaluace. Důvodem je v zásadě to, že překladatelská agentura udělala nějaké chyby, jinak by výsledku nebylo možné dosáhnout. Letos pak lidský překlad vyšel mírně lepší než můj překladač,“ vysvětluje Popel s tím, že stroj ale na rozdíl od člověka nedělá překlepy a obecně lépe zvládá gramatiku.

„Zkoušeli jsme i vyhodnocení takovou obdobou Turingova testu, kdy jsme lidem dali za úkol uhodnout, jestli je daná věta přeložená strojem, nebo člověkem. Nazvali jsme to Translation Turing Test a v tom většina hodnotitelů nedokázala signifikantně rozlišit výstup CUBBITTU od lidského překladu, což vzhledem k předchozím výsledkům není až tak překvapivé, ale tenkrát jsme tím byli překvapeni. Naopak Google Translate hodnotitelé až na jednu výjimku vždy dokázali od lidského překladu odlišit.“

Nová verze pracuje s kontextem

Zatím neveřejná vylepšená verze CUBBITTu posouvá překlad ještě dál tím, že překládá více vět najednou. „Aby to fungovalo, uživatelé tam musí dát rovnou alespoň celý odstavec najednou, nikoliv jednotlivé věty. Existuje spousta složitých technologií, jak vytáhnout kontext z okolních vět, nicméně já jsem nakonec použil poměrně jednoduchou metodu, že překládám opravdu víc vět najednou, a mírně jsem ji vylepšil tím, že přeložím třeba prvních pět vět, pak přeložím třeba od druhé do šesté věty a od třetí do sedmé a většinou z toho použiji jenom ten prostředek, kde jsem zjistil, že ta kvalita je nejlepší, protože to zná kontext zleva i zprava. A výsledky pak spojím dohromady.“ Překlad celých dokumentů je ale podle Popela zatím v plenkách, i když se na vývoji usilovně pracuje.

Co se největších nedostatků dnešních překladačů týče, Popel si myslí, že velké mezery jsou zejména v evaluaci, kdy je velmi složité kontrolovat, zda stroj překládá správně. „Další věc je, že tím, že se to přiblížilo úrovni lidského překladu, je velmi těžké určit, kam jít dál. Je pořád několik oblastí, ve kterých se strojový překlad dopouští chyb, které by člověk neudělal. Občas je to takové docela trapné. Třeba přeloží nějaká vlastní jména, přitom by měla zůstat nepřeložená. Nebo u čísel, když je mnoho číslic za sebou, tak je někdy změní třeba o řád, což může mít velmi vážné důsledky. Zrovna tyto dvě chyby a pár dalších se snažím se svými studenty momentálně řešit. Velmi častý vzorec je, že jedna verze překladu je plynulejší a druhá je přesnější a vlastně se ani lidé neshodnou na tom, která je obecně lepší.“

Samostatnou kapitolou je pak editace přeložených dokumentů, tedy očištění od chyb a nepřesností, případně přeformulování některých kostrbatých vět. Přitom i tato činnost by ideálně měla probíhat automatizovaně. „Vždy je potřeba, aby to ještě někdo zkontroloval, nebo zeditoval. Spolupracujeme nyní i s firmami, které se tímto zabývají, a je těžké, aby systém určil, kde si je jistý a kde si není jistý. Firmám by nevadilo, kdyby u nějakých vět překlad vůbec nevydal a nechal by to na lidech. Souvisí to s tím, že překlad je často velmi plynulý, a když ho někdo kontroluje, tak tam nějakou chybu přehlédne. To se ale děje i u lidského překladu. Dokud výstupy překladače byly takové kostrbaté, tak to každý vzal s rezervou. Kdežto dnes je tu tohle riziko. Například už se stalo, že kvůli chybnému překladu byl v Izraeli zatčen Palestinec, který napsal na Facebook Dobré ráno a přeložilo se to jako Attack them,“ uzavírá Popel.

Přijdou překladatelé o práci?

Podobný test, jako jsme si ukázali na začátku článku, byť v menším rozsahu, zkoušel i produktový designér Jura Ibl, který se o výsledek podělil na Twitteru. Ibl pochází z překladatelské rodiny a vývoj překladačů podle něj může přinést výrazné změny na nakladatelském trhu. „V některých případech tato technologie už dokáže nahradit člověka. Třeba u odborné literatury nebo pokud je důležitější rychlost než literární forma. Navíc, v řadě aplikací už funguje simultánní automatický překlad, dělá na tom řada firem, akorát to ještě nikdo nezkouší s knihami. A je jen otázkou času, než třeba Amazon řekne svým autorům ‚dejte nám svoje knížky, my je necháme přeložit do e-booků, když budete mít slušné prodeje, uděláme i tištěnou verzi a do toho audioknihu načtenou robotem vyvzorkovaným z hlasu autora‘,“ vysvětluje Ibl.

Lupa tip MF temata2

Profesionální lidské překlady mají oproti těm strojovým stále řadu nesporných kvalit. Například specifické nebo málo známé výrazy člověk na rozdíl od stroje protáhne do delšího souvětí, ve kterém termín vysvětlí. Na druhou stranu, lidský překlad trvá velmi dlouho, zpravidla i několik měsíců. „Knížky se nejvíc prodávají v určitých okamžicích. Třeba umřel Steve Jobs a nakladatelé okamžitě potřebovali mít na pultech jeho přeložené životopisy. Potřebovali prostě zareagovat na aktuální situaci. A u titulů, kde dochází k takovým vlnám, je jen otázkou času, než si někdo řekne ‚tady bychom mohli vydělat strašně moc peněz‘ a zkusí automatický překlad titulu. To samé platí u knih pro omezené skupiny čtenářů, které se nevyplácí překládat. Zároveň tam tolik nevadí, že překlad třeba není literární. Jediná nevýhoda je pořád pozice editora, který bude ještě dlouho potřeba.“

Funkcí editora je, aby zkontroloval, zda překlad dává smysl, a zároveň zaručil přenos rukopisu autora i do cizího jazyka. „Specifičtí autoři, typu J. K. Rowlingová, mají své zažité literární zvyky a obraty. A překladatel musí při překladu zachovat i kontinuitu se zbytkem díla autora. DeepL už tohle umí. Když do něj vložíte text jednou, tak si ho zapamatuje a příště to udělá lépe a popříště zase lépe. Takže pokud jsme vyřešili problém překladatelů, tak další na řadě je problém editorů. A ten se dá vyřešit tou stejnou technologií. A pak už bude zbývat v procesu jen jádro, tedy vydavatel či nakladatel a autor, kteří chtějí zisk a snaží se odstranit všechny ostatní překážky.“

Autor článku

Novinář a moderátor, redaktor Lupa.cz a spolupracovník Českého rozhlasu Plus. Dříve působil také v marketingu a pracoval ve státní správě.