Moses
Mojžíš je provádění statistické (nebo aktivovaný) přístup na strojový překlad (mt). To je dominantní přístup v oblasti v tuto chvíli, a zaměstnává on - line překlad systémů uskutečněné takové, Google a Microsoft. V poslední době se náš hybridní systém s chimérou, Mojžíš jako ústřední prvek, vedly lépe než Google přeložit, když překládal z angličtiny do češtiny. Toto interaktivní demo slouží jako ilustrace překladatelských schopností Mojžíše. Napsat nějaký text v levém dolním rohu krabice a vidím, že jsou automaticky převedeny na létání v rámečku vpravo. Při ukázání myši nad textem v jedné z krabic, aby viděl frázi zarovnání. Pro neinteraktivní použití vidět odpočinek API dokumentaci.
Google Translate
Mojžíš je implementace statistické (nebo řízené daty), přístup k strojového překladu (MT). To je dominantní přístup v oblasti v současné době, a je zaměstnán pro on-line překladatelských systémů nasazených likes Google a Microsoft. V poslední době se náš hybridní systém Chimera, s Mojžíšem jako centrální složku, lepší výsledky než Google Překladač při překládání z angličtiny do češtiny.
Tento interaktivní demo slouží jako ilustrace překladatelských schopností Mojžíše. Napište nějaký text v levém dolním poli a vidět, že je automaticky přeložen z běhu do pole vpravo. Najeďte myší nad textem v jedné z krabic vidět zarovnání fráze. Pro non-interaktivní využití viz REST API Dokumentace.
Však my víme, že to s překladem není tak jednoduché, jak se píše v novinách. :-)
A když už náš systém do češtiny dáváte do kontrastu s Google Translate, tak musím zmínit, že na novinových textech jsme Google porazili (už dvakrát), i když to tak z vaší ukázky nevypadá. Demo na webu je jen velmi ořezaná varianta tohoto systému: http://ufal.mff.cuni.cz/chimera
Ještě pro upřesnění: náš systém pro anglicko-český překlad je vyladěný na překlad novinových textů, v němž se akademicky "soutěží" v rámci WMT Translation Task a ve kterém naše Chiméra už dvakrát po sobě zvítězila nejen nad ostatními akademickými systémy, ale právě i nad Google Translate a Bing Translatorem. Při překladu jiných typů textu ale může docházet k takto nešťastným výběrům překladů.
Webové demo je navíc podstatně ořezaná verze systému -- chybí komponenty, které překlad výrazně zlepšují, avšak pro nasazení v reálném čase jsou zatím příliš pomalé (syntaktický překladový systém TectoMT a automatický korektor Depfix) a modely jsou kvůli rychlosti značně prořezané.
Tak Google má asi v kapse taky něco trošku lepšího, než co dal online zdarma pro všechny.
Ale nic proti, dobrá práce. Kdyby nám někdo před 15 lety řekl, že bude online zdarma překlad z čehokoliv do čehokoliv, tak se budu hodně smát. Dejme tomu ještě pár (desítek?) let a překladatelé nebudou mít co žrát :)
Jestli to spíš nebude tím, že Google translate je produkce běžící na škálovatelné, geograficky distribuované a několikaTFloop farmě. Oproti tomu kluci z UFALu jsou ve škatulce 'research' s velmi minimalistickými prostředky oproti Google. BTW Google má zdarma poněkud nesrovnatelně rozsáhlejší databázi duálních textů/trénovacích dat.
Takže bych se rozhodně nepouštěl do srovnávání nesrovnatelného.
BTW2 Nazdar Aleši, snad neplácám do větru... :).
Jasně, sice máme výpočetní cluster, ale nemůžeme si dovolit ho celý použít na demo překladového systému :-) Jo, pokud si nás někdo zaplatí, abychom mu přeložili nějaké texty, tak to je jiná...
Jiná věc jsou ta data, Google má celej internet třikrát a denně si to aktualizuje, to fakt není v našich silách. A k tomu má i spoustu neveřejných dat, jako třeba z Google Books, texty které mu lidi zadávají do Google Translate, feedback od lidí kteří v Google Translate používají funkci "Navrhnout lepší překlad"... to my prostě nemáme.