"Je snadné si představit, že pokud bude někdo chtít lokalizovat svou stránku do jiného jazyka, zaplatí Duolingu méně, než by stál profesionální překladatel, počká si hodinu a pak už jen hotový překlad vloží na svůj web. A nemusí jít jen o web. Pro takovou Evropskou unii s jejími 23 oficiálními jazyky by to byl dar z nebes."
Hmmm, jo, to určitě. Nechat si zprasit stránky, které mají být vizitkou firmy, bandou lidí, co ten jazyk vlastně neumí a jen si to tak zkoušejí. Nejspíš jste ještě nikdy neviděl rozdíl mezi amatérským překladem a překladem od skutečného profesionála, který se vyzná ve svém oboru. A to nemluvím o tom, že tu je pořád rozdíl mezi amatérem (který ten jazyk umí) a těmi, kdo se teprve učí. Pro překlady specificky oborově zaměřených stránek se specifickou terminologií také naprosto nepoužitelné. No nic, myslím, že tohoto systému se překladatelé bát nemusejí.
Z jazyků a do jazyků, které mají jinou stavbu věty, to bude problém. A jak si ten program poradí s idiomatikou, která se liší od jazyka k jazyku a například v němčině s oddělitelnými předponami a výzmamovými slovesy na konci věty?
Uvedu příklad: Naše "dostat se z louže pod okap" má v angličtině ekvivalent "to jump out of fryer pan in to fire" - čili "skočit ze smažicí pánve do ohně".
Nebo uvedu dva idiomy v němčině: "Sie gingen durch Dünn und Dicke zusammen" znamená "Sdíleli spolu dobré i zlé". "Dunkelblau werden" neznamená "ztmavomodrat" ale "zpít se pod obraz".
Takže se mi zdá, že opět to bude projekt, kdy bude text překládán strojem ve stylu: "Massa Bob být hodná pán".
A táži se: Jak velké kapacity diskových svazků by musel mít server, který by zvládal kvalitně překládat texty z jazyka do jazyka a kolik "člověkoroků" by trvalo, než by se tam ty ekvivalenty a idiomatické obraty dostaly. A jak by se naprogramovala heuristika výběru kontextově správných ekvivalentů? Překládám AJ-NJ, AJ-ČJ, NJ-ČJ a ČJ-NJ. A "udělat" kvalitní překlad není mnohdy "procházka růžovým sadem". Mnohdy se musí i "číst mezi řádky". Myslím si, že naše profese hned tak nevymře. A ještě bych přidal: "Kolik jazyků znáš, tolikrát jsi člověkem.
Pokud člověk bere výuku cizího jazyka vážně, pak zjistí, že na sobě musí pracovat kontinuálně a jeho učení musí mít hlavu a patu. Pokoušet se neustále překládat nějaké texty může být pro něco dobré, ale časově neefektivní!!!
Začínám se učit španělštinu a líbí se mi např. tato stránka https://conjuguemos.com , kde procvičím naučenou teorii v praktických testech.
Také by mě zajímalo, jak často se bude stávat, že idiomy budou překládány masově jinak, než by měly.
Každopádně díky za tip na zajímavý projekt.
Problém překladů z angličtiny spočívá v idiomech, které se liší časově i místně a neexistují na ně použitelné slovníky.
Je to důsledek toho, že angličtina nemá fonetický zápis (na rozdíl od kontinentálních jazyků). Rodilí mluvčí se učí psanou angličtinu asi stejně, jako se my učíme cizí jazyky, a slovo, které nemají nabiflováno v grafické podobě, nejsou schopni ani přečíst, ani napsat (byť ho třeba v mluveném jazyce běžně používají). Z toho plyne potřeba vyjádřit se několika málo známými slovy, která dala vznik idiomům, v nichž omezený počet běžně známých slov nabývá významu těch, která se běžně nepoužívají.
MMCH dominance angličtiny na počítačích je dnes asi největší brzdou dalšího rozšiřování výpočetní techniky. Včetně toho, že kdyby se angličtina nechala stranou, tak by počítačové překlady mezi evropskými jazyky nebyly absolutně problém.
Nesdílím váš pesimismus - Wikipedie takto úspěšně funguje. Po Britannice, kterou sestavovali odborníci, dneska už neštěkne ani pes. O jiných encyklopediích (Encarta...) nemá smysl mluvit vůbec.
Jiný příklad - dabingy. Raději si pustím originální dabing s amatérskými titulky, než český "profesionální", kde je zpraseno vše od obsahu sdělení po intonaci.
Samozřejmě, že odborné texty se takto překládat nebudou ,ale to ani není účel.
Staci kdyz dostanou k prekladu celou stranku a budou si moci vybirat. Pak budou prekladat jen to co je samotne zajima a tam se da predpokladat o neco vyssi uroven znalosti specifickych terminu a ustalenych spojeni.
U urcite sorty dokumentu to samozrejme pouzitelne neni a nebude. U spousty veci to ovsem bude mit myslim vysledky velice slusne.
Takze profesionalni prekladatele (specializovani treba na pravnicke nebo technicke texty) se nemaji ceho bat. Studenti a další co takypřekládají ... tam je to něco jiného.
Jedna studie přišla se zjištěním, že v Britannice je přibližně stejně chyb na daný počet článků jako na Wikipedii.
Wikipedie je na tom ve skutečnosti lépe než Britanicca. Jsou tam všechny informace, jsou tam aktuální informace, jsou tam zájmové informace. A protože za všech stran se upozorňuje na opatrnost ve využívání informací z Wikipedie, tak pokud je chce člověk použít někde, kde je důležité, aby informace byly přesné, ověří si je jinde.
Vyzkoušel jsem, je to prasárna! Zcela nejednoznačné věty to striktně vyžaduje překládat jen jedním, nebo dvěma způsoby, tam kde by každý normální člověk použil present simple to tvrdošíjně vyžaduje present continuos .... Prostě pro mě zcela zavádějící a jsem učitel AJ na SŠ rozhodně nedoporučuji, krom toho je to o nervy :D Je to spíš jako hra, odhadnout co asi tak chce ten "blbec" slyšet :D
No já myslím, že by to fungovat mohlo, otázka je, jestli se překládá do rodného či z rodného, protože do rodného jazyka jsou překlady vždy o mnoho řádů lepší a nemají s nimi větší problém ani začátečníci.
V překladu do cizího jazyka bych se bál, tam opravdu masa lidí-laiků bude dělat typické chyby laiků. Ovšem odhaduji, že to půjde zkombinovat a hodnotit právě podle překladů lidí různé úrovně, s automatickými překlady atd. takže po několika iteracích z toho i tak bude moci vyjít kvalitní výstup. A jestli to dokáží i nakombinovat, jako že tam budou úlohy do a z rodného jazyka a nechají to pak ve finále doladit právě rodilými mluvčími, tak výstup už bude moci být opravdu dobrý.
Každopádně věřím, že vždy to bude lepší než čistě automatický překlad. A asi si nikdo nemyslí, že to bude konkurovat právním překladům, minimálně v prvních několika letech - jako kvalitnější náhrada google translate atp. to ale bude mít určitě své místo.
Mně se na tom líbí ten revoluční potenciál - i když šance, že se ten projekt povede podle představ autorů je velmi malá ... tak POKUD se povede, bude to v tomto oboru naprostý přelom.
Mám to štěstí, že jsem se dostal do private bety a jen tak ze zajímavosti se začal pro mě úplně nový jazyk (španělštinu) a musím říct, že je to velice návykové a zábavné ... skoro jako nějaká online hra :-)
probl0m překladů obecně spočívá (nejen) v idiomech, které se liší časově i místně a neexistují na ně použitelné slovníky.
Je to důsledek toho jak lidský mozek a lidská komunikace funguje a s komplikovaností pravidel pro čtení psaného jazyka a zápisu mluveného souvisí jen velmi velmi velmi volně.
MMCH vaše přesvědčení, že překlad řekněme z francouzštiny do češtiny je něčím jednodušší než překlad z angličtiny do češtiny, je velmi úsměvné. Dominance angličtiny, bez skoňování, s jednoduchou a logickou gramatikou a definovanou strukturou věty je brzdou tak maximálně pro lidi příliš líné se angličtinu naučit. Ovšem ti by měli úplně stejný problém u jakéhokoli jiného jazyka s možnou vyjímkou svého mateřského.
Vlastně možnávětší. Představte si dominanci čínštiny!
To není program, ale živí lidé.
Oni si tak zadarmo procvičují cizí jazyk (nemusí za to platit) a vy tak zadarmo dostanete překlad (nemusíte za to platit a pokud tak řádově méně než je obvyklé)
Jednoznačná win-win situace.
Systém spoléhá na to, že když dá ten samý text přeložit statisticky významnému počtu lidí, tak Vám z toho nakonec vypadne překlad srovnatelný s profesionálním.
Teď je otázka, jestli se tato očekávání autorům naplní.
Ale jako startup je to výborný a odvážný nápad.
Problém wikipedie, a obecně internetu, je - že zhruba 20% obsahu jsou sraxčky. Buď údaje vložené imbecilem v dobré víře, nebo zlým člověkem ve špatné víře, nad to celá řada mylných informací vzniklých čistě pro pobavení - a ve všech případech nenulová množina informací neověřených. Zatímco důstojná brittanica byla po desítky let cizelovaná a již vstupní informace byly oponovány - na web si může kdokoli fláknout cokoli, a nikdo neví kterých dvacet procent je ten exkrement.
Je to jako v tom prastarém vtipu, jak naštvaný farmář, co mu pořád někdo kradl melouny, jednoho večera dal na kraj pole ceduli: pozor v jednom melounu je jed. Ráno bylo na ceduli připsáno: teď jsou tady ty melouny dva.
wiki neni preklad, ovsem je pravdou, ze lecjaky "profesionalni" preklad je naprosta tragedie - specilene v IT (hry napr). Ale samo znamy je i duvod - dotycny vubec netusi, co preklada, coz by byl problem i v pripade, ze bude prekladat knizku.
Ovsem automaticky preklad nemuze fungovat. Jednoduse proto, ze jednotlive jazyky pouzivaji (napriklad) ruzna prirovnani, ktera ac prelozena spravne nedavaji smysl nebo se tim uplne vytrati vyzneni. Realny preklad = v 90% pripadu nejde vlastne o preklad, ale o volny prepis a autor/prekladatel musi zapojit vlastni fantazii. Jedine takto lze ziskat preklad opravdu dobry. A to nemluvim o situacich, kdy si autor zacne vymyslet vlastni libozvucna slova (to by me zajimalo, jak prelozite "nosocistoplena" tak, aby to neztratilo ani vyznam ani vyzneni).
"Systém spoléhá na to, že když dá ten samý text přeložit statisticky významnému počtu lidí, tak Vám z toho nakonec vypadne překlad srovnatelný s profesionálním."
Pravděpodobnější je, že začátečníci učící se nějaký jazyk budou spíše dělat stejné typy chyb. Takže statisticky z toho možná něco vyleze, ale docela pochybuji, že to bude slušný překlad, natož překlad srovnatelný s profesionálním. Hlavně opravdu je rozdíl mezi překladem a dobrým, profesionálním překladem. Nic, kde na úrovni a kvalitě překladu záleží, bych této službě rozhodně nesvěřil.
Oni právě věří, že dokáží celý systém vyladit tak, že kvalitativně bude na úrovni profi překladu (například: http://www.fastcoexist.com/multisite_files/coexist/imagecache/inline-large/post-inline/Screen%20shot%202011-12-13%20at%2010.57.40%20AM.jpg - na druhou stranu je to jejich PR, tak to sotva bude reprezentativní příklad :-))
Jestli se jim to povede, to my dva těžko teď vyřešíme sebelepší argumentací. Takhle "šílený" nápad se prostě musí vyzkoušet v praxi.
Za projektem nestojí žádná Béčka, ale zkušení a chytří lidé a osobně jim držím palce. Možná jejich překlady nebudou vhodné pro všechny, i tak si ale dokážu představit tisíce případů, kdy naopak vhodné budou.
Ano, na tom se snad shodneme - bude to vždy lepší než čistě automatický překlad, tj. připadá to v úvahu pro texty, které by jinak nebyly přeloženy vůbec.
Možná ale dojde k posunu vnímání překladu (jako fenoménu). Už dnes je definice "překladu" poněkud problematická - opírá se o zachování invariantů, přičemž tyto invarianty se zjišťují z provedených překladů. Ve výsledku jde tedy čistě o úzus a překladem je to, co společnost za překlad uzná. Translatologie se tedy s duolingem pravděpodobně vyrovná prostě tak, že jej popíše.
Navíc mnoho lidí pomíjí roli překladatele jako spolutvůrce cílového jazyka, a to by se zrovna nám Čechům stávat nemělo, neboť náš současný jazyk byl z velké části stvořen překladateli. Osobně si myslím, že pokud se duolingo masově rozšíří, dojde spíše k importu cizích (např. anglických) idiomů a syntaktických konstrukcí do češtiny. Vždyť tenhle proces probíhá už dnes, a probíhal dokonce před vynálezem automatických překladačů. Že se to nelíbí lidem s vytříbeným jazykovým vkusem? Však si počkejte, ono už příští či přespříští generaci to přijde úplně normální…
Potiz je prave v tom, ze zacatecnici casto delaji ty stejne chyby. Navic pokud netusi co vlastne prekladaji (neznaji souvislost) dopadne to jak sem zminoval vejs - jako kdyz mate "profesionalni" preklad hry, kde prekladatel mozna ani netusil, ze preklada hru, ale rozhodne ne, jestli jde o akcni strilecku nebo rpgcko. Jinde budu totiz hledat inspiraci pro preklad smlouvy a jinde pro preklad milostneho dopisu.
Navic v pripade dostatecneho rozsahu textu muzou existovat i stovky zcela spravne prelozenych variant, jen (prave vzhledem ke kontextu onoho textu) nemusi byt zadna vhodna.
Uz jen takova drobnost, ze chci videt, jak u standardniho en textu bez znalosti urcite, jestli mate tykat nebo vykat.