Hlavní navigace

Názory k článku 60 minut s Googlem

  • 11. 1. 2005 8:47

    Michal Krsek (neregistrovaný)
    Par univerzit uz jsem navstivil, ale ze by nekde sedeli na balonech a kolem volne pobihali psi, to mi zustalo utajeno.

    Mozna jen autor zopakoval klise, ktere nekde slysel, mozna mel na mysli atmosferu na kolejich.

  • 11. 1. 2005 9:11

    indianek (neregistrovaný)
    ...Denně se na celém světě vyhledávají asi 2 miliónů dotazů. ... fakt? hmmm to mam poměrně slušnej podíl na provozu google já sám :-)
  • 11. 1. 2005 9:21

    Thomsn (neregistrovaný)
    no taky se mi to zda difny...? mozna ze to zas neni tak uspesna sluzba..o))
  • 11. 1. 2005 9:40

    Michal Krsek (neregistrovaný)
    Pojedes z ze SJC (Mileta San Jose International Airport) po 101 na server (az do Mountain View), odbocis na Amphitheatre Pkwy :-)

    A az tam poletis, dej si pozor, abys nemel letenku do San Jose v Kostarice.

  • 11. 1. 2005 10:04

    Tomáš Benda (neregistrovaný)
    Proc to resit takovym zpusobem? Neni jednodussi kod zbozi mobilem vyfotit a nasledne prohnat OCR-kem? Nebo tu fotku zOCR-kovat primo na vyhledavacim serveru...
  • 11. 1. 2005 10:43

    Zdeněk (neregistrovaný)
    Hlavně vidím problém v tom, že v databázi google nebudou všechny obchody. Takže třeba levnějšího obchodníka v ulici za rohem nenajdete. A co teprve až bude google nabízet AdCode ;-)
  • 11. 1. 2005 10:47

    Johanka (neregistrovaný)
    Ne nadarmo delam pocitacovou lingvistiku - automaticky preklad neni zadna sranda, a i kdyz do toho jde Google s nadsenim a hromadou lidi i pocitacu, IMHO jim to nepomuze (nebo se pak my vsichni ostatni budem moct jit vycpat). Kor se statistickymi metodami (nevim o tom, ze by pouzivali jine). Samozrejme, na nejakou drsne omezenou (tematicky i jazykove - zpravy o pocasi apod.) mnozinu jim to pujde a vsichni budou rikat jupi, ale obecne to nebude fungovat jeste dlouho (ja bych spis rekla ze nikdy, ale ocekavam, ze za par desitek let prijde nejaky zasadni prulom a zase se to zacne delat uplne jinak). Kazdopadne i preklad z jazyka A do jazyka B je drsny sousto (dosud nevyreseny), jestli chtej prekladat N jazyku do N jazyku, tak se muzu akorat zasmat.
  • 11. 1. 2005 10:58

    pajout (neregistrovaný)
    Podle mne to nepujde na 100 % bez porozumeni textu (a kontextu :). Typicky třeba "Ženy holí stroj.".
  • 11. 1. 2005 10:58

    zz (neregistrovaný)
    Aaaa - dlouho sme tu nemeli fantazirovani nejakeho toho duchovniho otce Internetu. Jeste chybelo prohlaseni typu "64 KB by melo stacit vsem..." ;o)
  • 11. 1. 2005 10:59

    Vladimír Seman (neregistrovaný)
    Aj ja si myslím, že "překlad bude težko" a počkáme si naň ešte dosť dlho. Predsa: stroje ešte dlho nedokážu nahradiť ľudský prístup. K prekladu treba mať aj niečo ako "jazykový cit". Nemčina má 4 pády, slovenčina 7,...pritom každý jazyk má svoje špecifiká => IMHO aby výsledok automatického prekladu nevyzeral doslova smiešne, budú sa musieť zamestnanci Google ešte veľmi snažiť - i keď je ich výber sofistikovaný, kancelárie netradičné, majú jedlo zdarma, všade im pobehujú psy a panuje pohodová atmosféra... :-)
  • 11. 1. 2005 11:02

    Johanka (neregistrovaný)
    zen_u_ holi stroj - takhle jsi z toho vykuch jeden vyznam :)
  • 11. 1. 2005 11:11

    pajout (neregistrovaný)
    Jo, uz si vzpominam, slysel jsem tu Tvou verzi. Mne se zase libi predstava zen, jak pomoci holicich strojku holi stroj.
  • 11. 1. 2005 11:17

    czRoPa (neregistrovaný)
    Sohlasím s Johankou, řekl bych, že strojový překlad je v plenkách. Když jsem měl naposledy tu čest, setkat se s výsledky překladů en-cz z různých služeb a programů, raději jsem si zobrazil původní anglický text, i když anglicky moc neumím. Hoši z googlu asi ještě neviděli češtinu (se svým skloňováním ..), jestli něco takového vytvoří, tak to bude stejně jako když to napíše větnamec( ja chtít prace (nic proti větnamcům :-) )). Takový překladač by musel rozumnět kontextu, využití metod umělé inteligence.. .No nebudu se vykecávat, kdo neumí ani how do you do, tak to snad využije.
  • 11. 1. 2005 11:24

    Johanka (neregistrovaný)
    Ze to bude "ja chtit praci" si nemyslim, protoze oni maji na uceni *obrovsky* mnozstvi dat, takze jsou schopny vykoukat, jak ty vety maj doopravdy vypadat (veta musi obsahovat finitni sloveso, nejaka ta shoda apod., na to nemusej umet cesky ani vedet, kolik ma cestina padu, to vsechno (si myslej ze) se naucej z tech dat).

    Takze vysledek bude vypadat civilizovane...akorat nebude odpovidat vstupu, no :) A v tu chvili, kdy tenhle vysledek z ty cerny skrinky dostanou, uz s tim tezko neco udelaji.

  • 11. 1. 2005 11:25

    Tom (neregistrovaný)
    Ja mel taky moznost vyzkouset par poslednich stroj. prekladacu a vsechny do jednoho nedokazaly prelozit ani jednoduche fraze. Ale kdyby rozpoznavali jednotlive vety jako celek nebyl by problem pri dnesnich TB mit strojovy preklad na velmi dobre urovni!
  • 11. 1. 2005 12:05

    tenis (neregistrovaný)
    No clanek je docela sila. Autor videl reklamni sot a vylicil nam co se dozvedel. Jak s Googlem vsechno pujde samo. Google za nas bude sjizdet vsechny filmy a pak psat recenze ve vsech jazycich... Clanek by asi snesl kritictejsi ton...
    A propos, preklad webovych stranek dela treba babelfish.altavista.com. Je pravde ze za moc nestoji, uvidime jak bude vypadat Googli verze...
  • 11. 1. 2005 12:10

    John (neregistrovaný)
    ...ale z ceho vlastne ta firma zije?
    na cem vydelava?
    vsude vidim Google, Google...
    vsechno je zdarma nebo si to alespon myslim
    muze mi to nekdo z pritomnych vysvetlit?
    diky
  • 11. 1. 2005 12:19

    SUNicko (neregistrovaný)
    Myslim, ze pokud by nekdo, klidne i Google podobny cisty strojovy preklad do cestiny ci jinych narocnejsich jazyku dotahl do konce, bylo by to mozna i na Nobelovku, otazkou je v jakem oboru, ja bych to klidne soupnul i do literatury :)
  • 11. 1. 2005 12:57

    Petr Šnajdr (neregistrovaný)
    Není pravda, že satelitními snímky je pokryta jen Serverní amerika a malá část světa. Poměrné rozsáhlé datové zroje jsou i v jiných končinách planety jako střední východ, Japonsko atd. Je pravda, že k pokrytí celé planety ještě zbývá hodně práce, ale už teď jsou pokryty i části antarktidy :-)

    Docela dobře je na tom třeba Řím nebo Atény. Myslím, že Atény jsou i jedním z prezentačních míst.

    Trochu horší situace je s dalšími datovými zdroji jako jsou restaurace, hotely atd. atd. tam víceméně platí ta popsaná situace: převážně severní amerika.

    Nicméně i to není úplně pravda, jen je svět pokrýván postupně od těch zajímavějších míst k těm méně zajímavým. Takže většinou tam kde se něco děje už data jsou i když se nejedná o rozsáhlá území.

    Atény májí na svědomí třeba olymp. hry, poměrně rozsáhlé části iráku zase tamnější politické poměry ;-) apod.

    Pokud se týká těch dotazů na Google tak jich nejsou 2 miliony, ale dvě miliardy za den - což počítáno v pageviews se "udělá" na servrech v iAuditu ("český internet") za 2 měsíce :-). Trochu jiná měřítka :).

    Zajímavější jsou technologie, které za tím stojí, ne to co vidí uživatel. To co vidí uživatel je současnost, to co je za tím je budoucnost.

    I když zrovna KeyHole Google koupil minulý rok tak je to technologicky velice zajímavá věc. Není to zdaleka 3D mapa, dokonce to ani není způsob jak dostávat obrázky a mapy z nějakého serevru na nějaký klientský počítač, to jsou jen konkrétní způsoby použití. Ale to by bylo na celý článek :-)

    Po světě existuje pár technologických ekvivalentů toho co dělá Google, v ČR v zásadě nikdo neinvestuje a zřejmě ani v budoucnu nebude schopen investovat ani do vývoje nebo výzkumu ve směru jaký jde třeba jen samotná technologie od KeyHole. Ale to už jsme odbočil trochu moc, ale přišlo mi, že ten článek moc kouká po povrchu a ne co je pod ním :-)
    A to je mnohem lepší a zajímavější :-)
  • 11. 1. 2005 13:15

    Tom (neregistrovaný)
    Nesouhlasím s Johankou, strojový překlad od googlu určitě bude. Už teď existují programy na slušné úrovni, pro češtinu třeba na www.britanik.cz. Google to určitě posune ještě dál. Akorát tady v česku si na to asi ještě chvíli počkáme...
  • 11. 1. 2005 13:21

    Brouzdej Blog (neregistrovaný)
    Nezbývá než autora pochválit. BTW: chybí tam důležitá informace, že zaměstnci google mohou 1 pracovní den v týdnu trávit tvorbou soukromých projektů.
  • 11. 1. 2005 13:32

    Petr Šnajdr (neregistrovaný)
    Ten pořad běžel tuším na SBS. Když už jsme u těch drobností tak mě docela rozesmálo jak jak Sergey se zamyslel po té co se ho ta slečna zeptala nejdřív zdali stále na lýžařské vájezdy jezdí všichni tj. celá firma, on odpověděl, že ano a ona se ho zeptala kolik mají zaměstnanců a na odpověď 3000 řekla: "to jsou opravdu velké výlety" :-))). Moc hezká mimika :)

  • 11. 1. 2005 13:42

    David Weil (neregistrovaný)
    Cože? Tohle že je ukázka slušné úrovně? A jak tedy vypadá ta "neslušná"?

    Přeložit "Be Donald Trump’s next Apprentice - Apply now." jako "Být Donald Trump je příště učeň - Platit nyní." a tvrdit přitom, že to je slušný překlad, to už chce tedy hodně velký nedostatek soudnosti. A to se ještě na Vámi uvedené adrese chlubí, jak Britanik zohledňuje celé věty.

    No, aspoň to pobavilo.




    Mimochodem - nedávno přišel do jedné konference dotaz od cizince, který si mail nechal do češtiny přeložit podobným programem. Nikdo dotaz nepochopil a to ani při pokusu o zpětný doslovný překlad. Považuji to za výmluvný příklad úrovně překladačů.
  • 11. 1. 2005 14:23

    Martin Kuželka (neregistrovaný)
    Kdyby někdo chtěl vidět víc fotek z Googleplexu, než je jich v článku, ať navštíví http://www.6smarketing.com/googlevisit .
  • 11. 1. 2005 14:54

    PaJaSoft (neregistrovaný)
    Nesouhlasim. Zamyslete se lidi nad tim, kde to drhne a co je tim omezenim... Po teto strance neni lidsky mozek nic jineho nez stroj, ktery se neco naucil a pak aplikuje... nepripomina Vam to neuronove site? Spravne! Zaklad by tu byl uz docela dlouho, jazyky Lisp a Prolog nejsou pro srandu kralikum, pravda dneska je spise sexy Java ci C++, pro otrlejsi starsi predkove jako Ada ci Simula (?). Ostatne, kouknete do libovolne hry, v cem je dnes psano to AI...

    Problem tohoto pristupu byl a stale je jen a jen v omezenych zdrojich - jak baze dat, tak potrebnem obrovskem vypocetnim vykonu. Obojimu se firme Google aktualne dostava - predstavte si ten zasitovany Google jako obrovsky pocitac - kam se hrabou nejvetsi superpocitace dneska... Ono dokonce nevadi ani ty vypadky, ze to neni Fault Tolerant, lidsky mozek taky ne, proste na chcili neco ze zve baze zapomene...

    Ja si naopak myslim, ze automatizovany preklad z mnoha do mnoha jazyku je strojove zvladatelny pri dostatecne velike bazi (semantika se nauci pomoci neuronovych elementu) a odpovidajicim vypocetnim vykonu.

    Ja uz jsem zaznamenal okolo roku 2001-2, ze jeden nejmenovany telco operator testuje STROJOVY SIMULTALNI preklad telefonickych hovoru - mam pocit, ze to bylo Japonsko vs. Francie nebo nejaky podobny jazykove "pribuzny"... - takze ja bych to tak cerne vubecnevidel, ackoli je fakt, ze tento vyzkum se na verejnost prilis nepopularizuje...

    A preklad z jazyka A do jazyka B prece je davno, vzdyt je to obycejne relacni zobrazeni, jde jen o to pokud mozno co nejpresneji popsat tu relaci. Je hezke, ze britove maji kosatou anglictinu (a miliony hantecu - co mesto to jiny underground), co z ni udelali Amici vime, ze tu spisovnou anglictinu neuslysite ani v Britskem kralovstvi, protoze poddani si to take zjednodusuji je nabiledni. Pujdeme-li do historie, urcite ten preklad bude problem (ale nerikam nemozny), ale dnesni "simple" verze anglictiny, cinstiny a normalnich jazyku - to zas tak cerne rozhodne nevidim...

  • 11. 1. 2005 14:56

    PaJaSoft (neregistrovaný)
    Doplnte si slusnou znalostni bazi, automatizujte sklonovani a casovani dle pravidel ceskeho pravopisu, vybudujte ani ne moc velikou bazi vyjimek a mate to... - co chybelo do ted byl vypocetni vykon (a drive castecne i ulozny prostor), zbytek je po teoreticke rovine zvladnut dost dlouho, pokud kvantovy pocitac nebude jen hracka v laboratori, muzeme se se soucasnym pohledem na IT jit vseci klouzat neb budeme prevalcovani.
  • 11. 1. 2005 15:15

    petr (neregistrovaný)
    1) preklad bez znalosti kontextu bude vzdycky stat za prd; a kontext (tj. "pochopeni sveta") zatim do pocitace narvat neumime a neni to jen otazka kapacity
    2) neuronky jsou pekna vec, ale zatim funguji jen na velmi jednoduche a specificke ulohy
    3) pro kvantove pocitace uz mame navrzenych spoustu peknych algoritmu, ale jaksi nam chybi ty pocitace samotne (ok, asi vterinu existoval cca 10 qbitovy kvantovy pocitac) a vypada to, ze dalsich x desitek let nebudou
  • 11. 1. 2005 15:20

    David Rohleder (neregistrovaný)
    problém je v tom, že IMHO člověk většinou chápe smysl věty a potom ji teprve překládá. A smysl větě dávají reálné vazby mezi jednotlivými objekty, které se v té větě vyskytují. A to včetně různých implicitních věcí, které sice nejsou řečeny, ale obecně platí. Neříkám, že není možné strojově překládat, ale podle mne to vyžaduje, aby byl v počítači model reálného světa. No a pak by mne celkem zajímalo, jak budou autoři implementovat do překladu smysl pro ironii a nadsázku. Celkem si nedovedu představit, jak by někdo dokázal překládat třeba slovní hříčky jako jsou třeba v Pratchettovi.
  • 11. 1. 2005 15:23

    PaJaSoft (neregistrovaný)
    ad 1) - kontext narvat umime, omezovala nas kapacita a chut mit spocitatelny vysledek v rozumnem case.

    Ad 2) - kdy jste je videl naposled a jaka mely omezeni?

    Ad 3) - vy mate paru o soucasnem stavu vyzkumu nebo jen o utrzcich, ktere obcas nekdo nepozorny nebo zamerne utrousi? Naopak zjednoduseni algoritmu z exponencialniho na linearni je takovy pocit, ze spousta dnesniho na co jsme zvykli proste prestane existovat/ byt potreba... Mimochodem, vite proc neco jako pocitac, alespon te Von Neumanovske architektury vubec vznikl? Jednoduse proto, ze mechanicke overovani vypoctu pomoci logaritmickych pravitek bylo narocne... - ano tusite spravne, byly to USA a jaderna puma... - zkuste si precist nejake publikovane zapisky/vzpominky treba nositele nobelovy ceny za Fyziku Prof. Feynmana.

  • 11. 1. 2005 15:28

    PaJaSoft (neregistrovaný)
    Nejsem lingvista, ale co treba zcela umely jazyk vytvoreny J.R.R. Tolkienem? Co treba dnes davno mrtvy jazyk jako Madarstina ci Latina - ty neumi vec(i)/spojeni, ktere v dobe "zivota" nemohly existovat - prekladat nebo pouzivat v tom kontextovem vyznamu? Co treba "pocitacovy" zapis v DNA? Byt mozna je vice jak binarni, nic to nemeni na faktu, ze vsechno toto lze "jednoduse" popsat, pravda, obcas tomu kodu a uz vubec ne zapisu nerozumime... ale i to se meni:-)

    Mne spise zajima, zda-li jsem seriova ci pararelni biologicka entita nez soucasne omezeni zabehlych postulatu...:-)

  • 11. 1. 2005 15:33

    J.K. (neregistrovaný)
    Asi takový naivka jako PaJaSoft byl redaktor toho televizního pořadu.
    Oni třeba připravují překlad klíčových slov mezi různými jazyky a nějaký trouba z toho do televize udělal automatické překlady.
    Nejprve by bylo potřeba vědět, co skutečně Sergej řekl televizi a potom vědět, co nějaký vedoucí oddělení vícejazyčných mutací nablábolil Sergejovi, aby oddělení vypadalo, že už v překladech jednoznačně předhonili konkurenci z bývalém Sovětském svazu.
  • 11. 1. 2005 15:35

    PaJaSoft (neregistrovaný)
    Radsi v tomto pripade uspokojeny naivka nez prekvapeny pesimista tvrdici, ne to neni mozne, tomu neverim...:-)

    K tem rusum - mozna Vam uniklo, ze velmi vyznamna cast (mozna majoritni) techto kapacit davno pracuje na druhe strane.

  • 11. 1. 2005 15:41

    petr (neregistrovaný)
    ad 1) Zrejme mi unikl nejaky vyznamny projekt/objev z posledni doby... mate nejaky odkaz na cokoliv, kde je popsan zpusob, jak do pocitace narvat znalost reality a schopnost ji pochopit? (IMHO nutna podminka pro spravny preklad vicevyznamovych slov, emotivniho naboje vet, ironie, nadsazky, atd.)

    ad 2) Spise bych to polozil tak, ze jsem nevidel zadne pouziti n.s. pro ulohy obecnejsiho charakteru. Vzdycky jde o nejakou optimalizacni ulohu, pripadne rozpoznavani textu, hlasu, obrazu, atd. Navic vsichni moji byvali spoluzaci z VS, kteri neco delali s n.s. na ne z nejakeho neznameho duvodu zanevreli :) Ono to IMHO ceka na poradne paralelni zpracovani...

    ad 3) Asi jsem to nenapsal jasne, takze jeste jednou. Algoritmy pro kvantove pocitace jsou vymyslene a jsou super. Chybi pocitace samotne! (to je ma vytka) BTW feynmana jsem cetl
  • 11. 1. 2005 15:45

    petr (neregistrovaný)
    Jeste drobnost - netvrdim, ze strojovy preklad nikdy nebude! Jen si myslim, ze zatim existuje nekolik prekazek a ze je potrva prekonat desitky let (20 minimalne). Do te doby poradne preklady neocekavam. A kdyz pisu poradne preklady, tak myslim nejen gramaticky bezchybne, ale i vyznamove spravne.
  • 11. 1. 2005 16:00

    Pet (neregistrovaný)
    Já jsem vymyslel SW pro překlady, který se sám učí, ale potřeboval nějaké přeložené texty tzn. text v AJ a k němu doslovný překlad do ČJ, abych to mohl vyzkoušet. Nevěděli byste o nějakých? Případně mi pošlete na mail.
  • 11. 1. 2005 16:03

    PaJaSoft (neregistrovaný)
    Ad 1) - neni to oblast, o kterou bych se denn2 zajimal, takze nemohu slouzit. Ovsem co treba heuristicke analyzy nekale cinnosti software, IDS atd.? Tim ted nemyslim porovnavani baze znalosti (vzorky) s aktualnim stavem, ale skutecne detekujici vec ve stavu "snapshotu" - bezicim kontextu... - zde je baze omezena prave s ohledem na pozadovany vykon, radsi nedomyslet, kdyby nebyl jako priorita vykon, ale znalost...:-)

    Ad 2) - je fakt, ze po optimismu v 50-tych letech v konfrontaci s lety 60-tymi to asi tak na 20 let (leta 70 a 80-ta) na venek skoro usnulo (vyschle finance byly jednim z duvodu). Pokud povazujete pouze za hricky studentu fotbal/hokej jeden robot vudci jednomu (algoritmus/strategie - mnozne cislo jsou jednou vlozeny), pripadne team vs. team, klidne, ja v tom vidim zaklad daleko mohutnejsi. Dalsi priklad bych si dovolil pujcit z vesmirneho programu, konkretne automatizovane systemy v programu dobyti Marsu - prave s ohledem na to, jak americka administrativa po 30-ti letech tlaci na uspech v teto oblasti (od pristani na Mesici) si myslim, ze se dockame jeste hodne zajimaveho...

    Ad 3) - ja vim, ze NEJSOU ke koupi ani kdybych lopatou zlato prehazoval, mozna se neshodneme na tom, ze rekneme 10, 20 let je skoro zitra s ohledem na to, jaky postup byl v poslednich 60-ti letech... a da-li Buh, jeste se toho doziju.

  • 11. 1. 2005 16:33

    petr (neregistrovaný)
    ad 1) To je ale priklad naprosto specificke cinnosti. Neznam detaily, ale tyhle veci obvykle nejak statisticky zpracujou vstupy a pak ne ne spusti algoritmus, ktery vyhodnoti riziko (jedno nebo par cisel). A to ma daleko k obecnych uloham. Uvedu 2 priklady (ne uplne idealni, ale zrovna me napadly): V textu o Thajsku z posledni doby se objevi slovo 'vlna' a pocitac ho preklada. Jak ma vedet bez pochopeni souvislosti, o jakou vlnu presne jde? Vlna jako ovci, morska, radiova, ...? Nebo druhy priklad - pocitac preklada rozhovor "Kde je dedecek?" "Uz odesel.", a pak preklada "Zije jeste dedecek?" "Uz odesel.". Musi pak poznat, ze v druhym pripade jde o eufemismus a spravne to prelozit. Neboli musi ty vety pochopit. A k tomu maj pocitace hodne daleko.
    Ted me napad jeste treti priklad - veta "T'll be back!". Za urciteho kontextu jde o parafrazi Arnieho vety z terminatora a musi byt prelozena "Ja se vratim!", jinak parafraze prestava fungovat, a jindy muze byt prelozena neutralnim "Vratim se!".

    ad 2) Ty hokeje/fotbaly - ano, je to pokrok, ale porad jde o tu specifickou cinnost, nejakou hru. A vyuziti neuronek v misich na Mars? Mate nejaky link?

    ad 3) Ne ze nejsou ke koupi, ale nikdo zatim nema ani predstavu, jak by se daly vyrobit. Ale souhlasim, za 20 let muze byt vsechno jinak.
  • 11. 1. 2005 16:59

    J (neregistrovaný)
    No nevim, udelat doslovny preklad, ktery bude sklonovany + bude mit OK slovosled, to si jeste predstavit dovedu. Ale problem je hlavne v tom, ze pri prekladu zdaleka nejde o samotne vety a tataz veta (klidne i odstavec) muze byt prelozena ruzne v zavislosti na kontextu.

    Obavam se, ze ten stroj by si musel predevsim uvedomovat sam sebe a sve okoli aby byl schopen prekladat. Casto se prekladaji veci tak ze se vpodstate volne prevypravi (a to vubec neznamena ze je to spatne). Kdyz si osobne ctu neco napr v en, nejake to sluvko trebas neznam, ale presto nemam problem rozumet vetam, protoze vim o cem ctu.

    Kdyz X lidi preklada jednu vec, kazdy preklad je trochu jiny a ten stroj by se musel drzet striktne toho, co uz bylo pouzito.

    Mam ten pocit, ze dokud se nebudou bezne pouzivat kvantove/biologicke pocitace, tak zadny vykon neni dostatecny.
  • 11. 1. 2005 18:44

    sundance@centrum.cz (neregistrovaný)
    Madarstina? Mrtvy jazyk, no jdete to vykladat do Budapesti a budete mrtvy Vy:)
  • 11. 1. 2005 19:04

    JersyWoo (neregistrovaný)
    Myslím si, že článek je přínosný, že ukázal jiný styl podnikání a práce než na který jsme běžně zvyklí.
  • 11. 1. 2005 20:44

    Barman (neregistrovaný)
    S Tvými vĚtnamci si neporadi ani Babelfish :-P

    Don't Panic!
  • 11. 1. 2005 20:56

    nomarski (neregistrovaný)
    A to ja zas jednoho profesora, co sedi na balonu, znam :-)
  • 11. 1. 2005 21:32

    JackCZ (neregistrovaný)
    :)) až na to, že by ty věty musel někdo manuálně přeložit...
  • 12. 1. 2005 0:42

    Bochi (neregistrovaný)
    "A preklad z jazyka A do jazyka B prece je davno, vzdyt je to obycejne relacni zobrazeni, jde jen o to pokud mozno co nejpresneji popsat tu relaci."

    Nemáte pravdu. Překlad mezi dvěma jazyky není obyčejná relace. Není to jednoznačné přiřazení, do hry vstupují i prvky mimo vlastní sdělení. Některé věty jsou nejasné nebo dokonce víceznačné a jen ze znalosti kontextu, rozpoložení řečníka, nebo povědomí o reáliích daného jazykového prostoru, vám umožní jejich pochopení (a posléze překlad). To je něco, co strojově možná v principu jde, ale takový stroj by musel disponovat něčím víc, než jen obrovskou datahbází slov a gramatických pravidel.
  • 12. 1. 2005 8:32

    PaJaSoft (neregistrovaný)
    Některé věty jsou nejasné nebo dokonce víceznačné a jen ze znalosti kontextu, rozpoložení řečníka, nebo povědomí o reáliích daného jazykového prostoru, vám umožní jejich pochopení (a posléze překlad)

    I stemito atributy umime pracovat, vcetne ne vzdy jednoznacneho (deterministickeho) prevodu... Znalost kontextu, realii je davno zvladnuta - pokud Vamneco rika pojem atributova gramatika, vite kam tim mirim. Snad jedine, co nevim kam zaradit (je-li vubec pri prekladu treba) je to rozpolozeni recnika... - znovu bych to hnal pomoci aparatu vicepaskoveho nedeterministickeho Turingova stroje a myslim, ze by se reseni naslo (dnes mozna v rovinach nevycislitelnosti a nespocitatelnosti).

    Preklad A -> B dnes uz davno neni databaze slov a gramatickych pravidel, samozrejme, to je zaklad, ten nestaci a ani dneska se u tohoto nekonci.

  • 12. 1. 2005 8:33

    PaJaSoft (neregistrovaný)
    Mne teda ve skole ucili, ze mezi jazykove mrtve jazyky patri Latina, Madarstina a mnoho dalsich... osnovy se zmenily?
  • 12. 1. 2005 9:52

    venca (neregistrovaný)
    > problém je v tom, že IMHO
    > člověk většinou chápe smysl věty

    osobne jsem zkusil par knih v prekladu
    i v originale (cj/aj) (ze zoufalstvi,
    kdyz ceskej preklad byl mimo). bohuzel
    mam pocit, ze dost prekladatelu zcela
    presne nechape smysl toho, co prekladaji
    a pojem 'volny preklad' si vykladaji velice
    volne.

    spickoveho prekladatele v google nevyvinou,
    ale prumerneho prekladatele prumerne
    literaruty asi jo.

    a hlavne, nemyslim si, ze je jejich
    cilem delat preklady basni ci romanu ;o)
  • 12. 1. 2005 11:56

    Vítězslav Novák (neregistrovaný)
    Neštudoval jste v Žilině?
    Tam jsou takoví roduverní Slováci, že možná Maďarštinu prohlásili za mrtvý jazyk...
    Ale někde na jihu Slovenska, třeba v Rimavské Sobotě (Rimaszombathely), Dunajské Strede (Dunaszerdahely) by se vám mohlo stát před čím jste byl varován. Nemluvě o čemkoliv za Rajkou nebo Komárom.

    No a ani latina není až tak mrtvý jazyk, jak je možno se přesvědčit třeba zde http://www.cernovlaska.cz/index.php/lexikon-latina/?cid=1144 byť leccos je poněkud kostrbaté.

    Hledal jsem "bikiny" (takový to hezký nic nahoře i dole, jak nosej ženský na pláži, pokud nosej vůbec něco, ne ten ostrov) - vím, že jsem tento výraz v moderní latině nedávno četl - ale po zadání do jyxa "latina nová bikiny" jsem dostal odkazy poněkud jiného ražení. Hodně jiného ražení. Zatraceně jinýho ražení.
  • 12. 1. 2005 11:57

    David Rohleder (neregistrovaný)
    Osobně si myslím, že k tomu, aby se dalo rozumně překládat nepotřebujeme vědomí. Ovšem vazby mezi objekty jsou potřeba. Pak ovšem interpretace slova kůň musí vycházet z vazeb na okolní text. No a nejjednodušší interpretace pak bude ta, že se spočítá metrika vzdálenosti mezi těmi okolními objekty a koněm. Už s takovou metrikou velkou pravděpodobností dojdeme ke správné interpretaci.

    Mně osobně se strašně líbil takový model grafického znázornění jednotlivých synonym, které měly mezi sebou vazbu (třeba Visual thesaurus). Tam je celkem pěkně vidět, jak je možné ty vazby realizovat.

    Nicméně mé představy jsou jenom představy nepoučeného laika.

  • 12. 1. 2005 12:19

    Petr (neregistrovaný)
    To mozna bude fungovat pro odbornou literaturu, kde je zadouci, aby cely text mel "uceleny kontext".

    Rozhodne to musi zalostne selhat na humoru, kde principem je prave ta prudka (neocekavana!) zmena kontextu.

    Vim, ze existuji texty, v nichz je humoru 0% a mene. Nastesti nejsem pravnickou mluvu nucen cist. Ve vsech ostatnich textech je humoru aspon 1% - a v automatickem prekladu z humoru vznikne situacni komika :-)
  • 12. 1. 2005 12:40

    Digero (neregistrovaný)
    Vedomi? Tohle uz jsem slysel kdyz se delali sachove programy... Jedine co je potreba je chytry algoritmus, spousta vypocetniho vykonu a mravenci prace pri katalogizaci jazyka.
  • 12. 1. 2005 12:46

    Vítězslav Novák (neregistrovaný)
    Nebyl bych AŽ TAK pesimistický. Přinejmenším nevidím na "vědomí" nic tak mystického, aby to nešlo nasimulovat jinde než v cca 15G neuronů. Ale to bychom se dostali na filosofickou půdu, a ta je hodně měkká.

    Ke správnému překladu (na úrovni člověka) potřebuje mít překladatel - člověk nebo stroj - spoustu znalostí. Což stroj zatím nemá a ještě dlouho mít nebude, přinejmenším proto, že je neumíme nějak pořádně zapsat. A to zahrnuji i dnes tak moderní ontologie a sémantický web a podobné. Protože tohle je na lidském vymýšlení, nepůjde to tak rychle dopředu jako HW, spíše slimáčím tempem SW.

    Jiná věc je, že ani člověk, byť vybavený patřičnou znalostí, nedokáže vždy správně rozhodnout. Ten váš příklad s koněm patří do této kategorie. Když řeknu "kůň", nemá to kontext a jsem v koncích já i mašina. A budou konstrukce, kde budu v koncích vždy. Ovšem nebudu-li po stroji vyžadovat, aby byl chytřejší než člověk, jednou (JEDNOU!) toho překladu a porozumění snad dosáhneme.
    Pak se třeba nestane, že v překladu špiónského thrilleru z USA se čeká, co na to řekne pan Langley... Když se chce někdo živit překlady, měl by znát základní reálie. No nic.

    Ale zdůrazňuji - dnes je možné udělat morfologickou a syntaktickou analýzu, ale nějaké porozumění, tedy i slušné překlady jsou hudba hodně daleké budoucnosti. Hodně daleké je ovšem v tomto oboru tak 10-20 let. Ale možná jsem optimista.
  • 12. 1. 2005 18:59

    Vítězslav Novák (neregistrovaný)
    Nevím jestli je nějaký link na nějaký scifoidní projekt, ale zatím ty superextra hi-tech zařízení jsou postavený na procesorech, který byste nejspíš nesneli ani v záchodovým prkýnku. A jezdí se stylem kamera - pár (někdy dost) minut přenos, vyhodnocení, pokec - povel posuň se o 50 cm směrem A - napětí co to udělá - kamer - přenos...

    Jediná neuronová síť je ta mezi obrazovkou a myší kdesi v Houstonu.

    Nikdo si nemůže dovolit poslat do kosmu něco, co je na Zemi mlo vyzkoušený.
  • 12. 1. 2005 19:03

    Vítězslav Novák (neregistrovaný)
    Tak pardon, podíval jsem se na http://www.scienceworld.cz/sw.nsf/ID/8F8122F0C8F4F2C4C1256E97004920A5?OpenDocument&cast=1 a základem je IBM PowerPC.

    Ostatní je platné.
  • 12. 1. 2005 19:54

    Bochi (neregistrovaný)
    Ano, presne tak. Humorny text, satira, ironie, poezie, ... to je jen par prikladu, na kterem si budou vylamovat automaticke prekladace zuby jeste mnoho desitek let, pokud to vubec kdy zvladnou.
  • 12. 1. 2005 20:10

    Bochi (neregistrovaný)
    "...aby to nešlo nasimulovat jinde než v cca 15G neuronů. "

    V zasade mate mozna pravdu, ale tech 15G neuronu neni zadna malickost. Jsou urcite problemy, ktere jsou zdanlive resitelne (tj. existuje na ne prislusny matematicky aparat), ale jejich vypoctova slozitost je takoveho radu, ze problem jako celek se stava de facto neresitelnym. Neresitelnym v principialnim smyslu.
    Podle kvantovych a gravitacnich zakonu moderni fyziky byste take mozna mohl zdanlive nasimulovat chovani (dejme tomu) nasi galaxie, ale jen k ulozeni potrebnych dat (nehlede na samotny vypocet a ziskavani dat) byste potreboval radove vice atomu, nez je obsazeno v teto galaxii. Takze neco, na co mame sice k dispozici rovnice a metody k ziskani dat, je presto neresitelne, pouze z duvodu extremni slozitosti.
    A to jeste (vratime-li se zpet k neuronove siti) pomijim nutny proces uceni, ktery by na tom systemu 15G neuronu musel probehnout, coz by take urcite nebyla otazka par dnu. Dite, ktere je na svete par let, take neporozumi zdaleka kazdemu textu, aby se dostal na solidni uroven potrebuje clovek roky a roky uceni a interakce s realnym svetem. Potazmo takovy univerzalni prekladac by musel byt vic nez jen nejaka 15G "kopie" lidskeho mozku, ale spise supermozek, ktery ma rozhled v daleko vice oborech nez bezny clovek. Lidsky prekladatel, byt spickovy, take nezvladne s patra prelozit text z libovolneho oboru.
    Takze vasich 15G by mozna muselo byt tak 100G, mozna 1000G, kdo vi. Kazdopadne si nedokazu predstavit, jak to zvladnout s vypocetni technikou, byt by byla mnohem a mnohem vykonnejsi nez dnes.
  • 13. 1. 2005 8:52

    PaJaSoft (neregistrovaný)
    Ano takto to fungovavalo, bohuzel se ukazalo, ze mohou nastat nepredvidatelne udalosti, na ktere je zpozdeni Mars Zeme (8m? * 2 ci kolik) proste kratke, takze bylo treba doplnit heuristiku aby se to nepo... alespon v elementarnich pripadech... - a pokud je mi znamo, tak to reseni neni ve stylu pokud nastane tato mnozina okolnosti udelej A, ale je to opravdu formou naucenych stavu, reakci - tedy svym zpusobem AI a nikoli podminka a akce.
  • 13. 1. 2005 13:32

    J (neregistrovaný)
    Kdepak, sachy maji jednoznacna pravidla, jazyk nikoli.

    Sachove programy funguji tak, ze zkousi v idealnim pripade vsechny moznosti + porovnavaji je s databazi odehranych partii a po te vyhodnoti ktery tah je za dane situace nejvyhodnejsi.

    U prekladu jazyka mate ten problem, ze lze napsat i cely odstavec, s nekolika moznymi vyznamy. A pokud chcete zachovat vyznam puvodni, musite jej chapat.
  • 13. 1. 2005 15:28

    Vítězslav Novák (neregistrovaný)
    Mně šlo o něco jiného. Vědomí - ať už je to co je to, zatím se mi nepodařilo najít definici, jež by nebyla vágní k nepoužitelnosti - je funkcí nějakých těch 15G neuronů, z čehož nezanedbatelná část dělá pomocné práce, případně řídí na dost nízké úrovni. Tedy určitě se dá materiálně navodit. Jestli je někdy nasimulujeme v křemíku, jestli to bude neuronová síť, těžko říct. Umím si představit, že to bude nějaká mohutně paralelní architektura plus informace plus vstupy.

    Ale na překlad nepotřebujeme tohle všecko. Rozhodně není nutné, aby překladatel nad Harlequinkou slzel, stačí, aby rozeznal jakou emoci autor do textu vložil a a věděl jak ji vyjádřit v cílovém jazyce. Což IMHO je záležitostí pravidel, ovšem strašně mnoha pravidel. V podstatě znalostí o skutečném světě. A reálií, pochopitelně. Když se v "námořním" románu dočtete o uzlech za hodinu, je to trapas. "Pana Langleyho" jsem citoval. Blbosti z počítačové branže nejspíš znáte.
  • 13. 1. 2005 15:34

    Vítězslav Novák (neregistrovaný)
    Obávám se, že nejen tady.

    Někdy se to určí z kontextu, někdy ovšem ten kontext bude hodně daleký. Příklad - čínština má mnohem víc slov pro rodinné příslušníky. My známe bratra - oni staršího a mladšího bratra, různá slova. Strýčky a tetičky z několika kolen a rozlišením jestli je tetička sestra otce nebo matky, případně přivdaná. Někdy je to podstatné. A přeložte to z češtiny!
    Přitom by to mohl být odborný sociologický text.

    Japonci mají zdvořilostní stupně, záleží na tom kdo a s kým mluví. Dělali si srandu z Američanů po válce - oni se učili japonsky od svých milenek, takže pak mluvili ženským jazykem, což v machistické japonské společnosti působilo srandovně. Když budete překládat obyčejný rozhovor, musí se vybrat patřičné stupně už proto, aby výsledek byl neutrální. Když podřízený mluví s nadřízeným neutrálně (a ne uctivě) už to setsakra něco znamená! Něco, co v původním textu vůbec nemuselo být, ale přesný překlad to tam dodá.

    Kdepak, na automatické překlady bych nespoléhal. Hned tak ne. A to "Ludvík dodávka Beethoven" není nejhorší.
  • 13. 1. 2005 20:41

    Janusz (neregistrovaný)
    Co me napada, ze Google by mohl pouzit pro optimalizaci prekladu z jednoho do druheho jazyka vyhledavani. Podle vysledku pageranku nebo poctu nalezeni dane varianty (bud tvaru slova , casti veti nebo vice vet) by mohl vybrat tu nejlepsi variantu prekladu. Toto mi pripada docela realne, vzhledem k obrovskemu vzorku textu dostupnemu pro vyhledavani.
  • 14. 1. 2005 14:24

    PaJaSoft (neregistrovaný)
    Coz neni takovy problem pro Google diky neskutecne velke databazi frazeologickych spojeni, jak spravne nekdo poznamenal...- proste je to casove i velikostne ohraniceny ukol.
  • 14. 1. 2005 15:34

    Vítězslav Novák (neregistrovaný)
    To jsou šachy taky. Podstatně omezenější. Především jsou šachy strašně jednoduchá hra. 64 políček, 2 x 16 figurek, pro každou jasná, jednoduchá a jednoznačná pravidla, co může. V každě situaci se dá vygenerovat úplná množina možných kroků. Jediný problém je s exponencielní katastrofou.

    Jazyk popisuje reálný svět, který je mnohem složitější, pravidla platí jednou víc a podruhé míň a je jich mnohem víc. Jak tohle chcete zvládnout prostým prohledáváním obrovské databáze textů, to mi je nejasné.

    Třeba v mnou zmíněném příkladu s panem Langleym - vy nějak statisticky určíte, že Langley je ústředna CIA, tedy že to je metafora? V jiném kontextu to metafora nemusí být, proč by nemohl být pan Langley a nebo být míněno město Langley (dokoce to samé)? Statisticky zjistíte, že se vyskytuje blízko sebe "Langley", "CIA" a "centrála", ale nejdřív byste musel vědět, co je to centrála, aby vám vyplynulo, že "Co na to Langley" znamená "Jaké je mínění centrály CIA" nebo "dtto šéfů CIA".
    Ale totéž může taky znamenat, že se ve městě L. něco stalo, a co na to jeho obyvatelé.
    Nakonec, i v CIA může pracovat pan Langley, dokonce na ústředí, takže půjde o Langleyho z Langley, což může mít význam.

    A když to statisticky určíte, tak zjistíte, že nejpravděpodobnější je použití slova Langley jako metafory, leč zrovna v tomto textu to tak být nemusí.

    Kdepak - překlad znamená porozumění textu a porozumění znamená znát spoustu informací mimo tento text. A souvislostí mezi nimi.

    ps - teď mě napadlo, že Langley taky může znamenat pana Lang-li, Číňana, rybáře z Kantonu. Nebo cokoli chcete´.
  • 14. 1. 2005 15:43

    PaJaSoft (neregistrovaný)
    Jazyk popisuje reálný svět, který je mnohem složitější, pravidla platí jednou víc a podruhé míň a je jich mnohem víc. Jak tohle chcete zvládnout prostým prohledáváním obrovské databáze textů, to mi je nejasné.

    Jednoduse mily Watsone, pomoci vah... a databazi na to ma setsakramentsky dobrou aby se v tech vahach nemylil.

  • 14. 1. 2005 17:45

    Vítězslav Novák (neregistrovaný)
    Přeji příjemné vyvíjení. Já prozatím vím, že když nějakou informaci agreguji, tak značnou část informace ztrácím.

    A že by dobrá databáze? Především žádná databáze. Spousta textů, často protiřečících si, často nesmyslných, často spíše desinformačních než informačních...
    Věřit, že z tohoto vznikne nějaká relevantní informace, je podobné, jako věřit, že vznikne dobrá encyklopedie stylem wikipedie. a nebo poživatina style pejska a kočičky, ovšem míchajícím miliardy pláců.

    Je dobrý být optimista, ale je rozdíl mezi optimistou a soutěžním skokanem na špek. Vy byste se mohl přihlásit do nároďáku, pokud taková disciplína vznikne.
  • 14. 1. 2005 18:29

    -- (neregistrovaný)
    na druhou stranu lze si i predstavit ze v nekterych oblastech bude databaze znalosti vct. kontextovych natolik sirsi u stroje nez u cloveka, ze muze plodit v urcitych situacich i preklad presnejsi..
  • 14. 1. 2005 18:43

    -- (neregistrovaný)
    prave ten Pan Langley je dle meho nazoru spise pripad kdy bude stroj uspesnejsi, nikdo nemuze znat vsechno, ale stroj ma mnohem vetsi sanci se o tom dovedet - monitoruje li napr. vsechen tisk narozdil od nekoho kdo precte rocne 20 knizek..
  • 14. 1. 2005 19:13

    __ (neregistrovaný)
    celkove je ale clanek nic moc spise takovou odou na google,
    nachytaneho autora, tento obraz googlu je imho jasne definovane PR, zamerene na konkretni cilovou skupinu predevsim programatoru,.. nemusejici odpovidat realite(vzpomenme na lakadlo pracovnich prilezitosti u seznamu a provnejme s realitou pro neznalce vnitrnich problemu alespon treba prohlasenim lukacovice v "na kus reci s"), a proto by kritictejsi ton nevadil - bez znalosti vnitrniho prostredi Googlu u pana autora, ktere pokud ma, necht prosim v clanku uvede.

    ..kdyz se reklama googlu siri tak sama, je hezke ze autor nezapomel zminit najimani PR pracovnika, take nevim jak stihaji manageri googlu prijmat vsechny pracovniky osobne, vzhledem k mnozstvi inzeratu jen v UK a I se mi to zda nemozne a tedy by nebylo od veci rici jasne, ze se jedna patrne pouze o kreativni pracovniky, ..

    dalsi veci je nejaky nakup tricka, takove ja-je-mam-rad PRovky snad nema Lupa zapotrepi prepravat.

    co se tyce zminenych projektu precejenom chybi argumenty a rict nekdo neco chysta, ach ano jak jednoduche bez receni kdy a jak,... co se tyce nastroju na porovnavani cen, nesmysl stejne se trh prizpusobi resp. zmeni jakmile by se takovy nastroj rozsiril nad zanedbatelnou mez.. ale to se imho stane s googlem i bez nej..

    google je predevsim o marketingu (kooperativni dohody s medii?) ne o technologii, kdovi jestli se jednoho dne nedovime ze za nim stoji sam MS nebo nejake vyznamne medialni skupiny, bily kone panu majitelu nevylouceny, nebezpeci pro skutecne vlastniky imho prilis velke, ze by se cely chod googlu obesel bez zajmu bezpecnost. slozek je imho take temer vyloucene atd. atd.
    ---------------------------------------------------------
    tento prispevek obsahuje nepodlozene spekulace a zcela jiste i omyly

    k tem 2 milionum dotazu to je snad ke konkretnimu programu KEYhole a ne GOOGLE celkem..
  • 16. 1. 2005 16:19

    kUk (neregistrovaný)
    "Sergey doufá, že se podaří vyrazit na lyže dokonce s třemi tisíci zaměstnanci dohromady."

    To je dobrej nápad že. Pak jim tam někdo šoupne bombu (nebo jiná katastrofa) a google dogoogluje :)) Některý firmy maj ve stanovách že vedení nesmí cestovat spolu apod. Proč asi? :)
  • 17. 1. 2005 20:52

    Martin Kuželka (neregistrovaný)
    Tu bombu jim můžou šoupnout i do Googleplexu a s Googlem bude taky konec....
  • 30. 11. 2006 20:19

    subcommandante marcos (neregistrovaný)
    Omlouvám se předem za stručnost, ale mám naspěch. Obávám se, že autor tohoto komentáře se příliš dobře neorientuje nejen v tom, co je a jak zhruba funguje strojový překlad, zároveň nepříliš dobře rozumí tomu, v čem spočívá problém s popisem jazyka pro jeho potřeby. Strukturalismus skutečně velmi dobře pochopil, že jazyk formálně charakterizuje jeho struktura, bohužel tentýž strukturalismus nedokázal formulovat svoje poznatky pomocí takového prostředků a z takovou explicitností, která by umožňovala jeho počítačové zpracování pro potřeby automatického překladu. Tedy alespoň ve své první fázi. S rozvojem generativismu ale začal být systematičtěji uplatňován popis jazyka orientovaný tímto směrem, takže např. u nás skupina kolem Petra Sgalla už několik desítek let pracuje na strukturalismem motivovaném a generativismem poučeném zpracování přirozeného jazyka právě pro potřeby automatické analýzy a syntézy, ergo překladu.
    Otázka, jestli počítače mají nebo nemají vědomí dost dobře stojí a padá s tím, jaká kritéria si pro evidenci vědomí stanovíme. Pokud budeme behavioristé a opřeme se o jistou variantu turingova testu, pak nás už dnes leckterý program svou reakcí dokáže přesvědčit, že se jedná o myslící bytost, tj. nositele vědomí (což neznamená, že mít vědomí musí nutně znamenat myslet lidsky!) Ale do toho bych se nepouštěl, protože to není k debatě o překladu v tomto kontextu vůbec potřeba. Počítačový překlad je primárně orientovaný na texty a spočívá de facto v jejich desambiguaci. Existuje přitom mnoho způsobů, jak reprezentovat sémantiku přirozených jazyků (např. pomocí matematicko-logické teorie modelů), takže vaše námitka o nemožnosti dát počítači zásobu významů je mylná. Stejně tak je mylná vaše interpretace saussurovské dichotomie označující - označované, kde označované není objekt reality, ale pojem charakterizovatelný také jako hodnota (pravdou ale je, že i de Saussure je v tomto ohledu nejednoznačný). Každopádně argumentace v podstatě marxistickou teorií odrazu přináší více problémů než řešení. Na vaši výtku, jak rozlišit potenciální nejednoznačnost některých výrazů, je možné reagovat odkazem na kontext (zachytitelný formálně) apod.
  • 12. 1. 2005 10:59

    Bedra (neregistrovaný)
    Myšlenka strojového překladu je hezká, ale absolutně nereálná. Tady je třeba zabrousit do lingvistiky, doporučuji autory jako J. Černého, F. Čermáka a především pak Základy jazykovědy od Adolfa Erharta. Ta knížka - byť je to jen přehled - hezky ukazuje, co jazyk vůbec je.
    Jazyky jsou dnes - co se týká struktury velmi dobře popsány. Známe už například fonologické podobnosti, hláskové korelace, syntaktická a morfologická pravidla. Srovnávací a historická gramatika a především strukturalitsmus tomuto hodně pomohly, dneska by díky tomu teoreticky nebyl problém vzít nějaký jazyk a naházet jej do počítače. Například čeština je dneska popsána jak synchronně, tak diachronně; v obou případech jak jako struktura sama o sobě, tak ve vztahu k ostatním jazykům. Máme tedy přesný popis a nebyl by tak problém jej aplikovat.
    Naprosto, ale naprosto zásadní problém je, že počítač nemá vědomí. A bez něj strojový překlad nikdy nemůže být realizován.
    V realitě totiž existuje nějaký objekt (označované). Tento objekt má odraz a otisk vě vědomí, tedy pojmenování skutečnosti. A k tomuto pojmenování skutečnosti máme formu (označující). Například pro objekt strom máme ve vědomí nějaký otisk, pro nějž máme uložený kód různých jazyků (strom, tree, baum atd.).
    Pokud nám z toho řetězce vypadne vědomí, překlad nebude nikdy možný. Reálná vazba mezi věcí a slovem totiž neexistuje! Dejme tedy nejdříve strojům vědomí jako zásobu významů, k nimž si bude přiřazovat slova různých jazyků, a pak můžeme hovořit o nějakém překladu.
    Kromě toho jsou tady další překážky, které vycházejí například z funkce jazyka. Kognitivní lingvistika (v současnosti dost populární) hovoří o kategorizaci a interpretaci. Opravdu nevím, jak by stroj mohl správně sémanticky interpretovat kontext symbolu kůň. Kůň jako zvíře? Jako sešívačka? Jako hobby? Výkon motoru? Bez otisku ve vědomí a porovnávání z předchozí zkušeností stroj tento kontext nikdy nedokáže vystihnout.
Vitalia.cz: Muž, který miluje příliš. Ženám neimponuje

Muž, který miluje příliš. Ženám neimponuje

Vitalia.cz: Voda z Vltavy před a po úpravě na pitnou

Voda z Vltavy před a po úpravě na pitnou

DigiZone.cz: Sat novinky: Kabel eins Doku

Sat novinky: Kabel eins Doku

120na80.cz: Zázrak ze smetiště: co léčí lopuch?

Zázrak ze smetiště: co léčí lopuch?

Vitalia.cz: Opuncie je plod kaktusu. Pozor na trny

Opuncie je plod kaktusu. Pozor na trny

Vitalia.cz: Tahák, jak vyzrát nad zápachem z úst

Tahák, jak vyzrát nad zápachem z úst

DigiZone.cz: Test: brýle pro virtuální realitu Exos Urban

Test: brýle pro virtuální realitu Exos Urban

Lupa.cz: Patička e-mailu závazná jako vlastnoruční podpis?

Patička e-mailu závazná jako vlastnoruční podpis?

Vitalia.cz: dTest odhalil ten nejlepší kečup

dTest odhalil ten nejlepší kečup

Lupa.cz: Jak levné procesory změnily svět?

Jak levné procesory změnily svět?

DigiZone.cz: UPC má v nabídce Discovery v HD

UPC má v nabídce Discovery v HD

120na80.cz: Hrbatá prsa aneb mýty o implantátech

Hrbatá prsa aneb mýty o implantátech

DigiZone.cz: Parlamentní listy: kde končí PR...

Parlamentní listy: kde končí PR...

DigiZone.cz: Nova opět stahuje „milionáře“

Nova opět stahuje „milionáře“

Vitalia.cz: Inspekce našla nelegální sklad v SAPĚ. Zase

Inspekce našla nelegální sklad v SAPĚ. Zase

Vitalia.cz: Jaký je rozdíl mezi brambůrky a chipsy?

Jaký je rozdíl mezi brambůrky a chipsy?

DigiZone.cz: Banaxi: videa kdekoli na světě

Banaxi: videa kdekoli na světě

Podnikatel.cz: Znáte už 5 novinek k #EET

Znáte už 5 novinek k #EET

Lupa.cz: Hackeři mají data z půlmiliardy účtů Yahoo

Hackeři mají data z půlmiliardy účtů Yahoo

Vitalia.cz: Když bílkoviny, tak jíme ty nekvalitní

Když bílkoviny, tak jíme ty nekvalitní