Názory k článku
60 minut s Googlem

Michal Krsek
Michal Krsek (neregistrovaný)
11. 1. 2005 8:47 Nový

Univerzitni prostredi

celé vlákno
Par univerzit uz jsem navstivil, ale ze by nekde sedeli na balonech a kolem volne pobihali psi, to mi zustalo utajeno.

Mozna jen autor zopakoval klise, ktere nekde slysel, mozna mel na mysli atmosferu na kolejich.

nomarski
nomarski (neregistrovaný)
11. 1. 2005 20:56 Nový

Re: Univerzitni prostredi

celé vlákno
A to ja zas jednoho profesora, co sedi na balonu, znam :-)
Michal Krsek
Michal Krsek (neregistrovaný)
12. 1. 2005 18:29 Nový

Re: Univerzitni prostredi

celé vlákno
Ano, vyjimky samozrejme nemuzeme nikdy vyloucit :-)
indianek
indianek (neregistrovaný)
11. 1. 2005 9:11 Nový

2 miliony denne?

celé vlákno
...Denně se na celém světě vyhledávají asi 2 miliónů dotazů. ... fakt? hmmm to mam poměrně slušnej podíl na provozu google já sám :-)
Thomsn
Thomsn (neregistrovaný)
11. 1. 2005 9:21 Nový

Re: 2 miliony denne?

celé vlákno
no taky se mi to zda difny...? mozna ze to zas neni tak uspesna sluzba..o))
Michal Krsek
Michal Krsek (neregistrovaný)
11. 1. 2005 9:40 Nový

Re: Sidlo guglu

celé vlákno
Pojedes z ze SJC (Mileta San Jose International Airport) po 101 na server (az do Mountain View), odbocis na Amphitheatre Pkwy :-)

A az tam poletis, dej si pozor, abys nemel letenku do San Jose v Kostarice.

Tomáš Benda
Tomáš Benda (neregistrovaný)
11. 1. 2005 10:04 Nový

Ctecka carovych kodu v mobilu?

celé vlákno
Proc to resit takovym zpusobem? Neni jednodussi kod zbozi mobilem vyfotit a nasledne prohnat OCR-kem? Nebo tu fotku zOCR-kovat primo na vyhledavacim serveru...
ts
ts (neregistrovaný)
11. 1. 2005 10:35 Nový

Re: Ctecka carovych kodu v mobilu?

celé vlákno
a nebo proste ten kod opsat a poslat v obycejne smsce
Zdeněk
Zdeněk (neregistrovaný)
11. 1. 2005 10:43 Nový

Re: Ctecka carovych kodu v mobilu?

celé vlákno
Hlavně vidím problém v tom, že v databázi google nebudou všechny obchody. Takže třeba levnějšího obchodníka v ulici za rohem nenajdete. A co teprve až bude google nabízet AdCode ;-)
Johanka
Johanka (neregistrovaný)
11. 1. 2005 10:47 Nový

Preklad bude tezko

celé vlákno
Ne nadarmo delam pocitacovou lingvistiku - automaticky preklad neni zadna sranda, a i kdyz do toho jde Google s nadsenim a hromadou lidi i pocitacu, IMHO jim to nepomuze (nebo se pak my vsichni ostatni budem moct jit vycpat). Kor se statistickymi metodami (nevim o tom, ze by pouzivali jine). Samozrejme, na nejakou drsne omezenou (tematicky i jazykove - zpravy o pocasi apod.) mnozinu jim to pujde a vsichni budou rikat jupi, ale obecne to nebude fungovat jeste dlouho (ja bych spis rekla ze nikdy, ale ocekavam, ze za par desitek let prijde nejaky zasadni prulom a zase se to zacne delat uplne jinak). Kazdopadne i preklad z jazyka A do jazyka B je drsny sousto (dosud nevyreseny), jestli chtej prekladat N jazyku do N jazyku, tak se muzu akorat zasmat.
pajout
pajout (neregistrovaný)
11. 1. 2005 10:58 Nový

Re: Preklad bude tezko

celé vlákno
Podle mne to nepujde na 100 % bez porozumeni textu (a kontextu :). Typicky třeba "Ženy holí stroj.".
Johanka
Johanka (neregistrovaný)
11. 1. 2005 11:02 Nový

Re: Preklad bude tezko

celé vlákno
zen_u_ holi stroj - takhle jsi z toho vykuch jeden vyznam :)
pajout
pajout (neregistrovaný)
11. 1. 2005 11:11 Nový

Re: Preklad bude tezko

celé vlákno
Jo, uz si vzpominam, slysel jsem tu Tvou verzi. Mne se zase libi predstava zen, jak pomoci holicich strojku holi stroj.
Vladimír Seman
Vladimír Seman (neregistrovaný)
11. 1. 2005 10:59 Nový

Re: Preklad bude tezko

celé vlákno
Aj ja si myslím, že "překlad bude težko" a počkáme si naň ešte dosť dlho. Predsa: stroje ešte dlho nedokážu nahradiť ľudský prístup. K prekladu treba mať aj niečo ako "jazykový cit". Nemčina má 4 pády, slovenčina 7,...pritom každý jazyk má svoje špecifiká => IMHO aby výsledok automatického prekladu nevyzeral doslova smiešne, budú sa musieť zamestnanci Google ešte veľmi snažiť - i keď je ich výber sofistikovaný, kancelárie netradičné, majú jedlo zdarma, všade im pobehujú psy a panuje pohodová atmosféra... :-)
czRoPa
czRoPa (neregistrovaný)
11. 1. 2005 11:17 Nový

Re: Preklad bude tezko

celé vlákno
Sohlasím s Johankou, řekl bych, že strojový překlad je v plenkách. Když jsem měl naposledy tu čest, setkat se s výsledky překladů en-cz z různých služeb a programů, raději jsem si zobrazil původní anglický text, i když anglicky moc neumím. Hoši z googlu asi ještě neviděli češtinu (se svým skloňováním ..), jestli něco takového vytvoří, tak to bude stejně jako když to napíše větnamec( ja chtít prace (nic proti větnamcům :-) )). Takový překladač by musel rozumnět kontextu, využití metod umělé inteligence.. .No nebudu se vykecávat, kdo neumí ani how do you do, tak to snad využije.
Johanka
Johanka (neregistrovaný)
11. 1. 2005 11:24 Nový

Re: Preklad bude tezko

celé vlákno
Ze to bude "ja chtit praci" si nemyslim, protoze oni maji na uceni *obrovsky* mnozstvi dat, takze jsou schopny vykoukat, jak ty vety maj doopravdy vypadat (veta musi obsahovat finitni sloveso, nejaka ta shoda apod., na to nemusej umet cesky ani vedet, kolik ma cestina padu, to vsechno (si myslej ze) se naucej z tech dat).

Takze vysledek bude vypadat civilizovane...akorat nebude odpovidat vstupu, no :) A v tu chvili, kdy tenhle vysledek z ty cerny skrinky dostanou, uz s tim tezko neco udelaji.

Tom
Tom (neregistrovaný)
11. 1. 2005 11:25 Nový

Re: Preklad bude tezko

celé vlákno
Ja mel taky moznost vyzkouset par poslednich stroj. prekladacu a vsechny do jednoho nedokazaly prelozit ani jednoduche fraze. Ale kdyby rozpoznavali jednotlive vety jako celek nebyl by problem pri dnesnich TB mit strojovy preklad na velmi dobre urovni!
JackCZ
JackCZ (neregistrovaný)
11. 1. 2005 21:32 Nový

Re: Preklad bude tezko

celé vlákno
:)) až na to, že by ty věty musel někdo manuálně přeložit...
SUNicko
SUNicko (neregistrovaný)
11. 1. 2005 12:19 Nový

Re: Preklad bude tezko

celé vlákno
Myslim, ze pokud by nekdo, klidne i Google podobny cisty strojovy preklad do cestiny ci jinych narocnejsich jazyku dotahl do konce, bylo by to mozna i na Nobelovku, otazkou je v jakem oboru, ja bych to klidne soupnul i do literatury :)
Barman
Barman (neregistrovaný)
11. 1. 2005 20:44 Nový

Re: Preklad bude tezko

celé vlákno
S Tvými vĚtnamci si neporadi ani Babelfish :-P

Don't Panic!
PaJaSoft
PaJaSoft (neregistrovaný)
11. 1. 2005 14:54 Nový

Re: Preklad bude tezko

celé vlákno
Nesouhlasim. Zamyslete se lidi nad tim, kde to drhne a co je tim omezenim... Po teto strance neni lidsky mozek nic jineho nez stroj, ktery se neco naucil a pak aplikuje... nepripomina Vam to neuronove site? Spravne! Zaklad by tu byl uz docela dlouho, jazyky Lisp a Prolog nejsou pro srandu kralikum, pravda dneska je spise sexy Java ci C++, pro otrlejsi starsi predkove jako Ada ci Simula (?). Ostatne, kouknete do libovolne hry, v cem je dnes psano to AI...

Problem tohoto pristupu byl a stale je jen a jen v omezenych zdrojich - jak baze dat, tak potrebnem obrovskem vypocetnim vykonu. Obojimu se firme Google aktualne dostava - predstavte si ten zasitovany Google jako obrovsky pocitac - kam se hrabou nejvetsi superpocitace dneska... Ono dokonce nevadi ani ty vypadky, ze to neni Fault Tolerant, lidsky mozek taky ne, proste na chcili neco ze zve baze zapomene...

Ja si naopak myslim, ze automatizovany preklad z mnoha do mnoha jazyku je strojove zvladatelny pri dostatecne velike bazi (semantika se nauci pomoci neuronovych elementu) a odpovidajicim vypocetnim vykonu.

Ja uz jsem zaznamenal okolo roku 2001-2, ze jeden nejmenovany telco operator testuje STROJOVY SIMULTALNI preklad telefonickych hovoru - mam pocit, ze to bylo Japonsko vs. Francie nebo nejaky podobny jazykove "pribuzny"... - takze ja bych to tak cerne vubecnevidel, ackoli je fakt, ze tento vyzkum se na verejnost prilis nepopularizuje...

A preklad z jazyka A do jazyka B prece je davno, vzdyt je to obycejne relacni zobrazeni, jde jen o to pokud mozno co nejpresneji popsat tu relaci. Je hezke, ze britove maji kosatou anglictinu (a miliony hantecu - co mesto to jiny underground), co z ni udelali Amici vime, ze tu spisovnou anglictinu neuslysite ani v Britskem kralovstvi, protoze poddani si to take zjednodusuji je nabiledni. Pujdeme-li do historie, urcite ten preklad bude problem (ale nerikam nemozny), ale dnesni "simple" verze anglictiny, cinstiny a normalnich jazyku - to zas tak cerne rozhodne nevidim...

David Rohleder
David Rohleder (neregistrovaný)
11. 1. 2005 15:20 Nový

Re: Preklad bude tezko

celé vlákno
problém je v tom, že IMHO člověk většinou chápe smysl věty a potom ji teprve překládá. A smysl větě dávají reálné vazby mezi jednotlivými objekty, které se v té větě vyskytují. A to včetně různých implicitních věcí, které sice nejsou řečeny, ale obecně platí. Neříkám, že není možné strojově překládat, ale podle mne to vyžaduje, aby byl v počítači model reálného světa. No a pak by mne celkem zajímalo, jak budou autoři implementovat do překladu smysl pro ironii a nadsázku. Celkem si nedovedu představit, jak by někdo dokázal překládat třeba slovní hříčky jako jsou třeba v Pratchettovi.
PaJaSoft
PaJaSoft (neregistrovaný)
11. 1. 2005 15:28 Nový

Re: Preklad bude tezko

celé vlákno
Nejsem lingvista, ale co treba zcela umely jazyk vytvoreny J.R.R. Tolkienem? Co treba dnes davno mrtvy jazyk jako Madarstina ci Latina - ty neumi vec(i)/spojeni, ktere v dobe "zivota" nemohly existovat - prekladat nebo pouzivat v tom kontextovem vyznamu? Co treba "pocitacovy" zapis v DNA? Byt mozna je vice jak binarni, nic to nemeni na faktu, ze vsechno toto lze "jednoduse" popsat, pravda, obcas tomu kodu a uz vubec ne zapisu nerozumime... ale i to se meni:-)

Mne spise zajima, zda-li jsem seriova ci pararelni biologicka entita nez soucasne omezeni zabehlych postulatu...:-)

J
J (neregistrovaný)
11. 1. 2005 16:59 Nový

Re: Preklad bude tezko

celé vlákno
No nevim, udelat doslovny preklad, ktery bude sklonovany + bude mit OK slovosled, to si jeste predstavit dovedu. Ale problem je hlavne v tom, ze pri prekladu zdaleka nejde o samotne vety a tataz veta (klidne i odstavec) muze byt prelozena ruzne v zavislosti na kontextu.

Obavam se, ze ten stroj by si musel predevsim uvedomovat sam sebe a sve okoli aby byl schopen prekladat. Casto se prekladaji veci tak ze se vpodstate volne prevypravi (a to vubec neznamena ze je to spatne). Kdyz si osobne ctu neco napr v en, nejake to sluvko trebas neznam, ale presto nemam problem rozumet vetam, protoze vim o cem ctu.

Kdyz X lidi preklada jednu vec, kazdy preklad je trochu jiny a ten stroj by se musel drzet striktne toho, co uz bylo pouzito.

Mam ten pocit, ze dokud se nebudou bezne pouzivat kvantove/biologicke pocitace, tak zadny vykon neni dostatecny.
sundance@centrum.cz
sundance@centrum.cz (neregistrovaný)
11. 1. 2005 18:44 Nový

Re: Preklad bude tezko

celé vlákno
Madarstina? Mrtvy jazyk, no jdete to vykladat do Budapesti a budete mrtvy Vy:)
PaJaSoft
PaJaSoft (neregistrovaný)
12. 1. 2005 8:33 Nový

Re: Preklad bude tezko

celé vlákno
Mne teda ve skole ucili, ze mezi jazykove mrtve jazyky patri Latina, Madarstina a mnoho dalsich... osnovy se zmenily?
Vítězslav Novák
Vítězslav Novák (neregistrovaný)
12. 1. 2005 11:56 Nový

Re: Preklad bude tezko

celé vlákno
Neštudoval jste v Žilině?
Tam jsou takoví roduverní Slováci, že možná Maďarštinu prohlásili za mrtvý jazyk...
Ale někde na jihu Slovenska, třeba v Rimavské Sobotě (Rimaszombathely), Dunajské Strede (Dunaszerdahely) by se vám mohlo stát před čím jste byl varován. Nemluvě o čemkoliv za Rajkou nebo Komárom.

No a ani latina není až tak mrtvý jazyk, jak je možno se přesvědčit třeba zde http://www.cernovlaska.cz/index.php/lexikon-latina/?cid=1144 byť leccos je poněkud kostrbaté.

Hledal jsem "bikiny" (takový to hezký nic nahoře i dole, jak nosej ženský na pláži, pokud nosej vůbec něco, ne ten ostrov) - vím, že jsem tento výraz v moderní latině nedávno četl - ale po zadání do jyxa "latina nová bikiny" jsem dostal odkazy poněkud jiného ražení. Hodně jiného ražení. Zatraceně jinýho ražení.
venca
venca (neregistrovaný)
12. 1. 2005 9:52 Nový

Re: Preklad bude tezko

celé vlákno
> problém je v tom, že IMHO
> člověk většinou chápe smysl věty

osobne jsem zkusil par knih v prekladu
i v originale (cj/aj) (ze zoufalstvi,
kdyz ceskej preklad byl mimo). bohuzel
mam pocit, ze dost prekladatelu zcela
presne nechape smysl toho, co prekladaji
a pojem 'volny preklad' si vykladaji velice
volne.

spickoveho prekladatele v google nevyvinou,
ale prumerneho prekladatele prumerne
literaruty asi jo.

a hlavne, nemyslim si, ze je jejich
cilem delat preklady basni ci romanu ;o)
Bochi
Bochi (neregistrovaný)
12. 1. 2005 0:42 Nový

Re: Preklad bude tezko

celé vlákno
"A preklad z jazyka A do jazyka B prece je davno, vzdyt je to obycejne relacni zobrazeni, jde jen o to pokud mozno co nejpresneji popsat tu relaci."

Nemáte pravdu. Překlad mezi dvěma jazyky není obyčejná relace. Není to jednoznačné přiřazení, do hry vstupují i prvky mimo vlastní sdělení. Některé věty jsou nejasné nebo dokonce víceznačné a jen ze znalosti kontextu, rozpoložení řečníka, nebo povědomí o reáliích daného jazykového prostoru, vám umožní jejich pochopení (a posléze překlad). To je něco, co strojově možná v principu jde, ale takový stroj by musel disponovat něčím víc, než jen obrovskou datahbází slov a gramatických pravidel.
PaJaSoft
PaJaSoft (neregistrovaný)
12. 1. 2005 8:32 Nový

Re: Preklad bude tezko

celé vlákno
Některé věty jsou nejasné nebo dokonce víceznačné a jen ze znalosti kontextu, rozpoložení řečníka, nebo povědomí o reáliích daného jazykového prostoru, vám umožní jejich pochopení (a posléze překlad)

I stemito atributy umime pracovat, vcetne ne vzdy jednoznacneho (deterministickeho) prevodu... Znalost kontextu, realii je davno zvladnuta - pokud Vamneco rika pojem atributova gramatika, vite kam tim mirim. Snad jedine, co nevim kam zaradit (je-li vubec pri prekladu treba) je to rozpolozeni recnika... - znovu bych to hnal pomoci aparatu vicepaskoveho nedeterministickeho Turingova stroje a myslim, ze by se reseni naslo (dnes mozna v rovinach nevycislitelnosti a nespocitatelnosti).

Preklad A -> B dnes uz davno neni databaze slov a gramatickych pravidel, samozrejme, to je zaklad, ten nestaci a ani dneska se u tohoto nekonci.

Janusz
Janusz (neregistrovaný)
13. 1. 2005 20:41 Nový

Re: Preklad bude tezko

celé vlákno
Co me napada, ze Google by mohl pouzit pro optimalizaci prekladu z jednoho do druheho jazyka vyhledavani. Podle vysledku pageranku nebo poctu nalezeni dane varianty (bud tvaru slova , casti veti nebo vice vet) by mohl vybrat tu nejlepsi variantu prekladu. Toto mi pripada docela realne, vzhledem k obrovskemu vzorku textu dostupnemu pro vyhledavani.
Pet
Pet (neregistrovaný)
11. 1. 2005 16:00 Nový

Re: Preklad bude tezko

celé vlákno
Já jsem vymyslel SW pro překlady, který se sám učí, ale potřeboval nějaké přeložené texty tzn. text v AJ a k němu doslovný překlad do ČJ, abych to mohl vyzkoušet. Nevěděli byste o nějakých? Případně mi pošlete na mail.
zz
zz (neregistrovaný)
11. 1. 2005 10:58 Nový

Duchovni otci Internetu

Aaaa - dlouho sme tu nemeli fantazirovani nejakeho toho duchovniho otce Internetu. Jeste chybelo prohlaseni typu "64 KB by melo stacit vsem..." ;o)
tenis
tenis (neregistrovaný)
11. 1. 2005 12:05 Nový

babelfish.altavista. com

No clanek je docela sila. Autor videl reklamni sot a vylicil nam co se dozvedel. Jak s Googlem vsechno pujde samo. Google za nas bude sjizdet vsechny filmy a pak psat recenze ve vsech jazycich... Clanek by asi snesl kritictejsi ton...
A propos, preklad webovych stranek dela treba babelfish.altavista.com. Je pravde ze za moc nestoji, uvidime jak bude vypadat Googli verze...
John
John (neregistrovaný)
11. 1. 2005 12:10 Nový

asi blba otazka...

celé vlákno
...ale z ceho vlastne ta firma zije?
na cem vydelava?
vsude vidim Google, Google...
vsechno je zdarma nebo si to alespon myslim
muze mi to nekdo z pritomnych vysvetlit?
diky
Zdeněk
Zdeněk (neregistrovaný)
11. 1. 2005 12:28 Nový

Re: asi blba otazka...

celé vlákno
http://www.google.com/intl/cs/corporate/business.html
Martin Kuželka
Martin Kuželka (neregistrovaný)
11. 1. 2005 14:55 Nový

Re: asi blba otazka...

celé vlákno
Google vydělává z 99% na reklamě.
Petr Šnajdr
Petr Šnajdr (neregistrovaný)
11. 1. 2005 12:57 Nový

KeyHole

Není pravda, že satelitními snímky je pokryta jen Serverní amerika a malá část světa. Poměrné rozsáhlé datové zroje jsou i v jiných končinách planety jako střední východ, Japonsko atd. Je pravda, že k pokrytí celé planety ještě zbývá hodně práce, ale už teď jsou pokryty i části antarktidy :-)

Docela dobře je na tom třeba Řím nebo Atény. Myslím, že Atény jsou i jedním z prezentačních míst.

Trochu horší situace je s dalšími datovými zdroji jako jsou restaurace, hotely atd. atd. tam víceméně platí ta popsaná situace: převážně severní amerika.

Nicméně i to není úplně pravda, jen je svět pokrýván postupně od těch zajímavějších míst k těm méně zajímavým. Takže většinou tam kde se něco děje už data jsou i když se nejedná o rozsáhlá území.

Atény májí na svědomí třeba olymp. hry, poměrně rozsáhlé části iráku zase tamnější politické poměry ;-) apod.

Pokud se týká těch dotazů na Google tak jich nejsou 2 miliony, ale dvě miliardy za den - což počítáno v pageviews se "udělá" na servrech v iAuditu ("český internet") za 2 měsíce :-). Trochu jiná měřítka :).

Zajímavější jsou technologie, které za tím stojí, ne to co vidí uživatel. To co vidí uživatel je současnost, to co je za tím je budoucnost.

I když zrovna KeyHole Google koupil minulý rok tak je to technologicky velice zajímavá věc. Není to zdaleka 3D mapa, dokonce to ani není způsob jak dostávat obrázky a mapy z nějakého serevru na nějaký klientský počítač, to jsou jen konkrétní způsoby použití. Ale to by bylo na celý článek :-)

Po světě existuje pár technologických ekvivalentů toho co dělá Google, v ČR v zásadě nikdo neinvestuje a zřejmě ani v budoucnu nebude schopen investovat ani do vývoje nebo výzkumu ve směru jaký jde třeba jen samotná technologie od KeyHole. Ale to už jsme odbočil trochu moc, ale přišlo mi, že ten článek moc kouká po povrchu a ne co je pod ním :-)
A to je mnohem lepší a zajímavější :-)
Tom
Tom (neregistrovaný)
11. 1. 2005 13:15 Nový

Překlad bude

celé vlákno
Nesouhlasím s Johankou, strojový překlad od googlu určitě bude. Už teď existují programy na slušné úrovni, pro češtinu třeba na www.britanik.cz. Google to určitě posune ještě dál. Akorát tady v česku si na to asi ještě chvíli počkáme...
David Weil
David Weil (neregistrovaný)
11. 1. 2005 13:42 Nový

Re: Překlad bude

celé vlákno
Cože? Tohle že je ukázka slušné úrovně? A jak tedy vypadá ta "neslušná"?

Přeložit "Be Donald Trump’s next Apprentice - Apply now." jako "Být Donald Trump je příště učeň - Platit nyní." a tvrdit přitom, že to je slušný překlad, to už chce tedy hodně velký nedostatek soudnosti. A to se ještě na Vámi uvedené adrese chlubí, jak Britanik zohledňuje celé věty.

No, aspoň to pobavilo.




Mimochodem - nedávno přišel do jedné konference dotaz od cizince, který si mail nechal do češtiny přeložit podobným programem. Nikdo dotaz nepochopil a to ani při pokusu o zpětný doslovný překlad. Považuji to za výmluvný příklad úrovně překladačů.
PaJaSoft
PaJaSoft (neregistrovaný)
11. 1. 2005 14:56 Nový

Re: Překlad bude

celé vlákno
Doplnte si slusnou znalostni bazi, automatizujte sklonovani a casovani dle pravidel ceskeho pravopisu, vybudujte ani ne moc velikou bazi vyjimek a mate to... - co chybelo do ted byl vypocetni vykon (a drive castecne i ulozny prostor), zbytek je po teoreticke rovine zvladnut dost dlouho, pokud kvantovy pocitac nebude jen hracka v laboratori, muzeme se se soucasnym pohledem na IT jit vseci klouzat neb budeme prevalcovani.
petr
petr (neregistrovaný)
11. 1. 2005 15:15 Nový

Re: Překlad bude

celé vlákno
1) preklad bez znalosti kontextu bude vzdycky stat za prd; a kontext (tj. "pochopeni sveta") zatim do pocitace narvat neumime a neni to jen otazka kapacity
2) neuronky jsou pekna vec, ale zatim funguji jen na velmi jednoduche a specificke ulohy
3) pro kvantove pocitace uz mame navrzenych spoustu peknych algoritmu, ale jaksi nam chybi ty pocitace samotne (ok, asi vterinu existoval cca 10 qbitovy kvantovy pocitac) a vypada to, ze dalsich x desitek let nebudou
PaJaSoft
PaJaSoft (neregistrovaný)
11. 1. 2005 15:23 Nový

Re: Překlad bude

celé vlákno
ad 1) - kontext narvat umime, omezovala nas kapacita a chut mit spocitatelny vysledek v rozumnem case.

Ad 2) - kdy jste je videl naposled a jaka mely omezeni?

Ad 3) - vy mate paru o soucasnem stavu vyzkumu nebo jen o utrzcich, ktere obcas nekdo nepozorny nebo zamerne utrousi? Naopak zjednoduseni algoritmu z exponencialniho na linearni je takovy pocit, ze spousta dnesniho na co jsme zvykli proste prestane existovat/ byt potreba... Mimochodem, vite proc neco jako pocitac, alespon te Von Neumanovske architektury vubec vznikl? Jednoduse proto, ze mechanicke overovani vypoctu pomoci logaritmickych pravitek bylo narocne... - ano tusite spravne, byly to USA a jaderna puma... - zkuste si precist nejake publikovane zapisky/vzpominky treba nositele nobelovy ceny za Fyziku Prof. Feynmana.

petr
petr (neregistrovaný)
11. 1. 2005 15:41 Nový

Re: Překlad bude

celé vlákno
ad 1) Zrejme mi unikl nejaky vyznamny projekt/objev z posledni doby... mate nejaky odkaz na cokoliv, kde je popsan zpusob, jak do pocitace narvat znalost reality a schopnost ji pochopit? (IMHO nutna podminka pro spravny preklad vicevyznamovych slov, emotivniho naboje vet, ironie, nadsazky, atd.)

ad 2) Spise bych to polozil tak, ze jsem nevidel zadne pouziti n.s. pro ulohy obecnejsiho charakteru. Vzdycky jde o nejakou optimalizacni ulohu, pripadne rozpoznavani textu, hlasu, obrazu, atd. Navic vsichni moji byvali spoluzaci z VS, kteri neco delali s n.s. na ne z nejakeho neznameho duvodu zanevreli :) Ono to IMHO ceka na poradne paralelni zpracovani...

ad 3) Asi jsem to nenapsal jasne, takze jeste jednou. Algoritmy pro kvantove pocitace jsou vymyslene a jsou super. Chybi pocitace samotne! (to je ma vytka) BTW feynmana jsem cetl
PaJaSoft
PaJaSoft (neregistrovaný)
11. 1. 2005 16:03 Nový

Re: Překlad bude

celé vlákno
Ad 1) - neni to oblast, o kterou bych se denn2 zajimal, takze nemohu slouzit. Ovsem co treba heuristicke analyzy nekale cinnosti software, IDS atd.? Tim ted nemyslim porovnavani baze znalosti (vzorky) s aktualnim stavem, ale skutecne detekujici vec ve stavu "snapshotu" - bezicim kontextu... - zde je baze omezena prave s ohledem na pozadovany vykon, radsi nedomyslet, kdyby nebyl jako priorita vykon, ale znalost...:-)

Ad 2) - je fakt, ze po optimismu v 50-tych letech v konfrontaci s lety 60-tymi to asi tak na 20 let (leta 70 a 80-ta) na venek skoro usnulo (vyschle finance byly jednim z duvodu). Pokud povazujete pouze za hricky studentu fotbal/hokej jeden robot vudci jednomu (algoritmus/strategie - mnozne cislo jsou jednou vlozeny), pripadne team vs. team, klidne, ja v tom vidim zaklad daleko mohutnejsi. Dalsi priklad bych si dovolil pujcit z vesmirneho programu, konkretne automatizovane systemy v programu dobyti Marsu - prave s ohledem na to, jak americka administrativa po 30-ti letech tlaci na uspech v teto oblasti (od pristani na Mesici) si myslim, ze se dockame jeste hodne zajimaveho...

Ad 3) - ja vim, ze NEJSOU ke koupi ani kdybych lopatou zlato prehazoval, mozna se neshodneme na tom, ze rekneme 10, 20 let je skoro zitra s ohledem na to, jaky postup byl v poslednich 60-ti letech... a da-li Buh, jeste se toho doziju.

petr
petr (neregistrovaný)
11. 1. 2005 16:33 Nový

Re: Překlad bude

celé vlákno
ad 1) To je ale priklad naprosto specificke cinnosti. Neznam detaily, ale tyhle veci obvykle nejak statisticky zpracujou vstupy a pak ne ne spusti algoritmus, ktery vyhodnoti riziko (jedno nebo par cisel). A to ma daleko k obecnych uloham. Uvedu 2 priklady (ne uplne idealni, ale zrovna me napadly): V textu o Thajsku z posledni doby se objevi slovo 'vlna' a pocitac ho preklada. Jak ma vedet bez pochopeni souvislosti, o jakou vlnu presne jde? Vlna jako ovci, morska, radiova, ...? Nebo druhy priklad - pocitac preklada rozhovor "Kde je dedecek?" "Uz odesel.", a pak preklada "Zije jeste dedecek?" "Uz odesel.". Musi pak poznat, ze v druhym pripade jde o eufemismus a spravne to prelozit. Neboli musi ty vety pochopit. A k tomu maj pocitace hodne daleko.
Ted me napad jeste treti priklad - veta "T'll be back!". Za urciteho kontextu jde o parafrazi Arnieho vety z terminatora a musi byt prelozena "Ja se vratim!", jinak parafraze prestava fungovat, a jindy muze byt prelozena neutralnim "Vratim se!".

ad 2) Ty hokeje/fotbaly - ano, je to pokrok, ale porad jde o tu specifickou cinnost, nejakou hru. A vyuziti neuronek v misich na Mars? Mate nejaky link?

ad 3) Ne ze nejsou ke koupi, ale nikdo zatim nema ani predstavu, jak by se daly vyrobit. Ale souhlasim, za 20 let muze byt vsechno jinak.
Vítězslav Novák
Vítězslav Novák (neregistrovaný)
12. 1. 2005 18:59 Nový

Re: Překlad bude

celé vlákno
Nevím jestli je nějaký link na nějaký scifoidní projekt, ale zatím ty superextra hi-tech zařízení jsou postavený na procesorech, který byste nejspíš nesneli ani v záchodovým prkýnku. A jezdí se stylem kamera - pár (někdy dost) minut přenos, vyhodnocení, pokec - povel posuň se o 50 cm směrem A - napětí co to udělá - kamer - přenos...

Jediná neuronová síť je ta mezi obrazovkou a myší kdesi v Houstonu.

Nikdo si nemůže dovolit poslat do kosmu něco, co je na Zemi mlo vyzkoušený.
Vítězslav Novák
Vítězslav Novák (neregistrovaný)
12. 1. 2005 19:03 Nový

Re: Překlad bude

celé vlákno
Tak pardon, podíval jsem se na http://www.scienceworld.cz/sw.nsf/ID/8F8122F0C8F4F2C4C1256E97004920A5?OpenDocument&cast=1 a základem je IBM PowerPC.

Ostatní je platné.
PaJaSoft
PaJaSoft (neregistrovaný)
13. 1. 2005 8:52 Nový

Re: Překlad bude

celé vlákno
Ano takto to fungovavalo, bohuzel se ukazalo, ze mohou nastat nepredvidatelne udalosti, na ktere je zpozdeni Mars Zeme (8m? * 2 ci kolik) proste kratke, takze bylo treba doplnit heuristiku aby se to nepo... alespon v elementarnich pripadech... - a pokud je mi znamo, tak to reseni neni ve stylu pokud nastane tato mnozina okolnosti udelej A, ale je to opravdu formou naucenych stavu, reakci - tedy svym zpusobem AI a nikoli podminka a akce.
petr
petr (neregistrovaný)
11. 1. 2005 15:45 Nový

Re: Překlad bude

celé vlákno
Jeste drobnost - netvrdim, ze strojovy preklad nikdy nebude! Jen si myslim, ze zatim existuje nekolik prekazek a ze je potrva prekonat desitky let (20 minimalne). Do te doby poradne preklady neocekavam. A kdyz pisu poradne preklady, tak myslim nejen gramaticky bezchybne, ale i vyznamove spravne.
J.K.
J.K. (neregistrovaný)
11. 1. 2005 15:33 Nový

Re: Překlad bude

celé vlákno
Asi takový naivka jako PaJaSoft byl redaktor toho televizního pořadu.
Oni třeba připravují překlad klíčových slov mezi různými jazyky a nějaký trouba z toho do televize udělal automatické překlady.
Nejprve by bylo potřeba vědět, co skutečně Sergej řekl televizi a potom vědět, co nějaký vedoucí oddělení vícejazyčných mutací nablábolil Sergejovi, aby oddělení vypadalo, že už v překladech jednoznačně předhonili konkurenci z bývalém Sovětském svazu.
PaJaSoft
PaJaSoft (neregistrovaný)
11. 1. 2005 15:35 Nový

Re: Překlad bude

celé vlákno
Radsi v tomto pripade uspokojeny naivka nez prekvapeny pesimista tvrdici, ne to neni mozne, tomu neverim...:-)

K tem rusum - mozna Vam uniklo, ze velmi vyznamna cast (mozna majoritni) techto kapacit davno pracuje na druhe strane.

Brouzdej Blog
Brouzdej Blog (neregistrovaný)
11. 1. 2005 13:21 Nový

Dobrý článek

celé vlákno
Nezbývá než autora pochválit. BTW: chybí tam důležitá informace, že zaměstnci google mohou 1 pracovní den v týdnu trávit tvorbou soukromých projektů.
Petr Šnajdr
Petr Šnajdr (neregistrovaný)
11. 1. 2005 13:32 Nový

Re: Dobrý článek

celé vlákno
Ten pořad běžel tuším na SBS. Když už jsme u těch drobností tak mě docela rozesmálo jak jak Sergey se zamyslel po té co se ho ta slečna zeptala nejdřív zdali stále na lýžařské vájezdy jezdí všichni tj. celá firma, on odpověděl, že ano a ona se ho zeptala kolik mají zaměstnanců a na odpověď 3000 řekla: "to jsou opravdu velké výlety" :-))). Moc hezká mimika :)

Petr Šnajdr
Petr Šnajdr (neregistrovaný)
11. 1. 2005 14:19 Nový

Re: Dobrý článek

celé vlákno
ooops, překlep, bylo to na CBS
Martin Kuželka
Martin Kuželka (neregistrovaný)
11. 1. 2005 14:23 Nový

Víc fotek z Googleplexu

Kdyby někdo chtěl vidět víc fotek z Googleplexu, než je jich v článku, ať navštíví http://www.6smarketing.com/googlevisit .
JersyWoo
JersyWoo (neregistrovaný)
11. 1. 2005 19:04 Nový

Dobrý článek

Myslím si, že článek je přínosný, že ukázal jiný styl podnikání a práce než na který jsme běžně zvyklí.
Bedra
Bedra (neregistrovaný)
12. 1. 2005 10:59 Nový

Stručný kurz lingvistiky, aneb strojový překlad je z lingvistikého hlediska nemožný

celé vlákno
Myšlenka strojového překladu je hezká, ale absolutně nereálná. Tady je třeba zabrousit do lingvistiky, doporučuji autory jako J. Černého, F. Čermáka a především pak Základy jazykovědy od Adolfa Erharta. Ta knížka - byť je to jen přehled - hezky ukazuje, co jazyk vůbec je.
Jazyky jsou dnes - co se týká struktury velmi dobře popsány. Známe už například fonologické podobnosti, hláskové korelace, syntaktická a morfologická pravidla. Srovnávací a historická gramatika a především strukturalitsmus tomuto hodně pomohly, dneska by díky tomu teoreticky nebyl problém vzít nějaký jazyk a naházet jej do počítače. Například čeština je dneska popsána jak synchronně, tak diachronně; v obou případech jak jako struktura sama o sobě, tak ve vztahu k ostatním jazykům. Máme tedy přesný popis a nebyl by tak problém jej aplikovat.
Naprosto, ale naprosto zásadní problém je, že počítač nemá vědomí. A bez něj strojový překlad nikdy nemůže být realizován.
V realitě totiž existuje nějaký objekt (označované). Tento objekt má odraz a otisk vě vědomí, tedy pojmenování skutečnosti. A k tomuto pojmenování skutečnosti máme formu (označující). Například pro objekt strom máme ve vědomí nějaký otisk, pro nějž máme uložený kód různých jazyků (strom, tree, baum atd.).
Pokud nám z toho řetězce vypadne vědomí, překlad nebude nikdy možný. Reálná vazba mezi věcí a slovem totiž neexistuje! Dejme tedy nejdříve strojům vědomí jako zásobu významů, k nimž si bude přiřazovat slova různých jazyků, a pak můžeme hovořit o nějakém překladu.
Kromě toho jsou tady další překážky, které vycházejí například z funkce jazyka. Kognitivní lingvistika (v současnosti dost populární) hovoří o kategorizaci a interpretaci. Opravdu nevím, jak by stroj mohl správně sémanticky interpretovat kontext symbolu kůň. Kůň jako zvíře? Jako sešívačka? Jako hobby? Výkon motoru? Bez otisku ve vědomí a porovnávání z předchozí zkušeností stroj tento kontext nikdy nedokáže vystihnout.
David Rohleder
David Rohleder (neregistrovaný)
12. 1. 2005 11:57 Nový

Re: Stručný kurz lingvistiky, aneb strojový překlad je z lingvistikého hlediska nemožný

celé vlákno
Osobně si myslím, že k tomu, aby se dalo rozumně překládat nepotřebujeme vědomí. Ovšem vazby mezi objekty jsou potřeba. Pak ovšem interpretace slova kůň musí vycházet z vazeb na okolní text. No a nejjednodušší interpretace pak bude ta, že se spočítá metrika vzdálenosti mezi těmi okolními objekty a koněm. Už s takovou metrikou velkou pravděpodobností dojdeme ke správné interpretaci.

Mně osobně se strašně líbil takový model grafického znázornění jednotlivých synonym, které měly mezi sebou vazbu (třeba Visual thesaurus). Tam je celkem pěkně vidět, jak je možné ty vazby realizovat.

Nicméně mé představy jsou jenom představy nepoučeného laika.

Petr
Petr (neregistrovaný)
12. 1. 2005 12:19 Nový

Re: Stručný kurz lingvistiky, aneb strojový překlad je z lingvistikého hlediska nemožný

celé vlákno
To mozna bude fungovat pro odbornou literaturu, kde je zadouci, aby cely text mel "uceleny kontext".

Rozhodne to musi zalostne selhat na humoru, kde principem je prave ta prudka (neocekavana!) zmena kontextu.

Vim, ze existuji texty, v nichz je humoru 0% a mene. Nastesti nejsem pravnickou mluvu nucen cist. Ve vsech ostatnich textech je humoru aspon 1% - a v automatickem prekladu z humoru vznikne situacni komika :-)
Bochi
Bochi (neregistrovaný)
12. 1. 2005 19:54 Nový

Re: Stručný kurz lingvistiky, aneb strojový překlad je z lingvistikého hlediska nemožný

celé vlákno
Ano, presne tak. Humorny text, satira, ironie, poezie, ... to je jen par prikladu, na kterem si budou vylamovat automaticke prekladace zuby jeste mnoho desitek let, pokud to vubec kdy zvladnou.
Vítězslav Novák
Vítězslav Novák (neregistrovaný)
13. 1. 2005 15:34 Nový

Re: Stručný kurz lingvistiky, aneb strojový překlad je z lingvistikého hlediska nemožný

celé vlákno
Obávám se, že nejen tady.

Někdy se to určí z kontextu, někdy ovšem ten kontext bude hodně daleký. Příklad - čínština má mnohem víc slov pro rodinné příslušníky. My známe bratra - oni staršího a mladšího bratra, různá slova. Strýčky a tetičky z několika kolen a rozlišením jestli je tetička sestra otce nebo matky, případně přivdaná. Někdy je to podstatné. A přeložte to z češtiny!
Přitom by to mohl být odborný sociologický text.

Japonci mají zdvořilostní stupně, záleží na tom kdo a s kým mluví. Dělali si srandu z Američanů po válce - oni se učili japonsky od svých milenek, takže pak mluvili ženským jazykem, což v machistické japonské společnosti působilo srandovně. Když budete překládat obyčejný rozhovor, musí se vybrat patřičné stupně už proto, aby výsledek byl neutrální. Když podřízený mluví s nadřízeným neutrálně (a ne uctivě) už to setsakra něco znamená! Něco, co v původním textu vůbec nemuselo být, ale přesný překlad to tam dodá.

Kdepak, na automatické překlady bych nespoléhal. Hned tak ne. A to "Ludvík dodávka Beethoven" není nejhorší.
--
-- (neregistrovaný)
14. 1. 2005 18:29 Nový

Re: Stručný kurz lingvistiky, aneb strojový překlad je z lingvistikého hlediska nemožný

celé vlákno
na druhou stranu lze si i predstavit ze v nekterych oblastech bude databaze znalosti vct. kontextovych natolik sirsi u stroje nez u cloveka, ze muze plodit v urcitych situacich i preklad presnejsi..
Digero
Digero (neregistrovaný)
12. 1. 2005 12:40 Nový

Re: Stručný kurz lingvistiky, aneb strojový překlad je z lingvistikého hlediska nemožný

celé vlákno
Vedomi? Tohle uz jsem slysel kdyz se delali sachove programy... Jedine co je potreba je chytry algoritmus, spousta vypocetniho vykonu a mravenci prace pri katalogizaci jazyka.
J
J (neregistrovaný)
13. 1. 2005 13:32 Nový

Re: Stručný kurz lingvistiky, aneb strojový překlad je z lingvistikého hlediska nemožný

celé vlákno
Kdepak, sachy maji jednoznacna pravidla, jazyk nikoli.

Sachove programy funguji tak, ze zkousi v idealnim pripade vsechny moznosti + porovnavaji je s databazi odehranych partii a po te vyhodnoti ktery tah je za dane situace nejvyhodnejsi.

U prekladu jazyka mate ten problem, ze lze napsat i cely odstavec, s nekolika moznymi vyznamy. A pokud chcete zachovat vyznam puvodni, musite jej chapat.
PaJaSoft
PaJaSoft (neregistrovaný)
14. 1. 2005 14:24 Nový

Re: Stručný kurz lingvistiky, aneb strojový překlad je z lingvistikého hlediska nemožný

celé vlákno
Coz neni takovy problem pro Google diky neskutecne velke databazi frazeologickych spojeni, jak spravne nekdo poznamenal...- proste je to casove i velikostne ohraniceny ukol.
Vítězslav Novák
Vítězslav Novák (neregistrovaný)
14. 1. 2005 15:34 Nový

Re: Stručný kurz lingvistiky, aneb strojový překlad je z lingvistikého hlediska nemožný

celé vlákno
To jsou šachy taky. Podstatně omezenější. Především jsou šachy strašně jednoduchá hra. 64 políček, 2 x 16 figurek, pro každou jasná, jednoduchá a jednoznačná pravidla, co může. V každě situaci se dá vygenerovat úplná množina možných kroků. Jediný problém je s exponencielní katastrofou.

Jazyk popisuje reálný svět, který je mnohem složitější, pravidla platí jednou víc a podruhé míň a je jich mnohem víc. Jak tohle chcete zvládnout prostým prohledáváním obrovské databáze textů, to mi je nejasné.

Třeba v mnou zmíněném příkladu s panem Langleym - vy nějak statisticky určíte, že Langley je ústředna CIA, tedy že to je metafora? V jiném kontextu to metafora nemusí být, proč by nemohl být pan Langley a nebo být míněno město Langley (dokoce to samé)? Statisticky zjistíte, že se vyskytuje blízko sebe "Langley", "CIA" a "centrála", ale nejdřív byste musel vědět, co je to centrála, aby vám vyplynulo, že "Co na to Langley" znamená "Jaké je mínění centrály CIA" nebo "dtto šéfů CIA".
Ale totéž může taky znamenat, že se ve městě L. něco stalo, a co na to jeho obyvatelé.
Nakonec, i v CIA může pracovat pan Langley, dokonce na ústředí, takže půjde o Langleyho z Langley, což může mít význam.

A když to statisticky určíte, tak zjistíte, že nejpravděpodobnější je použití slova Langley jako metafory, leč zrovna v tomto textu to tak být nemusí.

Kdepak - překlad znamená porozumění textu a porozumění znamená znát spoustu informací mimo tento text. A souvislostí mezi nimi.

ps - teď mě napadlo, že Langley taky může znamenat pana Lang-li, Číňana, rybáře z Kantonu. Nebo cokoli chcete´.
PaJaSoft
PaJaSoft (neregistrovaný)
14. 1. 2005 15:43 Nový

Re: Stručný kurz lingvistiky, aneb strojový překlad je z lingvistikého hlediska nemožný

celé vlákno
Jazyk popisuje reálný svět, který je mnohem složitější, pravidla platí jednou víc a podruhé míň a je jich mnohem víc. Jak tohle chcete zvládnout prostým prohledáváním obrovské databáze textů, to mi je nejasné.

Jednoduse mily Watsone, pomoci vah... a databazi na to ma setsakramentsky dobrou aby se v tech vahach nemylil.

Vítězslav Novák
Vítězslav Novák (neregistrovaný)
14. 1. 2005 17:45 Nový

Re: Stručný kurz lingvistiky, aneb strojový překlad je z lingvistikého hlediska nemožný

celé vlákno
Přeji příjemné vyvíjení. Já prozatím vím, že když nějakou informaci agreguji, tak značnou část informace ztrácím.

A že by dobrá databáze? Především žádná databáze. Spousta textů, často protiřečících si, často nesmyslných, často spíše desinformačních než informačních...
Věřit, že z tohoto vznikne nějaká relevantní informace, je podobné, jako věřit, že vznikne dobrá encyklopedie stylem wikipedie. a nebo poživatina style pejska a kočičky, ovšem míchajícím miliardy pláců.

Je dobrý být optimista, ale je rozdíl mezi optimistou a soutěžním skokanem na špek. Vy byste se mohl přihlásit do nároďáku, pokud taková disciplína vznikne.
Vítězslav Novák
Vítězslav Novák (neregistrovaný)
12. 1. 2005 12:46 Nový

Re: Stručný kurz lingvistiky, aneb strojový překlad je z lingvistikého hlediska nemožný

celé vlákno
Nebyl bych AŽ TAK pesimistický. Přinejmenším nevidím na "vědomí" nic tak mystického, aby to nešlo nasimulovat jinde než v cca 15G neuronů. Ale to bychom se dostali na filosofickou půdu, a ta je hodně měkká.

Ke správnému překladu (na úrovni člověka) potřebuje mít překladatel - člověk nebo stroj - spoustu znalostí. Což stroj zatím nemá a ještě dlouho mít nebude, přinejmenším proto, že je neumíme nějak pořádně zapsat. A to zahrnuji i dnes tak moderní ontologie a sémantický web a podobné. Protože tohle je na lidském vymýšlení, nepůjde to tak rychle dopředu jako HW, spíše slimáčím tempem SW.

Jiná věc je, že ani člověk, byť vybavený patřičnou znalostí, nedokáže vždy správně rozhodnout. Ten váš příklad s koněm patří do této kategorie. Když řeknu "kůň", nemá to kontext a jsem v koncích já i mašina. A budou konstrukce, kde budu v koncích vždy. Ovšem nebudu-li po stroji vyžadovat, aby byl chytřejší než člověk, jednou (JEDNOU!) toho překladu a porozumění snad dosáhneme.
Pak se třeba nestane, že v překladu špiónského thrilleru z USA se čeká, co na to řekne pan Langley... Když se chce někdo živit překlady, měl by znát základní reálie. No nic.

Ale zdůrazňuji - dnes je možné udělat morfologickou a syntaktickou analýzu, ale nějaké porozumění, tedy i slušné překlady jsou hudba hodně daleké budoucnosti. Hodně daleké je ovšem v tomto oboru tak 10-20 let. Ale možná jsem optimista.
Bochi
Bochi (neregistrovaný)
12. 1. 2005 20:10 Nový

Re: Stručný kurz lingvistiky, aneb strojový překlad je z lingvistikého hlediska nemožný

celé vlákno
"...aby to nešlo nasimulovat jinde než v cca 15G neuronů. "

V zasade mate mozna pravdu, ale tech 15G neuronu neni zadna malickost. Jsou urcite problemy, ktere jsou zdanlive resitelne (tj. existuje na ne prislusny matematicky aparat), ale jejich vypoctova slozitost je takoveho radu, ze problem jako celek se stava de facto neresitelnym. Neresitelnym v principialnim smyslu.
Podle kvantovych a gravitacnich zakonu moderni fyziky byste take mozna mohl zdanlive nasimulovat chovani (dejme tomu) nasi galaxie, ale jen k ulozeni potrebnych dat (nehlede na samotny vypocet a ziskavani dat) byste potreboval radove vice atomu, nez je obsazeno v teto galaxii. Takze neco, na co mame sice k dispozici rovnice a metody k ziskani dat, je presto neresitelne, pouze z duvodu extremni slozitosti.
A to jeste (vratime-li se zpet k neuronove siti) pomijim nutny proces uceni, ktery by na tom systemu 15G neuronu musel probehnout, coz by take urcite nebyla otazka par dnu. Dite, ktere je na svete par let, take neporozumi zdaleka kazdemu textu, aby se dostal na solidni uroven potrebuje clovek roky a roky uceni a interakce s realnym svetem. Potazmo takovy univerzalni prekladac by musel byt vic nez jen nejaka 15G "kopie" lidskeho mozku, ale spise supermozek, ktery ma rozhled v daleko vice oborech nez bezny clovek. Lidsky prekladatel, byt spickovy, take nezvladne s patra prelozit text z libovolneho oboru.
Takze vasich 15G by mozna muselo byt tak 100G, mozna 1000G, kdo vi. Kazdopadne si nedokazu predstavit, jak to zvladnout s vypocetni technikou, byt by byla mnohem a mnohem vykonnejsi nez dnes.
Vítězslav Novák
Vítězslav Novák (neregistrovaný)
13. 1. 2005 15:28 Nový

Re: Stručný kurz lingvistiky, aneb strojový překlad je z lingvistikého hlediska nemožný

celé vlákno
Mně šlo o něco jiného. Vědomí - ať už je to co je to, zatím se mi nepodařilo najít definici, jež by nebyla vágní k nepoužitelnosti - je funkcí nějakých těch 15G neuronů, z čehož nezanedbatelná část dělá pomocné práce, případně řídí na dost nízké úrovni. Tedy určitě se dá materiálně navodit. Jestli je někdy nasimulujeme v křemíku, jestli to bude neuronová síť, těžko říct. Umím si představit, že to bude nějaká mohutně paralelní architektura plus informace plus vstupy.

Ale na překlad nepotřebujeme tohle všecko. Rozhodně není nutné, aby překladatel nad Harlequinkou slzel, stačí, aby rozeznal jakou emoci autor do textu vložil a a věděl jak ji vyjádřit v cílovém jazyce. Což IMHO je záležitostí pravidel, ovšem strašně mnoha pravidel. V podstatě znalostí o skutečném světě. A reálií, pochopitelně. Když se v "námořním" románu dočtete o uzlech za hodinu, je to trapas. "Pana Langleyho" jsem citoval. Blbosti z počítačové branže nejspíš znáte.
--
-- (neregistrovaný)
14. 1. 2005 18:43 Nový

Re: Stručný kurz lingvistiky, aneb strojový překlad je z lingvistikého hlediska nemožný

celé vlákno
prave ten Pan Langley je dle meho nazoru spise pripad kdy bude stroj uspesnejsi, nikdo nemuze znat vsechno, ale stroj ma mnohem vetsi sanci se o tom dovedet - monitoruje li napr. vsechen tisk narozdil od nekoho kdo precte rocne 20 knizek..
subcommandante marcos
subcommandante marcos (neregistrovaný)
30. 11. 2006 20:19 Nový

Re: Stručný kurz lingvistiky, aneb strojový překlad je z lingvistikého hlediska nemožný

celé vlákno
Omlouvám se předem za stručnost, ale mám naspěch. Obávám se, že autor tohoto komentáře se příliš dobře neorientuje nejen v tom, co je a jak zhruba funguje strojový překlad, zároveň nepříliš dobře rozumí tomu, v čem spočívá problém s popisem jazyka pro jeho potřeby. Strukturalismus skutečně velmi dobře pochopil, že jazyk formálně charakterizuje jeho struktura, bohužel tentýž strukturalismus nedokázal formulovat svoje poznatky pomocí takového prostředků a z takovou explicitností, která by umožňovala jeho počítačové zpracování pro potřeby automatického překladu. Tedy alespoň ve své první fázi. S rozvojem generativismu ale začal být systematičtěji uplatňován popis jazyka orientovaný tímto směrem, takže např. u nás skupina kolem Petra Sgalla už několik desítek let pracuje na strukturalismem motivovaném a generativismem poučeném zpracování přirozeného jazyka právě pro potřeby automatické analýzy a syntézy, ergo překladu.
Otázka, jestli počítače mají nebo nemají vědomí dost dobře stojí a padá s tím, jaká kritéria si pro evidenci vědomí stanovíme. Pokud budeme behavioristé a opřeme se o jistou variantu turingova testu, pak nás už dnes leckterý program svou reakcí dokáže přesvědčit, že se jedná o myslící bytost, tj. nositele vědomí (což neznamená, že mít vědomí musí nutně znamenat myslet lidsky!) Ale do toho bych se nepouštěl, protože to není k debatě o překladu v tomto kontextu vůbec potřeba. Počítačový překlad je primárně orientovaný na texty a spočívá de facto v jejich desambiguaci. Existuje přitom mnoho způsobů, jak reprezentovat sémantiku přirozených jazyků (např. pomocí matematicko-logické teorie modelů), takže vaše námitka o nemožnosti dát počítači zásobu významů je mylná. Stejně tak je mylná vaše interpretace saussurovské dichotomie označující - označované, kde označované není objekt reality, ale pojem charakterizovatelný také jako hodnota (pravdou ale je, že i de Saussure je v tomto ohledu nejednoznačný). Každopádně argumentace v podstatě marxistickou teorií odrazu přináší více problémů než řešení. Na vaši výtku, jak rozlišit potenciální nejednoznačnost některých výrazů, je možné reagovat odkazem na kontext (zachytitelný formálně) apod.
__
__ (neregistrovaný)
14. 1. 2005 19:13 Nový

--

celkove je ale clanek nic moc spise takovou odou na google,
nachytaneho autora, tento obraz googlu je imho jasne definovane PR, zamerene na konkretni cilovou skupinu predevsim programatoru,.. nemusejici odpovidat realite(vzpomenme na lakadlo pracovnich prilezitosti u seznamu a provnejme s realitou pro neznalce vnitrnich problemu alespon treba prohlasenim lukacovice v "na kus reci s"), a proto by kritictejsi ton nevadil - bez znalosti vnitrniho prostredi Googlu u pana autora, ktere pokud ma, necht prosim v clanku uvede.

..kdyz se reklama googlu siri tak sama, je hezke ze autor nezapomel zminit najimani PR pracovnika, take nevim jak stihaji manageri googlu prijmat vsechny pracovniky osobne, vzhledem k mnozstvi inzeratu jen v UK a I se mi to zda nemozne a tedy by nebylo od veci rici jasne, ze se jedna patrne pouze o kreativni pracovniky, ..

dalsi veci je nejaky nakup tricka, takove ja-je-mam-rad PRovky snad nema Lupa zapotrepi prepravat.

co se tyce zminenych projektu precejenom chybi argumenty a rict nekdo neco chysta, ach ano jak jednoduche bez receni kdy a jak,... co se tyce nastroju na porovnavani cen, nesmysl stejne se trh prizpusobi resp. zmeni jakmile by se takovy nastroj rozsiril nad zanedbatelnou mez.. ale to se imho stane s googlem i bez nej..

google je predevsim o marketingu (kooperativni dohody s medii?) ne o technologii, kdovi jestli se jednoho dne nedovime ze za nim stoji sam MS nebo nejake vyznamne medialni skupiny, bily kone panu majitelu nevylouceny, nebezpeci pro skutecne vlastniky imho prilis velke, ze by se cely chod googlu obesel bez zajmu bezpecnost. slozek je imho take temer vyloucene atd. atd.
---------------------------------------------------------
tento prispevek obsahuje nepodlozene spekulace a zcela jiste i omyly

k tem 2 milionum dotazu to je snad ke konkretnimu programu KEYhole a ne GOOGLE celkem..
kUk
kUk (neregistrovaný)
16. 1. 2005 16:19 Nový

riziko

celé vlákno
"Sergey doufá, že se podaří vyrazit na lyže dokonce s třemi tisíci zaměstnanci dohromady."

To je dobrej nápad že. Pak jim tam někdo šoupne bombu (nebo jiná katastrofa) a google dogoogluje :)) Některý firmy maj ve stanovách že vedení nesmí cestovat spolu apod. Proč asi? :)
Martin Kuželka
Martin Kuželka (neregistrovaný)
17. 1. 2005 20:52 Nový

Re: riziko

celé vlákno
Tu bombu jim můžou šoupnout i do Googleplexu a s Googlem bude taky konec....
Rezza
Rezza (neregistrovaný)
30. 12. 2005 18:28 Nový

hh

The vodka is good, but the meat is rotten :)