Hlavní navigace

Počítač mluvící a naslouchající – nevěřím, nevěřím

 Autor: 29
Jiří Hlavenka 26. 5. 2008

Zásadní vývojové skoky bych s dovolením očekával jinde a jinak. Nechtěl jsem se původně této letité “Gatesově” vizi věnovat, ale při své nedávné návštěvě ji opět velmi intenzivně prezentoval Steve Ballmer, současný šéf Microsoftu.

Dle Steva Ballmera – i Billa Gatese – bude spočívat zásadní vývojový skok ve výpočetní technice v příštích letech v tom, že budeme s počítačem hovořit, říkat mu, co od něj chceme, on nejenže jasně porozumí našemu slovu, ale dokonce se domyslí, pokud nebudeme formulovat přesně, a i na základě našeho obecnějšího zadání nám vyhoví komplexním splněním úkolu. Ballmer to ilustroval na konkrétním, byť trochu chaoticky formulovaném příkladě: řeknete počítači, připrav mi referát, a ono to provede všechny ty akce, půjde do univerzitní knihovny, vyhledá si materiály, přeloží si texty, zjistí, kdo jiný tam ještě přednáší a o čem bude mluvit, kolika lidí se to týká a přesně to zaměří, co mě zajímá, a bude to samoučící proces, nebudu to zadávat na klávesnici, ale všechno hlasem, celý způsob ovládání těchto strojů se změní (video zde). Ballmer říká, že to vše se odehraje v příštích deseti letech, a že v těchto deseti letech proběhnou daleko dramatičtější změny “než kdykoli v minulosti”.

Nevěřím, nevěřím a nevěřím. Ne snad proto, že přesně toto už sliboval Bill Gates před deseti lety, takže již nyní jsme dle jeho prognóz se měli nacházet v nirváně. Vizionář neříká, kdy se něco stane, ale co se stane; vizionář nepočítá technické a technologické překážky zdržující jeho vizi s tím, že se to „po cestě vyřeší“. (I když to, jak dramaticky se v čase Gates, onen vrchní softwarový architekt, či jak zněl jeho kuriózní titul, zmýlil, je na pováženou. Již před deseti lety říkal, jak na tom jeho výzkumníci makají a že to mají už prakticky vyřešené a hotové.) Tedy: věřím spolu s Gatesem i Ballmerem, že toto bude technicky možné a vyřešené; jestli za deset, více nebo méně let, je celkem fuk. Ale nevěřím, že se to stane normou, standardem, obvyklou formou, jakou člověk pracuje s počítačem, a vůbec už ne tím zásadním vývojovým skokem, který je nám stále slibován. Důvody jsou dle mého názoru následující.

1) Myš rychlejší úst. Zkouším převádět běžnou činnost s počítačem (myš, klávesnice) do lidské řeči a takřka vždy mi vychází, že lidská pusa je pomalejší než myš a klávesnice. Představím si, že například chci označit tučně jedno slovo na této stránce: hele, jdi nahoru o sedmnáct, ne osmnáct, ne, devatenáct řádků, jo, dobře, o pár slov doprava, ještě, ne, už moc, o jedno doleva, vyber slovo, ne tohle, to druhý, tučně. Huba mně upadne; místo toho je to jeden klik a jedna klávesová zkratka. Ale i jiné příklady: Psát dopis! – o nic rychlejší než kliknout na ikonu Wordu.

Práce s počítačem je pro zkušené uživatele něco jako práce s předměty na stole – vzít, posunout, otočit, přeložit, odložit. Máme zručné ruce, hned dvě, prstů celkem deset – jde to svižně. Pokud bych měl si dát ruce za záda a ovládat tyto předměty hlasem… no, to bych se daleko nedostal.

2) Jak dlouho vydržíte mluvit v kuse? A poslouchat? Toto je možná věc osobního vkusu a trošku i pohlaví, dámy prominou, ale pokud bych měl namísto klidné práce s myší a klávesnicí neustále mluvit, a ještě pak poslouchat, co zase počítač říká mně, bylo by to na rychlý odvoz do blázince. Plus se přidávají další potíže: představme si dnešní typické kancelářské open space, ve kterém se bílý šum slévá z tisícerého tichounkého klapkání do klávesnic – dle Microsoftu by se zde vedly nepřetržité hovory uživatelů s počítači. Totéž v domácnosti, ve škole v učebnách a na kolejích. Pozavíráme se do zvukotěsných místností?

3) Správná otázka je těžší než správná odpověď. Každému vyřešenému úkolu, kreativní činnosti, objevu, poznání, podnětné informaci předchází správně položená otázka nebo správně zadaný úkol. Přesně formulovaná otázka je v procesu vyřešení úkolu tou nejtěžší věcí a když vidím – například –, že jedním z nejčastěji zadaných vyhledávacích slov na Yahoo je slovo „yahoo“, nemám pocit, že by to současná světová populace nějak zvládala (na Seznamu pak například „libimseti.cz“ nebo „freefoto.cz“. Ehm…). Je zcela utopické si myslet, že s tím, když na počítač budeme mluvit, se nějak zázračně naučíme ty správné dotazy zadávat, když ani nyní, v éře textové informace, to naprostá většina lidí neumí. Lidé nevědí, na co se zeptat, a pokud toto nevědí, je lhostejné, jestli prostředkem je klávesnice, myš, hlas nebo břichomluva. Není otázka, není odpověď. A naopak, pokud i průměrně inteligentní člověk ví, co chce vědět a zjistit, zadá to stejně snadno přes klávesnici jako přes hlasové rozhraní.

4) Kreativita jako šablona ve Wordu. Ballmerův (dosti bizarní) příklad o tom, jak počítač za nás víceméně připraví náš referát, má jednu citelnou slabinu. Pokud tisíc lidí – například v distančním studiu – dostane za úkol vypracovat práci Vliv pískání delfínů na intenzitu tání alpských ledovců, a ballmerovsky ji, sdělením této věty, sdělí počítači, bude výsledkem tisíc identických prací (či „polotovarů pro dopracování“), vytvořených podle algoritmické šablony připravené programátorem v Microsoftu, nebo třeba u Googlu. Máme zde tedy problém:

  • na rutinní, jednoznačné úkoly (Vytiskni to nebo Najdi vlakové spojení z Hodonína do Bruntálu) nepřinese hlas nic přínosného, ani jej moc oproti klávesnici a myši nezrychlí.
  • v obecných zadáních, kde „i cesta sama je objevem“, není žádné zadání typu napiš mi referát řešením, a velmi brzo se to pozná. Rozvádět to není potřeba.

Dalo by se o tom psát dále. Nejsem si jistý dopadem na duševní zdraví člověka (začne to dotazy, pak oslovováním „miláčku“, navolením si sexy hlasu na odpověď a skončí to prodejem gumových nafukovacích počítačů v sexshopech); mám pocit, že už tak „magoříme“ z počítačů dost a budoucnost by měla být spíše „bez počítačů“, tj. s tím, že informační a komunikační technologie budou spíše neviditelnými pomocníky než něčím, s čím neustále žvatláme. Nejsem si jistý zvládáním všech jazykových bariér; vždyť i tak triviální úkol oproti tomuto, jakým je schopnost kvalitního automatického překladu, který by ušetřil miliardy dolarů ročně, nebyl za padesát let computingu vůbec vyřešen a zvládnut. Nejsem si jistý i technologickou dokonalostí a uživatelskou přívětivostí tohoto řešení; bude to možné kvůli nejednoznačnosti lidského hlasu zvládnout tak, aby řešení fungovalo „dokonale“, bezchybně? Nedokonale fungující řešení se neujme. A technicky: budeme si všichni muset při práci s počítačem někam na sebe šroubovat mikrofony, budeme muset ztlumovat hudbu, televizi, okolní hluk a řeč? Lidské ucho je neuvěřitelně dokonalý „výrobek“: velmoci se snaží desítky let vyvinout dokonalé odposlouchávací zařízení a nemají na prostou vodu puštěnou v kuchyni (přičemž dva hovořící lidé si i při té tekoucí vodě navzájem dokonale rozumí).

Řekl jsem, že nebudu komentovat těch deset let, ale budu. Microsoft slibuje tak rychlý pokrok, jaký jsme dosud nezažili, ale já mám (v otázce operačních systémů, tj. základních pohonů našich počítačů) opačný pocit – setrvalé zpomalování pokroku. Vývoj Windows Vista trval Microsoftu nějakých sedm let, a výsledkem je inkrementální vylepšení – tak malé, že devíti z deseti uživatelů nestojí za upgrade ani dva roky po uvedení. Právě tak se, mimochodem, zpomalil i vývoj v hardware, kromě grafiky – proč? Protože lidem stačí to, co mají. Jaké je zdůvodnění toho, že ve světle toho, že se vývoj SW i HW už dvacet ket let nepřetržitě zpomaluje, náhle dojde k „největšímu zrychlení, jaké svět kdy viděl“? Kdo to vůbec potřebuje? A pokud se bavíme o pokroku, přelomech a revolucích – jsou zcela jiné oblasti, ve kterých vývoj pádí zběsile vpřed a konce nedohlédnout.

Tak jsem to oběma pánům nandal. Ale co chytří Ballmer s Gatesem vědí, co hloupý Hlavenka ani netuší? Možná:

  • Vycházejí ze zkušeností z domácího, amerického trhu. Lze uvěřit, že Američanům se řízení počítačů hlasem bude líbit – vypadá to pohodlněji, bezpracněji, prostě další krok ke „stroje pracují za nás“, což mají Američané velmi rádi. Saves your time, saves your money. Tak nějak mě to k „fast-foodové“ kultuře běžného Američana i pasuje; je možné, že to tam bude mít úspěch, no a pak to už Amerika nějak protlačí do zbytku světa. (Připomeňme si typické americké vynálezy: mikrovlnka, klimatizace, kráječ na chleba, otvírák na konzervy, eskalátor atd.).
  • vycházejí z toho, že časem počítač nebude stolní krám, ale bude zabudován, řekněme, ve vašem pupíku (do svého si vrtat nenechám). Tudíž jeho ovládání rukama bude obtížnější, ba nemožné, a lidský hlas (nebo možná i myšlenky?) bude jedinou volbou. To ale už fantazírujeme o ještě mocnější počítačové revoluci, kde bude změna ovládání spíše jakýmsi vedlejším produktem.
  • vycházejí z toho, že chtějí pro Microsoft i pro dalších pár desetiletí udržet vůdčí roli v oblasti PC (operační systém a běžné aplikace), a proti spíše „zjednodušujícímu“ Googlu chtějí mít něco, co hrozivý konkurent mít nebude a masivním marketingem to prohlásit za ten pravý pokrok. I hledalo se, hledalo a nalezlo, ovládání počítače hlasem. Nic moc, ale lepší než se nechat Googlem bez odporu převálcovat.

Tak si vyberte.

Anketa

Bylo by pro vás úplné hlasové ovládání PC spíše pomocí, nebo zátěží?

Našli jste v článku chybu?

26. 5. 2008 11:04

bredy.jinak.cz (neregistrovaný)
... tak se zblázníme. Buď bude muset každý stroj obsahovat umělou inteligenci, nebo dopadneme jako v Červeném trpaslíkovi...

HOLLY: A koho bys tady rád viděl?
LISTER: Kohokoliv! Chena, Petersona… Dokonce i s Göringem by byla větší psina než s Rimmerem. Já vim, že to byl šílenej transvestita, ale aspoň bysme si mohli zatrsat! (K umyvadlu) Vodu!
HOLLY: Ale pouze Rimmer je schopen udržet tě při zdravém rozumu.
LISTER: Ale, hovňajs!
Panel na zdi se otočí a objeví se ZÁCHOD.
LISTER: To n…





26. 5. 2008 13:42

JINC (neregistrovaný)
Před těmi deseti lety, na tom vámi zmiňovaném počítači, pro mne byl základní pracovní nástroj Excel. S pětašedesáti tisíci řádky a dvě stě padesáti šesti sloupci na listu. Měl jsem i sešity s patnácti listy, ale vešlo by se mi to všechno na jeden, kdybych oželel přehlednost. Běžně jsem míval v sešitu desítky tisíc vzorců, často víc jak z poloviny maticových. Před osmnácti lety jsem měl tabulky o něco málo jednodušší, počítaly se na 286 s frekvencí 8 MHz a nebyl to tehdy pro mne ještě Excel, ale …
Root.cz: Nová třída SD karet A1 s vysokým výkonem

Nová třída SD karet A1 s vysokým výkonem

DigiZone.cz: Mňam TV splnila slib a odešla z DVB-T

Mňam TV splnila slib a odešla z DVB-T

120na80.cz: Popraskané rty? Některé balzámy stav zhoršují

Popraskané rty? Některé balzámy stav zhoršují

Měšec.cz: Kdy vám stát dá na stěhování 50 000 Kč?

Kdy vám stát dá na stěhování 50 000 Kč?

Podnikatel.cz: Přehledná titulka, průvodci, responzivita

Přehledná titulka, průvodci, responzivita

Podnikatel.cz: Víme první výsledky doby odezvy #EET

Víme první výsledky doby odezvy #EET

Měšec.cz: Air Bank zruší TOP3 garanci a zdražuje kurzy

Air Bank zruší TOP3 garanci a zdražuje kurzy

Měšec.cz: U levneELEKTRO.cz už reklamaci nevyřídíte

U levneELEKTRO.cz už reklamaci nevyřídíte

Lupa.cz: Google měl výpadek, nejel Gmail ani YouTube

Google měl výpadek, nejel Gmail ani YouTube

120na80.cz: 5 poporodních problémů a jejich řešení

5 poporodních problémů a jejich řešení

Lupa.cz: UX přestává pro firmy být magie

UX přestává pro firmy být magie

Podnikatel.cz: Změny v daních z příjmů u zaměstnávání

Změny v daních z příjmů u zaměstnávání

Vitalia.cz: Pravda o přibírání na zimu

Pravda o přibírání na zimu

Podnikatel.cz: Pozor, pojišťovny mění čísla účtů

Pozor, pojišťovny mění čísla účtů

Měšec.cz: Vklad na cizí účet je draze zpoplatněn (přehled)

Vklad na cizí účet je draze zpoplatněn (přehled)

120na80.cz: Bojíte se encefalitidy?

Bojíte se encefalitidy?

120na80.cz: Rakovina oka. Jak ji poznáte?

Rakovina oka. Jak ji poznáte?

Podnikatel.cz: EET zvládneme, budou horší zákony

EET zvládneme, budou horší zákony

Root.cz: Telegram spustil anonymní blog Telegraph

Telegram spustil anonymní blog Telegraph

Lupa.cz: Avast po spojení s AVG propustí 700 lidí

Avast po spojení s AVG propustí 700 lidí