Hlavní navigace

klikni.idnes.cz je ostudou mezi katalogy

Libor Nováček 7. 3. 2001

Minulý týden spustila MAFRA, zbrusu nový katalog českého Internetu na adrese klikni.idnes.cz. Mnoho uživatelů, kteří se o spuštění dozvěděli a kteří mají v ostatních internetových katalozích záznam, se vrhla prozkoumat, jak se Klikni vypořádalo s jejich stránkami. Většina z nich ale musela být zklamána, když ne přímo zděšena.

Skutečnost, že katalog Klikni vykazuje nadměrné množství chyb a nepřesností už zjistil asi každý, kdo v něm zkoušel něco vyhledat. Chybovat je samozřejmě lidské, katalog Klikni však obsahuje chyb a nedostatků tolik, že to až bije do očí.

Podívejme se podrobněji na druhy chyb, které se v katalogu vyskytují nejčastěji:

1. Překlepy a pravopisné chyby

Mohlo by se zdát, že překlepy jako „archiv fotogragií, stránky pro dostpělé, sexxshop, vidoekazety“ vznikly tím, že katalogizátory rozrušilo prohlížení erotických stánek (navíc v rušném pracovním prostředí). Překlepy a pravopisné chyby ale obsahují i zcela obyčejné kategorie. „Sexxshop“ tak přijde o návštěvníky, kteří jej budou hledat jako sexshop, ale stávají se i horší věci.

2. URL zdroje často absolutně nesouhlasí s anotací či titulkem

Tuto chybu si můžeme ukázat dokonce i na záznamu (jednoho z mnoha) o našem serveru Lupa

Lupa
Server o českém internetu. Obsahuje množství informací z různých oblastí života společnosti. Doménová centrála, zpravodajství.
Sekce: Internetové zpravodajství, Technické zpravodajství, Internet
www: http://www.ho­kejka.cz

Katalogizátoři pracovali se „slepou“ databází URL a vše nasvědčuje tomu, že i s databází českých domén. Jak je vidět na příkladu s Lupou, v době tvorby katalogu URL http://www.ho­kejka.cz odkazovalo na stánky Lupy, což nikomu z katalogizátorů při tvorbě záznamu nevadilo. I jinak jsou často záznamy s jedním URL v katalogu mnohonásobně, občas pak zařazeny zcela v neodpovídajících kategoriích.

3. Anotace obsahují zbytečné informace, důležité pak vůbec

Mnoho anotací začíná velmi popisným či přímo „vypravěčským stylem“, např.: server obsahující informace… informace o… představení toho či onoho… ceník… objednávka… kontaktní adresy… e-mail. Místy najdeme perly typu „Uvdeny veškeré informace o firmě a její činnosti“ (uvádíme i s překlepem) nebo „Stránka poskytuje informace“.

Informace či adresu firmy spolu s e-mailem jistě očekává na WWW stránkách firemní prezentace každý. Pokud by uvádění těchto informací bylo součástí metodiky tvorby katalogu, měl by je pak obsahovat každý záznam – to ale neobsahuje. Často chybějí názvy značek produktů a služeb, které jsou v působnosti katalogizovaných subjektů. Katalog je prostě chudý na jména značek, které v jiných katalozích majitelé stránek ve svých záznamech potřebují prosadit a které ve svých popisech uvádějí. Navíc „vyprávěčský styl“ způsobuje, že mnoho záznamů obsahuje termíny v jiném pádě než prvním. Např. termín „opravna“ tedy uživatel najde spíše jako „(stránky) opravny či (informace o) opravně“, což činí navigaci pomocí fulltextového prohledávání katalogu značně složitější. U konkurenčních katalogových služeb se spíše setkáváme s popisem, který se ztotožňuje s prvními pády slov, které pravděpodobně uživatel spíše využije při vyhledávání.

Mravenčí práce

Pojďme se podívat, co by mohlo být příčinou tohoto nezdaru. Podařilo se nám malinko pohlédnout pod pokličku tvorby tohoto katalogu. Informace jsme získali od člověka, který se jako student-brigádník spolupodílel na tvorbě tohoto katalogu a který si nepřeje být jmenován. Tvorba katalogu se odehrávala v prostorách firmy PROFESSIONAL CALL CENTER SOLUTIONS, s. r. o. v Čestlicích u Prahy. PCC Solutions, jak se občas sama zkráceně tato firma přezdívá, je též podle internetového obchodního rejstříku majitelem společnosti SHOPCENTER.CZ, s. r. o., která provozuje na stejnojmenné adrese SHOPCENTER.CZ elektronický obchod. Tento obchod se z pohledu uživatele jeví, díky menu iDnes v horní a dolní části obchodu, jako integrální součást portálu iDnes. PCC Solutions je především telemarketingová firma a call centrum. V minulosti již ale pro společnost MAFRA pomáhala zpracovávat např. jejich soutěž MOTYNKA.

V Čestlicích na katalogu pracovalo podle odhadu našeho informátora vždy minimálně dvacet lidí. Placeni byli personální agenturou, náš člověk dostával 50 korun čistého na hodinu. Nejprve prý byla práce měřená podle množství vytvořených odkazů za hodinu. Výkonnostní laťka nastavená na 14 záznamů za hodinu však byla postupem času přehodnocena a šéfové začali žádat kvalitu před kvantitou. Přesto však podle našeho informátora nebylo výjimkou, že brigádníci zneužívali připojení k Internetu poskytnuté k práci pro soukromé účely – vyřizovali si e-maily, posílali SMS. Aby pak tento čas nahnali výkonem, stávalo se, že navštívili stránku, zkopírovali některou ze stěžejních vět prezentace z domácí stránky a záznam byl pro ně hotov.

Katalogizátoři prošli – a někteří i několikrát – zaškolením. Je tedy s podivem, že výsledek práce jednotlivých pracovníků je v mnohých případech velmi špatný. Katalogizování Internetu není jednoduchá záležitost ani pro profesionály, např. knihovníky, kteří mají k problematice pořádání informací velice blízko. Na začátku požadované tempo analýzy stránek a následné tvorby anotací lze z knihovnického hlediska označit za přímo vražedné.

Každý záznam ještě kontrolovala další osoba, náš člověk se domnívá, že nešlo o obyčejné brigádníky, ale o řádné zaměstnance. Pokud se jim záznam nelíbil, mohli jej buď změnit nebo zadat popisovanou adresu znovu do databáze určené ke zpracování.

Z hodinové mzdy brigádníků, pokud by dodržovali vysoké tempo 14 odkazů za hodinu, by se při uváděném počtu 100.000 záznamů dalo spočítat, že si brigádníci přišli na 357.000 korun. PCC Solutions však brigádníci nepřišli na pouhou jim vyplácenou mzdu, agentuře vyplácející tyto brigádníky musela zaplatit firma desítky procent navíc. Navíc tempo 14 dokazů za hodinu je vražedné a další pracovníci se zabývali kontrolou. Zdarma není ani připojení k Internetu a provoz počítačů, koordinace projektu. Společnost se jistě do projektu pustila i kvůli zisku. Náklady na tvorbu takto rozsáhlého katalogu se pak celkově mohou hravě přehoupnout daleko přes milion korun.

Říká se, že kdo šetří, má za tři. Trojku by možná s odřenýma ušima dostalo Klikni v Internetové škole. :-) Díky nekvalitně provedené práci se však provoz katalogu v jeho začátcích společnosti MAFRA notně prodraží. Další pracovní síly nyní budou potřeba na to, aby opravily záznamy uživatelů. Uživatelů, kteří budou mít to štěstí, že zaznamenají existenci tohoto nového katalogu a zjednají si vlastnoručně nápravu.

Samozřejmě nevíme, zda třeba veškeré reklamace nepadají na hlavu zpracovatele či zda se na tvorbě katalogu nepodílel ještě někdo jiný. Je škoda, že přestože společnost MAFRA nedávno vstoupila do společnosti Mobil Media, která ještě nedávno sama jeden katalogový server provozovala, pustila se do tvorby katalogu zcela od začátku.

Výše popisovaný případ Klikni jen vysvětluje důvod, proč lidé tak rádi používají katalogový vyhledávač na Seznamu (či americkém Yahoo!). Tento katalog totiž vznikal převážně tím způsobem, že záznamy do něj přidávali téměř od samého počátku Internetu sami majitelé stránek. A jedině majitel stránky ví nejlépe, jak popsat jádro svých služeb. S tímto faktem v budoucnosti málokdo něco udělá. A přinutit tvůrce stránek, aby používali některý z rodících se standardů pro popis obsahu stránek pomocí meta informací (např. Dublin Core Metadata), se jeví v příštích několika letech jako nereálné. Samy tyto standardy totiž mají daleko k dokonalosti. MAFRA se pustila do louskání tvrdého oříšku, navíc v době kdy se zdá, že pro budování katalogů od nuly je už i ten náš český Internet přiliš rozjetý.

Anketa

Jakou známku by od vás ve škole dostal katalog Klikni?

Našli jste v článku chybu?

9. 3. 2001 14:30

Dadule (neregistrovaný)
Takových chybiček zdá se máte vícero:
jedna nejmenovaná společnost je uvedena v katalogu jako personální agentura. Což není vůbec oborem její činnosti, ale pravděpodobně se tak stalo na základě toho, že sama na svých stránkách nabízí volná místa do své vlastní firmy...?!?!?!

No comment :-)

Dadule


9. 3. 2001 13:23

MK (neregistrovaný)
Co ovsem bude smrtonosne bude patrne pretezovani ci shazovani (M$) webu z duvodu session...

jeste kdybyste tak vedel, o cem mluvite :-)

Vitalia.cz: Baletky propagují zdravotní superpostel

Baletky propagují zdravotní superpostel

Podnikatel.cz: Přehledná titulka, průvodci, responzivita

Přehledná titulka, průvodci, responzivita

Podnikatel.cz: Hitem investice? Půda či nemovitost

Hitem investice? Půda či nemovitost

Podnikatel.cz: Nejenom EET, začaly platit další zákony

Nejenom EET, začaly platit další zákony

120na80.cz: Jak oddálit Alzheimera?

Jak oddálit Alzheimera?

Vitalia.cz: Chtějí si léčit kvasinky. Lék je jen v Německu

Chtějí si léčit kvasinky. Lék je jen v Německu

Vitalia.cz: Manželka je bio, ale na sex moc není

Manželka je bio, ale na sex moc není

Vitalia.cz: Mondelez stahuje rizikovou čokoládu Milka

Mondelez stahuje rizikovou čokoládu Milka

Měšec.cz: Vklad na cizí účet je draze zpoplatněn (přehled)

Vklad na cizí účet je draze zpoplatněn (přehled)

Podnikatel.cz: 3, 2, 1..EET startuje. Na co nezapomenout?

3, 2, 1..EET startuje. Na co nezapomenout?

DigiZone.cz: Milan Kruml: procházka TV historií

Milan Kruml: procházka TV historií

Lupa.cz: UX přestává pro firmy být magie

UX přestává pro firmy být magie

Root.cz: Vypadl Google a rozbilo se toho hodně

Vypadl Google a rozbilo se toho hodně

Lupa.cz: Google měl výpadek, nejel Gmail ani YouTube

Google měl výpadek, nejel Gmail ani YouTube

Vitalia.cz: Naučí vás péct kváskový chléb bez lepku i s lepkem

Naučí vás péct kváskový chléb bez lepku i s lepkem

Měšec.cz: Zdravotní a sociální pojištění 2017: Připlatíte

Zdravotní a sociální pojištění 2017: Připlatíte

Vitalia.cz: Spor o mortadelu: podle Lidlu falšovaná nebyla

Spor o mortadelu: podle Lidlu falšovaná nebyla

Měšec.cz: U levneELEKTRO.cz už reklamaci nevyřídíte

U levneELEKTRO.cz už reklamaci nevyřídíte

120na80.cz: Rovnátka, která nejsou vidět

Rovnátka, která nejsou vidět

DigiZone.cz: Digi CZ výrazně zlevnila balíček HBO

Digi CZ výrazně zlevnila balíček HBO