Hlavní navigace

Informace v menšině

Martin Kopta

Od chvíle, kdy se web stal výkladní skříní obchodu, ubírá se webdesign cestou, kde forma prezentace je důležitější než myšlenka. Diktátu módy se podřizuje absolutně všechno. Bude tedy zajímave se podívat, kolik textových informací dnes můžeme vytěžit z internetových stránek serverů uvedených v Lahvičkově seznamu.

Jelikož minulý srovnávací článek o podílu reklamy na datovém přenosu webu vzbudil celkem velký ohlas, rozhodl jsem se využít Lahvičkův výběr ještě jednou. Cílem třetího měření je odhalit poměr textových informací na internetových stránkách ke zdrojovému HTML. Textové informace jsou totiž v naprosté většině tím hlavním, co na webu hledáme (nechci samozřejmě snižovat význam jiných formátů informací), a proto by mohlo být zajímavé zjistit, kolik znaků ve zdrojovém kódu HTML připadne na jeden znak textové informace.

Tabulka přináší abecední seznam sledovaných serverů, kde u každého serveru jsou dvě čísla. První hodnota uvádí počet znaků ve zdrojovém kódu HTML, které připadají na jeden znak čistého textu na titulní straně, druhé číslo pak uvádí totéž pro typickou stranu z obsahu serveru.

SERVER Titulní strana Typická strana
Bonusweb 5,12 3,99
Centrum 7,11 7,74
Dáma 4,61 7,96
Doupě 4,83 3,93
iDnes 9,38 7,81
iHNed 7,85 9,14
Interval CZ 6,60 8,02
KudyKam 4,23 5,80
Lupa 6,05 6,42
MSN Atlas 7,03 3,97
Navrcholu 7,28 6,43
Neviditelný pes 4,33 2,85
Novinky 5,49 3,70
Pauza 6,37 6,29
Press CZ 12,29 n/a
Seznam 7,99 6,28
Seznamka 14,19 5,08
Svět namodro 4,07 5,49
TopList 7,46 11,61
Žena In 5,67 7,60
Živě 7,57 7,31
PRŮMĚR 6,93 6,37

Srovnání serverů

Ze všech předchozích měření obvykle nejlépe vycházely portály, protože jsou konstruovány úsporným kódem, neobsahují složité formátování ani grafickou úpravu. Tentokrát se Atlas, Centrum i Seznam drží v mírném podprůměru, a naopak bodují korpulentní zpravodajské servery Svět namodro a Neviditelný pes, mezi něž se ještě vetřel KudyKam. V typických stranách si nejlépe vedou Bonusweb, Doupě a Novinky, jejichž poměr textu ke zdroji nepřesahuje 1 : 4, aniž by to nutně znamenalo, že publikují delší články než konkurence. Na Neviditelném psu dokonce na jedno písmeno připadají jen necelá tři v HTML! Nejnižší informační hodnotu mají typické stránky na TopListu, Intervalu CZ a iHNed, a titulní strany Seznamky, Press CZ a iDnes.

Delší zdrojové kódy jsou pochopitelné u portálů, kde je de facto každé slovo odstavcem a tučným odkazem. Výhodnějšího poměru dosahují servery, které přinášejí maximum informací již na titulní straně — klasickým případem mohou být Neviditelný pes, KudyKam a Žena In, kde již na první obrazovce najdete úplné znění hlavních článků. Naopak Press CZ, kde většinu informací tvoří odkazy na informační zdroje, potřebuje k distribuci delší zdrojový kód.

Plýtvání kódem

Nejvíce prodlužuje HTML cesta v odkazu (zvláště pokud je uváděn úplný URL). Přitom autoři serverů mají obvykle možnost vytvořit publikační systém tak, aby byly odkazy co nejútlejší. Například slovo „aktual“, ktere se nachází takřka ve všech odkazech na Press CZ ( ./r.php3?z=1143404&t=aktual), by jistě bylo možné zkrátit až na jeden znak. Podobně plýtvají kódem odkazy na Seznamce ( ./ads.asp?idcat=104030000000&x=10&all=54).

Naprosto zbytečné je zapisovat přímo do zdrojového kódu definice kaskádových stylů a klientské skripty, které také tvoří nezanedbatelný objem, a přitom by jejich vyčlenění do samotatného souboru urychlilo načítání stránky. Postavené na hlavu jsou kombinace definic vzhledu psané tu v CSS, tu zase do atributů značek. Spoustu znaků vyprodukují také nefunkční a neefektivní konstrukce, jako je třeba tato: FONT face="Arial CE,Arial CE,Arial,Helvetica CE,Helvetica" size="-1" color="black" (Press CZ).

Převedení vlastností vzhledu z atributů HTML do globálního kaskádového stylu může v takových případech ušetřit třeba 30 % veškerého kódu (včetně CSS). Úspora je velmi dobře patrná třeba z rozdílných hodnot ve výsledcích serverů Navrcholu a TopList, kdy TopList spotřebuje na distribuci typické strany skoro dvojnásobně dlouhý zdrojový kód HTML, ačkoli Navrcholu poskytuje asi o 0,5 KB více textových informací téhož charakteru.

Krásnou ukázkou neefektivního kódu je i tabulka, jejímž prostřednictvím prezentuji výsledky měření. Sama o sobě spotřebuje 2.640 znaků ve zdrojovém kódu pro pouhých 407 znaků nesoucích významovou informaci, tím dosahuje poměru 1 : 6,49, přičemž při definici kaskádovými styly kód včetně CSS dosahuje jen 2.229 znaků, a tedy poměru 1 : 5,48.

Datový objem textové informace

Pokud si ještě vzpomenete na minulé měření, při kterém vyšlo najevo, že průměrná velikost HTML na sledovaných serverech je 56 KB a celkový objem strany dosahuje 160 KB, pak lze snadno dopočítat, že textové informace průměrně obsadí 14 % HTML, respektive jen 5 % celkového datového objemu. Pokud odečteme 28 % na reklamu, zbývá nám 33 % datového objemu na ilustrace a grafiku a cca 34 % na HTML (39 % včetně textu).

Pokud procenta převedeme na minuty, vyplývá z tohoto a minulého měření, že jen tři minuty z každé hodiny nepřetržitého stahování dat k nám proudí textové informace. Nebo jinak: pokud platíte za 1 GB cca 5.000 korun, tak jen 250 korun zaplatíte za textové informace; zbylých 4.750 korun platíte za data, která informaci nenesou, jen ji zprostředkovávají.

Co říkáte, nestálo by za pokus při příštím redesignu odělit strukturu (HTML) od formy (CSS) a zvýšit poměr textu v HTML na úkor redukovatelných atributů a zbytečných značek? Stránky vaší konkurence se zobrazují rychleji.

Našli jste v článku chybu?

4. 7. 2001 16:35

Jakub Mach (neregistrovaný)
Seznam, ze ma kratke odkazy???? A co treba tenhle?

http://dir.seznam.cz/Prumysl/Papirensky_a_polygraficky_prumysl_vydavatelske_cinnosti/Nakladatelstvi_a_vydavatelstvi/



11. 5. 2001 13:28

vik.tor (neregistrovaný)
Ano, pokud všechny stránky odkazují tentýž. To znamená stránky mají nemlich stejné styly a všechny jsou použity, pak to ušetří. Nebo každá obsahuje vybrané styly a poprvé se načítá soubor s dalšími x styly navíc. Pořád ale to zrychlí člověku, který čte těch 10 stránek, a zpomalí člověku, který čte jen stránku s flash news. Takže nějaká kombinace externího css, stylů ve stránce i formatovacích tagů se mi vůbec nejeví postavená na hlavu. Nepochopil jsem ze článku, zdali bylo uvažováno i cachování …
Měšec.cz: Za palivo zaplatíte mobilem (TEST)

Za palivo zaplatíte mobilem (TEST)

Vitalia.cz: Spor o mortadelu: podle Lidlu falšovaná nebyla

Spor o mortadelu: podle Lidlu falšovaná nebyla

DigiZone.cz: Placené VoD a obsah zdarma

Placené VoD a obsah zdarma

Root.cz: Telegram spustil anonymní blog Telegraph

Telegram spustil anonymní blog Telegraph

Podnikatel.cz: Změny v cestovních náhradách 2017

Změny v cestovních náhradách 2017

Podnikatel.cz: Vládu obejde, kvůli EET rovnou do sněmovny

Vládu obejde, kvůli EET rovnou do sněmovny

DigiZone.cz: NG natáčí v Praze seriál o Einsteinovi

NG natáčí v Praze seriál o Einsteinovi

Měšec.cz: Air Bank zruší TOP3 garanci a zdražuje kurzy

Air Bank zruší TOP3 garanci a zdražuje kurzy

Vitalia.cz: To nejhorší při horečce u dětí: Febrilní křeče

To nejhorší při horečce u dětí: Febrilní křeče

Podnikatel.cz: 3, 2, 1..EET startuje. Na co nezapomenout?

3, 2, 1..EET startuje. Na co nezapomenout?

Podnikatel.cz: Udávání kvůli EET začalo

Udávání kvůli EET začalo

Vitalia.cz: Když přijdete o oko, přijdete na rok o řidičák

Když přijdete o oko, přijdete na rok o řidičák

DigiZone.cz: Česká televize mění schéma ČT :D

Česká televize mění schéma ČT :D

120na80.cz: Popraskané rty? Některé balzámy stav zhoršují

Popraskané rty? Některé balzámy stav zhoršují

Měšec.cz: Jak levně odeslat balík přímo z domu?

Jak levně odeslat balík přímo z domu?

Měšec.cz: Kdy vám stát dá na stěhování 50 000 Kč?

Kdy vám stát dá na stěhování 50 000 Kč?

Podnikatel.cz: Chaos u EET pokračuje. Jsou tu další návrhy

Chaos u EET pokračuje. Jsou tu další návrhy

Root.cz: Mirai má nový cíl 5 milionů routerů

Mirai má nový cíl 5 milionů routerů

Podnikatel.cz: Daňové úlevy s EET nestačí. Budou zdražovat

Daňové úlevy s EET nestačí. Budou zdražovat

120na80.cz: Rovnátka, která nejsou vidět

Rovnátka, která nejsou vidět