Hlavní navigace

Informace v menšině

Martin Kopta

Od chvíle, kdy se web stal výkladní skříní obchodu, ubírá se webdesign cestou, kde forma prezentace je důležitější než myšlenka. Diktátu módy se podřizuje absolutně všechno. Bude tedy zajímave se podívat, kolik textových informací dnes můžeme vytěžit z internetových stránek serverů uvedených v Lahvičkově seznamu.

Jelikož minulý srovnávací článek o podílu reklamy na datovém přenosu webu vzbudil celkem velký ohlas, rozhodl jsem se využít Lahvičkův výběr ještě jednou. Cílem třetího měření je odhalit poměr textových informací na internetových stránkách ke zdrojovému HTML. Textové informace jsou totiž v naprosté většině tím hlavním, co na webu hledáme (nechci samozřejmě snižovat význam jiných formátů informací), a proto by mohlo být zajímavé zjistit, kolik znaků ve zdrojovém kódu HTML připadne na jeden znak textové informace.

Tabulka přináší abecední seznam sledovaných serverů, kde u každého serveru jsou dvě čísla. První hodnota uvádí počet znaků ve zdrojovém kódu HTML, které připadají na jeden znak čistého textu na titulní straně, druhé číslo pak uvádí totéž pro typickou stranu z obsahu serveru.

SERVER Titulní strana Typická strana
Bonusweb 5,12 3,99
Centrum 7,11 7,74
Dáma 4,61 7,96
Doupě 4,83 3,93
iDnes 9,38 7,81
iHNed 7,85 9,14
Interval CZ 6,60 8,02
KudyKam 4,23 5,80
Lupa 6,05 6,42
MSN Atlas 7,03 3,97
Navrcholu 7,28 6,43
Neviditelný pes 4,33 2,85
Novinky 5,49 3,70
Pauza 6,37 6,29
Press CZ 12,29 n/a
Seznam 7,99 6,28
Seznamka 14,19 5,08
Svět namodro 4,07 5,49
TopList 7,46 11,61
Žena In 5,67 7,60
Živě 7,57 7,31
PRŮMĚR 6,93 6,37

Srovnání serverů

Ze všech předchozích měření obvykle nejlépe vycházely portály, protože jsou konstruovány úsporným kódem, neobsahují složité formátování ani grafickou úpravu. Tentokrát se Atlas, Centrum i Seznam drží v mírném podprůměru, a naopak bodují korpulentní zpravodajské servery Svět namodro a Neviditelný pes, mezi něž se ještě vetřel KudyKam. V typických stranách si nejlépe vedou Bonusweb, Doupě a Novinky, jejichž poměr textu ke zdroji nepřesahuje 1 : 4, aniž by to nutně znamenalo, že publikují delší články než konkurence. Na Neviditelném psu dokonce na jedno písmeno připadají jen necelá tři v HTML! Nejnižší informační hodnotu mají typické stránky na TopListu, Intervalu CZ a iHNed, a titulní strany Seznamky, Press CZ a iDnes.

Delší zdrojové kódy jsou pochopitelné u portálů, kde je de facto každé slovo odstavcem a tučným odkazem. Výhodnějšího poměru dosahují servery, které přinášejí maximum informací již na titulní straně — klasickým případem mohou být Neviditelný pes, KudyKam a Žena In, kde již na první obrazovce najdete úplné znění hlavních článků. Naopak Press CZ, kde většinu informací tvoří odkazy na informační zdroje, potřebuje k distribuci delší zdrojový kód.

Plýtvání kódem

Nejvíce prodlužuje HTML cesta v odkazu (zvláště pokud je uváděn úplný URL). Přitom autoři serverů mají obvykle možnost vytvořit publikační systém tak, aby byly odkazy co nejútlejší. Například slovo „aktual“, ktere se nachází takřka ve všech odkazech na Press CZ ( ./r.php3?z=1143404&t=aktual), by jistě bylo možné zkrátit až na jeden znak. Podobně plýtvají kódem odkazy na Seznamce ( ./ads.asp?idcat=104030000000&x=10&all=54).

Naprosto zbytečné je zapisovat přímo do zdrojového kódu definice kaskádových stylů a klientské skripty, které také tvoří nezanedbatelný objem, a přitom by jejich vyčlenění do samotatného souboru urychlilo načítání stránky. Postavené na hlavu jsou kombinace definic vzhledu psané tu v CSS, tu zase do atributů značek. Spoustu znaků vyprodukují také nefunkční a neefektivní konstrukce, jako je třeba tato: FONT face="Arial CE,Arial CE,Arial,Helvetica CE,Helvetica" size="-1" color="black" (Press CZ).

Převedení vlastností vzhledu z atributů HTML do globálního kaskádového stylu může v takových případech ušetřit třeba 30 % veškerého kódu (včetně CSS). Úspora je velmi dobře patrná třeba z rozdílných hodnot ve výsledcích serverů Navrcholu a TopList, kdy TopList spotřebuje na distribuci typické strany skoro dvojnásobně dlouhý zdrojový kód HTML, ačkoli Navrcholu poskytuje asi o 0,5 KB více textových informací téhož charakteru.

Krásnou ukázkou neefektivního kódu je i tabulka, jejímž prostřednictvím prezentuji výsledky měření. Sama o sobě spotřebuje 2.640 znaků ve zdrojovém kódu pro pouhých 407 znaků nesoucích významovou informaci, tím dosahuje poměru 1 : 6,49, přičemž při definici kaskádovými styly kód včetně CSS dosahuje jen 2.229 znaků, a tedy poměru 1 : 5,48.

Datový objem textové informace

Pokud si ještě vzpomenete na minulé měření, při kterém vyšlo najevo, že průměrná velikost HTML na sledovaných serverech je 56 KB a celkový objem strany dosahuje 160 KB, pak lze snadno dopočítat, že textové informace průměrně obsadí 14 % HTML, respektive jen 5 % celkového datového objemu. Pokud odečteme 28 % na reklamu, zbývá nám 33 % datového objemu na ilustrace a grafiku a cca 34 % na HTML (39 % včetně textu).

MIF17

Pokud procenta převedeme na minuty, vyplývá z tohoto a minulého měření, že jen tři minuty z každé hodiny nepřetržitého stahování dat k nám proudí textové informace. Nebo jinak: pokud platíte za 1 GB cca 5.000 korun, tak jen 250 korun zaplatíte za textové informace; zbylých 4.750 korun platíte za data, která informaci nenesou, jen ji zprostředkovávají.

Co říkáte, nestálo by za pokus při příštím redesignu odělit strukturu (HTML) od formy (CSS) a zvýšit poměr textu v HTML na úkor redukovatelných atributů a zbytečných značek? Stránky vaší konkurence se zobrazují rychleji.

Našli jste v článku chybu?