Společnost Seznam.cz minulý týden zveřejnila svou mapu rychlosti internetu (v ČR). Dočíst jste se o tom mohli i zde na Lupě – v samostatné zprávě, která o zveřejnění informovala. Například o tom, že podle Seznamu se „téměř 80 % Čechů k internetu připojuje rychlostí nižší než 10 Mb/s“, a „pouze necelá 3 % české on-line populace mají připojení reálně rychlejší než 30 Mb/s“.
V tomto článku bych rád porovnal výsledky Seznamu s výsledky jiných obdobných pokusů o zmapování toho, jak rychlý, kvalitní a dostupný je internet v České republice. Mohu-li dopředu prozradit výsledek, pak jiná měření výsledky Seznamu příliš nepotvrzují: tyto se zdají být pesimističtější, než jak vyznívají jiné, alespoň z části srovnatelné statistiky. Ale snad každé měření či průzkum je unikátní a s jejich vzájemným srovnáváním, i se znalostí použité metodiky, je to obecně komplikované. Ne-li přímo nemožné.
Proč potřebujeme vědět, jak je to s internetem?
Nejprve se ale zastavme u širšího kontextu: proč vůbec potřebujeme vědět „jak jsme na tom“ s internetem? A proč je to znovu aktuální právě v současné době?
Zkoumání internetu ze statistického pohledu dnes již není žádnou samoúčelnou disciplínou, kterou by se lidé zabývali „jen tak“, z nějakého plezíru či pouhé zvědavosti. Dnes na výsledcích takovýchto statistik závisí hodně důležité věci. Třeba rozdělování peněz z unijních fondů v řádu miliard. Nebo naopak mastné pokuty, až v řádu stovek tisíc.
Připomeňme si, že z Evropské unie k nám v rámci nového programového období (2014 až 2020) směřuje docela dost peněz: jen na čtvrtou prioritní osu (PO 4) programu OP PIK (operačního programu podnikání a inovace pro konkurenceschopnost) vláda schválila částku 743 657 589 € (cca 21 mld. Kč). Z toho na vysokorychlostní přístupové sítě nové generace (NGA) má připadnout 521 380 364 € (cca 14 mld. Kč).
O konkrétní využití těchto peněz se určitě ještě strhne pořádná bitva – ale její pravidla a kritéria by měla být určitým způsobem odvozena i od rozšíření a dostupnosti internetu. Zatím je představa taková, že „cílovým územím“ budou tzv. bílé, případně šedé oblasti na území ČR (bez území hl. města Prahy), definované v závislosti na nabídce: „bílá“ je oblast, kde není žádná nabídka připojení alespoň 30 Mb/s (ani s výhledem na 3 roky). „Šedá“ pak je oblast, kde je taková nabídka jen jedna (od jednoho poskytovatele). No a „černá“ je oblast s nejméně dvěma nabídkami.
To, s čím nyní přichází Seznam, není takovýmto mapováním bílých, šedých a černých míst. Je to jiný typ statistiky. Nicméně Seznam sám říká, že jím chce přispět do diskuse kolem investic do budování sítí NGA:
Jsme si vědomi, že digitální služby nikdy nedosáhnou svého potenciálu bez kvalitní infrastruktury. Ani sebelepší vysokorychlostní síť však nenajde využití, pokud lidé nemají zájem o moderní obsah. Investice do infrastruktury tedy dávají smysl v okamžiku, kdy existuje zájem uživatelů, tak i zajímavý a moderní digitální obsah.
Obojího je podle našeho názoru v České republice dostatek, proto je nyní vhodná doba rozvířit debatu o investicích do rozvoje vysokorychlostních přístupových sítí v České republice. S cílem přispět do této diskuse jsme se rozhodli ke zveřejnění vlastních interních měření rychlosti připojení českých uživatelů k internetu.
Ministerstvo průmyslu a obchodu pak za tento počin společnost Seznam.cz promptně pochválilo:
Děkujeme @seznam_cz za podklad a těšíme se na spolupráci. V OPPIK čeká na rozvoj ICT a internetu 21 mld. Kč. https://t.co/5HrQIVk43j
— MPO (@mpo_tweetuje) March 20, 2015
Rozdělování peněz z unijních fondů ale není jediným důvodem, kvůli kterému je potřeba znát skutečnou situaci s dostupností a rychlostí internetu v ČR. Připomeňme si, že náš stát se snaží zavést zcela plošně elektronickou evidenci tržeb, pro kterou bude funkční připojení k internetu naprostou nezbytností. Navíc bude muset jít o připojení s dostatečně nízkou latencí (krátkým zpožděním), a také s garantovanou dostupností – protože v případě jakéhokoli problému (například výpadku připojení) bude mít povinný subjekt pouhých 48 hodin na to, aby správci daně dodatečně dopravil data, které v době výpadku získal. Jinak mu bude hrozit tučná pokuta. V praxi to nejspíše povede na nutnost mít kromě „hlavního“ připojení ještě jedno záložní, pro případ výpadku.
Jenže na dostupnost takovéhoto připojení se ti, co elektronickou evidenci tržeb prosazují, očividně neptají – a jednoduše předpokládají, že všude dostupné je.
No, alespoň satelitní připojení k internetu by skutečně mělo být k dispozici všude, na celém území ČR. Jenže není nejlevnější, a také jeho latence je dosti specifická (vysoká) a je otázkou, zda z tohoto důvodu satelitní připojení vůbec půjde využít pro potřeby elektronické evidence tržeb.
Jak to může fungovat?
Pojďme ale již k samotným statistikám o dostupnosti a rychlosti internetu v ČR. Chceme-li nějak porovnat nejnovější výsledky zveřejněné Seznamem, musíme si nejprve ujasnit, s čím bychom je měli srovnávat.
V prvním přiblížení lze údaje o dostupnosti a rychlosti internetu rozdělit do tří variant podle principu jejich získávání na:
- automaticky probíhající měření
- uživateli iniciovaná měření
- dotazování (statistické zjišťování): někdo se někoho ptá na to, jakým způsobem a jak rychle je připojen
Měření Seznamu spadá do první varianty ve smyslu předchozího výčtu: někdo (zde konkrétně společnost Seznam) automaticky měří provoz na „své straně“ sítě, ve které se sbíhají určité datové toky. Konkrétně jde o stahování videí ze služby Stream.cz (podrobněji). Koncoví uživatelé o tomto měření nevědí, toto probíhá nezávisle na jejich vůli (i jejich vědomí).
Jiným příkladem takovéhoto měření může být to, které na „své straně“ sítě provádí společnosti Akamai v rámci své sítě CDN a které publikuje v rámci své zprávy State of the Internet.
Do této první varianty asi můžeme zařadit i měření, která provádí routery Turris od sdružení CZ.NIC. Probíhají automaticky a průběžně, navíc se souhlasem uživatele. Nikoli ale „u poskytovatele“, ale naopak „u uživatele“ – v rámci směrovače (routeru), kterým se uživatel připojuje k internetu. Podobně funguje například měření v rámci projektu Sam Knows.
Nejpočetněji je v praxi zastoupena druhá varianta: zde jsou to naopak koncoví uživatelé, kteří iniciují měření – a tím oni rozhodují o tom, kdy a jak často se měří, i v jakých situacích. Příkladem mohou být různé speedmetry, kterých je na Internetu více než dost. Jeden z nich provozuje i vydavatel Lupy, v licenci od společnosti OOkla, která provozuje i známý Speedtest.net – a výsledky publikuje jako tzv. NetIndex. Na stejném principu fungují třeba speedmetry na serverech DSL.cz, či vlastní speedmetr sdružení Internet pro všechny. Známý je také speedmetr serveru Rychlost.cz, který se rozrostl do evropského netmeter.eu.
Za zmínku ale určitě stojí i měření, které teprve rozjíždí Český telekomunikační úřad spolu s CZ.NIC. Jde o projekt NetMetr, o kterém jste se mohli nedávno dočíst i zde na Lupě. Je sice primárně zaměřený na mobilní připojení a měření kvality pokrytí, ale mapuje také bezdrátová (WLAN) připojení. Jeho dosavadní výsledky najdete zde.
Konečně do třetí varianty (ve smyslu předchozího výčtu) spadají například statistická šetření realizovaná Českým statistickým úřadem, jehož tazatelé obchází respondenty a ptají se jich na konkrétní otázky – včetně otázek na jejich připojení. Stejně tak sem ale patří i mapování tzv. bílých, šedých a černých míst, která provedl ČTÚ ve spolupráci s MPO a které bylo založené na sběru podkladů a jejich vyhodnocení. Šlo o „průzkum NGA“, plným jménem „mapování existence relevantní infrastruktury pro stanovení podmínek programu na podporu projektů zaměřených na budování přístupových sítí nové generace, podmínek jeho správy a financování“.
Seznam vs. Akamai
Abychom srovnávali srovnatelné, zůstaňme v rámci první varianty a srovnejme si nejprve výsledky Seznamu s výsledky Akamai (v jeho nejnovějším Akamai State of the Internet Report).
Následující dva obrázky ukazují „zdrojová“ data obou měření. První zobrazuje výsledky Seznamu dle jednotlivých rychlostních kategorií, přepočtené na celou ČR.
Druhý obrázek je ukázkou ze zprávy Akamai, kde lze najít výsledky pro ČR (kumulativně pro různé rychlosti).
Konečně na třetím obrázku jsem se pokusil zkombinovat oba zdroje tak, aby byly co nejlépe srovnatelné.
Jak je z tohoto obrázku patrné, výsledky Seznamu jsou „pesimističtější“ než výsledky Akamai. Seznamu vychází podstatně více pomalejších přípojek než u Akamai, zatímco ten naměřil jen 17 % přípojek do 4 Mb/s, Seznam naměřil plných 57 % přípojek do 5 Mb/s. Že by byl takový skok v přechodu od 4 do 5 Mb/s? To asi ne.
Přeci jen lépe srovnatelné jsou výsledky v (kumulativních) kategoriích „do 10 Mb/s“ a „do 15 Mb/s“, kde Seznamu opět vychází více než u Akamai, ale už ne s tak dramatickým rozdílem. I když třeba u 10 Mb/s jde o rozdíl mezi 60 a 80 procenty, což také není málo.
Zapomínat ovšem nesmíme ani na metodiku měření. Tu Seznam popisuje zde a Akamai naznačuje alespoň něco na svém blogu (zde a zde). Oba přitom naráží na stejný problém: „malá“ data, která zkreslují výsledky jejich měření. Seznam konkrétně říká, jakým způsobem a v jakém rozsahu je eliminuje, zatímco Akamai jen konstatuje, že ovlivňují výsledek. Pak je ale o to zajímavější, že Seznamu vychází nižší rychlosti, a ne naopak vyšší.
Nicméně v obou případech je nutné si uvědomit principiální problém, vyplývající ze způsobu měření. Nejde totiž o měření rychlosti přípojky koncového uživatele, ale o měření něčeho dosti jiného: rychlosti stahování určitého obsahu, na které se „dohodnou“ obě strany. Přitom na straně koncového uživatele může být celková kapacita přípojky využívána dalšími uživateli současně, nebo i tím samým uživatelem, ale k jinému účelu. Na straně poskytovatele je to obdobné, protože ten obsluhuje více uživatelů současně (někdy jich obsluhuje opravdu vysoké počty). Takže výsledkem by měl být spíše jakýsi spodní odhad.
Na straně Seznamu je ještě důležité i to, na co poukazovali čtenáři v diskusi za předchozím článkem: že zde velmi záleží na tom, v jaké kvalitě (rozlišení) si uživatel pustí nějaké konkrétní video ze serverů služby Stream. Protože Seznam měří právě (a pouze) stahování videí ze Streamu, zatímco Akamai zřejmě provoz nediferencuje.
Je zde ale ještě jeden zajímavý moment: pokud vyjdeme z teze, že lidé v práci pracují (a naopak nesledují videa ze Streamu), znamená to, že Seznam měřil domácí přípojky, zatímco Akamai mezi nimi nerozlišuje. A pokud očekáváme, že rychlosti domácích přípojek budou nižší než rychlosti přípojek „v zaměstnání“, pak by Seznamu měly vycházet výsledky nižší. Možná i dost podstatně nižší. A to skutečně vychází.
Dalším faktorem pak může být délka doby, po kterou měření probíhalo: Seznam měřil jen týden (od 16. 2. – 22. 2. 2015), zatímco Akamai měří po podstatně delší dobu (zřejmě celý kvartál). Takže může lépe „rozředit“ různé momentální vlivy a odchylky a snad i lépe eliminovat faktor souběhu s „jiným využitím“ kapacity přípojky koncového uživatele.
Seznam vs. Turris
Zkusme si také srovnat měření Seznamu, coby měření probíhající „na pozadí“ (v síti poskytovatele), s měřením „na popředí“ u koncového uživatele. Například s populárními routery Turris, které mají možnost měřit rychlost přípojky koncového uživatele opravdu velmi přesně.
Výhodou Turrisů je to, že mohou měřit veškerý provoz na přípojce, a skrze maximální dosahované rychlosti dokáží asi nejlépe odhadnout skutečnou (efektivní) rychlost přípojky jako takové. Navíc statistiky takovýchto měření jsou veřejně dostupné (zde), i když jejich „uspořádání“ není stejné jako u Seznamu. Viz následující obrázek:
I přes rozdíly v uspořádání výsledků si ale dovolím konstatovat, že výsledky Turrisů jsou opět podstatně optimističtější než výsledky Seznamu. Když ten říká, že „téměř 80 % Čechů se k internetu připojuje rychlostí nižší než 10 Mb/s“, pak výsledky Turrisů lze interpretovat tak, že „50 % Čechů má k dispozici připojení alespoň 23,4 Mb/s“. I když ve skutečnosti nejde jen o tuzemské uživatele (několik málo Turrisů je nasazeno i v zahraničí, a asi proto jsou statistiky Turrisů prezentovány jako globální).
V úvahu ovšem musíme vzít i to, jaká asi je skladba uživatelů, vybavených routery Turris: vzhledem ke způsobu jejich distribuce to budou spíše „síťoví nadšenci“, u kterých lze očekávat lepší (rychlejší) připojení, než jaké je průměrem přes všechny uživatele. To následně zvedá naměřené rychlosti oproti skutečnému průměru, jaký vyhodnocují měření Seznamu či Akamai.
Seznam vs. speedmetry
Zkusme si ještě srovnat výsledky měření Seznamu s takovými výsledky z druhé varianty (tj. uživateli iniciovaných měření), která zveřejňují rozložení jednotlivých rychlostí připojení. To dělá například netmeter.eu a také speedmetr sdružení Internet pro všechny.
Výsledek je názorně vidět na následujících třech obrázcích: první z nich jen opakuje výsledky Seznamu podle rychlostních pásem (jde o stejný obrázek jako v úvodu článku). Povšimněte si znovu markantní „sestupné“ tendence. Druhý obrázek je od netmeter.eu a třetí od Internetu pro všechny – u obou je patrný přeci jen odlišný průběh: určitá „kulminace“ na vyšších rychlostech (zhruba v polovině měřených rozsahů) místo oné „sestupné“ tendence:
Musíme ale dát pozor na to, že celkový dojem z druhého a třetího obrázku může být významně ovlivněn rozdělením do více rychlostních kategorií. Tento vliv se ale dá snadno eliminovat sečtením dílčích údajů do stejných rychlostních kategorií, jaké používá i Seznam a Akamai. V „kumulativním“ pohledu to ukazuje následující obrázek, který navazuje na třetí obrázek z úvodu článku (a navíc obsahuje právě výsledky netmeter.eu a speedmetru IPV):
Podle tohoto posledního obrázku by to již mělo být lépe srovnatelné: třeba u rychlosti „do 10 Mb/s“ vychází Seznamu 80 % přípojek, což je prezentováno jako jeho hlavní zjištění (že „téměř 80 % Čechů se k internetu připojuje rychlostí nižší než 10 Mb/s“). To u Akamai, a prakticky shodně u Internetu pro všechny, vychází jen 60 %, resp. 62 %. Blíže k výsledkům Seznamu je 71 % u netmeter.eu. A u nižších rychlostí („do 4 Mb/s“, resp. „do 5 Mb/s“) jsou rozdíly také relativně významné.
Znovu si ale připomeňme dosti zásadní rozdíl v principu měření: zatímco Seznam měří automaticky a průběžně (a to všechna stahovaná videa), ostatní dva měří jen tehdy, když o to projeví zájem příslušný koncový uživatel. A ten „má zájem“ nejčastěji ve dvou krajních případech: když se chce nějak pochlubit vysokou rychlostí svého připojení, nebo když má naopak nějaký problém s příliš nízkou rychlostí (či jen podezření na závadu).
Stejně tak si znovu zdůrazněme, že se stále pohybujeme na poli statistik, kde uváděná čísla skutečně stojí a padají s principem měření a konkrétní metodikou, včetně mnoha různých detailů. A porovnávat výsledky různých měření, která mají vlastní (rozuměj: jinou) metodiku i odlišný celkový princip, je velmi ošemetné, až skoro nemožné. Nebo se alespoň nesmíme divit velkým a zásadním rozdílům.