Hlavní navigace

CESNET v TENu zavádí novou cache a provozovatelé serverů prskají

29. 5. 1998
Doba čtení: 5 minut

Sdílet

Tento komentář je druhý z dnešních siamských dvojčat. Po obecném úvodu přináší informace o aktuálním případu CESNETu a zároveň se snaží nabídnout řešení dané situace - co by měl dělat CESNET, co mohou dělat proti cachování na vlastní pěst správci serverů, jak se na to dívá náš právní řád. Komentujeme též vyjádření CESNETu, které má svá slabá místa.

Nepamatuji si, že by v posledních měsících někdo dokázal zvednout ze židlí provozovatele téměř všech významných serverů v českém Internetu tak, jak se to nyní podařilo CESNETu. Přitom je v tom celkem nevinně – problém je v tom, že se snaží zavést v akademické síti TEN-34 CZ transparentní proxy cache, která má snížit provoz na linkách, ale zároveň znamená podstatné užrání návštěvnosti všech serverů.

Princip věci popisuji jinde (mimo jiné v druhém dnešním komentáři), nebudu se tu tedy k němu vracet. Prskání provozovatelů serverů se nese v několika rovinách. První ohlasy směřovaly především proti tomu, že se do roviny nespolehlivých čísel přesunuly statistické údaje o unikátních hostech – zhruba 10 % provozu (přesně to vím jen u Lupy, ale ostatní hlásí podobná čísla) se mávnutím kouzelného proutku skrylo za jednu jedinou adresu. Pokud by byl problém jen v tom, nebylo by to podle mého názoru tak hrozné. Jestliže je na jedné misce vah významné zlepšení rychlosti a na druhé problémy se statistikou (odstranitelné sledováním jiných veličin), je zřejmé, na kterou stranu se jazýček vychýlí.

Ono to ale není tak snadné. Nejde totiž jen o to, že všechny přístupy jsou vedeny z jednoho stroje, podstatně se totiž sníží i jejich celkový počet – stránky se totiž při opakovaných přístupech posílají již lokálně a správce původního serveru se tak vůbec nedozví, že si stránku uživatel četl. To už je problém zásadní, protože zde umnělým zásahem okamžitě významně poklesne návštěvnost WWW serverů, zachycená ve statistikách.

Na moji výzvu zástupci CESNETu poskytli své stanovisko k celé věci. Přečtěte si jej sami, obsahuje řadu věcí, se kterými nemohu než souhlasit, jiné jsou však diskutabilní. Michal Krsek, který je jeho autorem, se vyjadřuje i k problému, který jsem právě naznačil. Říká: „Zároveň si dovolujeme se ohradit vůči některým tvrzením, které mimo jiné naznačují, že se sníží počet tzv. hitů na WWW servery poskytovatelů obsahu. Celé tvrzení není pravdivé a každý, kdo ví jak skutečně funguje protokol HTTP, musí uznat, že se jeho autoři mýlí. Proxy server sice přebírá požadavky klientů, nicméně při ověřování, že se stránka od posledního požadavku nezměnila, udělá požadovaný "hit“ a to i na příslušný reklamní proužek."

Poslouchá se to hezky, ale Michal bohužel v tomto bodě nemá pravdu. Netvrdím, že podobným způsobem není možné cache nastavit, ale jak jsem zjistil, CESNETí cache v TENu tak nastavená není a ověřování, o kterém se mluví, prostě nedělá. Zjišťování mi nedalo příliš práce. Mám z titulu svého studia přístup na několik strojů v TENu, takže jsem neváhal, na jeden z nich jsem si zatelnetil a lynxem se pokusil stáhnout jeden obrázek z Lupy. Souběžně jsem sledoval log: soubor se skutečně stáhl, jako by se nechumelilo, ale v logu se nepohlo ani peříčko. Někdo jiný už si přede mnou tento obrázek z Lupy stahoval (není ani příliš divu, šlo o jeden banner), takže cache ho měla uložený – a nic neověřovala! Abych měl jistotu, zkusil jsem ještě vytvořit fungl nový obrázek a stáhnout jej – poprvé se v logu skutečně přístup objevil, ale při dalších přístupech už nikoliv.

Je úplně jasné, že něco takového se správcům serverů nelíbí ani za mák, protože je to připravuje o řadu přístupů. Aby bylo jasno, tady už nejde o kouzla se statistikou, skutečně se tu přichází o přístupy, což majitelé serverů odnesou ve velmi hmatatelné podobě; když se proužek zobrazí méněkrát, inzerent za něj méně zaplatí.

Zatím jde jen o přístupy z TENu, ale je nasnadě, že stejnou technologii se chystají nasadit i další poskytovatelé připojení. Posléze můžeme dospět do situace, že si náš obsah stáhne každý den ráno jen desítka olizovačů, od každého poskytovatele jeden, a dále je budou už lokálně distribuovat svým uživatelům. To rozhodně není stav, do kterého bychom si přáli dospět – je proto namístě se dožadovat podmínek, které nevýhody, které provozovatelům serverů tyto cache přinášejí, do určité míry odstraní.

CESNET a jeho případní následovníci by ostatně měli ve vlastním zájmu projevit dobrou vůli, pohybují se totiž přinejmenším na hraně zákona, spíše však už notný kus cesty za ní. Někteří odborníci z oblasti autorského práva, mimo jiné známý soudní znalec a odborník na počítačové právo, Doc. Vladimír Smejkal, jsou totiž přesvědčeni, že proxy cache porušují zásadním způsobem platný autorský zákon – šíří totiž autorská díla bez povolení jejich autorů. Nejsa právník, nebudu se pouštět do úvah, jak by dopadly případné soudní spory, nicméně by bylo od zúčastněných firem hloupé, pokud by chtěly věc dovést tak daleko.

Základním požadavkem, na kterém by měli provozovatelé trvat, je zveřejnění statistiky, co, kam a kdy se tahalo, tedy údajů, o které kvůli cache provozovatel přichází. Není jasné, zda by to mělo být opravdu veřejnou cestou, nebo zda by měl každý správce serveru přístup jen ke svým údajům – to je otázka jednání. Nemůžeme po poskytovatelích připojení chtít, aby se nesnažili efektivně využívat své investice, ale na druhé straně je třeba trvat na tom, aby tak činili přijatelnou cestou.

Situace pro správce serverů však není tak docela beznadějná, v současné situaci se mohou docela dobře bránit. Pokud si totiž nepřejete, aby byly vaše stránky cachovány, alespoň při současném nastavení cache toho můžete dosáhnout docela snadno. Aniž bych se nějak snažil, nejsou cachované například stránky na Lupě (myslím skutečně dokumenty, obrázky cachované jsou) – na vině je fakt, že jsou dynamicky generované přes phtml, a takové stránky proxy necachuje. Naprosto stejně jsou na tom servery, které běží na microsoftích ASP (namátkou Svět namodro, Atlas) a také řada těch, které nabízejí volbu kódování češtiny. Řeč je sice stále jen o HTML dokumentech, ale podobný trik je možné použít i pro bannery – nadále už jen nebudete dávat do HTML dokumentu odkaz na konkrétní obrázek (ten se cachuje), ale například na cgi skript, který jej zobrazí (ten se necachuje). Ostatně už teď mají po problémech všichni, kteří používají některý profesionální reklamní software, které fungují přesně popsaným způsobem (je nezbytný pro jejich další funkce). U nás je to například impérium M.I.A. či servery Internet Servisu.

Jak vidíte, obejít se to dá, ale přináší to zbytečné problémy. Navíc – pokud se touto cestou vydají všichni, celá cache se rázem stane úplně zbytečnou, protože stejně nic cachovat nebude. Svépomoc proto není řešením, je potřeba se domluvit s poskytovateli připojení na podmínkách, které budou přijatelné pro všechny. Míč je ovšem na jejich straně hřiště (nyní tedy u CESNETu) a to nejen kvůli spornosti jejich počínání z právního hlediska.

wt100 2024 EARLY

Marek Antoš

Související články:

* Jsou proxy cache nepřátelé lidstva?!
* Stanovisko CESNETu k provozu transparentní cache v síti TEN-34 CZ


* Kdo to chodí po českém Internetu?
* Kdo mi to loupe perníček?
* Boga jego

Autor článku

Autor je někdejším šéfredaktorem serveru Lupa. V současné době už se psaní věnuje pouze v míře menší než malé, a to zásadně pro radost.
Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).