Gridové sítě

Dosud jsme hovořili o architektuře gridu, jeho specifických vlastnostech a softwarové podpoře přístupu uživatelů ke gridovým aplikacím. Zatím jsme se ale nevěnovali jedné zásadní součásti gridu, síťové infrastruktuře. Přitom bez rychlých a spolehlivých přenosových cest by grid nikdy nemohl sloužit svému účelu.

Komunikační sítě nebývají hlavním tématem gridových diskusí, přestože bez spolehlivých a rychlých komunikačních cest by nemohl grid být vlastně vůbec postaven na distribuované architektuře. Důvodem je zřejmě to, že gridoví odborníci se orientují spíše aplikačně a ohledně infrastruktury plně spoléhají na své síťové kolegy. Jinými slovy, předpokládají, že infrastruktura je k dispozici taková, jakou ji potřebují. Protože ale sítě jsou doménou nezanedbatelné části čtenářské obce (a mojí), věnujme se dnes výhradně sítím a jejich důležitosti pro využití gridu.

Sítě jako Popelka

Připomeňme, že grid představuje v zásadě novou architekturu, kterou lze snadno rozšiřovat a která může zahrnout prakticky jakékoli zařízení s nějakými komunikačními funkcemi. Motivací pro rozvoj gridové architektury jsou všude dostupné a přitom škálovatelné a samozřejmě levné komunikační služby. Z toho jasně vyplývá důležitost sítí pro grid, přestože gridová komunita je často za tak docela rovnocennou složku nepovažuje.

To s sebou nese jeden zásadní nedostatek: protože sítě nejsou do gridového prostředí plně integrované, velmi zřídka se implementují jako přímo adresovatelné a konfigurovatelné prostředky pro využití v gridech, obdobně jako CPU a úložné kapacity.

Ikonka - Kristalova Lupa 2006
Chcete podpořit svoji oblíbenou službu na českém Internetu? Rádi byste dali provozovatelům webů najevo, že jim fandíte? Pak neváhejte a hlasujte v anketě Křišťálová Lupa 2006! Až do 31. října 2006 můžete ovlivnit, které projekty si budou přebírat ocenění pro vítěze pro tento rok. Navíc získáte roční licenci k bezpečnostnímu balíku od společnosti AEC a můžete vyhrát i některou z 50 hodnotných cen.

Další mírně problematickou záležitost vysvětlující, proč je na sítě v gridové komunitě pohlíženo trochu skrz prsty, způsobuje odlišný princip architektury: zatímco gridová architektura je ve své podstatě modulární, sítě jsou postaveny na hierarchickém (vrstvovém) přístupu a odpovídající hierarchii v gridech prostě nenajdeme.

Virtualizace všech prostředků gridu (včetně sítí) představuje mocný nástroj pro vytvoření nových datových síťových služeb. S využitím abstrakce na vysoké úrovni pro síťové služby a s integrací síťových možností prostřednictvím gridového middleware (RFC 2768) lze přitom dosáhnout takové flexibility, která s tradičními datovými sítěmi možná není.

Kvalita služby QoS v gridech

Minule jsme si již naznačili nutnou souvislost mezi gridovými aplikacemi a službami poskytovanými sítí v podobě podpory kvality služby QoS (Quality of Service) v rámci dohodnuté úrovně služby (SLA, Service Level Agreement). Ukázali jsme si, že mapování QoS gridové aplikace na QoS sítě nemusí být zcela triviální, protože metriky se liší a výkonnost optimální pro síťovou QoS pak může být suboptimální pro určité chování aplikace.

Zatímco kritériem u aplikace bývá především doba (čas) provedení daného úkolu, teprve v případě přenosu objemných datových souborů pro distribuované výpočty přichází na pořad kritéria sítím bližší, tedy minimalizace latence (zpoždění) a maximalizace šířky pásma. Jednou z možností, jak požadovanou QoS naplnit, je předběžná rezervace prostředků (tato alokační strategie se používá např. v Globus toolkit pod označením GARA, General-purpose Architecture for Reservation and Allocation).

Teprve nyní – se současnými možnostmi – se začíná využívat pružnějších, nikoli statických služeb, s jistou mírou programovatelnosti pro dynamickou změnu služby, alokace prostředků a rekonfiguraci. Aplikace pak mohou požádat o konkrétní prostředky, tedy definovat přesně úrovně služby, kterou od sítě vyžadují. Takovéto deterministické síťování (specifikované typicky v rámci SLA) je důležité pro dosažení optimální výkonnosti aplikací.

Od nerovností k hybridům

Většina současných gridů využívá komunikační služby klasických IP směrovaných sítí, tedy typicky službu best effort. Propustnost přijatelná pro běžné síťové operace nemusí ale umožňovat dostatečnou podporu aplikacím – v gridovém prostředí více než kde jinde platí, že ne všechny aplikace jsou si rovny. Většina uživatelů sice pro běžné potřeby vystačí se základním typem síťové služby (tj. s běžným Internetem), ale malá a přitom „důležitá“ část uživatelů (ani uživatelé si nejsou rovni) potřebuje velmi propustné komunikační prostředí pro komunikaci (typicky několika uživatelů s několika dalšími).

Tato skupina uživatelů reprezentuje aplikace se zcela specifickými nároky na komunikační prostředí: provoz o objemu v řádu Gbit/s po dobu minut až hodin, vysílaných z několika málo míst a určených pro několik málo dalších míst. Takový provoz vlastně nepotřebuje žádné směrování, protože většinou používá stejnou cestu, ale zato potřebuje dynamické poskytování skutečně kvalitní cesty sítí.

Při bližším pohledu spolu musí v síti koexistovat (bez nežádoucího „rušení“) nejrůznější typy provozu: „myši i sloni“. V prvním případě se jedná o velmi malé pakety s řídicími informacemi pro komunikaci, nebo jen malým objemem uživatelských dat. V druhém případě se jedná o po okraj naplněné pakety (do maximální délky přenosové jednotky) přenášející efektivně data mezi koncovými uživateli pro efektivní využití přenosových kapacit (s minimem režie).

Se slony je ale ta potíž, že se nevyskytují jednotlivě, nýbrž ve skupinách. A přenést sítí – rychle a spolehlivě – stádo slonů je poměrně náročný úkol i pro rychlé optické sítě. Nesmí totiž dojít k tomu, aby relativně malé toky byly utlačeny v pozadí objemným provozem, který přitom současně může ještě trpět zhoršenou výkonností.

Vzhledem k typicky značnému objemu přenášených dat v gridu, která je nutno přenést v konečném (známém) čase, se často volí nikoli běžný paketový přenos (při přenosu přes Internet může dojít k řadě výpadků a lze jen obtížně garantovat minimální ztráty paketů a latenci), ale vyhrazené optické přepínané okruhy. Ty jsou schopny jednak dostát požadavkům kapacitním, a jednak požadavkům na alokaci síťových prostředků, takže garantují dobu přenosu (je známo, jak dlouhou dobu bude trvat objemný balík dat přenést).

V současnosti není mezi gridovými aplikacemi mnoho takových, které by výslovně požadovaly i minimální zpoždění při přenosu (podobně jako běžné síťové aplikace hlasové či živého videa), ale do budoucna s nimi bude třeba počítat.

Oba způsoby přenosu (zdánlivě protichůdné) v rámci jediné infrastruktury dnes umožňují tzv. hybridní sítě, které přenášejí digitální signál po analogových optických systémech a používají kombinaci přepínání okruhů a paketů. Zatímco běžný provoz dopraví v paketovém režimu, pro vybrané přenosy (velké objemy dat) se vytvoří samostatné okruhy. Pro některé typy komunikace je totiž efektivnější sestavit časově omezený samostatný okruh než přidat jejich data k ostatním a odpovídajícím způsobem navýšit výkon přepojovacích prvků sítě.

Uživateli hybridní síť může poskytovat buď paketové IP služby (bez spojení), nebo tzv. lambda služby (se spojením), tedy konektivitu (optickou cestu) přímo na úrovni vlnových délek optických vláken síťové infrastruktury (s použitím vlnového dělení WDM, Wavelength Division Multiplex), protože kombinuje klasickou IP směrovanou síť s inteligentním optickým přepínáním v jedné infrastruktuře.

Content

Příště budeme pokračovat v síťově zaměřené diskusi o gridech a podíváme se na lambda gridy a na použitelnost TCP/IP v gridech.

Další zdroje:

Travostino Franco, Mambretti Joe, Karmous-Edwards Gigi (editors): Grid Networks (Enabling grids with advanced communications technology), John Wiley & Sons, 2006 (ISBN 0–470–01748–1)

Anketa

Zajímáte se více o aplikace, nebo o sítě?

2 názory Vstoupit do diskuse
poslední názor přidán 20. 10. 2006 19:07
Zasílat nově přidané názory e-mailem

Školení Google Analytics pro pokročilé

  •  
    Jak využít nové funkce Google Analytics
  • Vyhodnocování pomocí Multichannel funnels
  • Neopakujte chyby při vyhodnocování dat.

Informace o školení Google Analytics pro pokročilé »