NASTAVENÍ TISKU (tato tabulka nebude vytištěna) Zpět k článku | Vytiskni!
Komentáře [0x] | Nadstandardní komentář [3x] - Zobrazit | Definice [0x]

GRID

První počítač vybavený moderními páskami pro zálohu dat měl kapacitu 4 MB a jednalo se o robotický systém IBM 370/168. V CERNu byl uveden do provozu v roce 1976. Současný počítačový systém CERNu počítá s tím, že veškerá data, která budou získána z experimentů LHC, budou zálohována pomocí magnetického záznamu na pásky. Pro úspěšné zvládnutí takového množství dat budou použity pásky s rychlostí záznamu až 4 GB za sekundu. Proto už v roce 2008, kdy LHC začal pracovat, mělo počítačové středisko CERNu k dispozici pět automatických zásobníků na magnetické pásky a disky. Kapacita těchto záznamových zařízení byla připravena na data z roku 2008 a nadále se budu zvyšovat.

V této souvislosti je nutné si uvědomit důležitou skutečnost. S postupným vývojem záznamových zařízení musí pracovníci CERNu volit taková záznamová média a přehrávací stroje, které budou schopné číst i starší záznamová média. Jinak by totiž bylo nutné s každým vylepšením technologie záznamu informací stále přenášet již archivovaná data na nová média. Tato aktualizace je občas nutná, ale cílem pracovníků počítačového střediska CERNu je, aby se prováděla minimálně. To ovšem klade velké nároky na výběr optimálních záznamových médií a jejich přehrávačů.

Řadu podobných zařízení dostává CERN za velmi výhodné ceny od firem světoznámých značek. Tyto firmy využívají počítačový park CERNu k testování svých výrobků (jak hardware, tak software), neboť jde o jednu z největších fungujících počítačových sítí na světě. A to je i jeden z dalších přínosů CERNu: po ověření přístrojů a jejich komponent v CERNu jsou tyto vylepšeny a k běžnému spotřebiteli putují již plně funkční výrobky bez technologických vad a za cenu, v níž testování není zahrnuto. Za otestování počítačů si totiž CERN žádné faktury neúčtuje.

Tok dat v CERNu je zobrazen na obr. 200.

Obr. 200

Vzhledem k velkému množství velmi jedinečných dat z experimentů LHC není možné zpracovávat tato data pouze na jednom místě - v CERNu. Příznivý vývoj počítačových sítí (přenosová rychlost, kapacita, zabezpečení, …) umožnil vznik počítačového GRIDu. V rámci něho budou data a výpočetní čas na zpracování úlohy přerozdělována podle momentální vytíženosti sítě.

Podobná síť před zavedením GRIDu v CERNu již úspěšně fungovala (a funguje) v elektrorozvodné síti. A to jak na národní úrovni, tak na mezinárodní úrovni: v případě výpadku elektrické energie v jedné oblasti (okres nebo stát) sousedé této oblasti (jiný okres, sousední stát, …) s dodávkou elektrické energie pomohou.

Systém bude fungovat tak, že pokud fyzik bude potřebovat nalézt a zpracovat určitá data z CERNu, odešle z laboratoře, která je začleněná do GRIDu, svůj požadavek. Speciální software (tzv. midleware) vyhodnotí momentální vytíženost (čas, paměťové nároky, …) počítačů v CERNu, linek, počítače, z něhož žádost přišla, … a na základě toho vyhodnotí způsob zpracování úlohy. Úloha se zpracuje buď v CERNu a pak se pošle fyzikovi na jeho počítač, nebo se pošlou data na fyzikův počítač, tam se zpracují a pak se pošlou výsledky zpět do CERNu. Je možná i varianta, že se data zpracují na třetím počítači, ke kterému je momentálně volný přístup a jeho vytíženost je pro úlohu optimální. Zpracovaná úloha se pak uloží do databáze v CERNu a je k dispozici všem.

Tento systém pochopitelně klade velké nároky na samotný software, který bude úlohy rozdělovat a spravovat. Proto mu musí být věnována velká pozornost. Nevýhodnou ovšem je, že celý systém může být definitivně odzkoušen až na skutečných datech a za plného provozu.

Sytém GRIDu (správně LCG = LHC Computing Grid) pracuje v několika úrovních (viz obr. 201), aby bylo možné nastavit priority (ne každý má přístup ke všem datům, do všech počítačů, …), ale také rozhodovat rychle o vytíženosti počítačů.

Infrastruktura systému je založena na několika odlišných úrovních (tiers). CERN je Tier-0 - poskytuje zálohovací systém, inicializuje zpracování dat a distribuuje je na střediska Tier-1. Ta se podílejí na dlouhodobém zálohování dat. Střediska Tier-2 poskytují převážně CPU a dočasné zálohy. S LCG spolupracují i další sítě.

Počítačové středisko CERNu mělo v roce 2008 více než 7000 počítačů a velké množství záložních disků a záznamových médií. Pomocí sítě Ethernet s přenosovou rychlostí 1 GB za sekundu bylo připojeno do sítě GRIDu.  Síť pouze pro LCG je připojena optickým vláknem s přenosovou rychlostí 10 GB za sekundu.

Obr. 201

© Převzato z http://fyzika.jreichl.com, úpravy a komerční distribuce jsou zakázány; Jaroslav Reichl, Martin Všetička