cs:infrastruktura_ulozist:start

Infrastruktura úložišť

Úložiště využívá distribuovaného a hierarchického modelu. Distribuovaný model je reprezentován geograficky oddělenými datovými centry, umístěnými v Plzni, Jihlavě a Brně. Tento model přináší výhodu výrazně vyšší odolnosti proti ztrátě dat způsobené poškozením médií, přírodní katastrofou nebo chybou uživatele či administrátora. Další výhoda může spočívat v možnosti využít nejbližšího úložiště, se kterým bude komunikace nejrychlejší.

Hierarchický model (typu HSM – Hierarchical Storage Management) spočívá v tom, že méně často používaná data jsou odsouvána na levnější média s vyšší kapacitou, většinou pásky a MAID pole. Tímto je umožněno s danými náklady dosáhnout výrazně vyšší kapacity oproti čistě diskovému úložišti. Naproti tomu často používaná data budou uložena na velmi rychlých médiích (cache, rychlé disky), a tak budou k dispozici uživateli ve velmi krátkém čase.

Datová centra


Plzeň

Datové centrum v Plzni využívá třívrstvého modelu, kde nejvyšší vrstvu reprezentují rychlé FC (Fiber Channel) disky, druhá vrstva je složena ze SATA disků a nejnižší vrstva obsahuje páskovou knihovnu. Disponuje 500 TiB diskového prostoru, 3584 TiB na vypínatelných discích a 4,8 PiB na páskách (rozšiřitelné na 5,5 PiB jen nákupem páskových médií).

Na migraci mezi jednotlivými vrstvami (tiery) se zde používá technologie DMF (Data Migration Facility) od firmy SGI a jako pásková knihovna je použita Spectra Logic T-Finity.

Fotky data centra


Jihlava

Tier 1 je tvořen dvěma samostatnými diskovými poli DCS3700 s celkovým počtem 342 ks 3TiB SAS disků. Disky jsou rozděleny do 32x (8+2) + 2x (6+2) RAID6 skupin. Šest disků je konfigurováno jako spare disky. Celková čistá kapacita pole Tier1 je 804 TiB. Prostory Tier 2 jsou tvořeny jednak 7 ks MAID pole Promise Vess R2600fiD a dále páskovou knihovnou IBM TS3500. V MAID polích je instalováno celkem 734 ks 4TiB disků. Tyto disky jsou rozděleny 41 skupin RAID6 (16+2). V každém diskovém poli jsou 4 disky použity jako spare. Celkem je tedy k dispozici 648 datových disků o čisté kapacitě 2 496 TiB. Pásková knihovna TS3500 má 3 744 TiB využitelné kapacity.

Fotky data centra


Brno

Tier 1 obsahuje dvě disková pole DCS3700 s kapacitou 498 TiB. Tier 2 je tvořen jednak třemi kusy MAID polí Proware EP-4643S, tak páskovou knihovnou IBM TS3500. Využitelná kapacita diskových polí MAID je 2116 TiB, respektive 3520 TiB v případě páskové knihovny.

Fotky data centra

Rozdíly mezi jednotlivými data centry

Rozdíly mezi jednotlivými data centry nejsou dramatické a zpravidla se volí to, které je geograficky blíže. Nicméně některé rozdíly sepsané níže mohou ovlivnit volbu nejlepšího úložiště.

Jakmile si zvolíte data centrum, musíte používat správné adresy pro připojení k jednotlivým protokolům.

Plzeň

  • Plzeň jako jediná ze všech tří data center poskytuje migrační politiku cache_tape. Zde primární data jsou na rychlých Fibre Channel discích, jedna kopie na páskách a SATA discích. Pokud dojde místo na SATA oblasti, vytvoří se druhá kopie na páskách, tj. celkem dvě různé pásky (vhodné pro rychlejší přístup ke standardním datům).
  • Plzeňské data centrum má z důvodu použité architektury problém s pomalejším ukládáním většího počtu menších souborů - tím jsou kupříkladu myšleny soubory v rádu miliónů, menší než 1 MB.
  • Jsou zde zakládány všechny účty VO Storage.

Jihlava a Brno

  • Jihlava a Brno mají jinou architekturu než Plzeň, a tak neduhem spojeným s pomalejším nahráváním většího počtu menších souborů netrpí.
Pokud po přečtení informací výše stále váháte, které data centrum použít, můžete použít skript pro vybrání nejvhodnějšího úložiště. Ten se rozhoduje na základě latence a vybere to úložiště, které ji má směrem od Vás nejmenší.
Poslední úprava: 14.12.2017 13:14