cs:replikace:start

Geografické replikace

Mechanismus replikací mezi úložišti slouží k vytváření asynchronní geografické repliky dat. Co to znamená:

  • geografická replika je další kopie dat na vzdáleném místě,
  • slouží pro zvýšení bezpečnosti uložení dat pro případy zničení primárních dat (například požárem),
  • asynchronní - data se do sekundární lokality kopírují až po nějakém čase (typicky po několika hodinách),
  • replika je jednosměrná, z primárního úložiště na repliku (není to synchronizace).

Repliky na datových úložištích provádíme pomocí opakovaného volání nástroje rsync, repliky zachovávají vlastníky a práva souborů. Rsync je volán s parametry -a –del.

Čím se liší replika od zálohy:

  • replika nedrží historii souborů, po běhu replikace jsou v replice přesně stejná data jako v primárních datech (včetně mazání, smazaný soubor bude i v replice smazán),
  • repliku je možno uživatelům přímo zpřístupnit
  • záloha umožňuje vrátit se po nějakou dobu k předchozí verzi souboru nebo obnovit smazaný soubor,
  • zálohu je potřeba nejdříve obnovit na primární úložiště, což pro velká data může trvat i týdny.

V jakých situacích je dobré mít repliku:

  • pokud potřebuji umístit data na více fyzických míst,
  • pokud se potřebuji k datům velmi rychle dostat v případě, že jejich primární úložiště selže,
  • pro asynchronní repliku mi ale nevadí, že mohu přijít o několik posledních hodin změn.
Je dobré si uvědomit rozdíl mezi replikou a zálohou. Dále je třeba vědět, že pokud uživatel změní data v replice při zapnutém mechanismu replikací, replikační nástroj mu tato data přepíše.

Pro uživatele

Repliky lze provádět na domovských adresářích a to i pro vybrané skupiny uživatelů. Replikovat je možno speciální adresáře používané v dané virtuální organizaci.

Pokud byste rádi replikovali data, obraťte se na správce virtuální organizace, který to dohodne se správcem úložiště. Stejně tak správce virtuální organizace podá informace o tom, jak jsou replikace ve vaší virtuální organizaci nastaveny.

Doporučujeme, aby replika byla pomocí práv nastavena tak, aby nebyla uživatelům přístupná. To uživatele chrání před tím, aby omylem vložil data do repliky a replikační nástroj mu tato data smazal (nejspíš předtím, než by byla zazálohována). Pokud je nutno zpřístupnit data z repliky, kontaktuje správce datových úložišť (nejlépe opět prostřednictvím správce virtuální organizace).

Je-li replika pro uživatele přístupná i pro zápis, dávejte dobrý pozor na to, kam zapisujete data. A vězte, že jsme takovou konfiguraci správci vaší VO rozmlouvali.

Pro správce VO

Pokud chcete pro své uživatele aktivovat geografické repliky nebo chcete přistoupit k datům v replice, napište správcům datových úložišť na support(zavináč)cesnet.cz.

Je potřeba se dohodnout:

  • z jakého úložiště a svazku na něm budeme replikovat,
  • je možno replikovat buď domovské složky uživatelů z tohoto svazku, nebo vybranou složku,
  • pokud se budou replikovat domovské složky uživatelů, lze prostřednictvím skupiny definovat, kterým uživatelům se bude replika provádět - touto skupinou mohou být i všichni členové vaší VO,
  • na jaké úložiště se bude replika provádět a na jaký svazek, typickou konfigurací je např. „replikujeme ze svazku tape_tape v Plzni na svazek tape v Brně“,
  • zda má být replika uživatelům přístupná.

Standardně doporučujeme repliku nastavit uživatelům nepřístupnou. To zvyšuje čas, po který se nedostanou k datům v případě havárie primárního úložiště, na druhou stranu je to chrání před tím, aby omylem do repliky zapsali data, která by replikační nástroje přepsaly.

Návod na přidání uživatelů do skupiny

Poslední úprava: 10.11.2017 11:19