[LUGOS] Varovanje podatkov na strežniku

Fri May 11 17:41:46 CEST 2007

On Tue, 8 May 2007, Metod Kozelj wrote:

>> Saj lahko delaš RAID-5 brez kontrolerja - softverski RAID-5. Čim več diskov
>> imaš, tem boljše je razmerje prostor/cena/varnost. Jaz to sicer počnem v
>> FreeBSDju, vendar tudi Linux to lepo zna.
>
> Zgornja trditev popolnoma drži za razmerje prostor/cena, za varnost pa ne 
> ravno.
>
> Varnost s številom diskov pada.

Do sem imas se prav.

> Primer (precej pretiran, za ilustracijo): če ima en disk zanesljivost na 
> časovno enoto recimo 0,8 (torej je 20% verjetnost crashiranja), potem 
> imasta dva enaka diska (vsak posebej kajpada isto kot eden) skupaj le še 
> 0,64, trije 0,512, ... 5 diskov le še 0,328.

Racun je naceloma sicer pravilen, vendar to velja za RAID-0. Pri RAID-5 je 
potrebno upostevati, da nam *en* disk *lahko* crkne, pa je celota se vedno 
delujoca in zanesljiva.

Ce je p zanesljivost enega diska, potem je zanesljivost RAID-5 sistema n 
diskov enaka
 		p^n + n * p^(n-1) * (1-p)

kar pri treh diskih znese 0,896, pri stirih 0,8192, pri petih 0,7373, itd. 
V tem pretiranem primeru se zadeva glede zanesljivosti in primerjave na en 
sam disk splaca do stirih diskov v RAID-5 polju. V praksi je to smiselno 
do precej visjih stevilk. Pri diskih z MTBF 1.000.000 ur recimo je to do 
16 diskov, ce nas zanima eno (naslednje) leto dni.

Seveda pa se vedno velja, da zanesljivost nobenega RAID-5 nikoli ni tako 
visoka, kot je zanesljivost RAID-1.

> Zato se pri večji količini diskov v enem RAID polju dodaja še ti 
> 'spare', ki poskrbi za avtomatski rebuild v primeru okvare. Tako se 
> zmanjša verjetnost da v istem polju crkne še en disk preden prvega 
> zamenjamo.

Ja, pri dodatnem spare disku se to zanesljivost dvigne na (n je skupno 
stevilo diskov skupaj s spare diskom)

 	p^(n-1) + (n-1) * p^(n-2) * (1-p) + (n-1) * (n-2) / 2 * p^(n-2) * (1-p)^2

kar pri stirih diskih znese 0,9728, pri petih 0,9421, pri sestih 0,9011, 
itd. Teoreticno, ker bi to zahtevalo rebuild v trenutku. V praksi je zato 
slabse, saj rebuild vedno nekaj casa traja. Lahko se pa teh tezav s 
trenutnim rebuildom znebimo, ce spare disk na nek nacin "virtualiziramo" 
in je potem vseeno katera dva diska izmed vseh crkneta. Nekoliko bolj 
naravno in lepse zapisana sicer ista formula bi potem lahko izgledala

 	p^n + n * p^(n-1) * (1-p) + n * (n-1) / 2 * p^(n-2) * (1-p)^2

Obstajajo diskovni sistemi, ki imajo taksne sorte virtualizacijo. Naceloma 
zelo lepo in zanesljivo delujejo. Lahko pa tudi zelo temeljito izgubis vse 
skupaj, ce ti po kaksnem nakljucju crknejo trije diski priblizno hkrati. 
Da kaj taksnega se dogaja, pa lahko potrdim iz osebnih izkusenj. Pri nas 
so enkrat v sicer ne tako zelo virtualiziranem diskovnem sistemu z nekje 
25-30 diski crknili stirje diski hkrati. Na sreco je bil eden spare disk, 
ostali trije so pa pripadali vsak razlicni skupini RAID-1/5 virtualnih 
diskov. Ampak ce bi bilo vse skupaj en velik virtualni disk z redundanco 
dveh diskov, bi pa ...

Ales

-- 
Ales Casar                |  Email:    casar at uni-mb.si
Computer Centre           |  DECnet:   RCUM::ALES
University of Maribor     |  AX.25:    S56SAC @ S50MBR.SVN.EU
SLOVENIA                  |  WWW:      http://www.el.feri.uni-mb.si/~ales/