[LUGOS] LVM2

Thu May 25 19:31:45 CEST 2006

Oj!

Pošiljam še majhno dopolnilo k prej napisanemu. Zlasti zato, ker
sem uporabil v glavnem neznano mersko enoto za "verjetnost odpovedi"
(in komplementarno "zanesljivost delovanja").

Bolj znana je MTBF.

Toda, ker je računanje z MTBF nekoliko bolj zapleteno bom MTBF
"preslikal" v "verjetnost odpovedi".

Iz administratorskega zornega kota je zanimiv podatek o tem ali obstaja
nevarnost in kolikšna je, da v naslednjem letu kakšen disk ali enota
odpove.

Če disk ima MTBF = mHD = 1.400.000 ur (cca. 160 let), to predstavlja
naslednjo "verjetnost odpovedi" (pfHD) v enem letu:

pfHD = (1/mHD)*24*365
      = (1/1400000)*24*365
      = 0,006257 (cca. 0,6257%)

verjetnost, da bo disk brezhibno preživel leto je, torej:

pHD = 1-pfHD
     = 1-0,006257
     = 0,993743

Verjetnost, da bo množica takšnih petih diskov v LVDu v letu dni
"crknil" je, torej:

pfLVD = 1-(0,993743^5)
       = 1-0,969
       = 0,031, torej zajetnih 3,1%

oz. je MTBF za takšen LVD enak:

mLVD = 1/(pfLVD/24/365)
      = 1/(0,031/24/365)
      = 283526 ur (oz. cca. 32 let)

Če se nisem zmotil bi izračun moral biti, torej blizu komaj ene
petine MTBF diskov (računa se s recipročnimi vrednostmi), ki
sestavljajo LVD.

Ni čudno, torej, da LVDi crkujejo. Saj niso niti namenjeni temu, da
ohranjajo zanesljivost, temveč da povečajo fleksibilnost.

Izračun, ki sem ga pripravil v prejšnjem postu je temeljil na letni
zanesljivosti 0,999, kar prenešeno v MTBF predstavlja 8,76 milion ur.
Takšne diske še ne proizvajajo. Je pa dosegljivo z RAID polji.

Zanesljivost RAID polja je dokaj teško izračunati, saj temelji na
domnevi HKRATNE odpovedi obeh diskov. Toda iz praktičnih izkušnj je 
nujno besedo HKRATI tolmačiti kot "odpoved drugega diska, v času, ko
napaka na prvem še ni odpravljena". Kar pomeni, jasno, da s hitrostjo
zamenjave prvega diska zelo vplivamo na dostopnost in skupno
zanesljivost RAID diskovnega polja.

Če potrebujemo za zamenjavo enega diska v okvari 24 ur (da se ne
pretrgamo) je verjetnost okvare drugega diska v polju:

pfHD2 = (1/mHD2)*24
       = 1,71E-5

Zanesljivost takšnega RAID diskovnega polja je:

pMD = 1-(1-pHD1)*(1-pHD2)
     = 1-pfHD1*pfHD2
     = 1-0,006257*1,71E-5
     = 0,99999989

oz. lažje je izraziti verjetnost, da bomo v naslednjem letu imeli 
opravka s takšnim katastrofičnim scenarijem:

pfMD = 1-pMD
      = 1-0,99999989
      = 1,07E-7

Izraženo v MTBF:

mRAID = 1/(pfRAID/24/365)
       = 1/1,07E-7/24/365)
       = 1/1,22E-11)
       = 8,17E10

Povedano drugače, MTBF takšnega RAID sistema je čez 81 milijard ur oz.
čez 9,3 milionov let.

LP

Darko

--

Darko Bulat wrote:
> Kriza se začne, če nekdo pomeša dve funkcionalnosti.
> 
> LVM ponuja eno funkcionalnost, to je, da omogoči administratorju, da
> odmisli "fizične diske" in upravlja z navideznimi diski. Toda, jasno,
> navidezno še ne pomeni, da zadeva ni odvisna od zanesljivosti fizičnih
> diskov.
> 
> Tukaj vskoči RAID in vsaj znani MD. MD pa ponuja to funkcionalnost, da
> poveča zanesljivost diskov tako, da eno enoto predstavlja več smisleno
> povezanih fizičnih enot, ki potem tvorijo bolj zanesljivo kombinacijo
> kakor bi bila le ena sama fizična enota (disk).
> 
> Zmagovalna kombinacija je, seveda,  LVM2 + MD. Vsako posebej je tudi
> mogoče uporabljati a vendarle, ker je v tej zgradbi MD "pod" LVMjem
> je logično načrtovati MD brez LVMa, manj pa je zaželjen LVM brez MDa.
> 
> Nek Janežič, ki je, torej, imel težave je v prvi vrsti naletel na mino
> zato, ker je pri kopičenju diskov in njihovem logičnem zlaganju v LVM2
> pozabil, da se za izračun verjetnosti za odpoved LVMa množijo količniki
> zanesljivosti (npr. pHD=0,999) in to tako, da končni količnik 
> predstavlja verjetnost zanesljivosti LVMa (npr. za sistem petih diskov,
> pHD[1-5]=0,999):
> 
> pLVM = pHD1*pHD2*pHD3*pHD4*pHD5
>      = 0,999*0,999*0,999*0,999*0,999
> pLVM = 0,995
> 
> Vidimo, da se zanesljivost hitro manjša s vsakim posameznim diskom. To
> je logično, saj je za delujoč LVM nujno, da delujejo vsi diski spodaj.
> 
> Obratno je pri MDu.
> 
> Denimo, da se odločamo za RAID1, torej mirroring. Pa če uporabimo le
> dva diska, s pHD[1-2]=0,999, tedaj se zanesljivost računa obrnjeno, s
> množenjem verjetnosti za napako. Šele, ko odpovesta oba istočasno je
> RAID1 crknjen.
> 
> pMD = 1-(1-pHD1)*(1-pHD2)
>     = 1-(1-0,999)*(1-0,999)
>     = 1-0,001*0,001
>     = 1-0,000001
> pMD = 0,999999
> 
> Mimogrede, enaka zanesljivost je tudi pri npr. večdiskovnem RAID5
> polju, saj izračun predstavlja zanesljivost sistema, pri katerem
> je dopustno, da crkne en disk. Če crkneta dva hkrati (in to je
> izračun) pa odpovedujeta tako RAID1 kot RAID5 (pod pogojem, da
> nismo zagotovili spare or hot-swap).
> 
> Ugotovimo, torej, da se je zanesljivost bistveno povečala. Šele tedaj,
> ko imamo pod LVMom tako zanesljiv "device" jih je mogoče in smotrno 
> logično povezovat skupaj v eno enoto primerno za filesystem.
> 
> S LVM, torej, pamet v glavo.
> 
> LP
> Darko
> 
> -- 
> 
> Blaz Podrzaj wrote:
>> On Thu, 25 May 2006, Jure Koren wrote:
>>
>>> On Thursday 25 May 2006 10:45, Blaz Podrzaj wrote:
>>>> On Thu, 25 May 2006, Ales wrote:
>>>>> Zanima me predvsem kaksne imate izkusnje z LVM2? Ali se mi splaca
>>>>> "komplicirat"?
>>>> Ne. Če imaš en disk z 250GB nimaš kaj komplicirat. Razen če ne misliš
>>>> aplicirat snapshotinga za potrebe arhiviranja.
>>>> Drugače bi bilo, če bi imel 20 diskov po 2GB - kakšen SAN prek FC.
>>> Ravno obratno je. SANi ti obicajno omogocajo, da razsiris logicno 
>>> napravo, ki
>>> jo vidi streznik, zato tam ne rabis LVMja.
>>
>> In se zbudiš ko se z glavo v nočno omarico udariš ;) to funkcionira 
>> samo v
>> filmih in stripih. Na papirju že gre, problem je meneđment in logistika
>> (veliki sistemi).
>>
>>> Ce imas samo en mirror in bi rad imel moznost dodat se enega in 
>>> enostavno
>>> povecat /home particijo, je reiser nad LVM kar primerna kombinacija in
>>> preizkuseno deluje.
>>
>> Če imaš HW mirroring ja, če imaš pa SW mirroring se pa začne nočna 
>> mora ko
>> začne kakšen od diskov crkovat - vsaj kar se LVM in MD tiče (beri en
>> thread od Janežiča izpred enega leta se mi zdi - on pa še MD-ja ni imel
>> se mi zdi).
>>
>> Pri HP-ju je SW mirroring del LVM-ja. Sicer ga fino plačaš samo potem
>> nekako dela za silo ;)
>>
>>> A je LVM2 == EVMS? Nisem cisto na tekocem, prvi LVM se vedno odlicno 
>>> deluje.
>>
>> Se mi zdi da je LVM2 del EVMS-ja. Bo Pečar povedal.
>>
>> lp,B
>>
>> _______________________________________________
>> lugos-list mailing list
>> lugos-list at lugos.si
>> http://liste2.lugos.si/cgi-bin/mailman/listinfo/lugos-list
> 
> _______________________________________________
> lugos-list mailing list
> lugos-list at lugos.si
> http://liste2.lugos.si/cgi-bin/mailman/listinfo/lugos-list