[LUGOS] LVM2
Darko Bulat
darko.bulat at ceterum.si
Thu May 25 19:31:45 CEST 2006
Oj!
Pošiljam še majhno dopolnilo k prej napisanemu. Zlasti zato, ker
sem uporabil v glavnem neznano mersko enoto za "verjetnost odpovedi"
(in komplementarno "zanesljivost delovanja").
Bolj znana je MTBF.
Toda, ker je računanje z MTBF nekoliko bolj zapleteno bom MTBF
"preslikal" v "verjetnost odpovedi".
Iz administratorskega zornega kota je zanimiv podatek o tem ali obstaja
nevarnost in kolikšna je, da v naslednjem letu kakšen disk ali enota
odpove.
Če disk ima MTBF = mHD = 1.400.000 ur (cca. 160 let), to predstavlja
naslednjo "verjetnost odpovedi" (pfHD) v enem letu:
pfHD = (1/mHD)*24*365
= (1/1400000)*24*365
= 0,006257 (cca. 0,6257%)
verjetnost, da bo disk brezhibno preživel leto je, torej:
pHD = 1-pfHD
= 1-0,006257
= 0,993743
Verjetnost, da bo množica takšnih petih diskov v LVDu v letu dni
"crknil" je, torej:
pfLVD = 1-(0,993743^5)
= 1-0,969
= 0,031, torej zajetnih 3,1%
oz. je MTBF za takšen LVD enak:
mLVD = 1/(pfLVD/24/365)
= 1/(0,031/24/365)
= 283526 ur (oz. cca. 32 let)
Če se nisem zmotil bi izračun moral biti, torej blizu komaj ene
petine MTBF diskov (računa se s recipročnimi vrednostmi), ki
sestavljajo LVD.
Ni čudno, torej, da LVDi crkujejo. Saj niso niti namenjeni temu, da
ohranjajo zanesljivost, temveč da povečajo fleksibilnost.
Izračun, ki sem ga pripravil v prejšnjem postu je temeljil na letni
zanesljivosti 0,999, kar prenešeno v MTBF predstavlja 8,76 milion ur.
Takšne diske še ne proizvajajo. Je pa dosegljivo z RAID polji.
Zanesljivost RAID polja je dokaj teško izračunati, saj temelji na
domnevi HKRATNE odpovedi obeh diskov. Toda iz praktičnih izkušnj je
nujno besedo HKRATI tolmačiti kot "odpoved drugega diska, v času, ko
napaka na prvem še ni odpravljena". Kar pomeni, jasno, da s hitrostjo
zamenjave prvega diska zelo vplivamo na dostopnost in skupno
zanesljivost RAID diskovnega polja.
Če potrebujemo za zamenjavo enega diska v okvari 24 ur (da se ne
pretrgamo) je verjetnost okvare drugega diska v polju:
pfHD2 = (1/mHD2)*24
= 1,71E-5
Zanesljivost takšnega RAID diskovnega polja je:
pMD = 1-(1-pHD1)*(1-pHD2)
= 1-pfHD1*pfHD2
= 1-0,006257*1,71E-5
= 0,99999989
oz. lažje je izraziti verjetnost, da bomo v naslednjem letu imeli
opravka s takšnim katastrofičnim scenarijem:
pfMD = 1-pMD
= 1-0,99999989
= 1,07E-7
Izraženo v MTBF:
mRAID = 1/(pfRAID/24/365)
= 1/1,07E-7/24/365)
= 1/1,22E-11)
= 8,17E10
Povedano drugače, MTBF takšnega RAID sistema je čez 81 milijard ur oz.
čez 9,3 milionov let.
LP
Darko
--
Darko Bulat wrote:
> Kriza se začne, če nekdo pomeša dve funkcionalnosti.
>
> LVM ponuja eno funkcionalnost, to je, da omogoči administratorju, da
> odmisli "fizične diske" in upravlja z navideznimi diski. Toda, jasno,
> navidezno še ne pomeni, da zadeva ni odvisna od zanesljivosti fizičnih
> diskov.
>
> Tukaj vskoči RAID in vsaj znani MD. MD pa ponuja to funkcionalnost, da
> poveča zanesljivost diskov tako, da eno enoto predstavlja več smisleno
> povezanih fizičnih enot, ki potem tvorijo bolj zanesljivo kombinacijo
> kakor bi bila le ena sama fizična enota (disk).
>
> Zmagovalna kombinacija je, seveda, LVM2 + MD. Vsako posebej je tudi
> mogoče uporabljati a vendarle, ker je v tej zgradbi MD "pod" LVMjem
> je logično načrtovati MD brez LVMa, manj pa je zaželjen LVM brez MDa.
>
> Nek Janežič, ki je, torej, imel težave je v prvi vrsti naletel na mino
> zato, ker je pri kopičenju diskov in njihovem logičnem zlaganju v LVM2
> pozabil, da se za izračun verjetnosti za odpoved LVMa množijo količniki
> zanesljivosti (npr. pHD=0,999) in to tako, da končni količnik
> predstavlja verjetnost zanesljivosti LVMa (npr. za sistem petih diskov,
> pHD[1-5]=0,999):
>
> pLVM = pHD1*pHD2*pHD3*pHD4*pHD5
> = 0,999*0,999*0,999*0,999*0,999
> pLVM = 0,995
>
> Vidimo, da se zanesljivost hitro manjša s vsakim posameznim diskom. To
> je logično, saj je za delujoč LVM nujno, da delujejo vsi diski spodaj.
>
> Obratno je pri MDu.
>
> Denimo, da se odločamo za RAID1, torej mirroring. Pa če uporabimo le
> dva diska, s pHD[1-2]=0,999, tedaj se zanesljivost računa obrnjeno, s
> množenjem verjetnosti za napako. Šele, ko odpovesta oba istočasno je
> RAID1 crknjen.
>
> pMD = 1-(1-pHD1)*(1-pHD2)
> = 1-(1-0,999)*(1-0,999)
> = 1-0,001*0,001
> = 1-0,000001
> pMD = 0,999999
>
> Mimogrede, enaka zanesljivost je tudi pri npr. večdiskovnem RAID5
> polju, saj izračun predstavlja zanesljivost sistema, pri katerem
> je dopustno, da crkne en disk. Če crkneta dva hkrati (in to je
> izračun) pa odpovedujeta tako RAID1 kot RAID5 (pod pogojem, da
> nismo zagotovili spare or hot-swap).
>
> Ugotovimo, torej, da se je zanesljivost bistveno povečala. Šele tedaj,
> ko imamo pod LVMom tako zanesljiv "device" jih je mogoče in smotrno
> logično povezovat skupaj v eno enoto primerno za filesystem.
>
> S LVM, torej, pamet v glavo.
>
> LP
> Darko
>
> --
>
> Blaz Podrzaj wrote:
>> On Thu, 25 May 2006, Jure Koren wrote:
>>
>>> On Thursday 25 May 2006 10:45, Blaz Podrzaj wrote:
>>>> On Thu, 25 May 2006, Ales wrote:
>>>>> Zanima me predvsem kaksne imate izkusnje z LVM2? Ali se mi splaca
>>>>> "komplicirat"?
>>>> Ne. Če imaš en disk z 250GB nimaš kaj komplicirat. Razen če ne misliš
>>>> aplicirat snapshotinga za potrebe arhiviranja.
>>>> Drugače bi bilo, če bi imel 20 diskov po 2GB - kakšen SAN prek FC.
>>> Ravno obratno je. SANi ti obicajno omogocajo, da razsiris logicno
>>> napravo, ki
>>> jo vidi streznik, zato tam ne rabis LVMja.
>>
>> In se zbudiš ko se z glavo v nočno omarico udariš ;) to funkcionira
>> samo v
>> filmih in stripih. Na papirju že gre, problem je meneđment in logistika
>> (veliki sistemi).
>>
>>> Ce imas samo en mirror in bi rad imel moznost dodat se enega in
>>> enostavno
>>> povecat /home particijo, je reiser nad LVM kar primerna kombinacija in
>>> preizkuseno deluje.
>>
>> Če imaš HW mirroring ja, če imaš pa SW mirroring se pa začne nočna
>> mora ko
>> začne kakšen od diskov crkovat - vsaj kar se LVM in MD tiče (beri en
>> thread od Janežiča izpred enega leta se mi zdi - on pa še MD-ja ni imel
>> se mi zdi).
>>
>> Pri HP-ju je SW mirroring del LVM-ja. Sicer ga fino plačaš samo potem
>> nekako dela za silo ;)
>>
>>> A je LVM2 == EVMS? Nisem cisto na tekocem, prvi LVM se vedno odlicno
>>> deluje.
>>
>> Se mi zdi da je LVM2 del EVMS-ja. Bo Pečar povedal.
>>
>> lp,B
>>
>> _______________________________________________
>> lugos-list mailing list
>> lugos-list at lugos.si
>> http://liste2.lugos.si/cgi-bin/mailman/listinfo/lugos-list
>
> _______________________________________________
> lugos-list mailing list
> lugos-list at lugos.si
> http://liste2.lugos.si/cgi-bin/mailman/listinfo/lugos-list
More information about the lugos-list
mailing list