Cluster File-rendszerek Összehasonlítása

 


 

Gere Csaba

tudományos munkatárs

Internet Technológiák és Alkalmazások Központ

MTA-SZTAKI

H-1132 Budapest, Victor Hugo u. 18-22.

telefon: (+36 1) 2796027

email: gcsaba@sztaki.hu

 

Stefán Péter

tudományos munkatárs

Szuperszámítógép Központ

NIIF Iroda

H-1132 Budapest, Victor Hugo u. 18-22.

telefon: (+36 1) 4503076

email: stefan@niif.hu


 

Kivonat

 

Napjainkban egyre fontosabbá válik a központi szolgáltatások tartalékolt környezetbe való átültetése. A tartalékolás, mint szolgáltatási irányvonal célja az, hogy a szolgáltatás rendelkezésre állását magas szinten (99,9%) lehessen tartani, akár úgy, hogy az adott szolgáltatás rendkívüli esemény bekövetkezésekor (valamely gép szoftver vagy hardver meghibásodásakor) csökkent teljesítménnyel működjön. A tartalékolásnak, tartalékolt rendszerek kiépítésének nagyon sokféle módja és szintje lehet, ezek közül az egyik, legalsó szint, a tartalékolt file-rendszer megoldások problémaköre.

A tartalékolt file-rendszerek elsősorban a hálózati file-rendszerből (NFS) fejlődtek ki oly módon, hogy azzal szemben a fokozódó igények egyre inkább olyan követelményeket támasztottak, melyeket az már nem tudott kielégíteni.

A cluster fájlrendszerekkel szemben támasztott legfontosabb igények többek között a hiba-tolerancia, (tartalékolás, elosztott adatok kezelése, failover), terhelésmegosztás, nagy sávszélesség hatékony kihasználása, skálázhatóság és hatékony erőforrás-menedzsment (diszkkapacitás-bővítés/csökkentés, terület-összefűzés, tükrözés, stripe-olás).

A cluster file-rendszerek alapvetően háromféle modellben használhatóak: normál (lokális) file-rendszer, hálózati file szolgáltatás, illetve mint tároló-hálózat, SAN architektúra.

Lokális file-rendszerként általában nem használnak cluster file-rendszereket, hiszen ebben az esetben ezek sok fontos tulajdonsága nem, vagy csak rendkívül korlátozott mértékben használható ki, ráadásul rosszabb teljesítmény-jellemzőkkel, mint a normál file-rendszerek.

A file szerver típusú kialakítás azt jelenti, hogy egy adott hálózatban vannak speciális gépek, file szolgáltatók, melyek kizárólagosan kapcsolódnak a háttértároló-kapacitáshoz, és ezek normál (például IP) hálózaton keresztül szolgáltatják a fájlrendszert az összes többi gép számára. Ebben a modellben az alapvető elvárás az, hogy a szerverek képesek legyenek egymástól szolgáltatói feladatot átvenni, a kliensek számára transzparens módon.

A SAN felépítés esetén minden gép fizikailag is kapcsolódik a diszkekhez, rendszerint Fibre Channel kapcsoló (FC switch), vagy hurok (FC loop) segítségével. E megoldás esetén minden gép ugyanazt a diszk-területet látja fizikailag, és ekkor a file-rendszer feladata elsősorban az, hogy a különböző gépek a közös fizikai területen, minél hatékonyabban tudjanak írási, olvasási műveletet végezni anélkül, hogy egymást zavarnák.

A cikkben azt vizsgáljuk, hogy az NIIF Iroda géptermében, 2003 januárjában üzembe helyezett EMC Storage felhasználásával, hogyan alakíthatók ki tartalékolt file szolgáltatások, illetve azok milyen teljesítmény-jellemzőkkel bírnak. Több vizsgált cluster file-rendszer közül az IBM GPFS, illetve a Sistina GFS rendszerekhez kapcsolódó tapasztalatainkat, konfigurációs problémákat, azok lehetséges megoldásait, illetve a mért teljesítmény-jellemzőket szeretnénk összefoglalni.