Performanța sistemelor de stocare cu matrice de discuri în conexiune cu o singură gazdă

În general, discurile sau matricele de discuri au cele mai bune performanțe într-un scenariu de conexiune cu o singură gazdă. Majoritatea sistemelor de operare se bazează pe sisteme de fișiere exclusive, ceea ce înseamnă că un sistem de fișiere poate fi deținut doar de un singur sistem de operare. Ca rezultat, atât sistemul de operare, cât și software-ul aplicației optimizează citirea și scrierea datelor pentru sistemul de stocare pe disc pe baza caracteristicilor acestuia. Această optimizare are ca scop reducerea timpilor de căutare fizică și reducerea timpilor de răspuns mecanic al discului. Solicitările de date din fiecare proces de program sunt gestionate de sistemul de operare, rezultând solicitări de citire și scriere a datelor optimizate și ordonate pentru disc sau matrice de discuri. Acest lucru duce la cea mai bună performanță a sistemului de stocare în această configurație.

Pentru matricele de discuri, deși se adaugă un controler RAID suplimentar între sistemul de operare și unitățile de disc individuale, controlerele RAID actuale gestionează și verifică în primul rând operațiunile de toleranță la erori de disc. Nu efectuează fuzionarea, reordonarea sau optimizarea cererilor de date. Controlerele RAID sunt proiectate pe baza presupunerii că cererile de date provin de la o singură gazdă, deja optimizată și sortată de sistemul de operare. Cache-ul controlerului oferă numai capacități de buffering direct și de calcul, fără a pune datele în coadă pentru optimizare. Când memoria cache este umplută rapid, viteza scade imediat la viteza reală a operațiunilor pe disc.

Funcția principală a controlerului RAID este de a crea unul sau mai multe discuri mari tolerante la erori de pe mai multe discuri și de a îmbunătăți viteza generală de citire și scriere a datelor utilizând caracteristica de stocare în cache pe fiecare disc. Cache-ul de citire al controlerelor RAID îmbunătățește semnificativ performanța de citire a matricei de discuri atunci când aceleași date sunt citite într-un timp scurt. Viteza maximă reală de citire și scriere a întregii matrice de discuri este limitată de cea mai mică valoare dintre lățimea de bandă a canalului gazdă, capacitatea de verificare a CPU-ului controlerului și de control al sistemului (motor RAID), lățimea de bandă a canalului de disc și performanța discului (performanța reală combinată a toate discurile). În plus, nepotrivirea între baza de optimizare a solicitărilor de date ale sistemului de operare și formatul RAID, cum ar fi dimensiunea blocului de solicitări I/O care nu se aliniază cu dimensiunea segmentului RAID, poate afecta semnificativ performanța matricei de discuri.

Variații de performanță ale sistemelor tradiționale de stocare cu matrice de discuri în accesul la mai multe gazdă

În mai multe scenarii de acces la gazdă, performanța matricelor de discuri scade în comparație cu conexiunile cu o singură gazdă. În sistemele de stocare cu matrice de discuri la scară mică, care au de obicei o pereche unică sau redundantă de controlere de matrice de discuri și un număr limitat de discuri conectate, performanța este afectată de fluxurile de date neordonate de la diverse gazde. Acest lucru duce la creșterea timpilor de căutare a discului, a informațiilor privind antetul și coada segmentului de date și fragmentarea datelor pentru procesele de citire, îmbinare, verificare și rescriere. În consecință, performanța de stocare scade pe măsură ce sunt conectate mai multe gazde.

În sistemele de stocare cu matrice de discuri la scară mare, degradarea performanței este diferită de cea a matricelor de discuri la scară mică. Aceste sisteme la scară largă folosesc o structură de magistrală sau o structură de comutare încrucișată pentru a conecta mai multe subsisteme de stocare (matrice de discuri) și includ cache-uri de mare capacitate și module de conexiune gazdă (similar cu hub-urile sau comutatoarele de canal) pentru mai multe gazde în magistrală sau comutare. structura. Performanța depinde în mare măsură de memoria cache din aplicațiile de procesare a tranzacțiilor, dar are o eficiență limitată în scenariile de date multimedia. În timp ce subsistemele interne de matrice de discuri din aceste sisteme la scară largă funcționează relativ independent, o singură unitate logică este construită doar într-un singur subsistem de disc. Astfel, performanța unei singure unități logice rămâne scăzută.

În concluzie, matricele de discuri la scară mică se confruntă cu o scădere a performanței din cauza fluxurilor de date neordonate, în timp ce matricele de discuri la scară mare cu mai multe subsisteme de matrice de discuri independente pot suporta mai multe gazde, dar încă se confruntă cu limitări pentru aplicațiile de date multimedia. Pe de altă parte, sistemele de stocare NAS bazate pe tehnologia RAID tradițională și care utilizează protocoale NFS și CIFS pentru a partaja spațiul de stocare cu utilizatorii externi prin conexiuni Ethernet se confruntă cu o degradare mai mică a performanței în mai multe medii de acces gazdă. Sistemele de stocare NAS optimizează transmisia de date utilizând transferuri multiple TCP/IP paralele, permițând o viteză partajată maximă de aproximativ 60 MB/s într-un singur sistem de stocare NAS. Utilizarea conexiunilor Ethernet permite ca datele să fie scrise în mod optim pe sistemul de disc după gestionarea și reordonarea de către sistemul de operare sau software-ul de gestionare a datelor în serverul subțire. Prin urmare, sistemul de discuri în sine nu suferă o degradare semnificativă a performanței, ceea ce face ca stocarea NAS să fie potrivită pentru aplicațiile care necesită partajarea datelor.


Ora postării: Iul-17-2023