Odată cu creșterea rapidă a aplicațiilor AI, conduse de modele precum ChatGPT, cererea de putere de calcul a crescut vertiginos. Pentru a satisface cerințele de calcul din ce în ce mai mari ale erei AI, H3C Group, sub umbrela Tsinghua Unigroup, a dezvăluit recent 11 produse noi din seriile H3C UniServer G6 și HPE Gen11 la summitul NAVIGATE Leader Summit din 2023. Aceste noi produse server creează o matrice cuprinzătoare pentru AI în diferite scenarii, oferind o platformă subiacentă puternică pentru manipularea datelor masive și a algoritmilor de model și asigurând o amplă sursă de resurse de calcul AI.
Matrice variată de produse pentru a răspunde nevoilor variate de calcul AI
În calitate de lider în calculul inteligent, H3C Group a fost profund implicat în domeniul AI de mulți ani. În 2022, H3C a atins cea mai mare rată de creștere de pe piața chineză de calcul accelerat și a acumulat un total de 132 de primele poziții mondiale în benchmark-ul AI de renume internațional MLPerf, demonstrând expertiza și capabilitățile sale tehnice puternice.
Folosind o arhitectură de calcul avansată și capabilități inteligente de gestionare a puterii de calcul construite pe baza calculului inteligent, H3C a dezvoltat modelul emblematic de calcul inteligent H3C UniServer R5500 G6, conceput special pentru formarea modelelor la scară largă. Ei au introdus, de asemenea, H3C UniServer R5300 G6, un motor de calcul hibrid potrivit pentru scenarii de inferență/antrenament la scară largă. Aceste produse îndeplinesc în continuare diversele cerințe de calcul în diferite scenarii AI, oferind o acoperire completă de calcul AI.
Computing inteligent proiectat pentru formarea modelelor la scară largă
H3C UniServer R5500 G6 combină puterea, consumul redus de energie și inteligența. În comparație cu generația anterioară, oferă o putere de calcul de trei ori mai mare, reducând timpul de antrenament cu 70% pentru scenariile de antrenament cu modele la scară largă GPT-4. Este aplicabil la diferite scenarii de afaceri AI, cum ar fi instruirea la scară largă, recunoașterea vorbirii, clasificarea imaginilor și traducerea automată.
Putere: R5500 G6 acceptă până la 96 de nuclee CPU, oferind o creștere cu 150% a performanței nucleului. Este echipat cu noul modul NVIDIA HGX H800 8-GPU, care oferă 32 PFLOPS de putere de calcul, rezultând o îmbunătățire de 9 ori a vitezei de antrenament AI a modelelor la scară largă și o îmbunătățire de 30 ori a performanței de inferență AI a modelului la scară largă. În plus, cu suportul pentru rețele PCIe 5.0 și 400G, utilizatorii pot implementa clustere de calcul AI de performanță mai înaltă, accelerând adoptarea și aplicarea AI în întreprinderi.
Inteligență: R5500 G6 acceptă două configurații de topologie, adaptându-se inteligent la diferite scenarii de aplicații AI și accelerând aplicațiile de deep learning și de calcul științific, îmbunătățind considerabil utilizarea resurselor GPU. Datorită caracteristicii GPU multi-instanță a modulului H800, un singur H800 poate fi împărțit în 7 instanțe GPU, cu posibilitatea de până la 56 de instanțe GPU, fiecare având resurse independente de calcul și memorie. Acest lucru îmbunătățește semnificativ flexibilitatea resurselor AI.
Amprentă redusă de carbon: R5500 G6 acceptă pe deplin răcirea lichidă, inclusiv răcirea lichidă atât pentru procesor, cât și pentru GPU. Cu un PUE (Eficiență de utilizare a energiei) sub 1,1, permite „calcularea rece” în căldura creșterii de calcul.
Merită menționat faptul că R5500 G6 a fost recunoscut drept unul dintre „Top 10 Servere Remarcabile de înaltă performanță din 2023” în „2023 Power Ranking for Computational Performance” la lansare.
Motor de calcul hibrid pentru potrivirea flexibilă a cerințelor de instruire și inferență
H3C UniServer R5300 G6, ca server AI de generație următoare, oferă îmbunătățiri semnificative ale specificațiilor CPU și GPU în comparație cu predecesorul său. Se mândrește cu performanțe remarcabile, topologie inteligentă și capacități integrate de calcul și stocare, făcându-l potrivit pentru formarea modelelor de învățare profundă, inferență de învățare profundă și alte scenarii de aplicații AI, potrivind în mod flexibil nevoile de instruire și calcul de inferență.
Performanță remarcabilă: R5300 G6 este compatibil cu cea mai recentă generație de GPU-uri NVIDIA de nivel enterprise, oferind o îmbunătățire a performanței de 4,85 ori comparativ cu generația anterioară. Acceptă diferite tipuri de carduri de accelerare AI, cum ar fi GPU-uri, DPU-uri și NPU-uri, pentru a îndeplini cerințele eterogene de putere de calcul ale AI în diferite scenarii, dând putere erei inteligenței.
Topologie inteligentă: R5300 G6 oferă cinci setări de topologie GPU, inclusiv HPC, paralel AI, serial AI, acces direct cu 4 carduri și acces direct cu 8 carduri. Această flexibilitate fără precedent îmbunătățește foarte mult adaptabilitatea la diferite scenarii de aplicații ale utilizatorului, alocă inteligent resurse și conduce la o funcționare eficientă a puterii de calcul.
Calculatoare și stocare integrate: R5300 G6 găzduiește în mod flexibil carduri de accelerare AI și NIC-uri inteligente, combinând capacități de antrenament și de inferență. Suportă până la 10 GPU-uri cu lățime dublă și 24 sloturi pentru hard disk LFF (Large Form Factor), permițând antrenament și inferență simultane pe un singur server și oferind un motor de calcul rentabil pentru medii de dezvoltare și testare. Cu o capacitate de stocare de până la 400 TB, îndeplinește pe deplin cerințele de spațiu de stocare ale datelor AI.
Odată cu boom-ul AI în creștere, puterea de calcul este în mod constant remodelată și provocată. Lansarea serverelor AI de generație următoare marchează o altă piatră de hotar în angajamentul Grupului H3C față de tehnologia „inteligență inerentă” și impulsul său continuu pentru evoluția calculului inteligent.
Privind spre viitor, ghidat de strategia „Cloud-Native Intelligence”, H3C Group aderă la conceptul de „pragmatism meticulos, înzestrând epoca cu inteligență”. Ei vor continua să cultive solul fertil al calculului inteligent, să exploreze scenarii de aplicații AI la nivel profund și să accelereze sosirea unei lumi inteligente cu putere de calcul adaptabilă și pregătită pentru viitor.
Ora postării: Iul-04-2023