Domov O hpc História aktuality Partneri

Domov — o hpc

O HPC

High performance computing

High performance computing (HPC) alebo vysoko výkonné počítanie (VVP) znamená využívanie (super)počítačov a počítačových klastrov na riešenie numericky alebo dátovo náročných úloh z rôznych odvetví vedy a techniky. Príkladom sú aplikácie v medicíne (genetika, „in silico“ dizajn liečiv, …), vo fyzike (meteorologické a klimatické modely, jadrová a časticová fyzika, …), v chémii (vlastnosti atómov a molekúl, korelácia medzi štruktúrou a reaktivitou, ….) ale aj v ekonomike (risk investícii, rast akcií, …) a v mnohých ďalších odvetviach.


Za superpočí­tače sú považované systémy, ktoré svojím výkonom vysoko prevyšujú bežné, osobné počítače. Na meranie výpočtového výkonu sú používané rôzne štandardizované testy akým je napríklad LINPACK (LINear equations software PACKage) benchmark. Jednotkou výpočtového výkonu počítačov je Flop (počet operácii s plávajúcou desatinnou čiarkou (floating point) za sekundu). Moderné superpočítače dosahujú výkony na úrovni terraFlopov (10^12) až petaFlopov (10^15). Agregátny výpočtový výkon je ovplyvnený aj ďalšími parametrami, akými sú oneskorenie a priepustnosť dátových sietí, prostredníctvom ktorých procesory alebo uzly superpočítača komunikujú, oneskorenie a priepustnosť komunikácie s úložiskom dát a pod. Všetky tieto parametre determinujú škálovateľnost, čiže efektivitu tzv. paralelných výpočtov využívajúcich viac uzlov, procesorov resp. jadier súčasne.


Trendom v modernom VVP je už spomenuté paralelné počí­tanie. V súčasnosti už jasne dominuje viacuzlová, viacprocesorová resp. viacjadrová architektúra superpočí­tačov, pričom jednotlivé výpočtové jednotky spolu komunikujú a ako celok poskytujú agregovaný výkon. Ich vzájomne prepojenie je realizované vysoko rýchlostnou sieťou, ako je napr. Infiniband alebo 10Gb/s ethernet, reps. inou dedikovanou sieťou. Architektúry takéhoto typu je možné (aspoň teoreticky) škálovať do obrovských rozmerov, pričom limitujúcimi faktormi sú spotreba elektrickej energie, chladenie a priestorové možnosti miesta inštalácie.

Medicína

  • — Genetika
  • — “in silico“
  • — Dizajn liečiv
  • ...

Fyzika

  • — meteorologické a klimatické modely
  • — jadrová a časticová fyzika
  • ...

Chémia

  • — Vlastnosti atómov a molekúl
  • — Korelácia medzi štruktúrou a reaktivitou
  • — ...

Ekonomika

  • — Risk investícii
  • — Rast akcií
  • — ...

Klastrové počítanie

Výpočtový klaster sa skladá z viacerých počítačov, pospájaných vysokorýchlostnou lokálnou sieťou, ktoré spolupracujú aby sa navonok javili ako jednoliaty systém. Klastre sa kvôli svojej cenovej efektivite obvykle používajú hlavne na zvýšenie výkonu a dostupnosti. Pre svoje fungovanie využívajú software, ktorý umožňuje vysokovýkonné distribuované počítanie. Výkonnosť klastrov je často ďalej zvyšovaná grafickými akcelerátormi. Vysoká dostupnosť (HA – high availability) sa dosahuje redundanciou niektorých zdrojov klastra a zaručuje jeho nepretržité fungovanie aj v prípade, že niektorý z týchto komponentov zlyhá.

Systém: IBM dx360 M3

Počet výpočtových uzlov: 46

Procesor: 2x 6 jadrový Intel Xeon X5640 @2,27GHz

Pamäť: 96GB

Subsystém pevných diskov: 2 x 500GB

Výpočtová sieť: 40Gb/s Infiniband

Operačný systém: Scientific Linux 6.3

2x NVIDIA Tesla M2070 6GB RAM, 448 CUDA jadier

Systém: IBM iDataPlex dx360

Počet výpočtových uzlov: 52

Procesor: 2x 6 jadrový Intel Xeon X5670 @2,93GHz

Pamäť: 48GB

Subsystém pevných diskov: 1x 2TB

Výpočtová sieť: 40Gb/s Infiniband

Operačný systém: Scientific Linux 6.4

2x NVIDIA Tesla M2050 6GB RAM, 448 CUDA jadier

Systém: IBM Blade system x HS22

Počet výpočtových uzlov: 24

Procesor: 2x 6 jadrový Intel Xeon X5640 @2,27GHz

Pamäť: 48GB

Subsystém pevných diskov: 500GB

Výpočtová sieť: 40Gb/s Infiniband, 10Gb/s Ethernet

Operačný systém: Scientific Linux 6.3


Systém: IBM Blade system x HS23

Počet výpočtových uzlov: 19

Procesor: 2x 8 jadrový Intel Xeon E5-2650 @2,6GHz

Pamäť: 64GB

Subsystém pevných diskov: 500GB

Výpočtová sieť: 40Gb/s Infiniband, 10Gb/s Ethernet

Operačný systém: Scientific Linux 6.3


Systém: IBM iDataPlex dx360 M3

Počet výpočtových uzlov: 2

Procesor: 2x 6 jadrový Intel Xeon X5640 @2,27GHz

Pamäť: 24GB

Subsystém pevných diskov: 2x 500GB

Výpočtová sieť: 40Gb/s Infiniband

Operačný systém: Linux

2x NVIDIA Tesla M2070 6GB RAM, 448 CUDA jadier


Systém: IBM iDataPlex dx360 M4

Počet výpočtových uzlov: 1

Procesor: 2x 8 jadrový Intel Xeon E5-2650 @2,6GHz

Pamäť: 64GB

Subsystém pevných diskov: 2x 500GB

Výpočtová sieť: 40Gb/s Infiniband

Operačný systém: Linux

1x NVIDIA Tesla K20 5GB RAM, 2496 CUDA jadier

Systém: IBM iDataPlex dx360 M3

Počet výpočtových uzlov: 56

Procesor: 2x 6 jadrový Intel Xeon X5640 @2,27GHz

Pamäť: 4GB

Subsystém pevných diskov: 2x 500GB

Výpočtová sieť: 40Gb/s Infiniband

Operačný systém: Linux

16x NVIDIA Tesla M2070 6GB RAM, 448 CUDA jadier

10x NVIDIA Tesla K20 5GB RAM, 2496 CUDA jadier

Systém: IBM iDataPlex dx360 M3

Počet výpočtových uzlov: 54

Procesor: 2x Intel E5645 @2,4GHz

Pamäť: 48GB

Subsystém pevných diskov: 2 x 500GB

Výpočtová sieť: 40Gb/s Infiniband, 10Gb/s Ethernet

2x NVIDIA Tesla M2070 6GB RAM, 448 CUDA jadier


Systém: IBM iDataPlex dx360 M4

Počet výpočtových uzlov: 8

Procesor: 2 x Intel E5-2670 @2,6GHz

Pamäť: 64GB

Subsystém pevných diskov: 2 x 500GB

Výpočtová sieť: 40Gb/s Infiniband, 10Gb/s Ethernet

2x NVIDIA Tesla K20 5GB RAM, 2496 CUDA jadier


Systém: IBM iDataPlex x3550 M4

Počet výpočtových uzlov: 1

Procesor: 1 x Intel E5-2640 @2,5GHz

Pamäť: 8GB

Subsystém pevných diskov: 2 x 500GB

Výpočtová sieť: 40Gb/s Infiniband, 10Gb/s Ethernet

Systém: IBM iDataPlex dx360 M3

Počet výpočtových uzlov: 24

Procesor: 2x Intel Xeon X5670 @2,93GHz

Pamäť: 48GB

Subsystém pevných diskov: 2 x 500GB

Výpočtová sieť: 40Gb/s Infiniband

Operačný systém: Linux

2x NVIDIA Tesla M2070 6GB RAM, 448 CUDA jadier


Systém: IBM iDataPlex dx360 M4

Počet výpočtových uzlov: 8

Procesor: 2x Intel Xeon E5-2670

Pamäť: 64GB

Subsystém pevných diskov: 2x 500GB + 2x 900GB

Výpočtová sieť: 40Gb/s Infiniband

Operačný systém: Linux


Systém: IBM iDataPlex dx360 M4

Počet výpočtových uzlov: 6

Procesor: 2x Intel Xeon E5-2670

Pamäť: 128GB

Subsystém pevných diskov: 2x 900GB

Výpočtová sieť: 40Gb/s Infiniband

Operačný systém: Linux


Systém: IBM iDataPlex dx360 M4

Počet výpočtových uzlov: 3

Procesor: 2x Intel Xeon E5-2670

Pamäť: 64GB

Subsystém pevných diskov: 2x 900GB

Výpočtová sieť: 40Gb/s Infiniband

Operačný systém: Linux

2x NVIDIA Tesla K20 5GB RAM, 2496 CUDA jadier

Počet jadier

4096

Celkové množstvo pamäte

12144GB

Celková kapacita pevných diskov

483.2TB

Massively parellel processing

Massively parellel processing (MPP) znamená spúšťanie zložitých vedeckých výpočtov na viacerých výpočtových uzloch. Na rozdiel od klastrového počítania sú tieto uzly hustejšie integrované a lepšie optimalizované pre distribuované výpočty. Vyššia hustota a množstvo procesorov a rýchlejšie prepojenia medzi výpočtovými uzlami zabezpečujú lepšiu a rýchlejšiu komunikáciu medzi procesmi a vyšší agregovaný výkon. MPP je vhodné pre najzložitejšie vedecké výpočty s veľkým množstvom komunikácie medzi procesmi.

Systém: IBM Power 775

Počet výpočtových jadier: 4096

Pamäť: 32TB

Výpočtová sieť: 5-48GB/s Internal Optical Links, 10GB/s Ethernet prepojenie s úložiskom dát

Kapacita externého úložiska dát: 600TB

Kapacita interného úložiska dát: 300TB

Operačný systém: AIX

pcs

Aurel (IBM Power 775)

Shared memory processing

Shared memory processing (SMP) znamená používanie rôznych implementácii zdieľanej pamäte. Zdieľaná pamäť umožňuje viacerým procesom pristupovať do toho istého pamäťového priestoru, bez použitia siete. SMP úlohy sú obvykle spracovávané na jedinom výpočtovom uzle, kde sú rozdelené na vlákna a paralelizované medzi jednotlivé procesory. Z SMP architektúr ťažia hlavne úlohy, ktoré sú náročné na veľkosť a prístupnosť pamätí, a ktoré používajú paralelizmus na úrovni vlákien.

Typ 1

Systém: IBM Power 755/750

Počet výpočtových uzlov: 18

Procesor: 4x 8-jadrový Power7 3,3GHz

Pamäť na výpočtový uzol: 128GB

Subsystém pevných diskov: 6 x 600GB

Výpočtová sieť: 40GB/s Infiniband

Operačný systém: SUSE 11.3 Linux

Typ 2

Systém: IBM Power 755/750

Počet výpočtových uzlov: 2

Procesor: 4x 8-jadrový Power7 3,3GHz

Pamäť na výpočtový uzol: 256GB

Subsystém pevných diskov: 6 x 600GB

Výpočtová sieť: 40GB/s Infiniband

Operačný systém: SUSE 11.3 Linux

Typ 3

Systém: IBM Power 780

Počet výpočtových uzlov: 1

Procesor: 8x 8-jadrový Power7 3,3GHz

Pamäť na výpočtový uzol: 1024GB

Subsystém pevných diskov: 6 x 600GB

Výpočtová sieť: 40GB/s Infiniband

Operačný systém: SUSE 11.3 Linux