Najvýkonnejšie superpočítače sú zastúpené radom. Najvýkonnejšie superpočítače na svete

Na tretie miesto sa posunul superpočítač K Computer, ktorý predtým obsadil prvé miesto. Jeho výkon je 11,28 Pflops (pozri obrázok 1). Pripomeňme si, že FLOPS (Floating-point Operations Per Second, FLOPS) je jednotka merania výkonu počítača, ktorá ukazuje, koľko operácií s pohyblivou rádovou čiarkou za sekundu je daný výpočtový systém schopný vykonať.

K Computer je spoločným vývojom Inštitútu fyzikálneho a chemického výskumu Rikagaku Kenkiyo (RIKEN) a Fujitsu. Vznikla ako súčasť iniciatívy High-Performance Computing Infrastructure pod vedením japonského ministerstva školstva, kultúry, športu, vedy a technológie (MEXT). Superpočítač je inštalovaný na území Inštitútu pokročilých počítačových vied v japonskom meste Kobe.

Superpočítač je založený na architektúre distribuovanej pamäte. Systém pozostáva z viac ako 80 000 výpočtových uzlov a je umiestnený v 864 stojanoch, z ktorých každý obsahuje 96 výpočtových uzlov a 6 I/O uzlov. Uzly, z ktorých každý obsahuje jeden procesor a 16 GB RAM, sú vzájomne prepojené v súlade s topológiou „šesťrozmernej slučky / torusu“. Systém využíva celkovo 88 128 osemjadrových procesorov SPARC64 VIIIfx (705 024 jadier) vyrobených spoločnosťou Fujitsu pomocou 45 nm technológie.

Tento univerzálny superpočítač poskytuje vysokú úroveň výkonu a podporu pre širokú škálu aplikácií. Systém sa používa na vykonávanie výskumu v oblasti klimatických zmien, prevencie katastrof a medicíny.

Jedinečný systém vodného chladenia znižuje pravdepodobnosť zlyhania zariadenia a znižuje celkovú spotrebu energie. Úspory energie sa dosahujú použitím vysoko účinných zariadení, systému kogenerácie tepla a elektriny a radu solárnych panelov. Mechanizmus opätovného využitia odpadovej vody z chladiča navyše znižuje negatívny dopad na životné prostredie.

Budova, v ktorej sa K Computer nachádza, je odolná voči zemetraseniu a dokáže vydržať zemetrasenia s magnitúdou 6 a viac v japonskej mierke (0-7). Pre efektívnejšie umiestnenie stojanov a káblov zariadení je tretie podlažie s rozmermi 50 × 60 m úplne bez nosných stĺpov. Moderné stavebné technológie umožnili zabezpečiť prijateľnú úroveň zaťaženia (do 1 t/m2) pre inštaláciu regálov, ktorých hmotnosť môže dosiahnuť 1,5 tony.

SEQUOIA SUPERPOČÍTAČ

Superpočítač Sequoia nainštalovaný v Národnom laboratóriu Lawrence Livermore. Lawrence, má výkon 16,32 Pflops a patrí mu druhé miesto v rebríčku (pozri obrázok 2).

Tento petaflop superpočítač, vyvinutý spoločnosťou IBM na základe Blue Gene/Q, bol vytvorený pre americký Národný úrad pre jadrovú bezpečnosť (NNSA) ako súčasť programu Advanced Simulation and Computing.

Systém pozostáva z 96 stojanov a 98 304 výpočtových uzlov (1024 uzlov na stojan). Každý uzol obsahuje 16-jadrový procesor PowerPC A2 a 16 GB DDR3 RAM. Celkovo je použitých 1 572 864 procesorových jadier a 1,6 PB pamäte. Uzly sú navzájom spojené v súlade s topológiou „päťrozmerného torusu“. Plocha, ktorú systém zaberá, je 280 m2. Celková spotreba energie je 7,9 MW.

Superpočítač Sequoia bol prvým na svete, ktorý vykonal vedecké výpočty, ktoré si vyžadovali výpočtový výkon viac ako 10 Pflops. Simulačný systém kozmológie HACC si teda vyžiadal asi 14 Pflops, keď bežal v režime 3,6 bilióna častíc a pri spustení kódu projektu Cardiod na simuláciu elektrofyziológie ľudského srdca dosiahol výkon takmer 12 Pflops.

TITAN SUPERPOČÍTAČ

Superpočítač Titan inštalovaný v Oak Ridge National Laboratory (ORNL) v USA bol uznaný ako najrýchlejší superpočítač na svete. V benchmarkových testoch Linpack bol jeho výkon 17,59 Pflops.

Titan implementuje hybridnú architektúru CPU-GPU (pozri obrázok 3). Systém pozostáva z 18 688 uzlov, pričom každý je vybavený 16-jadrovým procesorom AMD Opteron a grafickým akcelerátorom Nvidia Tesla K20X. Celkovo je použitých 560 640 procesorov. Titan je aktualizáciou predtým prevádzkovaného superpočítača Jaguar ORNL a zaberá rovnaké serverové skrine (celková plocha 404 m2).

Možnosť využívať existujúce napájacie a chladiace systémy ušetrila počas výstavby približne 20 miliónov dolárov. Spotreba energie superpočítača je 8,2 MW, čo je o 1,2 MW viac ako Jaguar, pričom jeho výkon pri operáciách s pohyblivou rádovou čiarkou je takmer 10-krát vyšší.

Titan bude primárne slúžiť na výskum v oblasti materiálovej vedy a jadrovej energie, ako aj na výskum súvisiaci so zlepšovaním účinnosti spaľovacích motorov. Okrem toho sa bude používať na modelovanie zmeny klímy a analýzu potenciálnych stratégií na riešenie jej negatívnych vplyvov.

„NAJZELEnejší“ SUPERPOČÍTAČ

Okrem hodnotenia Top500, zameraného na identifikáciu najvýkonnejšieho systému, existuje hodnotenie Green500, ktoré uznáva „najzelenšie“ superpočítače. Tu sa za základ berie ukazovateľ energetickej účinnosti (Mflops/W). V súčasnosti (najnovšie zverejnené hodnotenie je november 2012) je lídrom Green500 superpočítač Beacon (253. miesto v Top500). Jeho indikátor energetickej účinnosti je 2499 Mflops/W.

Beacon poháňajú koprocesory Intel Xeon Phi 5110P a procesory Intel Xeon E5-2670, takže špičkový výkon môže dosiahnuť 112 200 Gflops pri celkovej spotrebe energie 44,9 kW. Koprocesory Xeon Phi 5110P poskytujú vysoký výkon s nízkou spotrebou energie. Každý koprocesor má výkon 1 teraflop (dvojitá presnosť) a podporuje až 8 GB pamäte GDDR5 so šírkou pásma 320 Gbps.

Pasívny chladiaci systém Xeon Phi 5110P má hodnotu TDP 225 W, čo je ideálne pre servery s vysokou hustotou.

SUPERPOČÍTAČ EURORA

Vo februári 2013 sa však objavili správy, že superpočítač Eurora, ktorý sa nachádza v Bologni (Taliansko), prekonal Beacon v energetickej účinnosti (3150 Mflops/watt oproti 2499 Mflops/W).

Eurora je postavená spoločnosťou Eurotech a pozostáva zo 64 uzlov, z ktorých každý obsahuje dva procesory Intel Xeon E5-2687W, dva GPU akcelerátory Nvidia Tesla K20 a ďalší hardvér. Rozmery takéhoto uzla nepresahujú rozmery notebooku, no ich výkon je 30-krát vyšší a spotreba energie je 15-krát nižšia.

Vysoká energetická účinnosť v Eurore je dosiahnutá použitím niekoľkých technológií. Najväčším prínosom je vodné chladenie. Každý uzol superpočítača je teda akýmsi sendvičom: centrálne zariadenie v spodnej časti, vodný výmenník tepla v strede a ďalšia elektronická jednotka navrchu (pozri obrázok 4).

Takéto vysoké výsledky sa dosahujú vďaka použitiu materiálov s dobrou tepelnou vodivosťou, ako aj rozsiahlej sieti chladiacich kanálov. Pri inštalácii nového výpočtového modulu sú jeho kanály kombinované s kanálmi chladiaceho systému, čo vám umožňuje meniť konfiguráciu superpočítača v závislosti od konkrétnych potrieb. Riziko úniku je podľa výrobcov eliminované.

Prvky superpočítača Eurora sú napájané 48-voltovými jednosmernými zdrojmi, ktorých zavedením sa znížil počet premien energie. Nakoniec sa teplá voda odstránená z výpočtového zariadenia môže použiť na iné účely.

ZÁVER

Odvetvie superpočítačov sa aktívne rozvíja a vytvára stále nové a nové rekordy v oblasti výkonu a energetickej účinnosti. Treba poznamenať, že práve v tomto odvetví, ako nikde inde, sa dnes vo veľkej miere využívajú technológie chladenia kvapalinou a 3D modelovania, keďže špecialisti stoja pred úlohou zostaviť supervýkonný výpočtový systém, ktorý by bol schopný fungovať v obmedzený objem s minimálnymi energetickými stratami.

Jurij Chomutskij- Hlavný projektový inžinier v I-Teco. Možno ho kontaktovať na: [chránený e-mailom]. Článok využíva materiály z internetového portálu o dátových centrách „www.AboutDC.ru - Riešenia pre dátové centrá“.

Domov → História domácej výpočtovej techniky → Superpočítače

Superpočítače

Andrej Borzenko

Superpočítače sú najrýchlejšie počítače. Ich hlavný rozdiel od sálových počítačov je nasledujúci: všetky zdroje takéhoto počítača sú zvyčajne zamerané na čo najrýchlejšie vyriešenie jednej alebo aspoň niekoľkých úloh, zatiaľ čo sálové počítače spravidla vykonávajú pomerne veľké množstvo úloh, ktoré s každým konkurujú. iné. Rýchly rozvoj počítačového priemyslu určuje relativitu základného pojmu – to, čo sa pred desiatimi rokmi dalo nazvať superpočítačom, dnes už pod túto definíciu nespadá. Existuje aj vtipná definícia superpočítača: je to zariadenie, ktoré redukuje problém s počítačom na problém so vstupom a výstupom. Je v tom však kus pravdy: často jedinou prekážkou vo vysokorýchlostnom systéme sú I/O zariadenia. Ktoré superpočítače majú momentálne maximálny výkon, zistíte z oficiálneho zoznamu päťsto najvýkonnejších systémov sveta – Top500 (http://www.top500.org), ktorý vychádza dvakrát ročne.

V každom počítači sú všetky hlavné parametre úzko spojené. Je ťažké si predstaviť univerzálny počítač, ktorý má vysoký výkon a málo RAM, alebo obrovskú RAM a malý priestor na disku. Z tohto dôvodu sa superpočítače v súčasnosti vyznačujú nielen maximálnym výkonom, ale aj maximálnym množstvom pamäte RAM a diskovej pamäte. Poskytovanie takýchto technických charakteristík je dosť drahé - náklady na superpočítače sú extrémne vysoké. Aké úlohy sú také dôležité, že vyžadujú systémy, ktoré stoja desiatky alebo stovky miliónov dolárov? Spravidla ide o zásadné vedecké alebo inžinierske výpočtové problémy so širokým spektrom aplikácií, ktorých efektívne riešenie je možné len s dostupnosťou výkonných výpočtových zdrojov. Tu je len niekoľko oblastí, kde tento typ problému vzniká:

  • predpovede počasia, klímy a globálnych zmien v atmosfére;
  • veda o materiáloch;
  • konštrukcia polovodičových zariadení;
  • supravodivosť;
  • štrukturálna biológia;
  • vývoj liečiv;
  • ľudská genetika;
  • kvantová chromodynamika;
  • astronómia;
  • automobilový priemysel;
  • dopravné úlohy;
  • hydro- a plynová dynamika;
  • riadená termonukleárna fúzia;
  • účinnosť systémov spaľovania paliva;
  • prieskum ropy a zemného plynu;
  • výpočtové problémy v oceánskych vedách;
  • rozpoznávanie a syntéza reči;
  • rozpoznávanie obrazu.

Superpočítače kalkulujú veľmi rýchlo nielen vďaka použitiu najmodernejšej základne prvkov, ale aj novým riešeniam v architektúre systému. Hlavné miesto tu zaujíma princíp paralelného spracovania údajov, ktorý stelesňuje myšlienku súčasného (paralelného) vykonávania niekoľkých akcií. Paralelné spracovanie má dva typy: potrubie a skutočný paralelizmus. Podstatou spracovania potrubia je zvýrazniť jednotlivé fázy vykonávania všeobecnej operácie a každá fáza po dokončení svojej práce odovzdá výsledok ďalšej fáze, pričom súčasne prijíma novú časť vstupných údajov. Zrejmé zvýšenie rýchlosti spracovania sa dosiahne kombináciou predtým rozmiestnených operácií.

Ak určité zariadenie vykoná jednu operáciu za jednotku času, potom vykoná tisíc operácií za tisíc jednotiek. Ak existuje päť rovnakých nezávislých zariadení schopných pracovať súčasne, potom systém piatich zariadení môže vykonať rovnakých tisíc operácií nie za tisíc, ale za dvesto jednotiek času. Podobne systém N zariadení vykoná rovnakú prácu za 1000/N jednotiek času.

Samozrejme, dnes už len málokto prekvapí paralelizmus v počítačovej architektúre. Všetky moderné mikroprocesory používajú určitú formu paralelného spracovania, dokonca aj v rámci toho istého čipu. Zároveň sa tieto myšlienky objavili už veľmi dávno. Spočiatku boli implementované v najvyspelejších, a teda samostatných počítačoch svojej doby. Špeciálny kredit tu patrí spoločnostiam IBM a Control Data Corporation (CDC). Hovoríme o takých inováciách, ako sú bit-paralelná pamäť, bit-paralelná aritmetika, nezávislé vstupno/výstupné procesory, príkazový kanál, funkčné jednotky nezávislé na potrubí atď.

Slovo „superpočítač“ sa zvyčajne spája s počítačmi Cray, hoci dnes tomu tak nie je. Vývojárom a hlavným dizajnérom prvého superpočítača bol Seymour Cray, jedna z najlegendárnejších postáv počítačového priemyslu. V roku 1972 opustil CDC a založil vlastnú spoločnosť Cray Research. Prvý superpočítač, CRAY-1, bol vyvinutý o štyri roky neskôr (v roku 1976) a mal vektorovo-potrubnú architektúru s 12 zreťazenými funkčnými jednotkami. Špičkový výkon Cray-1 bol 160 MT/s (čas hodín 12,5 ns) a 64-bitová pamäť RAM (ktorá sa dala rozšíriť na 8 MB) mala čas cyklu 50 ns. Hlavnou inováciou bolo, samozrejme, zavedenie vektorových príkazov, ktoré pracujú s celými poľami nezávislých dát a umožňujú efektívne využitie pipeline funkčných zariadení.

Počas 60-80 rokov sa pozornosť svetových lídrov vo výrobe superpočítačov sústreďovala na výrobu výpočtových systémov, ktoré boli dobré pri riešení veľkoobjemových problémov s pohyblivou rádovou čiarkou. O takéto úlohy nebola núdza – takmer všetky súviseli s jadrovým výskumom a modelovaním letectva a boli vykonávané v záujme armády. Snaha dosiahnuť maximálny výkon v čo najkratšom čase spôsobila, že kritériom hodnotenia kvality systému nebola jeho cena, ale výkon. Napríklad superpočítač Cray-1 vtedy stál od 4 do 11 miliónov dolárov v závislosti od konfigurácie.

Na prelome 80.-90. Skončila sa studená vojna a vojenské zákazky nahradili obchodné. V tom čase priemysel urobil veľký pokrok vo výrobe sériových procesorov. Mali približne rovnaký výpočtový výkon ako zákazkové, no boli výrazne lacnejšie. Použitie štandardných komponentov a variabilný počet procesorov umožnilo vyriešiť problém škálovateľnosti. Teraz, keď sa zvýšila výpočtová záťaž, bolo možné zvýšiť výkon superpočítača a jeho periférnych zariadení pridaním nových procesorov a I/O zariadení. V roku 1990 sa teda objavil superpočítač Intel iPSC/860 s počtom procesorov rovným 128, ktorý v teste LINPACK ukázal výkon 2,6 Gflops.

Vlani v novembri vyšlo 18. vydanie zoznamu 500 najvýkonnejších počítačov sveta – Top500. Lídrom zoznamu je stále spoločnosť IBM Corporation (http://www.ibm.com), ktorá vlastní 32 % nainštalovaných systémov a 37 % celkovej produktivity. Zaujímavou správou bol nástup spoločnosti Hewlett-Packard na druhé miesto v počte systémov (30 %). Navyše, keďže všetky tieto systémy sú relatívne malé, ich celkový výkon je len 15 % z celého zoznamu. Po zlúčení so spoločnosťou Compaq sa očakáva, že nová spoločnosť bude v zozname dominovať. Ďalšími z hľadiska počtu počítačov na zozname sú SGI, Cray a Sun Microsystems.

Najvýkonnejším superpočítačom na svete bol stále systém ASCI White (k nemu sa ešte vrátime), inštalovaný v Livermore Laboratory (USA) a vykazujúci výkon 7,2 Tflops v teste LINPACK (58 % špičkového výkonu). Na druhom mieste sa umiestnil systém Compaq AlphaServer SC inštalovaný v Pittsburgh Supercomputing Center s výkonom 4 Tflops. Systém Cray T3E uzatvára zoznam s výkonom LINPACK 94 Gflops.

Za zmienku stojí, že zoznam už obsahoval 16 systémov s výkonom nad 1 teraflop, z ktorých polovicu nainštalovala IBM. Počet systémov, ktoré sú zhlukmi malých blokov SMP, sa neustále zvyšuje – v súčasnosti je na zozname 43 takýchto systémov. Väčšinu zoznamu však stále tvoria masívne paralelné systémy (50 %), po ktorých nasledujú klastre pozostávajúce z veľkých systémov SMP (29 %).

Typy architektúr

Hlavným parametrom pre klasifikáciu paralelných počítačov je prítomnosť zdieľanej alebo distribuovanej pamäte. Niečo medzi tým sú architektúry, kde je pamäť fyzicky distribuovaná, ale logicky zdieľaná. Z hardvérového hľadiska sa na implementáciu paralelných systémov navrhujú dve hlavné schémy. Prvým je niekoľko samostatných systémov s lokálnou pamäťou a procesormi, ktoré v určitom prostredí interagujú posielaním správ. Druhým sú systémy, ktoré interagujú prostredníctvom zdieľanej pamäte. Bez toho, aby sme teraz zachádzali do technických detailov, povedzme si pár slov o typoch architektúr moderných superpočítačov.

Myšlienka masívne paralelných systémov s distribuovanou pamäťou (Massively Parallel Processing, MPP) je pomerne jednoduchá. Na tento účel sa berú bežné mikroprocesory, z ktorých každý je vybavený vlastnou lokálnou pamäťou a je pripojený cez nejaké spínacie médium. Takáto architektúra má veľa výhod. Ak potrebujete vysoký výkon, môžete pridať ďalšie procesory a ak sú financie obmedzené alebo je vopred známy požadovaný výpočtový výkon, potom je ľahké zvoliť optimálnu konfiguráciu. MPP má však aj nevýhody. Faktom je, že interakcia medzi procesormi je oveľa pomalšia ako spracovanie údajov samotnými procesormi.

V paralelných počítačoch so zdieľanou pamäťou je všetka pamäť RAM zdieľaná medzi niekoľkými rovnakými procesormi. To odstraňuje problémy predchádzajúcej triedy, ale pridáva nové. Faktom je, že počet procesorov s prístupom k zdieľanej pamäti nemôže byť z čisto technických dôvodov veľký.

Hlavnými znakmi vektorovo-pipeline počítačov sú samozrejme pipeline funkčné jednotky a súbor vektorových inštrukcií. Na rozdiel od tradičného prístupu vektorové príkazy fungujú na celých poliach nezávislých údajov, čo umožňuje efektívne načítanie dostupných potrubí.

Posledný smer, prísne vzaté, nie je nezávislý, ale skôr kombináciou predchádzajúcich troch. Výpočtový uzol sa skladá z niekoľkých procesorov (tradičných alebo vektorových) a ich spoločnej pamäte. Ak získaný výpočtový výkon nestačí, niekoľko uzlov sa kombinuje s vysokorýchlostnými kanálmi. Ako viete, takáto architektúra sa nazýva klaster.

MPP systémy

Masívne paralelné škálovateľné systémy sú navrhnuté tak, aby riešili aplikačné problémy, ktoré si vyžadujú veľké množstvo výpočtov a spracovania dát. Poďme sa na ne pozrieť bližšie. Spravidla pozostávajú z homogénnych výpočtových uzlov vrátane:

  • jedna alebo viac centrálnych procesorových jednotiek;
  • lokálna pamäť (priamy prístup do pamäte iných uzlov nie je možný);
  • komunikačný procesor alebo sieťový adaptér;
  • niekedy pevné disky a/alebo iné vstupno/výstupné zariadenia.

Okrem toho je možné do systému pridať špeciálne I/O uzly a riadiace uzly. Všetky sú prepojené cez nejaké komunikačné médium (vysokorýchlostná sieť, prepínač atď.). Pokiaľ ide o OS, existujú dve možnosti. V prvom prípade beží plnohodnotný OS iba na riadiacom stroji, pričom každý uzol beží značne zredukovanú verziu OS, ktorá zabezpečuje iba prevádzku vetvy paralelnej aplikácie, ktorá sa v ňom nachádza. V inom prípade na každom uzle beží plnohodnotný OS podobný UNIX.

Počet procesorov v distribuovaných pamäťových systémoch je teoreticky neobmedzený. Pomocou takýchto architektúr je možné vybudovať škálovateľné systémy, ktorých výkon lineárne rastie s počtom procesorov. Mimochodom, samotný výraz „masívne paralelné systémy“ sa zvyčajne používa na označenie takýchto škálovateľných počítačov s veľkým počtom (desiatkami a stovkami) uzlov. Škálovateľnosť výpočtového systému je potrebná na úmerné zrýchlenie výpočtov, ale, bohužiaľ, nestačí. Na získanie adekvátneho zisku pri riešení problému je tiež potrebný škálovateľný algoritmus, ktorý dokáže zaťažiť všetky procesory superpočítača užitočnými výpočtami.

Pripomeňme si, že existujú dva modely vykonávania programu na viacprocesorových systémoch: SIMD (single inštrukcie stream - multiple data streams) a MIMD (multiple instruction streams - multiple data streams). Prvý predpokladá, že všetky procesory vykonávajú rovnaký príkaz, ale každý na vlastných údajoch. V druhom prípade každý procesor spracováva svoj vlastný tok príkazov.

V distribuovaných pamäťových systémoch je na prenos informácií z procesora do procesora potrebný mechanizmus na odovzdávanie správ cez sieť spájajúcu výpočtové uzly. Na abstrahovanie od detailov fungovania komunikačného zariadenia a programu na vysokej úrovni sa zvyčajne používajú knižnice odovzdávania správ.

Superpočítače Intel

Spoločnosť Intel Corporation (http://www.intel.com) je vo svete superpočítačov dobre známa. Jeho multiprocesorové počítače Paragon s distribuovanou pamäťou sa stali takými klasickými ako počítače Cray Research s vektorovým potrubím.

Intel Paragon využíva päť procesorov i860 XP s taktovacou frekvenciou 50 MHz v jednom uzle. Niekedy sú v jednom uzle umiestnené procesory rôznych typov: skalárny, vektorový a komunikačný. Ten slúži na odbremenenie hlavného procesora od vykonávania operácií súvisiacich s prenosom správ.

Najvýznamnejšou charakteristikou novej paralelnej architektúry je typ komunikačného zariadenia. Závisia od toho dva najdôležitejšie ukazovatele fungovania superpočítača: rýchlosť prenosu dát medzi procesormi a réžia prenosu jednej správy.

Prepojenie je navrhnuté tak, aby poskytovalo vysokú rýchlosť odosielania správ s minimálnou latenciou. Poskytuje spojenie viac ako tisícky heterogénnych uzlov pozdĺž dvojrozmernej obdĺžnikovej mriežkovej topológie. Pre väčšinu vývoja aplikácií však môže byť akýkoľvek uzol považovaný za priamo spojený so všetkými ostatnými uzlami. Prepojenie je škálovateľné: jeho priepustnosť sa zvyšuje s počtom uzlov. Pri navrhovaní sa vývojári snažili minimalizovať účasť na prenose správ tých procesorov, ktoré vykonávajú používateľské procesy. Na tento účel boli zavedené špeciálne procesory na spracovanie správ, ktoré sú umiestnené na doske uzla a sú zodpovedné za spracovanie protokolu správ. Výsledkom je, že hlavné procesory uzlov nie sú odvádzané od riešenia problému. Najmä nedochádza k drahému prepínaniu z úlohy na úlohu a riešenie aplikovaných problémov prebieha súbežne s výmenou správ.

Samotný prenos správ je realizovaný smerovacím systémom založeným na komponentoch smerovača sieťových uzlov (Mesh Router Components, MRC). Pre prístup MRC daného uzla do jeho pamäte má uzol aj špeciálny sieťový radič rozhrania, čo je vlastný VLSI, ktorý zabezpečuje simultánny prenos do a z pamäte uzla, ako aj monitorovanie chýb počas prenosu správ.

Modulárny dizajn Intel Paragon umožňuje viac než len podporu škálovateľnosti. Umožňuje nám to počítať s tým, že táto architektúra bude slúžiť ako základ pre nové počítače založené na iných mikroprocesoroch alebo využívajúce nové technológie zasielania správ. Škálovateľnosť sa tiež spolieha na vyváženie rôznych blokov superpočítača na rôznych úrovniach; v opačnom prípade sa pri zvyšovaní počtu uzlov môže niekde v systéme objaviť úzke miesto. Rýchlosť a kapacita pamäte uzlov sú teda v rovnováhe so šírkou pásma a latenciou prepojenia a výkon procesorov vo vnútri uzlov je vyvážený so šírkou pásma vyrovnávacej pamäte a RAM atď.

Až donedávna bol jedným z najrýchlejších počítačov Intel ASCI Red – nápadom Accelerated Strategic Computing Initiative ASCI (Accelerated Strategic Computing Initiative). Na tomto programe sa podieľajú tri najväčšie národné laboratóriá USA (Livermore, Los Alamos a Sandia). ASCI Red, postavený pre Ministerstvo energetiky USA v roku 1997, kombinuje 9152 procesorov Pentium Pro, má 600 GB celkovej pamäte RAM a celkový výkon 1800 miliárd operácií za sekundu.

Superpočítače IBM

Keď sa na trhu počítačov objavili univerzálne systémy so škálovateľnou paralelnou architektúrou SP (Scalable POWER parallel) od IBM Corporation (http://www.ibm.com), rýchlo si získali obľubu. Dnes takéto systémy fungujú v rôznych oblastiach použitia, ako je výpočtová chémia, analýza nehôd, návrh elektronických obvodov, seizmická analýza, modelovanie nádrží, podpora rozhodovania, analýza údajov a online spracovanie transakcií. Úspech systémov SP je určený predovšetkým ich všestrannosťou, ako aj flexibilitou architektúry, založenej na modeli distribuovanej pamäte s odovzdávaním správ.

Všeobecne povedané, superpočítač SP je škálovateľný, masívne paralelný univerzálny výpočtový systém pozostávajúci zo sady základňových staníc RS/6000 prepojených vysokovýkonným prepínačom. Naozaj, kto by nepoznal napríklad superpočítač Deep Blue, ktorý dokázal poraziť Garryho Kasparova v šachu? Jedna z jeho modifikácií však pozostáva z 32 uzlov (IBM RS/6000 SP), založených na 256 procesoroch P2SC (Power Two Super Chip).

Rodina RS/6000 je druhá generácia počítačov IBM, založená na architektúre obmedzeného inštrukčného súboru (RISC) vyvinutej spoločnosťou koncom sedemdesiatych rokov. S týmto konceptom sa na vykonanie všetkej práce v počítačovom systéme používa veľmi jednoduchá sada príkazov. Pretože sú príkazy jednoduché, môžu byť vykonávané veľmi vysokou rýchlosťou a tiež poskytujú efektívnejšiu implementáciu spustiteľného programu. Rodina RS/6000 je založená na architektúre POWER (Performance Optimized by Advanced RISC architecture) a jej derivátoch – PowerPC, P2SC, POWER3 atď. Pretože architektúra POWER kombinuje koncepcie architektúry RISC s niektorými tradičnejšími koncepciami, výsledkom je systém s optimálny celkový výkon.

Systém RS/6000 SP poskytuje výkon viacerých procesorov na riešenie najzložitejších výpočtových problémov. Prepínací systém SP je najnovšou inováciou IBM v oblasti medziprocesorovej komunikácie s vysokou šírkou pásma a bez latencie pre efektívne paralelné výpočty. Niekoľko typov uzlov procesora, variabilné veľkosti rámca (rack) a množstvo ďalších I/O schopností zaisťuje výber najvhodnejšej systémovej konfigurácie. SP je podporovaný poprednými dodávateľmi softvéru v oblastiach, ako sú paralelné databázy a spracovanie transakcií v reálnom čase, ako aj hlavní dodávatelia technického softvéru v oblastiach, ako je seizmické spracovanie a inžiniersky dizajn.

IBM RS/6000 SP vylepšuje aplikačné možnosti pomocou paralelného spracovania. Systém odstraňuje obmedzenia výkonu a pomáha predchádzať problémom spojeným so škálovaním a prítomnosťou nedeliteľných, samostatne vykonávaných fragmentov. S viac ako tisíckou zákazníkov nainštalovaných po celom svete poskytujú poskytovatelia služieb riešenia pre zložité a veľkoobjemové technické a komerčné aplikácie.

Hlavná jednotka SP je procesorový uzol, ktorý má architektúru pracovnej stanice RS/6000. Existuje niekoľko typov uzlov SP: Thin, Wide, High, líšia sa množstvom technických parametrov. Napríklad vysoké uzly založené na POWER3-II zahŕňajú až 16 procesorov a až 64 GB pamäte, ale tenké uzly nepovoľujú viac ako 4 procesory a 16 GB pamäte.

Systém je škálovateľný až na 512 uzlov a je možné kombinovať rôzne typy uzlov. Uzly sú inštalované v stojanoch (až 16 uzlov v každom). SP dokáže škálovať disky takmer lineárne spolu s procesormi a pamäťou, čo umožňuje skutočný prístup k terabajtom pamäte. Toto zvýšenie výkonu uľahčuje budovanie a rozširovanie systému.

Uzly sú vzájomne prepojené vysokovýkonným prepínačom (IBM high-performance switch), ktorý má viacstupňovú štruktúru a pracuje s prepínaním paketov.

Na každom uzle SP beží úplný operačný systém AIX, ktorý vám umožňuje využívať tisíce už existujúcich aplikácií AIX. Okrem toho je možné uzly systému kombinovať do skupín. Napríklad niekoľko uzlov môže fungovať ako servery Lotus Notes, zatiaľ čo všetky ostatné spracovávajú paralelnú databázu.

Správa veľkých systémov je vždy náročná úloha. SP na tento účel používa jedinú grafickú konzolu, ktorá zobrazuje stavy hardvéru a softvéru, spustené úlohy a informácie o používateľovi. Správca systému pomocou takejto konzoly (riadiacej pracovnej stanice) a softvérového produktu PSSP (Parallel Systems Support Programs) pripojeného k SP rieši úlohy správy vrátane správy ochrany heslom a používateľských oprávnení, účtovania vykonaných úloh, správy tlače, monitorovania systému. , spustenie a vypnutie systému.

Najlepší

Ako už bolo uvedené, podľa Top500 (tabuľka) je najvýkonnejším superpočítačom súčasnosti ASCI White, ktorý zaberá plochu veľkosti dvoch basketbalových ihrísk a je inštalovaný v Livermore National Laboratory. Zahŕňa 512 SMP uzlov založených na 64-bitových procesoroch POWER3-II (celkovo 8192 procesorov) a využíva novú komunikačnú technológiu Colony s priepustnosťou približne 500 MB/s, čo je takmer štyrikrát rýchlejšie ako vysokovýkonný SP. prepínač.

Desať najlepších 500 (18. vydanie)

pozícia Výrobca Počítač Kde je nainštalovaný Krajina rok Počet procesorov
1 IBM ASCI biela USA 2000 8192
2 Compaq AlphaServer SC Pittsburghské superpočítačové centrum USA 2001 3024
3 IBM SP Power3 Výskumný ústav energie NERSC USA 2001 3328
4 Intel ASCI červená Národné laboratórium Sandia USA 1999 9632
5 IBM ASCI Blue Pacific Národné laboratórium v ​​Livermore USA 1999 5808
6 Compaq AlphaServer SC USA 2001 1536
7 Hitachi SR8000/MPP Tokijská univerzita Japonsko 2001 1152
8 SGI ASCI Modrá hora Národné laboratórium Los Alamos USA 1998 6144
9 IBM SP Power3 Oceánografické centrum NAVOCEANO USA 2000 1336
10 IBM SP Power3 Nemecká meteorologická služba Nemecko 2001 1280

Architektúra nového superpočítača je založená na osvedčenej masívne paralelnej architektúre RS/6000 a poskytuje výkon 12,3 teraflopov (bilión operácií za sekundu). Systém obsahuje celkovo 8 TB pamäte RAM rozloženej medzi 16-procesorové uzly SMP a 160 TB diskovej pamäte. Dodanie systému z laboratórií IBM v štáte New York do Livermore v Kalifornii si vyžiadalo 28 návesov.

Všetky uzly systému bežia na OS AIX. Tento superpočítač používajú vedci z amerického ministerstva energetiky na spustenie zložitých 3D modelov, aby boli jadrové zbrane v bezpečí. ASCI White je vlastne tretím krokom v päťstupňovom programe ASCI, ktorý plánuje vytvoriť nový superpočítač v roku 2004. Vo všeobecnosti ASCI White pozostáva z troch samostatných systémov, z ktorých White je najväčší (512 uzlov, 8192 procesorov), a je tu aj Ice (28 uzlov, 448 procesorov) a Frost (68 uzlov, 1088 procesorov).

Predchodcom ASCI White bol superpočítač Blue Pacific (iný názov pre ASCI Blue), ktorý obsahoval 1464 štvorprocesorových uzlov založených na kryštáloch PowerPC 604e/332 MHz. Uzly sú spojené do jedného systému pomocou káblov v celkovej dĺžke takmer päť míľ a plocha počítačovej miestnosti je 8 tisíc štvorcových stôp. Systém ASCI Blue pozostáva celkovo z 5856 procesorov a poskytuje špičkový výkon 3,88 teraflopov. Celková veľkosť pamäte RAM je 2,6 TB.

Superpočítač pozostáva z kilometrov káblov.

Americké Národné centrum pre výskum atmosféry (NCAR) vybralo IBM za dodávateľa najvýkonnejšieho superpočítača na svete určeného na predpovedanie klimatických zmien. Systém, známy ako Blue Sky, pri plnej prevádzke v tomto roku rádovo zvýši možnosti modelovania klímy NCAR. Jadrom Blue Sky bude superpočítač IBM SP a systémy IBM eServer p690, ktorých použitím sa dosiahne špičkový výkon takmer 7 Tflops pri objeme diskového subsystému IBM SSA 31,5 TB.

Superpočítač s názvom Blue Storm vzniká na objednávku Európskeho centra pre strednodobé predpovede počasia (ECMWF). Blue Storm bude dvakrát výkonnejší ako ASCI White. Na jeho vytvorenie potrebujete 100 serverov IBM eServer p690, známych aj ako Regatta. Každá systémová jednotka s veľkosťou chladničky obsahuje viac ako tisíc procesorov. V roku 2004 bude Blue Storm vybavený servermi novej generácie p960, vďaka ktorým bude dvakrát výkonnejší. Na superpočítači bude fungovať operačný systém AIX. Na začiatku bude celková kapacita diskov Blue Storm 1,5 petabajtu a výpočtový výkon bude približne 23 teraflopov. Systém bude vážiť 130 ton a bude 1700-krát výkonnejší ako šachový superpočítač Deep Blue.

Výskumníci IBM spolupracujú s Livermore National Laboratory na počítačoch Blue Gene/L a Blue Gene/C. Tieto počítače sú súčasťou 5-ročného projektu Blue Gene, ktorý sa začal v roku 1999 skúmať proteíny, do ktorého sa investovalo 100 miliónov dolárov. Vytvorenie nového superpočítača Blue Gene/L (200 teraflopov) bude dokončené v roku 2004 – pre. šesť mesiacov - o rok skôr ako sa očakávalo ukončenie prác na výkonnejšom počítači Blue Gene/C (1000 teraflopov). Dizajnový výkon Blue Gene/L tak prekoná kombinovaný výkon 500 najvýkonnejších počítačov sveta. Nový superpočítač zároveň zaberá plochu rovnajúcu sa len polovici tenisového kurtu. Inžinieri IBM pracovali aj na znížení spotreby energie – podarilo sa im ju znížiť 15-krát.

Poznámky

Testy LINPACK.
Benchmarky LINPACK sú založené na riešení systému lineárnych rovníc s hustou maticou koeficientov v poli reálnych čísel pomocou Gaussovej eliminácie. Reálne čísla sú zvyčajne reprezentované s plnou presnosťou. Vzhľadom na veľký počet operácií na reálnych číslach sú výsledky LINPACK považované za meradlo výkonu hardvérových a softvérových konfigurácií v oblastiach, ktoré intenzívne využívajú zložité matematické výpočty.

Simulátor Zeme.
Podľa magazínu New Scientist sa v novej, 19. verzii rebríčka Top500 superpočítačov umiestni na prvom mieste superpočítačový systém pre projekt Earth Simulator spoločnosti NEC Corporation. Je inštalovaný v Japonskom inštitúte vied o Zemi (Yokohamský inštitút pre vedy o Zemi) v Kanagawa v prefektúre Jokohama. Vývojári tvrdia, že jeho maximálny výkon môže dosiahnuť 40 Tflops.

Superpočítač Earth Simulator je navrhnutý tak, aby simuloval zmenu klímy na základe údajov získaných zo satelitov. Podľa predstaviteľov NEC je vysoký výkon počítača dosiahnutý použitím špeciálne navrhnutých vektorových procesorov. Systém je založený na 5120 takýchto procesoroch kombinovaných do 640 uzlov SX-6 (každý 8 procesorov). Na superpočítači beží SUPER-UX OS. Vývojové nástroje zahŕňajú kompilátory pre jazyky C/C++, Fortran 90 a HPF, ako aj nástroje na automatickú vektorizáciu, implementáciu rozhrania MPI-2 a matematickú knižnicu ASL/ES. Celý stroj zaberá plochu troch tenisových kurtov (50 x 65 m) a využíva niekoľko kilometrov kábla.


Prvý superpočítač Atlas sa objavil na začiatku 60. rokov a bol inštalovaný na univerzite v Manchestri. Bol niekoľkonásobne menej výkonný ako moderné domáce počítače. Naša recenzia obsahuje „desať“ najvýkonnejších superpočítačov v histórii. Pravda, vďaka rýchlo sa rozvíjajúcim technológiám v tejto oblasti tieto výkonné stroje zastarávajú v priemere za 5 rokov.

Výkon moderných superpočítačov sa meria v petaflopoch, jednotke merania, ktorá ukazuje, koľko operácií s pohyblivou rádovou čiarkou môže počítač vykonať za sekundu. Dnes si povieme niečo o desiatich najdrahších moderných superpočítačoch.

1. IBM Roadrunner (USA)


130 miliónov dolárov
Roadrunner postavila IBM v roku 2008 pre Národné laboratórium Los Alamos (Nové Mexiko, USA). Stal sa prvým počítačom na svete, ktorého priemerný prevádzkový výkon presiahol 1 petaflop. Zároveň bol navrhnutý na maximálny výkon 1,7 petaflops. Podľa zoznamu Supermicro Green500 bol Roadrunner v roku 2008 štvrtým energeticky najefektívnejším superpočítačom na svete. Roadrunner bol vyradený 31. marca 2013, potom ho nahradil menší, energeticky efektívnejší superpočítač Cielo.

2. Vulcan BlueGene/Q (USA)


100 miliónov dolárov
Vulcan je superpočítač pozostávajúci z 24 samostatných rackových jednotiek, ktorý vyrobila spoločnosť IBM pre ministerstvo energetiky a nainštalovala ho v Národnom laboratóriu Lawrence Livermore v Kalifornii. Má špičkový výkon 5 petaflopov a v súčasnosti je deviatym najrýchlejším superpočítačom na svete. Vulcan vstúpil do služby v roku 2013 a teraz ho používa Národné laboratórium v ​​Livermore na výskum v oblasti biológie, fyziky plazmy, klimatických zmien, molekulárnych systémov a ďalších.

3. SuperMUC (Nemecko)

111 miliónov dolárov
SuperMUC je momentálne 14. najrýchlejší superpočítač na svete. V roku 2013 to bolo 10. miesto, no technologický vývoj nezaháľa. V súčasnosti je však druhým najrýchlejším superpočítačom v Nemecku. SuperMUC prevádzkuje Leibnizovo superpočítačové centrum pri Bavorskej akadémii vied neďaleko Mníchova.

Systém bol vytvorený spoločnosťou IBM, beží na Linuxe, obsahuje viac ako 19 000 procesorov Intel a Westmere-EX a má špičkový výkon niečo cez 3 petaflopy. SuperMUC používajú európski výskumníci v oblasti medicíny, astrofyziky, kvantovej chromodynamiky, výpočtovej dynamiky tekutín, výpočtovej chémie, analýzy genómu a modelovania zemetrasení.

4. Trinity (USA)

174 miliónov dolárov
Dalo by sa očakávať, že takýto superpočítač (vzhľadom na to, na čo je stavaný) bude šialene drahý, ale pokroky v technológii umožnili znížiť cenu Trinity. Americká vláda má v úmysle použiť Trinity na udržanie efektívnosti a bezpečnosti amerického jadrového arzenálu.

Trinity, v súčasnosti vo výstavbe, bude spoločným projektom medzi národným laboratóriom Sandia a národným laboratóriom Los Alamos ako súčasť programu prediktívneho modelovania a výpočtovej vedy Národného úradu pre jadrovú bezpečnosť.

5. Sequoia BlueGene/Q (USA)


250 miliónov dolárov
Superpočítač Sequoia BlueGene/Q triedy bol vyvinutý spoločnosťou IBM pre Národnú správu jadrovej bezpečnosti ako súčasť svojho programu Predictive Modeling and Computational Data Processing. Do prevádzky bol uvedený v júni 2012 v Livermore National Laboratory a stal sa v tom čase najrýchlejším superpočítačom na svete. Teraz je na treťom mieste na svete v rýchlosti (teoretický maximálny výkon Sequoia je 20 petaflopov alebo 20 biliónov výpočtov za sekundu).

Počítač pracuje stabilne pri 10 petaflopoch. Používa ho Sequoia na podporu rôznych vedeckých aplikácií, štúdium astronómie, energetiky, ľudského genómu, klimatických zmien a vývoja jadrových zbraní.

6. ASC Purple a BlueGene / L (USA)


290 miliónov dolárov
Tieto dva superpočítače spolupracovali. Boli vyrobené spoločnosťou IBM a nainštalované v roku 2005 v Livermore National Laboratory. V roku 2010 boli vyradené z prevádzky. V čase svojho vzniku bol ASC Purple v rýchlosti na 66. mieste v rebríčku top 500 superpočítačov a BlueGene/L bola predchádzajúca generácia modelu BlueGene/Q.

ASCI Purple bol vytvorený pre piatu fázu programu Prediktívneho modelovania a spracovania údajov Ministerstva energetiky USA a Národného úradu pre jadrovú bezpečnosť. Jeho účelom bolo simulovať a nahradiť skutočné testy zbraní hromadného ničenia. BlueGene/L sa použil na predpovedanie globálnej zmeny klímy.

7. Sierra a Summit (USA)


325 miliónov dolárov
Nvidia a IBM čoskoro pomôžu Amerike znovu získať vedúcu pozíciu v ultrarýchlych superpočítačových technológiách, vedeckom výskume a ekonomickej a národnej bezpečnosti. Oba počítače budú dokončené v roku 2017.

V súčasnosti je najrýchlejším superpočítačom na svete čínsky Tianhe-2, ktorý je schopný dosiahnuť 55 petaflopov, čo je dvakrát rýchlejšie ako zariadenie na druhom mieste v zozname. Sierra vyrobí viac ako 100 petaflopov, zatiaľ čo Summit bude schopný dosiahnuť 300 petaflopov.

Sierra, ktorá bude inštalovaná v Livermore National Laboratory, zabezpečí bezpečnosť a efektívnosť národného jadrového programu. Summit nahradí starnúci superpočítač Titan v Oak Ridge National Laboratory a bude navrhnutý tak, aby testoval a podporoval vedecké aplikácie po celom svete.

8. Tianhe-2 (Čína)

390 miliónov dolárov
Čínsky Tianhe-2 (čo v preklade znamená „Mliečna dráha 2“) je najrýchlejší superpočítač na svete. Počítač, ktorý vyvinul tím 1300 vedcov a inžinierov, sa nachádza v Národnom superpočítačovom centre v Guangzhou. Postavila ho Čínska ľudová oslobodzovacia armáda obrannej vedeckej a technologickej univerzity. Tianhe-2 je schopný vykonávať 33 860 biliónov výpočtov za sekundu. Napríklad jedna hodina výpočtov na superpočítači sa rovná 1 000 rokom práce 1,3 miliardy ľudí. Stroj sa používa na modelovanie a analýzu vládnych bezpečnostných systémov.

9. Simulátor Zeme (Japonsko)


500 miliónov dolárov
Earth Simulator bol vyvinutý japonskou vládou už v roku 1997. Náklady na projekt sú 60 miliárd jenov alebo približne 500 miliónov dolárov.

ES bol najrýchlejší superpočítač na svete v rokoch 2002 až 2004 a dodnes slúži na prácu s globálnymi klimatickými modelmi, posudzovanie vplyvov globálneho otepľovania a posudzovanie problémov v geofyzike zemskej kôry.

10. Fujitsu K (Japonsko)

1,2 miliardy dolárov
Najdrahší superpočítač na svete je len štvrtý najrýchlejší na svete (11 petaflopov). V roku 2011 to bol najrýchlejší superpočítač na svete. Fujitsu K so sídlom v RIKEN Institute of Advanced Computing Technology je približne 60-krát rýchlejší ako Earth Simulator. Jeho údržba stojí približne 10 miliónov dolárov ročne a superpočítač spotrebuje 9,89 MW (rovnaké množstvo elektriny, ktoré používa 10 000 vidieckych domov alebo jeden milión osobných počítačov).

Stojí za zmienku, že moderní vedci zašli tak ďaleko, že sa už objavili.

V posledných rokoch neúnavne pracujú spoločnosti zaoberajúce sa návrhom a výrobou počítačov. Výsledkom je, že množstvo technológií vo svete exponenciálne rastie.

Najvýkonnejšie počítače

Len nedávno svet nevedel o DirectX10 a grafika FarCry či NFS Underground 2 sa zdala byť vrcholom počítačových možností. Kedysi sa disk schopný uložiť 600 megabajtov informácií zdal ako zázrak technológie, no dnes sú voľne dostupné terabajtové pamäťové karty.

V oblasti superpočítačov sa deje takmer to isté. V roku 1993 profesor University of Tennessee Jack Dongarra prišiel s myšlienkou vytvoriť rebríček najvýkonnejších počítačov na svete. Odvtedy sa tento zoznam s názvom TOP500 aktualizuje dvakrát ročne: v júni a novembri.

Čas plynie a lídri v hodnotení superpočítačov zo začiatku 90. rokov sú už bezbožne zastaraní aj podľa štandardov bežných používateľov PC. Prvým v roku 1993 bol teda CM-5/1024, zostavený spoločnosťou Thinking Machines: procesory 1024 s taktovacou frekvenciou 32 MHz, výpočtovou rýchlosťou 59,7 gigaflops – o niečo rýchlejšie ako bežné 8-jadrové PC pod vaším stolom. Aký je dnes najlepší počítač?


Sunway TaihuLight

Ešte pred piatimi rokmi mali dlaň z hľadiska výkonu dôsledne superpočítače vyrobené v USA. V roku 2013 sa čínski vedci zmocnili vedenia a zjavne sa ho nevzdajú.

V súčasnosti sa za najvýkonnejší počítač na svete považuje Sunway TaihuLight (v preklade „Sila božského svetla jazera Taihu“), grandiózny stroj s výpočtovou rýchlosťou 93 petaflopov (maximálna rýchlosť - 125,43 petaflopov). Je 2,5-krát výkonnejší ako predchádzajúci držiteľ rekordu - superpočítač Tianhe-2, ktorý bol do júna 2016 považovaný za najvýkonnejší.


Sunway Taihulight má 10,5 milióna vstavaných jadier (40 960 procesorov, každý s 256 výpočtovými a 4 riadiacimi jadrami).

Takto vyzerá najvýkonnejší počítač roku 2016

Všetky zariadenia boli vyvinuté a vyrobené v Číne, pričom procesory predchádzajúceho najvýkonnejšieho počítača vyrábala americká spoločnosť Intel. Náklady na Sunway TaihuLight sa odhadujú na 270 miliónov dolárov. Superpočítač sa nachádza v Národnom superpočítačovom centre v okrese Wuxi.

Rekordmani z predchádzajúcich ročníkov

Do júna 2016 (a zoznam TOP500 sa aktualizuje každý jún a november) bol najvýkonnejším a najrýchlejším počítačom superstroj Tianhe-2 (v preklade z čínštiny „Mliečna dráha“) vyvinutý v Číne na Univerzite obrany vedy a techniky v r. Changsha s pomocou spoločnosti Inspur.


Výkon Tianhe-2 poskytuje 2507 biliónov operácií za sekundu (33,86 petaflopov za sekundu), špičkový výkon je 54,9 petaflopov. Čínsky vývoj je na vrchole tohto rebríčka od svojho uvedenia na trh v roku 2013 – neuveriteľne pôsobivé číslo!

Superpočítač Tianhe-2

Charakteristika Tianhe-2 je nasledovná: 16 tisíc uzlov, 32 tisíc 12-jadrových procesorov Intel Xeon E5-2692 a 48 tisíc 57-jadrových akcelerátorov Intel Xeon Phi 31S1P, čo znamená celkovo 3 120 000 jadier; 256 000 pamäťových jednotiek DDR3 RAM po 4 GB a 176 000 pamäťových jednotiek GDDR5 8 GB – celkovo 2 432 000 GB pamäte RAM. Kapacita pevného disku je viac ako 13 miliónov GB. Nebudete na ňom však môcť hrať – je určený výhradne na prácu s počítačom a Milky Way 2 nemá nainštalovanú grafickú kartu. Najmä pomáha pri výpočtoch kladenia podchodov a rozvoja miest.

Jaguár

Na čele rebríčka sa dlho držal superpočítač Jaguar z USA. Čím sa líši od ostatných a aké sú jeho technické výhody?


Superpočítač s názvom Jaguar pozostáva z veľkého množstva nezávislých buniek rozdelených do dvoch sekcií – XT4 a XT5. Posledná sekcia obsahuje presne 18688 výpočtových buniek. Každá bunka obsahuje dva šesťjadrové procesory AMD Opteron 2356 s frekvenciou 2,3 ​​GHz, 16 GB DDR2 RAM a tiež router SeaStar 2+. Aj jedna bunka z tejto sekcie by stačila na vytvorenie najvýkonnejšieho počítača na hranie. Sekcia obsahuje len 149 504 výpočtových jadier, obrovské množstvo RAM – viac ako 300 TB, ako aj výkon 1,38 Petaflops a viac ako 6 Petabajtov na disku.

Stavba počítačového monštra

Partícia XT4 obsahuje 7832 buniek. Ich charakteristiky sú skromnejšie ako u predchádzajúcej sekcie XT5: každá bunka obsahuje jeden šesťjadrový procesor s frekvenciou 2,1 GHz, 8 GB RAM a router SeaStar 2 Celkovo má sekcia 31 328 výpočtových jadier a viac 62 TB pamäte, ako aj špičkový výkon 263 TFLOPS a viac ako 600 TB miesta na disku. Superpočítač Jaguar beží na vlastnom operačnom systéme Cray Linux Environment.

Ďalší počítač dýcha do chrbta Jaguaru, ktorý je duchovným dieťaťom IBM – Roadrunner. Najvýkonnejšie počítačové monštrum je schopné vypočítať až 1 000 000 000 000 operácií za sekundu. Bol vyvinutý špeciálne pre Národnú správu jadrovej bezpečnosti Ministerstva energetiky v Los Alamos. S pomocou tohto superpočítača plánovali monitorovať prevádzku všetkých jadrových zariadení nachádzajúcich sa v Spojených štátoch.


Najvyššia rýchlosť spracovania Road Runner je asi 1,5 petaflops. Hovoríme o celkovej kapacite 3 456 pôvodných trojlistových serverov, z ktorých každý je schopný vykonať približne 400 miliárd operácií za sekundu (teda 400 gigaflopov). Vo vnútri Roadrunner sa nachádza približne 20 tisíc vysokovýkonných dvojjadrových procesorov – 12 960 Cell Broadband Engine a 6948 AMD Opteron, ktoré má na svedomí samotná IBM. Takýto superpočítač má systémovú pamäť 80 terabajtov.

Koľko miesta teda zaberá tento zázrak technológie? Stroj sa nachádza na ploche 560 metrov štvorcových. A všetko vybavenie oddelenia je zabalené na serveroch pôvodnej architektúry. Všetky zariadenia vážia približne 23 ton. Na jeho prepravu teda budú pracovníci Národnej správy jadrového zabezpečenia potrebovať minimálne 21 veľkých ťahačov.

Pár slov o tom, čo je petaflops. Jeden petaflop sa približne rovná celkovému výkonu 100 tisíc moderných notebookov. Ak si to skúsite predstaviť, dokážu vydláždiť cestu dlhú takmer dva a pol kilometra. Ďalšie dostupné porovnanie: do 46 rokov bude celá populácia planéty používať kalkulačky na výpočty, ktoré Roadrunner zvládne za jeden deň. Viete si predstaviť, ako málo bude potrebovať Sunway TaihuLigh, líder nášho hodnotenia?

Titan

V roku 2012 spustilo národné laboratórium Oak Ridge National Laboratory amerického ministerstva energetiky superpočítač Titan, ktorý má výkon 20 petaflopov – inými slovami, dokáže vykonať kvadrilión operácií s pohyblivou rádovou čiarkou za jednu sekundu.


Titan vyvinul Cray. Okrem Titanu vyvinuli americkí špecialisti v posledných rokoch ďalšie dva superpočítače. Jedna z nich - Mira - je určená pre potreby priemyslu a vedeckého výskumu a pomocou druhej - Sequoia - simulujú testy jadrových zbraní. Za všetkým týmto vývojom stojí IBM Corporation.

Najvýkonnejší počítač v Rusku

Bohužiaľ, ruský vývojový „Lomonosov-2“, uznávaný ako najvýkonnejší počítač v Rusku, je až na 41. mieste v TOP500 (k júnu 2016). Sídli vo Vedeckom výpočtovom centre Moskovskej štátnej univerzity. Výkon domáceho superpočítača je 1 849 petaflopov, špičkový výkon je asi 2,5 petaflopov. Počet jadier: 42 688.



Prihláste sa na odber nášho kanála v Yandex.Zen

Superpočítač je pomerne flexibilný a veľmi široký pojem. Vo všeobecnom zmysle je superpočítač počítač, ktorý je oveľa výkonnejší ako všetky počítače dostupné na trhu. Niektorí inžinieri vtipne nazývajú každý počítač, ktorého hmotnosť presahuje jednu tonu, superpočítač. A hoci väčšina moderných superpočítačov skutočne váži viac ako tonu. Nie každý počítač možno nazvať „super“, aj keď váži viac ako tonu. Mark-1, Eniak sú tiež ťažké váhy, ale ani na svoju dobu sa nepovažujú za superpočítače.

Rýchlosť technologického pokroku je taká veľká, že dnešný superpočítač bude o 5-10 rokov horší ako domáci počítač. Pojem superpočítač sa objavil v 20. rokoch minulého storočia a pojem superpočítač v 60. rokoch. Rozšíril sa však najmä vďaka Seymourovi Crayovi a jeho superpočítačom Cray-1, Cray-2. Aj keď samotný Seymour Cray tento výraz radšej nepoužíva. Svoje autá nazýva len počítačom.

V roku 1972 S. Cray opustil CDC a založil vlastnú spoločnosť Cray Research, ktorá v roku 1976 uvoľňuje prvý vektorový-potrubný počítač CRAY-1: čas hodín 12,5ns, 12 pipeline funkčných jednotiek, špičkový výkon 160 miliónov operácií za sekundu, RAM až 1Mword (slovo - 64 bitov), ​​pamäťový cyklus 50ns. Hlavnou inováciou je zavedenie vektorových príkazov, ktoré pracujú s celými poľami nezávislých údajov a umožňujú efektívne využitie funkčných zariadení potrubia.

Cray-1 Je považovaný za jeden z prvých superpočítačov. Počítačové procesory mali na tú dobu obrovskú sadu registrov. Ktoré boli rozdelené do skupín. Každá skupina mala svoj vlastný funkčný účel. Blok registrov adries, ktorý bol zodpovedný za adresovanie v pamäti počítača. Blok vektorových registrov, blok skalárnych registrov.

Zostavenie počítača Cray-1

Počítač Cray-2

Prvý sovietsky superpočítač

Na samom začiatku bol vznik superpočítačov spojený s potrebou rýchleho spracovania veľkého množstva dát a zložitých matematických a analytických výpočtov. Preto sa prvé superpočítače svojou architektúrou len málo líšili od bežných počítačov. Len ich výkon bol mnohonásobne väčší ako štandardné pracovné stanice. Spočiatku boli superpočítače vybavené vektorovými procesormi, konvenčnými skalárnymi. V 80. rokoch prešli na paralelnú prevádzku niekoľkých vektorových procesorov. Táto cesta vývoja sa však ukázala ako neracionálna. Superpočítače prešli na paralelne pracujúce skalárne procesory.

Masívne paralelné procesory sa stali základom pre superpočítače. Tisíce prvkov spracovania boli skombinované, aby vytvorili výkonnú výpočtovú platformu. Väčšina paralelných procesorov bola vytvorená na základe architektúry RISC. RISC (Reduced Instruction Set Computing) - výpočty s redukovaným súborom inštrukcií. Pod týmto pojmom výrobcovia procesorov rozumejú konceptu, kde sa jednoduchšie inštrukcie vykonávajú rýchlejšie. Táto metóda umožňuje znížiť náklady na výrobu procesora. Zároveň zvýšiť ich produktivitu.

Potreba výkonných počítačových riešení rýchlo vzrástla. Superpočítače sú príliš drahé. Bola potrebná alternatíva. A nahradili ich klastre. Ale aj dnes sa výkonné počítače nazývajú superpočítače. Klaster je množina serverov pripojených k sieti a pracujúcich na jednej úlohe. Táto skupina serverov má vysoký výkon. Mnohonásobne viac ako rovnaký počet serverov, ktoré by fungovali oddelene. Klaster poskytuje vysokú spoľahlivosť. Porucha jedného servera nepovedie k núdzovému zastaveniu celého systému, ale len mierne ovplyvní jeho výkon. Je možné nahradiť server v klastri bez zastavenia celého systému. Za superpočítač netreba hneď vyhadzovať obrovské sumy. Klaster sa môže postupne rozširovať, čím sa výrazne amortizujú náklady podniku.

Univerzitný klaster

Ciele superpočítača

1.Maximálny výkon aritmetického procesora;

2.účinnosť operačného systému a jednoduchosť komunikácie s ním pre programátora;

3.Efektívnosť prekladu z jazykov na vysokej úrovni a odstránenie programov na písanie v autokóde;

4.Efektívnosť paralelizácie algoritmov pre paralelné architektúry;

5.Zvyšovanie spoľahlivosti.

Architektúra moderných superpočítačov

Architektúra počítača pokrýva značnú škálu problémov spojených s tvorbou komplexu hardvéru a softvéru a zohľadňuje veľké množstvo určujúcich faktorov. Medzi tieto faktory patria hlavné: náklady, rozsah aplikácie, funkčnosť, jednoduchosť použitia a hardvér sa považuje za jednu z hlavných zložiek architektúry Počítačová architektúra zahŕňa štruktúru, ktorá odráža zloženie počítača a softvéru matematická podpora. Štruktúra počítača je súbor prvkov a spojení medzi nimi. Základným princípom stavby všetkých moderných počítačov je ovládanie programu.

Všetky počítače sú rozdelené do štyroch tried v závislosti od počtu príkazových a dátových tokov.

Do prvej triedy(sériové počítače von Neumanna) patria ku konvenčným skalárnym jednoprocesorovým systémom: jeden inštrukčný prúd - jeden prúd dát (SISD). Osobný počítač má architektúru SISD a nezáleží na tom, či počítač používa na urýchlenie operácií potrubia.

Druhá trieda charakterizované prítomnosťou jediného toku inštrukcií, ale viacerých dát nomoka (SIMD). Do tejto architektonickej triedy patria jednoprocesorové vektorové alebo presnejšie vektorové-pipeline superpočítače, napríklad Cray-1. V tomto prípade máme do činenia s jedným prúdom (vektorových) príkazov, ale existuje veľa dátových prúdov: každý prvok vektora je zahrnutý v samostatnom dátovom toku. Maticové procesory, napríklad kedysi slávny ILLIAC-IV, patria do rovnakej triedy počítačových systémov. Majú tiež vektorové inštrukcie a implementujú vektorové spracovanie, ale nie cez pipeline, ako vo vektorových superpočítačoch, ale pomocou procesorových matíc.

Do tretej triedy- MIMD - označuje systémy, ktoré majú viacero príkazových tokov a viacero dátových tokov. Zahŕňa nielen viacprocesorové vektorové superpočítače, ale aj všetky viacprocesorové počítače všeobecne. Prevažná väčšina moderných superpočítačov má architektúru MIMD.

Štvrtá trieda vo Flynnovej taxonómii nemá MISD praktický význam, aspoň pre počítače, ktoré analyzujeme. V poslednej dobe sa v literatúre často používa aj pojem SPMD (single program multiple data). Neodkazuje na počítačovú architektúru, ale na model paralelizácie programu a nie je rozšírením Flynnovej taxonómie. SPMD zvyčajne označuje systémy MPP (tj MIMD) a znamená viacero kópií toho istého programu.

Úlohy superpočítača

Na samom začiatku bol vznik superpočítačov spojený s potrebou rýchleho spracovania veľkého množstva dát a zložitých matematických a analytických výpočtov. Počítače sú stroje na veľké úlohy.

1.Riešiť zložité a veľké vedecké problémy, v manažmente, prieskume

2. Najnovší architektonický vývoj využívajúci modernú základnú základňu a aritmetické urýchľovače

3. Dizajn a simulácia

4. Zlepšená produktivita

5. Centralizované ukladanie informácií

6.Posudzovanie zložitosti riešených problémov v praxi

Superpočítač na Technickej univerzite v Mníchove

Superpočítač druhej generácie umiestnený na VNIIEF

Výkonové charakteristiky superpočítača

Za polstoročie vzrástol výkon počítača viac ako sedemsto miliónov krát. Zároveň je nárast výkonu spojený so skrátením doby taktu z 2 mikrosekúnd na 1,8 nanosekúnd len asi 1000-násobný. Hlavné miesto medzi nimi zaujíma princíp paralelného spracovania údajov, ktorý stelesňuje myšlienku súčasného (paralelného) vykonávania niekoľkých akcií. Paralelné spracovanie údajov, ktoré stelesňuje myšlienku súčasného vykonávania niekoľkých akcií, má dve odrody: potrubie a skutočný paralelizmus Paralelné spracovanie údajov, ktoré stelesňuje myšlienku súčasného vykonávania niekoľkých akcií, má dve odrody: potrubie a skutočný paralelizmus.

Paralelné spracovanie. Ak určité zariadenie vykoná jednu operáciu za jednotku času, potom vykoná tisíc operácií za tisíc jednotiek. Ak predpokladáme, že existuje päť rovnakých nezávislých zariadení schopných pracovať súčasne, potom systém piatich zariadení dokáže vykonať rovnakých tisíc operácií nie za tisíc, ale za dvesto jednotiek času. Podobne systém N zariadení vykoná rovnakú prácu za 1000/N jednotiek času. Podobné analógie možno nájsť aj v živote: ak jeden vojak vykope záhradu za 10 hodín, potom rota päťdesiatich vojakov s rovnakými schopnosťami, ktorí pracujú súčasne, zvládne rovnakú prácu za 12 minút - princíp paralelnosti v akcii!

Spracovanie dopravníka Množstvo malých operácií, ako je porovnávanie objednávok, zarovnávanie objednávok, pridávanie mantis, normalizácia atď. Procesory prvých počítačov vykonávali všetky tieto „mikrooperácie“ pre každú dvojicu argumentov, jednu po druhej, až kým nedosiahli konečný výsledok, a až potom pristúpili k spracovaniu ďalšej dvojice výrazov.

Všetky úplne prvé počítače (EDSAC, EDVAC, UNIVAC) mali bitovo sekvenčnú pamäť, z ktorej sa slová čítali postupne po bitoch. Prvým komerčne dostupným počítačom využívajúcim bit-paralelnú pamäť (na CRT) a bit-paralelnú aritmetiku bol IBM 701 a najpopulárnejším modelom bol IBM 704 (150 predaných kópií), ktorý bol okrem vyššie uvedeného prvým použiť feritové jadrá a hardvérový zosilňovač s pohyblivou rádovou čiarkou. Hierarchia pamäte. Pamäťová hierarchia priamo nesúvisí s paralelizmom, ale určite sa vzťahuje na tie vlastnosti počítačovej architektúry, ktoré majú veľký význam pre zvýšenie ich výkonu (vyhladenie rozdielu medzi rýchlosťou procesora a dobou prístupu do pamäte). Hlavné úrovne: registre, vyrovnávacia pamäť, RAM, disková pamäť. Čas vzorkovania úrovní pamäte z pamäte disku do registrov sa znižuje, cena za 1 slovo (bajt) sa zvyšuje. V súčasnosti je takáto hierarchia podporovaná aj na osobných počítačoch.

Aktuálne používané:

1. Vector-pipeline počítače. Potrubné funkčné zariadenia a vektorový súbor inštrukcií

2. Masívne paralelné počítače s distribuovanou pamäťou.

3. Paralelné počítače so zdieľanou pamäťou. Všetku pamäť RAM takýchto počítačov zdieľa niekoľko rovnakých procesorov

4.Využitie paralelných výpočtových systémov

Zoznam najvýkonnejších počítačov na svete

Organizácia, kde je počítač nainštalovaný Typ počítača Počet výpočtových jadier Maximálny výkon Spotreba energie
Jaguar - Cray XT5-HE Opteron Six Core 2,6 GHz / 2009224162 1759.00 6950.60
Národné superpočítačové centrum v Shenzhene (NSCS)Nebulae - Dawning TC3600 Blade, Intel X5650, NVidia Tesla C2050 GPU / 2010120640 1271.00 2984.30
DOE/NNSA/LANLRoadrunner – BladeCenter QS22/LS21 Cluster, PowerXCell 8i 3,2 GHz / Opteron DC 1,8 GHz, Voltaire Infiniband / 2009122400 1042.00 2345.50
Národný inštitút pre počítačové vedy/University of TennesseeKraken XT5 - Cray XT5-HE Opteron Six Core 2,6 GHz / 200998928 831.70 2569
JUGENE - Blue Gene/P Solution / 2009294912 825.50 2268.00
Národné superpočítačové centrum v Tianjine/NUDTTianhe-1 - NUDT TH-1 Cluster, Xeon E5540/E5450, ATI Radeon HD 4870 2, Infiniband / 200971680 563.10 2578
DOE/NNSA/LLNLBlueGene/L - eServer Blue Gene Solution / 2007212992 478.20 2329.60
Národné laboratórium ArgonneIntrepid - Blue Gene/P Solution / 2007163840 458.61 1260
Sandia National Laboratories/National Renewable Energy LaboratoryRed Sky – Sun Blade x6275, Xeon X55xx 2,93 GHz, Infiniband / 2010

Sun Microsystems

42440 433.50 1254
Texas Advanced Computing Center/Univ. z TexasuRanger - SunBlade x6420, Opteron QC 2,3 GHz, Infiniband / 2008

Sun Microsystems

62976 433.20 2000.00
DOE/NNSA/LLNLÚsvit – riešenie Blue Gene/P / 2009147456 415.70 1134
Moskovská štátna univerzita - Výskumné výpočtové centrum Rusko Lomonosov – T-Platforms T-Blade2, Xeon 5570 2,93 GHz, Infiniband QDR / 2009 T-Platforms 35360 350.10 1127
Forschungszentrum Juelich (FZJ)JUROPA - Sun Constellation, NovaScale R422-E2, Intel Xeon X5570, 2,93 GHz, Sun M9/Mellanox QDR Infiniband/Partec Parastation / 200926304 274.80 1549.00
Superpočítačové centrum KISTITachyonII - Sun Blade x6048, X6275, prepínač IB QDR M9, Sun HPC stack Linux edition / 2009

Sun Microsystems

26232 274.20 307.80
University of EdinburghHECToR – Cray XT6m 12-jadrový 2,1 GHz / 201043660 274.70 1189.80
NERSC/LBNLFranklin - Cray XT4 QuadCore 2,3 GHz / 200838642 266.30 1150.00
Grand Equipement National de Calcul Intensif – Centre Informatique National de l"Enseignement Supç╘rieur (GENCI-CINES)Jade - SGI Altix ICE 8200EX, Xeon E5472 3.0/X5560 2,8 GHz / 201023040 237.80 1064.00
Ústav procesného inžinierstva, Čínska akadémia viedMole-8,5 - Mole-8,5 Cluster Xeon L5520 2,26 GHz, nVidia Tesla, Infiniband / 2010

IPE, nVidia Tesla C2050, Tyan

33120 207.30 1138.44
Národné laboratórium Oak RidgeJaguar - Cray XT4 QuadCore 2,1 GHz / 200830976 205.00 1580.71}

 

Môže byť užitočné prečítať si: