Hyödyllisiä vinkkejä

Supertietokoneiden verkot

Pin
Send
Share
Send
Send


Hajautettu tietojenkäsittely on yksi tapa osallistua mielenkiintoisiin hankkeisiin. Kun tietokone on käyttämättömänä, jaa sen teho SETI-projektin kanssa, joka etsii maan ulkopuolisia sivilisaatioita. Tässä tapauksessa tietokoneesi analysoi satelliittitietoja ja teleskoopeista vastaanotettuja tietoja.

Tämä artikkeli auttaa sinua liittymään hankkeisiin (kuten SETI), joihin sisältyy hajautettu laskenta. Artikkelissa esitellään myös BOINC, hajautettu laskentaohjelmisto.

Tarvitset tietokoneen. Jos sinulla jo on sellainen, mene Lähteet ja linkit -osaan ja asenna BOINC-ohjelmisto. Jos et ole kiinnostunut SETI-projektista, alla on luettelo muista projekteista.

Jos paljon rahaa

Erikseen panemme merkille Intel Xeon LGA1567 -liittimen erittäin kalliit, mutta tuottavat prosessorisarjat.
Tämän sarjan huippuprosessori on E7-8870, jossa on kymmenen 2,4 GHz: n ydintä. Sen hinta on 4616 dollaria. Tällaisille prosessoreille HP ja Supermicro julkaisevat! kahdeksan-! palvelimen runko. Kahdeksan 10 ytimen Xeon E7-8870 2,4 GHz: n prosessoria, joissa HyperThreading, tukee 8 * 10 * 2 = 160 säiettä, joka näkyy Windows Task Manager -sovelluksessa satakuusikymmentä kuvaavana prosessorin latauskuvana, matriisi 10x16.

Jotta kahdeksan prosessoria mahtuu koteloon, niitä ei aseteta välittömästi emolevylle, vaan erillisille emolevyyn kiinnittyville levyille. Valokuvassa on neljä emolevyä, joissa emolevyyn on asennettu prosessoria (kaksi molemmissa). Tämä on Supermicro-ratkaisu. HP-ratkaisussa jokaisella suorittimella on oma kortti. HP-ratkaisun hinta on kaksi tai kolme miljoonaa, riippuen prosessorien määrästä, muistista ja muusta. Supermicro-alusta maksaa 10 000 dollaria, mikä on houkuttelevampaa. Lisäksi Supermicro voi laittaa neljä kopioprosessorin laajennuskorttia PCI-Express x16 -portteihin (muuten Infiniband-sovittimella on vielä tilaa näiden klusterin kokoamiseksi), mutta vain kaksi HP: ssä. Supermikron kahdeksan prosessorin alusta on siis houkuttelevampi supertietokoneen luomiseen. Seuraava näyttelykuva näyttää koko supertietokoneen neljällä GPU-kortilla.

Se on kuitenkin erittäin kallis.

Viestintäverkot

Supertietokoneen tehokkuus monissa sovelluksissa määräytyy pitkälti muistin ja verkon kanssa työskentelemisen profiilin perusteella. Muistin kanssa työskentelyprofiilia kuvataan yleensä puhelujen väliaikaisella lokalisoinnilla - puhelujen koosta ja niiden osoitteiden sironnasta, ja verkon kanssa työskentelyprofiilia kuvataan jakamalla solmut, joiden kanssa viestejä vaihdetaan, vaihtokurssi ja viestien koot.

Supertietokoneen suorituskyky tehtävissä, joissa solmujen välinen intensiivinen tiedonvaihto tapahtuu (mallintamisongelmat, ongelmat graafissa ja epäsäännöllisissä verkkoissa, laskelmat harvoilla matriiseilla) määräytyy pääasiassa verkon suorituskyvyn perusteella, joten perinteisten kaupallisten ratkaisujen (esimerkiksi Gigabit Ethernet) käyttö on erittäin tehotonta. Todellinen verkko on kuitenkin aina kompromissiratkaisu, jonka kehittämisessä asetetaan prioriteetit hinnan, suorituskyvyn, energiankulutuksen ja muiden suuresti ristiriitaisten vaatimusten välillä: Yhden ominaisuuden parantamisyritykset voivat johtaa toisen huonontumiseen.

Viestintäverkko koostuu solmuista, joista jokaisessa on verkkosovitin kytkettynä yhteen tai useampaan reitittimeen, jotka puolestaan ​​yhdistetään nopeiden tietoliikennekanavien (linkkien) avulla.

Kuva 1. Topologia 4D-torus (3x3x3x3)

Verkkorakenne, joka määrittelee kuinka järjestelmän solmut tarkalleen kytketään, määritetään verkon topologian (yleensä hilan, toruksen tai paksun puun) ja rakenneparametrien joukon avulla: mittausten lukumäärä, puutasojen lukumäärä, toruksen sivujen mitat, kytkinten lukumäärä puutasoilla, verkon solmujen lukumäärä. reitittimien portit jne. Kuvio 1 esittää esimerkkiä nelisuuntaisen toruksen 3x3x3x3 topologiasta.

Reitittimen arkkitehtuuri määrittää niiden lohkojen rakenteen ja toiminnallisuuden, jotka vastaavat tiedonsiirrosta verkkosolmujen välillä, samoin kuin kanavan, verkon ja siirtokerrosten protokollien välttämättömät ominaisuudet, mukaan lukien reititys, välitys ja tietovirran ohjausalgoritmit. Verkkosovittimen arkkitehtuuri määrittää prosessorin, muistin ja verkon välisestä vuorovaikutuksesta vastaavien lohkojen rakenteen ja toiminnallisuuden, etenkin MPI-toimintoja tuetaan tällä tasolla, RDMA (Remote Direct Memory Access - suora pääsy toisen solmun muistiin ilman prosessorin osallistumista), paketin toisen solmun vastaanottovahvistukset, poikkeustilanteiden käsittely, pakettien yhdistäminen.

Viestintäverkon suorituskyvyn arvioimiseksi käytetään useimmiten kolmea ominaisuutta: kapasiteetti (siirretyn tiedon määrä aikayksikköä kohti), viestinnän viive (tiedonsiirtoaika verkon yli), viestin vauhti (yleensä he harkitsevat erikseen toimitusnopeutta lähettäessään, vastaanottaessasi ja lähettäessäsi paketteja reitittimen sisäisten yksiköiden välillä).

Täydellisyyden vuoksi nämä ominaisuudet mitataan erityyppisissä liikenteissä, esimerkiksi kun yksi solmu lähettää tietoja kaikille muille tai päinvastoin, kaikki solmut lähettävät tietoja yhdelle tai kun kaikki solmut lähettävät tietoja satunnaisiin kohteisiin. Toiminnallisuusvaatimukset asetetaan nykyaikaisille verkoille:

  • Shmem-kirjaston tehokas toteutus vaihtoehtona yksisuuntaisen viestinnän mallin tukemiselle ja GASNet, johon monien PGAS-kielten toteutus perustuu,
  • MPI: n tehokas toteutus (yleensä tämä vaatii rengaspuskurien ja vastaanotettujen pakettien kuittausten tehokkaan tuen),
  • tehokas tuki kollektiivisille operaatioille: lähetys (saman tiedon lähettäminen samanaikaisesti monille solmuille), pienentäminen (esimerkiksi binaarioperaation käyttäminen eri solmuista vastaanotettuihin arvojoukkoihin), taulukkoelementtien jakaminen solmujoukolle (sironta), elementtien ryhmän kokoaminen, sijaitsevat eri solmuissa (kerää),
  • tehokas tuki solmujen välisille synkronointitoiminnoille (ainakin esteesynkronointi), tehokas vuorovaikutus suuren määrän prosessien verkon kanssa solmulla ja luotettavan paketin toimituksen varmistaminen.

Myös adapterin työn tehokas tuki isännän muistin kanssa suoraan ilman prosessorin osallistumista on tärkeää.

Ulkomaiset nopeat verkot

Kaikki viestintäverkot voidaan jakaa kahteen luokkaan: kaupallisiin ja räätälöityihin, kehitettyinä osana tietokonejärjestelmiä ja saatavana vain niiden kanssa. Kaupallisissa verkoissa markkinat jakautuvat InfiniBandin ja Ethernetin välille - Top500-luettelossa (kesäkuu 2011) 42% järjestelmistä käyttää InfiniBandia ja 45% Gigabit Ethernetä. Samaan aikaan, jos InfiniBand on keskittynyt erittäin suorituskykyisten järjestelmien segmenttiin, joka on suunniteltu monimutkaisille laskentatehtäville, joissa on paljon viestintää, Ethernet on perinteisesti oma markkinarako, jossa tiedonvaihto solmujen välillä ei ole kriittinen. Supertietokoneissa Ethernet-verkkoa käytetään alhaisten kustannustensa ja saatavuutensa vuoksi usein apupalveluverkkona ohjaus- ja tehtäväliikenteen häiriöiden vähentämiseksi.

Inifiniband-verkko keskittyi alun perin kokoonpanoihin, joissa on rasvapuun topologiaa, mutta kytkimien ja reitittimien (lähinnä QLogicin valmistamien) uusimmat versiot tukevat moniulotteista toruksen topologiaa (käyttäen Torus-2QoS Routing Engine -moottoria) sekä hybridi-topologiaa 3D-torusta. ja rasvapuu. Vuoden 2010 alussa koottu Sandia RedSky -supertietokone, joka on nyt Top500: n 16. sijalla, on yksi ensimmäisistä laajamittaisista projekteista, joissa on InfiniBand-verkko ja topologinen 3D-torus (6x6x8). Myös nyt kiinnitetään paljon huomiota RDMA-toimintojen ja Shmem-kirjaston (erityisesti Qlogic Shmem) tehokkaaseen tukemiseen.

InfiniBandin suosio johtuu suhteellisen alhaisista kustannuksista, kehittyneestä ohjelmistojen ekosysteemistä ja tehokkaasta tuesta MPI: lle. InfiniBandilla on kuitenkin haittoja: alhainen viestien toimitusnopeus (40 miljoonaa viestiä sekunnissa Mellanoxin uusimmissa ratkaisuissa), lyhyiden pakettien alhainen lähetystehokkuus, suhteellisen suuri viive (yli 1,5 μs lähetyksille solmusta solmuun ja lisäksi 0,1- 0,5 μs kuljetussolmua kohti), heikko tuki toroidiselle topologialle. Yleisesti voidaan väittää, että InfiniBand on massakäyttäjälle tarkoitettu tuote, jonka kehittämisen aikana kompromissi tehtiin tehokkuuden ja monipuolisuuden välillä.

Voimme huomata myös Extoll-verkon, jota valmistellaan markkinoille saattamiseksi - Heidelbergin yliopiston kehittämistä professori Ulrich Brueningin johdolla. Tämän verkon kehittämisessä painopiste on viivästysten minimoinnissa ja toimitusten nopeuttamisessa yksisuuntaisessa viestinnässä. On suunniteltu, että Extoll tarjoaa 3D-torustopologian ja käyttää optisia linkkejä, joiden kaistanleveys on 10 Gb / s kaistaa kohti (sarjan tiedonsiirtokanava linkin sisällä) ja leveys 12 kaistaa linkkiä kohti. Nyt FPGA: lla on Extoll-verkon prototyyppejä: R1 - perustuu Virtex4: ään, R2 Ventoux - kaksisolmuinen asettelu, joka perustuu Virtex6: een. Yhdensuuntainen kaistanleveys linkkiä kohti on 600 Mt / s (R1: lle). Kahta liitäntää (HyperTransport 3.0 ja PCI Express gen3) prosessorilla tuetaan myös, mikä mahdollistaa tämän verkon integroinnin Intel- ja AMD-alustoihin. Extoll tukee useita tapoja järjestää yksisuuntainen tietue, oma MMU (muistinhallintayksikkö, virtuaalisten osoitteiden käännöslohko fyysisiksi osoitteiksi) ja atomitoiminnot.

Toisin kuin kaupallisissa verkoissa, räätälöityjen verkkojen markkinaosuus on huomattavasti pienempi, mutta niitä käytetään Cray: n, IBM: n, SGI: n, Fujitsun, NEC: n ja Bullin tehokkaimmissa supertietokoneissa. Mukautettuja verkkoja suunnitellessaan kehittäjillä on enemmän vapautta ja he yrittävät käyttää edistyksellisempiä lähestymistapoja lopputuotteen markkinoiden houkuttelevuuden vähäisemmän merkityksen vuoksi ratkaiseen ensisijaisesti ongelman, joka on maksimaalisen suorituskyvyn saavuttaminen tietyssä tehtäväluokassa.

K Computer -supertietokone käyttää patentoitua Tofu (TOrus FUsion) -verkkoa, joka on skaalattava 3D-torus, jonka solmut sisältävät 12 solmun ryhmiä (solmuryhmät yhdistetään 12 verkossa 3D-toruksella ja jokaisella tämän ryhmän solmulla on oma lähtö) 3D-torus-verkko). Kunkin ryhmän solmut yhdistetään 3D-toruksella, jonka sivut ovat 2x3x4 ilman päällekkäisiä linkkejä, mikä vastaa 2D-torusta, jonka sivut ovat 3x4 (joten saamme 5D-toruksen, jolla on kiinteät kaksi ulottuvuutta). Siksi Tofu-verkon solmulla on 10 linkkiä, joiden yksisuuntainen suorituskyky on 40 Gb / s. Solmujen esteiden synkronointia ja pienentämistä (kokonaisluku ja liukuluku) tuetaan laitteistossa.

Tianhe-1A-supertietokoneen kehittämisen päätavoitteina olivat korkean energiatehokkuuden saavuttaminen, oman prosessorin ja verkon kehittäminen, joka on parempi kuin InfiniBand QDR. Supertietokone koostuu 7168 laskennallisesta solmusta, jotka on kytketty oman Arch-verkon avulla paksuun puiden topologiaan. Verkko on rakennettu 16-porttisista reitittimistä, yksisuuntaisen linkin kaistanleveys - 8 Gt / s, viive - 1,57 μs. RDMA-operaatiot tuetut ja kollektiiviset toiminnot optimoitu.

Klassiset edustajat järjestelmistä, joissa toroidista topologiaa käytetään laskennallisten solmujen yhdistämiseen, ovat IBM Blue Gene -sarjan järjestelmiä, joiden kahdessa ensimmäisessä sukupolvessa - Blue Gene / L (2004) ja Blue Gene / P (2007) - käytettiin 3D-toruksen topologiaa. Blue Gene / P: n verkolla on suhteellisen heikot yhteydet yksipuoliseen kaistanleveyteen, joka on 0,425 GB / s, mikä on luokkaa pienempi kuin sen nykyisen InfiniBand QDR -linkin kaistaleveys, mutta laitteistopohjainen tuki esteiden synkronoinnille ja kollektiivisille toimille (erillisissä puumaisissa verkoissa) mahdollistaa hyvän skaalautuvuuden todellisia sovelluksia. Lisäksi kaikki rajapinnat ja reititysyksiköt on integroitu BPC-mikroprosessoriin (Blue Gene / P Chip), mikä vähentää merkittävästi viestin lähetysviiveitä. Seuraavan sukupolven tietoliikenneverkossa Blue Gene / Q on 5D-tor-topologia, ja toisin kuin edeltäjät, sillä ei ole erillisiä verkkoja esteiden synkronointiin ja kollektiivisiin toimintoihin. Blue Gene / Q -sirusta tuli ensimmäistä kertaa multi-core-multi-thread - neljä laitteistolankaa kohti ydintä ja 16 ydintä, mikä mahdollistaa heikentää verkkovaatimuksia ja varmistaa viivetoleranssin. Linkin läpäisykyky on nostettu 2 Gt / s, mutta on silti pieni verrattuna Cray Gemini tai Extoll. Näiden järjestelmien alhaista suorituskykyä tasoittaa toruksen suuri mitta (suuri joukko linkkejä) ja seurauksena verkon pieni halkaisija (huomattavasti pienempi kuin verkoilla, joilla on 3D-toruksen topologia ja saman verran solmuja). Käytettävissä olevat lähteet kertovat kahden Blue Gene / Q-transpetaflops-supertietokoneen luomisesta: Sequoia, jonka suorituskyky on 20 PFLOPS ja Mira - 10 PFLOPS. Voimme päätellä, että Blue Gene / Q on keskittynyt tehtäviin, jotka käyttävät kymmeniä ja satoja tuhansia laskusolmuja, joiden verkkoliikenne on tyyppiä kaikille.

Toinen toroidisella topologialla varustettujen viestintäverkkojen rakentamista koskevan lähestymistavan kiinniottaja on Cray, joka jatkaa 3D-tor-topologian käyttöä lisääen samalla läpimenoaikaa ja vierekkäisten solmujen yhdistävien linkkien määrää. Cray-toroidisen verkon nykyinen sukupolvi on Cray Gemini -verkko. Yksi Gemini-reititin vastaa kahta edellisen SeaStar2 + -sukupolven reititintä, toisin sanoen tosiasiallisesti kahta verkkosolmua, joten Geminissä käytetään linkkien sijaan 6 linkin 10 sijasta 10 naapurisolmuihin (2 toimivat kahden sovittimen kytkemiseksi toisiinsa).

Supertietokoneen verkon komponentit (verkkosovittimet, kytkimet, reitittimet), toisin kuin prosessorit, ovat usein kalliimpia, ja pääsy niihin on rajoitetumpaa. Esimerkiksi nyt InfiniBand-verkon kytkimet, joka on supertietokoneiden pääasiallinen kaupallinen verkko, ovat vain kahden yrityksen tuottamia, kumpaakin hallitsee Yhdysvallat. Tämä tarkoittaa, että ilman omaa kehitystä nopeiden verkkojen alalla, nykyaikaisten supertietokoneiden luomista missä tahansa maassa paitsi Yhdysvalloissa, Kiinassa tai Japanissa voidaan helposti hallita.

Kotimaan verkot

Supertietokoneissa käytettäviä viestintäverkkoja kehittää useita kotimaisia ​​organisaatioita: RFNC VNIIEF (avoimessa lähteessä on vain vähän tietoa tästä kehityksestä), Venäjän tiedeakatemian ohjelmistojärjestelmien instituutti ja RSK SKIF, IPM RAS ja Kvantin tutkimuslaitos (MVS-Express-verkko) ").

Venäjän-italian supertietokoneen SKIF-Aurora 3D-toriviestintäverkko on kokonaan rakennettu käyttämällä Altera Stratix IV FPGA: ta, joka selittää melko pienen kaistanleveyden linkkiä kohti - 1,25 Gt / s (FPGA-resurssit ovat hyvin rajalliset).

MVS-Express-verkossa PCI Express 2.0: ta käytetään laskennallisten solmujen integrointiin, ja solmut yhdistetään 24-porttisten kytkinten kautta. Verkolla on topologia lähellä rasvapuuta. Laskennasolmun verkkosovittimella on yksi portti, jonka leveys on 4 kaistaa, minkä seurauksena yksisuuntainen huipputeho on linkkiä kohti 20 Gbit / s ottamatta huomioon koodausta. PCI Express -sovelluksen etuna MVS-Expressissä on jaetun muistin tehokas tuki mahdollistaen yksisuuntaisen tiedonsiirron. Tämän seurauksena verkko on kätevä Shmem-kirjaston ja PGAS-kielten (UPC, CAF) toteuttamiseen.

NICEVT OJSC kehittää Venäjän federaation teollisuus- ja kauppaministeriön tuella Angara-tietoliikenneverkkoa, jolla on 4D-tor-topologia, josta voi tulla perustana kotimaisen tekniikan luominen supertietokoneiden kehittämistä varten.

Verkko "Angara"

Angara-verkoston kehittämisen päätavoitteet:

  • tehokas tuki yksisuuntaiseen viestintään (put / get) ja PGAS-kielille (rinnakkaisohjelmoinnin päävälineinä),
  • Tehokas MPI-tuki
  • oman kristallin vapauttaminen (korkean tiedonsiirtonopeuden ja pienten viiveiden saavuttamiseksi),
  • mukautuva vikasuojattu pakettisiirto,
  • tehokas työskentely nykyaikaisten prosessorien ja piirisarjojen kanssa.

Tämän verkon ensimmäisessä kehitysvaiheessa (2006) simuloitiin erilaisia ​​verkkovaihtoehtoja ja tehtiin tärkeimmät päätökset topologiasta, reitittimen arkkitehtuurista, reititysalgoritmeista ja välimiesmenettelystä. Toroidisen topologian lisäksi otettiin huomioon Cayley-verkot ja ”paksu puu”. Nelidimensioinen torus valittiin sen yksinkertaisemman reitityksen, hyvän skaalautuvuuden ja suuren yhteyden vuoksi pienempiin toriin verrattuna. Verkkomallinnus mahdollisti verkon arkkitehtuurin eri parametrien vaikutuksen pääsuoritusominaisuuksiin yksityiskohtaisesti ja ymmärtää tehtävien liikenteen kuviot, joilla on intensiivinen epäsäännöllinen pääsy muistiin. Tuloksena valittiin optimaaliset puskurikoot, virtuaalikanavien lukumäärä ja mahdolliset pullonkaulat analysoitiin.

Vuonna 2008 ilmestyi FPGA-reitittimen ensimmäinen prototyyppi - Virtex4: n 2x3-torukseen kytketyssä kuuden solmun verkkosuunnitelmassa, johon reitittimen perustoiminnot poistettiin, vikasietoinen tiedonsiirto kehitettiin, ohjain ja matalatason kirjasto kirjoitettiin ja virheenkorjattiin, Shmem-kirjastot siirrettiin ja MPI. Nyt julkaistiin kolmannen sukupolven asettelu, joka koostuu yhdeksästä solmusta, jotka on kytketty kaksiulotteiseen torukseen 3x3. Собран стенд с двумя узлами для тестирования новых разъемов и каналов передачи данных, предполагаемых к использованию с будущими кристаллами маршрутизатора ВКС. При разработке принципов работы сети ряд деталей был позаимствован из работ и , а также в том или ином виде из архитектур IBM Blue Gene и Cray SeaStar.

Сеть «Ангара» имеет топологию 4D-тор. Поддерживается детерминированная маршрутизация, сохраняющая порядок передачи пакетов и предотвращающая появление дедлоков (взаимных блокировок), а также адаптивная маршрутизация, позволяющая одновременно использовать множество путей между узлами и обходить перегруженные и вышедшие из строя участки сети. Erityistä huomiota kiinnitettiin kollektiivisten toimintojen tukemiseen (lähettäminen ja pienentäminen), joka toteutettiin käyttämällä virtuaalista aliverkkoa, jonka puiden topologia oli asetettu moniulotteiselle torukselle. Laitteistotason verkko tukee kahta tyyppistä etäkirjoitusta, lukemista ja atomioperaatioita (lisäys ja yksinoikeus). Etälukemisen suoritusjärjestelmä (pyynnön lähettäminen ja vastauksen vastaanottaminen) on esitetty kuviossa 3. 2 (etätallennus ja atomitoiminnot suoritetaan samalla tavalla). Erillisessä lohkossa logiikka toteutetaan yhdistämään verkosta vastaanotetut viestit, jotta voidaan lisätä hyödyllisen datan osuutta tapahtumaa kohden lähettäessään rajapinnan kautta isännälle (isäntä on prosessori-muisti-silta-silta).

Kuva 2. Kaukolukujärjestelmä Angara-verkossa

Datayhteyskerroksessa tuetaan virheettömää pakettien siirtoa. On myös mekanismi epäonnistuneiden tietoliikennekanavien ja solmujen ohittamiseksi uudelleen rakentamalla reititystaulut. Eri palvelutoimintojen suorittamiseksi (erityisesti reititystaulukoiden määrittämiseksi / rakentamiseksi) ja laskelmien suorittamiseksi käytetään palveluprosessoria. Isäntäliittymä käyttää PCI Express -sovellusta.

Kuva 3. Laskennallisolmun rakenne verkkosovittimella / reitittimellä "Angara"

Reitittimen päälohkot:

  • rajapinta isäntäjärjestelmään, joka vastaa pakettien vastaanottamisesta ja lähettämisestä isäntärajapinnalla,
  • injektio- ja poistoyksikkö, joka muodostaa verkkoon lähetettävät paketit ja jäsentää verkosta tulevien pakettien otsikot,
  • pyynnönkäsittely-yksikkö, joka käsittelee paketteja, jotka vaativat tietoja isäntäjärjestelmän muistista (esimerkiksi lukemat tai atomitoiminnot),
  • kollektiivisen operaation verkkoyksikkö, joka käsittelee kollektiivisiin toimintoihin liittyvät paketit, erityisesti suorittamalla pienentämisoperaatiot, generoimalla lähetyspyyntöpaketit,
  • palvelutoimintayksikkö, joka käsittelee palvelukoprosessoriin meneviä ja sieltä lähteviä paketteja,
  • kytkin, joka yhdistää tulot eri virtuaalikanavista ja tulot injektoreista, joilla on lähtö eri suuntiin ja ejektoreihin,
  • viestintäkanavat datan lähettämiseksi ja vastaanottamiseksi tiettyyn suuntaan,
  • tiedonsiirtoyksikkö pakettien lähettämiseksi tiettyyn suuntaan ja vastaanotto- ja reititysyksikkö pakettien vastaanottamiseksi ja niiden tulevaisuuden kohtaloon päättämiseksi.

Isäntävuorovaikutus (keskusprosessorissa suoritettu koodi) reitittimen kanssa suoritetaan kirjoittamalla muistiosoitteisiin, jotka on kartoitettu reitittimen resurssialueiden osoitteisiin (muistikartattu tulo / lähtö). Tämä antaa sovelluksen olla vuorovaikutuksessa reitittimen kanssa ilman ytimen osallistumista, mikä vähentää pakettien lähetyskustannuksia, koska vaihtaminen ytimen kontekstiin ja takaisin vaatii yli sata kellojaksoa. Pakettien lähettämiseen käytetään yhtä muistialuetta, jota pidetään rengaspuskurina. On myös erillinen alue toimintojen suorittamista varten ilman muistimuistin kopiointia (tiedot luetaan muistista ja kirjoitetaan viestintäverkon sovittimen kautta DMA-toimintojen kautta) ja alue, jossa on ohjausrekistereitä. Ydinmoduuli valvoo pääsyä reitittimen tiettyihin resursseihin.

Tehokkuuden lisäämiseksi päätettiin, että yhdelle solmulle tulisi suorittaa vain yksi laskennallinen tehtävä, mikä eliminoi virtuaalimuistin käyttöön liittyvät yleiskustannukset, välti tehtävien häiriöitä, yksinkertaisti reitittimen arkkitehtuuria täydellisen MMU: n puutteen takia ja vältti kaiken hänen viestinnän työnsä viivästyy, samoin kuin yksinkertaistaa verkon suojausmallia poistamalla siitä yhden solmun eri tehtävien prosessien turvallisuus. Tämä ratkaisu ei vaikuttanut verkon toiminnallisuuteen, joka oli tarkoitettu ensisijaisesti suurten tehtävien suorittamiseen (toisin kuin InfiniBand, universaali verkko, joka soveltuu erikokoisiin tehtäviin). Samanlainen päätös tehtiin IBM Blue Gene: ssä, jossa jaksolle asetetaan rajoitus tehtävän ainutlaatuisuudelle.

Laitteistasolla tuetaan saman tehtävän samanaikaista työskentelyä useiden yhden tehtävän lankojen / prosessien kanssa - se toteutetaan useina injektiokanavina, joita prosessit voivat käyttää useiden rengaspuskurien kautta pakettien tallentamiseksi. Näiden puskurien lukumäärä ja koko voivat muuttua dynaamisesti.

Angara-verkon tärkein ohjelmointitila on MPI: n, OpenMP: n ja Shmem: n, sekä GASNetin ja UPC: n yhteinen käyttö.

Kun verkon varmentaminen ja prototyyppien määrittäminen on valmis, on tarkoitus julkaista VLSI-siru. Prototyyppinen VLSI-erä suunnitellaan perustuttamaan teknisiin ratkaisuihin, teknologiseen prosessiin ja simulaatiotulosten kokeelliseen todentamiseen. Prototyyppi sisältää kaikki perustoiminnot, toimii PCI Express gen2 x16 -rajapinnan kanssa ja linkit, joiden siirtonopeus on 75 Gb / s.

Angara-verkkoa on tarkoitus markkinoida kahdessa versiossa: erillisenä kaupallisena verkkona PCI Express -korttien muodossa klusterijärjestelmille, joissa on vakioprosessorit ja piirisarjat, ja osana NICEVT: ssä kehitettävää AMD-prosessoreihin perustuvaa nelipistorasiaista teräjärjestelmää.

Katso video: Mitä tarkoittaa tehotyöaseman virtualisointi? (Tammikuu 2023).

Pin
Send
Share
Send
Send