Eguneko artxiboak: September 21, 2010

Intel Konpilatzaileak

Informazio orokorra

Itanium2 nodoetan bereziki, konpilatzaile hauek erabiltzea goemndatzen dugu. GNU konpilatzailean baino eraginkorragoak baitira.

Zerbitzuko zerbitzaritan konpilatzeko txosten bat (pdf) prestatu dugu. Oso gomendagarria da irakurtzea. Bertan, zerbitzuko makina guztietarako programak nola konpilatu eta erabili azltzen dugu ere.

Zalantzak badituzu edo informazio gehiagorako galdetu  teknikariei.

 

Nola exekutatu

Fortran, C edo C++ exekutatzeko erabili ifort, icc, icpc.

Defektuz instalatutako konpilatzaileak

  • Itanium nodoetan Intel 11.1 Fortran (ifort), C (icc) eta C++ (icpc).
  • Xeon nodoetan Intel 15.0 Fortran (ifort), C (icc) eta C++ (icpc).

Informazio Gehiago:

Egikaritu, ifort -help konpilatzaile bakoitzarentzat edo galdetu  teknikariei.

Fortan Eskuliburua

Fortran Konpilatzailearen Eskuliburua

C Konpilatzailearen Eskuliburua

MPI Liburutegiak

Informazio orokorra

MPI liburutuegiak kalkulu paraleloak banatuak egiterakoan gehien erabilzten diren liburutegiak dira. MPI inplementazio mota desberdinak daude. Zerbitzuan hainbat ditugu instalatuta: HP-MPI, Bull-MPI,… Azkeneko bertsioak IntelMPI 4.0.3, MPIbull2 1.3, hpMPI 2.02, openMPI 1.4 eta mvapich2 1.5 dira. [intlink id=”3650″ type=”post”]Taula honetan[/intlink] erraz ikusi dezakezu bakoitza non dagoen eskuragarri.

Zalantzak badituzu edo informazio gehiago behar baduzu galdetu teknikariei.


Defektuz instalatutako liburutegiak

Defektuz erabiltzen direnak hauek dira

  • Itanium  nodoetan (Arina), MPIbull2.
  • Opteron nodoetan (Maiz) IntelMPI.
  • Xeon nodoetan (Guinness eta Katramila) Intelmpi.
  • OpenMPI Pendulon.

IntelMPI liburutegiak

Xeon y opteron nodoetan (Arina y maiz) eskuragarri daude. Defektuzkoa ez badira kargatu daitezke exekutatzen

source /software/intel/impi_latest/bin64/mpivars.sh

Inteleko Fortran, C y C++ kompiladoreak erabiltzeko exekutatu mpiifort, mpiicc e mpiicpc hurrenez hurren. GNU konpiladoreak erabiltzeko exekutatu mpif90, mpicc e mpiCC.

MPIbull2 liburutegiak

Xeon eta itanium nodoetan (Guinness eta Arina) ezkuragarri daude. Defektuzkoa ez badira kargatu daitezke exekutatzen

source /opt/mpi/mpibull2-1.3.9-18.s/share/mpibull2.sh

Inteleko Fortran, C y C++ kompiladoreak erabiltzeko exekutatu mpif90, mpicc e mpiCC.

HpMPI liburutegiak

Itanium eta opteron nodoetan (Arina y Maiz) eskuragarri daude. Defektuzkoa ez badira kargatu daitezke exekutatzen

export PATH=/opt/hpmpi/bin:$PATH

Inteleko Fortran, C y C++ kompiladoreak erabiltzeko exekutatu mpif90, mpicc e mpiCC.

OpenMPI liburutegiak

Xeon nodoetan (Guinness) eta Pendulon eskuragarri daude. /software/openmpi direktorioan instalatuta daude. Erabili ahal izateko path osoa zehaztu behar da, adibidez

/software/openmpi/bin/mpif90

Inteleko Fortran, C y C++ kompiladoreak erabiltzeko exekutatu mpif90, mpicc e mpiCC.

mvapich2 liburutegiak

Xeon nodoetan (Guinness) eskuragarri daude. /software/mvapich2 direktorioan instalatuta daude. Erabili ahal izateko path osoa zehaztu behar da, adibidez

/software/mvapich2/bin/mpif90

Inteleko Fortran, C y C++ kompiladoreak erabiltzeko exekutatu mpif90, mpicc e mpiCC.

NX Zerbitzaria

Informazio orokorra

NX terminal edo remotoko konexio grafiko bat egiteko tresna da.
Gure PC-tik aplikazio grafikoak modu eraginkorrean erabilzteko oso gomendagarria da, esate baterako, Maestro, ADFView, starccm+, gaussview ea,. bezalako programa grafikoak. Konexioa Arinarekin egiterako garaian, Guinness, Pendulo edo Maiz erabili beharko dira.

Nola erabili

Dokumentu honetan pausoz pauso azaltzen dugu nola egin konexioa.

Informazio gehiago

NX bezeroak Nomachine web-orritik jeitxi dezakezue.

Zerbitzuko baliabideak edozein  enpresa edo unibertsitatetik kanpo dagoen edozein erakundearentzat eskuragarri daude. Informazio gehiago beharrez gero [intlink id=”647″ type=”page”]arremanetan jarri Zerbitzuko Teknikeriekin[/intlink].

Empresentzako tarifak

CPU tarifa

Konputazio baliabideak erabiltzeko tarifa 0.016 €/ordu bakoitzeko eta kore bakoitzeko da (B.E.Z. gabe). Laguntza teknikoa barne dago lan eta arazo txikientzako. Ez dago barne datuentzako diskoa ezta teknikarien zerbitzu espezializatuak, hauentzako aurrekontua eskatu beharko da.

Disko tarifa

Hurrengo irizpideak jarraituz fakturatuko da.

  1. Zerbitzuak gehiago erabiltzen duena, hots datuak erabiltzen dituena, gutxiago ordainduko du. Horregatik kalkulu denboraren araberako tarifak ezartzen dira.
  2. Ez da fakturatuko 3 GB baino gutxiatik.
  3. Hilabete bakoitzeko fakturatuko da hilabete horretan erabilitako diskoaren batezbestekoa kontutan hartuz.
  4. Hurrengo taulan salneurriak erabiliko dira taldeak urtean erabili duen kalkulu denboraren arabera.
Taula: GB apartengatik ezarri diren tarifak kalkulu denboraren arabera. 
CPU erabilera Diska tarifa
(egunak) (Euro/Gb/hilabete)
2500< cpu 0.1
100< cpu <2500 0.5
1< cpu <100 1.0
0< cpu <1 1.5

B.E.Z. gabe.

Macromodel

Schrodinger-en Mekanika Molekularra erabiliz hainbat kalkuku mota egiten dituen programa da.

Informazio Orokorra

2011-ko otsaileraino izango da erabilgarria. Lizentziaren berritzea erabileraren araberakoa izango da. 18 schrodinger token daude, macromodelek 2 behar ditu kalkulatzeko. Token-en egoera ikusteko

checklicenses

tresna erabili dezakezue uneoro zenbat token libre dauden jakiteko.

Maestro erabili daiteke Macromodel programarako behar den inputa eraikitzeko. Maestro, Schrodinger-en tresna guztiak bateratzen dituen interface grafikoa da MAIZ, Guinness eta Pendulotik erabili daiteke.

Maestro egikaritzeko agindua honakoa da:

maestro &.

NX bezeroaren bitartez erabilztea gomendatzen dugu. Ikus hemen nola:

[intlink id=”2388″ type=”post”]Nola Erabili[/intlink]

Informazio Gehiago

Macromodel-en eskuliburuak arina:/software/schrodinger/docs-en daude eskuragarri.

Nola bidali Jaguar

send_jaguar komandoa

Jaguar lanak bidaltzeko send_jaguar agindua sortu dugu.

send_jaguar JOBNAME NODES PROCS_PER_NODE TIME MEM [``Other queue options'']

non

JOBNAME: Jaguarren sarrera datuen fitxategia.
NODES: Nodo kopurua.
PROCS: Prozesagailu kopurua.
TIME: Kaluluaren denbora hh:mm:ss fromatuan
MEM: memoria Gb-etan eta unitatea adierazi gabe
[``Other queue options''] Kola sistemari pasa nahi zaizkion beste aukerak.
Aukera hauei buruzko informazio gehiago.

Adibideak

  • job1 inputa duen kalkulua itaniumb motako nodo batera eta bertako 4 prozesagailu erabil ditzan esaten dugu. Memoria Gb batekoa eta denbora 4 ordu izanik.
send_jaguar job1 1 4:itaniumb 04:00:00 1
  • job3 inputa duen kalkuluari, bi nodo, eta bakoitzek 4 prozesagailu erabil ditzan eskatzen dizkiogu. Memoria 8 Gb batekoa eta denbora 60 ordu izanik. Gainera 1234 lana bukatu ondoren abiatu daitekela soilik adieratzen dugu.
send_jaguar job3 2 4 60:00:00 8  ``-W depend=afterany:1234''>
  • job3 inputa bidalzten dugu, nodo bat, eta 4 prozesagailu erabil ditzan eskatuz. Memoria 15 Gb-etakoa eta denbora 400 ordu izanik. Gainera, lana hasi eta bukatzean email bat bidaltzeko adierazten dugu nire.emaila@ehu.es helbidera.
send_jaguar job3 1 4 400:00:00 15 ``-m be -M nire.emaila@ehu.es''

Qsub interaktiboa

Kalkuluak bidali daitezke ere [intlink id=”667″ type=”post”]qsub interaktiboa.[/intlink] komandoarekin.

DL_POLY

Informazio orokorra

Daresbury Laborategian garatutako dinamika molekularreko programaren 4.02 bertsioa makromolekula, polimero, sistema ioniko, disoluzio eta beste sistema molekularentzako. Programa arkitektura guztietan instalatu egin da, Arinan eta Pédulon (2.2 bertsioa).

Nola erabili

Programa exekutatzeko idatzi skriptetan:

/software/bin/DL_POLY/DL_POLY.Z

GPGPU nodoetan sartzen bada programa GPGPUak erabilik exekutatuko da. gpu etiketa erabiliz [intlink id=”693″ type=”post”]kola sisteman[/intlink] bideratu daiteke lana GPGPU nodo batetara.

Interfaz grafikoa ere instalatu egin da. Hau exekutatzeko gomendatzen dizuegu Pendulon edo Maizen egitea, azkarragoa baita. Exekutatzeko:

/software/bin/DL_POLY/gui

Hainbat tresnen iturriak ere instalatu dira ondorengo direktorioan /software/bin/DL_POLY/.

Benchmark

Benchmark txiki batzuen datuak egin ditugu 4.02 bertsioarekin. Bai paralilizazioa bai GPGPUen eraginkortasuna neurtzen da.

System 1 cores 4 cores 8 cores 16 cores 32 cores 64 cores
Itanium 1.6 GHz 1500 419 248 149 92 61
Opteron 1230 503 264 166 74
Xeon 2.27 GHz 807 227 126 67 37 25

Lehenengo bencharmark honetan ikusten da xeon nodoak eraginkorragoak direla eta gomandagarriak lan luzeetarako. DL_POLYk oso ondo paralelizatzen du.

System 1 cores 2 cores 4 cores 8 cores 16 cores 32 cores
Itanium 1.6 GHz 2137 303 165 93 47
Opteron 1592 482 177 134 55
Xeon 2.27 GHz 848 180 92 48 28
1 GPGPU 125 114 104 102
2 GPGPU 77 72 69
4 GPGPU 53 50
8 GPGPU 37
System 1 cores 2 cores 4 cores 8 cores 16 cores 32 cores 64 cores
Xeon 2.27 GHz 2918 774 411 223 122 71
1 GPGPU 362 333 338 337
2 GPGPU 240 222 220
4 GPGPU 145 142
8 GPGPU 97

GPGPUak kalkulua bizkortzen dute. GPGPU kopurua bikoizterakoan abiadura 1.5 alditan igotzen da, hau dela etaazkenean prozesadore asko erabiltzea eraginkorragoa da. Hartu dezagun azken benchmarka. Nodo bakoitzak 8 kore ditu eta 2 GPGPU. Nodo batean GPGPUak erabiliz 220 s behar dira eta koreak erabiliz 411 s. 4 GPGPU 32 kore baino azkarragoak dira baina 64 kore jadanik 71 s behar dituzte lana bukatzeko eta 8 GPGPU 97 s. GPGPUak PC bat edo nodo batean egindako kalkulu bat dezente bizkortzen dute baina kalkulu paralelo handientzako koreetako paralelizazioa eraginkorragoa da.

DL_POLY sistema handietarako da eta milaka kore erabili ahal ditu. DL_POLYko dokumentazioaren arabera:

The DL_POLY_4 parallel performance and efficiency are considered very-good-to-excellent as long as (i) all CPU cores are loaded with no less than 500 particles each and (ii) the major linked cells algorithm has no dimension less than 4.

Informazio Gehiago

DL_POLYren web orrialde nagusi.

DL_POLYren eskuliburua (pdf).

DL_POLY interfaz grafikoaren eskuliburua (pdf).

GROMACS

Informazio orokorra

2018 bertsioa. GROMACS is a versatile package to perform molecular dynamics, i.e. simulate the Newtonian equations of motion for systems with hundreds to millions of particles.

It is primarily designed for biochemical molecules like proteins, lipids and nucleic acids that have a lot of complicated bonded interactions, but since GROMACS is extremely fast at calculating the nonbonded interactions (that usually dominate simulations) many groups are also using it for research on non-biological systems, e.g. polymers.

Nola erabili

send_gmx

GROMACS lanak kolara bidalzeko send_gmx tresna sortu dugu. Egikaritzerakona, aginduaren laguntza erakusten da. Erabiltzeko modua:

send_gmx ``JOB and Options'' NODES PROCS_PER_NODE TIME MEM [``Other queue options'' ]
``JOB and Options'': Kalkuluaren opzioak eta inputaren izena (extensioarekin). Oso garrantzitsua da komilla arten jartzea.
NODES: Nodo kopurua.
PROCS: Prozesagailu kopurua.
TIME: kolari eskatutako denbora hh:mm:ss. formatuan
MEM: memoria en Gb-etan.
[``Torque beste aukerak'' ] kola sistemari agindu gehiago pasatzeko modua.
Ikus beheko adibideak[intlink id=”632″ type=”post”]. informazio gehiago[/intlink]

Adibideak

send_gmx ``-s job1.tpr'' 1 4 04:00:00 1

send_gmx ``-s job2.tpr'' 2 8 192:00:00 8 ``-W depend=afterany:1234''

send_gmx ``-s job.tpr'' 1 8 200:00:00 2 ``-m be -M mi.email@ehu.es''

Ohiko pbs script bat sortu eta hau ere bidlai daiteke gero kolara. send_gmx erabili dezakezue adibide bat sortzeko.

Kalkuluen monitorizazioa

remote_vi  erabiliz md.log fitxeroa ikutsiko dugu.

Informazio gehiago

http://www.gromacs.org/About_Gromacs

Casino

Quantum Monte Carloren Casino programaren 2.4 bertsioa, Cambridgeko Unibertsitatean garatua.

Informazio orokorra

Sistema finituei edo periodikoei aplikatzeko programa paralelotua, uhinen funtzioak hedatzeko oinarri anizkunekin. Baimena nahitaezkoa da.

Nola erabili

Exekutatzeko erabili runqmc agindua. Honek defektuz, casino lana 8 itanium core-tara bidlaiko du, 36 ordutarako 4gb memoria eskatuz.

runqmc aginduaren beste aukerak ikusteko, exekutatu

runqmc -help

Jarraian hainbat adidbide erakusten dira:

  • Lan bat bi opteron nodo bakoitzari 8 core eskatuz bidaltzeko vfast ilarara eta 15gb RAM-a eskatuz.
runqmc -queue vfast -nnodes 2 -tpn 8 -arch opteron -mem 15072
  • Lan bat lau itanium nodoetara bakoitzari 8 core eskatuz bidaltzeko p_slow ilarara eta 22gb RAM-a eskatuz.
runqmc -queue p_slow -nnodes 4 -tpn 8 -arch itanium -mem 22072

Informazio gehiago

Casino Program home page.

Eskuliburua pdf formatuan.