DL_POLY | IZO-SGI Kalkulu Zientifikoa

Informazio orokorra

Daresbury Laborategian garatutako dinamika molekularreko programaren 4.02 bertsioa makromolekula, polimero, sistema ioniko, disoluzio eta beste sistema molekularentzako. Programa arkitektura guztietan instalatu egin da, Arinan eta Pédulon (2.2 bertsioa).

Nola erabili

Programa exekutatzeko idatzi skriptetan:

/software/bin/DL_POLY/DL_POLY.Z

GPGPU nodoetan sartzen bada programa GPGPUak erabilik exekutatuko da. gpu etiketa erabiliz [intlink id=”693″ type=”post”]kola sisteman[/intlink] bideratu daiteke lana GPGPU nodo batetara.

Interfaz grafikoa ere instalatu egin da. Hau exekutatzeko gomendatzen dizuegu Pendulon edo Maizen egitea, azkarragoa baita. Exekutatzeko:

/software/bin/DL_POLY/gui

Hainbat tresnen iturriak ere instalatu dira ondorengo direktorioan /software/bin/DL_POLY/.

Benchmark

Benchmark txiki batzuen datuak egin ditugu 4.02 bertsioarekin. Bai paralilizazioa bai GPGPUen eraginkortasuna neurtzen da.

System	1 cores	4 cores	8 cores	16 cores	32 cores	64 cores
Itanium 1.6 GHz	1500	419	248	149	92	61
Opteron	1230	503	264	166	74
Xeon 2.27 GHz	807	227	126	67	37	25

Lehenengo bencharmark honetan ikusten da xeon nodoak eraginkorragoak direla eta gomandagarriak lan luzeetarako. DL_POLYk oso ondo paralelizatzen du.

System	1 cores	2 cores	4 cores	8 cores	16 cores	32 cores
Itanium 1.6 GHz	2137		303	165	93	47
Opteron	1592		482	177	134	55
Xeon 2.27 GHz	848		180	92	48	28
1 GPGPU	125	114	104	102
2 GPGPU		77	72	69
4 GPGPU			53	50
8 GPGPU				37

System	1 cores	2 cores	4 cores	8 cores	16 cores	32 cores	64 cores
Xeon 2.27 GHz	2918		774	411	223	122	71
1 GPGPU	362	333	338	337
2 GPGPU		240	222	220
4 GPGPU			145	142
8 GPGPU				97

GPGPUak kalkulua bizkortzen dute. GPGPU kopurua bikoizterakoan abiadura 1.5 alditan igotzen da, hau dela etaazkenean prozesadore asko erabiltzea eraginkorragoa da. Hartu dezagun azken benchmarka. Nodo bakoitzak 8 kore ditu eta 2 GPGPU. Nodo batean GPGPUak erabiliz 220 s behar dira eta koreak erabiliz 411 s. 4 GPGPU 32 kore baino azkarragoak dira baina 64 kore jadanik 71 s behar dituzte lana bukatzeko eta 8 GPGPU 97 s. GPGPUak PC bat edo nodo batean egindako kalkulu bat dezente bizkortzen dute baina kalkulu paralelo handientzako koreetako paralelizazioa eraginkorragoa da.

DL_POLY sistema handietarako da eta milaka kore erabili ahal ditu. DL_POLYko dokumentazioaren arabera:

The DL_POLY_4 parallel performance and efficiency are considered very-good-to-excellent as long as (i) all CPU cores are loaded with no less than 500 particles each and (ii) the major linked cells algorithm has no dimension less than 4.

Informazio Gehiago

DL_POLYren web orrialde nagusi.

DL_POLYren eskuliburua (pdf).

DL_POLY interfaz grafikoaren eskuliburua (pdf).