Informazio orokorra
Daresbury Laborategian garatutako dinamika molekularreko programaren 4.02 bertsioa makromolekula, polimero, sistema ioniko, disoluzio eta beste sistema molekularentzako. Programa arkitektura guztietan instalatu egin da, Arinan eta Pédulon (2.2 bertsioa).
Nola erabili
Programa exekutatzeko idatzi skriptetan:
/software/bin/DL_POLY/DL_POLY.Z
GPGPU nodoetan sartzen bada programa GPGPUak erabilik exekutatuko da. gpu
etiketa erabiliz [intlink id=”693″ type=”post”]kola sisteman[/intlink] bideratu daiteke lana GPGPU nodo batetara.
Interfaz grafikoa ere instalatu egin da. Hau exekutatzeko gomendatzen dizuegu Pendulon edo Maizen egitea, azkarragoa baita. Exekutatzeko:
/software/bin/DL_POLY/gui
Hainbat tresnen iturriak ere instalatu dira ondorengo direktorioan /software/bin/DL_POLY/
.
Benchmark
Benchmark txiki batzuen datuak egin ditugu 4.02 bertsioarekin. Bai paralilizazioa bai GPGPUen eraginkortasuna neurtzen da.
System | 1 cores | 4 cores | 8 cores | 16 cores | 32 cores | 64 cores |
Itanium 1.6 GHz | 1500 | 419 | 248 | 149 | 92 | 61 |
Opteron | 1230 | 503 | 264 | 166 | 74 | |
Xeon 2.27 GHz | 807 | 227 | 126 | 67 | 37 | 25 |
Lehenengo bencharmark honetan ikusten da xeon nodoak eraginkorragoak direla eta gomandagarriak lan luzeetarako. DL_POLYk oso ondo paralelizatzen du.
System | 1 cores | 2 cores | 4 cores | 8 cores | 16 cores | 32 cores |
Itanium 1.6 GHz | 2137 | 303 | 165 | 93 | 47 | |
Opteron | 1592 | 482 | 177 | 134 | 55 | |
Xeon 2.27 GHz | 848 | 180 | 92 | 48 | 28 | |
1 GPGPU | 125 | 114 | 104 | 102 | ||
2 GPGPU | 77 | 72 | 69 | |||
4 GPGPU | 53 | 50 | ||||
8 GPGPU | 37 |
System | 1 cores | 2 cores | 4 cores | 8 cores | 16 cores | 32 cores | 64 cores |
Xeon 2.27 GHz | 2918 | 774 | 411 | 223 | 122 | 71 | |
1 GPGPU | 362 | 333 | 338 | 337 | |||
2 GPGPU | 240 | 222 | 220 | ||||
4 GPGPU | 145 | 142 | |||||
8 GPGPU | 97 |
GPGPUak kalkulua bizkortzen dute. GPGPU kopurua bikoizterakoan abiadura 1.5 alditan igotzen da, hau dela etaazkenean prozesadore asko erabiltzea eraginkorragoa da. Hartu dezagun azken benchmarka. Nodo bakoitzak 8 kore ditu eta 2 GPGPU. Nodo batean GPGPUak erabiliz 220 s behar dira eta koreak erabiliz 411 s. 4 GPGPU 32 kore baino azkarragoak dira baina 64 kore jadanik 71 s behar dituzte lana bukatzeko eta 8 GPGPU 97 s. GPGPUak PC bat edo nodo batean egindako kalkulu bat dezente bizkortzen dute baina kalkulu paralelo handientzako koreetako paralelizazioa eraginkorragoa da.
DL_POLY sistema handietarako da eta milaka kore erabili ahal ditu. DL_POLYko dokumentazioaren arabera:
The DL_POLY_4 parallel performance and efficiency are considered very-good-to-excellent as long as (i) all CPU cores are loaded with no less than 500 particles each and (ii) the major linked cells algorithm has no dimension less than 4.