2D-FEM-Benchmark auf Clustersystemen, Einzelprozessor

Gleichungssystemlöser PCGM (ohne Grobgitterlöser) als sequentieller Algorithmus
Prozessor, Compiler Zeit [s] für Level 5,
N=263.169
Zeit [s] für Level 6, 
N=1.050.625
Zeit [s] für Level 7, 
N=4.198.401
Pentium II-350, egcs-1.1.2 - f77, (TBZ Pariv) 22,2 88,1
Pentium III-450, egcs-1.1.2 - f77, (TBZ Pariv) 21,4 85,6
Pentium III-500, egcs-1.1.2 - f77, (TBZ Pariv/Fak. Mathe) 19,6 80,0
Pentium II-400, egcs-1.1.2 - f77, (Inst. Physik) 22,0 86,7
Pentium II-400,  NAG-f95, (Inst. Physik) 20,3 83,6
hpcLine, Pentium II-400, pg-f90, (RWTH Aachen) 19,3 79,3
Pentium II-330*,  g77, (Fak. Mathe) 36,6 147,3
Pentium II-330*, egcs-1.1.2 - g77, (Fak. Mathe) 29,2 117,4
Pentium II-330*NAG-f95 (Fak. Mathe) 26,7 111,0
AMD-K7-500 (Athlon), egcs-1.1.2 - g77, (TU, URZ) 16,4 71,2
Alpha-21264 DS20, f77, (Compaq) 13,0 66,3
mclick000 (PIII-450), pg-f77 -O2 19,1 79,1
mclick000 (PIII-450), pg-f77 -fast (vbasmodf)** 19,4 78,5
mclick000 (PIII-450), pg-f77 -fast (vbasmodc)** 18,3 75,5
mclick000 (PIII-450), pg-f90 -fast (vbasmodc)** 18,4 75,9
mclick000 (PIII-450), egcs-g77 -ffast-math -fexpensive-optimization ... 20,1 82,1
CLIC, g77 (vbasmodc)** 14,3 58,4
CLIC, g77 (vbasblas)** 13,7 57,8
CLIC, pgf77 14,0 58,1
CLIC, ifc -O2 -axK -tpp6 -unroll (vbasmodc)** 11,5 49,0
Itanium (900MHz), g77 -O3 -funroll-all-loops (vbasmodc)** 9,8 42,1 169,4
Itanium (900MHz), efc -O2 (vbasmodf)** 6,1 25,5 104,4
Pentium4 (1.6 GHz), g77 -O2 -funroll-all-loops (vbasmodc)** 7,1 28,7 116,1
Pentium4 (2.4 GHz), g77 -O2 -mcpu=pentium4 ... (vbasmodc)** 3,3 7,5? 56,2
Pentium4 (2.8 GHz), g77 -O2 -mcpu=pentium4 ... (vbasmodc)** 1,9 8,2 33,2
CHIC Opteron (2.6 GHz), -mcpu=x86-64 ... (vbasmodc) 1,7 7,3 32,0
* - noch mit 66 MHz Systembus
** - vbasmod enthält alle Vektoroperationen (vergleichbar mit BLAS) und liegt als Fortran- und C-Version vor, bei vbasblas wird nur ein Teil derVektoroperationen durch Routinen aus der BLAS-Bibliothek realisiert.
zu Level 5 zur Übersicht Diagramm anzeigen