Rechenleistung für Skalarproduktberechnung

Mit je drei verschiedenen Fortran- und C-Compilern wurden jeweils verschiedene Versionen der Skalarproduktberechnung untereinander und mit der für Pentium-III optimierten BLAS-Routine (sblas13d.a) verglichen.
Gerechnet wurde auf Pentium III-800 und zum Vergleich auf einer HP Workstation P8000-236MHz, sowie einem Athlon-PC, 500MHz).
Die Rechenleistung (Mflop/s) wird in Abhängigkeit von der Vektorlänge betrachtet (man kann leider nicht ewig im Cache rechnen).

Die Programmversionen: Die benutzten Compileroptionen:

Pentium III-800: GNU-Compiler | PGI-Compiler | Intel-Compiler

zum Vergleich: HPPA-Workstation | Athlon-500 | SGIn32 (R5000)

Pentium 4, 1.6 GHz: GNU-Compiler | Intel-Compiler

weitere Vergleiche: Pentium4 | Itanium (g77/gcc) | Itanium (efc/ecc)
Xeon (3GHz, g77/gcc) - "artus" | "hilbert"

Mflops bei Skalarprodukt