Zur Charakterisierung der Einprozessor-Rechenleistung verschiedener Maschinen


Thu Mar 27 16:36:18 MET 1997

Die effektive Rechenleistung im Umlauf befindlicher Maschinen wenigstens irgendwie abzuschätzen, wurde zwischen 1992 und 1997 die folgende Tabelle gepflegt. Mit Verlaub, nicht alle der Kandidaten sind Workstations, einige sind Super-Computer.

---------------------------------------------------------------------------
cpu            cc    notes  500x500  1000x1000    rel    rel    rel    rel
description                    time       time  cache   perf   perf   mean
                           user+sys   user+sys  accel    500   1000   perf
---------------------------------------------------------------------------
rs6k/530      c89    power   159.10    1273.10   1.00   0.04   0.04   0.04
rs6k/530      gcc    power   177.40    1420.00   1.00   0.04   0.04   0.04
i486dx33-128  gcc    linux   124.69    1051.02   1.05   0.05   0.05   0.05
i486dx33-256  gcc    linux   118.41    1010.34   1.07   0.06   0.05   0.05
rs6k/550      gcc    power   107.70     861.70   1.00   0.06   0.06   0.06
rs6k/220      gcc    power   !89.50     691.10 1/1.04   0.07   0.08   0.07
rs6k/550      c89    power   >94.65     757.20   1.00   0.07   0.07   0.07
rs6k/220      c89    power   !82.40     635.50 1/1.04   0.08   0.08   0.08
i4dx2/66-128  gcc    linux    72.33     634.15   1.10   0.09   0.08   0.09
rs6k/580      gcc    power    69.60     558.70   1.00   0.09   0.09   0.09
sparc2/40     gcc   sunos4   >70.59     564.70   1.00   0.09   0.09   0.09
sparc2/40     gcc  solaris    70.40     563.50   1.00   0.09   0.09   0.09
rs6k/580      c89    power   >63.66     509.30   1.00   0.10   0.10   0.10
sparc2/40wtk  gcc   sunos4    41.00     348.20   1.06   0.16   0.15   0.16
r4k-1mb/100    cc mips2,20    26.88     236.38   1.10   0.25   0.22   0.23
r4k-1mb/100   gcc mips2,20    27.43     244.94   1.12   0.24   0.22   0.23
sparc10/40    pro  solaris    26.90     215.30   1.00   0.24   0.24   0.24
sparc1000/51  gcc  solaris    24.90     223.10   1.12   0.26   0.24   0.25
sparc1000/51  pro  solaris    24.60     217.60   1.11   0.27   0.24   0.25
sparc20-514   pro  solaris    26.20     210.40   1.00   0.25   0.25   0.25
sparc20-514   gcc  solaris    24.20     195.40   1.01   0.27   0.27   0.27
axil311mod51  gcc   sunos4    22.70     194.70   1.07   0.29   0.27   0.28
p90-256tri/a  gcc    linux    21.52     203.99   1.18   0.31   0.26   0.28
rs6k/43p-512  c89    power   !23.13     173.87 1/1.06   0.28   0.30   0.29
2000/300axp   gcc     osf1    20.80     183.90   1.11   0.32   0.29   0.30
hp9kt500/90   c89    pa7k1    18.80     180.50   1.20   0.35   0.29   0.32
l-chall/150   gcc    mips2    18.78     168.61   1.12   0.35   0.31   0.33
r4k4-1mb/150  gcc mips2,22    18.82     167.63   1.11   0.35   0.31   0.33
sparc20-61    gcc  solaris   >19.68     157.40   1.00   0.33   0.33   0.33
sparc20/602   gcc  solaris    19.90     163.60   1.03   0.33   0.32   0.33
l-chall/150    cc     mips    18.34     165.56   1.13   0.36   0.32   0.34
r4k4-1mb/150   cc mips2,22    18.26     160.60   1.10   0.36   0.33   0.34
rs6k/43p-512  c89  powerpc    17.42     151.58   1.09   0.38   0.35   0.36
hp9k725/100   gcc  pa7k1lc    17.60     143.60   1.02   0.37   0.37   0.37
l-chall/150    cc    mips2    16.33     148.97   1.14   0.40   0.35   0.38
hp9kg50/96    c89    pa7k1   >16.54     132.30   1.00   0.40   0.40   0.40
pm9500/200    gcc  mklinux    15.32     126.04   1.03   0.43   0.42   0.42
p133-256/pb   gcc    linux    14.58     129.93   1.11   0.45   0.41   0.43
2100/a500mp   c89     osf1    13.40     129.20   1.21   0.49   0.41   0.45
r5k-0mb/180    cc mips2,32    14.13     116.64   1.03   0.47   0.45   0.46
2100/a500mp   gcc     osf1    13.00     128.20   1.23   0.51   0.41   0.46
hp9kg60/96    c89    pa7k1    13.50     121.80   1.13   0.49   0.43   0.46
p200-256/t2p4 gcc    linux    13.22     120.85   1.14   0.50   0.44   0.47
p200-512/t2p4 gcc    linux    12.94     120.05   1.16   0.51   0.44   0.47
vpp300(rwth)   cc      uxp   !14.93     106.45 1/1.12   0.44   0.50   0.47
hp9k735/125   c89   pa7k15   >13.53     108.20   1.00   0.49   0.49   0.49
p200-256/gbt  gcc    linux    12.26     110.32   1.12   0.54   0.48   0.51
p6rp4/150-i2  gcc linux,a2   !12.64     100.35 1/1.01   0.52   0.53   0.52
pl-chall/75    cc    mips3    11.87     102.74   1.08   0.55   0.51   0.53
j90(sn9009)    cc   unicos   !16.70      77.12 1/1.73   0.39   0.68   0.54
pl-chall/75    cc    mips2    10.72      96.45   1.12   0.61   0.55   0.58
3000/800axp   c89     osf1     8.60     107.70   1.57   0.77   0.49   0.63
3000/800axp   gcc     osf1     8.30     106.10   1.60   0.79   0.50   0.65
vpp300(rwth)  vcc      uxp   !10.78      71.38 1/1.21   0.61   0.74   0.67
p6rp4/150-i4  gcc linux,a2    !9.78      77.53 1/1.01   0.67   0.68   0.68
pl-chall/75    cc    mips4     8.88      81.28   1.14   0.74   0.65   0.70
u-sparc170    gcc  solaris     9.20      75.50   1.03   0.72   0.70   0.71
u-sparc170    pro  solaris     9.00      73.80   1.02   0.73   0.71   0.72
u-sparc170     v8  solaris     8.90      73.10   1.03   0.74   0.72   0.73
hp9k/k450-1m  c89 pa8k/160     7.90      70.40   1.11   0.83   0.75   0.79
r10k-1mb/195   cc mips4,28     7.27      61.89   1.06   0.91   0.85   0.88
dec600_5/266  c89     osf1     6.10      72.50   1.49   1.08   0.73   0.90
rs6k/390      c89   com,57    !7.16      54.22 1/1.06   0.92   0.97   0.95
rs6k/390      c89  pwr2,57    !7.11      54.30 1/1.05   0.93   0.97   0.95
rs6k/390      c89   pwr,57    !6.97      53.15 1/1.05   0.95   0.99   0.97
xp6np5/200    gcc    linux     6.51      52.70   1.01   1.01   1.00   1.01
y-mp(sn6105)   cc   unicos    !8.76      40.08 1/1.75   0.75   1.31   1.03
hp9k/k450-1m  gcc pa8k/160     5.20      44.70   1.07   1.27   1.18   1.22
rs6k/39h-2mb  c89  pwr2,59    !5.47      41.52 1/1.05   1.20   1.27   1.24
rs6k/39h-2mb  c89   com,59    !5.35      40.55 1/1.06   1.23   1.30   1.27
rs6k/39h-2mb  c89   pwr,59    !5.28      40.03 1/1.06   1.25   1.32   1.28
rs6k/590      c89   com,70    !5.41      39.05 1/1.11   1.22   1.35   1.28
rs6k/590      c89  pwr2,70    !5.36      39.47 1/1.09   1.23   1.34   1.28
rs6k/590      c89   pwr,70    !5.32      39.19 1/1.09   1.24   1.34   1.29
c90d(sn4701)   cc   unicos    !6.88      31.54 1/1.75   0.96   1.67   1.31
r10k-4mb/190   cc mips2,27     3.11      30.68   1.23   2.12   1.72   1.92
r10k-4mb/190   cc mips4,27     3.06      31.06   1.27   2.15   1.70   1.92
r10k-4mb/190  gcc mips4,27     2.60      28.24   1.36   2.53   1.87   2.20
p4-2400/p4b   gcc    linux     1.17       9.44   1.01   5.56   5.58   5.57 (2007 eingefügte Zeile, PC, Technologie-Niveau 2002)
---------------------------------------------------------------------------

Grundsätzlich mag man von derartigen Tabellen halten was man will. Praktiker empfinden sie i.a. als angenehm, Theoretiker sollten wenigstens die Hände über dem Kopf zusammenschlagen. Unabhängig davon möchte einmal kurz dargelegt werden, wie dieselbe entstanden ist.

Ausgangspunkt war irgendwann, die CPU-Leistung von Maschinen mit typischer Workstation-Architektur beurteilen zu können, und zwar unter Berücksichtigung ihres Durchsatzes zum Hauptspeicher. Dazu wurde ein Problem aus der linearen Algebra hergenommen und in zwei verschiedenen Ausdehnungen mit Hilfe eines einzelnen Prozessors durchgerechnet. Theoretisch sollten im 500x500-Fall 1/8 der Operationen des 1000x1000-Falls abgearbeitet werden. Da der 500x500-Fall in 0-ter Näherung in einen der Caches paßt, sind Abweichungen von diesem Faktor 8 regulär. Der 1000x1000-Fall paßt in keinen der heute üblichen Caches (Stand 1997). Ferner kommt es gelegentlich vor, daß der 500x500-Fall sogar länger als 1/8 des 1000x1000-Falls dauert. Kenner der Materie werden das prinzipielle Verhalten der verschiedenen Architekturen wiedererkennen. Maschinen, bei denen in der sechsten Spalte ein Wert kleiner als Eins gefunden wird, besitzen gewisse Eigenschaften von Vektorrechnern.

Noch ein Wort zur Bewertung von SMP-Maschinen. Das besagte Test-Programm nimmt zu einem Zeitpunkt nur einen Prozessor in Anspruch. D.h., die letzte Tabellenspalte beschreibt bei SMP-Systemen die Leistung eines der Prozessoren.

Abschlußbemerkung: Die Ergebnisse obiger Tabelle grundsätzlich besser zu verstehen, wurde inzwischen ein weiteres, völlig anders geartetes Experiment an ausgewählten Maschinen vorgenommen.

2013 eingefügter Kommentar: Für all diejenigen, die das nicht gleich erkennen, sei bemerkt, daß also ein PC, Technologie-Niveau 2002, im konkreten Fall viermal so schnell rechnet wie ein Super-Computer, erschienen 1991. Während man das in den Rechenzentren heute wieder gelassen sehen kann, wurde so etwas früher nur hinter vorgehaltener Hand zum Besten gegeben.


Thu Mar 27 16:36:18 MET 1997
Stephan K.H. Seidl