Leistung
Mit ihrem Register File kann die SP sechzehn 8-Bit-, acht 16-Bit-, vier 32-Bit-Integer- oder vier Gleitkomma-Zahlen pro Taktzyklus bearbeiten. Bei 3,2 GHz Taktfrequenz liefert eine SPE damit 4 x 3,2 GHz = 12,8 GFlops, alle acht insgesamt 8 x 12,8 = 102,4 GFlops Rechenleistung. Nach sechs Taktzyklen (Latenzzeit) ist das Ergebnis bei einfacher Genauigkeit verfügbar. Bei doppelter Genauigkeit (zwei 64-Bit-Gleitkomma-Zahlen) kann alle sieben Taktzyklen mit einer totalen Latenzzeit von dreizehn Taktzyklen eine Operation initiiert werden.
Üblicherweise wird die Angabe der Flops-Leistung mit dem Faktor 2 multipliziert, wenn das System Multiplikation und Addition zusammen in einem Zyklus (Multiply-Add-Instruction) durchführen kann. Damit ergibt sich für den Cell BE eine Rechenleistung von 25,6 GFlops beziehungsweise 204,8 GFlops für alle SPEs. Dies ist konform zur Angabe seitens IBM, das heißt 2 x 8 x 4 = 64 Gleitkomma-Operationen pro Taktzyklus. Ingesamt leistet der Cell BE Spitzenwerte von über 256 GFlops bei einfacher und über 26 GFlops bei doppelter Genauigkeit.
Die Leistung eines Mehrprozessorsystems hängt neben der Taktfrequenz von den folgenden Faktoren wesentlich ab:
-
Max. Ausnutzung aller Einheiten (Pipelining, In-Order-Ausführung, gute Sprungvorhersagen)
-
Hohe interne und externe Datenbandbreiten
-
Datenkohärenz und effektiver Mikrocode (SIMD)