Auch wenn der Power-Kern (PPE) Dual-Threading beherrscht, so sind die beiden Threads nicht unabhängig voneinander, da einige Hardware-Ressourcen des PPE gemeinsam genutzt werden. Zur Programmoptimierung empfiehlt IBM, den PPE nur die nötigste Arbeit durchführen zu lassen und den Großteil an die SPEs zu delegieren.
Nur wenn das Programm für den CELL optimiert ist, kann die CPU seine volle Leistung entfalten. Auch während alle acht SPEs aktiv sind, kann sich der PPE anderen Aufgaben widmen. Die Developer-Resource-Seiten von IBM geben dazu nähere Angaben.
Im Vergleich zu einem aktuellen 3,2-GHz-Prozessor ist der Cell BE beim 4kx4k-Linpack-Benchmark mit einfacher Genauigkeit um den Faktor 6 schneller. Je nach Anwendung und Algorithmus ergibt sich laut IBM eine Performance-Steigerung von 0,9 bis 35 bei Einsatz des Cell BE.