Test: So schnell ist AMDs neuer Desktop-Prozessor Phenom 9600 mit K10-Architektur

22.11.2007 von Christian Vilsbeck
AMD geht mit dem lange erwarteten Phenom für Desktop-PCs an den Start. Mit nativem K10-Quad-Core, neuer Cache-Hierarchie und viel Architekturfeinschliff tritt der 2,3 GHz schnelle Phenom 9600 gegen Intels Core-2-Prozessoren an.

AMD geht mit dem lange erwarteten "Phenom" für Desktop-PCs an den Start. Mit nativem K10-Quad-Core, neuer Cache-Hierarchie und viel Architekturfeinschliff tritt der 2,3 GHz schnelle Phenom 9600 gegen Intels Core-2-Prozessoren an.

Von Christian Vilsbeck, TecChannel

Testbericht

Der „alt gediente“ Dual-Core-Prozessor Athlon 64 X2 unterliegt dem Core 2 Duo in fast allen Bereichen hoffnungslos. Und gegen die Quad-Core-Modelle von Intel sehen AMDs Doppelkerner mit K8-Core in Multitask-Umgebungen sowie bei multithreaded programmierten Anwendungen kein Land mehr.

Eine neue Architektur und vor allem ein Quad-Core-Prozessor für Desktop-PCs waren für AMD längst überfällig. Mit der neuen Phenom-9000-Serie will der Hersteller nun endlich wieder mehr als nur konkurrenzfähige CPUs im Angebot haben. So vereint die K10-Architektur des Phenom vier Kerne auf einem Siliziumplättchen. Außerdem peppt AMD seinen Prozessor mit zahlreichen Architekturerweiterungen auf.

AMD Phenom 9600: Der 65-nm-Quad-Core-Prozessor für den Sockel AM2+ arbeitet mit 2,3 GHz Taktfrequenz. Alle vier Kerne sind auf einem Siliziumplättchen vereint.

Schwachstellen der K8-Mikroarchitektur des Athlon 64 X2 merzt AMD beim Phenom gezielt aus. So erhält die neue Desktop-CPU-Generation eine deutliche Verbesserung bei der SSE-Befehlsverarbeitung. Auch die Cache-Struktur optimierte AMD mit einem zusätzlichen L3-Cache. Und der weiterhin integrierte Dual-Channel-Speicher-Controller steuert schnelleres DDR2-1066-SDRAM an.

Die Interaktion mit der Grafikkarte erfolgt nun über HyperTransport 3.0 mit verdoppelter Bandbreite. Und für geizigen Umgang mit der Energie soll Cool’n’Quiet 2.0 sorgen. Jeder der vier Kerne kann mit voneinander unabhängiger Taktfrequenz arbeiten.

Die Summe der Neuerungen klingt in der Theorie vielversprechend. Doch genügt die Taktfrequenz von 2,3 GHz des neuen Phenom 9600, um gegen Intels Quad-Core-Prozessoren bestehen zu können? Im TecChannel-Testlabor fühlen wir AMDs Phenom und seinen Konkurrenten intensiv auf den Zahn. Unter Windows Vista setzen wir von Profianwendungen wie 3ds Max 2008 über das weit verbreitete iTunes 7.5 bis hin zum DirectX-10-Spiel Crysis einen modernen Applikationsmix ein. Die Linux-Distribution CentOS 5 fordert zudem die 64-Bit-Performance der CPUs bei wissenschaftlichen Berechnungen.

Die Ergebnisse unseres Benchmark-Parcours und Energiemessungen ergeben eindeutige Sieger und Verlierer.

Details zum Phenom

Mit der Phenom-9000-Serie bietet AMD seine ersten auf der K10-Architektur basierenden Desktop-Prozessoren an. Der native Quad-Core-Chip des Phenom besitzt pro Kern einen dedizierten 128 KByte fassenden L1-Cache - je 64 KByte für Daten und Befehle – sowie den 512 KByte großen L2-Cache. Alle vier Kerne greifen zusätzlich auf einen 2 MByte großen gemeinsam nutzbaren L3-Cache zurück. Die Daten-Cache-Bandbreite verdoppelte AMD beim Phenom gegenüber der K8-AMD64-Generation mit 2 x 128 Bit Loads pro Taktzyklus.

Stufenplan: AMDs Phenom arbeitet mit einer dreistufigen Cache-Struktur. Den 2 MByte großen L3-Cache müssen sich alle vier Kerne teilen. (Quelle: AMD).

Beim Athlon 64 X2 ist der SSE-Pfad nur 64 Bit breit. Dadurch muss die K8-CPU einen 128-Bit-SSE-Befehl in zwei 64-Bit-Happen aufteilen. Der K10-Core des Phenom liest laut AMD dagegen zwei 128-Bit-SSE-Befehle pro Taktzyklus ein. Damit erlaubt ein Phenom-Kern bis zu vier Floating-Point-Operationen in doppelter Präzision pro Taktzyklus.

Neue SSE4a-Befehle (EXTRQ, INSERTQ, MOVNTSD und MOVNTSS) sowie Erweiterungen für die Bit-Manipulation (LZCNT und POPCNT) implementiert AMD ebenfalls. Damit will AMD die bisher geringere SSE-Performance gegenüber den Intel-Prozessoren wettmachen.

Als Steckplatz nutzt der Phenom den neuen Socket AM2+ mit HyperTransport 3.0. Bei einer Taktfrequenz von 3,6 GHz erlaubt die Phenom-9000-Serie damit eine Busbandbreite von 14,4 GByte/s. Die mit 2,0 GHz operierende HyperTransport-2.0-Schnittstelle des Athlon 64 X2 ermöglicht theoretische Bandbreiten von 8,0 GByte/s.

Nativer Quad-Core: AMDs K10-Architektur vereint vier Prozessorkerne auf einem Siliziumplättchen. Im unteren Bereich des Bildes sehen Sie den für alle Cores gemeinsamen 2 MByte großen L3-Cache. (Quelle: AMD)

Durch Cool’n’Quiet 2.0 können alle vier Kerne des Phenom mit voneinander unabhängiger Taktfrequenz arbeiten. Die Core-Spannung orientiert sich jeweils am Kern mit der aktuell höchsten Taktfrequenz. Die integrierte Northbridge der Phenom-Prozessoren darf unabhängig von den Kernen mit einer eigenen Spannung arbeiten. Die hierfür notwendige „Split Power Plane“ ist in Mainboards mit Socket AM2+ zwingend. Der Phenom arbeitet laut AMD auch in Socket-AM2-Boards, dann aber mit geringerer HyperTransport-Geschwindigkeit und mit weniger Powermanagement-Features.

Alle Phenom-Prozessoren fertigt AMD in seinem 65-nm-Prozess. Auf dem 283 mm² großen Siliziumplättchen breiten sich 463 Millionen Transistoren aus.

Modelle und Taktfrequenzen

AMD bietet die Quad-Core-Prozessoren der Phenom-9000-Serie zum Start mit zwei Modellen an. Als Einstiegsversion fungiert der Phenom 9500 mit 2,2 GHz Taktfrequenz. Beim Phenom 9600 hebt AMD den Arbeitstakt auf 2,3 GHz an. Das ursprünglich zum Launch ebenfalls vorgesehene Topmodell Phenom 9700 mit 2,4 GHz Taktfrequenz strich AMD kurzfristig aus dem Programm. Die CPU soll laut AMD im ersten Quartal 2008 auf den Markt kommen.

Alle Phenom-9000-Modelle setzen auf den Socket AM2+ mit HyperTransport 3.0. Der serielle Prozessorbus arbeitet jeweils mit 3,6 GHz Taktfrequenz. Beim Phenom steuert der integrierte Dual-Channel-Speicher-Controller unverändert ungepufferte DDR2-DIMMs an. Allerdings beherrschen die CPUs nun Speichergeschwindigkeiten bis 1066 MHz.

Modellpalette: Zum Start am 19. November 2007 gibt es zwei Phenom-9000-Modelle mit 2,2 und 2,3 GHz Taktfrequenz.

AMD gibt für den Phenom 9500 und 9600 einen TDP-Wert von 95 Watt an. Beim später zu erwartenden 2,4-GHz-Modell Phenom 9700 steigt der Wert auf 125 Watt. Damit liegt das 2,4-GHz-Quad-Core-Topmodell auf dem gleichen thermischen Theoriewert wie AMDs schnellste Dual-Core-CPU Athlon 64 X2 6400+ mit 3,2 GHz und 90 nm Strukturbreite.

Voraussichtlich im ersten Quartal 2008 will AMD die Phenom FX-80 Serie vorstellen. Die CPUs für die 2-Sockel-Enthusiast-Plattform setzen auf den Socket 1207FX+ und bieten ebenfalls HyperTransport-3.0-Unterstützung. Im ersten Quartal 2008 folgt auch die Phenom-8000-Serie mit Triple-Core für den Socket AM2+. Sukzessive stellt AMD dann K10-basierende Dual-Core-Prozessoren als neue Athlon-6000-Serie vor. Single-Core-Modelle mit K10-Architektur wird AMD als Athlon-1000-Serie lancieren.

Laut AMD bieten die Phenom-CPUs im ersten Quartal 2008 bis zu 2,6 GHz Taktfrequenz. Noch bis Mitte 2008 will der Hersteller 3,0 GHz erreichen.

SYSmark2007: Overall

Mit dem Benchmark-Paket SYSmark2007 Preview bietet BAPCo eine aktualisierte Version zur Ermittlung der Systemleistung. Wie bei der Vorgängerversion SYSmark 2004 SE kommen 17 Anwendungen zum Einsatz, deren Zusammensetzung hat sich allerdings geändert. Der neue Benchmark enthält vier Workload-Szenarios: E-Learning, Office Productivity, Video Creation und 3D-Modeling.

SYSmark2007 Preview öffnet mehrere Programme gleichzeitig und lässt die Applikationen teilweise auch im Hintergrund arbeiten. Somit profitieren Dual- und Quad-Core-CPUs von zusätzlichen Prozessorkernen.

Neben den Geschwindigkeitswerten für die Szenarios gibt SYSmark2007 einen daraus resultierenden Gesamtwert für die Systemperformance aus.

Gesamtwertung: Die Systemleistung des Phenom 9600 enttäuscht. Die Architekturerweiterungen und Kernverdoppelung gleichen gegenüber dem Athlon 64 X2 6400+ gerade mal den Taktfrequenznachteil aus. Intels Core-2-Prozessoren bleiben für AMD unerreichbar.

SYSmark2007: Office Productivity

Der Workload Office Productivity von SYSmark2007 Preview erstellt Datenanalysen mit gebräuchlichen Office-Applikationen. Kommunikation, Projekt-Management und Datei-Operationen komplettieren das Szenario.

Folgende Applikationen setzt SYSmark2007 Preview ein: Microsoft Excel 2003, Outlook 2003, PowerPoint 2003, Word 2003 und Project 2003 sowie WinZip 10.0.

Office Productivity: Der Phenom 9600 erzielt gegenüber dem Athlon 64 X2 6400+ mit 900 MHz weniger Taktfrequenz zwar eine respektable Leistung. Den Produktivitätsvergleich mit Intels Core-2-Prozessoren verliert der neue K10-Prozessor aber deutlich.

SYSmark2007: E-Learning

Im Workload E-Learning führt SYSmark2007 Preview Applikationen aus dem Umfeld von Online-Schulungen durch. Eine Vielzahl von Bildern, Videos und Audio-Content werden über eine Website als Schulungsmaterial präsentiert. SYSmark2007 Preview nutzt folgende Programme: Adobe Illustrator CS2 und Photoshop CS2, Macromedia Flash 8 und Microsoft PowerPoint 2003.

E-Learning: In diesem Szenario skaliert die Performance mehr mit der Taktfrequenz als mit der Kernanzahl. Auch hier düpiert der Core 2 Quad Q6600 (2,4 GHz) – der preisliche Hauptkonkurrent – den Phenom 9600 (2,3 GHz).

SYSmark2007: Video Creation & 3D Modeling

Der Workload Video Creation in SYSmark2007 Preview verwendet insgesamt fünf verschiedene Applikationen. Hierzu zählen Adobe After Effects 7, Illustrator CS2 und Photoshop CS2, Microsoft Windows Media Encoder 9 Series sowie Sony Vegas 7.

Das Szenario erzeugt ein Video unter Verwendung von Spezialeffekten und Bildern verschiedener Quellen. Der Content wird für Online-Streaming und als High-Resolution-Material produziert.

Video Creation: In diesem Szenario dominieren SMP-fähige Anwendungen. Der Phenom 9600 setzt sich erstmals von den Doppelkernen Athlon 64 X2 6400+ und Core 2 Duo E6750 ab. Höhere Taktfrequenzen sorgen nur für ein bescheidenes Leistungsplus. Bei den Intel-CPUs sorgt schnellerer Speicher für mehr Performance – der Core 2 Extreme QX9650 fällt mit DDR2-800-Mainboard deutlich zurück.

Im Workload 3D Modeling wird mit AutoDesk 3ds Max 8 und SketchUp 5 eine Animation sowie eine photorealistische Darstellung eines Gebäudes erstellt.

3D Modeling: Der Phenom 9600 bildet wieder das Schlusslicht. Die Kernverdoppelung und die Architekturerweiterungen können den Taktfrequenznachteil nicht kompensieren.

PCMark Vantage: Overall

Futuremarks PCMark Vantage wurde speziell für Windows Vista entwickelt. Das Analysetool ermittelt die Gesamtleistung eines Systems. Multi-Core-Prozessoren, Speicher, Grafikkarte und das Storage-Subsystem werden in verschiedenen Szenarios beansprucht und getestet. Den Gesamtwert für die System-Performance stellt PCMark Vantage aus den einzelnen Szenarios Memories, TV and Movies, Gaming, Music, Communications, Productivity und HDD zusammen.

Gesamtwertung: AMDs Phenom 9600 verfehlt das Leistungsniveau von Intels Core 2 Quad Q6600. Immerhin kann sich der Phenom trotz 900 MHz geringerer Taktfrequenz von der Dual-Core-CPU Athlon 64 X2 6400+ etwas absetzen.

PCMark Vantage: Communications & Productivity

Im Szenario Communications von PCMark Vantage wird die Leistungsfähigkeit des Systems bei typischen Kommunikationsanwendungen ermittelt. Hierzu zählen E-Mail, Verschlüsselung und entpacken von Dateien, Audio Transcoding für VoIP oder Darstellung von grafischen Content im Browser.

PCMark Vantage nutzt beim Szenario Communications bis zu drei parallel arbeitende Tasks. Multi-Core-Prozessoren profitieren von ihren Kernen.

Communications: Während sich AMDs Phenom 9600 vom Athlon 64 X2 6400+ absetzen kann, muss der Core 2 Quad Q6600 den Doppelkerner Core 2 Duo E6750 ziehen lassen. Allerdings arbeitet der E6750er mit einem schnelleren FSB1333 und DDR3-1333. Der Phenom bietet mit DDR2-1066 knapp vier Prozent mehr Performance gegenüber DDR2-800-Speicher.

Beim Szenario Productivity Suite führt PCMark Vantage typische Standardaufgaben am PC durch. Hierzu zählt das Laden von Applikationen, Texte editieren, suchen in Datenbanken, E-Mail-Verwaltung oder das Öffnen von Websites mit dem Internet Explorer 7 in separaten Tabs.

PCMark Vantage nutzt auch beim Szenario Productivity Suite bis zu drei parallel arbeitende Tasks. Multi-Core-Prozessoren profitieren von ihren Kernen.

Productivity Suite: Die Quad-Core-Prozessoren sind hier im Vorteil. AMDs Phenom 9600 kann das Leistungsniveau des Core 2 Quad Q6600 nur mit Mühe halten. Immerhin schlägt der Athlon 64 X2 6400+ ausnahmsweise mal den Core 2 Duo E6750.

Analyse: SunGard ACR

SunGards Adaptiv Credit Risk 3.0 ist ein Analysetool für den Finanzbereich. Basierend auf modifizierten Monte-Carlo-Simulationen berechnet das Programm den künftigen Wert einer Anlage auf Basis vorhandener Marktdaten.

SunGards Adaptiv Credit Risk wurde in C# für Microsofts .NET-Umgebung programmiert. Spezielle Mathematik-Bibliotheken wie Intels MKL oder AMDs Core Math Library ACML verwendet Adaptiv Credit Risk nicht. Das Analysetool arbeitet multithreaded und unterstützt Multiprozessor-Systeme optimal. SunGard rechnet überwiegend mit Integer-Operationen. Speicherzugriffe halten sich bei Adaptiv Credit Risk in Grenzen.

Schnelle Vorhersagen: Der 2,3-GHz-Phenom analysiert 53 Prozent schneller als der 3,2-GHz-Dual-Core-Athlon. Wird bei SunGard die sehr gute Skalierung der Performance mit höheren Taktfrequenzen berücksichtigt, so würde der Phenom bei einem Arbeitstakt auf dem Niveau der Core-2-Vierkernmodelle eine ähnliche Leistung bieten.

Rendering: 3ds Max 2008

Autodesk bietet mit 3ds Max 2008 eine professionelle Software für 3D-Modelling, Animation und Rendering an. Bei den Render-Vorgängen nutzt 3ds Max 2008 Multiprocessing voll aus.

Die gewählten Render-Szenen „Space Flyby“ und „Underwater Escape“ basieren auf der Benchmark-Suite SPECapc for 3ds Max von SPEC.org. Die Grafikkarten-Performance spielt beim Rendering keine Rolle, die OpenGL/DirectX-basierenden Tests der SPECapc-Suite verwenden wir nicht.

Szene „Space Flyby“: AMDs Phenom arbeitet 11 Prozent langsamer als der preislich günstigere Core 2 Quad Q6600. Die Speicher-Performance ist hier nebensächlich, wie der Phenom und Core 2 Extreme QX9650 mit unterschiedlichen DIMMs zeigen.
Szene „Underwater Escape“: Bei diesem Render-Workload arbeitet der Phenom 19 Prozent langsamer als der Core 2 Quad Q6600. Die Puffergrößen von 512 KByte L2-Cache pro Kern und 2 MByte shared L3-Cache reichen jetzt nicht mehr ganz aus. Beim Core 2 Quad sind mit 8 MByte L2-Cache noch Reserven vorhanden.

Rendering: CINEBENCH 10

Mit dem CINEBENCH 10 stellt Maxon die aktuelle Version des bekannten Benchmark-Tools bereit. CINEBENCH 10 basiert auf Cinema 4D Release 10 und führt wieder Rendering-Tests durch. Maxon bietet CINEBENCH 10 als 32- und 64-Bit-Version zum Download an.

Beim Render-Test wird eine photorealistische 3D-Szene mit Hilfe des Cinema-4D-Raytracers berechnet. Die Szene enthält unter anderem Lichtquellen, Schatteneffekte sowie Multi-Level-Reflektionen. Bei dem FPU-lastigen Test spielt die Leistungsfähigkeit der Grafikkarte keine Rolle. Auch höhere Speicher- und FSB-Bandbreiten nutzen beim Rendering von CINEBENCH 10 wenig - der Test läuft überwiegend in den Cache-Stufen ab.

1 Thread: Beim Rendering wird jetzt nur ein Prozessorkern verwendet - Multi-Core nutzt hier nichts. AMDs K10-Kern des Phenom arbeitet bei einer 28 Prozent geringeren Taktfrequenz bei gleichem Speicher auch entsprechend langsamer als der K8-Core des Athlon 64 X2 6400+.
Alle Threads: Jetzt nutzt CINEBENCH alle verfügbaren Prozessorkerne. Im Quad-Core-Vergleich muss der Phenom 9600 den langsamsten Intel-Vierkerner Core 2 Quad Q6600 mit einer 17 Prozent höheren Performance ziehen lassen. Die Taktfrequenz des Q6600 ist mit 2,4 GHz dagegen nur vier Prozent höher als beim Phenom.

Audio-Enkodieren: iTunes 7.5

Apples iTunes 7.5 ermöglicht das Enkodieren von verschiedenen Audio-Formaten. Über den integrierten MP3-Codec wandelt die digitale Jukebox beispielsweise WAV-Audio-Files in komprimierte MP3-Dateien um. Beim MP3-Enkodieren nutzt iTunes 7.5 zwei Threads und somit die Vorteile von Dual-Core-Prozessoren aus. Quad-Core-CPUs profitieren von ihren zusätzlichen Kernen nicht.

Um die Enkodier-Performance der CPUs zu überprüfen, legen wir die 13 Musikstücke der Audio-CD „Gwen Stefani: Love. Angel. Music. Baby.“ mit einer Gesamtspieldauer von 52,1 Minuten mit iTunes als unkomprimierte WAV-Dateien auf die Festplatte. Die folgende MP3-Erstellung erledigt iTunes mit einer Audio-Qualität von 192 kbps.

Vertont: Weil iTunes nur zwei Threads beim Enkodieren nutzt, profitieren die Quad-Core-Modelle nicht von ihren vier Kernen. Der Phenom hinkt trotz ähnlicher Taktfrequenz dem Core 2 Quad Q6600 deutlich hinterher.

Video-Enkodieren: iTunes 7.5

Mit Apples iTunes 7.5 wandeln wir außerdem mit den integrierten De- und Encodern den 1080i-High-Definition-Trailer von Ice Age 2 im H.264-Format ins MPEG-4-Format mit 124 KBit/s und einer „mobilen“ Auflösung von 640 x 352 Bildpunkten. Dieses Video-Format ist für Apples iPod Touch und iPhone optimiert. iTunes 7.5 nutzt beim Umwandeln des Videos die Vorteile von Dual-Core-Prozessoren aus.

Kurzfilm: Wie beim Audio-Enkodieren nutzt iTunes nur zwei Threads. Der Phenom belegt deshalb weiterhin den letzten Platz.

OpenGL: SPECviewperf 10

Die Leistungsfähigkeit von OpenGL-Anwendungen verifizieren wir mit dem neuen SPECviewperf 10 der SPECopc. Schließlich sehen sowohl Intel als auch AMD ihre Sprösslinge gerne im professionellen Workstation-Markt. Das CAD-Paket beinhaltet neun verschiedene Tests, basierend auf realen CAD/CAM-Anwendungen: 3ds Max, CATIA, EnSight, Maya, Pro/ENGINEER, SolidWorks, UGS Teamcenter Visualization Mockup und UGS NX.

Besonders die Anwendung Pro/ENGINEER (proe-04) stresst die Grafikkarte. Das dargestellte Modell im Workload besteht aus 3,9 bis 5,9 Millionen Eckpunkten. Jeder schattierte Frame des Modells beinhaltet mehr als 100 MByte an Status- und Vertex-Informationen.

Pro/ENGINEER: Multi-Core nutzt hier nichts. Der Phenom 9600 entlockt der Grafikkarte eine 17 Prozent höhere Framerate gegenüber dem Athlon 64 X2 6400+. Hier zahlt sich der Architekturfeinschliff des K10-Kern aus. Allerdings bleiben die Core-2-Modelle in Führung.

Die Einzelergebnisse von SPECviewperf 10 in der Tabelle zeigen, dass die OpenGL-Performance sehr abhängig von der Applikation ist:

SPECviewperf 10

Prozessor

3dsmax-04

catia-02

ensight-03

maya-02

proe-04

sw-01

tcvis-01

ugnx-01

Athlon 64 X2 6400+ DDR2-800

10,8

7,5

13,5

20,6

8,8

14,0

3,9

4,6

Phenom 9600 DDR2-800

11,2

7,4

13,6

20,7

10,1

9,9

2,4

4,0

Phenom 9600 DDR-1066

11,2

7,5

13,8

21,7

10,3

9,9

2,4

4,2

Core 2 Duo E6750 DDR3-1333

14,5

14,3

15,0

31,2

12,6

19,8

4,6

4,3

Core 2 Quad Q6600 DDR3-1066

12,0

7,6

15,0

21,8

10,5

11,2

2,7

4,2

Core 2 XE QX9650 DDR2-800

15,3

10,5

16,9

26,6

13,0

11,5

3,3

4,3

Core 2 XE QX9650 DDR3-1333

15,4

8,7

16,8

27,3

13,0

12,3

3,2

4,3

Obwohl je nach Applikation die Prozessoren die Grafikkarte unterschiedlich gut unterstützen, bleibt AMDs Phenom 9600 meist hinter seinem Hauptkonkurrenten Core 2 Quad Q6600 - er ist maximal gleich schnell.

DirectX 9: 3DMark06

Futuremarks 3DMark06 bietet verbesserte Testabläufe für das Shader Model 2 und High Dynamic Range (HDR) Shader Model sowie neue Benchmark-Routinen für Prozessoren. Damit soll der Benchmark laut Hersteller zukunftssicher sein und grafische Strukturen abtesten, die sich erst in zwei Jahren tatsächlich in Spielen wieder finden werden.

3DMark06 nutzt als erstes Produkt von Futuremark die Ageia Phys X-Software-Physics-Bibliothek in zwei spieleähnlichen CPU-Tests. Außerdem kommen im 3DMark06 Algorithmen zum Einsatz, die künstliche Intelligenz simulieren sollen. Insgesamt besteht der Benchmark aus zwei CPU- und vier Grafiktests. Daraus errechnet sich die Gesamtpunktzahl, die Auskunft über die Spiel-Performance des Rechners gibt.

Gesamtwertung: Der Vorteil der Multicore-Technologie fließt in das Ergebnis ein. AMDs Phenom überholt die Dual-Core-Prozessoren, muss aber den vierkernigen Intel-CPUs weiterhin den Vortritt lassen.

3Dmark06 bietet erstmals Unterstützung für Multi-Core-Prozessoren oder Hyper-Threading. Der Benchmark gibt als Teilergebnis einen Wert für die Leistungsfähigkeit der CPUs bei DirectX-Anwendungen aus.

CPU-Test: Ohne Hilfe der Grafikkarte distanzieren sich die Quad-Core-Modelle deutlich von den Doppelkernern. Der Phenom 9600 beißt sich am fast ein Jahr alten Core 2 Quad Q6600 weiter die Zähne aus. Intels Core 2 Extreme QX9650 profitiert von DDR3-1333 mit fünf Prozent höherer Performance gegenüber DDR2-800-Speicher.

Crysis: 800 x 600 Low Quality

Das 3D-Spiel Crysis von Crytek unterstützt DirectX 10 und stellt hohe Anforderungen an die Hardware. Die komplexen grafischen Elemente der Spieleszenen sowie die Physik-Engine beanspruchen die Grafikkarte und den Prozessor besonders stark. Cryteks eingesetzte CryEngine 2 unterstützt Multi-Core-CPUs. In parallelen Threads führt Crysis Berechnungen für Audio- und Physikeffekte, das Partikelsystem sowie dem Daten-Streaming oder der KI durch.

Die Frameraten von Crysis mit den verschiedenen Prozessoren ermitteln wir bei einer Grafikauflösung von 800 x 600 Bildpunkten, ausgeschaltetem Anti Aliasing sowie der Darstellungsqualität „low“. Als Szenario verwenden wir das in Crysis mitgelieferte Testskript „Benchmark_CPU.bat“. Die Grafikkarte wird nicht voll gefordert.

Minimale Framerate: Die vielen Kerne „behindern“ sich hier gegenseitig. Der Doppelkerner Core 2 Duo E6750 ist trotz geringer Taktfrequenz schneller als der Core 2 Extreme QX9650 mit vier Kernen. Der Phenom liegt abgeschlagen am Ende.
Mittlere Framerate: Jetzt sortieren sich die Core-2-Prozessoren entsprechend ihrer Taktfrequenz ein.
Maximale Framerate: Der Core 2 Extreme QX9650 erreicht mit DDR3-1333 eine sechs Prozent höhere Framerate gegenüber DDR2-800. Unverändert liegt der Phenom am Ende des Feldes.

Crysis: 1024 x 768 Medium Quality

Jetzt ermitteln wir die Frameraten von Crysis mit den verschiedenen Prozessoren bei einer Grafikauflösung von 1024 x 768 Bildpunkten, ausgeschaltetem Anti Aliasing sowie der Darstellungsqualität „medium“. Als Szenario verwenden wir das in Crysis mitgelieferte Testskript „Benchmark_CPU.bat“. Die Grafikkarte wird bereits stark belastet.

Minimale Framerate: Überraschend bricht die Framerate beim Athlon 64 X2 6400+ am wenigsten ein. Schneller Speicher bringt bei den CPUs hier einen deutlichen Schub, wie besonders am Phenom zu sehen ist. Leider hilft es dem K10-Prozessor nicht weg von ganz hinten.
Mittlere Framerate: Die CPUs sortieren sich auch bei der 1024er Auflösung wieder ihrer Taktfrequenz entsprechend ein – sauber getrennt nach Hersteller.
Maximale Framerate: Hier wird die Grafikkarte wieder am wenigsten gefordert. Die Rechenkraft der Prozessoren und ihre Speicheranbindung erhält bei der maximalen Framerate mehr Gewichtung.

Crysis: 1280 x 1024 High Quality

Welche Frameraten die Prozessoren bei Crysis bei einer Grafikauflösung von 1280 x 1024 Bildpunkten, ausgeschaltetem Anti Aliasing sowie der Darstellungsqualität „high“ ermöglichen, ermitteln wir wieder mit dem Testskript „Benchmark_CPU.bat“. Die Grafikkarte arbeitet bei dieser Einstellung unter Volllast.

Minimale Framerate: Die Grafikkarte arbeitet bei diesem Test voll „auf Anschlag“.
Mittlere Framerate: Die Unterschiede zwischen den CPUs minimieren sich bei der durchschnittlichen Bildwiederholrate. Der Phenom profitiert jetzt etwas von seiner Quad-Core-Technologie und zieht am Athlon 64 X2 6400+ vorbei.
Maximale Framerate: Die Grafikkarte ist bei dieser Auflösung und hohen Darstellungsqualität deutlich die limitierende Komponente.

SSE-Performance: Linpack 64 Bit

Linpack dient als verbreitetes Tool zum Ermitteln der Floating-Point-Performance von Highend-Computern. Das Ergebnis wird in Flops (Fließkomma-Operationen pro Sekunde) angegeben.

Linpack löst komplexe lineare Gleichungssysteme. Die Anzahl der Gleichungen lässt sich dabei stark erhöhen, um auch massiv parallel operierende Systeme unter Last zu setzen. Der Bedarf an Arbeitsspeicher wächst entsprechend mit. Die Speicherzuweisung erfolgt über eine Matrix-Berechnung. Size x LDA x 8 (Anzahl der Gleichungen x Input x 8 bit) ergibt den zu allokierenden Speicher.

Unter CentOS 5 Linux 64 Bit setzen wir die 64-Bit-Version von Linpack 2.1.2 ein. Der SMP-fähige Benchmark setzt EMT64-Prozessoren mit SSE3-Unterstützung voraus. AMDs Prozessoren mit SSE3 arbeiten unter Linux mit der von Intel-Compilern erstellten Linpack-Version ebenfalls problemlos zusammen.

Bei unseren Tests löst Linpack in verschiedenen Durchläufen 5000, 10.000 und 15.000 Gleichungssysteme. Damit benötigt der Benchmark zwischen 190 MByte (5000 Gleichungssysteme) und zirka 1,6 GByte Arbeitsspeicher (15.000 Gleichungssysteme). Im Diagramm finden Sie die von den Prozessoren maximal erreichten GFlops.

Ausnahme: Obwohl der Phenom nur mit 2,3 GHz Taktfrequenz arbeitet, wird der 2,4-GHz-Quad-Core-Q6600 locker überholt. AMDs Konzept mit den integrierten Speicher-Controllern zeigt bei diesem sehr speicherlastigen Benchmark erstmals die Überlegenheit gegenüber Intels „klassischer“ FSB-Technologie.

Energieverbrauch: Leerlauf

AMD und Intel spezifizieren den Energiebedarf ihrer Prozessoren mit der Thermal Design Power (TDP). Bei diesem Wert handelt es sich um ein theoretisches Maximum – in der Praxis liegt der Energiebedarf der Prozessoren in der Regel selbst bei hoher Auslastung darunter. Die CPU-Kühler müssen aber für diese TDP-Werte entsprechend dimensioniert sein.

Interessanter ist der reale Energieverbrauch der kompletten Plattform – ohne Monitor. Unsere Testplattformen unterscheiden sich lediglich beim Mainboard und natürlich der CPU. Grafikkarte, Netzteil, Festplatte und wenn möglich der Speicher sind identisch. Damit lassen sich praxisnahe Aussagen treffen, wie sehr der Prozessor den Energieverbrauch der Plattform beeinflusst.

Im folgenden Diagramm vergleichen wir den Systemverbrauch unter Windows Vista im „Leerlauf“ ohne aktivierten Energiesparmodus:

Regungslos: Trotz geringerem TDP-Wert von 95 Watt benötigen die vier 65-nm-Kerne des Phenom 9600 etwas mehr Energie als die 125-Watt-TDP-CPU Athlon 64 X2 6400+. Dass der Core 2 Extreme QX9650 mit DDR3-1333 deutlich sparsamer ist als mit DDR2-800, liegt vor allem an den unterschiedlichen X38-Mainboards.

Jetzt sind die Energiesparfunktionen Intel SpeedStep und AMD Cool’n’Quiet zum dynamischen Senken von Taktfrequenz und Core-Spannung aktiv. Windows befindet sich weiterhin im „Leerlauf“:

Sparfüchse: Der Phenom 9600 arbeitet bei 2,3 GHz Taktfrequenz mit einer Core-Spannung von 1,25 V. Im Stromsparmodus reduziert Cool’n’Quiet 2.0 den Arbeitstakt auf 1,15 GHz bei einer Core-Spannung von 1,05 V. Damit spart die CPU zirka 14 Watt. Noch deutlicher fällt die Einsparung beim Athlon 64 X2 6400+ aus. Bei den Intel-CPUs sinkt der Energiebedarf im Leerlauf mit SpeedStep nur marginal, weil bei den Prozessoren bereits andere Powersave-Technologien greifen. SpeedStep hilf bei den Intel-CPUs Energie zu sparen, wenn die Prozessorauslastung im „mittleren“ Bereich liegt.

Energieverbrauch: Volllast

Der Energieverbrauch der Plattformen steigt auf die Werte im Diagramm, wenn alle Kerne der Prozessoren unter voller Last arbeiten. Die Grafikkarte wird beim verwendeten Lasttest mit SunGard ACR nicht beansprucht.

Lasttest ohne Grafik: Unter Volllast macht sich die geringere TDP des Phenom im Vergleich zum Athlon 64 X2 6400+ bemerkbar. Die Intel-X38-Plattform mit den Core-2-Modellen benötigt deutlich weniger Energie als das AMD-System mit 790FX-Chipsatz.

Wird zusätzlich die Grafikkarte GeForce 8800 GTS über das DirectX-10-Spiel Crysis stark gefordert, so erhöht sich der Energiebedarf der Plattformen auf folgende Werte:

Lasttest mit Grafik: Die AMD-Plattform benötigt mit dem Phenom deutlich mehr Energie als die Core-2-Modelle mit dem X38-Mainboard. Zudem bieten Core-2-Prozessoren mehr Performance.

Listen- & Straßenpreise

Hinsichtlich der Preise empfiehlt es sich, gelegentlich einen Blick auf die offiziellen Listen der CPU-Hersteller zu werfen. Bei AMDs Preisliste gab es am 08. Oktober 2007 die letzten Änderungen. Intels Preisliste wurde am 05. September 2007 aktualisiert.

OEM- und Straßenpreise im Vergleich

Modell

Taktfrequenz /FSB [MHz]

Listenpreis [US-Dollar]

Straßenpreis [Euro]

Socket AM2+

Phenom 9600

2300

283

250

Phenom 9500

2200

251

230

Socket AM2

Athlon 64 X2 6400+ Black Edition

3200

220

165

Athlon 64 X2 6000+

3000

167

140

Athlon 64 X2 5600+

2800

146

120

Athlon 64 X2 5200+

2600

125

105

Athlon 64 X2 5000+ Black Edition

2600

136

125

Athlon 64 X2 5000+ 65 nm

2600

115

100

Athlon 64 X2 4800+ 65 nm

2500

104

90

Athlon 64 X2 4400+ 65 nm

2300

89

75

Athlon 64 X2 4200+

2200

78

75

Athlon 64 X2 4000+ 65 nm

2100

68

60

LGA775

Core 2 Extreme QX9650

3000 / 1333

999

940

Core 2 Extreme QX6850

3000 / 1333

999

885

Core 2 Extreme QX6800

2930 / 1066

999

885

Core 2 Extreme QX6700

2670 / 1066

999

860

Core 2 Extreme X6800

2930 / 1066

999

840

Core 2 Quad Q6700

2670 / 1066

530

480

Core 2 Quad Q6600

2400 / 1066

266

225

Core 2 Duo E6850

3000 / 1333

266

235

Core 2 Duo E6750

2670 / 1333

183

160

Core 2 Duo E6700

2670 / 1066

316

280

Core 2 Duo E6600

2400 / 1066

224

205

Core 2 Duo E6550

2330 / 1333

163

140

Core 2 Duo E6400

2130 / 1066

183

140

Core 2 Duo E6300

1860 / 1066

163

150

Core 2 Duo E4400

2000 / 800

113

100

Core 2 Duo E4300

1800 / 800

113

100

TecChannel Preisvergleich & Shop

Produkte

Info-Link

Prozessoren

Preise und Händler

Fazit

Das Fazit für den neuen Phenom 9600 fällt ernüchternd aus. AMDs erster Quad-Core-Prozessor für Desktop-PCs schafft es nicht, dem vom Hersteller selbst auserwählten Hauptkonkurrenten Intel Core 2 Quad Q6600 das Wasser zu reichen.

In fast allen Bereichen liegt der Phenom 9600 deutlich zurück. Durchschnittlich über unseren Applikationsmix gerechnet arbeitet AMDs K10-Prozessor zirka 13 Prozent langsamer als der Core 2 Quad Q6600. Maximal sind es sogar 23 Prozent, nur selten arbeiten die CPUs gleich schnell oder der Phenom ist flinker.

Dabei handelt es sich beim günstigeren Intel-Prozessor um die fast ein Jahr alte Einstiegsversion bei den Quad-Core-Modellen. Die Ablösung mit den noch schnelleren 45-nm-Penryn-Versionen steht im vierkernigen Einstiegsbereich kurz bevor. Das bereits erhältliche 45-nm-Topmodell Core 2 Extreme QX9650 zeigt, welches Leistungsvermögen, Energiespar- und Taktfrequenzpotenzial in der Intel-45-nm-Architektur steckt.

Hier liegt AMDs größtes Problem begraben – die Taktfrequenz. Nicht ohne Grund wurde das für den Launch ebenfalls geplante 2,4-GHz-Modell Phenom 9700 kurzerhand auf das erste Quartal 2008 verschoben.

Kommt kein intensives Multitasking oder multithreaded optimierte Anwendungen zum Einsatz, so zieht dem Phenom 9600 selbst der günstigere Vorgänger Athlon 64 X2 6400+ mit 3,2 GHz davon. Sicherlich, der Phenom 9600 ist dennoch schnell, aber für eine neue Desktop-CPU-Generation fällt der Leistungssprung bescheiden aus.

Im Server-Segment bei 2-Sockel-Systemen punktet der K10-basierende Opteron dagegen selbst mit 2,0 GHz Taktfrequenz. Doch hier herrschen wieder andere Regeln: Multithreading und Virtualisierungsszenarien sind bei Servern an der Tagesordnung. Im Duett profitieren die K10-Quad-Core-Opterons gegenüber den Xeon-Modellen deutlich besser von ihren integrierten Speicher-Controllern und dem flinken HyperTransport-Connect.

AMD hat angekündigt, die Taktfrequenz des Phenom bis Mitte 2008 auf 3,0 GHz zu steigern. Notwendig wären die 3,0 GHz jetzt. Denn: der schnellste Phenom verliert gegen den langsamsten Core 2 Quad. (cvi)

Testkonfiguration

Wir haben die Benchmarks unter dem Betriebssystem Windows Vista Business in der 32-Bit-Version durchgeführt. Für den Linux-Test verwenden wir CentOS 5 in der x86_64-Edition.

Socket-AM2+-Plattform: Das Gigabyte GA-MA790FX-DQ6 verwendet als Chipsatz AMDs 790FX. Beim Speicher steuert das Board Dual-Channel-DDR2-1066-SDRAM an.

AMDs Phenom 9600 für den Socket AM2+ testen wir in einem Gigabyte GA-MA790FX-DQ6 mit AMD 790FX Chipsatz. Der CPU stehen 2 GByte Dual-Channel DDR2-1066-Speicher mit CL5 von takeMS zur Verfügung. Über den im Phenom integrierten Speicher-Controller konfigurieren wir die DIMMs für unsere Tests jeweils mit 800 und 1066 MHz. Dem Athlon 64 X2 6400+ steht ebenfalls das Gigabyte-Mainboard zur Verfügung. Die Socket-AM2-CPU arbeitet im GA-MA790FX-DQ6 mit HT-2.0-Geschwindgkeit und steuert die Speicherriegel von takeMS als DDR2-800-DIMMs an.

LGA775-Plattform: Das P5E3 Deluxe von Asus setzt auf Intels X38-Express-Chipsatz. Das Mainboard unterstützt DDR3-1333-Speicher in einer Dual-Channel-Konfiguration.

Intels Core-2-Prozessoren nehmen im Asus P5E3 Deluxe mit X38-Express-Chipsatz Platz. Den FSB1333-Modellen Core 2 Duo E6750 und Core 2 Extreme QX9650 steht als Arbeitsspeicher jeweils 2 GByte DDR3-1333-SDRAM mit CL7 in einer Dual-Channel-Konfiguration zur Verfügung. Die FSB1066-CPU Core 2 Quad Q6600 steuert den DDR3-Speicher von OCZ mit 1066 MHz an. Den Core 2 Extreme QX9650 testen wir zusätzlich im X38-Mainboard Asus Maximus Formula. Das LGA775-Board steuert DDR2-800-Speicher mit CL5 an. Damit können wir die Performance-Unterschiede von DDR2-800 zu DDR3-1333 ermitteln.

DDR2-Speicher: Die Mach2-Series von takeMS erlaubt Speichergeschwindigkeiten bis 1066 MHz.
DDR3-Speicher: Die Platinum Series von OCZ ermöglicht DDR3-Taktfrequenzen von 1066, 1333 und 1600 MHz.

Um gleiche Testbedingungen zu gewährleisten, wurden alle Testsysteme mit einer Zotac GeForce 8800GTS bestückt. Der DirectX-10-Grafikkarte mit 320 MByte Grafikspeicher stand der ForceWare-Treiber Release 163.69 zur Seite.

Referenzgrafik: Zotacs GeForce 8800GTS arbeitet mit 570 MHz Core-Taktfrequenz und steuert 320 MByte GDDR3 an.

Einheit herrschte auch beim 620-Watt-Netzteil Enermax Liberty ELT620AWT und den Massenspeichern - die Serial-ATA-II-Festplatte Seagate Barracuda 7200.10 mit 250 GByte Kapazität.

(tecchannel/bb)