AMD besitzt mit der Opteron-6100-Serie Prozessoren für Server mit zwei oder vier Sockeln. Die 6100er Modelle sind mit acht oder zwölf Kernen verfügbar. Außerdem bieten die CPUs mit vier integrierten DDR3-1333-Channels eine hohe Speicherbandbreite. Im Vergleich zu Intels Xeon-5600-Prozessoren für 2-Sockel-Server positionieren sich die 12-Kern-Opterons auch sehr konkurrenzfähig.
Mit der Opteron-4100-Serie will AMD vor allem durch günstige Preise und hohe Energieeffizienz punkten. Oder besser, noch höhere Effizienz, denn schon die Opteron-6100-Plattform überzeugt in der Performance pro Watt. Die Opteron-4100-CPUs mit Codenamen "Lisbon" sind für den 2-Sockel-Betrieb ausgelegt und gelten als legitime Nachfolger der Opteron-2400-Modelle, die weiter im Angebot bleiben. Die unverändert in 45-nm-Technologie gefertigten 4100er CPUs gibt es wie den Opteron 2400 mit vier und sechs Kernen.
Im Test unserer Schwesterpublikation TecChannel traten drei verschiedene Modelle aus der Opteron-4100-Serie gegeneinander an und mussten sich der Konkurrenz stellen. Zum einen wurde der Opteron 4162 EE getestet. Die Hexa-Core-CPU arbeitet mit "nur" 1,7 GHz Taktfrequenz, kommt aber mit einem sehr geringen ACP-Wert von 32 Watt aus. Für 99 US-Dollar nur etwa ein Drittel so teuer ist das Quad-Core-Modell Opteron 4122. Zu seinen Kenndaten zählen 2,2 GHz und 75 Watt ACP. Preislich dazwischen platziert sich der Opteron 4170 HE mit sechs Kernen, 2,1 GHz Taktfrequenz und 50 Watt ACP.
Wir überprüfen im identischen 2-Sockel-Server die Energieeffizienz mit den verschiedenen Opteron-4100-CPUs. Die Unterschiede sind überraschend groß. Außerdem testen wir die Performance der CPUs bei Integer- und Floating-Point-Anwendungen, Verschlüsselung, Rendering und Java-Applikationen.
Opteron 4100 mit Direct Connect Architecture 2.0
Den Opteron-4100-Prozessoren steht neben den für die K10-Architektur typischen 512 KByte L2-Cache pro Kern ein Shared L3-Cache mit 6 MByte Fassungsvermögen zur Verfügung. Die Kommunikation zur zweiten CPU und zum Chipsatz erledigen beim Opteron 4100 zwei HyperTransport-3.0-Links mit 6,4 GT/s (je 3,2 GT/s pro Richtung). Bei den Opteron-2400-Modellen mit Socket F ist die Bandbreite noch auf 4,8 GT/s pro Link beschränkt.
Beim Speicher-Controller bleibt es beim Opteron 4100 bei zwei Channels - allerdings für DDR3-1333-DIMMs (4 Stück pro Sockel). Low-Voltage-DDR3-DIMMs mit 1,35 statt 1,5 V Betriebsspannung unterstützt der Opteron 4100 ebenfalls. Durch die DDR3-Speicherriegel wird bei der Opteron-4100-Serie mit dem Socket C32 ein neuer Steckplatz fällig. Der Steckplatz basiert auf dem Socket F und nutzt ebenfalls 1207 Pins. Als preisgünstige Chipsätze für die C32-Plattform "San Marino" sieht AMD den SR5670 und SR5650 vor. Die Chipsätze unterscheiden sich in erster Linie in der Anzahl der PCIe-Lanes und in der Verlustleistung.
Achtung bei der Speicherbestückung
Der Opteron 4100 besitzt einen integrierten Speicher-Controller für DDR3-1333-DIMMs im Dual-Channel-Modus. Dabei beherrscht der Controller sowohl ungepufferte als auch Registered DIMMs. Pro Kanal sind laut AMD drei Speichermodule möglich. In den meisten Opteron-4100-Mainboards werden aus Kostengründen aber nur zwei DIMM-Slots pro Speicher-Channel verbaut.
Die Speichertaktung von 1333 MHz beherrscht der Opteron 4100 sowohl mit den Registered DIMMs als auch normalen Speicherriegeln. Low-Voltage-Module steuert die CPU ebenfalls mit 1333 MHz an. Bei allen verwendeten DIMM-Varianten kann die Speichertaktung allerdings von der Anzahl der Speicherbänke (Ranks) eines Moduls abhängen. Ein Rank ist dabei ein unabhängig adressierbarer 64-Bit-Adressbereich (mit ECC 72 Bit). Ein DIMM mit 2R-Organisation (2 Ranks) wird vom Controller praktisch wie zwei DIMMs mit 1R-Organistation angesteuert.
Der Opteron 4100 kann zwei Module pro Kanal (also vier DIMMs pro CPU) nur mit 1333 MHz ansteuern, wenn diese eine 1R-Organisation haben. Viele DDR3-DIMMs besitzen aber eine 2R-Organistation. Sind pro Speicher-Channel zwei 2R-DIMMs eingesetzt, dann schaltet die Geschwindigkeit automatisch auf 1066 MHz herunter. Soll der Opteron 4100 mit je zwei 4R-DIMMs pro Kanal bestückt werden, so steuert der Speicher-Controller die Module nur noch mit 800 MHz an (667 MHz bei LV-DIMMs).
AMDs Opteron 6100 ist bei den Speichergeschwindigkeiten weniger reglementiert. Zwei 2R-Module pro Channel sind auch mit 1333 MHz möglich. Nur bei drei 2R-DIMMs pro Channel reduziert sich die maximal Speichertaktung auf 1066 MHz. Intels Xeon-5600-Prozessoren schalten beim dritten DIMM pro Channel ebenfalls von 1333 auf 1066 MHz zurück.
Sparsam durch C1e und Cool Speed
AMD stuft seine Opteron-4100-Prozessoren mit einer ACP von 32, 50 und 75 Watt ein. Die bisherigen Hexa-Core-Modelle der Opteron-2400-Serie bietet AMD mit 40, 55, 75 und 105 Watt ACP an. Statt dem von Intel verwendeten TDP (Thermal Design Power), einem theoretischen Maximalwert, bei dem alle Transistoren der CPU gleichzeitig schalten, verwendet AMD bei der Energieeinstufung den ACP-Wert (Average CPU Power). Hier handelt es sich nach Ansicht des Herstellers um einen realistischen Maximalwert. Der ACP liegt jeweils unterhalb des TDP-Wertes, den es weiterhin für Entwickler gibt.
Wie beim Opteron 6100 kommt bei den 4100er Modellen der neue Energiesparmodus C1e zum Einsatz. Sind alle Prozessoren im Idle-Modus (C1-Status) und AMDs Smart Fetch Technologie hat die L1- und L2-Cache-Inhalte in den L3-Cache geladen (Kerne sind dann abgeschalten), dann kann der C1e-Schlafmodus aktiv werden. C1e reduziert vom L3-Cache und vom Speicher-Controller die Taktfrequenz und die HyperTransport-Links können in einen Energiesparmodus LS2 gehen. Zusätzlich werden die DRAM-DLLs ausgeschalten und der Chipsatz kann durch den LS2-Mode der HT-Links ebenfalls seine Energieaufnahme reduzieren. Laut AMD benötigt eine 2-Sockel-Plattform mit zwei Opteron 4164 EE im Leerlauf 63 Watt und bei 100 Prozent Last 133 Watt. Als Vergleich nennt AMD eine vergleichbare Plattform mit zwei Opteron 2419 EE: Hier sind 83 (Leerlauf) und 171 Watt (Last) angegeben.
Neben den bereits bekannten Energiesparmaßnahmen "PowerNow!" zum dynamischen Anpassen der Taktfrequenz und Core-Spannung sowie "Smart Fetch" unterstützt der Opteron 4100 zusätzlich noch die Technologie "Cool Speed". AMDs Cool Speed reduziert die P-States (Betriebszustand mit definierter Taktfrequenz und Core-Spannung), wenn ein Temperaturlimit erreicht wird. Damit wird die Betriebssicherheit erhöht.
Opteron-4100-Modelle im Überblick
In der Tabelle finden Sie alle neuen Opteron-4100-Prozessoren mit vier und sechs Kernen im Überblick:
Prozessor |
Taktfrequenz [GHz] |
Kerne |
ACP |
Preis |
---|---|---|---|---|
Opteron 4184 |
2,8 |
6 |
75 W |
316 US-Dollar |
Opteron 4180 |
2,6 |
6 |
75 W |
188 US-Dollar |
Opteron 4176 HE |
2,4 |
6 |
50 W |
377 US-Dollar |
Opteron 4174 HE |
2,3 |
6 |
50 W |
255 US-Dollar |
Opteron 4170 HE |
2,1 |
6 |
50 W |
174 US-Dollar |
Opteron 4164 EE |
1,8 |
6 |
32 W |
698 US-Dollar |
Opteron 4162 EE |
1,7 |
6 |
32 W |
316 US-Dollar |
Opteron 4130 |
2,6 |
4 |
75 W |
125 US-Dollar |
Opteron 4122 |
2,2 |
4 |
75 W |
99 US-Dollar |
Analyse: Rechenleistung
Der Opteron 4162 EE ist in der Rechenleistung trotz Hexa-Core durch seine geringe Taktfrequenz von 1,7 GHz klar im Nachteil. Gegenüber dem Opteron 2435 (Hexa-Core / 2,6 GHz) arbeitet die Stromspar-CPU bei Workloads, die im Cache vorrätig gehalten werden können, zirka 25 bis 35 Prozent langsamer. Der Opteron 4170 HE mit ebenfalls sechs Kernen und 2,1 GHz Taktfrequenz muss sich mit 8 bis 21 Prozent weniger Performance begnügen. Abgeschlagen liegt der vierkernige Opteron 4122 mit 2,2 GHz zurück. Gegenüber dem 1,7-GHz-Opteron 4162 EE rechnet der Quad-Core-Prozessor zirka 9 bis 17 Prozent langsamer.
Handelt es sich um sehr speicherintensive Applikationen, so profitiert das Opteron-4162-EE-Päärchen gegenüber den Opteron-2435-CPUs von seiner schnelleren Speicheranbindung (1333 statt 800 MHz) und der höheren HyperTransport-Geschwindigkeit. Der Nachteil der 34 Prozent geringeren Taktfrequenz wirkt sich auf eine nur noch zirka 15 Prozent geringere Performance aus. Der Opteron 4170 HE mit 2,1 GHz schließt beim sehr speicherintensiven SPECfp_rate_base2006 sogar bis auf zwei Prozent zum Opteron 2435 (2,6 GHz) auf.
Im BIOS unseres Testsystems Tyan YR190B8228 mit zwei Opteron 4162 EE war zugunsten eines geringeren Stromverbrauchs im Lieferzustand eine reduzierte HyperTransport-Geschwindigkeit eingestellt. Statt den maximal möglichen 3,2 GT/s pro Richtung zwischen den CPUs waren nur 1,0 GT/s gewählt. Bei einem sehr speicherintensiven Workload wie den Fließkommaanwendungen von SPECfp_rate_base2006 sinkt dadurch die Performance um zirka fünf Prozent. Dies gilt auch für den Opteron 4122 und 4170 HE.
Bei Applikationen, die überwiegend in den Caches der CPUs ablaufen, hat die gewählte HT-Geschwindigkeit kaum einen Einfluss auf die Rechenleistung. Wie sich die HyperTransport-Geschwindigkeit auf die Energieaufnahme auswirkt, finden Sie auf der nächsten Seite.
Analyse: Energieeffizienz
Während das Opteron-4162-EE-Päärchen in der reinen Rechenleistung meist chancenlos zurückliegt, punkten die CPUs in der Energieeffizienz umso mehr. Der 1U-Server Tyan YR190B8228 (halbe Rackbreite) benötigt im Leerlauf mit den zwei Opteron 4162 EE (ACP 32 Watt) nur 70 Watt, unter Volllast bei einem Java-Workload gerade einmal 129 Watt. Von diesen Werten sind alle getesteten Konkurrenten weit entfernt. Beispielsweise benötigt der Asus-Server RS700-E6/RS4 mit zwei Low-Voltage-Xeon-L5520 (2,26 GHz / 60 Watt TDP) bei ebenfalls einem Netzteil im Leerlauf 117 Watt und unter Last 254 Watt.
Trotz der deutlich geringeren Performance bietet so das Opteron-4162-EE-Päärchen im Tyan-Server mit 1484 ssj_ops/watt (SPECpower) die beste Energieeffizienz im Vergleichsfeld. Nur der AMD-Server mit zwei 12-Kern-Opteron-6174 erreicht mit 1370 ssj_ops/watt eine annähernd gute Performance pro Watt. Zwar bieten die zwei Opteron 6174 in etwas die doppelte Performance, aber auch deutlich mehr Energie.
Interessante Ergebnisse ergeben sich, wenn im Tyan-Server die Opteron-4162-EE- gegen 4170-HE- und 4122-Modelle ausgetauscht werden. Nehmen die Opteron 4170 HE mit 50 Watt ACP im Server Platz, so steigt der Energiebedarf im Leerlauf von 70 auf 72 Watt und unter Volllast von 129 auf 174 Watt. Aufgrund der höheren Performance der 2,1-GHz-Hexa-Core-CPUs erreicht der Tyan-Server mit 1397 ssj_ops/watt trotzdem noch eine sehr gute Energieeffizienz, die nur sechs Prozent geringer ist als mit den Opteron-4162-EE-CPUs.
Anders sieht es mit den vierkernigen Opteron-4122-CPUs aus, die mit 75 Watt ACP spezifiziert sind. Bereits im Leerlauf steigt der Energiebedarf auf 93 Watt, unter Volllast zeigt das Messgerät sogar 217 Watt an. Zusammen mit der geringeren Rechenleistung des Opteron 4122 erreicht der Tyan-Server nur eine Energieeffizienz von 863 ssj_ops/watt. Zum Vergleich: Mit dem Opteron-4162-EE-Päärchen bietet der Tyan-Server eine 72 Prozent höhere Effizienz.
Bei den sehr guten Effizienzwerten des Tyan-Servers YR190B8228 (bis auf die Kombination mit den Opteron-4122-CPUs) muss noch erwähnt werden, dass das System ein dem geringen Energiebedarf angepasstes Netzteil besitzt. Das verwendete YM-2451C von 3Y Power Technology ist auf maximal 450 Watt ausgelegt. Im Opteron-6100-Server ist ein 1200-Watt-Netzteil verbaut, in den Xeon-Servern arbeiten zwei 770-Watt-Netzteile. Der Opteron-4100-Server verschafft sich hierdurch natürlich einen Vorteil in der Energieeffizienz.
Analyse: Vorteil von LV-DIMMs und reduziertem HT-Speed
Die sehr gute Performance pro Watt des Opteron 4162 EE von 1484 ssj_ops/watt wurde mit optimierten Einstellungen und Komponenten erreicht (auch die Werte mit Opteron 4122 und 4170 HE) . So waren im Server Low-Voltage-DDR3-1333-DIMMs installiert und im BIOS die HyperTransport-Geschwindigkeit reduziert. Tauscht man die LV-DIMMs (1,35 V) gegen normale Registered DIMMs (1,5 V) aus - wie bei den Konkurrenten verwendet - so sinkt die Energieeffizienz auf 1314 ssj_ops/watt um 11,5 Prozent. Der Tyan-Server mit den Opteron-4162-EE-CPUs liegt damit auf dem Effizienzniveau des Opteron-6174-Servers. Während der Tyan-Server im Leerlauf mit beiden DIMM-Varianten mit 70 beziehungsweise 71 Watt ähnlich viel Energie benötigt, ist die Differenz unter Volllast deutlich: 129 Watt mit LV-DIMMs und 146 Watt mit normalen DIMMs.
Energie lässt sich beim Opteron-System auch durch eine reduzierte HyperTransport-Einstellung (BIOS) sparen. Der mit SPECpower ermittelte Wert von 1484 ssj_ops/watt wurde mit 1,0 GT/s pro Richtung erreicht. Wird die HyperTransport-Geschwindigkeit zwischen den beiden Opteron 4162 EE auf die maximal möglichen 3,2 GT/s pro Richtung geändert, so sinkt die Effizienz des Systems auf 1379 ssj_ops/watt (-7 %). Während die Java-Performance mit schnellerer HT-Einstellung nur minimal steigt (knapp 1 %, abhängig vom Workload), erhöht sich der Energiebedarf im Leerlauf von 70 auf 73 Watt und unter Last von 129 auf 137 Watt.
Nur wer sehr speicherintensive Workloads durchführt, wie wissenschaftliche Floating-Point-Berechnungen oder Virtualisierungsszenarien, erhält bei den unterschiedlichen HyperTransport-Geschwindigkeiten Performance-Unterschiede von bis zu fünf Prozent.
Fazit
Wer nach möglichst hoher Performance sucht, wird beim Opteron 4162 EE nicht fündig. Das war aber von vorneherein klar. Trotz der sechs Kerne ist die Taktfrequenz von 1,7 GHz einfach zu gering gegenüber den Konkurrenten. AMD fokussiert mit der Opteron-4100-Serie aber auch auf möglichst günstige Server mit sehr hoher Energieeffizienz. Und dieses Vorhaben gelingt mit den Opteron-4162-EE-Modellen überzeugend.
Der geringe Energiebedarf der 32-Watt-Hexa-Core-Opterons ermöglicht eine 2-Sockel-Plattform, die im Leerlauf nur zirka 70 Watt und unter Last 130 Watt benötigt. Für einen Server mit zwölf Kernen ist das ein sehr niedriger Wert. Entsprechend bietet das Opteron-4162-EE-Päärchen im verwendeten Tyan-YR190B8228-Server eine bessere Energieeffizienz als alle von uns getesteten Konkurrenten. Auch mit den etwas schnelleren 2,1-GHz-Opteron-4170-HE-CPUs (50 Watt ACP) wird eine immer noch sehr gute Performance pro Watt geboten, die nur sechs Prozent geringer ist als mit den Opteron-4162-EE-CPUs.
Wer allerdings mit dem Opteron 4122 aufgrund seines günstigen Preises liebäugelt, der sollte die Energiekosten des Servers über die Zeit nicht vergessen. Denn selbst wenn die Rechenleistung der Quad-Core-CPUs ausreicht, in der Energieeffizienz liegen 4122er abgeschlagen zurück. Der Tyan-Server YR190B8228 arbeitet mit zwei Opteron 4170 HE 62 Prozent, mit dem Opteron-4162-EE-Päärchen sogar 72 Prozent effizienter. Hier macht sich der höhere CPU-Preis gegenüber dem Opteron 4122 schnell bezahlt.
In der Gesamtbetrachtung für ein Rechenzentrum stellen somit Opteron-4100-Server eine überlegenswerte Alternative zu den bereits sehr effizienten und leistungsstarken Xeon-5600-Servern dar. Auch wenn die Opteron-4100-CPUs bei der Performance weit von den Xeon-5600-Modellen entfernt sind, ist die Energieeffizienz der ganzen Plattform mehr als konkurrenzfähig. Zusammen mit den günstigen Preisen der Opteron-4100-Plattform, lohnt es durchaus, auch entsprechende AMD-Server bei Neuanschaffungen für den Serverraum durchzukalkulieren. (cvi)
Testsysteme im Detail
AMDs Opteron 4122, 4162 EE und 4170 HE testen wir in dem 1U-Rackserver Tyan YR190B8228. Der Servereinschub mit halber Rackbreite setzt auf AMDs SR5650-Chipsatz. Jedem Prozessor stehen vier Registered DDR3-1333-DIMMs (zwei pro Channel) zur Verfügung. Die insgesamt 8 DIMM-Steckplätze ermöglichen mit 4-GByte-Riegeln 32 GByte Arbeitsspeicher. Für die Messungen der Energieeffizienz verwenden wir zusätzlich LV-DDR3-1333-DIMMs - hier kommt ein Riegel pro Channel zum Einsatz.
AMDs Opteron 6174 "Magny-Cours" testen wir in einem 2-Sockel-Referenzsystem von AMD. Das Tower-System verwendet das AMD-Referenz-Mainboard Dinar2 mit AMD SR5690-Chipsatz. Jeder Socket-G34-CPU stehen acht DIMM-Steckplätze zur Verfügung (zwei Speicherriegel pro Channel). Beide Opteron 6174 können im Testsystem auf jeweils vier 4-GByte-Registered-DIMMs zurückgreifen. Dem System stehen somit insgesamt 32 GByte RAM zur Verfügung.
AMDs Opteron 2435 testen wir in einem 4-Sockel-Server Tyan Transport GT26. Der 1U-Rack-Server verwendet als Mainboard ein Tyan S4987 mit NVIDIA MCP55-Chipsatz. Das System eignet sich für den Betrieb mit zwei oder vier Prozessoren. Jedem Prozessor stehen zwei gepufferte 4-GByte-DIMMs in einer Dual-Channel-Konfiguration zur Verfügung. Insgesamt verfügt der Tyan-Server in der 2-Sockel-Konfiguration über 16 GByte Arbeitsspeicher.
Intels Xeon L5520 und X5570 "Nehalem-EP" sowie den Xeon X5670 und X5680 "Westmere-EP" testen wir in einem 2-Sockel-Server Asus RS700-E6/RS4. Der 1U-Server mit der neuen Tylersburg-EP-Plattform besitzt als Mainboard ein Asus Z8PS-D12-1U mit Chipsatz Intel 5520 und ICH10R. Jedem Prozessor steht pro Speicher-Channel ein 4 GByte Registered DIMM vom Typ Qimonda IMHH4GP12A1F1C-13H mit 1333 MHz Taktfrequenz zur Verfügung. Beim Xeon L5520 arbeitet der Speicher mit 1066 MHz. Insgesamt besitzt das System damit 24 GByte Arbeitsspeicher - 12 GByte pro CPU mit drei Channels.
Um insbesondere für die Energiemessungen gleiche Vorraussetzungen für den AMD- und Intel-Server zu ermöglichen, arbeiten in den Systemen an der SAS/SATA-Backplane jeweils zwei SATA-RAID-Edition-Festplatten von Samsung. Lässt der Server nur 2,5-Zoll-Laufwerke zu, so verwenden wir die Seagate Constellation. Somit lassen sich bestmögliche Vergleiche zwischen den Prozessoren ziehen. Jeder Server bezieht seine Energie aus zwei 700-Watt-Netzteilen (AMD-Server und Intel-Xeon-5400-System) beziehungsweise 770-Watt-Netzteilen (Intel Nehalem-EP-System). Das Testsystem für den Opteron 2435 ist mit einem 1000-Watt-Netzteil ausgestattet.
Als Betriebssystem setzen wir Windows Server 2008/R2 Enterprise x64 ein. Tests unter Linux erfolgen mit CentOS 5.4 in der 64-Bit-Version.
Dieser Artikel basiert auf einem Beitrag der CW-Schwesterpublikation TecChannel.