1.2 Flex-FPU

Eine FPU (früher oft als Koprozessor bezeichnet) kümmert sich um die Abarbeitung von Gleitkommazahlen. Diese Ko-Prozessoren besitzen relativ breite Register. So kann ein Register bis zu 128 Bit groß sein. Die Bulldozer-FPU unterstützt neben zwei MMX-Register zusätzlich zwei 128 Bit FMAC-Pipes. Durch das Addieren beider Pipes unterstützt AMDs Bulldozer Intels 256 Bit AVX, dass durch die Flexibität sogar viel besser ist. Fused Multiply Add (FMA) nennt AMD diese Technologie.

Bild Bild

Der Vorteil von FMA ist die Genauigkeit. Denn erst am Ende der Berechnung eines Befehles wird gerundet, während bei Intels Technologie zwischendrin das Ergebnis gerundet werden muss und somit während der Berechnung nicht mehr exakt ist. AMDs Version des Advancec Encryption Standard (AES) (Verschlüsselungssystem, wird genutzt u.a. von Zip-Programmen, Datenbanken, SSL-Verschlüsselungen,VMware) wirkt sich zudem sehr positiv aus und hat sich vor der Vorstellung des ersten AMD FX-Prozessors im Vergleich zum Phenom II X4 nahezu verzehnfacht.

1.3 Turbo 2.0

Der Turbo kann im Rahmen der angegebenen TDP den Prozessor auf ein gewisses Niveau übertakten: In den Phenom II X6 sowie im Phenom II X4 960T hat AMD erstmals den Turbo eingeführt. Der Turbo sorgte dafür den Phenom bei Auslastung von der Hälfte der Kerne die Taktrate bei manchen Modellen bis auf 500 MHz zu übertakten. Beim AMD FX-Prozessor liegt die Turbostufe bei geringer Auslastung des Prozessors wesentlich höher. Von 3,6 GHz kann sich der Prozessor automatisch auf 4,2 GHz übertaktet werden. Der im Vergleich zum Phenom II erhöhte Turbo-Modus kann so extrem hoch übertaktet werden, weil sich die nicht belasteten Kerne durch den C6-Modus schlafen legen können und sich die Restenergie auf die anderen Prozessorkerne im Rahmen der TDP aufgeteilt wird. Bei Auslastung aller Kerne ist ein maximaler Turbo-Modus von maximal 300 MHz bei AMD FX-8150 drin. Auch hier wird im Rahmen der TDP übertaktet, sofern diese dadurch nicht überschritten wird.

Bild

Der Turbo in Verbindung mit der Modulbauweise hat jedoch auch ein Harken: Das Betriebssystem z.B. Windows 7 übernimmt die Ressourcenverteilung über die Kerne und wechselt die Aufgabenverteilung immer und immer wieder über die vorhandenen Kerne, sodass der Turbo-Modus nur im seltenen Fall den Ideal-Modus trifft. Mit Windows 8 soll sich das Verteilen der Aufgaben und die Unterstützung dieses Prozessors wesentlich besser sein. Es ist möglich in Kombination mit Windows 8 aus diesem Prozessor eine weitere Leistungssteigerung von bis zu 10 Prozent herauszuholen.

Microsoft veröffentliche vor wenigen Wochen einen Patch für Windows 7, den die native Unterstützung des Prozessors wesentlich erhöhen sollte, jedoch der Patch seitens Microsoft wieder vom Netz genommen wurde, weil dieses sich eher negativ auf die Leistungsfähigkeit dieses Prozessors ausgewirkt hat.

1.4 Cache, HT und Speichercontroller

Der Bulldozer besitzt neben der entscheidenden Architekturänderungen sowohl bei den Integer-Kernen als auch bei den FPUs auch noch andere Änderungen: Der Bulldozer muss pro Kern mit einem L1-Instruction-Cache von 64 kByte pro Modul sowie einen Datencache und 16 kByte pro Core klar kommen. Bisher haben AMDs bisherigen Prozessoren mit Ausnahme einiger Sempron-Modelle 128 kByte L1-Cache pro Kern, wovon jeder CPU-Kern auf 64 kByte Instruktion-Cache sowie 64 kByte Datencache zugreifen konnte.

Der Level2-Cache von 2 MByte wird auf je ein Modul verbaut. Das heißt die beiden Integer-Kerne des Modules müssen sich den L2-Cache teilen. Sowohl der L1 als auch der L2-Cache sind mit vollem Prozessortakt getaktet. Als L3-Cache sind insgesamt nochmals 8 MByte auf dem DIE verbaut und bei allen derzeit auf den Markt befindlichen AMD Bulldozern-Modellen gleich groß. Dieser ist nicht im Prozessortakt getaktet, sondern wird mit dem Hyper-Transport-Takt synchronisiert. Der Hyper-Transport, der schon seit dem ersten Athlon 64-Prozessor als wichtigste Schnittstelle dient, wird nun mit 4400 MT/s (Megatransfers/Sekunde) angebunden, bzw läuft standardmäßig auf 2200 MHz. Dieser ist im Vergleich zum Phenom II um 200 MHz bzw. 400 MT/s erhöht.

AMDs hat beim Bulldozer den Speichercontroller aufgeräumt und die Unterstützung von DDR2-Speicher verworfen. Stattdessen ist dieser nur mit DDR3-Speicher kompatibel und daher auch nur bis auf Socket AM3 abwärtskompatibel.

1.5 Powermanagement

Seit wenigen Jahren ist der Energieverbrauch in aller Munde und soll möglichst schnell vermindert werden. AMD zeigt schon seit Jahren mit der Cool'n'Quiet-Technologie, dass man Prozessoren "schlafen legen" kann. Beim Bulldozer geht AMD noch einen Schritt drauf. Der Phenom II unterstützt neben Coon'n'Quiet auch C1E (Low Power Idle-State), was bisher den Energieverbrauch nochmals drastisch gesenkt hat. Neben C1E und C'n'Q wird der Energieverbrauch durch Abschaltung von Cores nochmals gesenkt und die Effizienz im Leerlauf nochmals drastisch erhöht. C6 ermöglich das Core-Abschalten. Nebenbei kann die DRAM-Spannung gesenkt werden. Ebenso können nicht benötigte Schaltkreise im Prozessor einfach abgeschaltet werden. Als letzte Stromsparmaßname setzt AMD auf das Application Power Management (APM). Dieses kann den Prozessortakt der einzelnen Cores nach der Auslastung regeln, diese mit Spannung absenken oder entsprechend bei höherer Auslastung mit höherer Spannung versorgen.


«
×
Picture