Intel Core i7 / i5 / i3
Der Kern des Core i7 bildet die Nehalem-Architektur. Das Nehalem-Rechenwerk ist mit den Penryn-Kernen von Core 2 Duo und Core 2 Quad verwandt. Für Nehalem wurde der Penryn-Kern stark überarbeitet. Intel hat den Core i7 auf die parallele Verarbeitung zahlreicher Threads optimiert.
Der Nehalem hat einen integrierten Speichercontroller, so wie AMD es bei seinen Prozessoren schon länger macht. Mit der Einführung des Nehalem-Prozossors sind neue Motherboards mit neuem Sockel fällig. Das neue Gehäuse und der Sockel mit der Bezeichnung LGA1366 haben 1366 Kontakte. Hauptsächlich wegen dem integrierten Speichercontroller.


Die Besonderheiten des Core i7 und der Nehalem-Architektur:
- Einführung des QuickPath Interconnection (QPI)
- serielle Verbindungen zum Chipsatz und Speicher
- Wiedereinführung von Hyper-Threading (HT)
- integrierter Speichercontroller
- nativer Quad-Core
- SSE4.2
- Turbo Boost
- Später soll ein PCIe-2.0-Port (Direct Media Interface, DMI) und/oder ein Grafikkern folgen.
Nehalem-Architektur

Diese Nehalem-Architektur ist wie ein modulares Baukastensystem. Es sind viele Prozessor-Varianten für unterschiedliche Märkte und Anwendungen möglich. Darunter Server, Workstations und High-End-Desktop-Systeme. Die Architektur hält für preiswerte Desktop-Systeme auch einen integrierten Grafik-Controller bereit.
Der Aufbau eines Kerns entspricht dem Vorgänger Merom/Penryn der Core-Architektur. Die Kerne sind im Core-Bereich angesiedelt. Alles Weitere im Uncore-Bereich. Die wesentlichen Unterschiede zu Merom/Penryn finden sich vor allem im Uncore-Bereich, der den integrierten Speichercontroller für bis zu drei DDR3-Kanäle, die bis zu vier QuickPath-Links und den 8 MByte großen L3-Cache umfasst. Dieser Uncore-Bereich kann mit eigenem Takt und eigener Spannung betrieben werden, um Energie zu sparen.
Die Kerne takten immer gleich schnell. Der Grundtakt ist immer 133 MHz. Bei einer Taktfrequenz von 3,2 GHz ist ein Multiplikator von 24 eingestellt.
Die wichtigste architektonische Veränderung ist die Aufteilung des Font-Side-Bus in den QuickPath-Interconnection und den integrierten Speichercontroller. Davor hat Intel den kompletten Datenverkehr zum Prozessor über den Front-Side-Bus geführt.
Cache
In der Nehalem-Architektur hat jeder Kern einen L1-Cache mit 64 kByte, jeweils 32 kByte für Daten und Instruktionen, und einen L2-Cache mit 256 kByte auf den die Zugriffe mit sehr niedriger Latenzzeit erfolgen. Im Uncore-Bereich befindet sich ein gemeinsamer Inklusiv-L3-Cache mit 8 MByte, der je nach Prozessor-Typ auch etwas weniger betragen kann
Inklusiv-Cache bedeutet, dass die Daten im L1-Cache auch im L2- und L3-Cache vorhanden sind. So lässt sich die Datenkonsistenz zwischen den Kernen leichter sicherstellen (Cache-Koheränz bei mehreren Prozessor-Kernen). Im Vergleich zum Exklusiv-Cache wird etwas Speicherkapazität verschenkt.
Insgesamt hat die Nehalem-Architektur weniger Cache als der Core 2. Den Cache konnte Intel einsparen, weil die Anbindung von Prozessor zu Chipsatz und Speicher durch QPI beschleunigt werden konnte. Der Pufferspeicher in Form von umfangreichen Caches muss dann nicht mehr so groß sein.
Speichercontroller
Eine Besonderheit ist der integrierte Speichercontroller. Das war bisher eine Spezialität von AMD. Der Nehalem-Speichercontroller unterstützt drei Kanäle, die für DDR3-SDRAM-Chips mit maximal 533 MHz Taktfrequenz ausgelegt sind. Dafür eignen sich PC3-8500-DIMMs (DDR3-1066). In Summe haben die drei Kanäle eine theoretische Transferrate von maximal 25,6 GByte/s. Das ist genauso viel, wie zwei PC3-12800-Module (DDR3-1600).
Den optimalen Speicherdurchsatz erzielt man mit drei oder sechs gleich großen Speichermodulen. Nur dann steht dem Prozessor seine maximal mögliche Datentransferrate bei Hauptspeicherzugriffen zur Verfügung. Bisher waren ein-, zwei- oder auch vierkanalige Speichercontroller üblich. Deshalb bieten Händler baugleich DIMMs im Dreier- oder Sechserpack an (Tri- oder Hex-Kits).
Somit ist auch klar, warum der neue Sockel LGA1366 so viele Kontakte hat (1366 Stück). Er braucht sie, um die drei Kanäle für DDR3-SDRAM-Speichermodule anbinden zu können.
Hyper-Threading
Die Nehalem-Architektur hat Hyper-Threading (Simultaneous Multi-Threading, SMT) vom Pentium 4 geerbt. Es handelt sich allerdings um ein weiterentwickeltes Hyper-Threading, das wesentlich effizienter sein soll. Durch Hyper-Threading bekommt jeder physische Kern einen virtuellen bzw. logischen Kern dazu. Das Betriebssystem erkennt doppelt so viele Kerne, wie physisch vorhanden sind.
Hyper-Threading wirkt sich dann positiv aus, wenn die Abarbeitung eines Threads (Code-Faden) wegen Daten, die nachgeladen werden müssen, verzögert wird. Dann wird intern umgeschaltet und ein anderer Thread abgearbeitet. Auf diese Weise bringt Hyper-Threading zwischen 10 bis 20 Prozent mehr Leistung.
QPI - QuickPath Interconnection
QPI ersetzt den Front-Side-Bus (FSB). Wie HyperTransport von AMD ist QPI eine serielle Punkt-zu-Punkt-Schnittstelle. Das Interface ist eine Kombination aus HyperTransport und PCI Express. In Serverprozessoren eignet sich QPI auch zur CPU-Kopplung.
Ein Full-Width-QPI-Port besteht aus 20 Links pro Richtung, die jeweils bis zu 6,4 GBit/s übertragen. Weil 4 von 20 Links CRC-Prüfsummen übertragen, beträgt die Nutzdatenbreite 2 Byte (16 Bit). Ein Full-Width-Link kann also pro Richtung 12,8 GByte/s übertragen. Vollduplex kommt man sogar auf 25,6 GByte/s.
Full-Width-QPI auf einem 16x16-Link ist bei 6,4 GBit/s auch schneller als HyperTransport 3.0 mit nur 2,6 GHz (5,2 GBit/s). Das kommt daher, weil jeder einzelne Link zwei Signalleitungen nutzt. Weil pro Link ein ebenfalls differenzielles Taktsignal hinzukommt, braucht ein Full-Width-QPI-Link insgesamt 84 Signalleitungen.
Über den QPI fließen nur die Daten von und zu PCIe-Erweiterungskarten, sowie anderen Onboard-Einheiten. Die Geschwindigkeit des QPI ist deshalb weniger interessant als beim Front-Side-Bus (FSB).
Power-Management
Der Prozessor hat eine Power Control Unit (PCU) eingebaut. Die PCU enthält einen integrierten Mikrocontroller für das Power-Management. Alleine dafür werden mehr als eine Million Transistoren verwendet.
Um bei Teilen des Prozessors, die nicht benötigt werden, den Strom wirklich auf Null zu stellen, musste dafür eine vollständig neue Technik entwickelt werden. Der dafür neu entwickelte Schalter hat einen extrem niedrigen Widerstand, wenn er aktiv ist, und einen extrem hohen, wenn er ausgeschaltet ist. Zusätzlich wurden neue Sensoren integriert, die ständig die Temperatur der einzelnen Kerne und die Leistungsaufnahme überwachen. Hat ein Kern nichts zu tun, dann wird er in den Tiefschlaf geschickt.
Turbo Boost
Anwendungen, die nicht alle Kerne des Core i7 auslasten, werden beschleunigt, in dem der Prozessor höher getaktet wird. Hinter diesem Mechanismus steckt Turbo Boost. Für Turbo Boost ist die PCU verantwortlich. Die Monitoring-Logik der PCU misst die Auslastung, Leistungsaufnahme und Temperatur. In Abhängigkeit der drei Werte regelt die Logik den Turbo Boost. Die PCU ist dafür verantwortlich, dass der Prozessor seinen TDP, seine Maximalspannung und seine Maximaltemperatur nicht überschreitet. Diese Werte sind in der PCU unveränderlich vorgegeben. Außer in den zum Übertakten geeigneten Extreme-Edition-Versionen. Dort ist die Taktfrequenz offen und der TDP variabel.
Sofern Turbo Boost im BIOS freigeschaltet ist und nicht alle Kerne ausgelastet sind, kann Turbo Boost die Taktfrequenz einzelner CPU-Kerne um bis zu 666,67 MHz oder fünf 133-MHz-Multiplikatorstufen höher einstellen als die nominelle Frequenz des jeweiligen Prozessors. Um wieviel Turbo Boost den Multiplikator nach oben setzt, hängt von der CPU-Version, ihrem maximalen Multiplikator, ausreichende Kühlung (CPU-Kühler) und vom Spannungswandler auf dem Motherboard ab.
Turbo Boost hat den Nachteil, dass es im Vergleich zur Rechenleistung mehr Leistung verbraucht.
Der Unterschied zwischen Übertakten und Turbo Boost ist nicht sehr groß. Allerdings bringt Turbo Boost nicht wirklich mehr Leistung. Das wäre nur dann gegeben, wenn man per Hand nachhelfen würde. Man kann aber jetzt schon davon ausgehen, dass der Mechanismus, der hinter Turbo Boost steckt, in zukünftigen Prozessor-Generationen eine größere Rolle spielen wird.
Ein klarer Vorteil, der jetzt schon für Turbo Boost spricht, ist die Tatsache, dass die meisten Anwendungen immer noch mit ein oder zwei Prozessorkernen auskommen. Wenn also nur ein oder zwei Kerne voll ausgelastet sind und mit höherer Taktfrequenz arbeiten, dann wirkt sich das insgesamt beschleunigend aus.
CPU-GPU-Prozessor

Mit der Core-i5-600er Serie wagt sich Intel erstmals die CPU und einen Grafikprozessor in einem Prozessor zu vereinen. Schaut man jedoch genauer hin, dann hat Intel einen Dual-Core-Prozessor und eine klassische Northbridge (Chipsatz) mit Speichercontroller und integrierter Grafikeinheit in ein gemeinsames Gehäuse verpflanzt. Von einem echten CPU-GPU-Prozessor ist Intel noch ein ganzes Stück weg.
Übersicht: Intel Core i7
Die Core-i7-800-Baureihe unterscheidet sich von den Core-i7-900-Baureihe hauptsächlich dadurch, dass sie auf den billigeren LGA1156-Motherboards und nicht auf den teureren LGA1366-Motherboards laufen. Die kleinere Baureihe muss auf den dritten DDR3-Speicherkanal und den externen QPI-Link verzichten. LGA1156-Prozessoren binden PCI-Express-2.0-Lanes für eine oder zwei Grafikkarten sowie den Chipsatz direkt an.
Stand: 22.07.2010
| Modell | Kerne | Kerntakt | L2-Cache | L3-Cache | QPI | Sonstiges |
|---|---|---|---|---|---|---|
| Intel Core i7 (Kern: Bloomfield), 263 mm², 731 Mio. Transistoren, 45 nm, LGA1366 | ||||||
| 920 | 4 | 2,66 GHz | 4 x 256 kByte | 8 MByte | 4,8 GT/s | SSE4, HT, EM64T, NX, VT, C2E |
| 940 | 4 | 2,93 GHz | 4 x 256 kByte | 8 MByte | 4,8 GT/s | SSE4, HT, EM64T, NX, VT, C2E |
| 950 | 4 | 3,06 GHz | 4 x 256 kByte | 8 MByte | 4,8 GT/s | SSE4, HT, EM64T, NX, VT, C2E |
| 960 | 4 | 3,20 GHz | 4 x 256 kByte | 8 MByte | 4,8 GT/s | SSE4, HT, EM64T, NX, VT, C2E |
| 975 | 4 | 3,33 GHz | 4 x 256 kByte | 8 MByte | 4,8 GT/s | SSE4, HT, EM64T, NX, VT, C2E |
| Intel Core i7 Extreme Edition (Kern: Bloomfield), 263 mm², 731 Mio. Transistoren, 45 nm, LGA1366 | ||||||
| 965 EE | 4 | 3,20 GHz | 4 x 256 kByte | 8 MByte | 6,4 GT/s | SSE4, HT, EM64T, NX, VT, C2E |
| 975 EE | 4 | 3,33 GHz | 4 x 256 kByte | 8 MByte | 6,4 GT/s | SSE4, HT, EM64T, NX, VT, C2E |
| Intel Core i7 (Kern: Lynnfield), 45 nm, LGA1156 | ||||||
| 860S | 4 | 2,53 GHz | 4 x 256 kByte | 8 MByte | 4,8 GT/s | HT, EIST, EM64T, SSE4, VT-x, VT-d, TXT |
| 860 | 4 | 2,80 GHz | 4 x 256 kByte | 8 MByte | 4,8 GT/s | HT, EIST, EM64T, SSE4, VT-x, VT-d, TXT |
| 870S | 4 | 2,66 GHz | 4 x 256 kByte | 8 MByte | 4,8 GT/s | HT, EIST, EM64T, SSE4, VT-x, VT-d, TXT |
| 870 | 4 | 2,93 GHz | 4 x 256 kByte | 8 MByte | 4,8 GT/s | HT, EIST, EM64T, SSE4, VT-x, VT-d, TXT |
| Intel Core i7 (Kern: Gulftown), 248 mm², 1,17 Mrd. Transistoren, 45 nm, LGA1366 | ||||||
| 980X (EE) | 6 | 3,33 GHz | 6 x 256 kByte | 12 MByte | 6,4 GT/s | HT, EIST, EM64T, SSE4, AES-NI, VT-x |
| Intel Core i7, 32 nm, LGA1366 | ||||||
| 970 | 6 | 3,2 GHz | 6 x 256 kByte | 12 MByte | 6,4 GT/s | HT, EIST, EM64T, SSE4, AES-NI, VT-x |
Übersicht: Intel Core i5 und i3
Stand: 22.07.2010
| Modell | Kerne | Kerntakt | L2-Cache | L3-Cache | Sonstiges |
|---|---|---|---|---|---|
| Intel Core i3 (Kern: Clarkdale), 32 nm, LGA1156 | |||||
| 530 | 2 | 2,93 GHz | 2 x 256 kByte | 4 MByte | HT, EIST, EM64T, SSE4, GPU, VT-x |
| 540 | 2 | 3,06 GHz | 2 x 256 kByte | 4 MByte | HT, EIST, EM64T, SSE4, GPU, VT-x |
| Intel Core i5 (Kern: Clarkdale), 32 nm, LGA1156 | |||||
| 650 | 2 | 3,20 GHz | 2 x 256 kByte | 4 MByte | HT, EIST, EM64T, SSE4, GPU, VT-x, VT-d, TXT |
| 660 | 2 | 3,33 GHz | 2 x 256 kByte | 4 MByte | HT, EIST, EM64T, SSE4, GPU, VT-x, VT-d, TXT |
| 661 | 2 | 3,33 GHz | 2 x 256 kByte | 4 MByte | HT, EIST, EM64T, SSE4, GPU, VT-x |
| 670 | 2 | 3,46 GHz | 2 x 256 kByte | 4 MByte | HT, EIST, EM64T, SSE4, GPU, VT-x, VT-d, TXT |
| Intel Core i5 (Kern: Lynnfield), 45 nm, LGA1156 | |||||
| 750S | 4 | 2,40 GHz | 4 x 256 kByte | 8 MByte | EIST, EM64T, SSE4, VT-x |
| 750 | 4 | 2,66 GHz | 4 x 256 kByte | 8 MByte | EIST, EM64T, SSE4, VT-x |
| 760 | 4 | 2,80 GHz | 4 x 256 kByte | 8 MByte | EIST, EM64T, SSE4, VT-x |
Weitere verwandte Themen:
- Intel Prozessoren
- Intel Core 2 Duo/Extreme
- Intel Core 2 Quad
- Intel Centrino 2
- Intel Pentium Dual-Core
| Dieser Text ist mir was wert: | [ ? ] |






