Intel setzt auf heterogene Zukunft für Supercomputing

Intel glaubt, dass künftige Fortschritte in der Supercomputing liegen über die Macht der CPU.

Während Server typischerweise auf CPUs zur Verarbeitung von Daten angewiesen sind, fügen heterogene Supercomputer der Mischung noch viele weitere Siliciumarten hinzu. Anstatt sich nur auf CPUs zu verlassen, schalten diese Maschinen auch Daten wie GPU-Cluster, Field Programmable Gate Arrays und Co-Prozessoren.

Berichte deuten darauf hin, dass Intel vorbereitet, um PC-Upgrades zu töten, indem sie die BGA anstatt ein LGA-Paket für seine anstehenden Broadwell-Architektur-Prozessoren. Dies ist der Anfang des Endes für den Desktop-PC.

Die Architektur dieser Co-Prozessoren kann sich auch erheblich von der Standard-Server-CPU unterscheiden. Zum Beispiel, während Intel Xeon E5-2600 v2 CPU vier bis acht Kerne packt, kann seine x86 Xeon Phi Co-Prozessor alles bis zu 61 Kerne auf einer einzigen Platine enthalten.

Mischen von Prozessorarchitekturen erlaubt Computern, mehr bang pro Dollar zu liefern. Wenn es darum geht, die beste Leistung pro Watt zu erzielen, können bestimmte Aufgaben parallel über viele kleinere, leistungsstärkere Kerne in einem Co-Prozessor oder einer GPU ausgeführt werden, während andere fähigere, energiehungrige CPUs mit tieferen Befehlspipelines bevorzugen.

Heterogene Supercomputer können um Prozessorkerne mit einer Mischung von Architekturen aufgebaut werden, deren Make-up für die Rechenaufgaben geeignet ist, die die Maschine ausführen wird.

Chinas Milchstraße 2, der schnellste Supercomputer der Welt nach der TOP500-Liste, basiert auf einer heterogenen Architektur. Milky Way 2 verfügt über 16.000 Knoten mit jeweils zwei Intel Xeon IvyBridge Prozessoren und drei Xeon Phi Prozessoren für insgesamt 3.120.000 Rechnerkerne.

“Wir glauben, dass die richtige Antwort ist, das Beste zu nutzen, was Heterogenität bietet, die die Leistung pro Energie aufgewendet und die Anpassung Nutzen ist”, sagte Dr. Rajeeb Hazra, Intels VP von Rechenzentrum und verbundene System-Gruppe und General Manager der technischen Computing-Gruppe .

Prozessoren: Intel startet Prozessoren der 7. Generation, um 4K UHD auf die Massen zu schieben, Prozessoren, Vision und neuronale Netze steigern die Nachfrage nach leistungsfähigeren Chips, Datenzentren, Nvidia startet virtuelle GPU-Überwachung, Analytics, Hardware, AMD schlägt gegen Intel-Dominanz mit Zen

Ein Nachteil des heterogenen Rechnens ist die zusätzliche Komplexität von Schreibprogrammen, die auf verschiedenen Befehlssatzarchitekturen ausgeführt werden können. Mit seinem Xeon Phi-Co-Prozessor behauptet Intel, dies zu überwinden, indem es das bewährte Programmiermodell für die Intel x86-Architektur bewahrt.

“Wir können das tun, ohne die Kosten für Heterogenität und die Beibehaltung der Vorteile der Homogenität auf der Programmierung Modell-Ebene”, sagte Hazra.

Eine IDC-Umfrage ergab, dass der Anteil der Hochleistungscomputerbenutzer, die planen, heterogene Beschleuniger oder Co-Prozessoren in zukünftigen Systemen zu verwenden, von unterhalb 30 Prozent ein Jahr und eine Hälfte bis zu mehr als 70 Prozent heute erhöht hat, entsprechend Hazra.

Gestern, kündigte Intel seine neue Line-up von Xeon Phi Co-Prozessor-Boards. Alle neuen Xeon Phi PCI-Express 3-Karten basieren auf der gleichen Knights Corner-Architektur, die im vergangenen November veröffentlicht wurde, und dem gleichen 22-nm-Tri-Gate-Prozess.

Die bestehende Familie von Xeon Phi 3100 ist jetzt mit aktiver und passiver Kühlung verfügbar, so dass die Boards von einem Server oder Workstations in-Fall-Kühlung nutzen können. Diese Familie ist entworfen, um Mittelbereichsleistung anzubieten, fähig zu mehr als einem teraflops der doppelten Präzisionsberechnungen und mit 240 GBps. An Bord sind 6 GB GDDR5 Arbeitsspeicher.

Die neue 7100-Serie steigert die Taktrate und steigert die Leistung auf mehr als 1,2 Teraflops von Gleitkomma-Berechnungen mit doppelter Genauigkeit und 352 GBit Speicherbandbreite. Onboard ist 16 GB GDDR5 Arbeitsspeicher.

Neue Xeon Phi

Die Baureihe 5100 ist ab sofort in einem neuen Formfaktor “hoher Dichte” erhältlich, der in hochdichte Systeme eingebaut werden soll. Wieder liefert der 5100 mehr als einen Teraflop der doppelten Präzision Gleitkomma-Leistung und 300GBps Speicherbandbreite. An Bord befinden sich 8 GB GDDR5-Speicher.

Vorgeschlagene Preise für die Boards sind $ 4,129 für die 7120P und 7120X, $ 2,759 für die 5120D und $ 1,695 für die 3120P und 3120A.

Die nächste Generation von Xeon Phi-Prozessoren mit dem Codenamen Knight’s Landing wird auf einem 14-nm-Chip basieren und als eigenständige CPU, die in eine Prozessorsockel passt, sowie einen Co-Prozessor, der auf einer PCI-Express-Platine sitzt, verfügbar sein.

Die größte Herausforderung mit der nächsten Generation von vielen Core-Prozessoren wie dem Xeon Phi wird genug Daten zu den vielen Kernen auf dem Prozessor mit einer schnell genug Rate füttern, sagte Hazra. Intel plant, das Problem durch die Integration von Speicher auf Paket, Stapeln es auf der Prozessor-Chip, in der nächsten Generation von Xeon Phi-Prozessoren zu bewältigen.

Zukünftige Hochleistungs-Cluster müssen auch die Netzwerk-Fabric-Controller auf Prozessoren zu integrieren, um genügend Daten, um das Netzwerk schnell genug schieben, sagte er. Die Integration der Netzwerk-Fabric-Controller auf diese Weise könnte liefern mehr als 100GBps Konnektivität, im Vergleich zu 10-20GBps heute verfügbar, sagte er.

Wenn Sie schauen, was die Maschinen heute tun können, sind sie alle an den Spitzen des Eisbergs angesichts dessen, was sie morgen tun müssen. Das Tempo und Tempo der Innovation muss weiter und beschleunigen, wie die Welt geht von petascale zu exascale Computing.

Die nächste Generation von High Performance Computing

Eine Exascale-Maschine wäre in der Lage zu mindestens einem Exaflops, das entspricht einer Milliarde Milliarden Operationen pro Sekunde.

Hazra sagte, die Integration der “richtigen Features in Silizium … reduziert die Leistung, reduziert die Kosten durch die Beseitigung von Chips, erhöht die Performance, indem Komponenten näher zusammen, erhöht die Skalierbarkeit, indem sie in der Lage, mehrere integrierte Funktionen in einem Satz von Bibliotheken abstrahieren und bietet beispiellosen Innovationsgrad in der Bereitstellung Sehr dichten Computing-Lösungen “.

Eine verstärkte Integration der Systemkomponenten wird für die Halbleiterindustrie erforderlich sein, um bis zum Ende des Jahrzehnts das Ziel zu erreichen, Exascale-Computing mit 20 MW zu schaffen.

Wir werden in der Lage sein, petascale Klasse Computer in etwa einem halben Rack heute zu bauen.

Intel startet Prozessoren der 7. Generation, um 4K UHD in die Massen zu schieben

Vision und neuronale Netze Antrieb Nachfrage nach leistungsfähigeren Chips

Nvidia startet virtuelle GPU-Überwachung, Analytics

AMD schlägt gegen Intel-Dominanz mit Zen zurück