CORDIS - Forschungsergebnisse der EU
CORDIS

Reconfigurable non-von-Neumann Accelerators

Article Category

Article available in the following languages:

GPGPU der neuen Generation erhöhen die Energieeffizienz um eine Größenordnung

Durch die Entwicklung von GPGPU und die Abkehr von Von-Neumann-Architekturen gelang es dem EXAFLOW-Projekt einen neuen Prozessor zu entwickeln, der hohe Leistungsfähigkeit mit Energieeffizienz vereint.

Digitale Wirtschaft icon Digitale Wirtschaft

Wir sind alle mit dem Mooreschen Gesetz und in geringerem Maße mit der Dennard-Skalierung vertraut. Ihre Kombination führt dazu, dass sich die Anzahl der Transistoren auf gleichbleibender Grundfläche durch technologische Fortschritte jährlich verdoppelt, ohne dabei den Gesamtstromverbrauch zu erhöhen. Seit 2005 ist es jedoch zunehmend schwieriger, dieses Tempo aufrechtzuerhalten. Transistoren werden zwar immer noch kleiner, aber der Stromverbrauch steigt mit jeder neuen Gerätegeneration. Am Ende des Tages werden die Prozessoren also mehr Strom verbrauchen müssen als es ihre Größe zulässt und einfach durchbrennen. Ingenieuren gelang es zwar, dieses Problem durch die Verwendung von Mehrkernprozessoren zu umgehen, doch entstand dadurch ein neues Problem – die Programmierbarkeit. Es erweist sich als notorisch schwierig, eine Software zu entwickeln, die in der Lage ist, mehr Leistung aus gleichzeitig arbeitenden Prozessoren herauszuholen als bisher möglich war. Nun stellt sich natürlich die Frage, wie wir diese Probleme endgültig lösen können. Genau das ist die Eine-Million-Dollar-Frage, die sich das EXAFLOW-Projekt gestellt hat. „Die Grenzen der Leistung und der Programmierbarkeit zu überwinden, stellen zwei zusammenhängende Bemühungen dar“, so Prof. Yoav Etsion, Koordinator des Projekts im Auftrag des Technion in Israel. „Die Leistungsbeschränkung erfordert, dass wir neue Rechenmodelle und Prozessordesigns entwickeln, die energieeffizienter sind als das derzeit vorherrschende, mehr als 70 Jahre alte Von-Neumann-Modell; und die Grenze der Programmierbarkeit besteht darin sicherzustellen, dass diese neuen Rechenmodelle einfach zu bedienen und zu programmieren sind.“ Aus diesem Grund widmete sich das Team von Prof. Etsion der Entwicklung eines neuen Prozessortyps. Dieses Vorhaben stützt sich auf das SIMT-Modell – ein Modell, das aus Grafikbeschleunigern (GPU), wie zum Beispiel der Marken NVIDIA und AMD, hervorging, und die Einführung von GPU für allgemeine Zwecke (GPGPU) nach sich zog. „Das EXAFLOW-Projekt setzte sich zum Ziel, die Art und Weise zu überdenken, wie GPGPU normalerweise entworfen werfen. Wir wollten den Prozessor selbst grundlegend neu gestalten, und zwar um das Programmiermodell herum und nicht umgekehrt. Tatsächlich zeigen unsere neuesten Ergebnisse, dass unser Prozessor GPGPU deutlich übertrifft und gleichzeitig eine um ein Vielfaches höhere Energieeffizienz bietet“, schwärmt Prof. Etsion. Das Geheimnis hinter dieser verbesserten Leistung liegt in der Verwendung des „Datenfluss“-Ausführungsmodells – einem 50 Jahre alten Modell, das bisher allerdings noch nie für die Ausführung von parallelem Code verwendet wurde. Der Datenfluss bestimmt dabei die Ausführungsreihenfolge der Befehle, je nach Erfüllung ihrer Abhängigkeiten. Dies steht im Gegensatz zu den Von-Neumann-Architekturen, die Befehle in dem Moment ausführen, in dem sie an den Anfang des Datenflusses gelangen, unabhängig von ihren Abhängigkeiten. Letztere vergleicht Etsion in Bezug auf ihre Energieeffizienz mit Glühbirnen. Bei den funktionalen Ressourcen gibt es im Vergleich zu Standard-GPGPU zwar keine Unterschiede, allerdings sind sie nicht auf die gleiche Weise verdrahtet, sodass Zwischenwerte direkt zwischen Funktionseinheiten kommuniziert werden können. Folglich ist es möglich, das Computergefüge nahezu zu 100 % zu nutzen. „Wir verwenden zur Laufzeit zwei Datenflussvarianten (‚statisch‘ und ‚dynamisch‘), um die Parallelität auf Befehlsebene zu extrahieren und gleichzeitige Threads ungeordnet auszuführen. Immer wenn ein Befehl eines Threads bei einem langen Speicherzugriff blockiert wird, berechnen Funktionseinheiten automatisch Befehle von anderen Threads. Da die Zwischenwerte direkt zwischen Funktionseinheiten kommuniziert werden, benötigen wir zudem keinen Registerspeicher. Dies stellt eine weitere große Energieeinsparung dar“, erklärt Prof. Dr. Etsion. Durch den Nachweis, dass die Abkehr vom Von-Neumann-Modell große Vorteile bezüglich Leistung und Energieverbrauch bieten kann, hofft Prof. Dr. Etsion, andere Forscher dazu zu inspirieren, neue Rechenmodelle zu erforschen, die schließlich die mit der Leistung und Programmierbarkeit verbundenen Grenzen durchbrechen werden. Er und sein Team untersuchen derzeit Möglichkeiten zur Kommerzialisierung ihres Prozessors und werden zwei verschiedene akademische Wege erkunden. „Zum einen arbeitet mein Team an der Entwicklung neuer Prozessorarchitekturen basierend auf dem Datenflussmodell, und zum anderen entwickeln wir eine neue Datenflusssprache für das Hardware-Design, um die Produktivität von Entwicklern um das Zehnfache zu erhöhen. Wir hoffen diesbezüglich schon bald Ergebnisse präsentieren zu können“, sagt Prof. Dr. Etsion abschließend.

Schlüsselbegriffe

EXAFLOW, GPGPU, von Neumann, Datenfluss, Transistor, Mooresches Gesetz, Dennard-Skalierung, Leistungsgrenze, Programmierbarkeitsgrenze, Multikern, Prozessor, Modell

Entdecken Sie Artikel in demselben Anwendungsbereich