CORDIS - Forschungsergebnisse der EU
CORDIS

Helix Nebula – The Science Cloud

Article Category

Article available in the following languages:

Big-Data-Forschende werden sich in die „Cloud“ erheben

Bestimmte EU-Forschungsprojekte produzieren Berge von Daten. Diese Mengen zu verarbeiten und zu speichern stellt eine große Herausforderung dar. Ein EU-Team wartet mit einer Lösung auf.

Digitale Wirtschaft icon Digitale Wirtschaft

Einige Wissenschaftszweige produzieren riesige Datenmengen. Teilchenphysik- und Genomiklabors geben beispielsweise täglich etwa ein Petabyte (PB) an Daten aus. Ein Petabyte entspricht tausend Terabytes (1 Million Gigabytes), oder ungefähr einer Viertelmillion DVDs. Die rund 10 Milliarden auf Facebook gespeicherten Fotos belaufen sich auf zirka 1,8 PB. Die meisten wissenschaftlichen Forschungseinrichtungen sind nicht in der Lage, solche Mengen in ihren eigenen Anlagen unterzubringen, und das Problem verschärft sich. Ein weiteres Problem bei der derzeitigen wissenschaftlichen Speicherung besteht darin, dass ein Großteil dieser Daten weder veröffentlicht noch öffentlich zugänglich ist. Daher hat die „Europäische Cloud für offene Wissenschaft“ (European Open Science Cloud, EOSC) die offene Wissenschaft in Auftrag gegeben, die bis 2020 einsatzbereit sein soll, um wissenschaftliche Ergebnisse öffentlich zugänglich und teilbar zu machen. Von der EU finanzierte Projekte, darunter EOSC-hub und EOSCpilot, haben bei der Entwicklung und Instandhaltung des Portals EOSC-Portal zusammengearbeitet. Das von der EU finanzierte Projekt HNSciCloud ist ein Konsortium aus kommerziellen Anbietern von Cloud-Diensten und öffentlichen Forschungseinrichtungen, das mit der Lösung der Probleme datenintensiver Wissenschaft beauftragt ist. Die Forschenden erkannten eine Marktlücke und verwalteten die Teilnahmeanträge der Ausschreibung für den Aufbau einer europäischen Hochleistungs-Cloud-Plattform für wissenschaftliche Organisationen. Die Idee ähnelt gewöhnlichen Cloud-Diensten, hat jedoch gigantische Dimensionen und erfüllt spezielle wissenschaftliche Bedürfnisse, einschließlich der EOSC-Konformität.

Ausschreibung und Entwurf

Die Arbeit des Projekts begann mit einer Ausschreibungsphase, in der das Team Anbieter- und Nutzerkreise konsultierte, um die Anforderungen festzulegen. Daraus ergab sich eine Auswahlliste von vier Konsortien. Während der anschließenden Entwurfsphase bereiteten die ausgewählten Konsortien ihre Vorschläge vor und reichten sie ein. Von diesen wählte der HNSciCloud-Bewertungsausschuss drei aus, um zur Prototyp- und Pilotphase voranschreiten zu können. In diesen letzten Phasen testeten die Projektforschenden anhand realistischer wissenschaftlicher Fälle die Skalierbarkeit und Zuverlässigkeit der Plattform. Der erste dieser Anwendungsfälle war das Worldwide Large Hadron Collider Computing Grid. Dabei handelt es sich um eine weltweite Kooperation, die aus 170 Rechenzentren in 42 Ländern besteht und Daten der CERN-Teilchenphysik verarbeitet. An den HNSciCloud-Tests waren auch viele andere stark nachgefragte europäische wissenschaftliche Forschungsgruppen beteiligt. Dazu gehören PanCancer zur täglichen Analyse von über 2 000 ganzen Krebsgenomen und das Niederfrequenzteleskop des Square Kilometre Array.

Spezialisierte Dienstleistungen

„In den Prototypen- und Pilotphasen wurden die Vorteile des hybriden Cloud-Modells erfolgreich demonstriert und es wurde gezeigt, dass Einrichtungen die Beschränkungen ihrer Recheninfrastruktur problemlos überwinden können, indem sie spezialisierte kommerzielle Cloud-Dienste einsetzen“, sagt Projektleiter Bob Jones. Wie in einem Projektvideo erwähnt, „kombiniert es Dienste auf der Ebene ‚Infrastruktur-als-Service‘, um eine Umgebung zu schaffen, die den gesamten Lebenszyklus wissenschaftlicher Arbeitsabläufe unterstützt“. Zu den Dienstleistungen gehören Rechnung und Speicherung, transparenter Zugriff auf Datensätze in Petabyte-Größenordnung, Netzwerkkonnektivität, föderiertes Identitätsmanagement und innovative Zahlungsmodelle. „Das Ergebnis ist eine hybride Cloud-Plattform, die nun der allgemeinen wissenschaftlichen Gemeinschaft zur Verfügung steht und die extrem anspruchsvollen Informations- und Kommunikationstechnik-Anforderungen selbst der datenintensivsten Wissenschaften erfüllen kann“, fügt Jones hinzu. HNSciCloud ist zertifiziert und entspricht den europäischen Normen und Vorschriften in Bezug auf Sicherheit und Datenschutz, sowie den Anforderungen der EOSC. Die Plattform basiert auf einem kommerziell unterstützten quelloffenen Code, für den keine Lizenzen erforderlich sind. Diese innovativen Cloud-Dienste bieten neue Möglichkeiten im Bereich der Informations- und Kommunikationstechnik, die Europas Forschungskapazität erweitern werden.

Schlüsselbegriffe

HNSciCloud, Cloud, Daten, wissenschaftlich, Petabyte, datenintensive Wissenschaft, Cloud-Plattform, Cloud-Speicher, wissenschaftliche Daten, Netzwerk, Infrastruktur-als-Service, Datenspeicherung

Entdecken Sie Artikel in demselben Anwendungsbereich