Skip to main content
European Commission logo print header

Article Category

Interview
Inhalt archiviert am 2024-04-18

Article available in the following languages:

EU-Forscher nutzen das Potenzial von Big Data

Das Hauptziel des EUDAT2020-Projekts besteht darin, europäischen Forschern den Zugang zu Datenverwaltungslösungen und großen Speichersystemen, die nahe an die leistungsstärksten Supercomputer Europas herankommen, zu erleichtern und ihnen gleichzeitig den grenzüberschreitenden Austausch von großen Datenmengen zu ermöglichen.

Digitale Wirtschaft icon Digitale Wirtschaft

Um auf dem neuesten Stand zu bleiben, müssen europäische Forscher aus verschiedenen Disziplinen sowohl dazu in der Lage sein, auf Massen von Daten zuzugreifen und sie zu sichern, als auch grenzüberschreitende Kooperationen zu fördern. EUDAT2020 soll genau dies ermöglichen. Aufbauend auf früheren EU-finanzierten Projekten gelang es dieser Initiative, ein Netzwerk europäischer Forschungseinrichtungen sowie Daten- und Rechenzentren aus 14 Ländern zusammenzuführen, um eine europaweite kollaborative Dateninfrastruktur (collaborative data infrastructure, CDI) zu schaffen. Ausgehend vom Stand April 2018 hatten sich 23 Partner offiziell der kollaborativen Dateninfrastruktur angeschlossen. Projektkoordinator Damien Lecarpentier vom CSC in Finnland diskutiert die Errungenschaften des Projekts und seine Rolle bei der Sicherung der europäischen Spitzenforschung der Zukunft. Wir haben mitbekommen, dass Big Data neue Möglichkeiten für Forscher eröffnet. Worin sehen Sie einige der Herausforderungen? Die Europäische Union und ihre Mitgliedstaaten haben in den letzten Jahren massiv in die Bereitstellung von dezentralen Netzwerken und Hochleistungsrechnentechnik (high-performance computing, HPC) für Forscher in verschiedenen Bereichen investiert. Die Herausforderung besteht darin, dass das schnelle Datenwachstum – dank leistungsfähiger neuer wissenschaftlicher Instrumente, Simulationen und der Digitalisierung vorhandener Ressourcen – neue Wege erfordert, um die Menge der mittlerweile verfügbaren Informationen zu organisieren und zu verarbeiten. Wir müssen einen kohärenteren Ansatz für die Datenverwaltung entwickeln, und genau darum geht es auch in diesem Projekt. Wir wollten Datenzentren miteinander verbinden, um verschiedene Forschungsgemeinschaften besser unterstützen zu können. Können Sie einige konkrete Beispiele für diese Herausforderungen nennen? In der Wissenschaft der festen Erde umfassen die gesammelten Informationen Echtzeit- und Offline-Daten (wie Bilder, Videos und organisierte Datenstrukturen, die in Datenbanken gespeichert werden). Für diese verschiedenen Arten von Daten bestehen unterschiedliche technische Anforderungen in Bezug auf den Zugang und die Erhaltung. Für die biomedizinischen Gemeinschaft stellt es eine zentrale Herausforderung dar, sicherzustellen, dass die Daten unter Wahrung der gesetzlichen Anforderungen an die Anonymität und Vertraulichkeit von Patienteninformationen abgerufen werden können. Alle Forschungsbereiche, einschließlich der Sozial- und Geisteswissenschaften, sehen sich mit Herausforderungen in Bezug auf die Verwaltung von Datenreplikaten und den Zugriff auf diese Daten in einer Umgebung mit mehreren Nutzern konfrontiert. Welche Rolle kam den Forschern in diesem Projekt zu? Die Forschungsgemeinschaften waren von Anfang an die treibenden Kräfte hinter der Auswahl der Datendienste. Darüber hinaus haben sie im Rahmen multidisziplinärer Teams direkt an der Konzeption und Entwicklung dieser Dienste teilgenommen. Das Projekt vereinte über 50 Forschungsgemeinschaften aus verschiedenen Disziplinen, von denen jede einzelne spezifische Anforderungen und Kenntnisse mit sich brachte. Diese Anforderungen reichten von der Notwendigkeit, Daten für eine höhere Verfügbarkeit zu reproduzieren und die Sicherheit sensibler Daten zu gewährleisten, bis hin zu der Möglichkeit, Daten über die ursprüngliche Gesellschaft hinaus teilen zu können. Neuere Forschungsgemeinschaften haben häufig die Gestaltung ihrer Kerndaten-Workflow-Prozesse noch nicht abgeschlossen und sind daran interessiert, verschiedene Lösungen zu testen, bevor sie sich endgültig festlegen. Reifere Gemeinschaften hingegen besitzen normalerweise bereits eine bestehende Arbeitsinfrastruktur. Wo immer es auch möglich war, sahen wir bestehende Dienste als Chancen an und versuchten sie zu unterstützen, indem wir es den Gemeinschaften ermöglichten, ihre Computer- und Speicherumgebung mithilfe der kollaborativen Dateninfrastruktur zu erweitern. Dies bedeutete, dass Forschungsgemeinschaften nicht nur in ihrer Rolle als Kunde, sondern auch als Dienstleister in Betracht gezogen wurden. Welche Vorteile erfahren Forscher durch dieses Projekt? Den an dem Projekt beteiligten Forschungsgemeinschaften gelang es europaweit Datenverwaltungsdienste zu planen, zu implementieren und zu nutzen. Zu den wissenschaftlichen Bereichen, die abgedeckt wurden, gehören Sozial- und Geisteswissenschaften, Geowissenschaften und Atmosphärische Wissenschaften, Klimawissenschaften, biologische Vielfalt, Biowissenschaften und Physik. In der Vergangenheit konnte ich mich an mein lokales Daten- und Rechenzentrum wenden, wenn ich Zugriff auf ein Speichersystem benötigte, das es mir erlaubt, meine Daten zu analysieren. Auf diese Weise würden allerdings nur lokale Nutzer aus dem gleichen Land abgedeckt. Daten über Grenzen hinweg zu übertragen oder Informationen und Tools mit Kollegen aus dem Ausland zu teilen, erforderte oft eine maßgeschneiderte Lösung, die einfach nicht erweiterbar ist. Diese nachhaltige Partnerschaft, in der alle Partner eine gemeinsame Vision verfolgen, hat den Zugang zu Datentools auf europäischer Ebene eröffnet, und ermöglicht eine schnellere Aktivierung von europäischen Kooperationen. Zudem hat das Projekt die Anbieter von Datenspeicherungs- und -verwaltungsdiensten viel stärker für die Bedürfnisse von Forschungsgemeinschaften sensibilisiert. Dazu gehören ihre Anforderungen an die Datenverwaltung sowie die Art und Weise, wie sie ihre jeweiligen Forschungsinfrastrukturen organisieren; zum Beispiel, ob sie sich dafür entscheiden, ihre eigenen Datenverwaltungsdienste zu nutzen, oder ob sie auf bereits vorhandene Dienste zurückgreifen, die spezielle Anpassungen erfordern. Was waren die Schlüsselfaktoren für den Erfolg des Projekts? Diese Errungenschaften wurden durch ein großzügig finanziertes EU-Projekt und eine Gruppe hoch engagierter Projektpartner ermöglicht. Dadurch, dass wir auf früheren Projekterfahrungen aufgebaut und zusammengearbeitet haben, ist es uns gelungen, eine einzigartige Kultur für offenen Wissensaustausch und Kooperation zu schaffen. Wir haben das Projekt EUDAT CDI auf den Weg gebracht, um dieses Vermächtnis zu bewahren und fortzuführen. Wie genau wird dieses Vermächtnis gesichert? Während des letzten Jahres haben wir uns darauf konzentriert, auf Grundlage des Projekts eine nachhaltige Gesellschaft aufzubauen. Die Partner von EUDAT haben sich dazu verpflichtet, die kollaborative Dateninfrastruktur sowie die damit verbundenen Dienstleistungen zunächst für einen Zeitraum von zehn Jahren zu unterstützen. Darüber hinaus haben wir ein Sekretariat eingerichtet, um die Entwicklung und den Betrieb der kollaborativen Dateninfrastruktur zu koordinieren, und im Februar 2018 wurde offiziell eine Gesellschaft mit beschränkter Haftung gegründet. Diese Gesellschaft wird ohne Gewinnerzielungsabsicht als Stimme der europäischen Organisationen fungieren, die im Rahmen von EUDAT CDI zusammenarbeiten und Dienstleistungen im Zusammenhang mit der Speicherung und dem Lebenszyklusmanagement von wissenschaftlichen und Forschungsdaten erbringen. Was die Zukunft betrifft, so sehen wir EUDAT CDI als eine wachsende Gesellschaft, basierend auf einer vertraglichen Vereinbarung zwischen ihren Mitgliedern. Sie ist eine der tragenden Säulen der Europäischen Cloud für offene Wissenschaft, einer Cloud für Forschungsdaten in Europa. CDI ist ein offenes Unternehmen und begrüßt Dienstleistungsanbieter, die sich dem Netzwerk, das aus verschiedenen Engagement- und Integrationsebenen besteht, anschließen möchten.

Länder

Finnland