Skip to main content
Przejdź do strony domowej Komisji Europejskiej (odnośnik otworzy się w nowym oknie)
polski polski
CORDIS - Wyniki badań wspieranych przez UE
CORDIS

DEEP – SOFTWARE FOR EXASCALE ARCHITECTURES

CORDIS oferuje możliwość skorzystania z odnośników do publicznie dostępnych publikacji i rezultatów projektów realizowanych w ramach programów ramowych HORYZONT.

Odnośniki do rezultatów i publikacji związanych z poszczególnymi projektami 7PR, a także odnośniki do niektórych konkretnych kategorii wyników, takich jak zbiory danych i oprogramowanie, są dynamicznie pobierane z systemu OpenAIRE .

Rezultaty

Quality control plan (odnośnik otworzy się w nowym oknie)

Definition of the quality control processes and templates for internal verification and document review for all project results and deliverables

Interoperability development (odnośnik otworzy się w nowym oknie)

Detailed report on proven ability of GPISpace to support the execution of MPI or GASPI programs spanning over multiple nodes and detailed performance study of MPIGPU performance bottleneck

Application use cases and traces (odnośnik otworzy się w nowym oknie)

Use cases integrated in JUBE profile and trace files provided to other WPs

Final evaluation of the system software stack (odnośnik otworzy się w nowym oknie)

Optimisations, adjustments and bug fixing in accordance with the user experiences.This Deliverable is led by ParTec.

Initial application co-design input (odnośnik otworzy się w nowym oknie)

Documents requirements of all applications for codesign includes all data analytics SW requirements compute memory communication performance footprints communication patterns etc

Final report on applications experience (odnośnik otworzy się w nowym oknie)

Reports the results of the application experience using the DEEP-SEA developments. Performance and efficiency (both according to the most relevant metric for the application), scalability, and portability will be measured and compared with the code performances at the beginning of the project.

Applications use of DEEP-SEA software stack (odnośnik otworzy się w nowym oknie)

Details the tools SW components and programming models that each application will use with further codesign input on the needed functionalities

Software specification (odnośnik otworzy się w nowym oknie)

Specification of the complete SW stack based on the requirements collected from WPs 1 to 5 This comprises WP3internal interfaces and dependencies as well as the interplay with WPs 2 4 and 5

Documentation of last improvements of the tools (odnośnik otworzy się w nowym oknie)

Documentation including bug fixes, lessons learned from deployment and next steps.

MSA-driven extension to system-wide programming and new memory integration (odnośnik otworzy się w nowym oknie)

Detailed report and intermediate release on extension of MPI libraries, including collective communications, RMA communication, tuning, and the MPI memory management extension. Also includes details on NVM as a fast buffer for a workflow’s intermediate data, and GPI-2 extension to support persistent segments.

Report on standardisation activities (odnośnik otworzy się w nowym oknie)

Summarising report covering all proposals made to the mentioned standardisation bodies based on work in DEEP-SEA as well as open standardisation potentials to create future roadmaps.

Final report (odnośnik otworzy się w nowym oknie)

Description of the technical and scientific results of the project

Repository for training material (odnośnik otworzy się w nowym oknie)

Design, access information and initial contents for the training repository.

Intermediate node-level programming environment (odnośnik otworzy się w nowym oknie)

Intermediate release and detailed report of programming environment. Final release and SW stack for processing in memory (PIM). This SW release will provide the programming environment to the application partners for their work leading to D1.4 First evaluation results.

Complete system software implementation (odnośnik otworzy się w nowym oknie)

Full system SW implementation of all components of the system SW stack meeting the requirements collected in D3.1 and matching the final specification developed in D3.2.This Deliverable is led by ParTec.

Final Node-level programming environment (odnośnik otworzy się w nowym oknie)

Final release and detailed report of programming environment and basis for D1.5 Final report on applications experience. Any remaining integration and debugging work will continue in the integration task

Initial node-level programming environment (odnośnik otworzy się w nowym oknie)

Initial release and detailed report of node-level programming environment. This SW release will enable early work by the application partners

Resiliency support (odnośnik otworzy się w nowym oknie)

Intermediate release and detailed report on resiliency enhancement. It includes description on resiliency in MPI sessions, slum extensions, Support of persistent segments in the GPI-2 implementation.

Malleability concept and early prototype (odnośnik otworzy się w nowym oknie)

Intermediate release and detailed report on malleability including concept and prototype version of MPIsessionbased malleability within MPI

Final system-level programming environment (odnośnik otworzy się w nowym oknie)

Final release and detailed report on WP5 contributions to system-level programming environment. This report includes the malleability support (including MPI and OmpSs-2@cluster extensions), interoperability (including accelerator optimised communication, MPC+GPI interaction, ParaStation MPI communication layer support in GPI-2, GPI-Space programs that support MPI and GASPI at the same time, and both MPI+OmpSs-2@cluster and GPI+OmpSs-2@cluster), and resiliency capabilities (including support for persistent segments in in-memory checkpointing library, evaluation of Slurm extension, evaluation of the extension of the checkpoint restart capabilities, evaluation of Open MPI runtime fault tolerance). These evaluations will be conducted using micro-benchmark and applications from WP1.

Final release of the tools (odnośnik otworzy się w nowym oknie)

Release with final feature set, tested and including updates to user documentation and installation guide.

Resource management and tool interface (odnośnik otworzy się w nowym oknie)

Intermediate release and detailed report on the interfaces developed between MPI libraries and their collocated environment such as the resource manager and external tools.

Final outreach activity (odnośnik otworzy się w nowym oknie)

Final brochure or project video, or an event or a combination of these. It will be decided during the project, which will be deemed most appropriate.

Communication and data management plan, toolkit and owned channels (odnośnik otworzy się w nowym oknie)

Details of the communication and brand strategy including a toolkit with materials like logos and collateral templates and DEEPSEA communication channels It contains also the data management plan as part of the Open Research Data Pilot ORDP

Publikacje

FaaSKeeper: Learning from Building Serverless Services with ZooKeeper as an Example (odnośnik otworzy się w nowym oknie)

Autorzy: M. Copik, A. Calotoiu, K. Taranov, T. Hoefler
Opublikowane w: 2022
Wydawca: Arxiv
DOI: 10.48550/arxiv.2203.14859

Classification of Solar Flares using Data Analysis and Clustering of Active Regions (odnośnik otworzy się w nowym oknie)

Autorzy: Hanne Baeke; Jorge Amaya; Giovanni Lapenta
Opublikowane w: Crossref, Numer 1, 2023
Wydawca: ESS Open Archive
DOI: 10.22541/essoar.167336864.46114556/v1

Processing in Memory: The Tipping Point (odnośnik otworzy się w nowym oknie)

Autorzy: Petar Radojković, Paul Carpenter, Pouya Esmaili-Dokht, Rémy Cimadomo, Henri-Pierre Charles, Abu Sebastian, Paolo Amato
Opublikowane w: ETP4HPC White Paper, Numer Sep 17, 2021, 2021
Wydawca: ETP4HPC
DOI: 10.5281/zenodo.4767489

Cppless: Productive and Performant Serverless Programming in C++ (odnośnik otworzy się w nowym oknie)

Autorzy: L. Möller, M. Copik, A. Calotoiu, T. Hoefler
Opublikowane w: 2024
Wydawca: Arxiv
DOI: 10.48550/arxiv.2401.10834

FTIO: Detecting I/O Periodicity Using Frequency Techniques (odnośnik otworzy się w nowym oknie)

Autorzy: Tarraf, Ahmad; Bandet, Alexis; Zanon Boito, Francieli; Pallez, Guillaume; Wolf, Felix
Opublikowane w: https://inria.hal.science/hal-04382142, Numer 2, 2023
Wydawca: arxiv
DOI: 10.48550/arxiv.2306.08601

Modular Supercomputing Architecture (odnośnik otworzy się w nowym oknie)

Autorzy: Suarez, Estela; Eicker, Norbert; Moschny, Thomas; Pickartz, Simon; Clauss, Carsten; Plugaru, Valentin; Herten, Andreas; Michielsen, Kristel; Lippert, Thomas
Opublikowane w: ETP4HPC White Papers, 2022
Wydawca: ETP4HPC
DOI: 10.5281/zenodo.6508394

Heterogeneous High Performance Computing (odnośnik otworzy się w nowym oknie)

Autorzy: P. Carpenter, U.-U. Haus, E. Laure, S. Narasimhamurthy, E. Suarez
Opublikowane w: ETP4HPC White Paper, 2022
Wydawca: ETP4HPC
DOI: 10.5281/zenodo.6090425

Task-Based Performance Portability in HPC

Autorzy: Olivier Aumage, Paul Carpenter, Siegfried Benkner
Opublikowane w: ETP4HPC White Paper, 2021
Wydawca: ETP4HPC

HPC for Urgent Decision-Making (odnośnik otworzy się w nowym oknie)

Autorzy: M. Marazakis, M.Duranton, D. Pleiter, G. Taffoni, and H.C. Hoppe
Opublikowane w: ETP4HPC White Paper, 2022
Wydawca: ETP4HPC
DOI: 10.5281/zenodo.6107362

A Compiler Approach to Automatic Multi-Pumping (odnośnik otworzy się w nowym oknie)

Autorzy: Johnsen, Carl-Johannes; De Matteis, Tiziano; Ben-Nun, Tal; Licht, Johannes de Fine; Hoefler, Torsten
Opublikowane w: Proceedings of the 41st IEEE/ACM International Conference on Computer-Aided Design, Numer 2, 2022
Wydawca: ACM
DOI: 10.1145/3508352.3549374

An Emulation Layer for Dynamic Resources with MPI Sessions (odnośnik otworzy się w nowym oknie)

Autorzy: Jan Fecht; Martin Schreiber; Martin Schulz; Howard Pritchard; Daniel J. Holmes
Opublikowane w: Lecture Notes in Computer Science, Numer 2, 2023, ISBN 9783031232190
Wydawca: Springer
DOI: 10.1007/978-3-031-23220-6_10

Arax: A Runtime Framework for Decoupling Applications from Heterogeneous Accelerators. (odnośnik otworzy się w nowym oknie)

Autorzy: M. Pavlidakis, S. Mavridis, A. Chazapis, G. Vasiliadis, and A. Bilas
Opublikowane w: ACM Symposium on Cloud Computing (SoCC) 2022, 2022
Wydawca: ACM
DOI: 10.1145/3542929.3563467

Static Local Concurrency Errors Detection in MPI-RMA Programs (odnośnik otworzy się w nowym oknie)

Autorzy: C. Tassadit Ait Kaci, M. Sergent, E. Saillard, D. Barthou
Opublikowane w: 2022 IEEE/ACM Sixth International Workshop on Software Correctness for HPC Applications (Correctness), 2023
Wydawca: IEEE
DOI: 10.1109/correctness56720.2022.00008

Artifact and instructions to generate experimental results for Euro-Par 2022 paper: OmpSs-2@Cluster: Distributed memory execution of nested OpenMP-style tasks (odnośnik otworzy się w nowym oknie)

Autorzy: Aguilar Mena, Jimmy; Shaaban, Omar; Beltran, Vicenç; Carpenter, Paul; Ayguadé, Eduard; Labarta Mancho, Jesus
Opublikowane w: Lecture Notes in Computer Science, Numer 2, 2022
Wydawca: Springer
DOI: 10.6084/m9.figshare.19960721.v1

NPBench: A Benchmarking Suite for High-Performance NumPy

Autorzy: Alexandros Nikolaos Ziogas, Tal Ben-Nun, Timo Schneider, and Torsten Hoefler
Opublikowane w: 2021
Wydawca: ICS'21

Efficient data redistribution for malleable applications (odnośnik otworzy się w nowym oknie)

Autorzy: Iker Martín Álvarez; José I. Aliaga; Maribel Castillo; Sergio Iserte
Opublikowane w: SC-W '23: Proceedings of the SC '23 Workshops of The International Conference on High Performance Computing, Network, Storage, and Analysis, 2023
Wydawca: Association for Computing Machinery
DOI: 10.1145/3624062.3624110

Maximum Flows in Parametric Graph Templates (odnośnik otworzy się w nowym oknie)

Autorzy: T. Ben-Nun, L. Gianinazzi, T. Hoefler, Y. Oltchik
Opublikowane w: International Conference on Algorithms and Complexity, 2023
Wydawca: Springer
DOI: 10.48550/arxiv.2307.08420

rFaaS: Enabling High Performance Serverless with RDMA and Leases (odnośnik otworzy się w nowym oknie)

Autorzy: M. Copik, K. Taranov, A. Calotoiu, T. Hoefler
Opublikowane w: 2023
Wydawca: IEEE
DOI: 10.1109/ipdps54959.2023.00094

OmpSs-2@Cluster: Distributed memory execution of nested OpenMP-style tasks. (odnośnik otworzy się w nowym oknie)

Autorzy: J. Aguilar Mena, O. Shaaban, V. Beltran, P. Carpenter, E. Ayguade, and J. Labarta
Opublikowane w: Proceedings of Euro-Par 2022, 2022
Wydawca: Springer
DOI: 10.1007/978-3-031-12597-3_20

Towards Dynamic Resource Management with MPI Sessions and PMIx (odnośnik otworzy się w nowym oknie)

Autorzy: Huber, Dominik; Streubel, Maximilian; Comprés, Isaías; Schulz, Martin; Schreiber, Martin; Pritchard, Howard
Opublikowane w: uroMPI/USA '22: Proceedings of the 29th European MPI Users' Group Meeting, Numer 2, 2022
Wydawca: ACM
DOI: 10.1145/3555819.3555856

A Data-Centric Optimization Framework for Machine Learning (odnośnik otworzy się w nowym oknie)

Autorzy: Oliver Rausch; Tal Ben-Nun; Nikoli Dryden; Andrei Ivanov; Shigang Li; Torsten Hoefler
Opublikowane w: ICS '22: Proceedings of the 36th ACM International Conference on Supercomputing, 2022
Wydawca: Association for Computing Machinery
DOI: 10.48550/arxiv.2110.10802

Productive Performance Engineering for Weather and Climate Modeling with Python

Autorzy: T. Ben-Nun, L. Groner, F. Deconinck, T. Wicky, E. Davis, J. Dahm, O. Elbert, R. George, J. McGibbon, L. Trümper, E. Wu, O. Fuhrer, T. Schulthess, T. Hoefler
Opublikowane w: SC'22, Numer -, 2022
Wydawca: -

Exploring the impact of node failures on the resource allocation for parallel jobs

Autorzy: Ioannis Vardas, Manolis Ploumidis, Manolis Marazakis
Opublikowane w: Proceedings of the 14th Resilience Workshop, held in conjunction with Euro-Par, 2021
Wydawca: JuSER

Bridging Control-Centric and Data-Centric Optimization (odnośnik otworzy się w nowym oknie)

Autorzy: T. Ben-Nun, B. Ates, A. Calotoiu, T. Hoefler
Opublikowane w: IEEE/ACM International Symposium on Code Generation and Optimization (CGO), 2023
Wydawca: ACM
DOI: 10.1145/3579990.3580018

Building Blocks for Network-Accelerated Distributed File Systems (odnośnik otworzy się w nowym oknie)

Autorzy: Salvatore Di Girolamo, Daniele De Sensi, Konstantin Taranov, Milos Malesevic, Maciej Besta, Timo Schneider, Severin Kistler, Torsten Hoefler
Opublikowane w: SC'22, 2022
Wydawca: SC'22
DOI: 10.48550/arxiv.2206.10007

Productivity, portability, performance: data-centric Python (odnośnik otworzy się w nowym oknie)

Autorzy: A. N. Ziogas, T. Schneider, T. Ben-Nun, A. Calotoiu, T. De Matteis, J. de Fine Licht, L. Lavarini, T. Hoefler
Opublikowane w: 2021
Wydawca: ACM
DOI: 10.1145/3458817.3476176

Impact of Cache Coherence on the Performance of Shared-Memory based MPI Primitives: A Case Study for Broadcast on Intel Xeon Scalable Processors - Computational Artifacts (odnośnik otworzy się w nowym oknie)

Autorzy: Katevenis, George; Ploumidis, Manolis; Marazakis, Manolis
Opublikowane w: 52nd International Conference on Parallel Processing (ICPP), Numer 2, 2023
Wydawca: ACM
DOI: 10.5281/zenodo.8074488

Accelerating Brain Simulations with the Fast Multipole Method (odnośnik otworzy się w nowym oknie)

Autorzy: H. Nöttgen, F. Czappa, and F. Wolf
Opublikowane w: Proceedings of Euro-Par 2022, Numer 01.08.2022, 2022
Wydawca: Springer
DOI: 10.1007/978-3-031-12597-3_24

Conquering Noise With Hardware Counters on HPC Systems (odnośnik otworzy się w nowym oknie)

Autorzy: M. Ritter, A. Tarraf, A. Geiß, N. Daoud, B. Mohr, F. Wolf
Opublikowane w: 2022
Wydawca: IEEE
DOI: 10.1109/protools56701.2022.00007

Page Size Aware Cache Prefetching (odnośnik otworzy się w nowym oknie)

Autorzy: Vavouliotis, Georgios; Chacon, Gino; Álvarez Martí, Lluc; Gratz, Paul V.; Jiménez, Daniel A.; Casas, Marc
Opublikowane w: 2022 55th IEEE/ACM International Symposium on Microarchitecture (MICRO), 2022
Wydawca: IEEE
DOI: 10.1109/micro56248.2022.00070

A High-Fidelity Flow Solver for Unstructured Meshes on Field-Programmable Gate Arrays: Design, Evaluation, and Future Challenges. (odnośnik otworzy się w nowym oknie)

Autorzy: Martin Karp, Artur Podobas, Tobias Kenter, Niclas Jansson, Christian Plessl, Philipp Schlatter, and Stefano Markidis
Opublikowane w: HPCAsia2022, 2022
Wydawca: ACM
DOI: 10.1145/3492805.3492808

Impact of Cache Coherence on the Performance of Shared-Memory based MPI Primitives: A Case Study for Broadcast on Intel Xeon Scalable Processors (odnośnik otworzy się w nowym oknie)

Autorzy: G. Katevenis, M. Ploumidis, M. Marazakis
Opublikowane w: 52nd International Conference on Parallel Processing (ICPP), 2023
Wydawca: ACM
DOI: 10.1145/3605573.3605616

Maximum Flows in Parametric Graph Templates (odnośnik otworzy się w nowym oknie)

Autorzy: Tal Ben-Nun; Lukas Gianinazzi; Torsten Hoefler; Yishai Oltchik
Opublikowane w: Lecture Notes in Computer Science, Numer vol 13898, 2023, Strona(/y) 97-111
Wydawca: Springer
DOI: 10.1007/978-3-031-30448-4_8

Boosting Performance Optimization with Interactive Data Movement Visualization (odnośnik otworzy się w nowym oknie)

Autorzy: Philipp Schaad, Tal Ben-Nun, Torsten Hoefler
Opublikowane w: 2022
Wydawca: SC'22
DOI: 10.48550/arxiv.2207.07433

FuzzyFlow: Leveraging Dataflow To Find and Squash Program Optimization Bugs (odnośnik otworzy się w nowym oknie)

Autorzy: P. Schaad, T. Schneider, T. Ben-Nun, A. Calotoiu, A. Nikolaos Ziogas, T. Hoefler
Opublikowane w: The International Conference for High Performance Computing, Networking, Storage and Analysis, 2023
Wydawca: ACM
DOI: 10.1145/3581784.3613214

Breaking Down the Parallel Performance of GROMACS, a High-Performance Molecular Dynamics Software (odnośnik otworzy się w nowym oknie)

Autorzy: Andersson, Måns I.; Murugan, N. Arul; Podobas, Artur; Markidis, Stefano
Opublikowane w: PPAM22, Numer Lecture Notes in Computer Science, vol 13826, 2023, Strona(/y) 333–345, ISBN 978-3-031-30442-2
Wydawca: Springer
DOI: 10.48550/arxiv.2208.13658

Lifting C semantics for dataflow optimization (odnośnik otworzy się w nowym oknie)

Autorzy: Calotoiu, Alexandru; Ben-Nun, Tal; Kwasniewski, Grzegorz; Licht, Johannes de Fine; Schneider, Timo; Schaad, Philipp; Hoefler, Torsten
Opublikowane w: ICS '22: Proceedings of the 36th ACM International Conference on Supercomputing, 2022
Wydawca: Association for Computing Machinery
DOI: 10.1145/3524059.3532389

ecoHMEM: Improving Object Placement Methodology for Hybrid Memory Systems in HPC (odnośnik otworzy się w nowym oknie)

Autorzy: Jordà Peroliu, Marc; Rai, Siddharth; Ayguadé Parra, Eduard; Labarta Mancho, Jesús José; Peña Monferrer, Antonio José
Opublikowane w: Crossref, Numer 18, 2022
Wydawca: IEEE
DOI: 10.1109/cluster51413.2022.00040

Satellite Collision Detection using Spatial Data Structures (odnośnik otworzy się w nowym oknie)

Autorzy: Ch. Hellwig, F. Czappa, M. Michel, R. Bertrand, F. Wolf
Opublikowane w: 2023
Wydawca: IEEE
DOI: 10.1109/ipdps54959.2023.00078

Filtering and Ranking of Code Regions for Parallelization via Hotspot Detection and OpenMP Overhead Analysis (odnośnik otworzy się w nowym oknie)

Autorzy: S.A. Mohammadi, L. Rothenberger, G. de Morais, B. Nico Görlich, E. Lille, H. Rüthers, F. Wolf
Opublikowane w: 2023
Wydawca: IEEE
DOI: 10.1145/3624062.3624206

PROGRAML: A Graph-based Program Representation for Data Flow Analysis and Compiler Optimizations

Autorzy: Chris Cummins and Zacharias V. Fisches and Tal Ben-Nun and Torsten Hoefler and Michael O’Boyle and Hugh Leather
Opublikowane w: ICML'21, Numer -, 2022
Wydawca: -

Automatic aggregation of subtask accesses for nested OpenMP-style tasks (odnośnik otworzy się w nowym oknie)

Autorzy: O. Shaaban, J. Aguilar Mena, V. Beltran, P. Carpenter, E. Ayguade and J. Labarta Mancho
Opublikowane w: SBAC-PAD 2022, 2022
Wydawca: IEEE
DOI: 10.1109/sbac-pad55451.2022.00042

Combining Dynamic Concurrency Throttling with Voltage and Frequency Scaling on Task-based Programming Models (odnośnik otworzy się w nowym oknie)

Autorzy: Antoni Navarro Muñoz; Arthur F. Lorenzon; Eduard Ayguadé Parra; Vicenç Beltran Querol
Opublikowane w: ICPP, Numer 6, 2021
Wydawca: Association for Computing Machinery
DOI: 10.1145/3472456.3472471

Advanced synchronization techniques for task-based runtime systems. (odnośnik otworzy się w nowym oknie)

Autorzy: D. Álvarez, K. Sala, M. Maroñas, A. Roca, V. Beltran
Opublikowane w: Proceedings of PPoPP 2021, Numer 2, 2021
Wydawca: ACM
DOI: 10.1145/3437801.3441601

FMI: Fast and Cheap Message Passing for Serverless Functions (odnośnik otworzy się w nowym oknie)

Autorzy: Copik, Marcin; Böhringer, Roman; Calotoiu, Alexandru; Hoefler, Torsten
Opublikowane w: Proceedings of the 37th International Conference on Supercomputing, Numer 18, 2023
Wydawca: ACM
DOI: 10.1145/3577193.3593718

Extra-Deep: Automated Empirical Performance Modeling for Distributed Deep Learning (odnośnik otworzy się w nowym oknie)

Autorzy: M. Ritter, F. Wolf
Opublikowane w: Workshop on Programming and Performance Visualization Tools (ProTools 23), 2023
Wydawca: ACM
DOI: 10.1145/3624062.3624204

Deinsum: Practically I/O Optimal Multilinear Algebra (odnośnik otworzy się w nowym oknie)

Autorzy: A. Nikolaos Ziogas, G. Kwasniewski, T. Ben-Nun, T. Schneider, T. Hoefler
Opublikowane w: 2022
Wydawca: SC'22
DOI: 10.48550/arxiv.2206.08301

a benchmarking suite for high-performance NumPy (odnośnik otworzy się w nowym oknie)

Autorzy: Alexandros Nikolaos Ziogas; Tal Ben-Nun; Timo Schneider; Torsten Hoefler
Opublikowane w: Proceedings of the ISC 2021, 2021
Wydawca: Association for Computing Machinery
DOI: 10.1145/3447818.3460360

Influence of Network Performance Variability on Application Scalability (odnośnik otworzy się w nowym oknie)

Autorzy: Daniele De Sensi; Tiziano De Matteis; Konstantin Taranov; Salvatore Di Girolamo; Tobias Rahn; Torsten Hoefler
Opublikowane w: Proceedings of the ACM on Measurement and Analysis of Computing Systems, 6 (3), Numer 2, 2022
Wydawca: ACM
DOI: 10.1145/3570609

Transparent load balancing of MPI programs using OmpSs-2@cluster and DLB (odnośnik otworzy się w nowym oknie)

Autorzy: J. Aguilar Mena, O. Shaaban, V. Beltran, P. Carpenter, E. Ayguade, and J. Labarta
Opublikowane w: Proceedings of ICPP, 2022
Wydawca: ACM
DOI: 10.1145/3545008.3545045

A framework for hierarchical single-copy MPI collectives on multicore nodes

Autorzy: G. Katevenis-Bitzos, M. Ploumidis, and M. Marazakis
Opublikowane w: IEEE Cluster 2022, Numer Presented at conference, 2022
Wydawca: IEEE

Performance Embeddings: A Similarity-Based Transfer Tuning Approach to Performance Optimization (odnośnik otworzy się w nowym oknie)

Autorzy: L Trümper, T Ben-Nun, P Schaad, A Calotoiu, T Hoefler
Opublikowane w: 2023
Wydawca: ACM
DOI: 10.1145/3577193.3593714

Sustainability in HPC: Vision and Opportunities (odnośnik otworzy się w nowym oknie)

Autorzy: Mohak Chadha; Eishi Arima; Amir Raoofy; Michael Gerndt; Martin Schulz
Opublikowane w: SC-W '23: Proceedings of the SC '23 Workshops of The International Conference on High Performance Computing, Network, Storage, and Analysis, 2023
Wydawca: ACM
DOI: 10.1145/3624062.3624271

User-guided Page Merging for Memory Deduplication in Serverless Systems (odnośnik otworzy się w nowym oknie)

Autorzy: Qiu, Wei; Copik, Marcin; Wang, Yun; Calotoiu, Alexandru; Hoefler, Torsten
Opublikowane w: 2023 IEEE International Conference on Big Data (Big Data), Numer 18, 2023
Wydawca: IEEE
DOI: 10.1109/bigdata59044.2023.10386487

Methodology for malleable applications on distributed memory systems (odnośnik otworzy się w nowym oknie)

Autorzy: J. Aguilar Mena
Opublikowane w: 2022
Wydawca: Universitat Politècnica de Catalunya
DOI: 10.5821/dissertation-2117-380814

Critical Analysis of the Modular Supercomputing Architecture

Autorzy: E. Suarez, N. Eicker, Th.Moschny, Th. Lippert
Opublikowane w: Porting applications to a Modular Supercomputer - Experiences from the DEEP-EST project, 2021
Wydawca: FZJ Zentralbibliothek Verlag

An OpenMP free agent threads implementation (odnośnik otworzy się w nowym oknie)

Autorzy: Lopez, Victor; Criado, Joel; Peñacoba, Raúl; Ferrer, Roger; Teruel, Xavier; Garcia-Gasulla, Marta
Opublikowane w: Lecture Notes in Computer Science - OpenMP: Enabling Massive Node-Level Parallelism, Numer 6, 2021
Wydawca: Springer
DOI: 10.1007/978-3-030-85262-7_15

Best practices guide

Autorzy: A. Kreuzer, J. Kreutz, B. Steinbusch
Opublikowane w: Porting applications to a Modular Supercomputer - Experiences from the DEEP-EST project, 2021
Wydawca: FZJ Zentralbibliothek Verlag

Space weather with DLMOS, xPic and GMM

Autorzy: J.Amaya
Opublikowane w: Porting applications to a Modular Supercomputer - Experiences from the DEEP-EST project, 2021
Wydawca: FZJ Zentralbibliothek Verlag

The DEEP-EST project

Autorzy: E. Suarez, A.Kreuzer, N. Eicker, Th. Lippert
Opublikowane w: Porting applications to a Modular Supercomputer - Experiences from the DEEP-EST project, 2021
Wydawca: FZJ Zentralbibliothek Verlag

Simulating Structural Plasticity of the Brain more Scalable than Expected (odnośnik otworzy się w nowym oknie)

Autorzy: F. Czappa, A. Geiß, F. Wolf
Opublikowane w: Journal of Parallel and Distributed Computing, Numer Volume 171, January 2023, Available online 15 September 2022, 2022, ISSN 0743-7315
Wydawca: Academic Press
DOI: 10.1016/j.jpdc.2022.09.001

Meshing strategies for 3d geo-electromagnetic modeling in the presence of metallic infrastructure (odnośnik otworzy się w nowym oknie)

Autorzy: O. Castillo-Reyes, P. Rulff, E. Schankee Um, A. Amor-Martin
Opublikowane w: Computational geosciences, 2023, ISSN 1573-1499
Wydawca: Springer
DOI: 10.1007/s10596-023-10247-w

O(n) Key–Value Sort With Active Compute Memory (odnośnik otworzy się w nowym oknie)

Autorzy: P. Esmaili-Dokht, M. Guiot, P. Radojkovic, X. Martorell, E. Ayguade, J. Labarta, J. Adlard, P. Amato, M. Sforzin
Opublikowane w: IEEE Transactions on Computers, 2024, ISSN 1557-9956
Wydawca: IEEE
DOI: 10.1109/tc.2024.3371773

Exactly energy-conserving electromagnetic Particle-in-Cell method in curvilinear coordinates (odnośnik otworzy się w nowym oknie)

Autorzy: Croonen, Joost; Pezzini, Luca; Bacchini, Fabio; Lapenta, Giovanni
Opublikowane w: The Astrophysical Journal Supplement, 2024, ISSN 0067-0049
Wydawca: University of Chicago Press
DOI: 10.48550/arxiv.2310.17253

Advances in the Implementation of the Exactly Energy Conserving Semi-Implicit (ECsim) Particle-in-Cell Method (odnośnik otworzy się w nowym oknie)

Autorzy: Giovanni Lapenta
Opublikowane w: Physics; Volume 5; Numer 1; Pages: 72-89, 2023, ISSN 2624-8174
Wydawca: MDPI
DOI: 10.3390/physics5010007

Electromagnetic imaging and deep learning for transition to renewable energies: a technology review (odnośnik otworzy się w nowym oknie)

Autorzy: O. Castillo-Reyes, X. Hu, B. Wang, Y. Wang, Z. Guo
Opublikowane w: Frontiers in Earth Science, 2023, ISSN 2296-6463
Wydawca: Frontiers
DOI: 10.3389/feart.2023.1159910

Towards Integration of a Dedicated Memory Controller and Its Instruction Set to Improve Performance of Systems Containing Computational SRAM (odnośnik otworzy się w nowym oknie)

Autorzy: Kévin Mambu; Henri-Pierre Charles; Maha Kooli; Julie Dumas
Opublikowane w: Journal of Low Power Electronics and Applications, Vol 12, Iss 1, p 18 (2022), 2022, ISSN 2079-9268
Wydawca: Multidisciplinary Digital Publishing Institute (MDPI)
DOI: 10.3390/jlpea12010018

Mitigating the NUMA Effect on Task-Based Runtime Systems (odnośnik otworzy się w nowym oknie)

Autorzy: M. Maroñas, A. Navarro, E. Ayguadé and V. Beltran
Opublikowane w: The Journal of Supercomputing, Numer 4, 2023, ISSN 0920-8542
Wydawca: Kluwer Academic Publishers
DOI: 10.1007/s11227-023-05164-9

Generation of sub-ion scale magnetic holes from electron shear flow instabilities in plasma turbulence (odnośnik otworzy się w nowym oknie)

Autorzy: Arrò, Giuseppe; Pucci, Francesco; Califano, Francesco; Innocenti, Maria Elena; Lapenta, Giovanni
Opublikowane w: Astrophysical Journal, 2023, ISSN 0004-637X
Wydawca: University of Chicago Press
DOI: 10.3847/1538-4357/acf12e

Operational Data Analytics in practice: Experiences from design to deployment in production HPC environments (odnośnik otworzy się w nowym oknie)

Autorzy: Alessio Netti, Michael Ott, Carla Guillen, Daniele Tafani, Martin Schulz
Opublikowane w: Parallel Computing (ParCo), Numer 01678191, 2022, ISSN 0167-8191
Wydawca: Elsevier BV
DOI: 10.1016/j.parco.2022.102950

Towards leveraging collective performance with the support of MPI 4.0 features in MPC (odnośnik otworzy się w nowym oknie)

Autorzy: S. Bouhrour, T. Pepin, J. Jaeger
Opublikowane w: Journal on Parallel Computing (ParCo), Numer Volume 109, March 2022, 102860, 2022, ISSN 0167-8191
Wydawca: Elsevier BV
DOI: 10.1016/j.parco.2021.102860

Anisotropic Electron Heating in Turbulence-driven Magnetic Reconnection in the Near-Sun Solar Wind (odnośnik otworzy się w nowym oknie)

Autorzy: Luca Franci; Emanuele Papini; Alfredo Micera; Giovanni Lapenta; Petr Hellinger; Daniele Del Sarto; David Burgess; Simone Landi
Opublikowane w: The Astrophysical Journal, 2022, ISSN 1538-4357
Wydawca: IOP Publishing Ltd
DOI: 10.3847/1538-4357/ac7da6

Optimizing Iterative Data-flow Scientific Applications using Directed Cyclic Graphs (odnośnik otworzy się w nowym oknie)

Autorzy: D. Álvarez and V. Beltran
Opublikowane w: IEEE Access, 2023, ISSN 2169-3536
Wydawca: Institute of Electrical and Electronics Engineers Inc.
DOI: 10.1109/access.2023.3269902

Porting applications to a Modular Supercomputer - Experiences from the DEEP-EST project

Autorzy: A. Kreuzer, E. Suarez, N. Eicker, Th. Lippert
Opublikowane w: Porting applications to a Modular Supercomputer - Experiences from the DEEP-EST project, 2021
Wydawca: FZJ Zentralbibliothek Verlag

Wyszukiwanie danych OpenAIRE...

Podczas wyszukiwania danych OpenAIRE wystąpił błąd

Brak wyników

Moja broszura 0 0