Notifying Memories for Dataflow Applications on Shared-Memory Parallel Computer - Ecole Nationale d'Ingénieurs de Brest Accéder directement au contenu
Thèse Année : 2022

Notifying Memories for Dataflow Applications on Shared-Memory Parallel Computer

Mémoires notifiantes pour applications flux-de-données sur machines parallèles à mémoire partagée

Alemeh Ghasemi
  • Fonction : Auteur
  • PersonId : 1089734

Résumé

Symmetric Shared-memory multiprocessor~(SMP) is the most widely used implementation of high- performance multi-core processors. It offers a uniform shared memory view that eases the development of parallel applications, but it requires cache-coherency management among the cores. Besides, dataflow Model of Computation helps the developers to specify complex applications with explicit parallelism to efficiently exploit the parallel resources of SMP. However, a dataflow application running on SMP requires high synchronization for data communication that stresses the cache memory and penalizes performance. Existing techniques for synchronization are not suited to dataflow as they are not aware of the model of computation. This thesis aims to deeply study dataflow applications' behavior on SMP and proposes novel techniques to speed them up. First, we evaluate dataflow application behavior based on several statistics. Second, we evaluate two memory techniques called Copy-on-Write and Non-Temporal Memory Transfer, to alleviate the memory footprint of dataflow applications on caches. Third, as our main contribution, we introduce an optimized hardware logic implemented near memory, Notifying Memory for SMP (NM4SMP) designed to speed up dataflow applications. Our solution improves synchronization of shared data by considering dataflow firing rules within the logic. A HW-SW co- design platform integrating NM4SMP is presented to support static and reconfigurable dataflow applications. Overall results show an average speed up of 1.23x and an average energy saving about 15%, assuming Intel SMP baseline system and real dataflow applications.
Les machines parallèles à mémoire partagée (SMP) constituent une solution pratique pour mettre en œuvre des architectures multiprocesseurs puisqu'elles proposent une vue unifiée de la mémoire aux programmeurs ce qui facilite le développement des applications, au prix d'un mécanisme coû- teux de cohérence de cache. Par ailleurs, les modèles de calcul flux-de-données offrent aux développeurs l'expressivité pour spécifier des applications complexes, en explicitant le parallélisme, permettant ainsi d'exploiter les ressources disponibles. Cependant, une implémentation d'une application flux-de-données sur SMP nécessite de nombreuses synchronisations qui impliquent la cohérence de cache et pénalisent les performances. Cette thèse s'intéresse à la compréhension des sources d’inefficacité dans l'exécution de ces applications et propose des techniques qui s'appuient sur la synchronisation exprimée dans le modèle pour en améliorer les performances. Tout d'abord, nous avons extrait les caractéristiques des applications selon plusieurs métriques, puis nous avons évalué deux techniques de gestion mémoire, Copy-on-Write et Non-Temporal Memory, pour soulager la pression sur la mémoire. Enfin, en contribution principale, nous proposons une unité matérielle spécialisée, proche de la mémoire, appelée NM4SMP (Notifying Memory for SMP) permettant d'accélérer les applications flux-de-données en y intégrant les règles de déclenchement des calculs. L'approche est validée sur des applications dites statiques et reconfigurables. Les résultats montrent une accélération de 1,23 et une économie d'énergie de 15% pour une plateforme basée sur des processeurs Intel et plusieurs applications réelles.
Fichier principal
Vignette du fichier
2022theseGhasemiA.pdf (3.31 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03704297 , version 1 (24-06-2022)
tel-03704297 , version 2 (17-01-2023)

Identifiants

  • HAL Id : tel-03704297 , version 2

Citer

Alemeh Ghasemi. Notifying Memories for Dataflow Applications on Shared-Memory Parallel Computer. Distributed, Parallel, and Cluster Computing [cs.DC]. Université de Bretagne Sud, 2022. English. ⟨NNT : 2022LORIS620⟩. ⟨tel-03704297v2⟩
167 Consultations
194 Téléchargements

Partager

Gmail Facebook X LinkedIn More