Une plateforme de partage de données pour les maladies rares est un système sécurisé qui harmonise, centralise ou fédère des données génomiques et cliniques afin de faciliter la recherche et le diagnostic. Ces systèmes, désignés en anglais sous le terme rare disease data sharing platform, répondent à un défi structurel : plus de 446 millions de personnes sont touchées par une maladie rare dans le monde, mais les cohortes restent dispersées et les données fragmentées. Des acteurs comme ERDERA, WiNGS-API et Orphanet ont construit les premières architectures capables de relier ces données à l'échelle européenne. Comprendre leur fonctionnement est aujourd'hui indispensable pour tout chercheur ou professionnel de santé travaillant sur ces pathologies.
Quels sont les modèles technologiques d'une plateforme partage données rare disease ?
Deux grandes architectures structurent le marché actuel : la centralisation et la fédération. Chacune répond à des contraintes différentes en matière de gouvernance, de conformité et de volume de données.
Architecture centralisée : le modèle ERDERA
ERDERA représente l'exemple le plus avancé d'architecture centralisée en Europe. La plateforme a rassemblé 10 000 jeux de données génomiques et phénotypiques harmonisés en 2026, issus de cas non résolus. Ces données sont hébergées via l'European Genome-phenome Archive (EGA) dans un environnement de recherche diagnostique à accès contrôlé. Ce modèle offre une puissance analytique élevée, car toutes les données sont comparables et interrogeables depuis un point unique.

La contrepartie est réelle : la centralisation exige une gouvernance stricte et une infrastructure sécurisée de haut niveau. L'accès aux données ERDERA nécessite une validation préalable d'une proposition scientifique. Ce filtre garantit que seules des recherches de haute qualité exploitent ces données sensibles.
Architecture fédérée : le modèle WiNGS-API
WiNGS-API adopte une logique opposée. Cette plateforme est déployée dans 7 centres, gère des milliers d'échantillons et respecte les principes FAIR. Les données brutes ne quittent jamais l'institution déposante. Les analyses s'exécutent localement, et seuls les résultats agrégés circulent entre les nœuds.
Ce modèle résout un problème central des maladies rares : les effectifs par pathologie sont faibles, mais les patients sont dispersés dans de nombreux centres. Les architectures fédérées permettent d'agréger de larges cohortes sans déplacer la donnée brute, ce qui est déterminant pour respecter le GDPR et les réglementations HIPAA. La limite est la complexité technique de déploiement et la nécessité d'une synchronisation rigoureuse entre les nœuds.
- Architecture centralisée : puissance analytique maximale, gouvernance centralisée, accès contrôlé par validation de projet.
- Architecture fédérée : données sous contrôle local, conformité GDPR native, idéale pour les cohortes dispersées.
- Accès contrôlé : dans les deux cas, l'approbation d'un projet scientifique conditionne l'accès aux données sensibles.
- Conformité réglementaire : les plateformes fédérées maintiennent les données sous contrôle des institutions et réalisent les analyses localement pour respecter GDPR et HIPAA.
Conseil de pro: Avant de soumettre une demande d'accès à ERDERA ou WiNGS-API, préparez une proposition scientifique détaillant la question de recherche, les variables nécessaires et le cadre éthique. Une proposition incomplète allonge significativement les délais d'approbation.
Comment les plateformes harmonisent-elles les données maladies rares ?
L'harmonisation des données est une étape indispensable pour rendre les bases comparables et exploitables, au-delà de leur simple accumulation. Sans elle, deux centres utilisant des terminologies différentes pour une même pathologie produisent des données incompatibles, même si elles décrivent les mêmes patients.

Le rôle des ontologies et des modèles communs
Les ontologies médicales structurent le vocabulaire partagé entre institutions. Orphanet recense plus de 6 500 maladies rares avec une classification claire des groupes, pathologies et sous-types. Cette classification est essentielle pour que les plateformes informent efficacement les processus de diagnostic et de recherche. HPO (Human Phenotype Ontology) et OMIM complètent ce dispositif en standardisant la description phénotypique et génétique.
Le pipeline de standardisation d'ERDERA
ERDERA applique un processus en plusieurs étapes avant tout dépôt de données :
- Collecte et audit initial : vérification de la complétude et de la qualité des données brutes soumises par les centres participants.
- Mapping vers les modèles communs : ERDERA utilise un pipeline de mapping vers des ontologies et modèles de données communs avant upload vers EGA.
- Contrôle qualité et auditabilité : chaque jeu de données reçoit une traçabilité complète permettant de retracer l'origine et les transformations appliquées.
- Dépôt sécurisé avec accès contrôlé : le chaînage harmonisation, plateforme diagnostique et dépôt sécurisé est le modèle pour assurer la qualité et l'auditabilité du partage de données sensibles.
Les principes FAIR comme cadre de référence
Le cadre FAIR (Findable, Accessible, Interoperable, Reusable) est aujourd'hui la norme de référence pour la gestion des données en maladies rares. Il structure, harmonise et rend les données réutilisables dans un écosystème collaboratif sécurisé.
WiNGS-API intègre les principes FAIR dans son architecture dès la conception. Chaque variant analysé, qu'il s'agisse de SNV, CNV ou SV, produit une sortie standardisée. Cette standardisation permet aux cliniciens de passer plus vite au diagnostic en réduisant le bruit dans les données brutes.
Quel est l'impact concret des plateformes sur le diagnostic des maladies rares ?
Les plateformes de partage de données génèrent des résultats mesurables sur la qualité du diagnostic et la découverte de variants génétiques. L'agrégation de données à l'échelle européenne change fondamentalement ce qui est possible pour une pathologie touchant quelques centaines de patients dans le monde.
Réduction des faux positifs et classification des variants
WiNGS-API produit des résultats directs sur la qualité diagnostique. Le système réduit les faux positifs, identifie des porteurs supplémentaires et facilite la compréhension des variants d'intérêt clinique. La gestion des VUS (Variants of Signification Inconnue) est particulièrement améliorée : en croisant les données de plusieurs centres, la plateforme accumule suffisamment d'observations pour reclassifier un variant de statut incertain vers pathogène ou bénin.
| Apport de la plateforme | Mécanisme | Résultat clinique |
|---|---|---|
| Agrégation de cohortes | Fédération de données multi-centres | Reclassification des VUS |
| Filtrage automatisé | Réduction du bruit analytique | Moins de faux positifs |
| Standardisation des sorties | Ontologies communes (HPO, Orphanet) | Comparabilité inter-centres |
| Accès contrôlé | Validation scientifique préalable | Qualité des recherches garantie |
Découverte de gènes et avancées en recherche
La puissance des bases de données agrégées réside dans la détection de signaux rares. Un variant observé deux fois dans un seul centre reste ambigu. Le même variant observé quinze fois dans sept centres différents devient un signal exploitable. ERDERA et WiNGS-API ont tous deux été conçus pour maximiser cette capacité de détection à faible effectif.
Conseil de pro: Pour les chercheurs travaillant sur des VUS, soumettez systématiquement vos données à ClinVar en parallèle de votre dépôt sur les plateformes fédérées. La triangulation entre plusieurs bases augmente la probabilité de reclassification rapide.
Quel est le rôle des plateformes d'expertise nationales en France ?
Les plateformes nationales complètent les dispositifs européens en assurant la coordination locale et la continuité des soins. En France, ce dispositif repose sur deux structures principales.
Les PEMR et PCOM : maillage territorial
Les Plateformes d'Expertise Maladies Rares (PEMR) et les Plateformes de Coordination (PCOM) organisent le réseau de soins à l'échelle régionale. Leurs missions principales sont les suivantes :
- Coordination des parcours patients : orientation vers les centres de référence et de compétence adaptés à chaque pathologie.
- Mutualisation des connaissances : partage des protocoles diagnostiques et thérapeutiques entre professionnels du réseau.
- Contribution à la BNDMR : les plateformes d'expertise coordonnent le réseau local et contribuent à la Banque Nationale de Données Maladies Rares, renforçant la couverture territoriale des soins et de la recherche.
- Lien avec la recherche européenne : les données collectées via la BNDMR alimentent les registres européens et les plateformes comme ERDERA.
La BNDMR comme colonne vertébrale nationale
La Banque Nationale de Données Maladies Rares centralise les données cliniques françaises selon un modèle structuré et interopérable. Elle constitue le point d'entrée national vers les infrastructures européennes. Les plateformes d'expertise jouent un rôle clé pour intégrer les données dans les parcours de soins et assurer une couverture efficace du territoire. Pour les chercheurs souhaitant accéder à des cohortes françaises, la BNDMR est le premier interlocuteur à contacter, avant toute démarche vers ERDERA ou WiNGS-API.
Ce que j'ai appris sur la gouvernance des données en maladies rares
La gouvernance est le vrai goulot d'étranglement de ces plateformes, pas la technologie. J'observe depuis plusieurs années que les projets échouent rarement sur des questions techniques. Ils échouent sur des désaccords entre institutions concernant la propriété des données, les droits de publication et les modalités d'accès.
ERDERA et WiNGS-API ont résolu ce problème différemment. ERDERA impose une validation centralisée qui rassure les institutions sur l'usage de leurs données. WiNGS-API laisse les données chez leurs propriétaires, ce qui réduit les résistances institutionnelles. Les deux approches fonctionnent, mais elles ne conviennent pas aux mêmes contextes.
Ce que je conseille aux chercheurs qui souhaitent contribuer à ces systèmes : commencez par cartographier vos obligations éthiques locales avant de choisir une plateforme. Un centre hospitalier français a des contraintes différentes d'un laboratoire académique allemand. La conformité GDPR n'est pas uniforme dans son application pratique, même si le texte est identique. Consultez le guide sur le réseau patient maladies rares pour comprendre comment ces structures de coordination s'articulent avec les plateformes de données.
Le défi suivant est le volume. Les données génomiques de séquençage complet (WGS) génèrent des fichiers de plusieurs gigaoctets par patient. Multiplié par des milliers de cas, le stockage et le transfert deviennent des contraintes physiques réelles. Les architectures fédérées comme WiNGS-API apportent une réponse partielle, mais la question de la puissance de calcul locale dans chaque nœud reste entière pour de nombreux centres.
— John
Hopeatrarelabs et la modélisation pour les maladies ultra-rares

Hopeatrarelabs travaille à l'intersection de la modélisation cellulaire et de la recherche thérapeutique pour les maladies ultra-rares et non diagnostiquées. Les équipes utilisent des cellules souches pluripotentes induites (iPSC) et l'édition génomique par CRISPR pour créer des modèles spécifiques à chaque patient, puis testent en parallèle des milliers de médicaments approuvés par la FDA, des oligonucléotides antisens (ASO) personnalisés et des options de thérapie génique.
Pour les chercheurs et professionnels de santé qui souhaitent approfondir les ressources disponibles sur les maladies rares, la base de ressources RareLabs centralise les programmes dédiés et les approches de médecine de précision. Les équipes d'Hopeatrarelabs sont également disponibles pour des partenariats de recherche ou des collaborations biopharma sur des pathologies sans traitement approuvé.
Questions fréquentes
Qu'est-ce qu'une plateforme de partage de données pour les maladies rares ?
Une plateforme de partage de données pour les maladies rares est un système sécurisé qui harmonise et centralise ou fédère des données génomiques et cliniques pour faciliter la recherche et le diagnostic. Des exemples concrets incluent ERDERA, WiNGS-API et la Banque Nationale de Données Maladies Rares (BNDMR).
Quelle est la différence entre architecture centralisée et fédérée ?
Dans une architecture centralisée, les données sont regroupées dans un dépôt unique comme EGA. Dans une architecture fédérée comme WiNGS-API, les données restent dans chaque institution et seuls les résultats d'analyse circulent entre les nœuds, ce qui garantit la conformité GDPR.
Comment accéder aux données d'ERDERA ?
L'accès aux données ERDERA nécessite la soumission et la validation préalable d'une proposition scientifique. Ce processus garantit que seules des recherches de haute qualité exploitent les 10 000 jeux de données harmonisés disponibles sur la plateforme.
Qu'est-ce que le cadre FAIR appliqué aux maladies rares ?
Le cadre FAIR (Findable, Accessible, Interoperable, Reusable) définit les critères de qualité pour les données de santé. Appliqué aux maladies rares, il garantit que les données sont structurées, accessibles selon des règles claires et réutilisables par différents acteurs de la recherche.
Quel est le rôle de la BNDMR dans le système français ?
La Banque Nationale de Données Maladies Rares centralise les données cliniques françaises et constitue le point d'entrée national vers les infrastructures européennes comme ERDERA. Les plateformes d'expertise régionales (PEMR, PCOM) alimentent la BNDMR et coordonnent les parcours patients sur le territoire.
Points clés
Les plateformes de partage de données pour les maladies rares combinent harmonisation, gouvernance stricte et architecture adaptée pour transformer des données dispersées en ressources diagnostiques exploitables à l'échelle européenne.
| Point | Détails |
|---|---|
| Deux architectures principales | ERDERA centralise, WiNGS-API fédère : choisissez selon vos contraintes de conformité et de gouvernance. |
| Harmonisation avant tout | Le mapping vers des ontologies communes (HPO, Orphanet) conditionne la comparabilité des données entre centres. |
| Impact diagnostique concret | WiNGS-API réduit les faux positifs et améliore la reclassification des variants de signification inconnue. |
| Dispositif national français | La BNDMR et les PEMR assurent la collecte locale et l'alimentation des registres européens. |
| Accès conditionné | Toute demande d'accès aux données sensibles requiert une proposition scientifique validée par un comité. |
