Entrepôts de données - Barrières et Facilitateurs (2)
Introduction
Malgré les nombreuses barrières rencontrées lors du développement et de la mise en œuvre d’un entrepôt de données de santé (EDS), plusieurs leviers peuvent être activés pour favoriser la réussite de ces projets. Ces facilitateurs, issus de l’expérience de terrain, concernent aussi bien la gouvernance, les compétences, la communication, que les choix technologiques.
Ce document présente un ensemble de recommandations pratiques élaborées à partir d’un atelier collaboratif réunissant des experts en entrepôts de données. Elles visent à guider les équipes dans la structuration de projets robustes, durables et utiles. Facilitateurs clés
1. Démarrer petit et progresser par itération
- Commencer avec un périmètre réduit (quelques sources bien documentées)
- S’appuyer sur des cas d’usage simples pour démontrer la valeur ajoutée
- Éviter les approches ambitieuses sans moyens humains ou techniques adaptés
2. Structurer la gouvernance
- Mettre en place un comité stratégique décisionnel et un comité scientifique
- Favoriser la transparence, la communication et l’alignement des objectifs
3. Former, informer, impliquer
- Organiser des sessions de sensibilisation à la science des données en santé
- Valoriser les retours utilisateurs (rapports d’activité, tableaux de bord)
- Produire des carnets de variables et des fiches de description
4. Construire une équipe pluridisciplinaire
- Associer dès le départ cliniciens, data scientists, juristes, ingénieurs
- Recruter via des structures externes pour contourner les limites hospitalières
- Favoriser les projets étudiants (internats, stages, thèses)
5. Développer une infrastructure dédiée à la recherche
- Créer un environnement de développement séparé du SIH
- Utiliser des jeux de données synthétiques pour les tests
- Choisir des outils avec une communauté active et une forte flexibilité
6. Cadrer les besoins avec les professionnels de santé
- Recueillir des cas d’usage et des priorités métier
- Définir les sources, variables, et transformations utiles
7. Anticiper les contraintes réglementaires
- Associer les juristes dès la phase de conception
- Clarifier les finalités d’usage des données
8. Favoriser la reproductibilité et l’interopérabilité
- Documenter les extractions et les traitements
- Mettre en place des cadres ETL communs et des définitions de variables partagées
9. Coopérer avec les éditeurs et les partenaires externes
- Demander l’ouverture du schéma de base
- Définir une valeur ajoutée partagée (open innovation, contrats intelligents)
10. Créer un socle d’interopérabilité technique
- Mettre en place un cadre ETL commun facilitant la réplication multi-sites
11. Développer des partenariats avec des entreprises spécialisées
- Collaborer avec des sociétés expertes en ETL, Big Data ou gestion des flux
12. Instaurer un comité scientifique
- Évaluer la faisabilité et la pertinence des demandes d’études
- Prioriser les projets selon les capacités de l’EDS
13. Promouvoir la recherche reproductible
- S’appuyer sur les checklists STROBE et RECORD
- Standardiser les définitions de variables, validées par les professionnels de santé
14. Mettre en place un pilotage qualité automatisé
- Générer des rapports de qualité des données à chaque étape (source, ETL, CDW)
- Faire valider ces rapports par les professionnels métiers
Remerciements : Matthieu Doutreligne, Emmanuel Chazard, Romaric Marcilly, Sonia Priou et les participants au workshop MIE2023.