Notre clinique des données intéresse beaucoup les autres hôpitaux français

Pierre-Antoine Gourraud, professeur au CHU de Nantes, est à l'initiative de l'entrepôt des données de santé, lancé à Nantes, et depuis étendu aux hôpitaux du Grand Ouest. Un temps passé par la Californie, cet enseignant-chercheur nous explique comment le numérique peut donner un coup d'accélérateur à la recherche en santé, une révolution portée par le jeu collectif à la nantaise.

En juin 2019, le CHU de Nantes s’est doté d’une "clinique des données" pour collecter les données santé des patients et fournir de la matière aux chercheurs pour améliorer les traitements. Depuis décembre 2020, elle a été étendu à l’échelle du Grand Ouest pour former le « Ouest Datahub ». Ce sont ainsi au total 130 millions de documents, les dossiers de 5 millions de patients, 6 millions de séjours qui y sont recueillis, organisés, structurés à des fins de recherche. Une véritable mine pour améliorer les traitements, comme l'explique le professeur Pierre-Antoine Gourraud.


En tant qu’initiateur, pouvez-vous nous expliquer à quoi sert cette "clinique des données de santé" ?

L’entrepôt de santé que j’ai lancé au CHU de Nantes à mon retour de San Francisco est le fruit des cinq dernières années de collaboration entre les CHU du grand ouest (Nantes, Angers, Rennes, Tours, Brest). Il est né de la prise de conscience d’une pénurie des données issues du soin. D’ordinaire, on recueille les données pour répondre à une problématique posée. Or, grâce au numérique, les données sont accessibles d’emblée. A l’échelle de la Loire-Atlantique, un patient sur deux passe par le CHU de Nantes. Ce qui représente un potentiel de 30 millions de documents. Si l’on devait les imprimer sur des feuilles A4 et les mettre bout à bout, cela serait plus long qu’un aller-retour sur le Pont de Saint-Nazaire (longueur 3356m) ! Ces données n’ont a priori pas été enregistrées pour faire de la recherche. Il a fallu les organiser pour qu’elles puissent avoir une seconde vie. Afin que les chercheurs puissent trouver les données dont ils ont besoin en quelques millisecondes.

Comment sont collectées les données des patients ? Comment s’assurer qu’elles resteront bien confidentielles ?

C’est une préoccupation majeure. La collecte se fait de manière électronique pendant la durée des soins. Le patient peut à tout moment s’y opposer et peut d’ailleurs revenir sur sa décision ultérieurement. Le droit de refus du patient à transmettre ses données de santé est tout à fait primordial. J’y pense à chaque fois qu’un étudiant prononce le serment d’Hippocrate. La confidentialité est absolument due au patient.

Pouvez-vous nous donner des exemples de recherche que vous menez grâce à cet entrepôt ?

Nous menons quelques 120 projets actuellement. Il peut s’agir d’identifier certains patients qui peuvent bénéficier d’un traitement dans le cadre d’une pathologie rare par exemple ou la combinaison de plusieurs pathologies. Les données peuvent aussi servir à évaluer les soins ou à de la recherche. Pour analyser si la variabilité de la glycémie est liée à l’insuffisance cardiaque dans le cas de patients diabétiques, par exemple, mais aussi l’identification de patients avec des pathologies digestives qui pourraient bénéficier d’un programme de recherche grâce à l’analyse du texte contenu dans les documents hospitaliers. Ou encore pour l’enrichissement des informations.

Comment collaborez-vous avec les autres hôpitaux français dans le cadre du plan national Health Data Hub ?

L’entrepôt de données du CHU de Nantes a été étendu à l’échelle du Grand Ouest pour former le « Ouest Datahub » en décembre 2020. On y trouve au total 130 millions de documents, les dossiers de 5 millions de patients, 6 millions de séjours, soit au total 1,2 milliard de données structurées. Ce qui en fait le 1er projet de ce type en région. Donc, oui, nous sommes regardés et recevons beaucoup d’appels et de marques d’intérêt de la part des autres hôpitaux français. Le Heath Data Hub a financé le projet HUGOshare dans le but d’identifier les médicaments incompatibles entre eux, et de déterminer finement les personnes les plus à risque (en dehors du seul critère de l’âge). Ils pourront aussi cibler les moments de ruptures de traitement (moment où le patient n’en prend plus, où ils n’ont plus de prescription) et les conséquences sur l’état de santé des patients.

"Il suffit de passer un coup de fil, de demander de l’aide et tout le monde répond présent. C’est le jeu collectif, et c’est vraiment remarquable comment cela fonctionne ici à Nantes et Saint-Nazaire !"

En quoi l'écosystème numérique nantais dynamique vous accompagne-t-il dans ces projets de recherche ? 

Nous recevons beaucoup de demandes de la part des entreprises du territoire qui ont besoin de ces données pour travailler. C’est d’ailleurs la force de ce territoire. Il suffit de passer un coup de fil, de demander de l’aide et tout le monde répond présent. C’est le jeu collectif, et c’est vraiment remarquable comment cela fonctionne ici à Nantes et Saint-Nazaire ! L’université de Nantes a la particularité d’être une université pluridisciplinaire et nous accueillons au CHU de Nantes plusieurs chercheurs et étudiants du LS2N (le laboratoire Nantais des Science du Numérique) qui développent des algorithmes spécifiquement pour les entrepôts de données issues du soin. Depuis 18 mois, nous testons le logiciel d’anonymisation de la société OCTOPIZE, qui produisent des données de haute valeur statistique sans risque de ré-identification des patients, nous avons accompagné leur démarche de certification de conformité auprès de la CNIL.

De quelle manière cette collecte des données est-elle utilisée dans la gestion de la crise Covid ? 

Pour apporter notre contribution à la gestion de la crise Covid, nous avons monté le projet « Argos », un outil statistique qui permet de mesurer la progression de l’épidémie dans le Grand Ouest : l’application présente un tableau de bord qui combine les courbes de fréquentation des urgences, du Samu, de SOS Médecins et des tests Covid des laboratoires de la ville. On prolonge ensuite ces données par des modèles mathématiques, puis on regarde comment les différents indicateurs évoluent ensemble, ce qui nous permet de faire des prédictions. C’est toute la force de l’intelligence artificielle. Ces courbes sont mises à disposition des directeurs d’hôpitaux et des autorités pour mieux piloter le déconfinement ou le reconfinement.

Le bigdata est fortement consommateur d’énergie. Comment faites-vous pour gérer ce problème ?

Dans certains cas, nous cherchons à minimiser les calculs requis. Parfois une petite idée nous fait économiser beaucoup de calculs. Dans certaines infrastructures de calcul, les calories sont même récupérées.