Le Machine Learning, nouvel accompagnant dans le suivi de patients souffrant de pathologies chroniques
21 déc. 2017 - 17:28,
Tribune
- Orange HealthcarePour cette initiative, Orange s’est associé à Sanoïa, une CRO (Clinical Research Organization) digitale en lien avec l’hôpital parisien de la Pitié-Salpêtrière.
Le Machine Learning est une branche de l’intelligence artificielle. C’est un domaine de l’informatique qui vise à développer des algorithmes permettant de modéliser les données. Les statistiques classiques sont quant à elle un domaine de l’analyse en mathématiques. Elles permettent de rejeter une hypothèse, au profit d’une hypothèse alternative. Appliqué au domaine de la santé, et plus précisément le suivi de maladies chroniques, le Machine Learning peut offrir de nouvelles possibilités aux patients pour le suivi de l’évolution de la maladie.
La Polyarthrite Rhumatoïde et la Spondylarthrite : des pathologies chroniques répondues et souvent sous-estimées
La polyarthrite rhumatoïde est la plus fréquente des diverses formes de rhumatismesinflammatoires chroniquesavec 300 000 cas estimés en France, et des milliers de nouveaux cas par an. Les premiers symptômes survenant en général entre 40 ans et 60 ans. Cette maladie touche le plus souvent les mains, les poignets, les genoux et les petites articulations des pieds. Elle évolue par poussées, entrecoupées de périodes où les symptômes s’atténuent. Lorsqu’elle n’est pas traitée correctement, la polyarthrite peut devenir très invalidante dans 20 % des cas.
La spondylarthrite est également une maladie rhumatismale qui atteint surtout la colonne vertébrale et le bas du dos. Une pathologie sous-estimée du fait de la difficulté du diagnostic. Elle commence chez les personnes jeunes, généralement des hommes de 15 ans à 40 ans et est aussi répandue que la polyarthite rhumatoïde.
Sanoïa, une organisation de recherche clinique (CRO) digitale et l’AP-HP (Hôpitaux de Paris) ont lancé fin 2016 une étude pour rechercher s’il y avait un lien entre l’activité physique de patients atteints de rhumatismes inflammatoires et l’évolution de la maladie, en particulier en surveillant la survenue de poussées.
Des patients équipés d’objets connectés pour le suivi de leur pathologie
Le service de Rhumatologie de l’hôpital de la Pitié-Salpétrière a mis en place pendant 3 mois une cohorte de 170 patients afin d’étudier la corrélation entre la mobilité des patients et la survenue des poussées. Tous les patients de la cohorte ont été équipés d’une montre connectée permettant de comptabiliser les nombres de pas réalisés. Parallèlement, les patients renseignaient chaque semaine, sur une application web (fiche santé de sanoia.com) l’appréciation de leur état de santé : pas de poussée, poussée de moins de 3 jours, poussée de plus de 3 jours.
Traditionnellement les CRO gèrent des études de recherche biomédicale et en particulier des essais cliniques pour le compte d’un laboratoire pharmaceutique ou d’un hôpital. La spécificité de Sanoïa, en tant que CRO digitale, est d’administrer des données provenant d’objets connectés ou de déclarations de patients sur le site web sanoia.com. Ainsi Sanoïa a équipé les 170 patients de la cohorte d’une montre connectée et a assuré la collecte, l’anonymisation et l’hébergement des données.
Une première analyse des données issues de cette cohorte a été réalisée par une équipe de biostatisticiens de l’AP-HP, à partir d’outils statistiques classiques. Elle a permis d’identifier une baisse d’activité de 12 à 20% pendant les poussées. Mais Sanoïa souhaitait aller plus loin avec des outils big data.
L’analyse par Machine Learning a permis d’obtenir des résultats prometteurs
Sur une proposition d’Orange Healthcare à Sanoïa et à l’APHP, une seconde analyse a été réalisée par des data scientists d’IMT avec l’outil de Machine Learning Khiops©, dans le cadre d’un contrat d’expérimentation entre Orange et Sanoïa. Et c’est là que les résultats ont dépassé les attentes des médecins et de Sanoïa. En effet, l’analyse menée par Orange a permis de détecter la survenue de poussées avec une précision de 96%, uniquement à partir de l’observation du nombre de pas réalisés par le patient.
Pour le Professeur Laure Gossec , cela ouvre de nouvelles perspectives pour le suivi des malades souffrant de cette pathologie, même s’il est trop tôt pour en déduire l’impact clinique.
Une expérimentation pour tester le potentiel du Machine Learning : une première réussite
Suite à la réussite de l’expérimentation, les résultats de l’étude ont été présentés par Hervé Servy (Sanoîa) lors du congrès mondial de rhumatologie qui s’est déroulé à San Diego début novembre 2017 et lors du congrès de la Société Français de Rhumatologie à la Porte de Versailles à Paris, du 10 au 12 décembre 2017, sous la forme d’un poster commenté. L’étude y est également présentée par le Professeur Laure Gossec du service de Rhumatologie de la Pitié-Salpêtrière sous forme de communication orale.
L’importance de la préparation des données pour l’analyse Machine Learning
Une part non négligeable du projet a consisté à réaliser toutes les opérations de data preparation.
Avant d’alimenter l’outil Khiops© de Machine Learning, il a fallu normaliser les données pour faire coïncider les données remontées automatiquement par la montre toutes les minutes avec celles remontées par les patients sur une base hebdomadaire.
C’est en agrégeant sur 1 heure les pas effectués par un patient que les résultats de la classification sont apparus les meilleurs. La classification consistant à pouvoir détecter, pour une semaine donnée et à partir du seul nombre de pas d’un patient, qu’une poussée a eu lieu. Le résultat obtenu par les data scientists est un algorithme qui en entrée est alimenté par les pas compatbilisés par la montre connectée pour un patient sur une semaine donnée, et en sortie fournit l’information : poussée ou pas poussée. Les données de 70% des patients sont utilisées pour établir l’algorithme de modélisation, les données des 30% des patients restants à tester et valider la pertinence du modèle. Il s’ensuit un travail d’ajustement des paramètres du modèle afin d’obtenir l’algorithme le plus performant. Ce travail est réalisé avec 10 échantillons différents, en choisissant aléatoirement un groupe de patients représentant 70% de la cohorte pour l’apprentissage et 30 % pour la validation.
Pour assurer la robustesse de notre modèle, un certain nombre d’indicateurs de performance ont été calculés : matrices de confusion, « accuracy », « No Information Rate », « p-valeur » et Kappa de Cohen. Cela a permis de valider l’algorithme développé et a ouvert la voie à une publication scientifique.
Quelles perspectives pour Orange ?
Avec le Technocentre, l’entité d’Orange dédiée à l’innovation, nous sommes à la recherche de projets qui vont nous permettre d’imaginer les produits et services de demain. Fruit de la fertilisation croisée entre Orange et ses partenaires, nous pensons que les travaux réalisés avec Sanoïa peuvent être utilisés pour la création de valeur chez nos clients.
Par exemple, les premières discussions avec nos partenaires nous ouvrent les pistes suivantes :
- répliquer notre première étude pour le suivi d’autres maladies inflammatoires chroniques en utilisant des données de santé en vie réelle,
- créer des services à destination des CRO, pour participer à la transformation numérique des laboratoires, dont un des objectifs est la réduction des durées des essais cliniques,
- créer des offres et des services à destination des hôpitaux à partir de prestation de data analytics.
Cette étude est une référence supplémentaire illustrant les prestations de data analytics qu’Orange Healthcare est en mesure de réaliser pour ses clients.
Cet article a été co-rédigé par
Thomas Lafargue, Chef de Produit Data au Technocentre d’Orange et Michel Seiler, Manager Innovation, Orange Healthcare