Le Machine Learning au service du suivi des maladies chroniques
Le Machine Learning est une branche de l’intelligence artificielle. Ce domaine de l’informatique vise à développer des algorithmes permettant de modéliser les données. Les statistiques classiques sont quant à elles un domaine de l’analyse en mathématiques. Elles permettent de rejeter une hypothèse, au profit d’une hypothèse alternative. Appliqué au domaine de la santé, et plus précisément au suivi de maladies chroniques, le Machine Learning peut offrir de nouvelles possibilités aux patients pour le suivi de l’évolution de la maladie.
La Polyarthrite Rhumatoïde et la Spondylarthrite : des pathologies chroniques répandues et souvent sous-estimées
La polyarthrite rhumatoïde est la plus fréquente des diverses formes de rhumatismes inflammatoires chroniques avec 300 000 cas estimés en France et des milliers de nouveaux cas par an. Les premiers symptômes survenant en général entre 40 et 60 ans. Cette maladie touche le plus souvent les mains, les poignets, les genoux et les petites articulations des pieds. Elle évolue par poussées, entrecoupées de périodes où les symptômes s’atténuent. Lorsqu’elle n’est pas traitée correctement, la polyarthrite peut devenir très invalidante dans 20 % des cas.
La spondylarthrite est également une maladie rhumatismale qui atteint surtout la colonne vertébrale et le bas du dos. Cette pathologie, sous-estimée du fait de la difficulté du diagnostic, commence chez les personnes jeunes, généralement des hommes de 15 ans à 40 ans, et est aussi répandue que la polyarthrite rhumatoïde.
Sanoïa, une organisation de recherche clinique (CRO) digitale et l’AP-HP (Hôpitaux de Paris) ont lancé fin 2016 une étude pour rechercher s’il y avait un lien entre l’activité physique de patients atteints de rhumatismes inflammatoires et l’évolution de la maladie, en particulier en surveillant la survenue de poussées.
Des patients équipés d’objets connectés pour le suivi de leur pathologie
Le service de Rhumatologie de l’hôpital de la Pitié-Salpétrière a mis en place pendant 3 mois une cohorte de 170 patients afin d’étudier la corrélation entre la mobilité des patients et la survenue des poussées. Tous les patients de la cohorte ont été équipés d’une montre connectée permettant de comptabiliser les nombres de pas réalisés. Parallèlement, les patients renseignaient chaque semaine, sur une application web (fiche santé de sanoia.com) l’appréciation de leur état de santé : pas de poussée, poussée de moins de 3 jours ou de plus de 3 jours.
Traditionnellement, les CRO gèrent des études de recherche biomédicale et en particulier des essais cliniques pour le compte d’un laboratoire pharmaceutique ou d’un hôpital. La spécificité de Sanoïa, en tant que CRO digitale, est d’administrer des données provenant d’objets connectés ou de déclarations de patients sur le site web sanoia.com. Ainsi Sanoïa a équipé les 170 patients de la cohorte d’une montre connectée et a assuré la collecte, l’anonymisation et l’hébergement des données.
Une première analyse des données issues de cette cohorte a été réalisée par une équipe de biostatisticiens de l’AP-HP, à partir d’outils statistiques classiques. Elle a permis d’identifier une baisse d’activité de 12 à 20% pendant les poussées. Mais Sanoïa souhaitait aller plus loin avec des outils big data.
L’analyse par Machine Learning a permis d’obtenir des résultats prometteurs
Sur une proposition d’Orange Healthcare à Sanoïa et à l’APHP, une seconde analyse a été réalisée par des data scientists de la division IMT (Innovation, Marketing, Technologies) d'Orange avec l’outil de Machine Learning Khiops© dans le cadre d’un contrat d’expérimentation entre Orange et Sanoïa. Et c’est là que les résultats ont dépassé les attentes des médecins et de Sanoïa. En effet, l’analyse menée par Orange a permis de détecter la survenue de poussées avec une précision de 96%, uniquement à partir de l’observation du nombre de pas réalisés par le patient.
Pour le Professeur Laure Gossec , cela ouvre de nouvelles perspectives pour le suivi des malades souffrant de cette pathologie, même s’il est trop tôt pour en déduire l’impact clinique.
Une expérimentation pour tester le potentiel du Machine Learning : une première réussite
Suite à la réussite de l’expérimentation, les résultats de l’étude ont été présentés par Hervé Servy (Sanoïa) lors du congrès mondial de rhumatologie qui s’est déroulé à San Diego début novembre 2017 et lors du congrès de la Société Français de Rhumatologie à la Porte de Versailles à Paris, du 10 au 12 décembre 2017, sous la forme d’un poster commenté. L’étude y est également présentée par le Professeur Laure Gossec du service de Rhumatologie de la Pitié-Salpêtrière sous forme d’une communication orale.
L’importance de la préparation des données pour l’analyse Machine Learning
Avant d’alimenter l’outil Khiops© de Machine Learning, il a fallu normaliser les données pour faire coïncider les données remontées automatiquement par la montre toutes les minutes avec celles remontées par les patients sur une base hebdomadaire.
C’est en agrégeant sur une heure les pas effectués par un patient que les résultats de la classification sont apparus les meilleurs. La classification consiste à pouvoir détecter, pour une semaine donnée et à partir du seul nombre de pas d’un patient, qu’une poussée a eu lieu. Le résultat obtenu par les data scientists est un algorithme qui est alimenté en entrée par les pas comptabilisés par la montre connectée pour un patient sur une semaine donnée, et en sortie fournit l’information : poussée ou pas poussée.
Les données de 70% des patients sont utilisées pour établir l’algorithme de modélisation, les données des 30% des patients restants à tester et valider la pertinence du modèle. Il s’ensuit un travail d’ajustement des paramètres du modèle afin d’obtenir l’algorithme le plus performant. Ce travail est réalisé avec 10 échantillons différents, en choisissant aléatoirement un groupe de patients représentant 70% de la cohorte pour l’apprentissage et 30 % pour la validation. Pour assurer la robustesse de notre modèle, un certain nombre d’indicateurs de performance ont été calculés : matrices de confusion, « accuracy », « No Information Rate », « p-valeur » et Kappa de Cohen. Cela a permis de valider l’algorithme développé et a ouvert la voie à une publication scientifique.
Quelles perspectives pour Orange ?
Avec le Technocentre, l’entité d’Orange dédiée à l’innovation, nous sommes à la recherche de projets qui vont nous permettre d’imaginer les produits et services de demain. Fruit de la fertilisation croisée entre Orange et ses partenaires, nous pensons que les travaux réalisés avec Sanoïa peuvent être utilisés pour la création de valeur chez nos clients.
Par exemple, les premières discussions avec nos partenaires nous ouvrent les pistes suivantes :
- répliquer notre première étude pour le suivi d’autres maladies inflammatoires chroniques en utilisant des données de santé en vie réelle,
- créer des services à destination des CRO, pour participer à la transformation numérique des laboratoires, dont un des objectifs est la réduction des durées des essais cliniques,
- créer des offres et des services à destination des hôpitaux à partir de prestation de data analytics.
Cette étude est une référence supplémentaire illustrant les prestations de data analytics qu’Orange Healthcare est en mesure de réaliser pour ses clients.
Article co-rédigé par Thomas Lafargue, Chef de Produit Data au Technocentre d’Orange et Michel Seiler, Manager Innovation, Orange Healthcare
Pour aller plus loin
E-santé : le numérique au service de la prise en charge des patients en ambulatoire
Digitalisation du parcours patient : le suivi automatisé pré et post-ambulatoire
Après 15 ans passés à accompagner mes clients dans leur transformation IT, depuis les premiers services IT managés jusqu’aux migrations dans le cloud d’Orange, j’ai décidé de rejoindre le Technocentre sur des sujets d’innovation autour des usages des données.
Ingénieur de formation, je suis maintenant confronté aux sujets aussi différents que le marketing, la transition énergétique et l’usage des données en e-santé.
Autant de sujets passionnants pour la réalisation de services à destination des clients, avec une portée qui va bien au-delà des entreprises.