Nous l’avons vu dans mon précédent article, le Big Data est certainement partout, mais tout n’est pas du Big Data. Essayons maintenant de voir dans cet article un exemple concret de l’utilisation du Big Data dans la santé.
génétique et Big Data
Depuis Mendel, l’hérédité a fait un chemin incroyable, y compris dans le langage : « c’est notre ADN », entendre consubstantiel, inévitable, déterminé.
Le courant de la médecine personnalisée à amplifié l’idée que l’ADN pouvait révéler les secrets de la vie, être la carte des mystères du corps. Pourtant le lien « un gène = une expression phénotypique » est l’exception, pas la règle. Les omics (génomiques, proteomique, etc) nous confrontent tous les jours à une complexité mal appréciée.
Cela ne devrait pourtant pas être une surprise :
- Conrad Hal Waddington avait introduit dès 1942 l’idée d’épigénétique selon laquelle l’expression des gènes est influencée par l’environnement.
- En 1970, deux groupes de chercheurs (H. Temin et S. Mizutani d’une part et David Baltimore d’autre part) découvrent avec les retro virus et la transcriptase inverse qu’une enzyme peut modifier notre ADN…
Bref, autant pour la carte du vivant, lisible et déterminée. Le problème est fondamentalement complexe, et quelque part sous déterminé, peut-être même chaotique.
Mais alors que fait-le Big Data en « omics » ?
La seule chose que l’on sache faire quand on n’y comprend rien : des stats.
On tente des associations. On prend des patients qui partagent une pathologie et on essaye de trouver s'ils présentent (de façon statistiquement significative) des caractéristiques génétiques communes, ou si ces patients présentent plus ou moins fréquemment que les autres (sans la pathologie) certains gênes.
Ce qui est remarquable, c’est d’abord que l’on cherche au hasard, en espérant trouver quelque chose et que si l’on trouve quelque chose, on trouve une différence ou une corrélation.
Trouver une différence c’est montrer que tel groupe de patients présente des caractéristiques propres, que ne présentent pas les autres. Par exemple que les patients ayant telle pathologie ont tel groupe de gêne plus fréquemment que ce qui n’ont pas cette pathologie.
Etablir une corrélation c’est dire quelque chose comme « les gens qui ont un gêne A présentent statistiquement plus fréquemment le phénotype A’». Au niveau d’un individu le sens est donc assez faible. Au niveau médical ce n’est malheureusement pas un lien de causalité, une implication, une conséquence. On peut vous dire « vous avez tant de chances d’avoir telle pathologie », mais sans certitude, et sans savoir pourquoi. Ça n’a rien de nouveau d’ailleurs : pour reprendre une pensée de Bruno Falissard « la médecine est un art corrélatif ».
Prédire n’est pas expliquer (1). C’est pourtant l’explication qui nous permet d’agir intelligemment, c’est elle qui doit appeler nos efforts… la route ouverte par Mendel est encore longue et les Big Data en Omics ne sont que les premiers pas.
Benjamin.
(1) R. Thom.
crédit photo : © Sergey Nivens - Fotolia.com
Directeur Marketing d'Orange Healthcare, je travaille depuis de nombreuses années dans l'univers de la santé. Avant d'intégrer Orange, je planchais déjà au sein de l'INSERM sur le domaine de l'imagerie médicale. Passionné de technologies, j'ai dû tester une bonne vingtaine d'objets connectés santé rien que cette année !