L'apprentissage automatique éclaire la matière noire du corps

Une start-up trouve des modèles que les experts en médecine personnalisée affirment qu’ils ne pouvaient pas voir auparavant.

Larry Smarr dit que la technologie a permis de mieux comprendre le microbiome. (Illustration de Nick Vokey; photo gracieuseté de RogDel / Wikipedia)

Larry Smarr est impressionné par l’utilisation des ordinateurs pour analyser les données médicales.

Smarr, informaticien au sein de l'institut de recherche Calit2, basé à San Diego / UC Irvine, est un pionnier du mouvement du soi quantifié. Il analyse régulièrement son sang et ses selles à la recherche de 150 biomarqueurs. S'il remarque quelque chose d'étrange, il ajustera ses activités quotidiennes, qu'il s'agisse de faire quelques tours supplémentaires sur le campus pour brûler plus de calories ou de modifier légèrement la charge de probiotique avec laquelle il complète. Grâce à toutes ces données, il a réalisé il y a quelques années qu'il souffrait de la maladie de Crohn avant son médecin. Lorsqu'il a finalement dû subir une intervention chirurgicale, il a fourni à son chirurgien un modèle tridimensionnel de son côlon afin de se familiariser avec la mise en page avant l'opération.

Parce que Smarr est très expérimenté dans la collecte et l'analyse de données médicales, il était frappant d'apprendre qu'une nouvelle startup du secteur de l'apprentissage automatique, Pattern Computer, avait quelque chose de nouveau à lui montrer.

L’une des obsessions de Smarr est l’interaction des bactéries dans notre intestin - notre microbiome - et le peu de connaissances dont nous disposons. ("La matière noire du corps", l'appelle-t-il.) Smarr tente de déterminer quels changements et fluctuations du microbiome sont normaux et lesquels sont susceptibles de provoquer une maladie. Pour ce faire, lui et ses collègues ont comparé les bactéries intestinales de personnes en bonne santé aux microbiomes de personnes présentant divers stades de maladie inflammatoire de l'intestin. Même avec seulement 62 personnes ayant fourni des échantillons dans cette étude, les données générées étaient énormes, car les bactéries présentes dans nos intestins produisent environ 10 000 types de protéines différentes qui remplissent chacune une fonction biologique différente. Et l'abondance relative de ces familles de protéines variait chez chacun des sujets humains.

On sait qu’un certain sous-ensemble de ces familles de protéines est moins répandu chez les personnes atteintes de MII que chez les personnes en bonne santé. Mais lorsque Smarr a transmis ces données à Pattern Computer, il a été en mesure de réduire considérablement le sous-ensemble. Il s'est avéré que neuf de ces 10 000 familles de protéines semblaient être les plus associées aux maladies inflammatoires de l'intestin. Se concentrer sur ces neuf facteurs et leurs voies biochimiques pourrait offrir de nouveaux indices sur la manière dont notre microbiome affecte notre santé et ouvrir de nouvelles interventions.

«C’était vraiment une découverte», déclare Smarr. Après avoir examiné ces données pendant des années avec une variété d’outils logiciels, il n’avait pas remarqué «le schéma qui était bloqué à l’intérieur de ce grand bazar de points de données».

C’est la promesse de Pattern Computer: que son système d’apprentissage automatique puisse trouver des corrélations que d’autres systèmes ne peuvent pas, même s’il n’a pas été informé de ce qu’il fallait rechercher. La société, dirigée par le prévisionniste technique Mark Anderson, a lancé cette semaine un financement d'environ 6 millions de dollars et des clients allant de «sociétés à pays», a-t-il déclaré. Avec le temps, elle se déplacera dans différentes industries, ajoute Anderson, mais se concentre actuellement sur la biomédecine.

Mark Anderson, à gauche, avec Smarr lors du lancement de Pattern Computer.

Il y a beaucoup de concurrence. Les chercheurs médicaux, les sociétés pharmaceutiques, les hôpitaux et les médecins expérimentent une vaste gamme de techniques informatiques avancées pour tenter de mieux comprendre les données. Ce qui est particulièrement délicat, c’est que ces données se présentent sous de nombreuses formes, allant des quantités dans les analyses de sang aux lectures de génomes, en passant par le texte des articles de journaux et des dossiers de patients. Ni Pattern Computer, ni aucune autre entreprise ni aucun algorithme ne sont susceptibles de tout maîtriser. IBM l'a montré. Malgré le battage médiatique sur la façon dont ses technologies Watson, basées sur le système qui a remporté le prix Jeopardy!, Sont utilisées au Memorial Sloan Kettering Cancer Center et dans d’autres hôpitaux, elles n’ont guère modifié le comportement des médecins en matière de diagnostic et de traitement des maladies.

Les progrès dans l'utilisation de l'apprentissage automatique en médecine se font par petites étapes. Ben Brown, biologiste informaticien au laboratoire national Lawrence Berkeley, tente de découvrir comment les interactions entre les gènes conduisent au cancer du sein. Mais comme il existe une grande variation dans les tumeurs du cancer du sein, il est impossible pour nous d'étudier toutes les interactions géniques pertinentes "par la force brute", a déclaré Brown. Il a utilisé la technologie de Pattern Computer pour trouver une interaction génétique à trois voies en corrélation taux de survie au cancer bas. Des recherches ultérieures pourraient explorer des thérapies ciblées pour cette interaction.

Plus haute résolution

En 2009, Leroy Hood, l'un des développeurs de la technologie de séquençage de gènes et pionnier d'une vision globale de la santé appelée «biologie des systèmes», a écrit un article pour Newsweek intitulé «La vision du médecin de l'avenir de la médecine». Il a imaginé que les gens testaient leur propre sang avec des appareils à domicile, permettant ainsi à leurs médecins d'analyser des quantités époustouflantes d'informations sur leur santé, y compris au niveau des gènes. Cet article a été publié en… juin 2018.

Nous n’en sommes pas là où Hood pensait être, car une partie seulement de l’équation est arrivée. «Nous avons d’énormes quantités de données», déclare Hood. "Nous commençons tout juste à gratter la surface de ce que nous pouvons faire avec."

Par le biais d'un service de coaching médical appelé Arivale et d'autres recherches, Hood s'attache à créer ce qu'il appelle la médecine P4: prédictif, préventif, personnalisé et participatif. Le défi, a-t-il dit, consiste à analyser des données de différents types. À titre d'exemple, il a cité une étude pilote sur les P4 menée auprès de 108 de ses amis. Pendant neuf mois, son équipe a recueilli des informations à leur sujet en séquençant leur génome, en effectuant des analyses de sang et de selles régulières et en leur fournissant des auto-diagnostics pour leur sommeil et leur activité physique. Pour bien comprendre les données et en tirer plusieurs suggestions exploitables, M. Hood a indiqué qu’il aurait besoin de davantage d’outils tels que Pattern Computer.

Smarr note que le modèle révolutionnaire créé par ses recherches dans le cadre de ses recherches n’est «qu’une expérience». Certes, la start-up pourrait jouer un petit rôle dans l’avancée de la médecine fondée sur les données. Mais Hood se dit optimiste sur le fait que P4 pourrait être une réalité dans peu de temps. Enfin, ajoute-t-il, les chercheurs peuvent «examiner les données et les maladies avec une résolution inédite».