Intelligence artificielle : comment la médecine prédit les cancers grâce à notre ADN
Les récents progrès en analyse ADN et la démocratisation de l’usage de l’intelligence artificielle dans les cliniques et laboratoires sonnent l’avènement de la médecine prédictive. La promesse du secteur, prédire l’apparition de maladies graves avant même que les patients n’en ressentent les symptômes, a tout de l’allure d’un scénario de science-fiction mais est pourtant devenu réalité, avec son lot de questions éthiques.
Pour Hippocrate, « il est plus important de savoir quel type de personne a une maladie que de savoir quel type de maladie a une personne ». Ainsi, la médecine prédictive est l’un des nouveaux Eldorados de la recherche scientifique. Elle ne vise pas moins qu’à anticiper l’apparition de maladies graves, comme le cancer, chez les patients avant même qu’ils ne ressentent le moindre symptôme, en détectant les signaux faibles. Et à ce niveau-là, notre génome se révèle être une mine d’or, dont tous les secrets ne demandent encore qu’à être dévoilés. C’est seulement l’année dernière que l’entièreté du génome humain a achevé d’être séquencé grâce aux progrès informatiques et technologiques. La fin d’une aventure initiée par les chercheurs dans les années 1970, ou plutôt le commencement. « Nous allons au-devant de grandes difficultés d’interprétation ces prochaines années, car c’est d’autant plus de données à prendre en compte pour prédire des pathologies. L’intelligence artificielle va être d’autant plus utile pour débroussailler tout ça.” Résume-ainsi Ariane Giacobino, spécialiste en génétique médicale au sein de la Faculté de médecine de Genève.
L’IA pour interpréter mieux et plus rapidement ces données
« Il y a plus de 20 ans, le premier objectif était d’établir un catalogue des gènes humains afin de trouver ceux qui étaient à l’origine de maladies génétiques lorsqu’ils étaient mutés », explique Jean Wesseinbach, pionnier du séquençage de génome humain en France et ex-directeur de l’institut publique du Genoscope. Pour se faire, “une séquence de référence était comparée à celle d’individus malades”. Car pour trouver ce qui est anormal dans un ADN, il s’agit déjà par définition d’établir ce qu’est la norme. Tâche ardue en génétique dans la mesure où l’ADN de chacun est unique.
Mais une étape supplémentaire a été franchie il y a deux semaines, quand une équipe de chercheurs est parvenue à séquencer un « pan-génome », intégrant le génome complet de 47 personnes issues des 5 continents, afin d’être davantage représentatif de la diversité génétique humaine. « Le pan-génome est une collection des variations de séquences, obtenue à partir d’une collection d’individus de différentes ethnies. […] Il y a environ six milliards de nucléotides par individu, pour des raisons de coût, on ne séquence pas tout. Mais si on multiplie ça par le nombre de génomes séquencés, on obtient un nombre astronomique en termes de données. »
C’est justement lorsqu’il s’agit d’interpréter ces milliards de données, et notamment les mutations susceptibles de causer à terme des cancers, que l’intelligence artificielle (IA) est devenue une référence. L’outils, toujours plus performant, s’est révélé pouvoir interpréter de manière plus fiable et rapide que l’humain toutes les irrégularités contenues dans l’ADN. « Cela fait à peu près cinq ans qu’on utilise l’IA en oncogénétique », explique Ariane Giacobino. « On peut voir toutes les mutations dans les 22 500 gènes grâce à cela, si une personne a une prédisposition à un cancer, on va la trouver. Il n’y a quasiment pas de faux négatifs ». L’IA va ainsi « mouliner toutes les données pour essayer de leur donner un sens et décerner un score », qui indique la probabilité que les variations du génome détectées soient bénignes ou pathologiques, et donc facteur de risque de cancer dans un organe donné. Cette « lecture » du génome intéresse également l’industrie pharmaceutique, qui peut ainsi prédire la réponse de l’organisme à certains médicaments, et donc leur efficacité.
A ce jour, une prescription médicale est nécessaire, en plus du déboursement d’un millier d’euros (un montant qui n’a fait que décroitre au cours des décennies), pour demander à faire séquencer son génome. La crainte de développer un cancer doit être justifiée par l’existence de précédents dans la famille du patient. En France, près de 160 000 personnes meurent du cancer chaque année, et la prise en charge doit se faire le plus précocement possible pour optimiser les chances de survie. Dans cette course contre la montre, la rapidité d’analyse de l’IA pour interpréter rapidement les génomes représente un enjeu crucial. Mais pour être efficace, ce type d’IA, qui fonctionne par « réseau-neuronal », doit se nourrir d’un nombre de données aussi important que possible pour effectuer tous les comparatifs génétiques. Plus la quantité de données à disposition de l’IA sera importante, plus la précision du fameux score sera élevée. Mais les acteurs du secteur ne sont pas toujours enclins à partager leurs données.
La chasse gardée des big data, une forte concurrence entre privé et public
Pour fonctionner, l’IA s’auto-alimente en continu d’un nombre colossal d’informations médicales, stockées principalement dans cinq grandes bases de données internationales gratuites. Elles font office de référence pour l’ensemble des généticiens et sont parfois désignées sous le nom de Big data. “Elles sont alimentées en continu par une multitude d’hôpitaux et de cliniques, qui y entrent leurs résultats médicaux du quotidien”, décrit Ariane Giacobino. “Il arrive que l’IA ne sache pas très bien interpréter une anomalie dans le génome d’un patient à partir des données à disposition à un moment donné ; dans ce cas, on peut lui dire de revenir deux ou trois ans plus tard, le temps que davantage de données aient été entrées dans la base par d’autres médecins. L’IA s’enrichit constamment du savoir produit dans le monde. »
Si de grandes bases de données internationales, comme GenBank, sont accessibles à tous les chercheurs, celles du privé ne sont pas accessibles pour le public. “Les centres privés ne jouent pas forcément le jeu de la mise en commun de données”, dénonce la généticienne suisse. “Pour attirer un maximum de gens et donc de données, ces laboratoires, principalement américains et asiatiques, font payer très peu cher leur séquençage génétique. Ils font du bon séquençage, car ils ont beaucoup de demandes, mais ils cassent le prix et ne partagent pas leurs données.”
Mais dans le domaine ultra-concurrentiel des big data génétiques, chacun s’accuse de vouloir garder la plus grosse part du gâteau. “Ma base de données à moi n’a pas une grande valeur”, relativise Pierre-Jean Lamy, directeur scientifique du groupe privé Inovie et auparavant généticien à l’institut du cancer de Montpellier, où son départ a notamment été motivé par des divergences de point de vue sur le potentiel médical du séquençage génétique. “On a des prix compétitifs par rapport au public, c’est vrai. Comme ils ne nous sont pas remboursés par la sécurité sociale, c’est du bénéfice en moins pour les cliniques, donc on essaie d’avoir des tests à moindre coût sans lésiner sur la qualité.” En France, les acteurs privés n’ont pas accès à certaines bases de données publiques. Une « guéguerre stérile » selon lui. « Je trouve ça dommageable, car les bases de données publiques sont payées par l’argent public. Les big data sont une chasse gardée. Ça peut être préjudiciable pour les patients qui auront un diagnostic moins fiable, puisque reposant sur un nombre de données qui pourrait être bien plus important. Idéalement, j’aimerais qu’il y ait une seule et même base accessible à tous. »
“Le privé vend ses données ou se les réserve pour d’éventuelles applications notamment des diagnostics”, rappelle Jean Weissenbach. “Il y a aussi la question de la confidentialité, car pour mettre ses données de séquençage en ligne dans les bases publiques, il faut que les individus donnent leur consentement.” Pour des raisons de confidentialité, ces données sont anonymes, et ce, pour la sécurité des patients.
Des données ultra-sensibles
Si le séquençage de génome peut sauver des vies, entre de « mauvaises mains », il peut être utilisé au détriment de son détenteur. Il y a par exemple peu de chance qu’une banque accepte de vous octroyer un prêt si elle a eu vent de vos prédispositions génétiques à un cancer. De même, une mutuelle santé se montrera probablement frileuse à vous couvrir si elle apprend qu’elle va sûrement devoir vous rembourser d’importants frais médicaux dans les années qui suivent. Normalement, l’article 16-13 du code civil affirme clairement : « Nul ne peut faire l’objet de discriminations en raison de ses caractéristiques génétiques ».
En janvier dernier, le CCNE (Comité consultatif national d’éthique pour les sciences de la vie et de la santé) rendait à ce propos un avis sur le développement de l’IA en médecine. « Une attention particulière doit être portée aux risques de surveillance et de sélection adverse en matière assurantielle et de santé publique », avertit le comité.
« En principe, une mutuelle ou une assurance ne peut pas identifier les patients dans ces bases de données puisqu’elles sont anonymisées », rassure Ariane Giacabino, membre du Comité. Toutefois, elle constate une forte convoitise pour ces données en Suisse, où, contrairement à la France, des assurances santé acceptent de prendre en charge les séquençages. « On voit souvent des questions tendancieuses posées aux patients. C’est un sujet très sensible, on sent qu’il y a une pression des assurances santé qui aimeraient bien pouvoir obtenir nos résultats en contrepartie du remboursement du séquençage du patient. Par exemple, si quelqu’un prend une assurance-vie en Suisse, on met nos patients en garde, car, selon le montant, la banque peut demander s’il a déjà fait des analyses génétiques et si oui quels étaient les résultats. »
LEXIQUE EXPLICATIF
IA : Diminutif d’intelligence artificielle. Pour le Parlement européen, l’intelligence artificielle représente tout outil utilisé par une machine afin de « reproduire des comportements liés aux humains, tels que le raisonnement, la planification et la créativité ». Médecine prédictive : Discipline récemment apparue, dont le but est d’indiquer, avec le plus de précision possible, le risque d’apparition de certaines maladies grâce à la génétique. Génome : Ensemble de l’information génétique inhérente à notre espèce. Il est présent dans toutes les cellules de l’organisme et s’organisme selon un code porté par l’ADN. Big Data : Gigantesque volume de données numériques produites combiné aux capacités sans cesse accrues de stockage et à des outils d’analyse en temps réel de plus en plus sophistiqués Eugénisme : Ensemble des recherches (biologiques, génétiques) et des pratiques (morales, sociales) qui ont pour but de déterminer les conditions les plus favorables à la procréation de sujets sains et, par là même, d’améliorer la race humaine.
Rien n’oblige normalement les patients et les médecins à communiquer ce type de données, mais les assurances miseraient sur leur méconnaissance des enjeux, pourtant énormes. « Des mutuelles nous contactent souvent avec des courriers un peu naïfs, disant “Vous avez demandé un remboursement pour une analyse, merci de nous transmettre les résultats”. On ne le fait pas bien sûr, mais il y a toujours un risque que ce soit par exemple le secrétariat qui tombe dessus. Or, il n’est pas forcément au fait de la sensibilité de ces données ou de la loi, et là ça peut faire mouche…”
Mais pas nécessairement besoin de poser explicitement la question pour obtenir le génome d’une personne. Lorsqu’on lui parle d’anonymisation, Jean Weissenbach ne peut s’empêcher de sourire : « L’anonymat total est impossible dans la mesure où un individu donné laissera toujours des traces de son ADN sur les objets qu’il touche et qui pourront être récupérées à son insu. Même une toute petite quantité est suffisamment caractéristique pour permettre de retrouver sans ambiguïté son possesseur si jamais il est dans des bases de données publiques, auquel cas on accède à l’entièreté de son génome. C’est quelque chose que les banques et assurances sont en mesure de faire. » Le scientifique à la retraite n’a toutefois jamais vu de cas avéré, une telle démarche restant coûteuse.
Mais outre les infractions, l’utilisation de l’IA appliquée à la génétique soulève d’importantes questions éthiques.
« L’eugénisme n’est jamais loin »
La prudence est de mise lorsqu’on touche à la génétique. Et dans le monde du séquençage humain, les technologies actuelles sont déjà en mesure de nous faire basculer vers une dystopie scientifique si demain la loi le permettait. « L’eugénisme n’est jamais loin », prévient Ariane Giacobino, une pratique interdite en Europe.
Les trois scientifiques identifient instantanément la question qui leur est posée lorsqu’est évoqué le film de science-fiction Bienvenue à Gattaca. Sorti en 1998, il met en scène deux frères qui rêvent d’aller dans l’espace. L’un est naît de manière naturelle, soumis au hasard de la génétique et à toutes les “imperfections” que cela induit, tel que l’asthme. L’autre, fruit d’une sélection rigoureuse d’embryons, possède un patrimoine génétique impeccable, sans prédisposition à aucune maladie d’aucune sorte, en plus d’une forme athlétique. Ainsi, seul ce dernier est autorisé à réaliser son rêve, une fatalité à laquelle son frère va refuser de se résoudre. Un scénario qui peut sembler improbable, mais dont des esquisses se dessinent déjà au Moyen-Orient et aux Etats-Unis. « Des firmes américaines testent les prédispositions au cancer de fœtus avant implantation, ce qui peut inciter à un tourisme reproductif pour avoir un embryon plus sain, craint Ariane Giacobino. Je ne voudrais pas qu’on glisse de la détection de certitude à la recherche de facteur de risque chez un embryon. »
En France, une telle pratique n’est autorisée que si le premier enfant d’un couple, qui souhaite en avoir un second, est atteint d’une maladie grave. « Oui, l’eugénisme se fait dans certains pays, ce n’est techniquement pas très complexe à mettre en place, mais ça n’aurait aucun sens », tacle le directeur du groupe Inovie. « Les problèmes médicaux ne se réduisent pas à la génétique, ce n’est pas magique. » En effet, les causes héréditaires restent plutôt rares, la plupart des cancers sont surtout liés à l’environnement de vie. Même son de cloche du côté de Jean-Weissenbach : « L’ADN parfait n’existe pas, c’est une utopie. Si on est protégé contre une maladie donnée, car on a un bon variant dans notre séquence, celui-ci peut avoir des effets à notre détriment dans d’autres circonstances », juge bon de rappeler l’ex-directeur du Génoscope, plus concerné par les trouvailles fortuites que le risque d’eugénisme.
Déjà en 2007, des craintes avaient été formulées à ce sujet dans un article scientifique rédigé par une généticienne et une philosophe, rappelant que, parmi les principes qui régissent les règles de bonne pratique en médecine prédictive, il y a notamment le droit de ne pas savoir. « On peut se demander si l’offre toujours croissante de tests génétiques, relayée par les médias, ne crée pas, ipso facto, un devoir de savoir. […] Est-il souhaitable qu’un individu asymptomatique dispose d’une liste des probabilités qu’il aurait de développer les maladies auxquelles il est génétiquement le plus vulnérable ? »
La question trotte dans la tête des trois généticiens. Que faire si l’IA trouve ce qu’elle ne cherchait pas à l’origine ? Doit-on en informer le patient alors que ce n’est pas ce qu’il était venu savoir ? « Avec les récents progrès réalisés en séquençage de génome et IA, nous allons très probablement être confrontés à un nombre beaucoup plus important d’incidentalomes, c’est-à-dire des mutations découvertes alors qu’on cherchait autre chose », s’inquiète Ariane Giacobino. « En Suisse, les assurances nous demandent souvent, puisque les analyses coûtent cher, de faire une analyse génétique aussi large que possible. D’une part pour ne pas avoir à effectuer plusieurs remboursements au patient, mais aussi pour qu’on trouve potentiellement davantage de prédispositions chez lui, alors que ce n’est pas ce qu’il souhaitait à la base. Ça renforce la probabilité de trouver des mutations qu’on ne sait pas interpréter et génère de l’anxiété chez le patient. »
Pour Pierre-Jean Lamy se pose enfin la question du fossé qui se crée entre riches et pauvres. « Le cancer est déjà un marqueur d’inégalité social absolu, car les pauvres sont dans les environnements les plus pollués, consomment davantage de tabac et d’alcool, et ont accès à de moins bons outils de soin. Le séquençage de l’ADN pour prendre en charge des cancers devient incontournable, alors il faut y mettre les moyens. Sinon, seuls certains y auront accès. »