IA médicale : vos genoux en disent long sur votre consommation de bière, ou pas
En coulisse

IA médicale : vos genoux en disent long sur votre consommation de bière, ou pas

Anna Sandner
2/1/2025
Traduction: Martin Grande

L’intelligence artificielle promet d’identifier des détails invisibles aux humains en imagerie médicale. Une nouvelle étude révèle la propension qu’ont les modèles d’IA à adopter des schémas de données trompeurs qui aboutissent à des conclusions erronées.

Imaginez qu’à partir d’une radiographie de votre genou, un programme informatique puisse prédire si vous aimez boire de la bière ou non. Ce qui semble à première vue absurde est justement ce qu’une équipe de recherche a réussi à accomplir dans une étude récente en anglais. La joie de ce succès n’a toutefois pas duré longtemps. En effet, la publication vise à attirer l’attention sur un grave problème dans le développement de l’intelligence artificielle pour l’imagerie médicale.

Le danger des raccourcis

Dans leur travail publié en anglais dans Scientific Reports, les scientifiques démontrent la vulnérabilité des algorithmes de deep learning aux raccourcis (shortcutting en anglais). En ingénierie informatique, on appelle shortcutting le phénomène par lequel les modèles d’IA prennent des raccourcis. Ils se basent sur des modèles de données d’entraînement superficiels plutôt que d’intégrer les caractéristiques médicales réellement pertinentes.

Les modèles trouvent une solution simple pour fournir une réponse sans vraiment comprendre le problème sous-jacent. Les conséquences de ce phénomène sont particulièrement préjudiciables dans le domaine médical.

De votre radio des genoux à votre consommation de bière

Pour illustrer cette problématique, l’équipe de recherche a entraîné des réseaux neuronaux simples à deviner si les patients ou les patientes évitent la bière ou les haricots frits en leur faisant analyser des radiographies du genou. Ces préférences personnelles ne pouvant logiquement pas être détectées sur une radiographie du genou, l’IA ne devrait pas être en mesure de tirer des conclusions à ce sujet. Le résultat est pourtant surprenant, car les modèles d’IA ont pu prédire les préférences avec une précision de 63 pour cent pour les haricots et de 73 pour cent pour la bière. Ce taux de réussite élevé était tout à fait inattendu, bien qu’il n’existe aucun lien médical plausible entre ces habitudes alimentaires et l’état d’un genou.

La logique cachée des données

Comment les modèles ont-ils pu aboutir à de tels résultats ? La réponse se trouve dans des liens logiques qui se cachent dans les métadonnées. Les systèmes d’IA ont appris à reconnaître des indices subtils liés à des facteurs démographiques ou à des détails techniques. Ils ne se sont donc pas basés sur l’apparence des radiographies pour faire leurs prédictions, mais plutôt sur l’âge et le sexe des patients, leur ethnie et leur lieu de résidence. Ils ont par exemple identifié la clinique qui a produit l’image ou l’année de fabrication de l’appareil de radiographie.

L’IA veut deviner la consommation de bière d’individus en se basant sur leurs radiographies. En réalité, ses résultats découlent d’autres facteurs.
L’IA veut deviner la consommation de bière d’individus en se basant sur leurs radiographies. En réalité, ses résultats découlent d’autres facteurs.
Source : Hill et al./ Scientific Reports, CC-by-nc-nd 4.0

Où réside le danger ?

« Ces résultats montrent à quel point il est facile de créer des modèles avec des prédictions étonnamment précises, mais dépourvues de toute plausibilité », préviennent les personnes derrière l’étude. Dans la recherche médicale, cela pourrait conduire à des conclusions erronées. On pourrait croire qu’un modèle d’IA a fait une nouvelle découverte révolutionnaire, alors qu’il n’a trouvé qu’une corrélation aléatoire dans les données.

Le problème du shortcutting va bien au-delà de simples quiproquos. Si l’on se penche plus profondément sur l’étude, on se rend compte que les modèles n’utilisent pas seulement des facteurs d’influence isolés comme le sexe ou l’âge, mais des combinaisons complexes de différentes variables. Même si l’on exclut les facteurs perturbateurs qui nous semblent évidents, les algorithmes trouvent souvent d’autres moyens de faire leurs prédictions.

Photo d’en-tête : Cagkan Sayin/Shutterstock

Cet article plaît à 88 personne(s)


User Avatar
User Avatar

Rédactrice scientifique et biologiste. J'aime les animaux et je suis fascinée par les plantes, leurs capacités et tout ce que l'on peut faire avec et à partir d'elles. C'est pourquoi mon endroit préféré est toujours à l'extérieur - quelque part dans la nature, volontiers dans mon jardin sauvage. 


Ces articles pourraient aussi vous intéresser

Commentaire(s)

Avatar