Comment les données synthétiques ont contribué à l'amélioration de la détection du cancer du sein ?

ALIA SANTé

Découvrez comment les données synthétiques peuvent servir à l’amélioration de la détection du cancer du sein

Temps de lecture : 3 minutes

Le cancer du sein

Il faut savoir que le cancer du sein est le type de cancer le plus courant chez les femmes en France, dans l’Union européenne et aux États-Unis. Bien que cette maladie soit la principale cause de décès par cancer chez les femmes en 2018, le nombre de cas diagnostiqués chaque année a tendance à diminuer depuis 2005. Si le cancer du sein est dépisté à un stade précoce, les chances de survie à 5 ans sont de 99%. La détection précoce du cancer du sein a donc un impact significatif sur la réduction du taux de mortalité de la maladie.

L’IA au service de la médecine

Actuellement, plusieurs outils d’intelligence artificielle existent dans le but d’aider les professionnels de santé à accélérer le diagnostic et faciliter la décision thérapeutique. En utilisant la combinaison de données de séquençage génomique et d’algorithmes de Machine Learning, il est possible de lutter contre le cancer. L’apprentissage automatique peut aider à la détection, au traitement et au pronostic de la maladie. Mais aussi à l’élaboration de traitements personnalisés. Cette approche permet de tirer parti des données de patients multiples pour identifier des similarités et des corrélations entre eux et ainsi mieux comprendre la maladie.

Cependant, l’intelligence artificielle se voit aujourd’hui freinée par la quantité limitée de données accessibles. Alors comment permettre à l’IA de casser cette barrière et d’accéder à une nouvelle étape de son évolution ?

Pour répondre à cette question, nous vous proposons un cas d’usage sur la base de données « Breast Cancer Wisconsin (Diagnostic) – UCI Machine Learning Repository« . Ce dataset a pour but de prédire si le type de tumeur est maligne ou bénigne. Nous avons donc décidé d’augmenter la base de données d’entraînement d’un modèle d’intelligence artificielle de classification en utilisant des données synthétiques.

L’étude

1000 jumeaux numériques ont complétés les 569 patients réels de cette étude. Ces jumeaux numériques sont des données synthétiques générées à partir d’algorithmes d’intelligence artificielle. Ces algorithmes reproduisent fidèlement les caractéristiques des patients réels tout en préservant leur anonymat. Cette approche a permis d’élargir  la taille de l’ensemble des données d’entraînement. Cela offre ainsi de nouvelles perspectives pour les modèles d’intelligence artificielle.

La comparaison

Nous avons réalisé une comparaison de la performance de plusieurs modèles de classification. Les résultats ont démontré une amélioration de 5,2% des performances des modèles entraînés avec une cohorte combinant des patients réels et virtuels par rapport aux modèles entraînés uniquement avec des patients réels.

Les bienfaits des données synthétiques dans ce contexte sont évidents. Les performances des solutions d’intelligence artificielle de classification du cancer du sein sont améliorées grâce à l’ajout de données synthétiques. Cela permet aux modèles d’être plus précis et fiables dans la détection des tumeurs malignes et bénignes. Ce qui peut avoir un impact direct sur les décisions de traitement prises par les professionnels de santé.

 

En utilisant des données synthétiques, il est alors possible d’élargir considérablement la taille de l’ensemble de données d’entraînement. Ce qui permet en conséquence aux modèles d’apprendre à partir d’un échantillon plus diversifié et représentatif.

De plus, les données synthétiques présentent l’avantage
d’être anonymes, ce qui résout les problèmes de confidentialité et de
protection des données sensibles des patients réels. Les chercheurs et les
professionnels de santé peuvent donc utiliser ces données sans craindre de
violer la vie privée des individus concernés.

Conclusion :

Les données synthétiques contribuent à l’amélioration de cancer du sein.

L’utilisation de données synthétiques a apporté des améliorations significatives dans la détection du cancer du sein grâce à l’intelligence artificielle. Les performances des modèles de classification ont été renforcées. Ce qui donc implique  de meilleures prédictions et une base de données plus vaste pour la recherche. Tout en préservant la confidentialité des patients, les données synthétiques ouvrent ainsi de nouvelles perspectives pour l’innovation dans la lutte contre le cancer du sein. Cette approche prometteuse ouvre alors la voie à de nouvelles avancées dans le domaine de la santé.