A mixture model to characterize genomic alterations of tumors

  • Christine Keribin Laboratoire de Mathématiques d’Orsay, Univ. Paris-Sud, CNRS, Université Paris-Saclay, 91405 Orsay, France
  • Yi Liu INRIA Saclay Ile-de-France équipe Select
  • Tatiana Popova Institut Curie, INSERM U830
  • Yves Rozenholc INRIA Saclay Ile-de-France équipe Select

Résumé

La caractérisation des altérations du nombre de copies dans le génome est d'importance capitale pour développer une médecine personnalisée en cancérologie. Les puces à SNPs (Single Nucleotide Polymorphism), une variante de puce à ADN, sont toujours utilisées pour mesurer les profils d'altération du nombre de copies. Parmi les méthodes d'analyse de profil de SNPs, la méthode GAP (Genome Alteration Print) de Popova et al, basée sur une segmentation préliminaire de profils issus de puces SNPs, utilise une approche déterministe pour déterminer le profil du nombre absolu de copies. Nous développons un modèle probabiliste pour la méthode GAP et définissons un modèle de mélange gaussien dont les centres sont contraints d'appartenir à un réseau dépendant de paramètres inconnus tels que la proportion de tissu tumoral dans le prélèvement. L'estimation est effectuée à l'aide d'un algorithme EM (expectation-maximization) permettant d'accéder non seulement aux paramètres mais aussi au nombre altéré de copies le plus probable sur chaque segment ainsi que la proportion tumorale inconnue. Nous proposons de déduire la plo\"idie tumorale en utilisant un critère pénalisé de choix de modèle. Notre modèle est testé sur des données simulées et appliqué à un exemple de données de cancer du côlon.

Publiée
2019-03-20
Rubrique
Numéro spécial : analyse de mélanges