Détection non-supervisée d’observations atypiques en contrôle de qualité : un survol

  • Aurore Archimbaud

Résumé

La détection d’observations atypiques ou d’anomalies est un challenge dans de nombreux domaines. Dans cet article, une revue de la littérature des méthodes non-supervisées est dressée et l’accent est principalement mis sur le contrôle de qualité. Tout d’abord il est important de noter que la notion d’anormalité retenue suit celle donnée par Hawkins (1980), à savoir qu’une observation est atypique si elle est générée par un mécanisme différent de celui de la majorité des données. Une première section se focalise sur le contexte du contrôle de qualité dans l’industrie des composants électroniques destinés aux applications automobiles, afin d’établir un inventaire des différentes méthodes utilisées en pratique. Il apparaît que ce sont principalement des méthodes univariées qui sont intégrées aux différents processus de détection de défauts. Seules quelques méthodes multivariées de type distance de Mahalanobis ou Analyse en Composantes Principales semblent connues de quelques industriels. Les sections suivantes essaient de résumer l’ensemble de la palette de possibilités destinées à la détection d’observations atypiques de manière non-supervisée ainsi que leur mise en oeuvre sous le logiciel R (R Core Team, 2017). Une distinction est faite entre les méthodes ne traitant que des données en dimension standard, i.e avec plus d’observations que de variables, et celles acceptant des données en grande dimension et avec une faible taille d’échantillon.

Publiée
2018-12-13
Rubrique
Article