Détection non-supervisée d’observations atypiques en contrôle de qualité : un survol
Résumé
La détection d’observations atypiques ou d’anomalies est un challenge dans de nombreux domaines. Dans cet article, une revue de la littérature des méthodes non-supervisées est dressée et l’accent est principalement mis sur le contrôle de qualité. Tout d’abord il est important de noter que la notion d’anormalité retenue suit celle donnée par Hawkins (1980), à savoir qu’une observation est atypique si elle est générée par un mécanisme différent de celui de la majorité des données. Une première section se focalise sur le contexte du contrôle de qualité dans l’industrie des composants électroniques destinés aux applications automobiles, afin d’établir un inventaire des différentes méthodes utilisées en pratique. Il apparaît que ce sont principalement des méthodes univariées qui sont intégrées aux différents processus de détection de défauts. Seules quelques méthodes multivariées de type distance de Mahalanobis ou Analyse en Composantes Principales semblent connues de quelques industriels. Les sections suivantes essaient de résumer l’ensemble de la palette de possibilités destinées à la détection d’observations atypiques de manière non-supervisée ainsi que leur mise en oeuvre sous le logiciel R (R Core Team, 2017). Une distinction est faite entre les méthodes ne traitant que des données en dimension standard, i.e avec plus d’observations que de variables, et celles acceptant des données en grande dimension et avec une faible taille d’échantillon.
Instructions
- Pour les articles à plusieurs auteurs, un seul des auteurs est tenu de signer ce formulaire. Cet auteur est présumé avoir consulté ses co-auteurs et avoir reçu leur accord quant au contenu du formulaire.
- Le formulaire complété et signé est scanné (au format JPEG ou PDF) et envoyé par courriel, comme fichier attaché, à Gilles Celeux
Remarques
- En transférant le copyright d'un article à la Société Française de Statistique (SFdS) pour sa publication dans le Journal de la SFdS, l'(es) auteur(s) conserve(nt) les trois droits de propriété suivants:
- le droit de reproduire et d'utiliser l'article à des fins non lucratives dans un contexte éducatif, professionnel ou académique (par exemple, faire circuler des copies sous format papier ou électronique, déposer l'article complet sur un site internet), pour autant que, dans le corps du fichier électronique ou de la copie de l'article, le Journal de la Société Française de Statistique soit clairement citée comme source originale de publication et que les références bibliographiques complètes de l'article soient mentionnées (année, volume, numéro du fascicule, nombre de pages et adresse web/URL du J-SFdS), comme c'est le cas dans la version électronique originale;
- le droit d'accorder l'autorisation de reproduire des tableaux, graphiques ou illustrations qui apparaissent dans l'article, pour autant que le Journal de la SFdS soit clairement citée comme source originale de publication et que les références bibliographiques complètes de l'article soient mentionnées;
- la propriété intellectuelle.
- Les auteurs peuvent contacter l'un des rédacteurs en chef du J-SFdS s'ils désirent obtenir l'autorisation pour d'autres formes de distribution de l'article.