Une approche par classification de variables pour la typologie d’observations : le cas d’une enquête agriculture et environnement

Vanessa Kuentz-Simonet, Sandrine Lyser, Jacqueline Candau, Philippe Deuffic, Marie Chavent, Jérôme Saracco

Résumé


Nous considérons le cas d'une enquête agriculture/environnement dont les données sont relatives aux transformations actuelles du métier d'agriculteur. Nous optons pour une démarche originale en remplaçant la première étape classique d'analyse factorielle par un algorithme de classification de variables. L'objectif de la classification de variables est de construire des classes de variables fortement liées entre elles et de supprimer ainsi l'information redondante. L'approche ClustOfVar utilisée fournit simultanément des groupes de variables ainsi que les variables synthétiques associées aux classes de variables. Dans cet algorithme, le critère d'homogénéité repose sur la notion de corrélation pour les variables quantitatives et de rapport de corrélation pour les variables qualitatives. L'étape de classification de variables nous permet d'obtenir des variables synthétiques que nous proposons de lire comme une sorte de gradient. Sur nos données, les valeurs correspondent à des regroupements de modalités distincts et pertinents pour l'interprétation. Cette démarche nous permet de lire et d'étiqueter chaque variable synthétique. Nous mettons ainsi en évidence des tendances qui vont départager l'opinion des agriculteurs quant à leur prise en compte de l'environnement. Puis nous précisons ces résultats en réalisant une classification sur les scores des individus mesurés sur les variables synthétiques. Sur le plan sociologique, l'apport des variables synthétiques pour interpréter les profils-types obtenus est incontestable.

Texte intégral : PDF


Creative Commons License
Ce travail est autorisé sous licence avec la Licence de paternité Creative Commons 3.0.

SFdS / SMF - Journal de la Société Française de Statistique - ISSN 2102-6238