L’émergence de la statistique robuste moderne ne date que des années 1960 avec les travaux pionniers de Tukey (1960), Huber (1964) et Hampel (1968). Depuis cette période, de nombreux modèles et méthodes ont été réexaminés sous l’angle de la robustesse.
La prise en compte de l’impact de valeurs atypiques, ou de toute autre structure minoritaire présente dans les données, est d’autant plus importante à l’heure actuelle que l’on dispose de bases de données de plus en plus grandes dont la fiabilité et la qualité sont relativement inégales. Or, l’estimation des paramètres d’un modèle n’est valable que sous certaines hypothèses, bien souvent passées sous silence dans la pratique. La présence dans la population de plusieurs types de comportement ou l’existence de valeurs aberrantes va à l’encontre de l’hypothèse que tous les individus examinés ont un comportement compatible avec le modèle sous-jacent. Les recherches intégrant des méthodes statistiques robustes destinées à surmonter ces difficultés sont intéressantes tant au niveau théorique que pratique. Les méthodes robustes sont également essentielles dans la détection des valeurs atypiques.
Cet ouvrage est le fruit de la collaboration entre spécialistes parmi les plus réputés : Eva Cantoni (Université de Genève), Christophe Croux (Katholieke Universiteit Leuven), Catherine Dehon (Université Libre de Bruxelles), Gentiane Haesbroeck (Université de Liège) et Anne Ruiz-Gazen (Université de Toulouse Capitole), réunis à l’occasion des 15e Journées d’étude en statistique organisées par la SFdS. Le lecteur y trouvera une synthèse des fondements méthodologiques et des travaux récents de la méthodologie statistique robuste, ainsi que des applications dans des domaines variés.
1. La médiane et ses petits frères : une croissance difficile, malgré leur robustesse. 2. Mesures de robustesse. 3. Analyse multivariée. 4. Analyse en composantes principales robuste application à la problématique des classements d’universités. 5. Classification robuste. 6. Régression linéaire robuste. 7. Le modèle linéaire généralisée (GLM) robuste. 8. Régularisation robuste de matrices de variances-covariances. 9. Mesures d’influence et robustesse en sondages. 10. Détection graphique de valeurs atypiques pour données dépendantes. Bibliographie.