Données manquantes
Auteurs : GÉGOUT-PETIT Anne , MAUMY-BERTRAND Myriam , SAPORTA Gilbert , THOMAS-AGNAN Christine
ISBN : 9782710811954
broché 16 x 24 cm 286 pages
Date de publication : Juin 2022
Il n’y a pas de données sans données manquantes ! Les inconvénients en sont connus : biais éventuels et difficultés d’utiliser des méthodes conçues pour des données complètes. Il est indispensable de comprendre les mécanismes qui peuvent conduire à l’absence totale ou partielle de valeurs dans des échantillons. Des variables peuvent manquer en totalité parce qu’elles n’ont pu être observées ou qu’elles sont inobservables comme des variables latentes. Les données censurées constituent une espèce particulière de données manquantes.
De nombreuses solutions ont été proposées pour remplacer des valeurs manquantes par des valeurs plausibles : imputations simples ou multiples, avec ou sans modèle. On peut aussi utiliser des méthodes qui s’accommodent d’une proportion raisonnable de données manquantes.
Depuis la première édition du célèbre ouvrage de Little et Rubin en 1987, des milliers d’articles ont été publiés et des développements logiciels ont foisonné.
Le lecteur trouvera ici une synthèse des fondements et des travaux les plus récents dans le domaine du traitement des données manquantes, avec des applications dans des domaines variés.
Cet ouvrage est le fruit de la collaboration entre spécialistes réputés venant de divers horizons : Vincent Audigier (Conservatoire national des arts et métiers), David Haziza (University of Ottawa), François Husson (Institut Agro Rennes-Angers), Matthieu Marbac (ENSAI), Aurélie Vanheuverzwyn (Médiamétrie) réunis à l’occasion des 19es Journées d’étude en statistique organisées par la SFdS.
Table des matières :
1. Une histoire lacunaire. 2. Introduction à une étude statistique avec données manquantes. 3. Méthodes basées sur la vraisemblance pour données manquantes avec mécanisme ignorable. 4. Méthodes de pondération pour données manquantes. 5. Gestion de données manquantes en et par analyse en composantes principales. 6. Gestion de données manquantes en et par analyse des correspondances multiples ou analyse factorielle de données mixtes. 7. Gestion des données manquantes par imputation multiple. 8. Imputation multiple en grande dimension par analyse factorielle. 9. Non-réponses et enquêtes. 10. Fusion de fichiers d’enquêtes. 11. Algorithmes de recommandation. Bibliographie. Index des noms propres. Index