Statistiques et analyse de données avec R
Authors : DU JARDIN Philippe , QUATREHOMME Gérald
ISBN : 9782710812005
trade paperback 17 x 24 cm 604 pages
Publication date : February 2025

Guide d’initiation à l’analyse des données (data mining), ce manuel présente les statistiques descriptives et explore un large éventail de techniques permettant de réaliser des comparaisons, des régressions ou des classifications à l’aide du logiciel R, en se reposant systématiquement sur des exemples pratiques facilement reproductibles. Il met également l’accent sur les conditions d’utilisation des différents tests et modélisations statistiques, un aspect primordial très souvent négligé par les utilisateurs.
Destiné à un large public, cet ouvrage s’adresse aux chercheurs, praticiens et étudiants de nombreuses disciplines : médecine, biologie, anthropologie, économie, finance, marketing, psychologie, sociologie, démographie, et bien d’autres encore.
Contents :
Le CHAPITRE 1 définit en introduction la notion de variables qualitatives et quantitatives, ainsi que les data frames.
Le CHAPITRE 2 s’intéresse aux comparaisons des proportions et des moyennes, avec un regard sur les petits échantillons et les échantillons appariés, si fréquents en pratique.
Le CHAPITRE 3 est consacré aux répétitions. La répétition des mesures nous amène à un chapitre fondamental, celui des essais inter-observateurs et intra-observateurs (Kappa, Anova pour mesures répétées, ICC).
Le CHAPITRE 4 traite de la corrélation (matrice de corrélation, coefficients de corrélation, corrélation et causalité).
Le CHAPITRE 5 étudie les régressions : la régression linéaire, la régression polynomiale et ses degrés.
Le CHAPITRE 6 aborde de nombreuses méthodes de classification : régression logistique, régressions régularisées, analyse discriminante, arbres décisionnels, machines à vecteurs supports, classifieur naïf de Bayes, méthode des K-means, K-medoid, méthode des plus proches voisins, méthodes hiérarchiques, bagging, boosting, random forest.

