Formation : R avancé, Manipulations de données et Analyses statistiques

Objectifs :

À l’issue de la formation, les participants seront capables de :

Maîtriser le tidyverse de manière approfondie (dplyr, tidyr).
Gérer des jeux de données complexes (jointures, reshaping, imputation, pipelines).
Optimiser la performance des scripts (vectorisation, data.table, bonnes pratiques).

Écrire des fonctions efficaces et réutilisables.
Comprendre les environnements, closures, purrr et la programmation fonctionnelle.
Structurer un projet complet en R et produire un code reproductible.

Réaliser des analyses inférentielles avancées (tests, régressions multivariées).
Évaluer et interpréter des modèles statistiques.
Produire des graphiques avancés avec ggplot2.

Générer des rapports dynamiques avec R Markdown.
Automatiser des analyses répétitives.

Profils des participants

Prérequis

Profils des participants

Prérequis

Format : présentiel ou à distance

Durée : 3 jours

Prix : 1 650 € HT

Programme

1-Rappels et mise à niveau

Les bonnes pratiques d’organisation de projets.
Notions clés : pipes (|> et %>%), tidyverse, tibble.
Astuces d’efficacité et de vectorisation.

2-Dplyr avancé

Jointures complexes (left_join, right_join, full_join, semi-join…).
Manipulations multi-tables.
across() et programmation sur colonnes.
Gestion des données manquantes.
Manipulations groupées complexes (nested data, group_modify).

Atelier pratique :

Traitement d’un jeu de données multi-sources + nettoyage complet.

3-Tidyr avancé

Pivot longer / pivot wider (cas complexes).
Tables imbriquées (nest / unnest).
Reshaping pour analyses multivariées.
Gestion des formats irréguliers.

Atelier pratique :

Refonte de tables pour analyses statistiques.

4-Introduction à data.table

Syntaxe de base.
Fusion rapide de tables (joins).
Pourquoi et quand l’utiliser.

Atelier pratique :

Accélérer des manipulations de données lourdes.

5-Programmation fonctionnelle

Fonctions avancées (arguments, return, dots).
Gestion des environnements et closures.
Purrr : map(), map_df(), imap(), walk().
Automatisation d’analyses répétitives.

Atelier pratique :

Construire une pipeline complète automatisée.

6-Modélisation statistique

Régression linéaire multiple : interprétation, diagnostics, colinéarité.
Modèles généralisés (GLM) : logit, Poisson, binomial.
Sélection de modèles (AIC, BIC, stepwise).
ANOVA et ANCOVA avancées.
Tests statistiques multiples (false discovery rate).

Atelier pratique :

Construire, comparer et interpréter trois modèles statistiques.

7-Résumés automatiques avec broom

tidy(), glance(), augment().
Intégration dans un pipeline d’analyse.
Création de résumés statistiques propres et présentables.

Atelier pratique :

Résumer automatiquement plusieurs modèles et les comparer.

8-ggplot2 avancé

Grammaire graphique avancée.
Facettes, thèmes personnalisés, annotations.
Graphiques complexes :
- heatmaps
- boxplots groupés
- ridgelines
- network plots (selon niveaux)
Gestion des couleurs, palettes, scales.

Atelier pratique :

Réalisation d’un tableau de bord graphique avec ggplot2.

9-R Markdown et reporting dynamique

Structure d’un document Rmd.
Générer automatiquement :
- rapports PDF, HTML
- tableaux dynamiques
- graphiques intégrés
Paramétrage de documents (YAML header).
Automatisation d’un rapport périodique.

Atelier pratique :

Produire un rapport complet intégrant analyses + graphiques.

10-Projet final

Sur un jeu de données fourni, les participants devront :

Nettoyer et transformer les données.
Construire plusieurs modèles statistiques pertinents.
Réaliser des visualisations avancées.
Produire un rapport automatisé R Markdown.

Livrables et documentations fournis :

Jeux de données
Scripts R modèles
Documentations tidyverse, data.table et ggplot2
Rapport R Markdown d’exemple
Support de formation
Attestation de formation

R avancé, Manipulations de données et Analyses statistiques

Formation : R avancé, Manipulations de données et Analyses statistiques

Objectifs :

Format : présentiel ou à distance

Durée : 3 jours

Prix : 1 650 € HT

Programme

Atelier pratique :

Atelier pratique :

Atelier pratique :

Atelier pratique :

Atelier pratique :

Atelier pratique :

Atelier pratique :

Atelier pratique :

Livrables et documentations fournis :

Articles récents