Ressources

Programmation

Livres

Coder proprement
Un guide pour écrire du code clair, lisible et maintenable, adapté à tous les langages.
R for Data Science
Une introduction moderne et complète à la science des données avec R et le tidyverse.

Packages R

Package Utilité
readr Importation rapide de fichiers de données plats (CSV, TSV, etc.) avec gestion fine des types de colonnes.
stringr Manipulation des chaînes de caractères (recherche, extraction, transformation, etc.)
lubridate Manipulation des dates et heures (extraction de composantes, calculs de durées, arrondis temporels, etc.).
dplyr grammaire intuitive pour manipuler les tableaux de données (filtrage, tri, agrégation, jointures, etc.).
tidyr Transformation des données en formats long ou large, la séparation ou la fusion de colonnes, etc.
forcats Manipulation de facteurs de manière explicite et cohérente (recatégorisation, réordonnancement, etc.).
janitor nettoyage des données, notamment en standardisant les noms de colonnes et en identifiant les valeurs manquantes ou en double.
RColorBrewer Palettes de couleurs prêtes à l’emploi adaptées aux représentations graphiques, y compris pour la publication.
ggplot2 Création de visualisations complexes selon une grammaire cohérente des graphiques.

Dataviz

Data-to-Viz