1 Introduction

Les tables sont un outil puissant pour visualiser les données de manière claire et concise. Avec R et le package gt, nous pouvons exploiter l’attrait visuel des tables pour communiquer efficacement des informations clés. Dans cette leçon, nous apprendrons comment construire des tables esthétiquement agréables et personnalisables qui soutiennent les objectifs d’analyse de données.

Objectifs d’apprentissage

Utiliser la fonction gt() pour créer des tables basiques
Regrouper les colonnes sous des en-têtes spanner
Renommer les noms des colonnes
Ajouter des lignes récapitulatives pour les groupes

À la fin, vous serez capable de générer des tables polies et reproductibles comme celle-ci :

Tableau récapitulatif exemple

2 Packages

Nous utiliserons ces packages :

{gt} pour créer des tables
{tidyverse} pour la manipulation des données
{here} pour les chemins de fichiers

# Charger les packages
pacman::p_load(tidyverse, gt, here)

3 Présentation du jeu de données

Nos données proviennent du ** Programme VIH du Malawi ** et couvrent les soins prénataux et le traitement du VIH en 2019. Nous nous concentrerons sur les agrégats régionaux et au niveau des installations par trimestre (disponibles ici).

# Importer les données
hiv_malawi <- read_csv(here::here("data/clean/hiv_malawi.csv"))

Explorons les variables :

# Les 6 premières lignes
head(hiv_malawi)

## # A tibble: 6 × 29
##   region          zone          district traditional_autho…¹
##   <chr>           <chr>         <chr>    <chr>              
## 1 Northern Region Northern Zone Chitipa  Senior TA Bulambya…
## 2 Northern Region Northern Zone Chitipa  Senior TA Bulambya…
## 3 Northern Region Northern Zone Chitipa  Senior TA Bulambya…
## 4 Northern Region Northern Zone Chitipa  Senior TA Bulambya…
## 5 Northern Region Northern Zone Chitipa  Senior TA Bulambya…
## 6 Northern Region Northern Zone Chitipa  Senior TA Bulambya…
## # ℹ abbreviated name: ¹traditional_authority
## # ℹ 25 more variables: facility_name <chr>, …

# Les noms et les types de variables
glimpse(hiv_malawi)

## Rows: 17,235
## Columns: 29
## $ region                                 <chr> "Northern R…
## $ zone                                   <chr> "Northern Z…
## $ district                               <chr> "Chitipa", …
## $ traditional_authority                  <chr> "Senior TA …
## $ facility_name                          <chr> "Kapenda He…
## $ datim_code                             <chr> "K9u9BIAaJJ…
## $ system                                 <chr> "e-masterca…
## $ hsector                                <chr> "Public", "…
## $ period                                 <chr> "2019 Q1", …
## $ reporting_period                       <chr> "1st month …
## $ sub_groups                             <chr> "All patien…
## $ new_women_registered                   <dbl> 45, NA, 40,…
## $ total_women_in_booking_cohort          <dbl> NA, 55, NA,…
## $ not_tested_for_syphilis                <dbl> NA, 45, NA,…
## $ syphilis_negative                      <dbl> NA, 10, NA,…
## $ syphilis_positive                      <dbl> NA, 0, NA, …
## $ hiv_status_not_ascertained             <dbl> 4, 7, 9, 4,…
## $ previous_negative                      <dbl> 0, 0, 0, 0,…
## $ previous_positive                      <dbl> 0, 0, 0, 1,…
## $ new_negative                           <dbl> 40, 47, 30,…
## $ new_positive                           <dbl> 1, 1, 1, 1,…
## $ not_on_cpt                             <dbl> NA, 0, NA, …
## $ on_cpt                                 <dbl> NA, 1, NA, …
## $ no_ar_vs                               <dbl> 0, 0, 0, 0,…
## $ already_on_art_when_starting_anc       <dbl> 0, 1, 0, 1,…
## $ started_art_at_0_27_weeks_of_pregnancy <dbl> 1, 0, 1, 1,…
## $ started_art_at_28_weeks_of_preg        <dbl> 0, 0, 0, 0,…
## $ no_ar_vs_dispensed_for_infant          <dbl> NA, 0, NA, …
## $ ar_vs_dispensed_for_infant             <dbl> NA, 1, NA, …

Les données couvrent les régions géographiques, les établissements de santé, les périodes de temps, les données démographiques des patients, les résultats des tests, les thérapies préventives, les médicaments antirétroviraux, et plus encore. Plus d’informations sur le jeu de données sont dans la section des annexes.

Les variables clés que nous examinerons sont :

previous_negative: Le nombre de patients qui ont visité l’établissement de santé au cours de ce trimestre et qui avaient auparavant des tests VIH négatifs.
previous_positive: Le nombre de patients (comme ci-dessus) avec des tests VIH positifs précédents.
new_negative: Le nombre de patients testant nouvellement négatif pour le VIH.
new_positive: Le nombre de patients testant nouvellement positif pour le VIH.

Dans cette leçon, nous allons agréger les données par trimestre et résumer les changements dans les résultats des tests VIH.

4 Création de tables simples avec `{gt}`

La flexibilité, l’efficacité et la puissance de {gt} en font un package redoutable pour la création de tables dans R. Nous explorerons certaines de ses principales caractéristiques dans cette leçon.

Le package {gt} contient un ensemble de fonctions qui prennent des données brutes en entrée et produisent une table joliment formatée pour une analyse et un rapport ultérieurs.

Pour utiliser efficacement le package {gt}, nous devons d’abord transformer nos données dans un format résumé approprié.

Dans le bloc de code ci-dessous, nous utilisons les fonctions de {dplyr} pour résumer les tests de VIH dans certains centres de dépistage du Malawi par trimestre. Nous regroupons d’abord les données par période, puis nous additionnons les cas sur plusieurs variables en utilisant across() :

# Variables à résumer
cols <- c("new_positive", "previous_positive", "new_negative", "previous_negative")

# Créer un résumé par trimestre
hiv_malawi_summary <- hiv_malawi %>%  
  group_by(period) %>%
  summarize(
    across(all_of(cols), sum) # Résumer toutes les colonnes
  )

hiv_malawi_summary

## # A tibble: 4 × 5
##   period  new_positive previous_positive new_negative
##   <chr>          <dbl>             <dbl>        <dbl>
## 1 2019 Q1         6199             14816       284694
## 2 2019 Q2         6132             15101       282249
## 3 2019 Q3         5907             15799       300529
## 4 2019 Q4         5646             15700       291622
## # ℹ 1 more variable: previous_negative <dbl>

Ceci agrège les données de manière appropriée pour les passer à {gt} afin de générer un tableau résumé propre.

Pour créer une table simple à partir des données agrégées, nous pouvons ensuite appeler la fonction gt() :

hiv_malawi_summary %>%  
  gt()

period	new_positive	previous_positive	new_negative	previous_negative
2019 Q1	6199	14816	284694	6595
2019 Q2	6132	15101	282249	5605
2019 Q3	5907	15799	300529	6491
2019 Q4	5646	15700	291622	6293

Comme vous pouvez le voir, le formatage de table par défaut est assez simple et non raffiné. Cependant, {gt} offre de nombreuses options pour personnaliser et embellir la sortie de table. Nous approfondirons ces aspects dans la prochaine section.

Voici la traduction en français du fragment de tutoriel Rmd, en gardant la syntaxe Rmd et le code valide :

5 Personnalisation des tableaux `{gt}`

Le package {gt} permet une personnalisation complète des tableaux grâce à son cadre de « grammaire des tableaux ». C’est similaire à la façon dont la grammaire graphique de {ggplot2} fonctionne pour les graphiques.

Pour tirer pleinement parti de {gt}, il est utile de comprendre certains éléments clés de sa grammaire.

Comme on le voit dans la figure du site du package, les principaux composants d’un tableau {gt} sont :

En-tête du tableau: Contient un titre et un sous-titre facultatifs
Colonne d’étiquette: Étiquettes de lignes qui identifient chaque ligne
En-tête de colonne d’étiquette: Regroupement et étiquettes facultatifs pour les lignes de colonne d’étiquette
Étiquettes de colonne: En-têtes pour chaque colonne
Corps du tableau: Les principales cellules de données du tableau
Pied de tableau: Notes de bas de page et notes de source facultatives

Comprendre cette anatomie nous permet de construire systématiquement des tableaux {gt} en utilisant sa grammaire.

5.1 En-tête et pied de tableau

Le tableau de base que nous avions peut maintenant être mis à jour avec plus de composants.

Les tableaux deviennent plus informatifs et professionnels avec l’ajout d’en-têtes, de notes de source et de notes de bas de page. Nous pouvons facilement améliorer le tableau de base d’avant en ajoutant ces éléments à l’aide des fonctions {gt}.

Pour créer un en-tête, nous utilisons tab_header() et spécifions un title et subtitle. Cela donne au lecteur le contexte de ce que montre le tableau.

hiv_malawi_summary %>%
  gt() %>%
  tab_header(
    title = "Dépistage du VIH au Malawi",
    subtitle = "T1 à T4 2019"
  )

period	new_positive	previous_positive	new_negative	previous_negative
Dépistage du VIH au Malawi
T1 à T4 2019
2019 Q1	6199	14816	284694	6595
2019 Q2	6132	15101	282249	5605
2019 Q3	5907	15799	300529	6491
2019 Q4	5646	15700	291622	6293

Nous pouvons ajouter un pied de page avec la fonction tab_source_note() pour citer la provenance des données :

hiv_malawi_summary %>%
  gt() %>%
  tab_header(
    title = "Dépistage du VIH au Malawi",
    subtitle = "T1 à T4 2019"
  ) %>%
  tab_source_note("Source : Programme VIH du Malawi")

period	new_positive	previous_positive	new_negative	previous_negative
Dépistage du VIH au Malawi
T1 à T4 2019
2019 Q1	6199	14816	284694	6595
2019 Q2	6132	15101	282249	5605
2019 Q3	5907	15799	300529	6491
2019 Q4	5646	15700	291622	6293
Source : Programme VIH du Malawi

Les notes de bas de page sont utiles pour fournir des détails supplémentaires sur certains points de données ou étiquettes. La fonction tab_footnote() attache les notes de bas de page aux cellules de tableau indiquées. Par exemple, nous pouvons annoter les colonnes de diagnostic :

hiv_malawi_summary %>%
  gt() %>%
  tab_header(
    title = "Dépistage du VIH au Malawi",
    subtitle = "T1 à T2 2019"
  ) %>%
  tab_source_note("Source : Programme VIH du Malawi") %>%
  tab_footnote(
    footnote = "Nouveau diagnostic",
    locations = cells_column_labels(columns = c(new_positive, new_negative))
  )

period	new_positive¹	previous_positive	new_negative¹	previous_negative
Dépistage du VIH au Malawi
T1 à T2 2019
2019 Q1	6199	14816	284694	6595
2019 Q2	6132	15101	282249	5605
2019 Q3	5907	15799	300529	6491
2019 Q4	5646	15700	291622	6293
Source : Programme VIH du Malawi
¹ Nouveau diagnostic

Ces petits ajouts améliorent grandement l’apparence professionnelle et informative des tableaux.

5.2 Stub

Le stub est la section gauche d’un tableau contenant les étiquettes de ligne. Elles fournissent un contexte pour les données de chaque ligne.

Cette image montre le composant stub d’un tableau {gt}, marqué par un carré rouge.

Dans notre tableau de cas de VIH, la colonne period contient les étiquettes de ligne que nous voulons utiliser. Pour générer un stub, nous spécifions cette colonne dans gt() en utilisant l’argument rowname_col:

hiv_malawi_summary %>%
  gt(rowname_col = "period") %>%
  tab_header(
    title = "Dépistage du VIH au Malawi",
    subtitle = "T1 à T2 2019"  
  ) %>%
  tab_source_note("Source: Programme VIH du Malawi")

	new_positive	previous_positive	new_negative	previous_negative
Dépistage du VIH au Malawi
T1 à T2 2019
2019 Q1	6199	14816	284694	6595
2019 Q2	6132	15101	282249	5605
2019 Q3	5907	15799	300529	6491
2019 Q4	5646	15700	291622	6293
Source: Programme VIH du Malawi

Notez que le nom de la colonne passé à rowname_col doit être entre guillemets.

Pour plus de commodité, sauvegardons le tableau dans une variable t1:

t1 <- hiv_malawi_summary %>%
  gt(rowname_col = "period") %>%
  tab_header(
    title = "Dépistage du VIH au Malawi",
    subtitle = "T1 à T2 2019"
  ) %>% 
  tab_source_note("Source: Programme VIH du Malawi")

t1

	new_positive	previous_positive	new_negative	previous_negative
Dépistage du VIH au Malawi
T1 à T2 2019
2019 Q1	6199	14816	284694	6595
2019 Q2	6132	15101	282249	5605
2019 Q3	5907	15799	300529	6491
2019 Q4	5646	15700	291622	6293
Source: Programme VIH du Malawi

5.3 Colonnes Spanner & sous-colonnes

Pour mieux structurer notre tableau, nous pouvons regrouper des colonnes liées sous des “spanners”. Les spanners sont des titres qui couvrent plusieurs colonnes, fournissant une organisation catégorielle de niveau supérieur. Nous pouvons le faire avec la fonction tab_spanner().

Créons deux colonnes spanner pour les tests nouveaux et précédents. Nous commencerons par le spanner “Nouveaux tests” afin que vous puissiez observer la syntaxe :

t1 %>%  
  tab_spanner(
    label = "Nouveaux tests",
    columns = starts_with("new") # sélectionne les colonnes commençant par "new"
  )

	Nouveaux tests		previous_positive	previous_negative
Dépistage du VIH au Malawi
T1 à T2 2019
	new_positive	new_negative	previous_positive	previous_negative
2019 Q1	6199	284694	14816	6595
2019 Q2	6132	282249	15101	5605
2019 Q3	5907	300529	15799	6491
2019 Q4	5646	291622	15700	6293
Source: Programme VIH du Malawi

L’argument columns nous permet de sélectionner les colonnes pertinentes, et l’argument label prend en entrée l’étiquette du spanner.

Ajoutons maintenant les deux spanners :

# Enregistre le tableau dans t2 pour un accès facile  
t2 <- t1 %>%  
  # Premier spanner pour "Nouveaux tests"   
  tab_spanner(
    label = "Nouveaux tests",
    columns = starts_with("new") 
  ) %>%
  # Second spanner pour "Tests précédents"
  tab_spanner(
    label = "Tests précédents",
    columns = starts_with("prev")
  )

t2

	Nouveaux tests		Tests précédents
Dépistage du VIH au Malawi
T1 à T2 2019
	new_positive	new_negative	previous_positive	previous_negative
2019 Q1	6199	284694	14816	6595
2019 Q2	6132	282249	15101	5605
2019 Q3	5907	300529	15799	6491
2019 Q4	5646	291622	15700	6293
Source: Programme VIH du Malawi

Notez que la fonction tab_spanner a automatiquement réarrangé les colonnes de manière appropriée.

Question 1 : Le but des Spanners

Quel est le but de l’utilisation de “colonnes spanner” dans un tableau gt ?

A. Appliquer des styles CSS personnalisés à des colonnes spécifiques.

B. Créer des colonnes de groupe et augmenter la lisibilité.

C. Formater la taille de la police de toutes les colonnes de manière uniforme.

D. Trier les données par ordre croissant.

Question 2 : Création de Spanners

En utilisant le cadre de données hiv_malawi, créez un tableau gt qui affiche un résumé de la somme des cas “nouveaux_positifs” et “précédents_positifs” pour chaque région. Créez des en-têtes spanner pour étiqueter ces deux colonnes de résumé. Pour y parvenir, remplissez les parties manquantes du code ci-dessous :

region_summary <- hiv_malawi %>%
  group_by(region) %>%
  summarize(
    _________(
      c(nouveaux_positifs, précédents_positifs),
      ______
    )
  )

# Créer un tableau gt avec des en-têtes spanner
summary_table_spanners <- region_summary %>%
  _____________ %>%
  ___________(
    label = "Cas positifs",
    ________ = c(nouveaux_positifs, précédents_positifs)
  )

6 Renommage des colonnes du tableau

Les noms des colonnes contiennent actuellement des préfixes inutiles comme “new_” et “previous_”. Pour une meilleure lisibilité, nous pouvons les renommer en utilisant cols_label().

cols_label() prend un ensemble d’anciens noms à apparier (du côté gauche d’une tilde, ~) et de nouveaux noms pour les remplacer (du côté droit de la tilde). Nous pouvons utiliser contains() pour sélectionner des colonnes avec “positive” ou “negative” :

t3 <- t2 %>%
  cols_label(
    contains("positive") ~ "Positive", 
    contains("negative") ~ "Negative"
  )

t3

	Nouveaux tests		Tests précédents
Dépistage du VIH au Malawi
T1 à T2 2019
	Positive	Negative	Positive	Negative
2019 Q1	6199	284694	14816	6595
2019 Q2	6132	282249	15101	5605
2019 Q3	5907	300529	15799	6491
2019 Q4	5646	291622	15700	6293
Source: Programme VIH du Malawi

Ceci renomme les colonnes d’une manière plus propre.

cols_label() accepte plusieurs aides à la sélection de colonnes comme contains(), starts_with(), ends_with() etc. Celles-ci proviennent du package tidyselect et offrent une flexibilité dans le renommage.

cols_label() a d’autres fonctions d’identification comme contains() qui fonctionnent de manière similaire et sont identiques aux aides de tidyselect, celles-ci incluent également :

starts_with(): Commence par un préfixe exact.
ends_with(): Se termine par un suffixe exact.
contains(): Contient une chaîne de caractères littérale.
matches(): Correspond à une expression régulière.
num_range(): Correspond à une plage numérique comme x01, x02, x03.

Ces aides sont utiles, en particulier dans le cas de la sélection de plusieurs colonnes.

Pour en savoir plus sur la fonction cols_label(), vous pouvez consulter ici : https://gt.rstudio.com/reference/cols_label.html

Question 3 : étiquettes de colonnes

Quelle fonction est utilisée pour changer les étiquettes ou les noms des colonnes dans un tableau gt ?

A. `tab_header()`

B. `tab_style()`

C. `tab_options()`

D. `tab_relabel()`

7 Lignes de résumé

Prenons les mêmes données avec lesquelles nous avons commencé au début de cette leçon et, au lieu de regrouper uniquement par période (trimestres), regroupons à la fois par période et par région. Nous faisons cela pour illustrer la puissance des fonctionnalités de résumé dans gt : les tableaux récapitulatifs.

Rappel {gt} - Lignes de résumé Cette image montre le composant des lignes de résumé d’un tableau {gt}, clairement indiqué dans un carré rouge. Les lignes de résumé fournissent des données agrégées ou des résumés statistiques des données contenues dans les colonnes correspondantes.

Tout d’abord, recréons les données :

summary_data_2 <- hiv_malawi %>% 
  group_by(
    # Notez l'ordre des variables par lesquelles nous regroupons.
    region,
    period
  ) %>% 
  summarise(
    across(all_of(cols), sum) 
    ) %>% 
  gt()

## `summarise()` has grouped output by 'region'. You can override using the `.groups` argument.

summary_data_2

period	new_positive	previous_positive	new_negative	previous_negative
Central Region
2019 Q1	2004	3682	123018	2562
2019 Q2	1913	3603	116443	1839
2019 Q3	1916	4002	127799	2645
2019 Q4	1691	3754	124728	1052
Northern Region
2019 Q1	664	1197	36196	675
2019 Q2	582	1084	35315	590
2019 Q3	570	1191	36850	542
2019 Q4	519	1132	34322	346
Southern Region
2019 Q1	3531	9937	125480	3358
2019 Q2	3637	10414	130491	3176
2019 Q3	3421	10606	135880	3304
2019 Q4	3436	10814	132572	4895

L’ordre dans la fonction group_by() affecte les groupes de lignes dans le tableau gt.

Deuxièmement, réincorporons tous les changements que nous avons précédemment effectués dans ce tableau :

# sauvegardant les progrès dans l'objet t4

t4 <- summary_data_2 %>% 
  tab_header(
    title = "Somme des tests VIH au Malawi",
    subtitle = "du T1 2019 au T4 2019"
  ) %>% 
  tab_source_note("Source des données : Programme VIH du Malawi") %>% tab_spanner(
    label = "Nouveaux tests",
    columns = starts_with("new") # sélectionne les colonnes commençant par "new"
  ) %>% 
   # création du premier spanner pour les tests précédents
  tab_spanner(
    label = "Tests précédents",
    columns = starts_with("prev") # sélectionne les colonnes commençant par "prev"
  ) %>% 
  cols_label(
    # localiser ### assigner 
    contains("positive") ~ "Positif",
    contains("negative") ~ "Négatif"
  )

t4

period	Nouveaux tests		Tests précédents
Somme des tests VIH au Malawi
du T1 2019 au T4 2019
period	Positif	Négatif	Positif	Négatif
Central Region
2019 Q1	2004	123018	3682	2562
2019 Q2	1913	116443	3603	1839
2019 Q3	1916	127799	4002	2645
2019 Q4	1691	124728	3754	1052
Northern Region
2019 Q1	664	36196	1197	675
2019 Q2	582	35315	1084	590
2019 Q3	570	36850	1191	542
2019 Q4	519	34322	1132	346
Southern Region
2019 Q1	3531	125480	9937	3358
2019 Q2	3637	130491	10414	3176
2019 Q3	3421	135880	10606	3304
2019 Q4	3436	132572	10814	4895
Source des données : Programme VIH du Malawi

Maintenant, que faire si nous voulons visualiser sur le tableau un résumé de chaque variable pour chaque groupe de régions ? Plus précisément, nous voulons voir la somme et la moyenne pour les 4 colonnes que nous avons pour chaque région.

N’oubliez pas que nos 4 colonnes d’intérêt sont : “new_positive”, “previous_positive”, “new_negative”, et “previous_negative”. Nous n’avons changé les labels de ces colonnes que dans la table gt et non dans le jeu de données lui-même, nous pouvons donc utiliser les noms de ces colonnes pour indiquer à gt où appliquer la fonction de résumé. De plus, nous avons déjà stocké les noms de ces 4 colonnes dans l’objet cols donc nous allons l’utiliser à nouveau ici.

Pour atteindre cet objectif, nous allons utiliser la fonction pratique summary_rows où nous fournissons explicitement les colonnes que nous voulons résumer, et les fonctions avec lesquelles nous voulons résumer, dans notre cas c’est sum et mean. Notez que nous assignons le nom de la nouvelle ligne (non citée) à un nom de fonction (“cité”).

t5 <- t4 %>% 
  summary_rows(
    columns = cols, #using columns = 3:6 also works 
    fns = list( 
      TOTAL = "sum",
      MOYENNE = "mean"
    )
  )

t5

	period	Nouveaux tests		Tests précédents
Somme des tests VIH au Malawi
du T1 2019 au T4 2019
	period	Positif	Négatif	Positif	Négatif
Central Region
	2019 Q1	2004	123018	3682	2562
	2019 Q2	1913	116443	3603	1839
	2019 Q3	1916	127799	4002	2645
	2019 Q4	1691	124728	3754	1052
sum	—	7524.00	491988.00	15041.00	8098.00
mean	—	1881.00	122997.00	3760.25	2024.50
Northern Region
	2019 Q1	664	36196	1197	675
	2019 Q2	582	35315	1084	590
	2019 Q3	570	36850	1191	542
	2019 Q4	519	34322	1132	346
sum	—	2335.00	142683.00	4604.00	2153.00
mean	—	583.75	35670.75	1151.00	538.25
Southern Region
	2019 Q1	3531	125480	9937	3358
	2019 Q2	3637	130491	10414	3176
	2019 Q3	3421	135880	10606	3304
	2019 Q4	3436	132572	10814	4895
sum	—	14025.00	524423.00	41771.00	14733.00
mean	—	3506.25	131105.75	10442.75	3683.25
Source des données : Programme VIH du Malawi

Question 4 : lignes résumées

Quelle est la bonne réponse (ou les bonnes réponses) si vous deviez résumer l’écart type des lignes des colonnes “new_positive” et “previous_negative” uniquement?

A. Utilisez summary_rows() avec l’argument columns défini sur “new_positive” et “previous_negative” et l’argument fns défini sur “sd”.

# Option A 
your_data %>%   
  summary_rows(
    columns = c("new_positive", "previous_negative"),     
    fns = "sd" 
  )

B. Utilisez summary_rows() avec l’argument columns défini sur “new_positive” et “previous_negative” et l’argument fns défini sur “summarize(sd)”.

# Option B 
your_data %>%   
  summary_rows(
    columns = c("new_positive", "previous_negative"),     
    fns = summarize(sd) 
  )

C. Utilisez summary_rows() avec l’argument columns défini sur “new_positive” et “previous_negative” et l’argument fns défini sur list(ECART_TYPE = "sd").

# Option C 
your_data %>%   
  summary_rows(
    columns = c("new_positive", "previous_negative"),     
    fns = list(ECART_TYPE = "sd")   
  )

D. Utilisez summary_rows() avec l’argument columns défini sur “new_positive” et “previous_negative” et l’argument fns défini sur “standard_deviation”.

# Option D
your_data %>%
  summary_rows(
    columns = c("new_positive", "previous_negative"),
    fns = "standard_deviation"
  )

8 Conclusion

Dans la leçon d’aujourd’hui, nous nous sommes attaqués aux tables de données dans R en utilisant gt. Nous avons commencé par définir des objectifs clairs, présenté les packages que nous utiliserons et découvert notre jeu de données. Ensuite, nous avons mis la main à la pâte en créant des tables simples. Nous avons appris à organiser nos données proprement en utilisant des colonnes spanner et en ajustant les étiquettes des colonnes pour rendre les choses parfaitement claires et cohérentes. Nous avons ensuite conclu avec quelques résumés de table astucieux. Ce sont les bases de la création de tables dans R et gt, et elles seront très utiles à mesure que nous poursuivrons notre voyage pour créer des tableaux engageants et informatifs dans R.

Corrigé

# Les solutions sont où les lignes sont numérotées

# résumer les données d'abord
district_summary <- hiv_malawi %>%
  group_by(region) %>%
  summarize(
    across(  #1
      c(new_positive, previous_positive),
      sum #2
    )
  )

# Créer une table gt avec des en-têtes spanner
summary_table_spanners <- district_summary %>%
  gt() %>% #3
  tab_spanner( #4
    label = "Cas positifs",
    columns = c(new_positive, previous_positive) #5
  )

Contributeurs

Les membres de l’équipe suivants ont contribué à cette leçon :

BENNOUR HSIN
Data Science Education Officer
Data Visualization enthusiast

JOY VAZ
R Developer and Instructor, the GRAPH Network
Loves doing science and teaching science

GUY WAFEU
R Instructor and Public Health Physician
Committed to improving the quality of data analysis

Références

Tom Mock, “The Definite Cookbook of {gt}” (2021), The Mockup Blog, https://themockup.blog/static/resources/gt-cookbook.html#introduction.
Tom Mock, “The Grammar of Tables” (May 16, 2020), The Mockup Blog, https://themockup.blog/posts/2020-05-16-gt-a-grammar-of-tables/#add-titles.
RStudio, “Introduction to Creating gt Tables,” Official {gt} Documentation, https://gt.rstudio.com/articles/intro-creating-gt-tables.html.
Fleming, Jessica A., Alister Munthali, Bagrey Ngwira, John Kadzandira, Monica Jamili-Phiri, Justin R. Ortiz, Philipp Lambach, et al. 2019. “Maternal Immunization in Malawi: A Mixed Methods Study of Community Perceptions, Programmatic Considerations, and Recommendations for Future Planning.” Vaccine 37 (32): 4568–75. https://doi.org/10.1016/j.vaccine.2019.06.020.

This work is licensed under the Creative Commons Attribution Share Alike license.

Présentation des données de santé avec les tableaux gt dans R: Fondamentaux