Les index composites sont utilisés dans les domaines sociaux et environnementaux pour représenter des informations complexes à partir de plusieurs indicateurs, sous la forme d’une seule métrique qui peut mesurer les progrès réalisés par rapport à un objectif et faciliter la prise de décision. L’outil Calculer un indice composite prend en charge les trois étapes principales du processus de création de l’indice : normaliser les variables en entrée sur une échelle commune (prétraitement), combiner les variables en une seule variable d’indice unique (combinaison) et mettre à l’échelle l’indice généré selon des valeurs significatives (post-traitement).
Concevoir un indice
La création d’un indice pertinent suppose de bien réfléchir à la question à laquelle l’indice tente de répondre, au choix des variables et aux méthodes appliquées. Les spécialistes du domaine et les utilisateurs finaux devraient prendre part à cette réflexion.
Tenez compte des points suivants pour la conception de l’indice :
- Choix d’organiser ou non les variables en sous-indices. Le concept selon lequel l’indice mesure un phénomène peut être représenté par plusieurs dimensions. Par exemple, un indice de vulnérabilité peut englober les domaines du logement, des transports et du revenu, comprenant chacun plusieurs variables. Vous pouvez constituer des sous-indices afin de représenter chaque dimension en exécutant l’outil à plusieurs reprises. Cela peut simplifier l’interprétation et, selon les méthodes utilisées, modifier également les résultats de l’indice.
- Mode de sélection des variables. Il est recommandé de réduire le nombre de variables en entrée, mais d’en conserver un nombre suffisant pour capturer les informations essentielles nécessaires à l’indice. Un nombre élevé de variables en entrée peut poser des problèmes d’interprétation de l’indice. En outre, si plusieurs variables relèvent du même domaine (revenu médian et pauvreté, par exemple), l’influence de ce domaine peut être surreprésentée dans l’indice. Si cette influence est indépendante de votre volonté, elle est appelée pondération non intentionnelle.
Définir les pondérations des variables
Les variables sont pondérées pour représenter l’importance relative de chaque facteur contribuant à l’indice. Par défaut, toutes les pondérations sont fixées à 1, ce qui signifie que chaque variable est pondérée de manière égale. Toutefois, il peut être important de représenter la différence de contribution relative d’une variable par rapport aux autres. En faisant passer la pondération de l’une des variables à 2 et en laissant les autres à 1, vous indiquez que cette variable doit être considérée comme deux fois plus importante que les autres eu égard à sa contribution à l’indice final.
Vous pouvez également cumuler les pondérations pour obtenir un total égal à 1. Si, par exemple, trois variables sont utilisées et que l’une doit être considérée comme deux fois plus importante, vous pouvez appliquer des valeurs de pondération de 0,5, 0,25, et 0,25.
Si les variables sont combinées en calculant leur moyenne, les pondérations sont appliquées en multipliant chaque variable par sa pondération respective. Si les variables sont combinées en calculant leur moyenne géométrique, les pondérations s’appliquent en élevant chaque variable à la puissance de sa pondération respective.
Les pondérations sont déterminantes pour l’indice obtenu. Que vous choisissiez de garder des pondérations égales ou de les modifier afin de favoriser des variables, l’utilisation de pondérations ajoute de la subjectivité à l’analyse. Par ailleurs, vous pouvez sans le vouloir effectuer une pondération du fait de la corrélation et des différences de variance entre les variables.
En savoir plus sur l’impact de la corrélation et de la variance sur l’indice
Prétraiter les variables
Pour créer un indice utile, les variables doivent avoir une échelle compatible. Pour cela, l’outil propose des options de prétraitement qui dotent les différentes variables en entrée d’une échelle de mesure commune afin d’assurer la cohérence de la combinaison. Vous pouvez également inverser les variables de sorte que la signification des valeurs élevées soit la même dans toutes les variables.
Prétraiter les variables pour en inverser le sens
Réfléchissez à la signification des valeurs faibles et élevées dans chaque variable et assurez-vous qu’il existe une cohérence entre elles. Par exemple, dans un indice de vulnérabilité sociale, la vulnérabilité dans les localités où les revenus moyens sont faibles est plus élevée que dans les localités où la proportion de personnes non assurées est faible ; ces variables ont un sens opposé dans le contexte de l’objectif de l’indice.
L’inverse de la variable est calculé en multipliant chaque valeur par -1 et en mettant à l’échelle le champ situé dans la plage initiale de la variable.
Prétraiter les variables pour utiliser la même échelle
L’option comporte plusieurs options visant à mettre à l’échelle les variables à l’aide du paramètre Method to scale and combine variables (Méthode de mise à l’échelle et de combinaison des variables). Les options Combine values (Mean of scaled values) (Combiner les valeurs [moyenne des valeurs mises à l’échelle]) et Compound differences (Geometric mean of scaled values) (Différences composites [moyenne géométrique des valeurs mises à l’échelle]) procèdent à la mise à l’échelle à l’aide des valeurs minimum-maximum. L’option Combine ranks (Mean of percentiles) (Combiner les classements [moyenne des centiles]) procède à la mise à l’échelle à l’aide des centiles. L’option Highlight extremes (Count of values above 90th percentile) (Mettre en évidence les extrêmes [nombre de valeurs au-dessus du 90e centile]) procède à la mise à l’échelle à l’aide des valeurs binaires. L’option sélectionnée s’applique à toutes les variables, et les champs mis à l’échelle qui en résultent sont fournis dans la sortie. Les options disponibles sont les suivantes :
Minimum-maximum : cette option met à l’échelle les variables entre 0 et 1 en utilisant les valeurs minimale et maximale de chaque variable. Il s’agit de la méthode la plus simple dans la mesure où elle préserve la distribution des variables en entrée et applique une échelle de 0 à 1 facile à interpréter.
Cette méthode applique la formule suivante :
Sachant que cette méthode préserve la distribution des variables, elle peut être affectée par les distributions asymétriques et les points aberrants. Par exemple, s’il existe un seul point aberrant avec une valeur très élevée, il lui sera attribué la valeur 1, mais les autres valeurs seront similaires et plus proches de zéro. Du fait de la variation réduite de la variable prétraitée, il se peut qu’elle ait moins d’influence sur l’indice obtenu.
Par ailleurs, sachant que cette méthode dépend des valeurs minimales et maximales des données en entrée, elle est moins indiquée pour les comparaisons d’indice sur plusieurs périodes et lorsque les valeurs minimale et maximale d’une variable sont susceptibles de varier à chaque intervalle temporel.
Percentile (Centile) : les variables sont converties en centiles compris entre 0 et 1. Cette méthode peut être utile lorsque les classements de chaque variable sont plus importants que leurs valeurs effectives. De même, elle se montre tolérante vis-à-vis des points aberrants et des distributions asymétriques, car les variables sont transformées en distribution uniforme.
Il existe diverses définitions pour les centiles. Cette méthode utilise la formule suivante :
,
où R est le classement ordinal (valeur minimale de classement utilisée en cas d’égalités), N est le nombre de valeurs et P est le centile obtenu.
Les centiles indiquent la position d’une valeur par rapport aux autres valeurs au sein de la variable. Par exemple, même si entre 50 000 euros et 60 000 euros, il n’y a pas en soi une différence de revenu considérable, la différence en centiles peut être importante s’il existe un grand nombre d’entités avec des valeurs dans cette plage.
Flag by threshold (binary) (Marquer par seuil [binaire]) : la variable est convertie en valeurs binaires (0, 1), ce qui indique que la valeur est supérieure ou inférieure à un seuil spécifié. Cette méthode est utile lorsqu’il est important de mettre en évidence certaines valeurs et que la variation des valeurs n’a pas d’importance.
Cette méthode n’est pas affectée par les points aberrants dans les variables en entrée, mais les informations d’intervalle dans chaque variable en entrée sont perdues, car chaque variable est convertie dans une forme binaire (0, 1).
- Raw (Brut) : les valeurs initiales des variables sont utilisées. Cette méthode ne doit être utilisée que si toutes les variables se trouvent sur une échelle comparable. Par exemple, utilisez cette méthode lorsque toutes les variables sont exprimées dans une unité standard comme les pourcentages ou les parties par million. Cette méthode peut aussi être intéressante si une normalisation ou une transformation de variables a déjà été effectuée.
Combiner les variables
Une fois que les variables ont été prétraitées sur une échelle commune, elles sont agrégées pour créer une valeur unique. L’option Combine scaled values (Mean of scaled values) (Combiner les valeurs mises à l’échelle [moyenne des valeurs mises à l’échelle]) du paramètre Method to scale and combine variables (Méthode de mise à l’échelle et de combinaison des variables) procèdent à l’agrégation à l’aide de la moyenne. La méthode Compound scaled values (Geometric mean of scaled values) (Valeurs mises à l’échelle composites [moyenne géométrique des valeurs mises à l’échelle]) procède à l’agrégation à l’aide de la moyenne géométrique. L’option Highlight extremes (Count of values above 90th percentile) (Mettre en évidence les extrêmes [nombre de valeurs au-dessus du 90e centile]) procède à l’agrégation à l’aide de la somme.
Sum (Somme) et Mean (Moyenne) sont des méthodes additives. Geometric mean (Moyenne géométrique) représente une méthode multiplicative.
Méthodes additives
Les méthodes de combinaison Sum (Somme) et Mean (Moyenne) sont relativement simples à interpréter et sont couramment utilisées par divers indices. Les méthodes sont presque identiques ; les distributions qui en résultent se présentent sous la même forme, seule l’échelle est différente. Par conséquent, la carte d’index obtenue présente le même aspect. Seules les valeurs diffèrent.
Ces méthodes autorisent les valeurs élevées dans une variable pour compenser les valeurs faibles d’une autre variable.
Méthodes multiplicatives
Les méthodes multiplicatives ont l’avantage de ne pas autoriser les valeurs élevées dans une variable pour compenser les valeurs faibles d’une autre variable ; une valeur d’indice élevée n’est possible que s’il existe plusieurs variables avec des valeurs élevées.
La moyenne géométrique est analogue à la multiplication. Un indice utilisant la moyenne géométrique aboutit à la même carte qu’un indice recourant à la multiplication pour combiner les variables, car la distribution a la même forme. Seules les valeurs diffèrent.
Post-traiter l’indice
Une fois que les variables ont été prétraitées et combinées dans l’indice brut, le post-traitement peut contribuer à rendre l’indice plus compréhensible.
Inverser l’indice
Tenez compte de l’objectif de l’indice et déterminez si les valeurs élevées de l’indice sont telles que prévu. Avec l’inversion de l’indice, les valeurs élevées de l’indice brut deviennent les valeurs faibles dans l’indice final et vice versa.
Mettre à l’échelle l’indice à l’aide des valeurs minimales et maximales
Grâce aux valeurs minimale et maximale, mettez l’indice à l’échelle pour modifier la plage de l’indice en sortie. Cette option est sans doute la plus facile à interpréter, quelles que soient les méthodes de prétraitement et combinaison utilisées. Par exemple, spécifiez une valeur Minimum de 0 et une valeur Maximum de 100 pour mettre l’indice brut à l’échelle de cette plage. Cette utilise la formule suivante :
où x désigne la valeur initiale, min(x) la valeur minimale se trouvant dans l’indice, max(x) la valeur maximale se trouvant dans l’indice, a la valeur minimale spécifiée, b la valeur maximale spécifiée et x’ la valeur mise à l’échelle.
Interpréter les résultats
La couche de l’indice affiche la distribution des valeurs de l’indice après une opération facultative de mise à l’échelle ou d’inversion. La couche fournit une carte choroplèthe continue qui permet d’évaluer les résultats de l’indice. Vous pouvez utiliser la carte pour évaluer les valeurs élevées et basses en préservant la distribution de l’indice et les éventuels point aberrants.
La couche inclut également les champs suivants que vous pouvez utiliser pour explorer les résultats :
- Un champ de centile qui indique les positions relatives (classements) entre les valeurs d’indice. Utilisez ce champ pour découvrir comment les localisations se situent les unes par rapport aux autres en fonction de leur classement plutôt que de leurs différences d’indice.
- Champ où l’indice est classé en fonction de cinq classes d’intervalle égal.
- Champ où l’indice est classé en fonction de cinq classes de quantile.
- Champ où l’indice est classé en fonction de six classes d’écart type. Utilisez ce champ pour découvrir comment la valeur d’indice de chaque localisation se situe par rapport à la valeur d’indice moyenne et pour identifier les localisations dont les valeurs d’indice sont extrêmement élevées ou extrêmement faibles.
Ressources supplémentaires
Pour de plus amples informations, consultez le manuel intitulé Handbook on Constructing Composite Indicators: Methodology and User Guide publié par l’Organisation de coopération et de développement économiques (OCDE).
Vous avez un commentaire à formuler concernant cette rubrique ?