Le tableau de contingence représente l’un des instruments les plus puissants pour analyser les relations entre deux caractéristiques observées. Cet outil statistique offre une visualisation claire des interactions entre variables, transformant les données brutes en décisions éclairées.
Qu’est-ce qu’un tableau de contingence ?
Le tableau de contingence organise et analyse les données issues de l’observation simultanée de deux variables qualitatives. Il permet de visualiser instantanément la relation entre deux informations en les croisant, par exemple le genre des clients et leur préférence produit.
Cette représentation prend la forme d’un tableau rectangulaire où chaque cellule contient le nombre d’observations correspondant à une combinaison particulière des modalités de vos deux variables.
Principe et fonctionnement du tableau croisé
Les modalités de la première variable s’organisent en lignes et celles de la seconde en colonnes. Chaque cellule révèle combien de personnes d’un profil donné présentent une caractéristique spécifique.
En croisant « tranche d’âge » avec « moyen de transport privilégié », vous identifiez rapidement les profils dominants et les associations inhabituelles. Le tableau transforme des données dispersées en un format structuré, permettant de repérer d’un seul coup d’œil les combinaisons les plus fréquentes.
Structure d’un tableau à double entrée
La structure suit une organisation rigoureuse :
- Les lignes accueillent les modalités de la première variable statistique
- Les colonnes reçoivent celles de la seconde variable
- Une ligne de totaux en bas du tableau
- Une colonne de totaux à droite
- Une cellule d’effectif total à l’intersection des totaux
Cette disposition crée naturellement une matrice dont chaque case représente une intersection significative. Les totaux marginaux fournissent des informations essentielles sur la distribution de chaque variable prise isolément.
Différence entre effectifs et fréquences
Les effectifs correspondent aux nombres bruts d’observations pour chaque combinaison de modalités. Ces valeurs absolues donnent une première lecture quantitative des données.
Les fréquences expriment ces informations sous forme de proportions ou de pourcentages, permettant de comparer des groupes de tailles différentes. On distingue :
- Les fréquences marginales : la proportion de chaque modalité dans l’échantillon
- Les fréquences conditionnelles : la proportion d’une modalité sachant qu’une autre modalité est réalisée
Comment construire un tableau de contingence ?
Définir les variables et modalités à croiser
Sélectionnez deux variables qualitatives qui répondent à une question de recherche précise. Il est impératif que ces catégories soient mutuellement exclusives : chaque observation n’appartient qu’à une seule modalité par variable.
Pour une variable « satisfaction client », les modalités pourraient être : Très insatisfait, Insatisfait, Neutre, Satisfait, Très satisfait. Vérifiez que les modalités couvrent l’ensemble du spectre possible.
Répartir les données selon les lignes et colonnes
Placez généralement la variable explicative en lignes et la variable à expliquer en colonnes. L’objectif reste de faciliter la lecture et l’interprétation des résultats.
Créez la structure vide en traçant autant de lignes et colonnes que nécessaire, puis ajoutez une ligne et une colonne supplémentaires pour les totaux marginaux. Nommez chaque ligne et colonne avec des intitulés courts mais explicites.
Calculer les effectifs conjoints et marginaux
Comptabilisez pour chaque cellule le nombre d’observations correspondant simultanément à la modalité de ligne et de colonne. Ce travail nécessite une attention particulière pour éviter les erreurs de saisie.

Les effectifs marginaux se calculent ensuite :
- Sommez les valeurs de chaque ligne pour obtenir les totaux marginaux en lignes
- Sommez les valeurs de chaque colonne pour obtenir les totaux marginaux en colonnes
Ajouter les totaux et distributions marginales
Complétez systématiquement le tableau avec une ligne et une colonne de totaux. Ces totaux marginaux jouent un rôle déterminant dans l’interprétation ultérieure des données.
La cellule à l’intersection contient l’effectif global, vérification essentielle de cohérence. Calculez les distributions marginales en pourcentage en divisant chaque total marginal par l’effectif global.
Interpréter les résultats d’un tableau de contingence
Analyser les profils en lignes et en colonnes
Les profils en lignes examinent comment se répartissent les modalités de la variable en colonnes pour chaque modalité en lignes. Cette approche révèle si la distribution d’une variable change selon les modalités de l’autre variable.
Les profils en colonnes fonctionnent dans l’autre direction, offrant une perspective complémentaire qui enrichit l’analyse.
Comprendre les fréquences relatives et conditionnelles
Les fréquences relatives représentent la proportion de chaque cellule par rapport à l’effectif total. Les fréquences conditionnelles expriment la probabilité d’observer une modalité sachant qu’une autre modalité est déjà réalisée.
Comparez ces fréquences conditionnelles aux fréquences marginales pour évaluer l’ampleur de l’association entre les variables. Un écart significatif indique que les variables ne sont probablement pas indépendantes.
Identifier les relations entre variables
Repérez les cellules où les effectifs sont nettement supérieurs ou inférieurs à ce que le hasard produirait. Ces écarts substantiels signalent les associations fortes entre modalités spécifiques.
Recherchez des tendances générales : une relation positive se manifeste par une concentration des effectifs sur certaines zones du tableau, tandis qu’une relation négative apparaît lorsque les effectifs importants se situent dans des zones opposées.
Le test du chi-deux appliqué aux tableaux croisés
Le test du chi-deux valide objectivement les intuitions concernant la dépendance entre deux variables qualitatives. Cette méthode permet d’établir des conclusions scientifiquement fondées.
Principe du test d’indépendance
Le principe repose sur une comparaison entre ce qui est observé et ce qui devrait être observé si les variables étaient indépendantes. Formulez deux hypothèses : l’hypothèse nulle postulant l’indépendance, et l’hypothèse alternative suggérant une dépendance.
Calculez un effectif théorique en multipliant les totaux marginaux de la ligne et de la colonne concernées, puis en divisant par l’effectif total. Ces effectifs théoriques servent de référence pour évaluer les écarts avec les effectifs observés.
Calculer la valeur du khi-deux
La statistique du khi-deux se calcule ainsi : χ² = Σ [(Effectif observé – Effectif théorique)² / Effectif théorique]. Plus cette valeur est élevée, plus les écarts sont importants.
Le nombre de degrés de liberté correspond à : ddl = (nombre de lignes – 1) × (nombre de colonnes – 1).
Interpréter la significativité statistique
Utilisez la valeur de khi-deux et les degrés de liberté pour déterminer la p-value. Une p-value faible indique qu’il serait très improbable d’observer de tels écarts par simple hasard.
Comparez cette p-value à un seuil de significativité, généralement 5 % (0,05) ou 1 % (0,01). Si la p-value est inférieure, la relation est statistiquement significative.
Valider ou rejeter l’hypothèse d’indépendance
Lorsque le test aboutit à un résultat significatif, rejetez l’hypothèse d’indépendance. Cette conclusion permet d’affirmer avec un niveau de confiance déterminé qu’il existe une relation entre les caractéristiques étudiées.
Si le test n’est pas significatif, vous ne pouvez pas affirmer qu’une dépendance existe. La significativité statistique n’équivaut pas nécessairement à une importance pratique : avec un échantillon très large, vous pouvez détecter des relations statistiquement significatives mais d’ampleur négligeable.
Ce guide pratique : Palettes de couleurs : de l’idée à l’efficacité, toutes les étapes
Créer un tableau de contingence avec Excel
La disponibilité d’Excel et son interface intuitive permettent de construire rapidement des tableaux fonctionnels sans maîtriser de langage de programmation.
Organiser les données brutes dans Excel
Structurez les données en format tabulaire : chaque ligne représente une observation individuelle et chaque colonne une variable. Assurez-vous que la première ligne contient les en-têtes clairement nommés.
Vérifiez la cohérence en détectant erreurs de saisie, valeurs aberrantes et cellules vides. Cette phase de nettoyage conditionne la fiabilité des analyses futures.
Utiliser les formules pour les calculs
Utilisez la fonction NB.SI.ENS pour compter le nombre de lignes répondant à plusieurs critères : =NB.SI.ENS(Plage_Variable1;Modalité_Ligne;Plage_Variable2;Modalité_Colonne).
Cette fonction automatise le comptage et évite les erreurs manuelles. Pour les totaux marginaux, employez la fonction SOMME. Cette approche garantit des mises à jour automatiques.
Appliquer une mise en forme conditionnelle
Appliquez un dégradé de couleurs sur les effectifs conjoints pour faire ressortir les cellules avec les valeurs élevées. Cette visualisation permet de repérer d’un coup d’œil les associations fortes.
Sélectionnez la plage contenant les effectifs conjoints et choisissez « Nuances de couleurs ». Privilégiez des dégradés doux pour faciliter la lecture.
Générer des graphiques adaptés
Le graphique en barres groupées permet de comparer visuellement les distributions. Ces visualisations rendent les profils immédiatement compréhensibles.

Les graphiques en secteurs empilés à 100 % constituent une option intéressante pour visualiser les profils en pourcentage.
Applications concrètes en études de marché
Les tableaux de contingence transforment des questionnaires clients en insights actionnables qui orientent les décisions stratégiques.
Segmenter les clients selon plusieurs critères
Croisez l’âge des clients avec leur fréquence d’achat pour identifier les profils rentables. Cette approche permet d’optimiser l’allocation des ressources commerciales en concentrant les efforts là où le retour sur investissement sera maximal.
Le croisement du canal d’acquisition avec le taux de fidélisation évalue la qualité de chaque point de contact.
Analyser les préférences de consommation
Croisez les caractéristiques démographiques avec les préférences produits pour identifier quels segments manifestent un intérêt pour certaines gammes. Ces informations guident directement le développement produit et le positionnement commercial.
Le croisement niveau de revenus et sensibilité au prix révèle des patterns parfois contre-intuitifs, affinant la compréhension du comportement d’achat.
Optimiser les campagnes marketing ciblées
Croisez le type de message marketing avec le taux de conversion pour identifier les combinaisons performantes. Cette analyse expérimentale transforme l’intuition créative en décisions factuelles.
L’analyse croisée des canaux marketing avec le panier moyen permet d’allouer intelligemment le budget publicitaire, maximisant le retour sur investissement de manière mesurable.
Limites et précautions d’utilisation
La maîtrise de ces contraintes distingue une analyse statistique rigoureuse d’une simple manipulation de chiffres.
Éviter les erreurs d’interprétation
Ne confondez pas effectifs absolus et fréquences relatives. Un effectif élevé peut simplement refléter des marges importantes plutôt qu’une association réelle. Calculez systématiquement les fréquences conditionnelles avant de conclure.
Lorsque plusieurs cellules contiennent moins de 5 observations, regroupez certaines modalités ou augmentez la taille de l’échantillon. Vérifiez toujours la significativité statistique avant de communiquer sur une relation observée.
Distinguer corrélation et causalité
Le tableau révèle des associations mais ne démontre jamais de lien de causalité. D’autres facteurs peuvent créer une association apparente entre deux variables qui ne sont pas directement liées.
Une variable confondante peut créer une relation trompeuse. Cette vigilance protège contre les décisions stratégiques basées sur de fausses causalités.





0 commentaires