*** Une **régression** est une famille de méthodes statistiques qui servent à **décrire et quantifier la relation entre une variable et une ou plusieurs autres**, et à **prédire** la valeur de cette variable à partir des autres. ## Idée de base - On distingue : - une **[[variable dépendante]]** (ou expliquée, notée souvent Y) : ce que l’on veut comprendre ou prédire (par ex. niveau de participation politique) ; - une ou plusieurs **[[variable indépendante|variables explicatives]]** (ou indépendantes, notées X1,X2,…) : les facteurs supposés influencer Y (par ex. âge, niveau d’études, revenu, intérêt pour [[la politique]]). - La régression cherche une **relation systématique** entre Y et les X (par exemple une droite en régression linéaire) et mesure : - dans quel **sens** va l’effet (positif/négatif) ; - quelle est sa **force** (taille de l’effet) ; - quelle part de la **variabilité** de Y est expliquée par le modèle (par ex. R2 en régression linéaire). ## Ce que permet une régression - **Décrire** : “Toutes choses égales par ailleurs, les individus plus diplômés ont en moyenne un score de participation politique plus élevé que les moins diplômés.” - **Prédire** : “Étant donné tel âge, tel niveau d’études, tel revenu, le modèle prévoit un niveau de participation attendu de X.” - **Tester** : “L’effet de l’âge reste-t-il [[significatif]] si on contrôle pour le niveau d’études et le [[genre]] ?” En pratique, en sciences sociales, tu verras surtout : - **régression linéaire** (variable dépendante quantitative, ex. score, revenu) ; - **régression logistique** (variable dépendante binaire, ex. a voté / n’a pas voté) ; - et leurs variantes (multiniveau, multinomiale, etc.). ## Notes de bas de page ``` dataview TABLE length(file.outlinks) AS "Liens sortants", length(file.inlinks) AS "Liens entrants" WHERE file.path = this.file.path ```