***
Une **régression** est une famille de méthodes statistiques qui servent à **décrire et quantifier la relation entre une variable et une ou plusieurs autres**, et à **prédire** la valeur de cette variable à partir des autres.
## Idée de base
- On distingue :
- une **[[variable dépendante]]** (ou expliquée, notée souvent Y) : ce que l’on veut comprendre ou prédire (par ex. niveau de participation politique) ;
- une ou plusieurs **[[variable indépendante|variables explicatives]]** (ou indépendantes, notées X1,X2,…) : les facteurs supposés influencer Y (par ex. âge, niveau d’études, revenu, intérêt pour [[la politique]]).
- La régression cherche une **relation systématique** entre Y et les X (par exemple une droite en régression linéaire) et mesure :
- dans quel **sens** va l’effet (positif/négatif) ;
- quelle est sa **force** (taille de l’effet) ;
- quelle part de la **variabilité** de Y est expliquée par le modèle (par ex. R2 en régression linéaire).
## Ce que permet une régression
- **Décrire** : “Toutes choses égales par ailleurs, les individus plus diplômés ont en moyenne un score de participation politique plus élevé que les moins diplômés.”
- **Prédire** : “Étant donné tel âge, tel niveau d’études, tel revenu, le modèle prévoit un niveau de participation attendu de X.”
- **Tester** : “L’effet de l’âge reste-t-il [[significatif]] si on contrôle pour le niveau d’études et le [[genre]] ?”
En pratique, en sciences sociales, tu verras surtout :
- **régression linéaire** (variable dépendante quantitative, ex. score, revenu) ;
- **régression logistique** (variable dépendante binaire, ex. a voté / n’a pas voté) ;
- et leurs variantes (multiniveau, multinomiale, etc.).
## Notes de bas de page
``` dataview
TABLE length(file.outlinks) AS "Liens sortants", length(file.inlinks) AS "Liens entrants"
WHERE file.path = this.file.path
```