S11 - Martin

*** ``` dataview TABLE length(file.outlinks) AS "Liens sortants", length(file.inlinks) AS "Liens entrants" WHERE file.path = this.file.path ``` ## Concepts importants # Annotations (18/04/2026 11:31:46) ### S11 - martin « les relations, des dépendances ou les corrélations entre variables » « tableau croisé » « tableau indiquant la distribution des individus selon deux variables simultanément » montrer l'influence entre variables « dans quelle mesure tel phénomène ou caractéristique sociale dépend-elle de tel autre phénomène ou caractéristique » utilise comme exemple une question autour de la sortie du cinéma et du sexe avec un tableau croisé « la variable « explicative » étant en ligne et la variable « expliquée » en colonne, l’étude de ce tableau suppose le calcul de pourcentages en ligne. » « L’intervalle de confiance d’une différence » « cet intervalle est un encadrement probable de la vraie valeur, c’est-à-dire un encadrement contenant la vraie valeur (inconnue) avec une forte probabilité » ils ne détaillent pas comment il est calculé mais le calcul existe sur internet « Cette différence n’est-elle qu’apparente, c’est-à-dire produite par le hasard, ou bien traduit-elle une différence existant fondamentalement au sein de la population ? » mais si on a calculé à l'aide d'un échantillon, c'est parce qu'on peut pas vraiment calculer avec la population de référence ? Ils disent que si la pop se comporte autrement que l'échantillon c'est par rapport aux aléas de l'échantillon donc franchement jsp sociologue peut regarder les relations entre deux variables dans un tableau croisé « d’indépendance » Deux variables sont indépendantes s’il n’existe pas de relation entre les modalités en ligne et les modalités en colonne, ce qui revient à dire que les modalités en ligne ne conditionnent pas les modalités en colonne « Les pourcentages calculés en ligne (ou en colonne) doivent être identiques sur chacune des lignes » ça permettrait de prouver que ce sont des variables indépendantes i need an example « De manière plus générale, l’effectif de chaque case du tableau d’indépendance peut être calculé de la façon suivante : » j'ai rien compris mais c'est un truc par rapport à la proportionnalité ou jsp effectif d'indépendance = effectif total de la colonne / effectif total de l'échantillon x effectif total de la ligne mais c'est abstrait dans le cas où théoriquement y'aurait une parfaite indépendance entre les deux variables pour évaluer le hasard = test du khi-deux : - hypothèse sur la relation entre les deux variables - tester avec l'échantillon - conclure sur la plausibilité de l'hypohtèse le style d'écriture avec le truc de mettre des parenthèses toutes les deux minutes je pourrais mourir + c'est pas du tout compréhensible faicilement à partir de cela, on va comparer l'échantillon observé avec les attentes sur l'indépendance des deux variables pour déterminer si notre hypothèse doit être rejetée ou non On va calculer la distance entre l'échantillon de référence pour l'hypothèe et l'échantillon observé on va le placer sur une courbe qui indiqiue sa probabilité et de là rejet ou non. La courbe part du principe que les variables sont indépendantes « à partir de quelle valeur considère-t-on que la distance est « grande » ou « petite » ; « faible » ou « élevée » » formule pour calculer un écart relatif et ensuite comparer différentes modalités = (effectif observé - effectif théorique) / effectif théorique plus c'est élevé et plus la distance est grande pour bien calculer la distance du khi-deux, on va juste faire la somme avec toutes les cellules puis on va comparer sur la courbe et estimer la probabilité d'obtenir un tel résultat « Tout logiciel statistique réalise les calculs nécessaires : écarts ; écarts relatifs ; contributions aux khi2 ; distance ; probabilité associée à cette distance... La seule information intéressant le sociologue est la probabilité » si on sait que les variables sont dépendantes, on ne sait rien de plus Limites au khi-deux : - ça doit être avec seulement deux variables - il faut qu'il y ait assez d'effectif dans l'échantillon - il ne fournit que des présomptions de relations qui doivent être étayé par d'autres analyses - enfin, cela ne dit rien de l'interprétation qui reste à faire Il va nous apprendre à calculer un coefficient de corrélation « La covariance prend des valeurs positives d’autant plus élevées que les deux variables varient simultanément dans le même sens (une hausse de l’une est associée à une hausse de l’autre ; une baisse de l’une est associée à une baisse de l’autre). Elle prend des valeurs négatives d’autant plus petites (c’est-à-dire éloignées de zéro) que les variables varient simultanément dans des sens contraires (une baisse de l’une est associée à une hausse de l’autre). » « il ne permet d’identifier que les relations de nature linéaire entre deux variables et signale la présence ou l’absence d’une telle relation, sans fournir la moindre indication sur la présence d’une relation d’un tout autre type entre deux variables. » Il nous montre comment estimer le lien entre une variable quantitative et une variable qualitative « variance est une mesure de la variabilité » en gros cela regarde la dispersion des données autour de la moyenne la variabilité permet d'estimer l'homogénéité ou l'hétérogénéité d'une série de valeurs = si variable X est complètement déterminée par variable Y = homogène Sinon, hétérogène Si les pratiques ont un lien entre elles, alors la variabilité de la variable indépendante est forte alors que si y'a pas de lien entre elles, la variabilité est faible Il va donc falloir faire un test ANOVA « pour se faire une idée de l’existence d’un lien éventuel entre la pratique sportive et le sexe des adolescents, il suffit de comparer les variabilités au sein des groupes et la variabilité entre les groupes. Le principe général de l’ANOVA réside dans cette comparaison des variabilités » on compare la variabilité intraclasse et la variabilité interclasse pour déterminer si la variable qualitative est liée à la variable quantitative (ça se voit si y'a des grosses différences entre les groupes) J'AI COMPRIS : en gros on va tester la pertinence des variables qualitatives en créant des groupes au sein d'une plus grande variable quantitative. Si y'a des grosses différences entre les groupes, c'est que le découpage est pertinent pour voir si la variance est faible ou élévée, il faut comparer à si les variables étaient indépendantes il est possible de faire ce test avec différentes variables ce qui est différent du test khi-deux