Les parties sont indépendantes, l’ordre est indifférent !








télécharger 299.67 Kb.
titreLes parties sont indépendantes, l’ordre est indifférent !
page1/7
date de publication06.07.2017
taille299.67 Kb.
typeDocumentos
l.21-bal.com > comptabilité > Documentos
  1   2   3   4   5   6   7
PLAN DU COURS


Les parties sont indépendantes, l’ordre est indifférent !





  1. Rappel




    variables et autre




  1. Analyses uni -variées



    distribution de fréquences et pourcentages

    mesure de tendance centrale, dispersion et variation




  1. Analyses bi -variées




    estimation, intervalles de confiance, régression, corrélation

    tests paramétriques (Les variables quantitatives ont une distribution proche de la

    normale), comparaison de deux échantillons, de moyennes, test du Chi Deux, comparaison de moyennes, tableau croisé ou de contingence



  1. Analyses multi -variées 




    anova à 1 ou plusieurs facteurs

    analyse en composantes principales

    analyse factorielle des correspondances




      1. Les catégories


La statistique descriptive se compose de 3 domaines distincts :

  • Statistique univariée: répartition d’une population selon une variable (la taille, le poids…)



  • Statistique bivariée: étudie la relation qui peut exister entre deux variables (entre la taille et le poids, par exemple…)



  • Statistique multivariée: étudie les relations entre plusieurs variables.






3 étape : décrire – expliquer - synthétiser


  1. Rappel


  1. Statistique


  • Ensemble des méthodes de dénombrement, de classement et de présentation des données relatives à une population donnée.



  • Objectif est de synthétiser les données brutes, les comprendre, les présenter à d’autres acteurs.



  1. Statistique inférentielle


  • Objectif est de généraliser à toute une population donnée des observations et conclusions tirées à partir des résultats obtenus sur un petit nombre d’individus (échantillon) appartenant à cette population. [Échantillon  population]



  1. Vocabulaire


  • Population: à l’origine « groupement humain ». Actuellement c’est l’ensemble complet des unités que l’on désire étudier : des personnes, des sociétés, des objets, des actions…



  • Echantillon: tout sous-ensemble de la population



  • Surreprésentation : lorsqu’un type d’individu (individus ayant une caractéristique X) est proportionnellement plus nombreux dans l’échantillon que d’autres types d’individus. (Ex: 70% de français contre 30% de Belge)



  • Unité statistique: élément sur lequel porte l’observation. Exemple: un individu, un étudiant…



  • Observation (ou caractère, ou variable): caractéristique qui est observée sur chaque individu constituant l’ensemble. Exemple: l’âge de pensionnaires



  • Modalités: les différentes situations où les éléments de l’ensemble peuvent se trouver à l’égard du caractère considéré. Exemple: étude de la taille des villes selon trois modalités (petite, moyenne, grande). Synonyme = valeur, item.



  • Distribution de fréquences ou distribution: répartition des individus de l’échantillon ou de la population suivant les valeurs ou les états que prend, dans cette population ou cet échantillon, l’observation (variable, caractère) considérée. Exemple: répartition des pensionnaires selon leur âge.



  1. Présentation des données


  • Sous forme de tableau: système de lignes et de colonnes. Chaque ligne représente un individu et chaque colonne un caractère (ou variable)



  • Sous forme de graphique: moins précis que les tableaux, ils font généralement ressortir de façon plus claire les relations entre les variables.



  1. Types de variables

    Echelles de mesures (façon dont une variable peut être mesurée)


    Variables quantitatives
    s’expriment par des nombres sur lesquels des opérations arithmétiques telles que somme, moyenne, ... ont un sens. Exemple: poids d’une personne.


    Soit :
    de mesures (mensurations)

    = variables de nature continue

    peut prendre un nombre infini de valeurs réelles. Exemples:

    la t° (35.5°), le poids (65.5 kg)…
    de dénombrements (comptages)

    = variables de nature discrète ou discontinue

    prend uniquement un nombre limité de valeurs entières. Il n’y a pas de valeurs intermédiaires. Exemple: nombre d’enfants dans une famille.
    Echelle d’intervalle: permet de tenir compte de la différence entre deux valeurs d’une variable. Les valeurs observables sont ici numériques. Exemple: échelle de t° Celsius. Le choix de l’origine (le zéro) de l’échelle est arbitraire. Le rapport entre les valeurs n’a pas de sens en soi.
    Echelle de rapport: semblable à l’échelle d’intervalle mais avec l’existence d’une origine significative (zéro « naturel » ou « absolu »). Le rapport entre les valeurs a un sens précis. Exemple: durée de vie, taille, vitesse…



    Variables discontinues ou qualitatives
    s’expriment de façon littérale ou par un codage sur lequel les opérations arithmétiques telles que moyenne, somme, ..., n’ont pas de sens. Exemple: couleur des yeux.




    Soit :
    nominales ou catégorielles

    permet d’affecter les individus à des catégories sans relation hiérarchique (nationalité, sexe, appartenance à un parti politique…)
    ordinales ou de rangements

    permet d’affecter les individus à des catégories avec une relation hiérarchique qui rend possible leur comparaison (petit –moyen -grand)
    Types ou nature de variable & échelles de mesure : schéma





  1. Traitement des NR (non-réponses) ou NSP (ne sais pas) :


Si elles sont contenues dans le questionnaire comme possibilité de réponse, il s’agira à ce moment-là d’une échelle nominale et non plus ordinale (contenant seulement 1, 2,3 …10). On ne pourra donc plus calculer de moyenne.

La Règle :

  1. Comprendre la raison des NR




  • Les questions sont trop difficiles

  • La personne ne sait pas répondre dans les termes formulés par la question, ne rend pas compte de la finesse de la réponse

  • Question embarrassante pour la personne

  • La personne n’est pas concernée par la question. On peut savoir cela, en analysant ces réponses aux autres questions et déterminer un Profil de personne. Ex : une personne dit ne jamais utiliser de préservatif à une question, lorsqu’on lui demande s’il trouve que le préservatif est cher selon lui, il ne sera pas répondre.




  1. Différencier la solution en fonction du fait qu’il y a beaucoup ou peu de NR. Si elles sont peu nombreuses, elles affectent peu les résultats. 3 possibilités s’offrent à nous.




  • Soit on les élimine. Ce qui n’est pas la meilleure des solutions car selon les questions ce ne seront pas toujours les mêmes types d’individus qui ne répondront pas aux questions. Ce qui fait que l’on fini par

  • éliminer un nombre important d’individu au total.

  • Soit on remplace les NR par la moyenne du groupe. On suppose donc que les personnes qui ne répondent pas pensent comme les autres, or ce n’est pas spécialement vrai.

  • Soit on remplace les NR par la valeur au milieu de l’échelle proposée (5,5). On suppose ainsi que l’individu n’a pas su se placer entre JAMAIS et TOUJOURS, et donc c’est une manière de faire le moins d’erreur.

  1. La Question de l’Echelle dans les questionnaires


Echelle à basse fréquence : sensibles aux petites valeurs, aux phénomènes rares.

Echelle à haute fréquence : sensibles aux grandes valeurs.

Il a été observé que selon les échelles proposées dans le questionnaire, les réponses des individus différaient quelque peu.

Explication :

  1. Attraction des valeurs centrales

  2. Estimation floue à partir de vision de société et à partir de l’échelle. L’échelle est interprétée par les individus comme la manière dont le phénomène est distribuée dans la société. Ils se placent donc dans la moyenne.



  1. Analyses uni -variées.


Il est souvent astucieux lorsqu’on est confronté à une variable (ex : la taille) de faire un graphique pour avoir une représentation visuelle, qui plus facile à se représenter que des formules abstraites.




Echelle

Nominale

Ordinale

Quantitative

1 variable


Indice de tendance



Mode


Médiane


moyenne

1 variable


Indice de dispersion









Variance & écrart-type

      1. Indices de tendance centrale


Indique la caractéristique la plus représentative de tous les individus du groupe en la ramenant à un individu type qui se situerait au « centre » de la distribution. Ce sont des indices qui donnent des informations sur la position générale de la distribution. On en distingue trois :

  • Mode: valeur ou modalité de la variable ayant l’effectif le plus élevé (Exemple: 14/20…r

  • ésultat des examens)



  • Médiane: valeur de la variable qui partage en deux groupes d’effectifs égaux l’ensemble des individus rangés par ordre de valeurs croissantes ou décroissantes (Exemple: 13/20 – 50% moins/50% plus)



  • Moyenne: moyenne arithmétique (somme des valeurs/nombre total des individus) (Exemple: 12.8/20)
      1. Indices de dispersion


Exprime l’étendue de la variabilité des observations. Ils donnent des renseignements sur la dispersion et la variabilité dans un groupe, à savoir à quel point les valeurs de la distribution sont homogènes (si les valeurs sont proches de la moyenne ou pas) et hétérogènes (si écart entre la moyenne et les valeurs extrêmes est trop important). Il est abordé de trois manières:

  • Étendue: consiste à regarder simplement l’écart qui apparaît entre la valeur observée la plus basse et la valeur la plus élevée de la distribution.



  • Ecart interquartile: consiste à regarder la dispersion des valeurs observées autour de la médiane. Il convient de ranger préalablement les valeurs par ordre croissant ou décroissant.



  • Variance ou écart -type (ou déviation standard): consiste à mesurer l’écart moyen de toutes les valeurs observées par rapport à la moyenne. Mesure de la dispersion des valeurs des individus autour de la moyenne



  • Ecart moyen: moyenne arithmétique des valeurs absolues des écarts.



  • Variance: moyenne arithmétique des écarts au carré.

  • Ecart-type ou déviation standard : racine carrée de la variance. Il s’exprime dans la même unité que les données.


Une variance (et un écart type) faible signifie une faible dispersion des valeurs observées autour de la moyenne.

      1. Loi normale ou Gauss

La distribution normale ou de Gauss est une curve qui représente une distribution de probabilités. Elle présente les caractéristiques suivantes:

    • la distribution est symétrique

    • la moyenne, la mode et la médiane sont identiques

    • 68% des observations sont à l’intérieur de l’intervalle m ± s où m et s représentent la moyenne et l’écart- type de la variable

    • 98 % des observations sont à l’intérieur de l’intervalle m +ou- s où met s représentent la moyenne et l’écart type de la variable

Elle est appelée normale parce qu’elle représente la plupart des variables (par exemple, la taille, le poids des hommes d’une population). Elle serve comme base de comparaison, pour mesurer, par exemple, le degré de symétrie et la kurtosis (le degré d’aplatissement). Cette loi dépend de deux paramètres, son espérance mathématique, et son écart-type.




      1. Intervalle de confiance, seuil de signification


Dans la plupart des cas, principalement pour des raisons de coûts et de temps, une enquête ne portera que sur un échantillon extrait de la population étudiée. On aura alors à déduire des résultats obtenus sur échantillon les valeurs, c’est-à-dire celles qui seraient disponibles si l’ensemble de la population était connu mais la taille de l’échantillon influence aussi la précision des résultats !

La population totale est de taille N; la valeur vraie de la moyenne de la variable analysée est µ, et son écart type s. Ces deux valeurs µ et s sont inconnues, mais sur l’échantillon de taille n, une moyenne et un écart-type s ont été repérés (cf. graphique). Il s’agit de déduire µ et s de ces valeurs et s. Cette déduction suit des règles simples issues de la théorie des sondages, dans la mesure où les hypothèses suivantes sont respectées :

  • les éléments de l’échantillon ont été sélectionnés de manière aléatoire

  • l’échantillon est non exhaustif (n/N < 1/7)

  • l’échantillon comprend au moins 30 individus.


L’intervalle de confiance (IC) (ou marge d’erreur (d)) à 95% est un intervalle de valeurs qui a 95% de chance de contenir la véritable valeur du paramètre estimé. Avec un peu moins de rigueur, il est possible d’admettre que l’IC représente la fourchette de valeurs à l’intérieur de laquelle nous sommes certains à 95% de trouver la vraie valeur recherchée. L’intervalle de confiance est donc l’ensemble des valeurs raisonnablement compatibles avec le résultat observé (estimation ponctuelle). Il donne une expression formelle de l’incertitude rattachée à une estimation ponctuelle du fait des fluctuations d’échantillonnages. Des intervalles de confiance à 99% ou à 90% sont parfois utilisés. La probabilité (degré de confiance) de ces intervalles de contenir la vraie valeur est respectivement de 99% et 90%.

Il est à noter que la marge d’erreur prend uniquement en compte l’erreur de l’échantillon. Elle ne prend pas en compte les autres sources potentielles d’erreurs, notamment, le biais dans les questions ou dans l’exclusion d’un groupe n’étant pas questionné, le fait que certaines personnes ne veulent pas répondre, le fait que certaines personnes mentent, les erreurs de calculs (fluctuations d’échantillonnages)

Le seuil de signification : Pour contrôler la précision (précision des résultats obtenus) nous devons aussi contrôler le seuil de signification, c’est-à-dire fixer la probabilité que la marge d’erreur soit supérieure à d. Un seuil de signification égal à 5% signifie que dans 100 échantillons, 5 des échantillons auront une marge d’erreur supérieure à d.

Pour conclure, les bornes de l’intervalle de confiance sont les bornes à l’intérieur duquel se trouve la vraie moyenne de la population statistique avec une probabilité donnée. Une estimation par intervalle de confiance sera d’autant meilleure que l’intervalle sera petit pour un coefficient de confiance grand.

Exemple : La taille moyenne d’un échantillon de 51 filles de 2ème candi. commu. est de 167,9 cm. L’écart type de cet échantillon est de 5,3 cm.

Si nous supposons que cet échantillon est représentatif de la taille des filles belges âgées d’une vingtaine d’années [Attention ; Un échantillon est toujours représentatif de quelque chose, d’une variable – cette chose, variable doit être exprimée dans le protocole de recherche !] nous pouvons calculer la taille moyenne de cette population, avec sa marge d’erreur:


Avec 95 % de confiance, nous pouvons donc dire que la taille moyenne de la population vaut:


 Ce qui revient à dire qu’il y a 95 chances sur 100 pour que la taille moyenne des filles belges de 20 ans se situe entre 166,4 et 169,4 cm.
      1. Pondération


Il y a derrière cette notion une idée de poids. La pondération est un mécanisme par lequel on va donner son juste poids à une série de catégorie qui relève de variables

Exemple :

Ech. Vs Pop.

53.7  51.5

46.3  48.5

  • Pourquoi pondérer ?

Afin de redonner à chaque individu son poids réel, son poids statistiques dans l’échantillon. La pondération est un traitement statistique qui sert à rééquilibrer les sous-groupes composant l’échantillon, à redonner à chaque groupe, individu son poids réel ou statistique dans l’échantillon. Elle apporte des corrections aux disproportions causées à l’échantillon de base pendant le sondage.

Attention, on pondère l’échantillon par rapport à la population de base en fonction d’un critère (région, sexe …) mais nous n’avons pas de garantie qu’il soit représentatif par rapport à d’autres critères cela ne veut pas dire qu’il a été pondéré pour d’autres critères (origine culturelle, âge…)


  1. Analyses bi -variées.

  1. Les variables


Il faut y insister : une variable n’est pas indépendante ou dépendante par elle-même, mais bien par le rôle qu’elle joue dans une relation donnée. Par convention, dans la représentation graphique (axes orthogonaux), on porte la variable indépendante (X) en abscisse et la variable dépendante (Y) en ordonnée.

  • Variable indépendante

Dans une relation de cause à effet, la cause est la variable indépendante et l’effet la variable dépendante. On ne peut cependant pas poser cause et variable dépendante comme synonymes, car il arrive fréquemment que des variables soient mises en relation sans qu’il existe ou qu’on puisse démontrer une relation de cause à effet entre elles. En pareil cas, on peut simplement constater que, si l’on a affaire à X (variable indépendante), on observera plus ou moins souvent le phénomène Y (X implique Y, si X il y aura Y).


Dans une recherche sur l’incidence du mi-temps pédagogique (X) sur le rendement scolaire (Y), on étudie les conséquences entraînées par la variation de la durée de l’enseignement. Autrement dit, on fait varier X et l’on observe ce qui arrive à Y. C’est pourquoi la variable indépendante est aussi appelée variable expérimentale, variable active, variable stimulus, variable explicative.


  • Variable dépendante



C’est la variable passive, appelée parfois variable réponse, voire variable critère parce qu’elle indique le phénomène que le chercheur cherche à expliquer. Les mesures de critères sont donc celles que l’on fait sur le groupe expérimental, sur celui que l’on fait varier systématiquement.


  1. Les traitements bi -variés

Ont pour objet de mettre en évidence des relations éventuelles qui existent entre deux variables analysées simultanément. L’analyse bi -variée (une étude de relation à l’aide de tableau croisé) comprend notamment :

  • une analyse descriptive univariée préalable de chacune des deux variables en jeu ;

  • un tableau croisé ou de contingence entre ces deux variables ;

  • une interprétation des résultats obtenus ;

  • un commentaire concernant les données manquantes.


Cette liaison éventuelle entre deux variables se caractérise non seulement par une intensité mais aussi par l’ampleur. On s’intéresse donc à deux types d’analyses : la mesure du degré de liaison, la mesure de l’effet d’une variable sur une autre. L’étude de ces relations permet d’analyser des hypothèses de travail et de savoir si l’on peut conclure à un lien causal entre deux variables.

Tableau : les formes de relation




  1   2   3   4   5   6   7

similaire:

Les parties sont indépendantes, l’ordre est indifférent ! iconExamen des rapports présentés par les états parties (point 4 de l’ordre du jour) (

Les parties sont indépendantes, l’ordre est indifférent ! iconParcours définitionnel
«interprète» la démonstration logique ou mathématique, qui est de l’ordre du pré-texte. À cet effet, elles sont associées à deux...

Les parties sont indépendantes, l’ordre est indifférent ! iconProgrammer cet algorithme sur votre calculatrice et lancer 20 fois...
«expériences» aléatoires sont indépendantes les unes des autres et donc on a bien ici une loi binomiale de paramètre n = 20 et p...

Les parties sont indépendantes, l’ordre est indifférent ! iconCours de déontologie plan
Les obligations du stage sont déterminées par le conseil de l’Ordre, sans préjudice des pouvoirs attribués à l’Ordre des barreaux...

Les parties sont indépendantes, l’ordre est indifférent ! iconPartie 1 ─ politiques d’ordre géNÉral, procédures et définitions
«Définitions» déplacée au 4 Inclusion des définitions de toutes les parties dans la section 4 pour en faciliter la consultation

Les parties sont indépendantes, l’ordre est indifférent ! iconProbabilités / Exercices entrainement
«Le test est positif». La taille de ce troupeau permet de considérer les épreuves comme indépendantes

Les parties sont indépendantes, l’ordre est indifférent ! iconPour k allant de 1 à 30 Choisir f entre 0 et 1 Si
«Le test est positif». La taille de ce troupeau permet de considérer les épreuves comme indépendantes

Les parties sont indépendantes, l’ordre est indifférent ! iconLes élèves présentant des troubles du comportement sont des élèves...
«bougent beaucoup». Les symptômes apparaissent très tôt : les conduites sont rapidement inadaptées

Les parties sont indépendantes, l’ordre est indifférent ! iconNote : les parties en italiques sont moins importantes, mais peuvent...

Les parties sont indépendantes, l’ordre est indifférent ! iconPar acte d’avocat articles 229 et suivants du Code Civil
L'acte sous signature privée contresigné par les avocats de chacune des parties ou par l'avocat de toutes les parties fait foi de...








Tous droits réservés. Copyright © 2016
contacts
l.21-bal.com