Docteur de l’universite paris XI








télécharger 2.38 Mb.
titreDocteur de l’universite paris XI
page9/46
date de publication09.08.2018
taille2.38 Mb.
typeDocumentos
l.21-bal.com > comptabilité > Documentos
1   ...   5   6   7   8   9   10   11   12   ...   46

.BMesure d’une association entre un gène et le risque d’une maladie


De façon générale, une association entre un génotype à un locus marqueur et une maladie peut se produire de différentes façons (1) le locus est lié à la maladie et les différents allèles peuvent porter des risques différents, (2) le locus n’est pas lié lui-même à la maladie mais est suffisamment proche du « vrai » locus, c’est-à-dire qu’il se trouve en déséquilibre de liaison avec le locus « coupable » (3) l’association s’explique par un biais de l’étude ou par un artefact statistique.

. 1.Approche cas-témoins

..i.Principe de la mesure d’une association

Deux approches sont disponibles, selon si l’on s’intéresse à l’estimation les effets liés aux génotypes (dans un cas biallélique : aa, aA, AA) ou à estimer l’effet de l’allèle d’intérêt (A).

La première approche consiste à comparer les distributions des génotypes chez les cas et les témoins, parmi n sujets. La seconde compare la distribution allélique parmi les 2n allèles des cas et des témoins.
Nous présentons ci-dessous les principes de mesure d’une association entre un gène et le risque de maladie, par comparaison cas-témoins, pour la situation la plus flexible qui s’intéresse aux effets de chaque génotype.
Tableau 11: Distribution dans la population des génotypes selon le statut de la maladie

En terme de probabilité




En terme d’effectif







Maladie










Maladie







Génotype

Oui

Non




Génotype

Oui

Non

Total

aa

πaa

1 – πaa




aa

naa(+)

naa(-)

naa

aA

πaA

1 – πaA




Aa

naA(+)

naA(-)

naA

AA

πAA

1 – πAA




AA

nAA(+)

nAA(-)

nAA



L’association est définie par la différence entre les pénétrances πAA, πaA, πaai = la proportion de malades parmi les porteurs du génotype i) ou, de manière équivalente, entre les distributions des génotypes chez les cas et chez les témoins.
Une mesure commune est le risque relatif (RR) qui mesure l’écart des pénétrances par rapport à une pénétrance choisie comme référence. Si l’allèle a est l’allèle le plus courant, la force de l’association est mesurée par :

RR(AA vs aa) = πAA / πaa

et

RR(aA vs aa) = πaA / πaa

Une autre mesure plus couramment utilisée en épidémiologie est le rapport des odds (odds-ratio, noté OR), où l’odds de la maladie pour les porteurs d’un génotype X mesure le rapport entre la probabilité que la maladie soit présente parmi les porteurs du génotype et la probabilité que la maladie soit absente parmi les porteurs du génotype.

OR(AA vs aa) = (πAA/1-πAA) / (πaa/1-πaa)

et OR(aA vs aa) = (πaA/1-πaA) / (πaa/1-πaa)

Le RR et l’OR sont des indices définis au niveau de l’ensemble de la population. Dans le cas d’une maladie rare, la valeur du risque relatif peut être approchée par la valeur de l’odds-ratio. Cela découle du fait que les valeurs π sont petites, et ainsi que (1-π) est proche de 1.
Dans le cadre d’une enquête cas-témoins où le nombre de témoins est fixé en fonction du nombre de cas, la fréquence de la maladie pour chaque génotype ne peut pas être estimée. Le RR ne peut donc pas être calculé dans ce type d’enquête. En revanche, nous pouvons montrer que dans le calcul de l’odds-ratio, le génotype et la maladie ont un rôle symétrique, nous pouvons ainsi écrire l’odds-ratio comme le rapport des odds des génotypes. Cette écriture requiert l’estimation des fréquences des génotypes chez les malades et chez les non malades, informations disponibles dans une enquête cas-témoins. Finalement les calculs des odds-ratios se simplifient et s’expriment par les effectifs de chaque cellule.

OR(AA vs aa) = (nAA(+)/nAA(-)) / (naa(+)/naa(-))

et OR(aA vs aa) = (naA(+)/naA(-)) / (naa(+)/naa(-))

..ii.Modélisation de l’association : logistique ou log-linéaire.

La modélisation des données cas-témoins par une régression logistique utilise le statut cas ou témoin comme variable aléatoire. Nous nous intéressons à la probabilité d’un sujet d’être un cas (π), exprimée par la fonction inverse du Logit d’une combinaison linéaire incluant les variables indicatrices (notées I) de la présence/absence de chacun des trois génotypes.

Logit (π) = log (π / 1- π)

= tX β

= β0 + βaa I(sujet porteur de aa) + βaA I(sujet porteur de aA) + βAA I(sujet porteur de AA)

Par transformation, nous retrouvons l’expression des OR en fonction des coefficients sous la forme :

OR (AA vs aa) = exp(βAA – βaa)

et OR (aA vs aa) = exp(βaA – βaa)
En pratique, pour prévenir la situation d’aliasing (dans laquelle la matrice X n’est pas de plein rang), nous avons besoin de poser une contrainte sur les paramètres. Nous choisissons par exemple le génotype aa comme référence en fixant βaa= 0.6
La modélisation log-linéaire se base sur une table de contingence (ici, 2x3) dans laquelle les fréquences sont supposées être distribuées selon une loi de Poisson, et le logarithme de leurs valeurs attendues obéit à un modèle linéaire. Le modèle (sous sa forme saturée) fait intervenir le statut cas ou témoin, le génotype et leurs interactions. Notons G1 et G2 les variables indicatrices associées respectivement aux génotypes aA et AA, M la présence (M=1, sujet cas) ou l’absence (M=0, sujet témoin) de la maladie. On note umg le nombre de sujets avec M=m et le génotype g.
ln umg = μ0 + β01 G1 + β02 G2 + μ1 M + β11 MG1 + β12 MG2
Les coefficients β11 et β12 du modèle log-linéaire et les coefficients βaA et βAA (sachant la contrainte βaa= 0) du modèle logistique fournissent la même description du risque de maladie, et s’interprétent exactement de la même façon.

..iii.Test de l’association et Intervalle de confiance

Plusieurs tests d’association entre le génotype et la maladie sont disponibles : le test de Wald, le test du rapport de vraisemblance et le test du score (Annexe 1). Ces trois tests sont asymptotiquement équivalents, le test de Wald étant le moins robuste sur de petits échantillons. Plus facile à mettre en œuvre, nous utilisons le test de rapport de vraisemblance qui mesure deux fois l’écart des log-vraisemblances des deux modèles à comparer (avec ou sans les indicatrices associées aux génotypes).
- 2 {log V(modèle contraint sans G1 ni G2) – log V(modèle complet)} ~ χ² ddl=2
Cette statistique suit asymptotiquement une loi du Khi-deux à k degrés de liberté, où k est égal à la différence de paramètres entre le modèle contraint et le modèle complet (ici k=2).
Les modélisations logistiques et log-linéaires peuvent permettre de tester différentes hypothèses sur les effets des génotypes : modèle « multiplicatif » (βaA²=βAA ou β01²=β02, avec une variable codant le nombre de copies d’allèle A portées par le sujet), allèle A dominantaAAA ou β01=β02, avec une indicatrice codant la présence/absence de l’allèle A dans le génotype) ou récessifaaaA ou β01=0, avec une indicatrice codant la présence/absence de l’allèle a dans le génotype). Dans ces situations, un test de rapport de vraisemblance peut être employé et suit une distribution du Khi-deux à 1 degré de liberté.
Plusieurs méthodes d’estimation d’intervalle de confiance à 95% pour chaque coefficient peuvent être réalisées. Nous choisirons les intervalles de confiance usuels de Wald (Annexe 1), basés sur l’hypothèse de normalité des coefficients estimés, aisément calculables par l’encadrement du coefficient estimé plus ou moins 1.96 (fractile de la loi normale à 97.5%) multiplié par l’écart-type estimé du coefficient. Les intervalles de confiance des risques se calculent par les exponentielles des bornes inférieures et supérieures de l’intervalle de Wald.

..iv.Biais de stratification génétique de population

La mesure d’association entre un gène et le risque de maladie dans une étude cas-témoins n’est pas exempte des biais méthodologiques traditionels observés pour la mesure de l’association avec un facteur environnemental. Aussi nous portons une attention particulière au biais de stratification génétique de population.

..aDéfinition

Une stratification génétique de la population est présente dans un échantillon cas-témoins si le groupe des témoins est issu d’une population génétiquement différente de celle des cas. Elle peut être le résultat d’échantillonnage réalisé sans considération des groupes ethniques des sujets ou le résultat de groupes de cas et de témoins qui possèdent une répartition différente des groupes ethniques.
Il peut sembler aisé d’identifier et de contrôler cette forme de stratification par un ajustement des analyses ou par un appariement des cas et des témoins, sur leurs origines ethniques (Wacholder 2000), cependant une distinction plus ou moins fine des groupes ethniques peut ne pas suffire à détecter la présence d’une stratification de population. Aussi, dans le cas de population « génétiquement » jeune, il peut s’avérer nécessaire de connaître l’origine ethnique des ancêtres.

..bQuel biais ?

La conclusion raisonnable par un généticien d’une association statistique entre le génotype défini par le locus du marqueur et le phénotype est qu’elle implique usuellement un lien physique entre le locus du marqueur et le locus de la maladie. En présence de stratification de population, il est possible d’observer des associations statistiques entre le phénotype et le marqueur qui pourtant n’a pas de lien physique avec le locus « causal ». En effet, le phénomène de stratification permet aux fréquences de l’allèle marqueur de varier parmi différentes sous-populations. Si la maladie est plus prévalente dans l’une de ses sous-populations, elle sera statistiquement associée avec les allèles les plus fréquents dans cette sous-population.
Une solution alternative qui a souvent été proposée pour contourner ce problème de stratification est l’utilisation d’un schéma d’étude avec un groupe « interne » de témoins, comme les allèles non transmis des parents à l’enfant atteint. Ce groupe de témoins fictifs est issu de la même population génétique que les allèles des sujets cas, et offre ainsi une robustesse face au biais de stratification de population. Il s’agit de l’ensemble des études basées sur des données familiales, incluant l’enfant-cas, les parents ou les frères et sœurs, voire les grands-parents.
C’est seulement récemment que certains auteurs ont développé des méthodologies nouvelles et adaptées au schéma d’étude cas-témoins, permettant de détecter l’existence d’un biais de stratification ou/et de mesurer une association génétique en présence de ce biais.

..cDétection et mesure d’association en présence d’une stratification génétique de population

L’approche basique pour détecter la présence d’une stratification génétique de population serait de vérifier l’hypothèse d’équilibre d’Hardy-Weinberg (HWE) pour divers loci suffisamment éloignés pour qu’ils ne soient pas en déséquilibre de liaison. S’ils dévient de l’équilibre HWE, nous pourrions admettre qu’il puisse exister une stratification génétique de la population. La difficulté de cette approche est qu’il s’agit ici de tests multiples et qu’elle nécessite une correction du degré de signification (p-value). De plus, il est maintenant bien établi que la puissance du test de HWE pour détecter une stratification de population est faible (Deng et al. 2001).
De façon générale, ces développements sont possibles grâce aux nouvelles techniques de la génomique qui offre aujourd’hui un accès rapide aux informations du génome humain. Ils s’appliquent à des jeux de données pour lesquels il est possible de réaliser des génotypages supplémentaires pour un panel de marqueurs non liés au locus de la maladie appelés « témoins génomiques » (traduit littéralement de genomic control (GC)).
Pritchard and Rosenberg (1999) proposent un test de la présence de stratification, adapté à des jeux de données cas-témoins, pour lesquels une association a été observée pour plusieurs loci. Ils considèrent que si une stratification est présente dans l’échantillon de population, alors les marqueurs additionnels non liés au locus de la maladie devraient montrer à leur tour une association avec le phénotype étudié. Les simulations des auteurs montrent que le test proposé obtient un risque d’erreur de première espèce de 6% à partir de 30 marqueurs bialléliques. L’approche développée par Devlin and Roeder (1999) est similaire.
La stratification de la population génère un phénomène de sur-dispersion (inflation de la variance) des statistiques de l’évaluation de l’association entre le locus d’intérêt et le risque de maladie. Certains auteurs proposent d’utiliser ces « témoins génomiques » pour estimer un facteur de correction et corriger la statistique de test (Bacanu et al. 2000, Devlin et al. 2001, Reich and Goldstein 2001).
Une autre approche, appelée structured association (SA), a pour principe d’utiliser les GC dans le but d’évaluer les informations manquantes, telles que le nombre de sous-populations qui constitueraient la stratification. Elle mélange des méthodologies statistiques d’approximation bayésienne ou/et classiques basées sur la vraisemblance des modèles. L’hypothèse de l’approche est que la population est hétérogène mais composée de sous-populations non observées homogènes. Elle estime ainsi la structure de la population (par un modèle latent) puis teste l’association. Il s’agit, entre autres, des travaux de Pritchard et al. (2000, 2001), de Satten et al. (2001) et de Hoggart et al. (2003).
Enfin, les GC peuvent permettre de constituer des groupes homogènes de sujets à l’aide d’un algorithme de classification, et les classes ainsi identifiées sont ensuite intégrées dans une analyse de régression comme ajustement (Schork et al. 2001).
L’ensemble des méthodes est intéressant et prometteur. Cependant encore peu d’applications sont actuellement publiées dans la littérature. Ces développements nécessitent davantage de recherche pour mieux apprécier leurs limites et leurs points forts.

..dQuantification du biais et discussion

Il n’existe aujourd’hui que peu de publications d’études cas-témoins rapportant une preuve solide de l’existence de biais de stratification de population.
Une étude récente a proposé de quantifier le biais potentiel causé par une stratification de population (Wacholder et al. 2000) sur une étude cas-témoins s’intéressant à l’association entre un polymorphisme commun et le risque de cancer (vessie pour les hommes, sein pour les femmes) pour une population non hispanique des Etats-Unis d’ancêtres issus de huit pays européens. Les simulations suggèrent que le biais causé par la stratification de population est minimal et diminue avec le nombre de sous-population pris en compte. Aussi, lorsqu’une maladie est causée par différents gènes de différents loci non proches, la possibilité d’un biais important de stratification est sévèrement réduite (Wacholder et al. 2002a).
Cardon et Palmer (2003) suggèrent que, même en présence d’un biais de stratification de population dans une étude cas-témoins, la force du biais est faible, sauf si la structure est définie par une situation de différences extrêmes du risque de maladie et de la fréquence allélique entre les sous-populations.
L’ensemble de ces résultats est reproduit plus récemment par les simulations de l’étude de Wang et al. (2004), réalisées sur une population afro-américaine.
Nombreux auteurs développent l’idée que le biais de stratification de population dans les études cas-témoins correctement construits n’est pas une menace sérieuse pour la validité des conclusions, et modèrent ainsi l’enthousiasme porté sur les schémas d’étude basés sur les données familiales.
Morton et Collins (1998) considèrent que l’effet de stratification de population est négligeable à l’intérieur des groupes ethniques même s’ils sont vagues tels que les « Caucasiens, Noirs, Asiatiques et Hispaniques ».
L’idée majeure développée par Wacholder et al. (2002a) est que l’appartenance ethnique à des pratiques culturelles et linguistiques, lorsqu’elles sont auto-déclarées, est un meilleur indicateur que les marqueurs génétiques pour identifier une structure de la population : les auteurs concluent ainsi qu’une étude épidémiologique cas-témoins qui prend en compte ces appartenances ethniques ne peut être que faiblement concernée par un biais de stratification de population.
Rosenberg et al. (2002) renforce cette hypothèse par la construction d’une classification basée sur 377 loci, à partir de 1056 sujets issus de 52 populations définies selon la géographie, la culture et la langue (caractéristiques décrites par les sujets eux-mêmes). L’étude identifie 6 groupes principaux génétiquement homogènes dont 5 correspondent aux zones géographiques majeures définies par les délimitations des continents. Des sous-populations plus finement décrites à l’intérieur des zones géographiques majeures peuvent être distinguées dans la classification des loci, excepté pour le continent Européen pour lequel aucune structure génétique ne peut être distinguée (précisément l’étude isole trois sous-groupes génétiquement homogènes selon les 377 loci qui correspondent à la population basque, à la population de la Sardaigne, et la population restante).
Finalement, l’existence et l’ampleur du biais de stratification génétique de population dans les études cas-témoins de mesure d’association génétique a été et est encore largement débattu. Les développements méthodologiques (génomique ou statistique) permettant de contrôler ce biais doivent être améliorés et leur faisabilité évaluée, puisque les discussions des études cas-témoins traditionnelles feront toujours l’objet de cette critique.
1   ...   5   6   7   8   9   10   11   12   ...   46

similaire:

Docteur de l’universite paris XI iconDocteur de l’universite paris X nanterre

Docteur de l’universite paris XI iconTHÈse pour obtenir le grade de Docteur de l’Université Paris 8

Docteur de l’universite paris XI iconThèse pour obtenir le grade de docteur de l’Université Paris I panthéon-Sorbonne
«L’Université n’entend donner aucune approbation ni improbation aux opinions émises dans ce document. Ces opinions doivent être considérées...

Docteur de l’universite paris XI iconDocteur en Histoire des Mondes Anciens. Université Paris IV sorbonne
«Dynamique d’occupation et zones de confins à l’époque antique : la question du territoire carnute (Ier s av. J. C. –IVe s ap. J....

Docteur de l’universite paris XI iconJean-Luc Moulène Selected Biography Born in France, 1955 Lives and...

Docteur de l’universite paris XI iconJean-Luc Moulène Selected Biography Born in France, 1955 Lives and...

Docteur de l’universite paris XI iconUniversité Paris XII
«Pacte pour la Recherche». Elle réitère son appel à l'extension du mouvement de «la maternelle à l'Université». Elle appelle aux...

Docteur de l’universite paris XI iconDocteur en droit public, Maître de conférences à la Faculté de droit...

Docteur de l’universite paris XI iconLe programme et Le dépliant sont disponibles sur
«passé qui ne passe pas» Avec Gilles Manceron (ldh), Nicolas Bancel (Université de Lausanne-Achac) & Catherine Coquery-Vidrovitch...

Docteur de l’universite paris XI iconUniversité Paris X- master 2 grfa








Tous droits réservés. Copyright © 2016
contacts
l.21-bal.com