.CEvaluation d’une interaction entre un gène et un facteur environnemental L’ensemble des méthodologies employées pour l’estimation d’un effet conjoint entre un facteur génétique et un facteur environnemental est basé sur des extensions simples des modèles s’intéressant aux associations génétiques, quelle que soit l’approche cas-témoins ou cas-parents. Un terme d’interaction est inclus dans les régressions logistiques, ou une stratification supplémentaire sur le facteur environnemental du jeu de données est mise en place pour la modélisation log-linéaire.
. 1.Approche cas-témoins ..i.Modélisation logistique Soit la situation simplifiée de deux facteurs dichotomiques génétique G et environnemental E, nous notons g+ (g-) la présence (l’absence) d’un caractère génétique du sujet (par exemple, présence de l’allèle d’intérêt A dans le génotype du sujet, qui correspond à un mode de transmission dominante de l’allèle), et e+ (e-) la présence (l’absence) d’exposition au facteur environnemental. Soit le groupe de référence, le groupe de sujets possédant les caractéristiques g- et e-, le modèle logistique s’intéressant à l’interaction entre G et E s’écrit : logit (p) = α + βg Ig+ + βe Ie+ + βge I(g+ et e+)
où p est la probabilité d’être un cas
βg est le log de l’odds-ratio associé au caractère génétique g+ parmi les non-exposés e-(ORg)
βe est le log de l’odds-ratio associé à l’exposition e+ parmi les non porteurs du caractères génétiques g- (ORe)
βge est le paramètre additionnel lié à la présence conjointe de l’exposition et de la présence du caractère génétique. Son exponentielle est l’odds-ratio de l’interaction gène-environnement. L’exponentielle de (βg + βe + βge) est l’odds-ratio associé à la présence du caractère génétique parmi les exposés au facteur environnemental (ORge). Les intervalles de confiance à 95% se calculent selon la procédure usuelle de Wald. L’interaction peut être testée par un test du rapport de vraisemblance (à 1 degré de liberté dans cette situation simplifiée). Ce modèle peut être étendu en considérant les effets de chaque génotype. L’hypothèse nulle du test de l’interaction génotype-environnement est définie alors par la nullité simultanée de deux paramètres (correspondant aux trois génotypes moins un génotype de référence), aboutissant à un test à deux degrés de liberté. Un facteur environnemental à plus de deux classes ou en continu, peut être utilisé ; le nombre de degrés de liberté du test d’interaction doit alors être adapté. L’interaction gène-environnement estimée et testée par la régression logistique est mesurée, dans ce cas, sous l’échelle multiplicative. L’hypothèse nulle du test est : Ho : βge=0, nous obtenons donc sous Ho :
ORge= exp(βg + βe + βge) = exp(βg + βe)
= exp(βg) exp(βe)
= ORg ORe L’hypothèse nulle peut être reformulée par : Ho : Effet conjoint est dit « multiplicatif » ou Absence d’interaction multiplicative ou ORge= ORg ORe. Certains auteurs (Khoury et Flanders 1996, Botto et Khoury 2001) suggèrent de présenter par un tableau 2x4 les interactions gène-environnement mesurées par l’approche cas-témoins. Ce tableau a l’avantage de présenter de façon synthétique les effets utilisés, les effets propres et conjoints des facteurs E et G (1ère partie du Tableau 15 et de visualiser ainsi simplement l’existence d’une interaction selon les deux échelles de mesure : multiplicative et additive (2ème partie du Tableau 15). Tableau 15: Tableau 2x4 des effets propres et conjoint des facteurs génétique G et environnemental E, par l’approche cas-témoins E
| G
| Cas
| Témoin
| Odds-ratio (brut)
| Information
| -
| -
| a
| b
| Ref.
| Référence commune
| -
| +
| c
| d
| ORg = bc / ad
| Effet de g+ seul
| +
| -
| e
| f
| ORe = eb / af
| Effet de e+ seul
| +
| +
| g
| h
| ORge = gb / ah
| Effet conjoint de e+ et g+
|
|
|
|
| ORge attendu
| Déviation à l’ORge attendu (=ORinteraction)
| Sous l’hypothèse additive
| ORg + ORe -1
| ORge – ORg – ORe +1
| Sous l’hypothèse multiplicative
| ORg x ORe
| ORge / (ORg x ORe)
| -/+ : absence/présence
|
|
|
Ce mode de présentation peut être extrapolé en un tableau 2x6 lorsque nous nous intéressons aux effets de chaque génotype sans hypothèse particulière de mode de transmission génétique.
..ii.Hypothèses, Limite, Puissance, Faisabilité L’estimation d’une interaction gène-environnement par l’approche cas-témoins, est sensible aux biais méthodologiques classiques de sélection des cas et des témoins, de classification de l’exposition et du génotype, de confusion et de stratification de population. Quelques auteurs ont évalué les conséquences de la présence de certains de ces biais sur l’estimation d’une interaction, sa précision et sa puissance (Khoury et al. 1993, Witte et al. 1999, Garcia-Closas et al. 1999, Wacholder et al. 2002b). Garcia-Closas et al. (1999) montrent qu’une erreur de classement (différentielle ou non) générée sur un facteur environnemental dichotomique ou un facteur génétique, produit un biais de la mesure de l’interaction (multiplicative ou additive) qui converge vers une absence d’interaction entre le facteur environnemental et le gène. Wacholder et al. (2002b) se sont intéressés au biais de sélection des témoins hospitaliers sur la mesure d’une interaction gène-environnement. Si le groupe de témoins hospitaliers est recruté à travers une pathologie unique, aucun biais pour l’interaction multiplicative n’est observé si la pathologie des témoins n’est pas liée à cette interaction (quel que soit le lien des deux facteurs propres avec le risque de cette pathologie). En revanche, si le groupe de témoins est constitué de plusieurs pathologies, même si elles ne sont pas liées à l’interaction d’intérêt, ce groupe n’assure pas d’absence de biais dans la mesure de l’interaction. Il est maintenant bien établi que la puissance de détection de l’effet d’une interaction gène-environnement est très inférieure à celles des effets propres du facteur environnemental et du facteur génétique (Greenland 1983, Smith and Day 1984). De plus, la variance du paramètre estimé de l’interaction est supérieure aux variances des paramètres des effets propres. Différents auteurs ont estimé la puissance de détection d’une interaction par l’approche cas-témoins et la taille de l’échantillon associée (Hwang et al. 1994, Khoury et al. 1995, Andrieu et Goldstein 1996, Foppa et Spiegelman 1997, Yang et al. 1997, Yang et al. 2003). Les approches diffèrent dans les définitions de l’hypothèse alternative du test ou plus généralement par leurs propriétés mathématiques, conduisant pour quelques-unes à une sur-estimation de la puissance et à une sous-estimation de la taille de l’échantillon pour des situations très spécifiques (García-Closas et Lubin 1999). L’approche la plus courante se base sur les calculs de taille d’échantillon proposés par Smith et Day (1984) pour détecter une interaction, et convient aux situations pour lesquelles l’effet de l’interaction et les effets propres sont modérés. Les calculs s’appuient sur des informations contenus dans un tableau 2x4 (Tableau 15), ORge, ORe, ORg, et sur la prévalence de l’exposition dans la population (pe), sur la prévalence du génotype dans la population (pg), sur le ratio cas-témoins, ainsi que sur l’erreur de type I et la puissance souhaitée. Hwang et al. (1994) montrent que la situation décrite par pg=0.30, pe=0.70, ORe≈ORg≈2, ratio de 2 témoins pour 1 cas, nécessite 200 et 400 témoins pour détecter une interaction multiplicative de 4 (c’est-à-dire une ORge≈16) avec une erreur de type I de 5% et une puissance de 80%. Cependant, dans la majorité des situations réelles, les génotypes sont plus rares et l’exposition est moins fréquente. Andrieu et Goldstein (1996) envisage alors la situation suivante, pg=0.01, pe=0.30, ORe≈ORg≈2, ratio cas-témoins de 1:1. Un total de 12000 cas et 12000 témoins est nécessaire pour détecter une interaction multiplicative de 3 (c’est-à-dire une ORge≈12) avec une erreur de type I de 5% et une puissance de 80%. Finalement, la faisabilité d’une étude cas-témoins dans le cas d’un polymorphisme rare (<1%) et d’une exposition peu commune est compromise. Hwang et al. (1994) estiment, de façon synthétique, un effectif minimal de 1000 cas et 1000 témoins pour détecter une interaction dans une situation d’un polymorphisme presque rare (entre 1 et 5 %) et d’odds-ratio de G et E modérés (autour de 2). En revanche, cette approche est appropriée aux études de détection d’interaction si les facteurs E et G sont communs.
..iii.L’alternative Cas-seuls ..aPrincipe Dans certaines situations, les effets propres du facteur environnemental E et du gène G sur le risque de maladie sont négligeables et l’intérêt est porté sur un possible effet de synergie de la présence conjointe des deux facteurs. L’estimation d’une interaction ne requiert pas dans toutes les situations un groupe de témoins, et le schéma d’étude « cas-seuls » a ainsi été proposé dans la littérature épidémiologique (Piegorsch et al. 1994, Khoury et Flanders 1996, Andrieu et Goldstein 1998, Weinberg et Umbach 2000, Umbach et Weinberg 1997, Yang et al. 1997, Botto et Khoury 2001). Cette méthode d’analyse s’appuie sur la relation suivante : la déviation de l’OR de la présence conjointe du gène et du facteur environnemental à l’hypothèse multiplicative des OR propres de E et G, mesurée par l’approche cas-témoins, est égale à l’OR mesurant l’association entre le gène et le facteur environnemental chez les cas divisé par ce même OR mesuré chez les témoins.

où
ORcas = ag/ce
ORtémoins = bh/df (notations duTableau 15) Si le génotype et le facteur environnemental sont indépendants dans la population générale (ou dans le groupe des témoins), la valeur de l’ORtémoins s’approche de 1 et l’odds-ratio mesuré chez les cas-seuls mesure la déviation à un effet conjoint multiplicatif du gène et de l’exposition environnementale, c’est l’odds-ratio de l’interaction mesurée sous l’hypothèse de l’échelle multiplicative. Tableau 16: Effet conjoint des facteurs génétique G et environnemental E, par l’approche cas-seuls
|
| G
|
|
|
| -
| +
| E
| -
| a
| C
|
| +
| e
| G
| (effectifs issus du Tableau 15)
|
Cette analyse peut se présenter sous la forme d’un tableau 2x2 avec le calcul de l’effet de l’interaction par un OR brut et testé par une statistique du Khi-deux (Tableau 16). Elle peut également être menée par une analyse logistique classique avec ajustement.
..bHypothèses, Limite, Puissance Si le génotype n’est pas corrélé à l’exposition dans la population et que la maladie est rare, l’alternative « cas-seuls » offre une meilleure précision de l’estimation de l’interaction gène-environnement et une puissance supérieure du test que ne le fournit l’approche cas-témoins traditionnelle. Ces propriétés s’expliquent mathématiquement. Pour l’approche cas-témoins, la précision de l’estimation du logarithme de l’ORge s’écrit, à partir des effectifs du tableau 2x4 (Tableau 15), tel que :
[cas-témoins]
L’approche cas-seuls estime cette variance à partir des effectifs des cas seulement par :
[cas-seuls]
Dans une situation asymptotique (si b, d, f et h, les effectifs du groupe des témoins, sont très grands), les variances estimées selon les deux approches sont alors équivalentes. Sinon, la variance estimée par l’approche cas-seuls est inférieure à celle estimée avec les effectifs des témoins et procure ainsi une meilleure précision de l’estimation. De façon similaire, la puissance de détection d’une interaction par l’approche cas-seuls est meilleure que celle de l’approche cas-témoins, et accroît avec l’ORge, son calcul faisant intervenir des variances du logarithme de l’ORge plus précises sous les hypothèses nulle et alternative. Finalement, le gain de performance de l’approche cas-seuls s’explique par le fait que l’on pose une hypothèse d’indépendance entre le facteur génétique et le facteur environnemental. Cette hypothèse semble raisonnable dans la population générale, cependant il existe des gènes qui conduisent à modifier l’exposition environnementale (par exemple, un comportement d’aversion à l’alcool). Aussi, il peut exister un tiers facteur pour lequel les facteurs génétique et environnemental varient différemment selon ses valeurs, créant ainsi une corrélation entre les deux facteurs (par exemple, le caractère ethnique). S’appuyant sur l’erreur de 1ère espèce à 5% d’un test, Albert et al. (2001) évaluent la sensibilité du test de l’interaction gène-environnement à une déviation de l’hypothèse d’indépendance entre le gène et le facteur environnemental. A partir de 1000 simulations sur un jeu de données de 340 cas et 340 témoins, ils observent 4.1% de rejet du test si l’ORge chez les témoins (noté ORtémoins plus haut) est égal à 1 (correspondant à l’hypothèse d’indépendance entre G et E), 10% de rejet du test si l’ORge chez les témoins est égal à 1.22, et 60% de rejet pour un ORge chez les témoins de 1.65. Ces résultats indiquent une hypersensibilité du test de l’interaction face à l’hypothèse d’indépendance entre G et E du groupe des témoins. Finalement, cette alternative n’est pas satisfaisante pour substituer l’approche cas-témoins : elle offre un test d’interaction gène-environnement très sensible à une légère déviation de l’hypothèse d’indépendance entre G et E (elle est encore moins appropriée pour l’étude d’une interaction entre deux facteurs environnementaux, comme des facteurs nutritionnels, la consommation de tabac ou l’exposition professionnelle, l’hypothèse d’indépendance étant encore plus difficile à vérifier). De plus, elle n’estime pas les effets propres des deux facteurs.
..iv.L’alternative mixte : modélisation log-linéaire Umbach et Weinberg (1997) ont proposé une méthode mixte permettant d’évaluer à la fois les effets propres du facteur génétique, du facteur environnemental et de l’interaction, en forçant l’hypothèse d’« indépendance » entre le génotype et l’exposition environnementale chez les témoins. L’approche propose trois modèles log-linéaires construits selon les informations disponibles et l’hypothèse d’« indépendance » entre le génotype et l’exposition. Soit une situation simple, où G note la présence (G=1) ou l’absence (G=0) du caractère génétique d’intérêt, E la présence (E=1) ou l’absence (E=0) de l’exposition, et M la présence (M=1, sujet cas) ou l’absence (M=0, sujet témoin) de la maladie. Nous notons umge le nombre de sujets avec M=m, G=g et E=e.
Si l’ensemble des informations sur les témoins est disponible, le modèle complet s’écrit :
ln umge = μ0 + α0 E + β0 G + γ0 GE + μ1 M + α1 ME + β1 MG + γ1 MGE Ce modèle ne repose sur aucune hypothèse d’« indépendance » entre génotype et exposition. L’approche log-linéaire présentée est équivalente à l’approche logistique classiquement utilisée pour l’analyse des études cas-témoins. Ces modèles fournissent les mêmes descriptions du risque la maladie : les exponentielles des coefficients α1, β1 et γ1 sont les OR lié à, respectivement, l’exposition, le génotype d’intérêt et l’interaction gène-environnement. Sous l’hypothèse d’indépendance entre le génotype et l’exposition parmi les témoins, le modèle s’écrit tel que l’on pose la contrainte γ0 = 0:
ln umge = μ0 + α0 E + β0 G + μ1 M + α1 ME + β1 MG + γ1 MGE
Ce modèle offre les mêmes interprétations des coefficients que le modèle précédent, en revanche les valeurs des estimations sont modifiées. En l’absence du terme d’interaction « GE » dans le modèle, l’estimation du coefficient γ1 ne requiert pas les informations du groupe des témoins, il s’agit de l’estimateur « cas-seuls » proposés par Piegorsch et al. (1994). Les paramètres α1 et β1 dépendent des données de témoins seulement par les sommes marginales. Les variances des coefficients (α1, β1, γ1) sont plus faibles que celles du modèle complet. Lorsque l’hypothèse d’indépendance est remplie, cette seconde analyse nécessite moins de sujets que l’analyse faite sous le modèle complet. Cependant, l’estimation « cas-seuls » reste sensible à la déviation de l’hypothèse. Enfin, l’idée initiale des auteurs était le développement d’une analyse qui estimerait les effets propres et l’interaction en prenant en compte la difficulté pratique d’obtention d’information génétique du groupe de témoins. Ainsi, une extension du modèle permet la prise en compte d’informations incomplètes lorsque l’information du génotype chez les témoins n’est pas obtenue. Le modèle s’écrit :
ln umge = μ0 + a0 E + m1 M + a1 ME + b1 MG + c1 MGE Les notations de ce troisième modèle sont différentes car b1 n’estime plus l’effet du génotype correspondant au terme β1, mais la somme β0 + β1. Lorsque les témoins ne sont pas génotypés, l’effet propre du génotype G sur le risque de maladie n’est plus estimable, alors que l’interaction gène-environnement le reste sous l’hypothèse d’indépendance des deux facteurs. Le risque de maladie lié à l’interaction gène-environnement est l’exponentielle de c1, celui de l’exposition est l’exponentielle du coefficient a1.
..v.Autres alternatives Des stratégies particulières d’appariement des cas et des témoins ont été proposées pour détecter une interaction gène-environnement pour les situations où l’un ou les deux facteurs sont rares. Il s’agit des stratégies de contre appariement (countermatched design) ou d’appariement en deux phases décrites par Andrieu et Goldstein (1998) et des stratégies d’appariement flexibles proposées par Stürmer et Brenner (2000). Le principe du contre-appariement est de sélectionner des témoins pour accroître la variation du facteur d’intérêt dans le jeu de données, en maximisant ainsi le nombre de paires discordantes cas-témoins à l’opposé du principe d’appariement classique. L’appariement flexible estime la fréquence de témoins exposés à sélectionner, qui maximise la puissance du test d’interaction. Ces stratégies sont récentes et la puissance, la performance et la faisabilité de ces études sont encore peu évaluées. La stratégie de contre-appariement sur le(s) facteur(s) rare(s) des cas et des témoins produirait une puissance supérieure de détection d’une interaction gène-environnement par rapport aux analyses traditionnelles cas-témoins. Mais elle nécessiterait encore une taille d’échantillon importante, rendant la faisabilité de ces études toujours difficile. De surcroît, la mise en place de cette stratégie est complexe (Andrieu et al. 2001).
. 2.Approche cas-parents La majorité des méthodes d’analyse présentées dans la section précédente permet d’étudier une hétérogénéité de transmission allélique ou de stratifier les modèles pour évaluer des effets des génotypes différents selon l’exposition au facteur environnemental (Khoury et Flanders 1996, Maestri et al. 1997, Waldman et al. 1999, Eaves et Sullivan 2001, Witte et al. 1999, Schaid 1999b, Umbach et Weinberg 2000, Laird 2000, Lake et Laird 2004). Umbach et Weinberg (2000) soutiennent que les tests d’interaction gène-environnement qui font intervenir un contraste entre les taux de transmission allélique des familles exposées et des familles non exposées, à partir des parents hétérozygotes à leur enfant atteint, sont sensibles à deux sources de biais : la différence entre les taux de transmission des familles exposées et non exposées peut être la conséquence d’une stratification de population même s’il n’y a pas d’interaction ; dans la majorité des situations, il n’existe pas d’indépendance des transmissions alléliques entre les parents hétérozygotes sous l’hypothèse nulle d’absence d’interaction. De tels biais provoquent une inflation du taux d’erreur de première espèce du test de l’interaction. Ils se produisent pour tous les tests basés sur le comptage de transmission allélique à partir des parents hétérozygotes. Robustes à ces sources de biais, l’approche de Schaid et Sommers (1993), conditionnée sur les génotypes parentaux, s’étend à l’étude d’interaction gène-environnement et est présentée par Schaid (1999b) puis complétée par Cordell et al. (2004). Les méthodes non paramétriques FBAT possèdent l’avantage de permettre l’évaluation d’une interaction entre un génotype et une exposition environnementale quantitative (Laird et al. 2000, Lake et Laird 2004). En raison de sa flexibilité d’implémentation, nous choisissons de développer plus en détails dans la section suivante le modèle log-linéaire de l’approche cas-parents s’intéressant à l’interaction gène-environnement (Umbach et Weinberg 2000).
..i.Méthodologie log-linéaire Soit un gène G à deux allèles et un facteur environnemental E dichotomique, l’approche log-linéaire peut être étendue à l’étude des interactions gène-environnement, par la construction d’une stratification des familles selon leur exposition à E. Nous nous intéressons aux effets du génotype de l’enfant sur chaque strate d’exposition. Le modèle s’écrit :
ln (E [n M,P,C]) = ln (2) I[M=P=C=1] + γj + δj I[E=1]
+ β1 I[C=1] + β2 I[C=2] + η1 I[E=1;C=1] + η2 I[E=1;C=2]
Dans ce modèle, γj correspond au risque de base de chaque profil parental j du groupe « non exposé », et (γj + δj) à celui des familles « exposées ». Les coefficients βc (c=1,2) sont les logarithmes des risques relatifs associés au nombre c de copies de l’allèle d’intérêt chez l’enfant parmi les triades « non exposées » (par rapport à aucune copie). Pour le groupe des « exposés », le log des risques relatifs associés à C=c, versus 0 copie, correspond à la somme (βc+ ηc). Enfin, les effets potentiels de l’interaction gène-environnement sont multiplicatifs et sont mesurés par les paramètres η1 et η2. Les interactions génotype-environnement sont testées par un test du rapport de vraisemblance (H0 : η1=η2=0) qui suit une loi du Khi-deux à 2 degrés de liberté. Ce modèle peut intégrer les interactions entre le génotype de la mère et le facteur environnemental. Il a été généralisé par Kistner et Weinberg (2004) pour les situations d’un facteur environnemental quantitatif et de triades incomplètes. Cette extension est semi-paramétrique et a l’avantage de ne pas imposer d’hypothèse de normalité du facteur quantitatif.
..ii.Hypothèses, Limites et Puissance L’étude d’interaction gène-environnement par le modèle log-linéaire sur les triades, nécessite de poser l’hypothèse mendélienne séparément sur chaque niveau de l’exposition, car l’inférence de l’interaction se base sur le degré de la déviation aux proportions attendues entre chaque strate d’exposition. Ainsi, cette analyse est essentiellement applicable aux maladies précoces (early onset), tout d’abord pour des raisons inhérentes au schéma d’étude nécessitant la présence des deux parents et la disponibilité des génotypes, puis pour écarter l’influence de facteurs pouvant perturber l’hypothèse mendélienne au cours du temps (exemple, la survie de sujets liée au génotype). Une seconde hypothèse est nécessaire à la validité de ce modèle : l’exposition d’un sujet doit être indépendante de son génotype conditionnellement aux génotypes des parents. Cette hypothèse est moins forte que l’hypothèse appliquée à la population générale requise pour le schéma d’étude cas-seuls (Witte et al. 1999). Quand l’allèle d’intérêt prédispose à une exposition et crée ainsi une structure dans la population, il en résulte une sur-représentation de sujets-cas porteurs de l’allèle dans chaque famille exposée. Les inférences étant basées sur le nombre de familles, une apparente distorsion mendélienne apparaît, et produit un contraste de distorsion mendélienne entre les familles exposées et non exposées. Par exemple, la source de dépendance entre l’exposition et le génotype pourrait être l’histoire familiale positive d’antécédents de la maladie. Cependant, il est important de distinguer quels membres de la famille sont impliqués : si l’exposition maternelle est influencée par la présence d’antécédents parmi ses frères et sœurs, parents, grands-parents ou cousins, et non par la présence de la maladie chez ses enfants, ceci n’inclut pas de biais dans l’évaluation d’une interaction gène-environnement par l’approche cas-parents (Thomas 2000). L’approche cas-parents ne permet pas d’estimer l’effet propre du facteur environnemental. Elle examine l’interaction gène-environnement simplement par la comparaison des risques relatifs génétiques estimés parmi les familles exposées et les familles non exposées. Par conséquent, il n’est pas possible de distinguer si l’exposition a un effet neutre en l’absence du génotype d’intérêt et un effet délétère en présence de ce génotype, ou si l’exposition a un effet bénéfique en l’absence du génotype d’intérêt et un effet neutre en présence de ce génotype. Le schéma d’étude cas-parents présente une puissance du test de l’effet génétique supérieure au schéma cas-témoins dans la majorité des situations (lorsqu’il est indemne de biais de stratification de population) (Witte et al. 1999). En revanche, cette efficacité relative est moins évidente lorsqu’il s’agit d’un test d’interaction gène-environnement. A un nombre d’enfants-cas fixé, Schaid (1999b) montre que l’approche cas-parents offre une puissance comparable ou légèrement supérieure à l’approche cas-témoins (non appariée) de détecter la présence d’une interaction gène-environnement. Witte et al. (1999), puis Gauderman 2002), comparent l’efficacité d’évaluation d’une interaction entre les schémas d’étude appariés suivants : cas-témoins, cas-sibs (le sib est un frère ou une sœur), cas-cousins et cas-parents (ou pseudo-sibs). A partir de multiples possibilités de modèles, Gauderman (2002) montre que l’approche cas-sibs et cas-parents nécessitent un nombre de séries appariées plus faible que l’approche cas-témoins pour atteindre la même puissance. L’approche cas-sibs serait particulièrement plus puissante pour un mode de transmission dominant, tandis que le mode récessif convient mieux à l’approche cas-parents. Enfin, l’approche cas-sibs serait plus adaptée que l’approche cas-parents aux gènes les plus rares.
.D Tableau-bilan de l’évaluation d’une interaction gène-environnment Tableau 17: Caractéristiques des approches disponibles dans l'étude évaluant une interaction gène-environnement (notée GxE, avec le gène G et le facteur environnemental E)
| Cas-Témoins
| Cas-Seuls
| Cas-Parents
| Quelle population-témoin ?
| Témoins (Externes)
| Pas de témoins
| - Allèles non transmis des parents, ou
- Pseudo-sibs (ou distribution attendue des génotypes selon les génotypes des parents)
| Hypothèse associée à la population-témoin
| Population des témoins « génétiquement équivalente » à celle de la population-source des cas
|
| Transmission mendélienne
| Hypothèse associée à la mesure de l’interaction GxE
|
| Pas de lien entre G et E dans la population générale
| - Indépendance entre G et E, conditionnellement aux génotypes parentaux
- Hypothèse mendélienne sur chaque strate de E
| Sensibilité (impliquant un biais potentiel dans l’estimation d’une interaction GxE) des approches à …
| … une stratification génétique de la population
| Oui
| Oui
| - Oui, si évaluation de GxE par transmission allélique
- Non, si conditionnement sur « profils génétiques des parents »
| … une distorsion de l’hypothèse de transmission mendélienne dans la population générale
| Equivalent à un biais de sélection. Exemple : la survie des sujets associée à G
| Non
| Oui, s’il existe un contraste entre les strates du facteur environnemental
| … un lien entre le gène G de l’enfant et son exposition E dans la population générale
| Non
| Oui
| Non
(Oui, si l’exposition est influencée par le gène de l’enfant : situation impossible dans cette étude, car il s’agit d’une exposition in utero)
| Difficulté d’interprétation d’une interaction GxE liée à …
| … un déséquilibre de liaison entre le locus marqueur et le locus de la maladie
| Oui
| Oui
| Oui
| … un déséquilibre de liaison entre le locus marqueur et un locus associé à E
| Non
| Oui
| Non
| … la présence d’un effet du génotype maternel
| Oui
| Oui
| - Oui, si évaluation par transmission allélique
- Non, si conditionnement sur « profils génétiques » des parents
| .EMesure des effets d’empreintes parentales Les effets du génotype maternel, présentés jusqu’à présent dans ce projet, correspondent à des influences génétiques sur l’environnement intra-utérin du fœtus, ou, plus généralement, à des influences génétiques non héritées par l’enfant. Une empreinte parentale est définie par l’influence génétique d’un allèle sur le risque de maladie de l’enfant différente selon l’origine maternelle ou paternelle de cet allèle. Par exemple, il a été observé que l’expression d’un allèle peut être différente selon s’il est hérité de la mère ou du père. Les premiers tests qui ont proposé de mesurer l’effet d’empreinte parentale sont le TDTM vs F (le TDT Mothers versus Fathers) et le TAT (Transmission Asymmetry Test). Le premier consiste à stratifier l’étude de la transmission allélique selon le sexe du parent hétérozygote et à comparer les taux de transmissions alléliques par un test du Khi-deux standard. Le principe du TAT est équivalent ; il exclut cependant les familles pour lesquelles les deux parents sont hétérozygotes dans le but de vérifier les conditions d’indépendance entre les unités statistiques. Ces deux tests ne sont, toutefois, pas valides en présence d’effets du génotype maternel (Weinberg 1999b). Une alternative à ces tests, adaptée à la possibilité d’une présence d’effets du génotype maternel, est le PO-LRT (Parental-of-Origin Likelihood Ratio Test). Ce test est proposé par Weinberg (1999b). Le calcul de ce test s’appuie sur les trois profils génétiques de couple parental pour lesquels la mère et le père n’ont pas le même génotype. Le modèle proposé exprime la probabilité que la mère porte un nombre de copies de l’allèle d’intérêt supérieur au père (M>P) en fonction de l’effet d’empreinte maternelle et des effets propres du génotype de la mère. Il s’écrit : logit p(M>P/profil parental, C) = α I(C=1) + β I(M+P>1) + γ [I(M+P=1) – I(M+P>2)]
où M, P et C sont les nombres de copies de l’allèle d’intérêt porté par, respectivement, la mère, le père et l’enfant, I définit une variable indicatrice. La présence d’un effet d’empreinte parentale se mesure par la significativité du coefficient α (testée par le test usuel du rapport de vraisemblance, Ho : α=0). Le conditionnement sur les profils parentaux et le nombre de copies d’allèles portés par l’enfant permet d’évaluer l’effet de l’empreinte parentale de façon statistiquement indépendante des effets potentiels du génotype maternel. Cette robustesse du test lui procure néanmois une puissance statistique modeste. D’autres auteurs s’intéressent à un effet possible d’empreinte parentale, les tests proposés sont plus puissants mais ne permettent pas d’évaluer cet effet indépendant d’une influence génétique maternelle (Eaves and Sullivan 2001, Cordell et al. 2004).
4
|