Etat de l’art des méthodes statistiques d’évaluation d’une interaction gène-environnement
Dans les études épidémiologiques traditionnelles, une interaction gène-environnement est définie comme « un effet d’un facteur environnemental sur le risque de maladie différent selon le génotype de l’individu » ou, de façon symétrique, « un effet du génotype sur le risque de maladie différent selon l’exposition des sujets au facteur environnemental ». La présence ou l’absence d’une interaction statistique s’évalue selon une échelle de mesure multiplicative ou additive. En termes de risque de maladie, il y a présence d’interaction multiplicative si l’effet conjoint de deux facteurs A et B est différent du produit des effets propres de A et B. Il y a présence d’interaction additive si l’effet conjoint de A et B est différent de la somme des deux effets propres moins un. Ainsi, en présence d’une interaction gène-environnement, les effets propres d’un caractère génétique et d’une exposition environnementale ne permettent pas de prédire l’effet observé de la présence simultanée des deux facteurs. Le choix de l’échelle de mesure a été intensivement débattu dans la littérature épidémiologique (revue rapide par Ottman 1996) ; certains auteurs recommandent l’utilisation de l’échelle multiplicative lorsque les facteurs agissent à des étapes distinctes, d’autres conseillent l’échelle multiplicative pour les recherches à visée étiologique. En l’absence de consensus, il nous semble pertinent de présenter les estimations sous la forme stratifiée afin d’observer l’hétérogénéïté des résultats, puis de préciser l’échelle utilisée lors de l’interprétation d’un résultat de test d’une interaction, comme Greenland et Rothman (1998) le recommandent. Cette définition de l’interaction gène-environnement est strictement méthodologique. L’étude statistique d’une interaction doit être accompagnée d’une interprétation biologique pour contribuer à la compréhension des mécanismes. Cependant, un modèle d’interaction statistique sur le risque d’une maladie peut être obtenu par différents modèles de mécanismes biologiques. Ottman (1990) décrit quatre modèles de relation entre un gène, une exposition environnementale et le risque d’une maladie, biologiquement plausibles et impliquant possiblement la détection statistique d’une interaction. (1) L’effet de synergie : les deux facteurs génétique et environnemental augmentent le risque de maladie chacun séparément, et le risque est plus fort si les deux sont simultanément présents. (2) Le caractère génétique étudié exacerbe l’effet du facteur de risque environnemental alors que le génotype n’a pas d’effet parmi les individus non exposés. (3) L’exposition environnementale exacerbe l’effet du gène de susceptibilité à la maladie, et n’a pas d’effet sans le génotype à risque. (4) L’interaction dite « pure » : seule la présence conjointe des deux facteurs affecte le risque. De nombreuses autres possibilités de modèles d’interaction gène-environnement existent et se complexifient en présence d’effets protecteurs des facteurs génétiques et environnementaux (Ottman 1996). Nous ciblerons cette section sur les méthodes d’analyse statistique utilisées récemment dans la discipline de l’épidémiologie intégrant les informations génétiques. Une variété de schémas d’étude et de modèles statistiques est à ce jour développée pour évaluer une association entre un gène et une maladie ou une interaction entre un gène et un facteur environnemental sur le risque d’une maladie. Cette section se limitera spécifiquement aux schémas d’étude cas-témoins et cas-parents, qui se distinguent par leur groupe de témoins, issus respectivement, d’un recueil externe si les témoins sont recrutés dans la population-source de l’étude, ou d’un recueil interne lorsque le groupe de témoins est construit à partir des informations des parents des enfants-cas. Nous passerons en revue les principales méthodes proposées dans la littérature, et tenterons de décrire leur principe de fonctionnement, leurs hypothèses, leurs limites, leur performance et faisabilité et leurs évolutions. Nous présenterons plus en détails les quelques méthodes statistiques qui nous semblent les plus adaptées au contexte du projet d’étude de malformations congénitales, comme les fentes orales.
Avant toute évaluation statistique d’une interaction gène-environnement, certains auteurs épidémiologistes privilégient l’exploitation d’un concept dénommé « la randomisation mendélienne » (Clayton et McKeigue 2001). Nous décrivons en première partie de cette section, les principes et les limites de ce concept.
|