Exemple d’application :
Soient 2 séries de données :
- la série X représentant les altitudes en m.n.m :
196 1278 917 1650 150 124 1451 1100 330 140 1450 1300 1050 1040 1220 1000 908
1125 513 1345
- la série Y représentant les totaux annuels des précipitations en mm mesurées en différentes stations pluviométriques :
118 470 277 532 92 134 455 327 159 100 306 354 273 410 484 451 500 515 270 680
Questions : - Y’ a-t-il liaison entre ces 2 séries ?
Réponse : oui
- Quel type de liaison s’il y’en a ?
Réponse : Liaison stochastique linéaire
- S’il existe une régression linéaire simple entre ces deux séries, trouvez les
paramètres de la droite de régression a0 et a1 tels que y=a0 + a1x + e
ou yx = a0 + a1x (utiliser la méthode des moindres carrés !)
L’utilisation de la méthode des moindres carrés aboutit au système d’équations
suivant, donné sous forme matricielle :
n ∑xi a0 ∑yi
=
∑xi ∑xi2 a1 ∑xiyi
20 16942 a0 6907
=
16942 21344149 a1 7617303
Λ = n∑xi2 – (∑xi)2Λ = 20 X 21344149 – 169422 = 139851616
a0 = ( ∑yi∑xi2 - ∑xiyi∑xi) / Λ = (6907 x 21344149 – 7617303 x 16942)/ 139851616
a0 = 131,37
a1 = (-∑yi∑xi + n∑xiyi) / Λ = (-6907 x 16942 + 20 x 7617303) / 139851616
a1 = 0,25
L’ équation de la droite de régression est donc y = 131,37 + 0,25x +e
- Calculer le coefficient de corrélation r entre X et Y
Le coefficient de corrélation est égal à :
r = COV(X,Y)/ (sx . sy)
COV(X ,Y) = ∑(xi - ) ( yi - ) / n-1
Avec = 914,4 = 345,4
sx = 493,3 sy = 167,8
COV(X ,Y) = 68520,4
r = 68520,4/ (493,3 x 167,8) = 0,828
3.2 Régression linéaire multiple
Lorsque la variable Y peut être expliquée par p (>=2) variables explicatives indépendantes entre elles (ou très peu), nous sommes alors en face d’une régression multiple. Si cette régression est en plus linéaire, alors son expression est de forme :
yi = f(a0,a1,a2,….., ap ; x1,x2,….,xp) + ei
Soit sous une forme développée:
yi = a0 + a1x1 + a2x2 + …. + apxp + ei
ou
= a0 + a1x1 + a2x2 + …. + apxp
et on parle alors de régression linéaire multiple.
Les coefficients de régression a0, a1, a2, …., ap peuvent etre également estimés par la méthode des moindres carrés. Mais c’est surtout a1, a2, …., apqui sont estimés de cette façon ; le paramètre a0 peut être estimé facilement comme : a0 = - ( a1. +a2. + …. + ap . )
Pour le cas de deux variables indépendantes X1et X2, on arrive à l’équation relativement facile du plan de régression suivante :
- = . (x1 – ) + . (x2 – )
Où
r01 ˜ Coefficient de corrélation entre Y et X1
r02 ˜ Coefficient de corrélation entre Y et X2
r12 ˜ Coefficient de corrélation entre X1 et X2
σ0˜ Ecart-type de Y (estimé par s0)
σ1˜ Ecart-type de X1 (estimé par s1)
σ2˜ Ecart-type de X2 (estimé par s2)
Et le coefficient de corrélation entre la variable dépendante Y et les variables indépendantes X1 et X2 est égal à :
r0.12 = 
L’utilisation de la régression linéaire multiple suppose que les variables indépendantes soient très peu corrélées entre elles. Si ce n’est pas le cas, on réduit le nombre de variables indépendantes par la méthode dite de l’analyse en composantes principales (ACP) qui fera l’objet du dernier chapitre de ce polycopié.
4. ETUDE DES CRUES ET DES ETIAGES
Parmi les caractéristiques du régime hydrologique d´un cours d´eau et d´un bassin versant, les plus importantes sont ses extrêmes, soient les débits maxima et minima et les niveaux d´eau. L´importance de ces caractéristiques découlent de leurs conséquences pour l´activité économique, particulièrement de l´activité d´investissement, et d´autre part de conséquences catastrophiques fréquentes. C´est pourquoi, une attention particulière est prêtée par le passé par les hydrologues aux débits maxima qui ont lieu pendant les crues. Ces dernières décennies, les débits minima ont également reçu de la part des hydrologues un interêt tout particulier en raison des sécheresses á répéticion qui ont lieu. Ces débits minima surviennent pendant les périodes de sécheresse et c´est aussi pendant ces périodes que les concentrations élevées d´ímpuretés de l´eau dans les rivières ont lieu. Ceci a des conséquences graves sur l´approvisionnement en eau de la population et de l´industrie.
La détermination des extrêmes est l´une des tâches les plus importantes et en même temps les complexes de l´hydrologie.
4.1 ETUDE DES ETIAGES
Le terme de basses eaux est utilisé pour les débits les plus bas enregistrés pendant la période de sécheresse. La notion de basses eaux représente la période du régime hydrologique pendant laquelle il y´a insuffisance pour la satisfaction des besoins socioéconomiques.
Les débits des basses eaux (ou débits d´étiages) sont considérés comme des débits extrêmes.
Les débits d´étiages sont étudiés en relation avec leur durée. Donc, l´étude des débits d´étiages consistera toujours á estimer et les débits minima et leurs durées. Donc la varible étudiée est une variable couplée débit – durée.
4.1.1 Quelques notions sur les débits caractéristiques
Les caractéristiques des débits d´étiage sont :
Le débit minimal absolu est le débit moyen journalier le plus faible observé pendant une longue période. Son occurrence est de nature exceptionnelle et du point de vue probabilité de dépassement, il n´est pas bien déterminé.
Le débit minimal pour une durée choisie est le débit moyen journalier le plus faible. Comme durée choisie on considère soit l´année, la saison ou le mois.
Le débit minimal moyen pour une durée choisie est la moyenne des débits minima journaliers pour longue période d´observations ( n- années), il est exprimé comme Qmin,a = ∑Qmin,i / n
Ce débit représente la caractéristique fondamentale des débits minima. Il peut être estimé du point de vue probabiliste.
Les eaux de m-jours, où m représente le nombre de jours dans l´année où le débit est dépassé ou atteint(10,30,60, 90 jours,……355 jours, ...etc.).
Durée des débits d´étiages (jours) est une caractéristique importante du régime des basses eaux. En effet, selon l’importance des prises d’eau du cours d’eau pour des besoins de l’économie nationale et selon l’importance du cours d’eau, on détermine la borne supérieure du débit des basses eaux, par ex. Q355(ou un autre débit). La borne supérieure constitue d’habitude le débit ou le niveau d’eau, important du point de vue sanitaire ou biologique du cours d’eau.
Estimation probabiliste des caractéristiques hydrologiques des débits d´étiage
L’estimation probabiliste des caractéristiques du régime des basses eaux permet d’évaluer le degré de leur importance. Par estimation probabiliste on peut exprimer la probabilité d’occurrence, probabilité au dépassement ou la période de retour de cet évènement. Les débits minimaux de période de retour n-années (par ex les basses eaux de 100 années - Qmin,100, de 50 années Qmin,50,….etc.) sont traités de la meme manière que les débits maximaux correspondants.
Le degré d´équilibre des débits d´étiages
La courbe de la fonction de répartition des probabilités au dépassement des débits moyens journaliers nous donne une bonne information sur le régime des basses eaux et sur le degré d’équilibre du cours d’eau.
4.1.2Le tarissement – la courbe de tarissement
Le tarissement est la décroissance des débits pendant la période sans précipitations. La courbe de tarissement est définie comme la partie descendante de la courbe des débits (à partir de la fin de la décrue) correspondant à la période sans pluie. La courbe de tarissement est utilisée pour la prévision des débits et des volumes pendant la période de sécheresse pour la prévision des débits d’étiage, pour la résolution des modèles pluie-débit, pour la résolution du rapport entre l’écoulement de surface et l’écoulement souterrain, pour la détermination des réserves d’eau dans le réseau hydrographique, pour la détermination des hauteurs de pluie effective, ….etc.
Différents auteurs ont proposé des formules pour exprimer la courbe de tarissement. Pour :
Maillet Qt = Q0 /(1+β.t)2
Boussinesque Qt = Q0 e-αt
Où
Qt est le débit au temps t
Q0 est le débit initial (parfois pris pour débit max journalier si t est jours)
α et β coefficients d’épuisement des réserves.
4.2 ETUDE DES CRUES
L´étude des crues peut être approchée de différentes manières; soit par l´utilisation des méthodes statistiques, soit par les méthodes analytiques, en particulier la méthode de l´hydrogramme unitaire.
4.2.1 Méthodes statistiques
Parmi les méthodes statistiques les plus utilisées pour la détermination du débit maximal de crue, on peut citer:
La méthode des maxima annuels qui consiste à choisir un débit maximal par année et puis de procéder au traitement statistique permettant d´estimer le débit correspondant à une prériode de retour T,
La méthode dite de «Renouvellement» qui consiste à chosir non pas un seul débit par année mais tous les débits à partir d´un certain seuil,
La méthode du gradex qui repose sur la connaissance des débits et des précipitations
Méthode régionales
4.2.2 Analyse de l´onde de crue – Hydrogramme unitaire
Les débits et les niveaux d´eau les plus élevés sont atteints pendant les crues. Une crue est augmentation temporaire du niveau d´eau dans la rivière au-dessus du niveau des berges. On appelle onde de crue la courbe des débits (surtout la variation des débits en fonction du temps) ou hydrogramme á un profil donné du cours d´eau. Cet hydrogramme est caractérisé par la forme, le volume et le sommet qui est le débit maximal instantané au cours d´une crue.
La courbe simple de l´hydrogramme est une courbe asymptotique et a une forme en cloche (Fig. 4.1.2). Elle est constituée de ces différentes parties:
la courbe de concentration (de montée),
la culmination, soit la partie comprise entre la fin de montée et le début de décrue,
Courbe de décrue partie de la diminution rapide des débits,
Courbe de tarrissement, soit la partie représentant l´épuisement des réserves d´eau des grandes profondeurs du BV
tm P
Courbe de concentration
tp Courbe de décrue
B Courbe de tarissement
A
td tep
tc
tb
Figure 4.1.2 Parties constitutives d´une onde de crue.
Du point de vue de la durée de la crue, il est utile d´éclaircir les caractéristiques suivantes:
a) la durée de montée tm est le temps compris entre le début d´une augmentation claire
de l´écoulement superficiel (niveau d´eau) dans le profil donné et le débit maximal
instantané (Pointe,sommet) – temps correspondant à la courbe de montée
b) la durée de décrue td temps correspondant à la courbe de décrue (entre la pointe et la
fin de l´écoulement superficiel
c) la durée de tarrissement tep est le temps correspondant à la courbe de tarrissement
d) La durée de concentration tc est le temps nécessaire à la goutte d´eau pour parcourir la
distance entre le point le plus éloigné du BV et le profil considéré. Cette durée peut être
déterminée comme le temps qui s´écoule entre la fin de la pluie efficace à la fin de
l´écoulement superficiel
e) le temps de retard de l´écoulement est l´intervalle de temps entre le centre de gravité
des pluies efficaces et la courbe des débits
f) la durée de l´écoulement superficiel tp est la durée entre le début de l´augmentation
nette et la fin de l´écoulement superficiel
La méthode de l´hydrogramme unitaire (unit hydrograph) a été mise au point par l´hydrologue américain K. Sherman en 1932. La méthode est très utilisée aux USA, mais moins en Europe et dans le reste du monde quelques années après sa conception.
La méthode de l´hydrogramme unitaire permet sur la base des données des précipitations indirectement de déterminer l´évolution de l´écoulement et ses paramètres, par exemple le débit maximal instantané. La méthode s´applique aux petits et moyens bassins versants (jusqu´à 5000 km2). La méthode de l´hydrogramme unitaire est une méthode de transformation de la fonction des précipitations H(t) en débits Q(t). Concrètement il y va de la transformation des précipitations efficaces He(t) par le graphe de sitribution de l´écoulement q(t)- hydrogramme unitaire en débits Q(t). L´hydrogramme unitaire est une fonction des propriétés du bassin versant.
5. ANALYSE EN COMPOSANTES PRINCIPALES
5.1 INTRODUCTION
Parmi les méthodes de l´analyse factorielle, l´analyse en composantes principales (abr. ACP) occupe une place prépondérante. L´ACP est une méthode de réduction de variables. L´ACP tend á transformer un grand nombre de variables d´origine en un nombre réduit de variables indépendantes qui ont leur interprétation objective. Donc le but principal est la réduction par une transformation linéaire du nombre de variables d´origine, souvent correlées en un nombre réduit de facteurs orthogonaux mutuellement non correlés, appelés composantes principales.
L´objectif d´une ACP est de : à partir d’une matrice rectangulaire de données de p variables quantitatives (p colonnes) et n unités statistiques–individus (n lignes) , de pouvoir représenter graphiquement ces unités et ces variables et de pouvoir ensuite les interpréter. On cherchera donc si l’on peut distinguer des groupes dans l’ensemble desunités ou l´ensemble des variables en regardant quelles sont celles qui se ressemblent ou celles qui se distinguent ou bien pour les variables celles qui sont correlées entre elles de celles qui ne le sont pas. 5.2 PREPARATION DES DONNÉES
Pour la préparation des données on doit tout d´abord décider du choix des attributs quantitatifs qu´on doit mesurer (ou observer) sur chaque unité (individu). On fait également le choix sur le nombre d´unités à prendre en compte. Supposons, à titre d´exemple, d´étudier la réussite des étudiants pendant un cursus universitaire. Ainsi, considérons n – nombre d´étudiants et Xp les matières prises en compte ( xij – la note de l´étudiant i et de la matière j).
Un autre exemple peut etre n bassins versants sur lesquels on mesure p caractéristiques (précipitations, écoulements, inclinaison, couverture forestière,...etc.).
Soit donc la matrice X formée de données obtenues par des mesures effectuées sur n unités statistiques (u1, u2, .....un). Les mesures effectuées sur ces unités concernent p variables (X1, X2, .............Xp) quantitatives. La matrice X est donc de la forme:
X1 X2 X3 ..........Xj.........Xp
u1 x11 x12 x13 .........x1j .......x1p
u2 x21 x22 x23 .........x2j.......x2p
X = . . . . .... . ..... .
ui xi1 xi2 xi3 .........xij ........xip
. . . . ..... . ..... .
un xn1 xn2 xn3 .........xnj .......xnp
5.3 MATRICE DES COVARIANCES
On appelle matrice de covariance empirique de p variables quantitativesv1,v2, ..., vj , ..., vp
mesurées sur un ensemble de n unités, la matrice à p lignes et p colonnes contenant sur
sa diagonale principale les variances empiriques des p variables, et ailleurs, les covariances
empiriques de ces variables deux `a deux :
Var(v1) Cov(v1, v2).......Cov(v1, vj) . . . Cov(v1, vp) Cov(v2, v1) Var(v2) ..........Cov(v2, vj) . . . Cov(v2, vp)
...... .... ... ∑ = Cov(vj , v1) Cov(vj , v2) . . ....Var(vj) . . . . . Cov(vj , vp) . . . ..... ..... .... Cov(vp, v1) Cov(vp, v2) . . . Cov(vp, vj) . . . Var(vp)
5.4 RECHERCHE DES VALEURS PROPRES
5.5 TAUX D´INFORMATION |