Correction Exercices d'entrainement types Bac : Statistiques - TL

Classe: 
Terminale

Exercice 1

Le tableau donne l'évolution du pourcentage de ménages possédant au moins une voiture dans un pays A entre 1958 et 1986.

Année x 58 62 66 70 74 78 82 86
% voiture y 25.9 35.7 49 56.5 62.1 66.8 71 74.7

  1. Représenter le nuage de points

 Axe horizontal : x, l’année (utiliser 1 cm pour 2 ans ou centrer autour de 1970 pour limiter la largeur).
 Axe vertical : y, le pourcentage de ménages (échelle : 1 cm pour 5 % par exemple).
 Tracer les points (58, 25.9), (62, 35.7),, (86, 74.7)

  2. Calculs statistiques

 a) Moyennes ˉX et ˉY

On calcule les sommes des x et des y :

x=58+62+66+70+74+78+82+86=576ˉX=5768=72

y=25.9+35.7+49+56.5+62.1+66.8+71+74.7=441.7ˉY=441.78=55.21

 b) Variances V(X), V(Y), Covariance cov(X,Y)

On construit un tableau :

x y xˉX yˉY (xˉX)2 (yˉY)2 (xˉX)(yˉY)
58 25.9 -14 -29.31 196 858.36 4103.4
62 35.7 -10 -19.51 100 380.6 195.1
66 49 -6 -6.21 36 38.57 37.26
70 56.5 -2 1.29 4 1.66 -2.58
74 62.1 2 6.89 4 47.47 13.78
78 66.8 6 11.59 36 134.34 69.54
82 71 10 15.79 100 249.34 157.9
86 74.7 14 19.49 196 379.96 272.86
Totaux       672 2090.3 4847.3

Variance de X :

V(X)=6728=84

Variance de Y :

V(Y)=2090.38261.29

Covariance :

cov(X,Y)=4847.38=605.91

  3. Droite de régression de Y en X

Forme : y=ax+b, où :

 a=cov(X,Y)V(X)=605.91847.21
 b=ˉYaˉX=55.217.21×72=55.21519.12=463.91

 Équation de la droite de régression :

y=7.21x463.91

  4. Estimation pour l’année 2000

x=2000 ? Attention ! Nos années sont notées sans les deux premiers chiffres (1958 → 58), donc 2000 correspond à x = 100

y=7.21×100463.91=721463.91=257.09

 Cela dépasse 100 %, donc il faut conclure que le modèle linéaire devient irréaliste à long terme. Il est probablement valide uniquement entre 1958 et 1986.

  Conclusion

 La proportion de ménages possédant au moins une voiture a fortement augmenté entre 1958 et 1986.
 La relation entre année et pourcentage est bien linéaire sur cette période.
 Le modèle de régression obtenu permet une estimation correcte sur une courte période, mais n’est pas fiable pour des projections trop lointaines comme l’an 2000.

Exercice 2 (Bac 2000, 1er groupe, série L1 et L'1)

On étudie ici l’évolution de la tension artérielle moyenne Y en fonction de l’âge X d’une population.

Âge X 36 42 48 54 60 66
Tension Y 11.8 14 12.6 15 15.5 15.1

  1. Représenter le nuage de points

Échelles :

 1/2 cm pour 1 an → 1 cm pour 2 ans
 3 cm pour 1 unité de tension

Coordonnées des points à tracer :

 (36, 11.8), (42, 14), (48, 12.6), (54, 15), (60, 15.5), (66, 15.1)

  2.a. Moyennes et variances

Données :

 X=[36,42,48,54,60,66]
 Y=[11.8,14,12.6,15,15.5,15.1]

 Calcul de la moyenne de X :

ˉX=36+42+48+54+60+666=3066=51

 Moyenne de Y :

ˉY=11.8+14+12.6+15+15.5+15.16=846=14

 Variance de X :

V(X)=16(xiˉX)2=16[(3651)2++(6651)2]

V(X)=16[225+81+9+9+81+225]=6306=105

 Variance de Y :

V(Y)=16[(11.814)2++(15.114)2]=16[4.84+0+1.96+1+2.25+1.21]=11.2661.88

  2.b. Coefficient de corrélation r

La covariance est :

cov(X,Y)=16(xiˉX)(yiˉY)

On fait le calcul détaillé :

xi yi xiˉx yiˉy Produit
60000 11 -6000 -7.25 43500
64000 17 -2000 -1.25 2500
68000 20 2000 1.75 3500
72000 25 6000 6.75 40500

x y xˉX yˉY (xˉX)(yˉY)
36 11.8 -15 -2.2 33.0
42 14 -9 0 0
48 12.6 -3 -1.4 4.2
54 15 3 1 3.0
60 15.5 9 1.5 13.5
66 15.1 15 1.1 16.5

cov(X,Y)=33+0+4.2+3+13.5+16.56=70.2611.7

Le coefficient de corrélation :

r=cov(X,Y)V(X)V(Y)=11.71051.8811.710.251.3711.714.050.83

 Corrélation positive forte (car r0.83).

  3. Droite de régression de Y en X

Forme : y=ax+b

 a=cov(X,Y)V(X)=11.71050.1114
 b=ˉYaˉX=140.111451145.68=8.32

 Équation :

y=0.1114x+8.32

  4. Estimation pour une femme de 70 ans

x=70y=0.1114×70+8.32=7.8+8.32=16.1

 Estimation : La tension artérielle moyenne attendue est environ 16.1.

Exercice 3 (Bac 2000, 1er groupe, L2)

On donne la série statistique suivante :

Xi 1.2 1.4 1.6 1.8 2
Yi 13 12 14 16 α

Et la droite de régression de y en x est donnée par :

y=9x+0.6

  1. Calcul de ¯X

X=1.2+1.4+1.6+1.8+25=85=1.6

  2. Exprimer ¯Y en fonction de α

Y=13+12+14+16+α5=55+α5

  3. Déduire que α=20

L’idée ici est d’utiliser le fait que la droite de régression passe par le point moyen G(¯X,¯Y).

Or la droite est :

y=9x+0.6

Donc :

Y=9X+0.6=91.6+0.6=14.4+0.6=15

Mais on a aussi :

Y=55+α555+α5=1555+α=75α=20

 Donc, α=20

  4. Calcul du coefficient de corrélation linéaire

On utilise la formule :

r=cov(X,Y)V(X)V(Y)

Ou bien on utilise le fait que la droite de régression est connue y=9x+0.6, donc :

 a=9
 r=aσXσYr=cov(X,Y)σXσY=9σ2XσXσY=9σXσY

Nous devons donc calculer les variances ou les écarts-types.

On peut aussi utiliser une méthode directe avec tableau.

Données mises à jour :

X Y
1.2 13
1.4 12
1.6 14
1.8 16
2.0 20

  5. Estimer Y pour X=3.2

À l’aide de la droite de régression :

y=9x+0.6y=93.2+0.6=28.8+0.6=29.4

Exercice 4

On note :

 X : quantité de matières premières (en tonnes),
 Y : chiffre d’affaires (en millions de francs),
 Les valeurs sont :
  X=[0.9,1.2,0.6,0.5,1.4,1.0],
  Y=[37,40 ou 49,33,33,41,35]

Le deuxième mois donne une ambiguïté : deux valeurs pour Y, soit 40 ou 49. On va faire le calcul deux fois si nécessaire.

 1. Nuage de points et point moyen

Valeurs (cas avec Y=40) :

XY0.9371.2400.6330.5331.4411.035

Point moyen G(ˉx,ˉy) :

ˉx=0.9+1.2+0.6+0.5+1.4+1.06=5.660.933

ˉy=37+40+33+33+41+356=2196=36.5

 2.a. Covariance

Formule :

Cov(X,Y)=1nni=1(xiˉx)(yiˉy)

On calcule :

xi yi xiˉx yiˉy Produit
0.9 37 -0.033 0.5 -0.0165
1.2 40 0.267 3.5 0.9345
0.6 33 -0.333 -3.5 1.1655
0.5 33 -0.433 -3.5 1.5155
1.4 41 0.467 4.5 2.1015
1.0 35 0.067 -1.5 -0.1005

Total : =5.6

Cov(X,Y)=5.660.933

 2.b. Coefficient de corrélation

Formule :

r=Cov(X,Y)σXσY

On calcule :

 σ2X=16(xiˉx)2
 σ2Y=16(yiˉy)2

(xiˉx)20.0011+0.0713+0.1109+0.1874+0.2180+0.0045=0.5932σX0.09890.3146

(yiˉy)2=0.25+12.25+12.25+12.25+20.25+2.25=59.5σY9.91673.149r=0.9330.3146×3.1490.9330.9910.941

 3. a. Équation de la droite de régression

Forme : y=ax+b

a=Cov(X,Y)σ2X=0.9330.09899.44

b=ˉyaˉx=36.59.440.93336.58.8127.69

Donc :

y=9.44x+27.69

 4. Estimation de X pour Y=40

40=9.44x+27.69x=4027.699.4412.319.441.30

Donc, il faut environ 1.30 tonne de matières premières pour un chiffre d'affaires de 40 millions.

 Exercice 5

Données :

 X= salaire proposé : [60000,64000,68000,72000]
 Y= candidatures : [11,17,20,25]

 1. Nuage de points

 2. Droite de régression de Y en X

On centre les X autour de leur moyenne pour simplifier :

 ˉX=60000+64000+68000+720004=66000
 ˉY=11+17+20+254=18.25

xi yi xiˉx yiˉy Produit
60000 11 -6000 -7.25 43500
64000 17 -2000 -1.25 2500
68000 20 2000 1.75 3500
72000 25 6000 6.75 40500

Cov(X,Y)=900004=22500

σ2X=14[(6000)2+(2000)2+(2000)2+(6000)2]=880000004=22000000

a=Cov(X,Y)σ2X=2250022000000=0.001023

b=ˉyaˉx=18.250.0010236600018.2567.52=49.27

Donc, équation :

y=0.001023x49.27

 3. Estimation du salaire pour 30 candidatures

30=0.001023x49.27x=30+49.270.00102379.270.00102377533

Il doit proposer environ 77 533 F CFA pour espérer 30 candidatures.

Ajouter un commentaire