article sur le Régression linéaire, Explication sur le Régression linéaire

Régression linéaire Article, Signification, Explication

   

On a représenté dans un graphe, un ensemble de points représentant des mesures d'une grandeur en fonction d'une autre , telles que la taille () des enfants en fonction de leur âge ().

Les points paraissent alignés. On peut alors tenter une régression linéaire, c'est-à-dire chercher la droite D dont l'équation est qui passe au plus près des points .

Passer au plus près, selon la méthode des moindres carrés, c'est rendre minimale la somme :

des distances des points expérimentaux originaux à la droite calculées comme la meilleure. Cela revient donc à déterminer les valeurs des paramètres et , qui sont respectivement le coefficient angulaire de la droite et son ordonnée à l'origine qui minimise la somme ci-dessus.

Table of contents
1 Formules à connaître
2 Résultat de la régression
3 Coefficient de corrélation linéaire
4 Démonstration des formules par étude d'un minimum
5 Démonstration des formules grâce aux espaces vectoriels de dimension n
6 Voir aussi

Formules à connaître

  • La moyenne des
  • La moyenne des
  • Le point moyen G a pour coordonnées
  • La variance des
  • l'écart type des
  • La variance des
  • l'écart type des
  • La covariance des

Résultat de la régression

La droite rendant minimale la somme précédente passe par le point G et a pour coefficient directeur . Son équation est donc:

Coefficient de corrélation linéaire

On peut aussi chercher la droite D' : x=a'y + b' qui rende minimale la somme :

On trouve alors une droite qui passe aussi par le point moyen G et telle que a' = . On souhaite évidemment tomber sur la même droite. Ce sera le cas si et seulement si a' = 1/a, c'est-à-dire si aa' = 1. Les droites sont confondues si et seulement si c'est-à-dire si et seulement si

On appelle cette quantité le coefficient de corrélation linéaire entre x et y. On peut démontrer que ce nombre est toujours compris entre -1 et 1.

En pratique sa valeur absolue est rarement égale à 1, mais on estime généralement que l'ajustement est valide dès que ce coefficient a une valeur absolue supérieur à

Démonstration des formules par étude d'un minimum

Pour tout réel a, on pose . Il suffit de développer et ordonner ce polynôme du second degré en b. On obtient:

Ce polynôme atteint son minimum si

Ce qui signifie que la droite passe par le point moyen G

Il reste à remplacer dans la somme de départ, b par cette valeur.

Pour tout réel a, . Il suffit de développer et ordonner ce polynôme du second degré en a. On obtient

.

Ce polynôme atteint son minimum si et seulement si

La droite de régression est bien la droite passant par G et de coefficient directeur .

Démonstration des formules grâce aux espaces vectoriels de dimension n

Dans l'espace , muni du produit scalaire canonique, on considère le vecteur X de coordonnées , le vecteur Y de coordonnées , le vecteur U de coordonnées (1, 1, ..., 1).

On peut remarquer que

On note alors le vecteur et le vecteur

Le vecteur Z de coordonnées appartient à l'espace vectoriel engendré par X et U.

La somme représente le carré de la norme du vecteur .

Cette norme est minimale si et seulement si Z est le projeté orthogonal de Y dans l'espace vectoriel vect(X,U).

Z est le projeté de Y dans l'espace vectoriel vect(X,U) si et seulement si et .

Or donc (Z-Y).U=0 signifie que .

En remplaçant dans , on obtient

donc  signifie que 


Enfin le coefficient de corrélation linéaire s'écrit alors . Cette quantité représente le cosinus de l'angle formé par les vecteurs et .

On retrouve alors les résultats suivants:

  • si le coefficient de corrélation linéaire est 1 ou -1, les vecteurs et sont colinéaires de coefficient de colinéarité et . L'ajustement linéaire est parfait.
  • si le coefficient de corrélation linéaire est en valeur absolue supérieur à alors l'angle formé par les deux vecteurs est compris entre et ou entre et .

Voir aussi


C'est un article concernant le Régression linéaire. La page contient la signification du Régression linéaire , Description et explication au sujet de Régression linéaire

recherche quelque chose