La régression linéaire permet de modéliser une variable réponse Y continue à partir d’une variable explicative X continue.
Le modèle associé à la régression linéaire s’exprime au travers de la formule suivante,
Y = aX + B + ε
La plus populaire de toutes les méthodes d'estimation des coefficients a et b; demeure celle des moindres carrés.
Le R (ou coefficient de correlation) offre un indicateur statistique de la modélisation du modèle et notamment de sa capacité à coller aux données réelles utilisées pour le construire. Le R varie entre [-1,1] et plus il s’approche de ses bornes, meilleur est le modèle.
Le test de régression sur l'ordonnée à l'origine permet de tester la validité du modèle par rapport au modèle Y = aX où b est = à 0 (H0). Le test de régression permet, en outre, de vérifier la validité d'un modèle pour lequel b serait ≠ 0.
Si la condition de normalité n'est pas respectée, on s'orientera vers un test non-paramétrique (pour variable indépendante ordinale) tel que le test de Spearman ou la régression logistique.