Tomemos el caso de la altura e intentemos crear un algoritmo que nos permita predecir la estatura de una determinada persona a partir de una variable de la que sospechamos que exista una relación: el peso.
El material con el que partimos es un conjunto de estimaciones ya realizadas mostradas en la gráfica como puntos sobre el plano. Esto es algo característico de la regresión lineal y en general de todo el Machine Learning: necesitamos datos del mundo real con los que trabajar.
Matemáticamente, nuestro objetivo es hallar el valor de un parámetro, que llamaremos θ _{1}, el cual multiplica a la variable independiente x «peso». Este parámetro cuantifica la relación entre ambas variables y es esperable que sea positivo (θ _{1} >0), es decir, que refleje que, a mayor peso, mayor altura.
Además de este parámetro es necesario incluir un segundo parámetro θ _{0}, el cual permite afinar aun más nuestras predicciones. Todo ello da forma a nuestro modelo de regresión lineal que devolverá una predicción \hat{y} de la variable dependiente:
\hat{y} = θ _{0} + θ _{1}x
Esta expresión es un ejemplo de ecuación lineal, una ecuación que si la graficamos nos devuelve una línea recta sobre el plano.
\hat{y} = 110 + 1.1x
\hat{y}:
En la gráfica de arriba podréis comprobar como modificar los parámetros de la ecuación modifica la recta trazada sobre el plano. θ _{1} define la pendiente de la recta, mientras que θ _{0} determina el punto de corte con el eje vertical.