1

Regresión Lineal

MACHINE LEARNING

Machine Learning

1.2 - El modelo de Regresión Lineal

Tomemos el caso de la altura e intentemos crear un algoritmo que nos permita predecir la estatura de una determinada persona a partir de una variable de la que sospechamos que exista una relación: el peso.

El material con el que partimos es un conjunto de estimaciones ya realizadas, mostradas en la gráfica como puntos sobre el plano. Esto es algo característico de la regresión lineal y en general de todo el Machine Learning: necesitamos datos del mundo real con los que trabajar. Cada dato de nuestra distribución -el par variable independiente/dependiente o en nuestro caso «peso»/»altura»- se denomina instancia o feature en la literatura inglesa.

Matemáticamente, nuestro objetivo es hallar el valor de un parámetro, que llamaremos θ _{1}, el cual multiplica a la variable independiente x «peso». Este parámetro cuantifica la relación entre ambas variables y es esperable que sea positivo (θ _{1} >0), es decir, que refleje que, a mayor peso, mayor altura.

Además de este parámetro es necesario incluir un segundo parámetro θ _{0}, el cual permite afinar aun más nuestras predicciones. Finalmente, todo ello da forma a nuestro modelo de regresión lineal que devolverá una predicción \hat{y} de la variable dependiente:

\hat{y} = θ _{0} + θ _{1}x

Esta expresión es un ejemplo de ecuación lineal, una ecuación que si la graficamos nos devuelve una línea recta sobre el plano.

θ _{0} 110
θ _{1} 1.1

\hat{y}:

= 110 + 1.1x

Imaginemos que hemos tomado el peso y la altura de una clase de 24 alumnos. Nuestro objetivo es crear un modelo que cuantifique la relación entre estas variables y, en última instancia, pueda ser usado para realizar predicciones con otros sujetos que no sean los mismos alumnos. En la gráfica de arriba podréis ver el modelo en forma de ecuación lineal y comprobar como  podemos modificarlo manipulando sus dos parámetros. θ _{1} define la pendiente de la recta, cuanto sube o baja, mientras que θ _{0} determina el punto de corte con el eje vertical.

Los elementos interactivos solo se encuentran disponibles en versión escritorio o tablet