Skip to content
RBJLabs ®

Análisis de regresión

El análisis de regresión es un tema muy interesante que muchas veces la utilidad que le vemos es nula, algunas personas como tú sí que le ven una gran utilidad al análisis de regresión ya que la estadística es una herramienta muy útil para modelar ecuaciones. Y en el análisis de regresión analizaremos un experimento, así que recordemos que el fin último de un experimento es lograr predecir el comportamiento de un determinado fenómeno, el cual puede ser representado en una gráfica de regresión.

Al realizar un experimento, se obtienen pares de datos (X,Y) que se colocan en un plano cartesiano y así estos puntos forman un diagrama de dispersión.

Los puntos pueden aproximarse a una curva de tal forma que se ajuste al comportamiento de los fenómenos. Además, esta curva puede ser de muchos tipos, como parábola, exponencial o geométrica.

Regresión lineal simple

Este tipo de regresión emplea la variable independiente (x) y una variable dependiente (y) para una población.

Supongamos que la relación entre ambas es una línea recta, por lo tanto, la recta puede escribirse de la siguiente forma:

Y = \beta_{0} + \beta_{1}x

Un experimento consiste de resultados aleatorios, es decir, no podemos predecir exactamente qué valor será el medido a partir de la variable independiente. A lo que se refiere que como estamos utilizando muestras obtenidas por un experimento, los datos se refieren a estimaciones, dando como resultado la siguientes gráfica:

\hat{y} =\hat{\beta}_{0} + \hat{\beta}_{1}x

Cómo calcular los coeficientes de regresión

\hat{y} es la recta de regresión, pero ese \hat{y} está igualado a otras cosas, que son \hat{\beta}_{0} más \hat{\beta}_{1}x, y para hallar los valores de \hat{\beta}_{0} y de \hat{\beta}_{1}, te daremos de una vez las fórmulas para que calcules esos valores llamados coeficientes de regresión. Tranquilízate, las fórmulas están un poco tediosas de dónde vienen, pero no son tan tediosas de resolver:

\hat{\beta}_{1} = \cfrac{n\sum xy - \left[ \left( \sum x\right)\left(\sum y \right)\right]}{n\sum x^{2} - \left( \sum x \right)^{2}}

\hat{\beta}_{0} = \bar{y} - \hat{\beta}_{1}\bar{x}

Algunas consideraciones de la recta de regresión

  • No uses la recta de mínimos cuadrados cuando los datos no son lineales.
  • Los estimadores no son lo mismo que los valores verdaderos
  • Que exista una relación no indica que existe causalidad entre ambos.

Ejemplo de análisis de regresión

Vamos con el enunciado:

En este ejemplo de recta de regresión que veremos, se midió el peso inercial (en toneladas) y el ahorro de combustible (en milla/galón) para una muestra de siete camiones de Diesel, predice qué tan diferentes son los millajes de los camiones si tienen una diferencia de 5 toneladas. En la siguiente tabla se presentan los resultados:

\begin{array}{| l | l |}
\hline
\text{Peso }(x) & \text{Millaje } (y) \\
\hline
8\text{.}00 & 7\text{.}69 \\
24\text{.}50 & 4\text{.}97 \\
27\text{.}00 & 4\text{.}56 \\
14\text{.}50 & 6\text{.}49 \\
28\text{.}50 & 4\text{.}34 \\
12\text{.}75 & 6\text{.}24 \\
21\text{.}25 & 4\text{.}45 \\
\hline
\end{array}

Muy bien, lo que se puede observar es que el peso es la variable independiente x y el millaje es la variable dependiente y. Ahora, para hacer el cálculo de la recta de regresión, hacen falta los elementos de los coeficientes de regresión, así que hace falta \sum x, \sum y, \sum xy, \sum x^{2} y (\sum x)^{2}

Vamos a determinar primero las sumatorias de x y de y:

\begin{array}{| c | c |}
\hline
\text{Peso } (x) & \text{Millaje } (y) \\
\hline
8\text{.}00 & 7\text{.}69 \\
24\text{.}50 & 4\text{.}97 \\
27\text{.}00 & 4\text{.}56 \\
14\text{.}50 & 6\text{.}49 \\
28\text{.}50 & 4\text{.}34 \\
12\text{.}75 & 6\text{.}24 \\
21\text{.}25 & 4\text{.}45 \\
\hline
\sum x = 136\text{.}5 & \sum y = 38.74\\
\hline
\end{array}

Ahora vamos a multiplicar x por y y vamos a calcularle la sumatoria:

\begin{array}{| c | c | c |}
\hline
\text{Peso }(x) & \text{Millaje } (y) & xy \\
\hline
8\text{.}00 & 7\text{.}69 & 61\text{.}52\\
24\text{.}50 & 4\text{.}97 & 121\text{.}765\\
27\text{.}00 & 4\text{.}56 & 123\text{.}12 \\
14\text{.}50 & 6\text{.}49 & 94\text{.}105 \\
28\text{.}50 & 4\text{.}34 & 123\text{.}69 \\
12\text{.}75 & 6\text{.}24 & 79\text{.}56 \\
21\text{.}25 & 4\text{.}45 & 94\text{.}5625 \\
\hline
& & \sum xy = 698\text{.}3225 \\
\hline
\end{array}

Luego vamos a calcular la sumatoria del cuadrado de x:

\begin{array}{| c | c | c |}
\hline
\text{Peso }(x) & \text{Millaje }(y) & x^{2} \\
\hline
8\text{.}00 & 7\text{.}69 & 64 \\
24\text{.}50 & 4\text{.}97 & 600\text{.}25 \\
27\text{.}00 & 4\text{.}56 & 729 \\
14\text{.}50 & 6\text{.}49 & 210\text{.}25 \\
28\text{.}50 & 4\text{.}34 & 812\text{.}25 \\
12\text{.}75 & 6\text{.}24 & 162\text{.}5625 \\
21\text{.}25 & 4\text{.}45 & 451\text{.}5625 \\
\hline
& & \sum x^{2} = 3029\text{.}875 \\
\hline
\end{array}

Seguidamente vamos a calcular la sumatoria del cuadrado de y:

\begin{array}{| c | c | c |}
\hline
\text{Peso }(x) & \text{Millaje }(y) & y^{2} \\
\hline
8\text{.}00 & 7\text{.}69 & 59\text{.}1361 \\
24\text{.}50 & 4\text{.}97 & 24\text{.}7009 \\
27\text{.}00 & 4\text{.}56 & 20\text{.}7936 \\
14\text{.}50 & 6\text{.}49 & 42\text{.}1201 \\
28\text{.}50 & 4\text{.}34 & 18\text{.}8356 \\
12\text{.}75 & 6\text{.}24 & 38\text{.}9376 \\
21\text{.}25 & 4\text{.}45 & 19\text{.}8025 \\
\hline
& & \sum y^{2} = 224\text{.}3264 \\
\hline
\end{array}

Falta calcular la media de x y la media de y, calculémosla:

\bar{y} = \cfrac{\sum y}{n} = \cfrac{38.74}{7} = 5.5342

\bar{x} = \cfrac{\sum x}{n} = \cfrac{136.5}{7} = 19.5

Finalmente, tomando las ecuaciones de los coeficientes de regresión, sustituyamos todos los valores en las fórmulas:

\hat{\beta}_{1} = \cfrac{7(698.3225)-[(136.5)(38.74)]}{7(3029.875) - 18632.25} = - 0.1551

\hat{\beta}_{0} = \bar{y} - \hat{\beta}_{1}\hat{x} = 5.5342 - ( - 0.1551)(19\text{.5}) = 8.5593

Finalmente nuestra recta de regresión quedará de la siguiente manera:

\hat{y} = 8.5593 - 0.1551x

Predice qué tan diferentes son los millajes de dos camiones de diferencia de 5 toneladas

Para hacer esta parte del ejercicio, se tomaron dos valores de x con una diferencia de 5 toneladas y se sustituyeron en la ecuación de la recta que se halló, así que se tomaron valores de x = 9 y x = 14:

x = 9

\hat{y} = 8.5593 - 0.1551(9) = 7.1631

x = 14

\hat{y} = 8.5593 - 0.1551(14) = 6.3875

Seguidamente se tiene que realizar la diferencia de los dos valores obtenidos:

7.1631 - 6.3875 = 0.7756

Así que se predice que sus millajes tienen 0.7756 de diferencia si los camiones tienen 5 toneladas de diferencia.

Gracias por estar en este momento con nosotros : )