Significancia Individual

    La significancia individual en el modelo de regresión lineal se refiere a la importancia de cada variable predictora en el modelo. Para evaluar la significancia individual de una variable predictora se realiza una prueba de hipótesis para el coeficiente de regresión correspondiente a esa variable.

    La hipótesis nula establece que el coeficiente de regresión es igual a cero, lo que significa que esa variable no tiene efecto sobre la variable de respuesta. La hipótesis alternativa afirma que el coeficiente de regresión es diferente de cero, lo que significa que la variable predictora sí tiene un efecto significativo sobre la variable de respuesta.

    Para realizar esta prueba de hipótesis, se utiliza el valor t de Student y su correspondiente p-valor. Si el p-valor es menor que el nivel de significancia elegido, normalmente 0.05, se rechaza la hipótesis nula y se concluye que la variable predictora es significativa en el modelo.

    Por lo tanto, la significancia individual nos permite identificar las variables predictoras que tienen un efecto significativo sobre la variable de respuesta y que deben incluirse en el modelo.

    Un ejemplo de significancia individual en un modelo de regresión lineal sería el siguiente:

    Supongamos que se desea modelar la relación entre la cantidad de horas de estudio y la calificación obtenida en un examen. Se recolectan datos de 50 estudiantes y se ajusta un modelo de regresión lineal simple. Los resultados del análisis muestran que el coeficiente de regresión correspondiente a la cantidad de horas de estudio es 0.7, con un valor t de Student de 3.5 y un p-valor de 0.002.

    En este caso, como el p-valor es menor que 0.05, se puede concluir que la cantidad de horas de estudio es significativa en el modelo y tiene un efecto significativo en la calificación obtenida en el examen. Por lo tanto, se debe incluir esta variable predictora en el modelo final.


Ejemplo:

Supongamos que se tiene el siguiente modelo de regresión lineal simple:

Yi = β0 + β1Xi + εi

Donde Yi es la variable dependiente, Xi es la variable independiente, β0 y β1 son los coeficientes del modelo y εi es el error aleatorio.

Para probar la significancia individual del coeficiente β1, se plantea la hipótesis nula de que no existe una relación significativa entre la variable independiente y la variable dependiente, es decir:

H0: β1 = 0

Y la hipótesis alternativa es que sí existe una relación significativa:

Ha: β1 ≠ 0

Para realizar la prueba de significancia individual se utiliza la distribución t de Student, y se calcula el valor t de la siguiente manera:

t = (β1 - 0) / SE(β1)

Donde SE(β1) es el error estándar del coeficiente β1. Si el valor absoluto del estadístico t es mayor al valor crítico t(α/2; n-2), se rechaza la hipótesis nula y se concluye que el coeficiente β1 es significativamente diferente de cero.

Por ejemplo, supongamos que se tiene una muestra de n=30 observaciones, y se estima el siguiente modelo de regresión lineal simple:

Yi = 5 + 2Xi + εi

Se desea probar la significancia individual del coeficiente β1. Se calcula el valor del estadístico t:

t = (2 - 0) / 0.5 = 4

El valor crítico de la distribución t de Student para un nivel de significancia del 5% y 28 grados de libertad es de aproximadamente 2,048. Como el valor absoluto de t es mayor al valor crítico, se rechaza la hipótesis nula y se concluye que el coeficiente β1 es significativamente diferente de cero al nivel de significancia del 5%.


Comentarios

Entradas populares de este blog

Durbin-Watson

Graficos de Dispersión para los Residuos

Diagrama de Dispersión