Significancia Global
La significancia global en un modelo de regresión lineal se refiere a si al menos uno de los predictores en el modelo está relacionado significativamente con la variable de respuesta. En otras palabras, la significancia global indica si el modelo en su conjunto es estadísticamente significativo.
Para evaluar la significancia global, se utiliza el análisis de varianza (ANOVA) para comparar la variabilidad explicada por el modelo con la variabilidad no explicada. La hipótesis nula es que todos los coeficientes de regresión son iguales a cero, lo que significa que el modelo no tiene efecto sobre la variable de respuesta. La hipótesis alternativa es que al menos un coeficiente de regresión es diferente de cero, lo que significa que el modelo tiene un efecto significativo sobre la variable de respuesta.
El valor p de la prueba ANOVA se utiliza para evaluar la significancia global del modelo. Si el valor p es menor que el nivel de significancia predefinido (por ejemplo, 0.05), entonces se rechaza la hipótesis nula y se concluye que el modelo en su conjunto es estadísticamente significativo.
Es importante tener en cuenta que la significancia global no indica la importancia relativa de cada predictor en el modelo. Para evaluar la importancia relativa de cada predictor, se utilizan las pruebas de significancia individual de los coeficientes de regresión.
Ejemplo:
Supongamos que tenemos los siguientes datos:
X | Y |
---|---|
1 | 2 |
2 | 4 |
3 | 5 |
4 | 7 |
5 | 6 |
Queremos determinar si la variable X tiene un efecto significativo sobre la variable Y. Para ello, ajustamos un modelo de regresión lineal simple utilizando la fórmula Y = b0 + b1X. Obtenemos los siguientes resultados:
Coeficiente | Estimado | Error estándar | Valor t | Valor p |
---|---|---|---|---|
Intercepto | 1,400 | 1,088 | 1,286 | 0,268 |
X | 1,020 | 0,243 | 4,199 | 0,012 |
La significancia global se evalúa mediante una prueba de ANOVA. La tabla ANOVA es la siguiente:
Fuente de variación | Suma de cuadrados | Grados de libertad | Cuadrado medio | Valor F | Valor p |
---|---|---|---|---|---|
Modelo | 23,760 | 1 | 23,760 | 17,637 | 0,012 |
Residual | 5,000 | 3 | 1,667 | ||
Total | 28,760 | 4 |
La hipótesis nula es que el modelo no tiene efecto sobre la variable de respuesta, es decir, que b1 = 0. La hipótesis alternativa es que el modelo tiene efecto sobre la variable de respuesta, es decir, que b1 ≠ 0.
El valor F se calcula dividiendo la suma de cuadrados del modelo por sus grados de libertad y dividiendo la suma de cuadrados residual por sus grados de libertad. En este caso, el valor F es 17,637. El valor p asociado a este valor F es 0,012.
Como el valor p es menor que el nivel de significancia predefinido de 0,05, se rechaza la hipótesis nula y se concluye que el modelo en su conjunto es estadísticamente significativo. Por lo tanto, podemos decir que la variable X tiene un efecto significativo sobre la variable Y.
Comentarios
Publicar un comentario