19 Regresión con coeficientes de regresión estandarizados
En este capítulo se muestra cómo obtener los coeficientes estandarizados para un modelo de regresión lineal múltiple.
Para obtener los coeficientes estandarizados se va a usar la función myCoefficients(lm.model, dataset)
y el paquete car creado por John Fox, Weisberg, and Price (2023).
Para poder usar la función se debe correr el siguiente código:
library(car)
source("https://raw.githubusercontent.com/fhernanb/Trabajos_Est_2/main/Trabajo%201/funciones.R")
Ejemplo
En este ejemplo se busca encontrar un modelo de regresion lineal que explique la variable respuesta \(y\) en función de las covariables \(x_1\) a \(x_{11}\), los datos provienen del ejercicio 9.5 del libro de Montgomery, Peck and Vining (2003).
A continuación se muestra el encabezado de la base de datos y la definición de las variables.
Nota: Type of transmission (1=automatic, 0=manual).
Ajustar un modelo de regresión en el cual los coeficientes estimados se puedan comparar directamente.
Solución
Antes de iniciar es necesario revisar si hay NA's
y eliminarlos.
## y x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11
## 22 21.47 360.0 180 290 8.4 2.45 2 3 214.2 76.3 4250 1
## 23 16.59 400.0 185 NA 7.6 3.08 4 3 196.0 73.0 3850 1
## 24 31.90 96.9 75 83 9.0 4.30 2 5 165.2 61.8 2275 0
## 25 29.40 140.0 86 NA 8.0 2.92 2 4 176.4 65.4 2150 0
## 26 13.27 460.0 223 366 8.0 3.00 4 3 228.0 79.8 5430 1
Ahora ajustamos el modelo en la forma tradicional.
Luego aplicamos la función myCoefficients
al modelo mod
ajustado antes.
## The following objects are masked _by_ .GlobalEnv:
##
## x1, x2, y
## The following objects are masked from table.b3 (pos = 4):
##
## x1, x10, x11, x2, x3, x4, x5, x6, x7, x8, x9, y
## Estimated and standardized coefficients, their 95% CI's and VIF's
## Estimation Coef.Std Limit_2.5% Limit_97.5% Vif
## (Intercept) 17.339837796 0.00000000 -46.43443817 81.114113759 0.000000
## x1 -0.075588173 -1.39951643 -0.19396794 0.042791594 119.487804
## x2 -0.069162672 -0.49519344 -0.25360373 0.115278389 42.800811
## x3 0.115117110 1.51763260 -0.07000235 0.300236574 149.234409
## x4 1.494736629 0.06988749 -5.02119752 8.010670778 2.060036
## x5 5.843494528 0.47402632 -0.77112903 12.458118083 7.729187
## x6 0.317583298 0.05441838 -2.39043536 3.025601953 5.324730
## x7 -3.205389852 -0.32998716 -9.73754540 3.326765695 11.761341
## x8 0.180811422 0.59088742 -0.09294007 0.454562918 20.917632
## x9 -0.397945211 -0.35207546 -1.07750158 0.281611161 9.397108
## x10 -0.005115293 -0.77480686 -0.01750293 0.007272338 85.744344
## x11 0.638482730 0.04576200 -5.70983208 6.986797539 5.145052
En la segunda columna de la salida anterior están los coeficientes \(\beta\) y en la tercera columna están los coeficientes estandarizados \(\beta^\star\). La variable más importante en el modelo es x3, seguida de x1 porque sus \(\beta^\star\) son los más grandes en valor absoluto.
La última columna de la tabla contiene los VIF, los cuales son una medida de multicolinealidad.