19 Regresión con coeficientes de regresión estandarizados

En este capítulo se muestra cómo obtener los coeficientes estandarizados para un modelo de regresión lineal múltiple.

Para obtener los coeficientes estandarizados se va a usar la función myCoefficients(lm.model, dataset) y el paquete car creado por John Fox, Weisberg, and Price (2023).

Para poder usar la función se debe correr el siguiente código:

library(car)
source("https://raw.githubusercontent.com/fhernanb/Trabajos_Est_2/main/Trabajo%201/funciones.R")

Ejemplo

En este ejemplo se busca encontrar un modelo de regresion lineal que explique la variable respuesta \(y\) en función de las covariables \(x_1\) a \(x_{11}\), los datos provienen del ejercicio 9.5 del libro de Montgomery, Peck and Vining (2003).

A continuación se muestra el encabezado de la base de datos y la definición de las variables.

Ilustración de la base de datos.

Figure 19.1: Ilustración de la base de datos.

Nota: Type of transmission (1=automatic, 0=manual).

Ajustar un modelo de regresión en el cual los coeficientes estimados se puedan comparar directamente.

Solución

Antes de iniciar es necesario revisar si hay NA's y eliminarlos.

library(MPV)  # Aqui estan los datos
table.b3[22:26, ] # Can you see the missing values?
##        y    x1  x2  x3  x4   x5 x6 x7    x8   x9  x10 x11
## 22 21.47 360.0 180 290 8.4 2.45  2  3 214.2 76.3 4250   1
## 23 16.59 400.0 185  NA 7.6 3.08  4  3 196.0 73.0 3850   1
## 24 31.90  96.9  75  83 9.0 4.30  2  5 165.2 61.8 2275   0
## 25 29.40 140.0  86  NA 8.0 2.92  2  4 176.4 65.4 2150   0
## 26 13.27 460.0 223 366 8.0 3.00  4  3 228.0 79.8 5430   1
datos <- table.b3[-c(23, 25), ]

Ahora ajustamos el modelo en la forma tradicional.

mod <- lm(y ~ ., data=table.b3)

Luego aplicamos la función myCoefficients al modelo mod ajustado antes.

attach(table.b3)
## The following objects are masked _by_ .GlobalEnv:
## 
##     x1, x2, y
## The following objects are masked from table.b3 (pos = 4):
## 
##     x1, x10, x11, x2, x3, x4, x5, x6, x7, x8, x9, y
myCoefficients(lm.model=mod, dataset=table.b3)
## Estimated and standardized coefficients, their 95% CI's and VIF's
##               Estimation    Coef.Std   Limit_2.5%  Limit_97.5%        Vif
## (Intercept) 17.339837796  0.00000000 -46.43443817 81.114113759   0.000000
## x1          -0.075588173 -1.39951643  -0.19396794  0.042791594 119.487804
## x2          -0.069162672 -0.49519344  -0.25360373  0.115278389  42.800811
## x3           0.115117110  1.51763260  -0.07000235  0.300236574 149.234409
## x4           1.494736629  0.06988749  -5.02119752  8.010670778   2.060036
## x5           5.843494528  0.47402632  -0.77112903 12.458118083   7.729187
## x6           0.317583298  0.05441838  -2.39043536  3.025601953   5.324730
## x7          -3.205389852 -0.32998716  -9.73754540  3.326765695  11.761341
## x8           0.180811422  0.59088742  -0.09294007  0.454562918  20.917632
## x9          -0.397945211 -0.35207546  -1.07750158  0.281611161   9.397108
## x10         -0.005115293 -0.77480686  -0.01750293  0.007272338  85.744344
## x11          0.638482730  0.04576200  -5.70983208  6.986797539   5.145052

En la segunda columna de la salida anterior están los coeficientes \(\beta\) y en la tercera columna están los coeficientes estandarizados \(\beta^\star\). La variable más importante en el modelo es x3, seguida de x1 porque sus \(\beta^\star\) son los más grandes en valor absoluto.

La última columna de la tabla contiene los VIF, los cuales son una medida de multicolinealidad.

References

Fox, John, Sanford Weisberg, and Brad Price. 2023. Car: Companion to Applied Regression. https://r-forge.r-project.org/projects/car/.