2) Una institución educativa realizó un estudio observacional durante el último año para indagar sobre la nota promedio de los
aspirantes en la prueba de matemáticas del examen de admisión. Para esto la institución recolectó información sobre
cuatro variables que son: Math nota obtenida (en puntos) por cada aspirante en la prueba de matemáticas; Age edad en
años del aspirante al presentar la prueba; Race raza del candidato (1: blanco, 2: negro, 3: mestizo y 4: indígena) y Female, 1
si el candidato era mujer, 0 caso contrario. La institución educativa contrató un profesional en estadística para que le
asesorara en el ajuste del modelo. Los resultados que obtuvo el profesional usando R fueron los siguientes:
Call:
lm(formula = math ~ age + female + race)
Residuals:
Min 1Q Median 3Q Max
-15.5008 -3.6491 0.1459 4.7396 15.9861
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 50.9390 1.3508 37.710 <2e-16 ***
age 4.7529 0.3280 14.491 <2e-16 ***
female1 -0.7020 0.8896 -0.789 0.0310
race2 1.9614 2.3425 0.837 0.4035
race3 1.1841 1.8930 0.626 0.5324
race4 2.9723 1.3937 2.133 0.0342 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 6.214 on 26 degrees of freedom
Multiple R-squared: 0.571, Adjusted R-squared: 0.56
F-statistic: 51.65 on 5 and 26 DF, p-value: < 2.2e-16
a) ¿Cuál fue el número de observaciones utilizadas en el análisis de regresión?
b) ¿Cuál fue el número de covariables en el estudio?
c) ¿Cuántos coeficientes tiene el modelo?
d) ¿Cuál es el valor de la varianza estimada de los errores?
e) ¿Cuántas variables dummy asociadas a la variable Race hay en el modelo?
f) ¿Cuál es el número total de variables dummy en el estudio?
g) ¿Cuál es el valor predicho o ajustado en la prueba de matemáticas para un aspirante hombre de 20 años de edad y
proveniente de la comunidad indígena Guane?
h) A la institución se presentó una candidata de 23 años de raza blanca. ¿Cuál es la nota media esperada en la prueba de
matemáticas para la candidata?
i) Construya un IC del 95% para el coeficiente de la raza mestiza.
j) Construya un IC del 95% para el coeficiente de la edad.
k) ¿Cuál es la mayor subestimación del modelo?
l) ¿Qué se puede concluir de la prueba de significancia de la regresión? Considere .
m) ¿Es significativa para el modelo la variable Race? Considere .
n) Interprete el coeficiente asociado a la variable edad.
o) ¿Qué se puede concluir del coeficiente de determinación?
NOTA: la relación (con como el número de variables cuantitativas) se cumple solo si todas la variables con cuantitativas.
Cuando hay variables cualitativas aparecen variables dummy que destruyen la relación (ahí representa el número de variables REA
LES, cuantitativas o dummies), sin embargo, el número de parámetos del modelo corresponde a la cantidad de ’s. Para construir I
C para uno de los parámetros debe usar la siguiente fórmula: