Respuestas
1. Abajo las respuestas.
a) Suponga que queremos determinar si se estaría cometiendo extrapolación oculta o no al estimar el número de juegos
ganados para un equipo A con 1750 yardas por aire y 1568 yardas por tierra al contrario. Para esto se calculan todos los
de los cual se obtiene que es igual a 0.3006904, luego se obtiene que para el equipo A el valor es de 0.1428355 y
por lo tanto se concluye que no se está cometiendo extrapolación oculta.
b) Al calcular los residuales estandarizados y los residuales PRESS para el modelo se encontró que el equipo u observación
número 1 presentó los residuales más alejados del cero. Para este equipo se obtuvo que fue de 2.29818678 y el valor
encontrado para fue de 4.30005708. De los resultados anteriores se puede decir que este equipo no (si/no) es punto
atípico y que si (si/no) es un punto de influencia.
c) Para determinar que observaciones o filas son influyentes en el modelo 2 se usó la Distancia de Cook. Al calcular esta distancia
se encontró que las observaciones n° ninguna fueron las que presentaron distancias superiores a la cota calculada de
0.173913, por lo tanto se concluye que estas observaciones no (si/no) son influyentes.
d) Para determinar la capacidad del modelo 2 para predecir nuevas observaciones se calculó el coeficiente R2 de predicción el
cual arrojó un valor de 0.9989339 por lo tanto se puede decir que el modelo 2 es bueno para predecir nuevas observaciones.
2. Se ajustó un modelo lineal simple para explicar el rendimiento en función de la relación de compresión. Como el
diagrama de dispersión no muestra una nube en forma recta se decide aplicar la prueba formal para la falta de
ajuste. Al aplicar esta prueba se encuentra que el estadístico toma el valor de 0.7538876 con un valor P de
0.5912081, por lo tanto se concluye que el modelo describe los datos en forma adecuada.
3. -17.58 es la estimación pero NO se puede interpretar. Horas*pies/millas, si tiene sentido que sea positiva la pendiente, a
mayor velocidad se requiere más distancia para detenerse. No hay falta de ajuste porque el valor-P de la prueba es 0.2948 y
es mayor al nivel de significancia, el modelo ajustado es apropiado. La apariencia es muy diferente pero los resultados son
los mismo. ¿Cuál usaría usted?
4. 5.9601; 3.2721; 10.7071; 0.002758; 215.772; 7.7477; no se rechaza la hipótesis “Ho: el modelo es apropiado a los datos”.
5. M1 y M4.
6. A) No. B) Se viola fuertemente. C) La 211, 96 y 76. D) No se sabe. E) Parece que 224 o algo así.
7. Se viola seriamente la normalidad.
8. A) . C) Se observa que los errores no siguen una distribución normal y que parece haber indi
cios de heterocedasticidad, se necesita un conjunto de observaciones mayor para verificar esto.