Soluciones Estadística para la Administración y Economía Ánderson. Capítulo 16

1. Considere los datos siguientes para las variables x y y.

a. Con estos datos obtenga una ecuación estimada de regresión de la forma  b0 b1x. b. Use los resultados del inciso a para probar si existe una relación significativa entre x y y. Use α 0.05 c. Obtenga el diagrama de dispersión de estos datos. ¿Este diagrama de dispersión sugiere una ecuación estimada de regresión de la forma b0 b1x b2x2? Explique.
d. Con estos datos obtenga una ecuación estimada de regresión de la forma b0 b1x b2x2 e. Remítase al inciso d. ¿La relación entre x, x2 y y es significativa? Use α 0.05 f. Prediga el valor de y para x 25.



2. Considere los datos siguientes para las variables x y y.

a. Con estos datos obtenga una ecuación estimada de regresión de la forma b0 + b1x. Presente un comentario sobre lo adecuado de esta ecuación para predecir y. b. Con estos datos obtenga una ecuación estimada de regresión de la forma b0 b1x b2x2. Dé un comentario sobre lo adecuado de esta relación para predecir y. c. Prediga el valor de y para x 20.


4. El departamento de autopistas estudia la relación entre flujo de tráfico y velocidad. Se considera que el modelo siguiente es el adecuado.


donde

y=flujo de tráfico en vehículos por hora
x=velocidad de los vehículos en millas por hora

Los siguientes datos fueron recolectados durante “horas pico” en las seis principales autopistas que salen de la ciudad.


a. Obtenga con estos datos una ecuación estimada de regresión.
b. Use α = 0.01 para probar la significancia de la relación.


5. Para continuar con el problema del ejercicio 4, se sugiere emplear la siguiente ecuación estimada de regresión curvilínea

a. Use los datos del problema 4 para estimar los parámetros de esta ecuación estimada de regresión. b. Use α = 0.01 para probar la significancia de la relación. c. Estime el flujo de tráfico en vehículos por hora correspondiente a 38 millas por hora.


6. En un estudio sobre instalaciones para servicios de emergencia se investigó la relación entre el número de instalaciones y la distancia promedio a recorrer para dar el servicio de emergencia. En la tabla siguiente se presentan los datos obtenidos.

a. Trace el diagrama de dispersión de estos datos, considere la distancia promedio a recorrer como la variable dependiente. b. ¿Un modelo lineal simple será apropiado? Explique. c. Con estos datos obtenga la ecuación estimada de regresión que mejor explica la relación entre las dos variables.



8. Corvette, Ferrari y Jaguar fabricaron varios automóviles clásicos con un valor que aún sigue en aumento. En la tabla siguiente, basada en el sistema Martin de evaluación de automóviles de colección, se presenta la evaluación de su rareza (1-20) y el precio ($ miles) de 15 automóviles clásicos (www.businessweek.com, febrero de 2006).

a. Dé el diagrama de dispersión de estos datos, emplee la evaluación de la rareza como variable independiente y el precio como variable independiente. ¿Es apropiado un modelo de regresión lineal simple? b. Obtenga una ecuación estimada de regresión simple en la cual las variables independientes sean x evaluación de la rareza y x2. c. Considere la relación no lineal dada por la ecuación (16.7). Use logaritmos para obtener una ecuación estimada de regresión para este modelo. d. ¿Cuál de las ecuaciones estimadas de regresión prefiere, la del inciso b o la del inciso c? Explique.



10. En un análisis de regresión en el que se emplearon 27 observaciones, se obtuvo la siguiente ecuación estimada de regresión.
y = 25.2 + 5.5x1
Para esta ecuación estimada de regresión STC 1 550 y SCE 520. a. Utilice α 0.05 y pruebe si x1 es significativa. Suponga que a este modelo le agrega las variables x2 y x3 y obtiene la ecuación de regresión siguiente.
y = 16.3+ 2.3x1 + 12.1x2 - 5.8x3

Para esta ecuación estimada de regresión STC 1 550 y SCE 100. b. Use una prueba F y 0.05 como nivel de significancia para determinar si x2 y x3 contribuyen significativamente al modelo.


11. En un análisis de regresión en el que se emplearon 30 observaciones, se obtuvo la siguiente ecuación estimada de regresión.
y = 17.6 + 3.8x1 - 2.3x2 + 7.6x3 + 2.7x4

Para esta ecuación estimada de regresión STC =1 805 y SCR = 1 760.
a. Con α = 0.05, pruebe la significancia de la relación entre las variables. Suponga que de este modelo elimina las variables x1 y x4 y obtiene la siguiente ecuación estimada de regresión.
y = 11.1 - 3.6x2 + 8.1x3

Para esta ecuación estimada de regresión STC = 1 805 y SCR= 1 705.
b. Calcule SCE(x1, x2, x3 y x4)
c. Calcule SCE(x2, x3)
d. Use una prueba F y 0.05 como nivel de significancia para determinar si x1 y x4 contribuyen significativamente al modelo.



12. La Ladies Professional Golfers Association (LPGA, por sus siglas en inglés) lleva estadísticas sobre el desempeño y las ganancias de sus miembros en la LPGA Tour. En el archivo titulado LPGAdel disco compacto se presentan las estadísticas de fin de año sobre el desempeño de las 30 jugadoras que obtuvieron las mayores ganancias en la LPGATour de 2005 (www.lpga.com, 2006). Earnings (ganancias) ($ miles) son los ingresos totales en miles de dólares; Scoring Avg., es la puntuación promedio de una jugadora en todos los eventos; Greens in Reg., es el porcentaje de las veces que una jugadora llega al green en regulación; Putting Avg., es el promedio de putts hechos en el green en regulación, y Sand Saves es el porcentaje de veces que la jugadora logra “subir y bajar” (“up and down”) cuando se encuentra en un búnker de arena al lado del green. a. Obtenga una ecuación estimada de regresión que sirva para predecir Scoring Avg. dado Greens in Reg. b. Obtenga una ecuación estimada de regresión que sirva para predecir Scoring Avg. dados Greens in Reg., Putting Avg. y Sand Saves. c. Con un nivel de significancia 0.05 pruebe si las dos variables independientes agregadas en el inciso b, Putting Avg. y Sand Saves, contribuyen significativamente a la ecuación estimada de regresión obtenida en el inciso a. Explique.



14. En un estudio realizado a lo largo de 10 años por la American Heart Association se obtuvieron datos acerca de la relación entre edad, presión sanguínea y fumar con el riesgo a sufrir un infarto. Los datos que se presentan a continuación son parte de este estudio. El riesgo se interpreta como la probabilidad (multiplicada por 100) de que el paciente sufra un infarto en los próximos 10 años. Para la variable fumar, defina una variable ficticia que tome el valor 1 si la persona es fumadora y el valor 0 si no es fumadora.


a. Obtenga una ecuación estimada de regresión que sirva para predecir el riesgo de sufrir un infarto, dados edad y presión sanguínea. b. Considere la adición de dos variables independientes al modelo obtenido en el inciso a, una para la interacción entre edad y presión sanguínea y otra que indique si la persona es o no un fumador. Obtenga una ecuación estimada de regresión, emplee estas cuatro variables independientes. c. Emplee como nivel de significancia 0.05, realice una prueba para determinar si la adición de la variable de la interacción y la variable fumador contribuyen significantemente a la ecuación estimada de regresión obtenida en el inciso a.



16. En un estudio se obtuvieron datos de variables que pueden estar relacionadas con el número de semanas que está desempleado un trabajador de la industria. La variable dependiente de este estudio (semanas) se definió como el número de semanas que un empleado está desempleado debido a despido. En este estudio se usaron las siguientes variables independientes.
Age (edad) Edad del trabajador
Educ (educación) Número de años de estudio
Married (casado) Variable ficticia; 1 si está casado, 0 si no es así
Head (cabeza) Variable ficticia; 1 si es cabeza de familia, 0 si no es así
Tenure (ocupación) Número de años en el trabajo anterior
Manager (administrativo) Variable ficticia; 1 si su ocupación es en administración , 0 si no es así
Sales (ventas) Variable ficticia; 1 si su ocupación es en ventas, 0 si no es así
Estos datos se encuentran en el archivo Layoffs del disco compacto que se distribuye con el libro. a. Obtenga la mejor ecuación estimada de regresión que tenga una variable. b. Emplee el procedimiento por pasos para obtener la mejor ecuación estimada de regresión. Use 0.05 como Alpha to enter y Alpha to remove. c. Use el procedimiento de selección hacia adelante para obtener la mejor ecuación estimada de regresión. Use 0.05 como Alpha to enter. d. Use el procedimiento de eliminación hacia atrás para obtener la mejor ecuación estimada de regresión. Use 0.05 como Alpha to remove. e. Use el procedimiento de regresión de los mejores subconjuntos para obtener la mejor ecuación estimada de regresión.



18. Jeff Sagarin proporciona, desde 1985, evaluaciones deportivas para USAToday. En el béisbol sus pronósticos RPG (runs/game) estadísticos toman en cuenta todas las estadísticas de ofensiva del jugador y, se asegura, que es la mejor medida del verdadero valor de la ofensiva de un jugador. En los datos que se presentan a continuación se da el RPG y varios estadísticos de ofensiva de la temporada de la Liga Mayor de Béisbol correspondientes a 20 miembros de los Yankees de Nueva York (www.usatoday.com, 3 de marzo de 2006). Los rótulos de las columnas se definen como sigue: RPG, estadístico que predice número de carreras por juego; H, batazos buenos; 2B, dobles; 3B, triples; HR, cuadrangulares; RBI, carreras bateadas; BB, bases por bola; SO, ponchadas; SB, bases robadas; CS, atrapado en robo de base; OBP, porcentaje en base; SLG, porcentaje de potencia de bateo; AVG, promedio de bateo.
 
Considere que la variable dependiente es la estadística RPG. a. Obtenga la mejor ecuación estimada de regresión con una variable. b. Emplee los métodos de esta sección para obtener la mejor ecuación estimada de regresión múltiple que estime el RPG de un jugador.



20. Considere un diseño completamente aleatorizado en el que haya cuatro tratamientos: A, B, C y D. Escriba la ecuación de regresión múltiple que sirva para analizar estos datos. Defina todas las variables



22. Dé una ecuación de regresión múltiple que sirva para analizar los datos de un diseño bifactorial que tenga dos niveles para el factor Ay tres niveles para el factor B. Defina todas las variables.


24. En la publicidad de cuatro pinturas diferentes se asegura que todas tienen el mismo tiempo de secado. Para comprobar esto se probaron cinco muestras de cada pintura.
Los tiempos de secado de cada muestra se presentan a continuación

a. Use α 0.05 para probar si existe una diferencia significativa entre los tiempos de secado. b. Dé una estimación del tiempo medio de secado de la pintura 2. ¿Cómo se obtiene de los resultados de un paquete de software?

26. Una empresa de ventas por catálogo diseñó un experimento factorial para probar los efectos del tamaño de un anuncio publicitario y su diseño sobre el número (en miles) de catálogos solicitados. Se consideraron tres diseños y dos tamaños diferentes del anuncio publicitario. De éstos se obtuvieron los datos siguientes. Pruebe si hay efectos significativos debido al diseño, al tamaño o a interacciones. Use α 0.05.



 
 

28. Remítase al conjunto de datos de Craven de la tabla 16.5. En la sección 16.3 se mostró que el coeficiente de determinación ajustado de la ecuación estimada de regresión que contenía Accounts(Cuentas), AdvExp (GastPubl), Poten y Share (Participación) era 88.1%. Use 0.05 como nivel de significancia y aplique la prueba de Durbin-Watson para determinar si existe autocorrelación positiva.



30. Muchos fondos internacionales ofrecen tasas más razonables que en Estados Unidos. Como los mercados internacionales suelen moverse en direcciones distintas a los mercados de Estados Unidos, las inversiones en mercados extranjeros pueden reducir el riesgo de un inversionista. En la tabla siguiente se presentan 20 fondos internacionales dando tipo de fondo (con comisión o sin comisión), coeficiente de gastos (%), seguridad (0 la más riesgosa, 10 la más segura) y su desempeño en un año al 10 de diciembre de 1999 (Mutual Funds, febrero de 2000).



a. Utilice los métodos de este capítulo para obtener una ecuación estimada de regresión que sirva para estimar el desempeño de un fondo con base en los datos proporcionados. b. ¿La ecuación estimada de regresión obtenida en el inciso a proporciona un buen ajuste? Explique. c. Acorn International es un fondo sin comisión cuyo coeficiente de gastos es 1.12% y cuya seguridad es 7.6. Use la ecuación estimada de regresión obtenida en el inciso a para estimar el desempeño en un año de Acorn International.
 

32. Remítase a los datos del ejercicio 31. Considere un modelo en el que para predecir retraso se use únicamente industria. Emplee como nivel de significancia 0.01 y pruebe si existe alguna autocorrelación en los datos.


34. Se realizó un estudio para investigar la actividad de los compradores cuando buscan y miran cosas dentro de una tienda, y de acuerdo con esto se les clasificó como inactivos, poco activos y muy activos. También se midió qué tan cómodo se sentía cada comprador en la tienda; puntuaciones más altas correspondían a mayor comodidad. Los datos siguientes provienen de este estudio. Emplee como nivel de significancia 0.05 y realice una prueba para determinar las diferencias que existen en la comodidad dentro de la tienda entre los tres tipos de compradores.