Un ejemplo aplicado de regresiones - estadistica
PRUEBA DE HIPÓTESIS
Planteamiento del Problema
• Bayer quiere analizar si la agencia de medios está optimizando los recursos empleados en la compra de espacios de televisión, en comparación con la compra que realizan otras empresas farmacéuticas. • Se sabe que para las empresas de esta industria, el costo promedio por punto de rating es de $44,037.• Con una muestra de 849 anuncios, Bayer tiene un costo promedio por punto de rating de $41,143 con una desviación estándar de $5,239 y con un nivel de significancia de 0.05.
Planteamiento del Problema
Se plantea la siguiente prueba de Hipótesis
Ho : μ ≥ costo promedio por punto de rating de la industria farmacéutica Ha : μ < costo promedio por punto de rating de la industria farmacéuticaZona de error μ=44,037
-1.64
Z
Base de datos
• Se consideró
– Total de anuncios regulares de 52 empresas farmacéuticas (110,560 datos) – de los meses de Enero a Agosto de 2009, – en los canales 2, 4, 5, 7, 9 y 13, – Una muestra de 849 anuncios regulares de Bayer
• Para cada spot publicitario se determinó el costo promedio por punto de rating
– El precio de cada spot publicitario secalcula en base al rating obtenido y el horario en el que se transmita
Resolución
• • • • • n= 849 μ=44,037 x=41,143 s=5,279 z= -15.97
-15.97
-1.64
Z
Conclusiones
• Se rechaza Ho • Con un nivel de significancia de 0.05 en una prueba de cola izquierda se tiene evidencia estadística para afirmar que el costo promedio por punto de rating que paga Bayer es menor a la media de laindustria ($44,037).
REGRESIÓN MÚLTIPLE
Planteamiento del Problema
• Grupo México es una empresa pública relacionada con el sector minero, produce principalmente cobre, plata y oro. • Se desea pronosticar el precio de la acción de Grupo México con base en las variables que se considera influyen en la determinación del mismo:
– – – – x1 = Índice nacional de precios y cotizaciones (INPC) x2= precio del oro x3 = precio de la plata x4 = precio del cobre
Base de datos
• Se consideró
– La cotización diaria del 23 de marzo de 2005 al 19 de marzo de 2010, con un total de 1,229 datos por cada una de las variables
Fecha 23/03/2005 29/03/2005 30/03/2005 31/03/2005 … 16/03/2010 17/03/2010 18/03/2010 19/03/2010 ACCION 6.40 5.90 5.95 6.07 30.98 31.10 31.66 31.81 IPC 12,852.81 12,581.8012,653.42 12,676.90 32,723.90 32,798.30 32,969.83 33,022.84 EXP 3.62 3.52 3.54 3.55 26.37 26.57 27.03 27.17 Oro 425.35 426.10 426.35 428.35 1,127.70 1,120.35 1,127.35 1,107.00 Plata 6.96 6.96 7.13 7.12 17.46 17.46 17.41 16.99 Cobre 3,208.00 3,230.00 3,255.00 3,290.00 7,405.00 7,534.00 7,486.00 7,435.00
Resolución
• Se corrió una regresión múltiple teniendo en cuenta las variables definidas enel problema, obteniendo los siguientes resultados
Estadísticas de la regresión
Coeficientes
Error típico
Inferior 95%
Superior 95%
Coeficiente de determinación R^2 Error típico
0.863606167 2.832595904
Este rango comprende el valor cero, por lo cual no se tiene en cuenta para la siguiente regresión
Intercepción IPC Oro Plata Cobre
-14.451021 0.000954 0.008132 -0.0996950.000312
0.370639 0.000029 0.001046 0.084169 0.000097
-15.178179 0.000897 0.006079 -0.264827 0.000122
-13.723863 0.001010 0.010184 0.065437 0.000503
• Con base en esto, se plantea la siguiente ecuación
y = -14.45 + 0.00095 IPC + 0.0081 Oro - 0.099 Plata + 0.00031 Cobre
Resolución
Adicionalmente, nos percatamos que la variable con un mayor Coeficiente de correlación tenia una formaexponencial por lo que se decidió correr una segunda regresión elevando la serie del IPC en forma exponencial y eliminando la variable plata
Del experimento de correr la segunda regresión se obtuvieron los siguientes resultados
Estadísticas de la reg resión Coe ficie nte d e co rrelació n m últiple Coe ficie nte d e d etermina ción R^2 R^2 aju stad o E rror típ ico O bservacion es 0.9666...
Regístrate para leer el documento completo.