Estadística precio telefonos móviles
OBJETIVO
• Determinar cuáles son los factores que más influyen en el precio de un teléfono de pantalla táctil; por tanto, queremos obtener un modelo explicativo.
VARIABLES
• Variables explicativas numéricas: – Tamaño pantalla (pulgadas) – Resolución pantalla (píxel) – Número colores (en miles) – Peso (gramos) – Calidad cámara (MPx) – Memoriainterna disponible (Mb) • Variables explicativas categóricas:
– Disponibilidad Wi-fi/3G
• Variable respuesta:
– Precio del teléfono (Euros)
DATOS
• Datos de aproximadamente 50 teléfonos móviles de distintas marcas. • Fuente: Tiendas de telefonía (físicas y online) y web de los fabricantes. • Dificultades: obtener el precio de los teléfonos libres, sin el efecto de contratos o promociones.ANÁLISIS EXPLORATORIO DE LOS DATOS
• Análisis univariante de la respuesta:
RELACIÓN ENTRE VARIABLES
MÁS VARIABLES…
Vemos posibles relaciones entre: – resolución/tamaño pantalla – colores/tamaño pantalla – tamaño pantalla/peso
así que las agregamos al modelo de estudio.
Regresión lineal simple
VARIABLES Tamaño pantalla Resolución pantalla Número colores Peso Calidad cámara Memoriainterna Resolución/Tamaño pantalla R2 38.2 30 17.6 27.4 19.5 30.5 22.9 P-valor constante 0.003 0 0 0.293 0 0 0 P-valor variable 0 0 0.003 0 0.001 0 0.001
Colores/Tamaño pantalla Tamaño pantalla/Peso
21.1 3.5
0 0.002
0.001 0.199
Tamaño pantalla es la variable que más explica la respuesta por sí sola
POSIBLES TRANSFORMACIONES DE LA RESPUESTA Y/O VARIABLES EXPLICATIVAS
precio =21,29 + 132,3 logmemoriainterna 800
S R-cuad. R-cuad.(ajustado) 139,196 41,1% 39,8%
Gráfica de línea ajustada
Logarítmico
precio
700 600 500
Scatterplot of precio vs memoria interna Mb
800 700 600 500
precio
400 300 200 100 0 1,5 2,0 2,5 3,0 3,5 logmemoriainterna 4,0 4,5
400 300 200 100 0 0 5000 10000 15000 20000 memoria interna Mb 25000 30000 35000
PolinomialLogarítmico
Gráficas de residuos para precio
Gráfica de probabilidad normal
Residuo estandarizado
Polinomial
vs. ajustes
99
Porcentaje
90 50 10 1 -2 -1 0 1 Residuo estandarizado 2
2 1 0 -1 -2 200 300 400 500 Valor ajustado 600
Histograma
Residuo estandarizado
vs. orden
2 1 0 -1 -2 1 5 10 15 20 25 30 35 Orden de observación 40 45
10,0
Frecuencia
7,5 5,0 2,5 0,0 -2 -1 0 1Residuo estandarizado 2
Realizamos algún cambio?
• Pros:
– Sube la “R2”, por tanto la recta de regresión se ajusta más a nuestro modelo. – Los residuos estandarizados están dentro de un rango y repartidos homogéneamente.
• Contras:
– Dificultad de cálculos. – La “R2”, aunque sube, no sube tanto – Dificultades al interpretar el modelo final.
• Conclusión:
– Mejor no hacer transformaciones.Detección de anomalías
A lo largo del estudio, vigilaremos este punto:
REGRESIÓN MÚLTIPLE
• A MANO:
VARIABLES Todas Quitando “Peso” Quitando “Tamaño pantalla” Quitando “Colores/Tamaño pantalla” Quitando “Wi-fi/3G” Quitando “Tamaño pantalla/Peso” R2 AJUSTADO 59 60 60.9 OBSERVACIONES SOBRE P-VALOR Valores altos En general altos, algunos bajan Ya no tan altos
61.1
61.2 60.9
Engeneral valores bajos
Un valor elevado, los demás bajos Todos los valores próximos a cero
Mejor regresión múltiple hecha a mano: “precio = 267 - 0,00834 resolución/tamaño(pantalla) + 0,00759 memoria interna Mb + 25,1 calidad cámara (MPx) - 0,507 colores (x1000) + 0,00268 resolución pantalla (pixeles)”
Comprobación del Factor de inflación de la varianza (VIF)
Predictor Constante memoriainterna Mb calidad cámara (MPx) colores (x1000) resolución pantalla (pixels) resolucion/tamaño(pantalla) Coef 267,11 0,007594 25,083 -0,5073 0,0026803 -0,008343 Coef. de EE 50,61 0,002534 7,765 0,2021 0,0006823 0,002439 T 5,28 3,00 3,23 -2,51 3,93 -3,42 P 0,000 0,005 0,002 0,016 0,000 0,001 VIF
1,263 1,183 1,205 26,710 26,752
Valores elevados!! relación entre variables
Aunque el modelo no...
Regístrate para leer el documento completo.