Acorresp

Solo disponible en BuenasTareas
  • Páginas : 7 (1544 palabras )
  • Descarga(s) : 0
  • Publicado : 18 de junio de 2011
Leer documento completo
Vista previa del texto
UNIVERSIDAD CENTRAL DEL ECUADOR
ANALISIS DE DATOS
Nombre: Andrés Tubón fecha: 04/07/2011
Tema: Análisis de Correspondencias.
Objetivos

* Plantear el problema a resolver por un Análisis de Correspondencias.
* Calcular los perfiles marginales, fila y columna de una tabla de contingencia bidimensional e interpretarlos.
* Analizar la dependencia/independencia de las filas ycolumnas de una tabla de contingencia bidimensional.
* Calcular e interpretar los resultados de un Análisis de Correspondencias tanto desde un punto de vista gráfico como numérico.

Planteamiento del Problema

Según un estudio realizado en la base de datos de ventas de un producto x repartidas en Ecuador, se clasifica a los vendedores y las provincias donde operan los vendedores se harecogido el número del producto devuelto (devoluciones), para hacer un estudio de posibles causas de la no acogida del producto x.
Así, se tienen dos variables categóricas: Vendedor y Provincia:

Solución al problema
* Iniciamos el estudio del problema realizando una prueba de la dependencia entre variables, puesto que si no son dependientes no se podrá aplicar el AC.
* De existirdependencia, procedemos a realizar el cálculo de las tablas de Probabilidades, Perfiles Fila, Perfiles columna y a establecer las matrices de peso correspondientes a la matriz de probabilidades conjunta.
* Procedemos a encontrar las distintas distancias entre individuos, de igual manera lo hacemos con las variables y aplicamos los mismos métodos para encontrar las distancias de los distancias deindividuos y variables a los correspondientes centros de gravedad.
* Realizamos el cálculo de coordenadas para los perfiles fila y columna, con la finalidad de tener una representación grafica de dichos perfiles y poder determinar dependencias.
* Como punto final realizamos el cálculo de ‘contribuciones y cosenos’ al cuadrado en los perfiles fila y columna con la finalidad de saber cuáles sonlas variables más importantes en cada perfil.
Solución Matemática
Prueba de Independencia JI-CUADRADO

Llegamos a la concluimos que hay relación entre Provincia y Vendedor.
Calculo de Perfiles Fila y Perfiles Columna
* Tabla de Probabilidades Conjunta

*
* Tabla de Perfiles Fila

* Tabla de Perfiles Columna

DETERMINACIÓN DE DEPENDENCIA ENTRE VARIABLES CUALITATIVAS
a.Hipótesis Nula H0: Música y Compradores son independientes.
b. Hipótesis Alternativa H1: Música y Compradores no son independientes.
c. Calculo de estadístico de la prueba.

Xobs2=i=1nj=1p(kij-eij)2eij

eij=ki.*k.jK

Xobs2=(3-6.95)26.95+(13-10.13)210.13+(10-10.07)210.07+(1-10.02)210.02+ …=536.89

d. Región de Rechazo.
La hipótesis de independencia se rechaza siXobs2>Xα2[(n-1)(p-1)]
Si α=0,05 tenemos para el estimador tabulado: X0.052120=156.47
e. Decisión. Como 536.89 >156.47, se rechaza la hipótesis nula. Concluimos que hay relación entre Vendedor y Provincia.

ESTUDIO DE PERFILES FILA
* Cálculo de coordenadas, contribuciones y cosenos cuadrados en el eje 1.
| ¥1 | C1(i) | Cos2 i1 |
Dance | 0.0030889 | 0.0001203 | 0.00002523 |
Reggaetón |-0.2080734 | 0.5531281 | 0.94369026 |
Pop | 0.0544391 | 0.0436880 | 0.008907160 |
Clásica | 0.2218473 | 0.4030658 | 0.64080263 |

Interpretación:
Podemos observar que el género del Reggaetón y la música Clásica están muy bien representados en el eje 1, además estas modalidades son las más importantes que conforman dicho eje.

* Cálculo de coordenadas, contribuciones y cosenos cuadrados enel eje 2.
| ¥2 | C2(i) | Cos2 i2 |
Dance | 0.6148298 | 0.2677531 | 0.99997495 |
Reggaetón | -0.0508267 | 0.0018536 | 0.056309305 |
Pop | -0.5742467 | 0.2730068 | 0.99109306 |
Clásica | 0.1660958 | 0.0126888 | 0.35919749 |

Interpretación:
Notamos como la música DANCE y POP están muy bien representados en el eje 2, y son las modalidades son las más importantes que conforman dicho...
tracking img