Estadistica

Páginas: 7 (1592 palabras) Publicado: 13 de abril de 2011
-------------------------------------------------
Enunciat

Disposem d’una mostra de 474 treballadors/res amb les variables (fitxer PAC4.MTW) :

nivell_educ | Nombre d’anys de formació |
sal_actual | Salari actual en milers d’euros a l’any |
temps_emp | Nombre de mesos a l’empresa |
ex_pre | Nombre de mesos d’experiència prèvia |
gènere | 1= home; 2 = dona |

1.
a)Quin objecte tindria realitzar una anàlisi de components principals amb les dades quantitatives d’aquest fitxer? (Màxim 4 línies)

L’anàlisi de components principals (ACP) té la finalitat de sintetitzar la informació per mitjà de la selecció de variables. L’elecció dels factors es útil quan a partir de la matriu de correlacions, s’observa l’existència d’elevades correlacions entre variables, iaixí podem evitar informació redundant. Els components principals que resulten son una combinació lineal i independent de les variables originals.

b) Presenteu els resultats de realitzar aquesta anàlisi amb minitab per a les variables quantitatives del fitxer (no indiqueu res a l’espai Number of components to compute)

Atès que es demanen les variables quantitatives, i que la variablegènere es de tipus qualitatiu, he exclòs “gènere” de l’ACP.

-------------------------------------------------
Principal Component Analysis: nivell_educ; sal_actual; temps_emp; ex_pre
-------------------------------------------------

-------------------------------------------------
Eigenanalysis of the Correlation Matrix
--------------------------------------------------------------------------------------------------
Eigenvalue 1,7537 1,0090 0,9175 0,3198
-------------------------------------------------
Proportion 0,438 0,252 0,229 0,080
-------------------------------------------------
Cumulative 0,438 0,691 0,920 1,000
-------------------------------------------------

-------------------------------------------------
VariablePC1 PC2 PC3 PC4
-------------------------------------------------
nivell_educ 0,682 0,046 -0,137 0,717
-------------------------------------------------
sal_actual 0,651 -0,105 -0,329 -0,676
-------------------------------------------------
temps_emp 0,114 -0,888 0,443 0,033
-------------------------------------------------
ex_pre -0,312-0,444 -0,823 0,169

c) Quantes components creieu que val la pena retenir? Per quin motiu? (Màxim 4 línies)

L’elecció dels factors ha de conjugar la major proporció possible de la variabilitat original, i l’objectiu de sintetitzar la informació. Atès que es pretén reduir el nombre de variables inicials (4), i que la variància explicada de PC2 es 25,2% i PC3 22,9% (les respectivesacumulades de 69,1% i 92,0%), retindria els dos primers components per reduir raonablement el nombre de variables inicials.

d) Feu una interpretació del primer i segon component (Màxim 5 línies)

S’observa que per la component PC1 existeix una major correlació positiva amb la variable “Nombre d’anys de formació” i “Salari actual en milers d’euros a l’any”, mentre que per la component PC2la correlació es majoritàriament negativa, mes elevada per la variable “Nombre de mesos a l’empresa”, seguit de la variable “Nombre de mesos d’experiència prèvia”. Per tant, la 1a component esta molt relacionada amb la qualificació i la 2a component amb l’experiència.

2.
e) Una persona proposa realitzar una anàlisi cluster amb les variables del fitxer. Quin profit creieu ques’obtindrà de fer aquesta anàlisi? (Màxim 4 línies)

L’anàlisi clúster agrupa elements que tenen propietats semblants, en base a la distància que existeix entre els elements analitzats, distància que serà el mes petita possible entre els elements del mateix grup, i la major distància possible entre els elements de diferent grup. Es dir, forma grups (clústers) que son homogenis interiorment, i el...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Estadistica
  • Estadistica
  • Estadistica
  • Estadistica
  • Estadistica
  • Estadisticas
  • Estadistica
  • Estadistica

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS