Lectura Y Codificación De Variables Nominales
Práctica 1. Lectura y codificación de variables nominales
En los siguientes ejercicios no se pueden modificar los datos textuales (sería hacer trampa). Los archivos de texto se copiarán y pegarán en el editor de programas.
1) El archivo texto1.txt contiene las variables nombre y teléfono en formato por columnas. Pasar esas dos variables a un archivo sastemporal y comprobar que está bien leído.
data listintelefono;
length Nombre $ 22;
input Nombre $ 1-22 Telefono $ 23-31;
cards;
Antonia García 913456789
Pepe Luis Gonzalez 913776789
Maria Sarmiento 655895075
;
procprint data=listintelefono;
run;
Sistema SAS 14:12 Wednesday, March 3, 2010 1
Obs Nombre Telefono
1 Antonia García 913456789
2 Pepe Luis Gonzalez 913776789
3 Maria Sarmiento655895075
2) El archivo texto2.txt contiene las variables nombre y teléfono en formato por columnas, pero donde hay más variables que interesan y cada caso ocupa 3 líneas. Pasar esas dos variables a un archivo sas temporal y comprobar que está bien leído.
data listintelefono2;
length Nombre $ 22 Otro $ 20;
input Nombre $ &Telefono $ Otro ;
cards;
Antonia García
913456789
5653453535353
Pepe Luis Gonzalez
913776789
44444444444353
Maria Sarmiento
655895075
12121253535353
;
proc printdata=listintelefono2;
run;
Sistema SAS 14:12 Wednesday, March 3, 2010 11
Obs Nombre Otro Telefono
1 Antonia García 5653453535353 91345678
2 Pepe Luis Gonzalez 44444444444353 91377678
3Maria Sarmiento 12121253535353 65589507
3) El archivo texto3.txt contiene la variable nombre separada por comas. Pasar esa variable a un archivo sas temporal y comprobar que está bien leído.
data listintelefono3;
infile 'c:\texto3.txt' dlm=",";
length Nombre $20;
input Nombre $ @@ ;
run;proc print data=listintelefono3;
run;
Sistema SAS 16:34 Wednesday, March 3, 2010 4
Obs Nombre
1 Antonia García
2 Pepe Luis Gonzalez
3 Maria Sarmiento
4) La función SAS compress en la sintaxisexacta
compress(variable,,”p”);
elimina los signos de puntuación presentes en los valores de la variable. Por ejemplo:
palabra2=compress(palabra,,”p”);
crea la variable palabra2 que es igual que la variable palabra pero sin los signos de puntuación que tenga “pegados”.
Utilizar esta función para leer y hacer una tabla de frecuencias de la variedad de palabras de los primeros párrafos delquijote (archivo quijote.txt). Utilizar la opción datalines4; en lugar de cards; pues los datos contienen caracteres de punto y coma (‘;’) .
data quijote;
length Palabra $20;
input Palabra $ @@;
datalines4;
En un lugar de la Mancha, de cuyo nombre no quiero acordarme,
……………………………………...
Regístrate para leer el documento completo.