Stata
MICROECONOMETRÍA César Alonso Borrego Rocío Sánchez Mangas Universidad Carlos III de Madrid
Índice
1. ASPECTOS GENERALES 1.1. Stata es “case sensitive” 1.2. Sintaxis de las órdenes 1.3. Recursos de memoria 1.4. Comando de ayuda 1.5. Precisión de las variables 1.6. Abreviaturas de comandos 1.7. Salir de Stata 2. GESTIÓN DE DATOS 2.1. Introducción de datos porteclado 2.2. Gestión de ficheros 2.3. Gestión de variables 2.4. Análisis descriptivo de datos 3. CREACIÓN DE VARIABLES 3.1. Comando generate 3.2. Extensiones 3.3. Reemplazar variables 3.4. Variables categóricas y variables indicador 3.5. Generación de retardos y diferencias 4. CREACIÓN DE GRÁFICOS 5. UNIÓN DE FICHEROS 6. FICHEROS DO 7. ESTIMACIÓN 7.1. Estimación por MCO 7.2. Estimación por VI 7.3.Estimación de modelos de elección binaria 7.4. Estimación de modelos censurados 7.5. Obtención de resultados tras la estimación 7.6. Contrastes de hipótesis 7.7. Estimación con datos de panel
2
1. Aspectos generales
Stata es un paquete estadístico diseñado para el análisis descriptivo de datos y la implementación de diferentes técnicas de estimación. Trabajaremos con grandes bases de datosque contienen información de diferentes variables para un conjunto de individuos o empresas. En Stata, los ficheros de datos tienen extensión .dta. Supongamos que tenemos un fichero llamado datos.dta con seis variables llamadas iden, year, var1 , var2 , var3 y dum, que contienen cierta información sobre una muestra de 30 individuos a lo largo de 5 años, es decir, en total, 150 observaciones.Supongamos que la variable iden identifica a los individuos y la variable year hace referencia al año, y que la información está organizada de la siguiente forma: iden 1 1 1 1 1 2 2 2 2 2 3 3 30 30 year 1991 1992 1993 1994 1995 1991 1992 1993 1994 1995 1991 1992 1994 1995 var1 45.6 23.6 12.5 78.9 45.3 16.5 56.9 14.3 12.5 10.1 12.3 45.2 26.5 70.8 var2 6.2 4.1 3.5 4.5 5.4 7.8 6.2 1.3 3.6 5.22.5 1.9 9.8 1.2 var3 65.2 18.5 65.1 23.3 14.7 65.9 87.2 10.6 11.7 13.8 14.3 15.4 85.3 23.0 dum 1 1 0 1 0 1 1 0 1 0 1 1 0 1 categ 5 10 10 20 5 5 10 20 20 5 5 10 20 5
Estos datos nos servirán como ejemplo para ilustrar los comandos de Stata que permiten el análisis descriptivo y la estimación de modelos econométricos.
1.1. Stata es “case sensitive”
Stata distingue entremayúsculas y minúsculas, de forma que las variables var1 y Var1 son distintas.
1.2. Sintaxis de las órdenes
En Stata la sintaxis de las órdenes es la siguiente: comando lista de variables [if expression] [in expression], [opciones] Todo lo que aparece entre corchetes es opcional. Con in podemos referirnos a un cierto rango de los datos y con if podemos introducir expresiones lógicas. Los operadoreslógicos se escriben como:
3
& | ~
y ó negación
mientras que los operadores de relación vienen dados por: > < >= 1992 borra, en todas las variables del fichero en uso, todas las observaciones para las que year>1992 drop in 5/15 borra, en todas las variables, todas las observaciones desde la 5 hasta la 15. keep if dum==1 & var1 >20 mantiene, en todas las variables, todas las observacionespara las que dum=1 y var1 >20, borrando el resto de observaciones. - Renombrar variables: supongamos que queremos renombrar la variable var1 de forma que pase a llamarse nvar. Entonces la orden será: rename var1 nvar - Poner una etiqueta a una variable: Supongamos que queremos poner a la variable iden la etiqueta identificador de individuo, para tener siempre presente qué significa esa variable. Laorden será: label variable iden “identificador de individuo” Si hemos etiquetado una variable, el comando describe nos dará, además del nombre, la etiqueta de la variable.
7
2.4. Análisis descriptivo de datos
- Contar el número de observaciones de nuestro fichero de datos: count Para contar el número de observaciones que cumplen cierta condición: count if iden>20 & dum==1 nos da el...
Regístrate para leer el documento completo.