Practica laboratorio

Solo disponible en BuenasTareas
  • Páginas : 8 (1888 palabras )
  • Descarga(s) : 0
  • Publicado : 22 de mayo de 2011
Leer documento completo
Vista previa del texto
Sistemas Informaticos: Minería de Datos

Ing. Edwin O. Ramos Velásquez

PRACTICA DE LABORATORIO TEMA: DATAMINING TITULO: OPERACIONES DE REGRESION DE DATOS USANDO EL STAT GRAPHISCS I. OBJETIVOS El estudiante reconocerá la aplicabilidad de las técnicas de regresión de datos en datos reales. El estudiante podrá utilizar el método más adecuado de regresión en el análisis de datos. El estudianteaplicará sus conocimientos de análisis de datos en el análisis de datos reales.

II. METODOLOGIA Se realizará un breve repaso teórico de las técnicas de minería de datos, a continuación se seleccionará una de ella, y se realizarán ejercicios de regresión. En primer término el docente realizará el desarrollo de análisis de datos usando el método de Regresión utilizando el StatGraphics 5.1. Acontinuación se solicitará que los alumnos, por grupos, realicen el análisis de datos 1 sobre la muestra de datos que ellos hubieren previamente traído a clase . Se utilizará el software StatGraphics Plus 5.1 para las operaciones de regresión de datos. Para mostrar los distintos ejemplos a lo largo de esta práctica, usaremos en fichero Autos_vendidos.sf3. Para abrir dicho archivo pinchamos en ArchivoAbrir Abrir Datos y buscamos en la dirección Menú Inicio\Programas\Statgraphics Plus 5.1\SgWin.

III. DESARROLLO DE LA PRÁCTICA DE LABORATORIO: OPCIONES DE ANALISIS a) Selección de la muestra Seleccionamos del menú principal Dependencia Regresión Simple, y aparece una ventana en la que seleccionamos los datos a analizar:

A continuación seleccionamos los datos a contrastar, por ejemplo: Y=Autosvendidos, además de X=Vendedores.
1

Antes de esta clase de práctica, se solicitará que los alumnos, por grupos, traigan a clases archivos con datos tabulares (en forma de tablas), que pueden estar en formato de Excel, StatGraphics o texto. Se les indicará los requisitos mínimos respecto a la estructura del contenido del archivo de datos.

1

Sistemas Informaticos: Minería de DatosIng. Edwin O. Ramos Velásquez

Comentario (Análisis opcional): Podemos hacer una selección de los datos cumplen cierto criterio que se introduce en el campo Selección de la ventana anterior. Ejemplo. Seleccionar los datos que cumplen “ Autos vendidos ≥ 20 “.

Al pulsar sobre el botón Aceptar se generarán dos ventanas que contienen el análisis de regresión de la variable seleccionada. Para ver másgrande una ventana pinchamos dos veces con el ratón sobre ella. Ejemplo. Pinchar dos veces en cada una de las 4 ventanas y observar sus contenidos.

2

Sistemas Informaticos: Minería de Datos

Ing. Edwin O. Ramos Velásquez

b) Opciones del análisis Podemos escoger distintas opciones de análisis en la barra de herramientas. Así si queremos, por ejemplo, Resumen del Procedimiento(coeficiente de correlación, error estándar de desviación, etc.), Predicciones, comparación de modelos alternativos, lo seleccionaremos en las Opciones Tabulares. Ejemplo. Marcar en Opciones Tabulares las casillas correspondientes a Resumen del proyecto, predicciones, comparación de modelos alternativos observar las dos nuevas ventanas que aparecen.

b.1) En la ventana del “Resumen del procedimiento” (oAnálisis de regresión), podemos escoger los Tipos de modelo (modelo matemático) a aplicar para la obtención de la ecuación de regresión deseada, pulsando con el botón derecho del ratón dentro de dicha ventana y seleccionándolos en Opciones de Análisis.

b.2) En la ventana en que aparecen los “Valores predichos”, podemos escoger los correspondientes valores de X (Vendedores) para los cualesdeseamos predecir los respectivos valores de la variable dependiente Y (Autos vendidos), pulsando con el botón derecho del ratón dentro de dicha ventana y seleccionándolos en Opciones de Ventana.

3

Sistemas Informaticos: Minería de Datos

Ing. Edwin O. Ramos Velásquez

Ejemplo. Con Opciones de Ventana conseguir que aparezcan en la ventana “valores predichos” los valores estimados para los...
tracking img