Informe dataminnig mineria de datos

Solo disponible en BuenasTareas
  • Páginas : 6 (1394 palabras )
  • Descarga(s) : 0
  • Publicado : 24 de enero de 2012
Leer documento completo
Vista previa del texto
UNIVERSIDAD DE LAS AMÉRICAS
FACULTAD DE INGENIERÍA
INGENIERÍA DE EJECUCIÓN INFORMÁTICA
INFORME DE DATAMINING N° 3

EXPERIENCIA:
Análisis SIMCE 1998







Docente:
Fabian González Berger

INDICE

I RESUMEN 3

II INTRODUCCIÓN 3

III ASOCIACION 3

IV DESARROLLO de Actividad 5

VCLASIFICACIÓN Y AGRUPAMIENTO 6

VI TRABAJOS FUTURO 8

VII CONCLUSIÓN 9

VII REFERENCIAS 9

I. RESUMEN.
Analizar, extraer, transformar y convertir datos desde cualquier tipo de fuente o tipo de archivo y llevarlo al software Weka para obtener información útil para apoyar la toma de decisionesposteriores con el resultado obtenido.

II. INTRODUCCIÓN.
Como alumnos de DATAMINING debemos ser capaces de tomar la información del SIMCE 1998 aplicado a nivel nacional, limpiar y procesar datos, para luego usar el software WEKA para obtener resultados y conclusiones.
WEKA (Waikato Environment for Knowledge Analysis) es una herramienta que permite la experimentación de análisis de datos mediantela aplicación, análisis y evaluación de las técnicas más relevantes de análisis de datos, principalmente las provenientes del aprendizaje automático, sobre cualquier conjunto de datos del usuario.
El fichero de datos seleccionado contiene datos provenientes del campo de la enseñanza, correspondientes a alumnos que realizaron las pruebas SIMCE en el año 1998 procedente de diferentes centros deenseñanza secundaria y primaria de todas las regiones de Chile. Los datos de cada centro de estudio contienen la siguiente información: Nombre Región, Código Depto. Prov., Nombre depto. provincial, Código Comuna, Nombre Comuna, Rol Base de Datos, Nombre establecimiento, Letra establecimiento, Número Establecimiento, Alumnos que rindieron, Puntaje Matemática, Puntaje Castellano, Diferencia 1998-1994Mat., Diferencia 1998-1994 Cast., Dependencia, Modalidad.
Algunos de los análisis que podemos llevar a cabo con esta herramienta puede ser el relacionar los resultados obtenidos en las pruebas con las características de cada establecimiento, cuáles son las características comunes establecimientos por regiones y/o comunas.

III ASOCIACIÓN
Mediante algoritmos de asociación podemos realizar labúsqueda automática de reglas que relacionan conjuntos de atributos entre sí. Son algoritmos no supervisados, ya que no existen relaciones conocidas a priori con las que contrastar la validez de los resultados, sino que se evalúa si esas reglas son estadísticamente significativas. El principal algoritmo implementado en WEKA es el algoritmo “Apriori”, el
cual sólo busca reglas entre atributossimbólicos, por lo cual todos los atributos numéricos deberían ser
discretizados previamente. Si aplicamos el algoritmo de asociación con los parámetros por defecto, nos aparecen una serie de reglas que relacionan Los establecimientos y sus localidades, por lo tanto en la imagen siguiente podemos visualizar la cantidad de pruebas rendidas por región.

IV. DESARROLLO de la Actividad.
* Descargar Basede Datos Simce 1998
La obtención de la fuente de la información se obtuvo desde el siguiente link http://www.simce.cl/index.php?id=262 desde ahí se descargó los datos asociados a los resultados del Simce año 1998.
* Realizar limpieza de datos
Una vez revisada la información y el constante aprendizaje del conocimiento de la herramienta Weka se tuvo que realizar limpieza de los datos para queel software tomara de manera natural los datos generados. Los pasos para llegar a introducir los datos al aplicativo Weka fueron los siguientes:
Archivo fuente dbf (database file) se convirtió a archivo extensión csv mediante aplicación Excel, luego en link siguiente se procede a convertir archivo csv a arff, que es el que interpreta Weka, en ese momento nos percatamos que existía data que...
tracking img