Minería de datos aplicada a la gestión docente

Solo disponible en BuenasTareas
  • Páginas : 17 (4051 palabras )
  • Descarga(s) : 0
  • Publicado : 17 de enero de 2011
Leer documento completo
Vista previa del texto
Minería de Datos aplicada a la Gestión Docente del Instituto Superior Politécnico
José Antonio Echeverría

Data Mining applied to the Educational Management of the
Superior Polytechnic Institute José Antonio Echeverría

Raycos Brito Sarasa1, Alejandro Rosete Suárez2, Rolando Acosta Sánchez3

Facultad de Ingeniería Informática
Instituto Superior Politécnico José Antonio Echeverría
ave.114 # 11901 Marianao.
Ciudad de La Habana, Cuba

1 CUJAE, Cuba, rbrito@ceis.cujae.edu.cu
2 CUJAE, Cuba, rosete@ceis.cujae.edu.cu
3 CUJAE, Cuba, racostas@ceis.cujae.edu.cu

Resumen
De manera proporcional al paso de los años, el desarrollo de nuevas tecnologías ha hecho posible el almacenamiento de información de forma creciente. El volumen de datos recogidos ha permitido satisfacer lasnecesidades diarias de las organizaciones, pero ha superado las capacidades humanas para analizar y transformar la información en conocimiento útil que apoye la toma de decisiones. Esta necesidad ha motivado el empleo de técnicas y herramientas de minería de datos, que posibiliten la extracción de conocimiento, en forma de reglas o patrones a partir de dichos datos.
El presente trabajo presentaun estudio realizado para la selección de atributos y la obtención de parámetros para predecir el rendimiento docente de los estudiantes, durante un proceso de Descubrir Conocimiento en Bases de Datos (KDD) en el Instituto Superior Politécnico José Antonio Echeverría (CUJAE), con el objetivo de conocer cuales son las características de los estudiantes que influyen sobre el promedio de un año,tanto a nivel de Instituto como de Especialidad, enfocados en la metodología CRISP-DM y la herramienta de análisis de datos WEKA.

Palabras Claves: minería de datos, KDD, selección de atributos, clasificación, árboles de decisión, CRISP-DM, WEKA.

Abstract
RECENTLY, THE DEVELOPMENT OF NEW TECHNOLOGIES HAVE MADE POSSIBLE THE STORAGE OF INFORMATION IN A GROWING WAY. THE VOLUME OF STORED DATA HASALLOWED TO SATISFY THE DAILY NECESSITIES OF THE ORGANIZATIONS, BUT IT HAS OVERCOME THE HUMAN CAPACITY TO ANALYZE AND TO TRANSFORM THE INFORMATION IN USEFUL KNOWLEDGE THAT SUPPORTS DECISION MAKING. THIS NECESSITY HAS MOTIVATED THE EMPLOYMENT OF TECHNICAL AND TOOLS OF MINING OF DATA THAT FACILITATE THE EXTRACTION OF KNOWLEDGE, IN FORM OF RULES OR PATTERNS STARTING FROM THIS DATA.
The present workpresents a study carried out for the selection of attributes and the obtaining of parameters to predict the educational yield of the students, during a process of Discovering Knowledge in Databases (KDD) in the Superior Polytechnic Institute José Antonio Echeverría (CUJAE), with the objective of to know which are so much the characteristics of the students that influence on the average of oneyear, at level of Institute as of Specialty, focused in the methodology CRISP-DMK and the tool of analysis of data WEKA.

Key Words: data mining, KDD, select attributes, classification, decision tree, CRISP-DM, WEKA.

1. INTRODUCCIÓN

LA DENOMINACIÓN DE MINERÍA DE DATOS (MD) DERIVA DE LA SIMILITUD QUE SE ENCUENTRA ENTRE BUSCAR VALIOSA INFORMACIÓN DE NEGOCIO EN GRANDES BASES DE DATOS, Y LABÚSQUEDA DE VETAS DE METALES PRECIOSOS DENTRO DE UNA MONTAÑA, PUES AMBOS PROCESOS REQUIEREN EXAMINAR INTELIGENTEMENTE UNA INMENSA CANTIDAD DE MATERIAL, HASTA ENCONTRAR ALGO QUE PUEDA RESULTAR REALMENTE ÚTIL E INTERESANTE [1], [2].
Entre las múltiples definiciones que identifican a la minería de datos se encuentran:
“…el proceso no trivial de identificar patrones válidos, novedosos,potencialmente útiles y en última instancia, comprensibles a partir de los datos” [3].
“…el proceso de extraer conocimiento útil y comprensible, previamente desconocido, desde grandes cantidades de datos almacenados en distintos formatos” [4].
“…término genérico que engloba resultados de investigación, técnicas y herramientas usadas para extraer información útil de grandes bases de datos” [5].
De...
tracking img