Mineria de datos

Solo disponible en BuenasTareas
  • Páginas : 56 (13806 palabras )
  • Descarga(s) : 0
  • Publicado : 12 de mayo de 2011
Leer documento completo
Vista previa del texto
Miner´ de Datos ıa
Jos´ L. Balc´zar e a
Dept. Matesco, Universidad de Cantabria

MinD – Fac. Ciencias – Ing. Inform´tica – Oto˜o de 2009 a n

Cuestiones Factuales

A cargo de: Jos´ Luis Balc´zar e a
´ Unico profesor

Cuestiones Factuales

A cargo de: Jos´ Luis Balc´zar e a
´ Unico profesor

Clases:
Martes, 11:45 a 13:45, Laboratorio LSC-II Mi´rcoles, 11:45 a 12:45, Aula A14(Teor´ e ıa) Jueves, 9:45 a 11:45, Laboratorio LSC-II

(El 24/09/2009 en el Aula 3; ah´ se acord´ empezar el jueves a las ı o 9:45 en vez de hacer una pausa de 10:30 a 10:45.)

Planteamiento General

Situaci´n conceptual: Disciplina muy pr´xima a: o o
Bases de Datos, Estad´ ıstica (Probabilidad, An´lisis “Inteligente” de Datos), a Aprendizaje (Inteligencia Artificial, Teor´ de la Computaci´n),ıa o Recuperaci´n de Informaci´n. o o

Caracter´ ıstica: eclecticismo.

Planteamiento General

Situaci´n conceptual: Disciplina muy pr´xima a: o o
Bases de Datos, Estad´ ıstica (Probabilidad, An´lisis “Inteligente” de Datos), a Aprendizaje (Inteligencia Artificial, Teor´ de la Computaci´n), ıa o Recuperaci´n de Informaci´n. o o

Caracter´ ıstica: eclecticismo. Enfoque: pr´ximo a laL´gica pero eminentemente pr´ctico y o o a pragm´tico. a (Inconveniente: quedar´ un poco “batiburrillo”.) a

Evaluaci´n o
Calificaci´n: suma de dos partes, truncada a diez puntos. o Trabajos pr´cticos individuales: de cero a diez puntos. (El a tercer trabajo tendr´ m´s peso.) a a Examen de problemas: de cero a cuatro puntos. Pragmatismo: Los trabajos pr´cticos han de estar relacionados con la aasignatura, pero pueden estarlo en mayor o menor grado, seg´n el inter´s de cada alumno. u e Enunciado de los trabajos pr´cticos a negociar conmigo a individualmente; excepcionalmente, alguno se puede realizar por parejas.

Trabajos Pr´cticos a
Primero y segundo: tres opciones. Web Frameworks y Google Analytics: har´is un poco de Web e Frameworks (en Python) en la clase del martes 29, y se tratar´de continuar profundizando. a Cubos OLAP: los que hay´is visto un poco de cubos OLAP en a Bases de Datos y quer´is profundizar. a Iniciativa personal: tu propia propuesta, a partir de lo que vayamos haciendo en las sesiones de laboratorio sobre R o sobre Weka. Tercer trabajo pr´ctico: a partir de un “dataset” que acordemos (a a iniciativa tuya o m´ har´s entrar en juego todo lo que hayas ıa), aaprendido e intentar´s completar un miniproyecto de Miner´ de a ıa Datos. Seg´n lo ambicioso que pueda ser, una extensi´n de este trabajo u o puede dar lugar a un Proyecto de Fin de Carrera.

Recursos
Pr´cticas: Iros instalando R (r-project.org) y Weka. a Otro software: Django (Web Frameworks), Rapid-Miner (interfaz a Weka), MOA (extensi´n de Weka para “data streams”)... o Bibliograf´ ıa: 1. IanH. Witten, Eibe Frank
Data mining: Practical machine learning tools and techniques with java implementations. Es el libro que acompa˜a a Weka. n

2. David Hand, Heikki Mannila, Padrhraic Smyth:
Principles of data mining. Un “cl´sico”. a

3. Ricardo Baeza-Yates, Berthier Ribeiro-Neto:
Modern information retrieval. Para el poquit´ que tocaremos de ese tema. ın

4. Trevor Hastie, RobertTibshirani, Jerome Friedman:
The elements of statistical learning: Data mining. La base m´s estad´ a ıstica de la miner´ de datos. ıa

Temario
Pero el Orden Puede Variar

1. Introducci´n. o 2. Aprendizaje activo y pasivo. 3. Clasificaci´n y regresi´n: predictores. Predictores lineales con o o n´cleos. u 4. “Clustering”. 5. “Feature selection”. 6. Reglas de asociaci´n. o 7. Recuperaci´n deinformaci´n. o o

´ Indice
Probabilidad y Cotas de Concentraci´n o El modelo predictivo MAP y su aproximaci´n Na¨ Bayes o ıve ´ Arboles de Decisi´n o Metapredictores (Ensemble Methods) Segmentaci´n (Clustering) y el algoritmo K-means o Reglas de Decisi´n o Predictores Lineales Support Vector Machines Regresi´n; SVM-SMO en Weka o Reglas de Asociaci´n o Reglas de Asociaci´n (II) o Asociaciones...
tracking img