Narcocultura

Solo disponible en BuenasTareas
  • Páginas : 13 (3176 palabras )
  • Descarga(s) : 0
  • Publicado : 12 de junio de 2011
Leer documento completo
Vista previa del texto
1.1 Justificación de esta tesis
Esta tesis se enmarca dentro del vasto campo de la inducción automática de conocimiento a partir de bases de datos. En particular, dentro del aprendizaje empírico de primer orden y la programación lógica inductiva, en gran auge desde hace unos 10 años.
Aunque muchos sistemas de aprendizaje basados en la lógica de proposiciones ya han demostrado su validez alaplicarlos sobre conjuntos de datos reales, en general, no ocurre lo mismo con los sistemas de programación lógica inductiva. La expresividad de la lógica de predicados permite construir descripciones sencillas, aunque dificulta enormemente la construcción de las mismas, al producirse una explosión combinatoria en el espacio de búsqueda. Esto hace que la búsqueda de la mejor descripción se conviertaen una difícil y costosa tarea, sólo posible mediante la aplicación de métodos heurísticos, ya usados por la mayoría de estos sistemas.
La aplicación de sistemas de "laboratorio" para inducción de conocimiento a partir de bases de datos reales presenta dificultades adicionales, asociadas al ruido e incertidumbre de la realidad, al gran volumen de datos existente en una base de datos real, así comoa la dinamicidad e incompletitud de algunos datos.
El trabajo central de esta tesis se orienta, precisamente, hacia la aplicación de un sistema de programación lógica inductiva bien conocido, FOIL ( [Quinlan, 90]), sobre bases de datos reales.
Para ello, se analizará, en primer lugar, la parte heurística que utiliza, en concreto la función Ganancia de evaluación de literales, que presentaalgunas deficiencias en situaciones concretas que pueden presentarse no sólo en la realidad sino también en pequeños ejemplos de entrenamiento. Este punto guarda una estrecha relación con un problema bien conocido en muchos sistemas de optimización: los máximos locales. Una sustitución de esta función de evaluación por otra basada en medidas del interés de los literales, según ciertos criterios, asícomo algunas modificaciones en la construcción de los conjuntos de entrenamiento intermedios, mejoran sustancialmente el comportamiento global del algoritmo, solventando los problemas detectados.
Por otro lado, se introducirá una importante mejora en el sistema anterior, enfocada hacia la manipulación de la incertidumbre asociada a la realidad. Se propone la utilización de la lógica borrosa y deconjuntos borrosos para representar, de un modo más natural, conceptos borrosos dentro de la base de datos relacional de partida. La adaptación del algoritmo para manejar relaciones borrosas a la entrada y construir definiciones con incertidumbre a la salida amplía las posibilidades y la expresividad (más afín a la concepción humana de la realidad) del sistema original. Esto supone una interesanteaportación dentro de la programación lógica inductiva, ya que los sistemas existentes hasta ahora no van más allá de la manipulación de relaciones ordinarias (booleanas) o, a lo sumo, de relaciones en las que algunos atributos tienen asociado un factor de incertidumbre (enfocados a la lógica de proposiciones extendida). El sistema que se propone, por el contrario, maneja relaciones borrosas en símismas (con incertidumbre asociada a sus tuplas) y las descripciones que construye se basan en la lógica borrosa y en la lógica de predicados. Es decir, este sistema podría decirse que utiliza la "lógica borrosa de primer orden" para representar el conocimiento inducido. Sobre este punto será necesario desarrollar algunos conceptos teóricos y definiciones nuevas.
1.2 Objetivos
El principalobjetivo que se planteó al comenzar este trabajo fue la adaptación de un sistema de programación lógica inductiva para poder aplicarlo sobre datos reales y su extensión para poder manejar conocimiento con incertidumbre, tanto en los datos de entrada (en la base de datos relacional de partida) como en las definiciones lógicas que se induzcan.
Para conseguir este objetivo, se desglosó el mismo en...
tracking img