Mineria de

Solo disponible en BuenasTareas
  • Páginas : 6 (1475 palabras )
  • Descarga(s) : 0
  • Publicado : 4 de enero de 2012
Leer documento completo
Vista previa del texto
Mineria de datos y su aplicación en web mining data
Redes de computadores I – ELO 322

Nicole García Gómez – 2830047-6 Diego Riquelme Adriasola – 2621044-5

RESUMEN.-

La minería de datos corresponde a la extracción de información no trivial de una base de datos, inicialmente desconocida, pero potencialmente útil, mediante herramientas estadísticas. Una de sus aplicaciones la Web Mining,donde se estudian distintos comportamientos y factores dentro de una página web. Un correcto uso de esta información, permite entre otras cosas, comprender el hábito de los usuarios, como también mejorar el diseño de la página.

INTRODUCCIÓN.-

La minería de datos corresponde a la extracción de información en una base de datos, con el objetivo de encontrar patrones, tendencias o ciertoscomportamientos que eran desconocidos en un principio, pero que son potencialmente útiles. Para ello, se cuenta con distintos algoritmos de búsqueda y procesamientos, ya que la extracción de la información no trivial de estos datos depende de muchos factores y variables. Las aplicaciones de la minería de datos son bastante amplias, ya que se puede ver su uso en distintas áreas, tales como InteligenciaArtificial, negocios, terrorismo, informática, y comportamiento en internet. Este último caso de estudio, también llamado Web Mining (minería de datos web), en el cual se estudia la actividad de una página web, como por ejemplo, su tráfico, contenidos más accedidos, tipos de usuario y su procedencia, navegadores, sistemas operativos, etc.

MINERÍA DE DATOS.-

La minería de datos consiste enla extracción de información desconocida de una base de datos, para luego ser estudiada y analizada. Estas extracciones son inicialmente definidas por funciones estadísticas, las cuales definen las variables a buscar (objetivos), como también variables dependientes (que ayudan para realizar el cálculo). La recolección de dichos datos, se realiza a través de los siguientes pasos:
• Selección

ypre-procesado de datos: inicialmente, los datos de la fuente o base de

datos están “en bruto”, por lo que mediante el pre-procesado se filtran los datos (de forma que se eliminan valores incorrectos, no válidos, etc), y se puede obtener muestras de los mismos (volver a filtrar), o reducir el número de valores posibles (por ejemplo, redondeando).
• Selección

de variables: aún después de habersido pre-procesados, en la mayoría

de los casos se tiene una gran cantidad de datos. Para ello, se escogen las variables más influyentes en el problema. Los métodos para la selección de características son básicamente dos: 1. Los basados en la elección de los mejores atributos del problema 2. Los que buscan variables independientes mediante tests de sensibilidad, algoritmos de dista ncia oheurísticos,
• Extracción de conocimiento: mediante una técnica de minería de datos, se obtiene

un modelo de conocimiento, que representa patrones de comportamiento observados en los valores de las variables del problema o relaciones de asociación entre dichas variables. • Interpretación y evaluación: una vez obtenido el modelo, se debe proceder a su validación comprobando que las conclusionesque arroja son válidas y suficientemente satisfactorias. En el caso de haber obtenido varios modelos mediante el uso de distintas

técnicas, se deben comparar los modelos en busca de aquel que se ajuste mejor al problema. WEB MINING.-

Una aplicación de la minería de datos, es la Web Mining, la cual recupera información de las páginas webs, tanto como su contenido, estructura de enlaces yregistro de navegación de los usuarios. Por tanto, existen tres divisiones de la Web Mining: minería de estructura, minería de contenido y minería de utilización. MINERÍA DE ESTRUCTURA.Esta parte pretende revelar la estructura real de un sitio web, a través de la recolección de datos referentes a su estructura y, principalmente a su conectividad. Típicamente tiene en cuenta dos tipos de enlaces:...
tracking img