Base de datos distribuidas

Solo disponible en BuenasTareas
  • Páginas : 22 (5471 palabras )
  • Descarga(s) : 0
  • Publicado : 22 de mayo de 2011
Leer documento completo
Vista previa del texto
INDICE
Introducción
UNIDAD 4. Nuevas Tecnologías de Base de Datos
4.1 Minería de Datos
4.1.1 Nuevas Necesidades
4.1.2 Tipos de Datos
4.1.3 Tipos de Modelos
4.1.4 El proceso de descubrimientos de Conocimientos en la Base de Datos
4.1.5 Relación con otras disciplinas
4.1.6 Sistemas y herramientas de minería de Datos
4.1.7 Las fases del proceso de extracción de Conocimiento
4.2Otras tendencia: panorámica y aplicaciones----
4.2.1 Base de Datos especiales
4.2.2 Base de Datos Temporales
4.2.3. Base de Datos Activas
4.2.4 Bases de Datos Móviles

Nuevas Tocologías de Bases de Datos

4.1 Minería de Datos
Aunque desde un punto de vista académico el término data mining es una etapa dentro de un proceso mayor llamado extracción de conocimiento en bases de datos. LaMinería de Datos (Data Mining) es un conjunto de técnicas y procesos de análisis de datos quepermite extraer información de bases de datos y Almacenes de Datos mediante la búsqueda automatizada de patrones y relaciones.

Una definición tradicional es la siguiente: Un proceso notrivial de identificación válida, novedosa, potencialmente útil y entendible depatrones comprensibles que se encuentranocultos en los datos (Fayyad y otros,1996).

4.1.1 Nuevas Necesidades
Lo que se pretende conseguir es proporcionar información detallada sobre algunos ejemplos de software diseñados para implementar la Minería de Datos.

Librerías: las librerías de Minería de datos son un conjunto de métodos que implementan funcionalidades y utilidades básicas como el acceso a datos, modelos de redesneuronales, métodos bayesianos, exportación de resultados… Las librerías se encargan principalmente de facilitar el desarrollo de las tareas de Minería de Datos que son más complejas, como el diseño de experimentos.

El problema de las librerías, es que es precisa la comprensión de conocimientos de programación. Algunas de las Librerías más importantes son: o XELOPES XELOPES (extended library forprudys embedded solution): es una librería con licencia pública GNU para el desarrollo de aplicaciones de Minería de Datos. Esta librería está implementada para que sea eficiente para la mayoría de los algoritmos de aprendizaje, por eso, es importante destacar que el usuario puede desarrollar aplicaciones particulares de Minería de Datos. Sus principales características son:
* Acceso a datos* Modelos de redes neuronales
* Métodos de agrupamiento
* Métodos de reglas de asociación
* Árboles lineales
* Árboles no lineales
* Exportación de datos

4.1.2 Tipos de Datos
Cuando cree un modelo o una estructura de minería en deberá definir los tipos de datos de cada una de las columnas de la estructura. Los tipos de datos indican al motor de minería de datos silos datos del origen de datos son numéricos o de texto y cómo deben procesarse los datos.

Por ejemplo, si el origen de datos contiene datos numéricos, puede especificar si los números deben tratarse como enteros o utilizando posiciones decimales.

Por ejemplo, si tiene datos numéricos en una columna, puede elegir que se traten como tipos de datos numéricos o como texto. Si elige el tipo dedatos numérico, puede establecer varios tipos de contenido diferentes: puede discretizar los números o tratarlos como valores continuos. Para obtener una lista de todos los tipos de contenido.

Analysis Services admite los tipos de datos siguientes para las columnas de estructura de minería:

Tipo de datos | Tipos de contenido admitidos |
Text | Cyclical, Discrete, Discretized, Key Sequence,Ordered, Sequence |
Long | Continuous, Cyclical, Discrete, Discretized, Key, Key Sequence, Key Time, Ordered, Sequence, TimeClassified |
Boolean | Cyclical, Discrete, Ordered |
Double | Continuous, Cyclical, Discrete, Discretized, Key, Key Sequence, Key Time, Ordered, Sequence, TimeClassified |
Date | Continuous, Cyclical, Discrete, Discretized, Key, Key Sequence, Key Time, Ordered |...
tracking img