Data mining

Páginas: 65 (16198 palabras) Publicado: 25 de febrero de 2010
UNIVERSIDAD TECNOLOGICA DE QUERETARO

INGIENERIA EN TECNOLOGIAS DE LA INFORMACIÓN Y
COMUNICACIÓN

PROYECTO DE INVESTIGACION
BASE DE DATOS

SERGIO GÓMEZ HERNÁNDEZ
ALEJANDRO CERRITOS RAMIREZ

ITI4

24/02/10

Minería de Datos

La minería de datos integra numerosas técnicas de análisis de datos y extracción de modelos, aunque se basa en varias disciplinas, algunas de ellas mastradicionales, se distingue de ellas en la orientación mas hacia el fin que hacia el medio, hecho que permite nutrirse de todas ellas sin prejuicios. La minería de datos es solo una etapa, si bien la mas importante, de lo que ha venido llamando el proceso de extracción de conocimiento a partir de datos. Este proceso consta de varias fases e incorpora muy diferentes técnicas de los campos del aprendizajeautomático, la estadística, las bases de datos, los sistemas de gestión de información, etc.

La minería de datos se crea, en realidad por la aparición de nuevas necesidades y, especialmente por el reconocimiento de un nuevo potencial: “los datos”, pasan de ser un producto (el resultado histórico de los sistemas de información) a ser una “materia prima” que hay que explotar para obtener elverdadero “producto elaborado”, el conocimiento; un conocimiento que ha de ser especialmente valiosa para la ayuda en la toma de decisiones sobre el ámbito en el que se han recopilado o extraído los datos.

El principal cometido de la minería de datos: resolver problemas analizando los datos presentes en las bases de datos.

Ejemplo: suponga que una cadena de tiendas comerciales quiere ampliar suzona de actuación abriendo nuevos locales, para ello la empresa analiza la información disponible en sus bases de datos de clientes para determinar el perfil de los mismos y hace uso de diferentes indicadores demográficos que le permiten determinar los lugares más idóneos para las nuevas tiendas.

La clave de este problema es analizar los datos para identificar el patrón que define lascaracterísticas de los clientes más fieles y que se usa posterior mente para identificar el número de futuros buenos clientes de cada zona. El análisis de los datos de una base de datos se realizaba mediante consultas efectuadas con lenguajes de consulta, como el SQL, y se producía sobre la base de datos operacional, esta manera de actuar solo permitía generar información resumida de una manera previamenteestablecida (generación de informes), poco flexible y, sobre todo, poco escalable a grandes volúmenes de datos. Para este inconveniente se ha desarrollado recientemente una nueva arquitectura: el almacén de datos (data warehouse), se trata de un repositorio de datos, integrados y organizados bajo un esquema unificado para facilitar su análisis y dar soporte a la toma de decisiones, esta tecnologíaincluye operaciones de procesamiento analítico en línea( On-Line Analytical Prcessing, OLAP), es decir, técnicas de análisis como pueden ser el resumen, la consolidación o la agregación, así como la posibilidad de ver la información desde distintas perspectivas.

Lo que de verdad es interesante es el conocimiento que puede inferirse a partir de los datos y, más aún la capacidad de poder usareste conocimiento. La minería de datos se distingue porque no obtiene información extensional (datos) sino intencional (conocimiento) y, además, el conocimiento no es, generalmente, una parametrización de ningún modelo preestablecido o intuido por el usuario, sino que es un modelo novedoso y original, el resultado de la minería de datos son conjunto de reglas, ecuaciones, árboles de decisión, redesneuronales, grafos probabilísticos.

Por lo tanto son dos los retos de la minería de datos: por un lado, trabajar con grandes volúmenes de información de datos, procedentes mayoritariamente de sistemas de información, con los problemas que ello conlleva (ruido, datos ausentes, intratabilidad, volatilidad de los datos), y por el otro usar técnicas adecuadas para analizar los mismos y extraer...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Data Mining
  • Data Mining
  • data mining
  • Data mining
  • Data Mining
  • DATA MINING
  • Data Mining
  • Data Mining

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS