curso de minería de datos

Páginas: 52 (12950 palabras) Publicado: 9 de febrero de 2015
M.C.C. ANA LILIA MONTIEL DE LA ROSA

UNIDAD II.
PREPROCESAMIENTO DE
DATOS

Al
completar la unidad
de
aprendizaje, el alumno será capaz
de:
* Implementar técnicas y estrategias
de preprocesamiento de los datos
cuando se presenta información
faltante, con ruido, diferente escala
numérica o cuando es necesaria la
discretización, mediante programas
de computadora.
* Implementartécnicas y estrategias
para
la
reducción
de
dimensionalidad y visualización de
los datos, mediante programas de
computadora.

DATA MINING Y FUNCIONES DE BASES
DE DATOS
 En el caso de integración fuerte entre el SGBD y data mining hay un fuerte

impacto sobre las diferentes funciones del sistema de bases de datos. Por
ejemplo, en el procesamiento de consultas. Se han realizado trabajospara
examinar lenguajes de consultas como SQL y determinar si se necesitan
extensiones para soportar data mining (véase por ejemplo [ACM96a]). Si hay
estructuras adicionales y consultas que son complejas, entonces el optimizador
de consultas tiene que ser adaptado para manejar esos casos. Estrechamente
relacionado con la optimización de consultas esta la eficiencia de las estructuras
dealmacenamiento, índices, y métodos de acceso. Pueden ser necesarios
mecanismos especiales para apoyar data mining en el procesamiento de
consultas.

DATA MINING Y FUNCIONES DE BASES
DE DATOS
 En el caso de gestión de transacciones, la realización de data mining puede

tener poco impacto, puesto que data mining se hace normalmente en los datos
de apoyo a la toma de decisiones y no en losdatos transaccionales. Sin
embargo hay casos dónde se analizan los datos transaccionales para anomalías
como en los casos de tarjetas de crédito y de tarjetas de teléfono. A veces las
compañías de tarjetas de crédito o de teléfono han notificado sobre usos
anómalos de tarjetas de crédito o de teléfono. Esto normalmente se hace
analizando los datos transaccionales. También se podría aplicar datamining a
estos datos.

DATA MINING Y FUNCIONES DE BASES
DE DATOS
 En el caso de metadata, se podría aplicar data mining a metadata para extraer

la información útil en casos dónde los datos no sean analizables. Ésta puede ser
la situación para datos no estructurados cuyo metadata deba ser estructurado.
Por otro lado, los metadata podrían ser un recurso muy útil para una
herramienta dedata mining. Metadata podría dar información adicional para
ayudar con el proceso de data mining.

DATA MINING Y FUNCIONES DE BASES
DE DATOS
 La seguridad, integridad, calidad del datos, y tolerancia a fallos son influidas por

data mining. En el caso de seguridad, data mining podría suponer una amenaza
importante para la seguridad y privacidad.
 Por otro lado data mining pueden usarsepara descubrir las intrusiones así como

para analizar la auditoria de datos. En el caso de auditoria, la cantidad de datos
sobre los que se aplica data mining es grande. Se pueden aplicar las
herramientas de data mining a los datos para descubrir los modelos anormales.
Por ejemplo, si un empleado hace un excesivo número de viajes a un país
determinado y este hecho es conocido, proponiendoalgunas preguntas. La
siguiente pregunta a realizar es si el empleado tiene asociaciones con ciertas
personas de ese país. Si la respuesta es positiva, entonces la conducta del
empleado se marca.

DATA MINING Y FUNCIONES DE BASES
DE DATOS
 Como ya se ha mencionado data mining tiene muchas aplicaciones en el

descubrimiento de la intrusión y analizando amenazas a las bases de datos. Sepuede usar data mining para descubrir modelos de intrusiones y amenazas.
Ésta es un área emergente y se llama Información de Confianza. No sólo es
importante tener datos de calidad, también es importante recuperarse de fallos
maliciosos o de otro tipo, y proteger los datos de amenazas o intrusiones.
Aunque la investigación en esta área simplemente está empezando, se esperan
grandes...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Mineria de datos
  • Mineria de Datos
  • MINERIA DE DATOS
  • Mineria de datos
  • Mineria de datos
  • mineria de datos
  • Mineria de datos
  • Mineria de datos

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS