Sistemas Torchan 2do Parcial
Consiste en:
1- Tomar un conjunto de datos referidos a una determinada actividad y/o a los actores que en ella se encuentren afectados;
2- Limpiarlos y depurarlos adecuadamente;
3- Solucionar las omisiones de atributos/campos;
4- Prepararlos adecuadamente y
5- Generar modelos (o descubrir patrones) de comportamiento a los fines de: Prediccion,clasificación, visualización, agrupamiento de clusters,
Con las condición de acreditar un determinado nivel de confianza y ? en sus resultados.
Es necesaria la existencia de un repositorio (Data werehouse) del cual tomar datos aptos para su estudio.
La minería de datos:
Es la herramienta mas ?tinada;
No reemplaza al OLAP, sino que la complementa y la potencia;
Es una practica imprescindible dentro de lainteligencia de negocios
Consiste en la búsqueda de:
Relaciones insospechadas;
De patrones de conducta no evidentes entre los datos de una data werehouse a los fines de obtener ganacias; reducir costos operativos; proponer soluciones a medida.
El análisis de datos podría arrojar relaciones insospechadas entre accidentes y enfermedades, nivel ?econductas y multas de transito, que permitan facilitarcampañas preventivas de accidentes y enfermedades permitiendo apurar directamente a la raíz del problema y al segmento de la población donde efectivamente se presenta.
Ventajas apreciables:
Contabilidad sobre la calidad del conocimiento;
Verifibilidad y precisión;
Compartido? Por el grupo de trabajo;
? de procesos que se pueden enseñar y aprender.
Apliciones concretas:
Investigacion de mercadoPlaneamineto y control
Marketing
Estudio de tendencias
Pronósticos de demanda
Prevención y detección de fraudes
Análisis crediticios
Medicina/ cuidado de salud
Apunta al:
a- Descubrimiento de clientes potenciales. Ej en zonas geográficas no cubiertas;
b- Descubrimiento de productos apuntados (de consumo) al conocimiento de grupos y sus habitos;
c- Clasificación / segmentación;
d- Estudio de lealtad declientes a los fines de retención y/o recuperarlos;
e- Prevención de enfermedades y accidentes;
f- Estudio de riesgos;
g- Cross selling: se trata de aprovechar los datos de los clientes actuales para ofrecerles otros productos, comenzando por aquellos con mayor probabilidad de respuesta a una determinda oferta;
h- Pronósticos;
i- Detección temprana de fraudes con tarjeta de créditos y llamadas;
j-Rastreo y causa de llamadas telefónicas;
k- Revisiones de auditoria;
Analisis de sistemas computarizados
Los soportes físicos donde se puede efectuar alamacenamiento secundario son las cintas y discos. Los discos soportan cualquien organización, mientras que las cintas solo soportan la organización secuencial.
Clasificacion de los archivos según si organización.
La organización de un archivoqueda eterminada por la forma en que los registros se almacenan, se ubican y se recepcionan.
Serial (secuencial): en la forma mas simple que existe, ya que los registros se grabam unos detrás de otros, siguiendo un orden de secuecia, sin que ningún registro tenga dirección física. Los registro se identifican por el orden que ocupan en el archivo. Este tipo de archivos es apropiado para el manejo degrandes volúmenes de datos, particulamente en los casos que se presente cuentas uniformes en su tratamiento.
Limitaciones:
El recupera?/consulta la información se puede efectuar solo bajo un estricto orden de secuencua;
No se pueden realizar al mismo tiempo operaciones de lectura y escritura;
La actualización consiste en creer un nuevo archivo. Es el padre a lejos. Las novedades tiene que estarcoordenadas.
Aleatoria (ramdom): los registros de los archivos poseen clave y se almacenan en direcciones físicas del soporte. De conocerse la clave del registro, un algoritmo elaborado por el sistema identifica la dirección y el registro es recuperado.
Ventajas:
El recupera/consulta de la información puede efectuarse bajo un orden de secuencia. Agregan el acceso directo N? regristro buscado.
Las...
Regístrate para leer el documento completo.