Metodos basados en casos y en vecindad

Solo disponible en BuenasTareas
  • Páginas : 2 (372 palabras )
  • Descarga(s) : 0
  • Publicado : 26 de mayo de 2011
Leer documento completo
Vista previa del texto
MINERÍA DE DATOS

MÉTODOS BASADOS EN CASOS Y EN VECINDAD

 Métodos

basados en Casos: Este tipo de métodos resuelve problemas a partir de información extraída de un conjunto de ejemplosexistentes previamente.
basados en Vecindad: Su predicción se basa fundamentalmente en la utilización del conjunto de ejemplos “vecinos” al dato que hay que procesar.

 Métodos

INTRODUCCIÓN
Cuando

se aprende de ejemplos, casos o datos conocidos, generalmente lo que se intenta es poder tomar una decisión sobre nuevos casos.  Nueva situación: Se deberá actuar como en situacionesanteriores parecidas o similares.

¿Cuándo será explotada la similitud?


Preprocesamiento Anticipativo o no Retardado. *si o no modelo * predice al vuelo Preprocesamiento Demorado o Retardado.*modelo de generalización individual *Retrasan la decisión de generalización.



MANERAS DE PROCESAR LOS EJEMPLOS
 Memorización

de todos los ejemplos (métodos retardados).  Memorización departe (ejemplos significativos).  Creación de Prototipos (métodos no retardados).

MEDIDAS DE DISTANCIA


Si se quiere saber la similitud entre dos instancias o individuos, es necesario elegiruna función de distancia y calcular con ella la distancia entre los dos individuos. Medidas de distancias Tradicionales: Atributos Numéricos.
Distancia Euclídea: Distancia clásica, longitud de larecta que une dos puntos en el espacio. Distancia d Manhattan: Recorre caminos en forma de zigzag. Distancia de Chebychev: Calcula la discrepancia mas grande en alguna de las dimensiones. Distancia deCoseno: Si se considera que cada ejemplo es un vector, la distancia seria el coseno del ángulo que forman.

   

MEDIDAS DE DISTANCIAS: ATRIBUTOS NOMINALES.

Para

atributos nominales sesuele utilizar la función Delta, es decir ᵟ(a , b)=0 si y sólo si a=b y ᵟ(a , b)=1 en caso contrario

K-MEDIAS
Es un Método de agrupamiento por vecindad.  La idea del K-Medias es situar a los...
tracking img