Aprendizaje Basado en Instancias
Considerando la tabla con atributos numéricos del ejemplo del “play” y considerando la siguiente instancia de prueba: Outlook Sunny, Temperature 82, Humidity 95,Windy True
1.- ¿Cuál sería la predicción usando 1-NN con distancias euclidianas?
2.- ¿Cuál sería la predicción usando 1-NN y distancias Manhattan?
Para contestar la pregunta 1 y 2,comenzamos con la tabla original de datos ya clasificados que es la siguiente:
Outlook
Temperature
Humidity
Windy
Play
Sunny
80
90
true
no
Sunny
75
70
true
yes
Sunny
85
85
false
noSunny
72
95
false
no
Overcast
72
90
true
yes
Rainy
71
91
true
no
Overcast
83
86
false
yes
Sunny
69
70
false
yes
Rainy
70
96
false
yes
Rainy
65
70
true
no
Overcast81
75
false
yes
Rainy
75
80
false
yes
Overcast
64
65
true
yes
Rainy
68
80
false
yes
A partir de esta tabla se deben hacer dos operaciones antes de obtener las distancias entre elquery y cada una de las instancias de esta tabla. Estas son las de normalización de los valores numéricos y la de asignación de distancia a los valores nominales.
Comenzando con los valoresnuméricos, se hace la normalización de cada valor a partir de la siguiente formula:
Donde ai es el valor normalizado obtenido, vi es el valor original de la instancia y min vi y max vi son los máximosde dicho atributo en toda la tabla.
Para los valores nominales únicamente hay dos opciones. Su distancia es 1 si es diferente al query y 0 si es igual.
Después de aplicar estos criterios, latabla anterior ahora nos queda de la siguiente manera:
Outlook
Temp Norm.
Hum
Norm.
Windy
0
0.76190476
0.80645161
0
0
0.52380952
0.16129032
0
0
1
0.64516129
1
0
0.38095238
0.967741941
1
0.38095238
0.80645161
0
1
0.33333333
0.83870968
0
1
0.9047619
0.67741935
1
0
0.23809524
0.16129032
1
1
0.28571429
1
1
1
0.04761905
0.16129032
0
1
0.80952381...
Regístrate para leer el documento completo.