Neuromarketing

Solo disponible en BuenasTareas
  • Páginas : 7 (1535 palabras )
  • Descarga(s) : 0
  • Publicado : 10 de noviembre de 2011
Leer documento completo
Vista previa del texto
Regresion logística

La idea de este ejercicio es aclarar la relación entre:
•Una variable dependiente cualitativa, dicotómica (regresión logística binaria o binomial) o con más de dos valores (regresión logística multinomial).
•Una o más variables explicativas independientes, o covariables, ya sean cualitativas o cuantitativas.
Como vemos, las covariables pueden ser cuantitativas ocualitativas. Las covariables cualitativas deben ser dicotómicas, tomando valores 0 para su ausencia y 1 para su presencia (esta codificación es importante, ya que cualquier otra codificación provocaría modificaciones en la interpretación del modelo). Pero si la covariable cualitativa tuviera más de dos categorías, para su inclusión en el modelo deberíamos realizar una transformación de la misma en variascovariables cualitativas dicotómicas ficticias o de diseño (las llamadas variables dummy), de forma que una de las categorías se tomaría como categoría de referencia. Con ello cada categoría entraría en el modelo de forma individual. En general, si la covariable cualitativa posee n categorías, habrá que realizar n-1 covariables ficticias. Un ejemplo con la covariable color de ojos:
|Categorías|F1 |F2 |
|Azules (categoría de referencia) |0 |0 |
|Verdes |1 |0 |
|Marrones |0 |1 |

En este ejemplo un sujeto de ojos azules (la categoría de referencia), entraría en el modelo con F1=0 y F2=0, mientras que un sujeto con ojosverdes entraría con F1=1 y F2=0.
Por sus características, los modelos de regresión logística permiten dos finalidades:
1. Cuantificar la importancia de la relación existente entre cada una de las covariables y la variable dependiente, lo que lleva implícito también clarificar la existencia de interacción y confusión entre covariables respecto a la variable dependiente (es decir, conocer laodds ratio para cada covariable).
2. Clasificar individuos dentro de las categorías (presente/ausente) de la variable dependiente, según la probabilidad que tenga de pertenecer a una de ellas dada la presencia de determinadas covariables.
En esta nota me ocuparé únicamente de los modelos de regresión logística binaria. Resultan los de mayor interés ya que la mayor parte de las circunstanciasanalizadas en medicina responden a este modelo (presencia o no de enfermedad, éxito o fracaso, etc). Como hemos visto, la variable dependiente será una variable dicotómica que se codificará como 0 ó 1 (ausencia y presencia respectivamente). Este aspecto de la codificación de las variables no es vanal (influye en la forma en que se realizan los cálculos matemáticos), y habrá que tenerlo muy en cuentasi empleamos paquetes estadísticos que no recodifican automáticamente nuestras variables cuando éstas se encuentran codificadas de forma diferente (por ejemplo el frecuente uso de 1 para la presencia y -1 ó 2 para la ausencia).
La ecuación de partida en los modelos de regresión logística es como sigue:
[pic]
Ecuación 1
... siendo P(y=1|X) la probabilidad de que y tome el valor 1 (presencia dela característica estudiada), en presencia de las covariables X (aquí X es un conjunto de n covariables x1, x2, ... , xn-1, xn). Los componentes de esta ecuación son:
1. b0 es la constante del modelo o término independiente
2. n el número de covariables
3. bi los coeficientes de las covariables
4. xi las covariables que forman parte del modelo.
Es lo que se denomina distribuciónlogística. En la siguiente imagen vemos un ejemplo de esta distribución: la probabilidad de padecer enfermedad coronaria en función de la edad. Como puede verse, la relación entre la variable dependiente (cualitativa dicotómica), y la covariable (edad, cuantitativa continua en este caso), no es definida por una recta (lo que correspondería un modelo lineal), sino que decribe una forma sigmoidea...
tracking img