Informatica
En estadística , estimación kernel (KDE) es un manera no-paramétricos de estimar la función de densidad de probabilidad de una variable aleatoria . Laestimación del kernel es un conjunto de datos fundamentales de suavizado problema donde inferencias sobre la población se hizo, en base a los datos de un finito de muestra . En algunos campos, talescomo procesamiento de señales y econometría también se llama la ventana Parzen-Rosenblatt método, después de Emanuel Parzen y Rosenblatt Murray , quien se acredita generalmente con la creación independiente queen su forma actual.
DEFINICIÓN
Sea (x 1, x 2,..., x n) ser un iid muestra extraída de una distribución con un desconocido densidad ƒ. Estamos interesados en la estimación de la forma de estafunción ƒ. Su estimador de la densidad del núcleo es
Donde K (•) es el núcleo - una función simétrica pero no necesariamente positivo que integra a uno - y h > 0 es un suavizado parámetro llamadoel ancho de banda. Un núcleo con subíndice h se llama el núcleo a escala y se define como K h (x) = 1 / h K (x / h). Intuitivamente uno quiere elegir h tan pequeño como los datos permitan, sin embargo siemprehay un equilibrio entre el sesgo del estimador y su varianza; más en la elección de la anchura de banda más tarde.
Una gama de funciones del núcleo se utilizan comúnmente: uniforme, triangular,triweight biweight, Epanechnikov , normales , y otros. El núcleo Epanechnikov es óptimo en el sentido de mínima varianza, [ 3 ] aunque la pérdida de eficiencia es pequeña para los núcleos mencionadosanteriormente, [ 4 ] y debido a sus propiedades matemáticas convenientes, el kernel normal se utiliza a menudo K ( x ) = φ ( x ) , donde φ es el estándar normal función de densidad.
La construcción deuna estimación de densidad de kernel encuentra interpretaciones en campos fuera de la estimación de la densidad. Por ejemplo, en la termodinámica , esto es equivalente a la cantidad de calor...
Regístrate para leer el documento completo.