Inteligencia Artificial y Seguridad Informatica
Jornadas de Software Libre y Seguridad Informática
Santa Rosa – La Pampa – 4 y 5 de Diciembre de 2009
AGENDA
http://www.ifork.com.ar
Primera Parte
Definiciones y ejemplos
- Definición de Data Mining - ¿Qué son las Redes Neuronales? - ¿Qué es la Estadística Bayesiana? - Sistemas de Detección de Intrusos (IDS)- Open Source software para Data Mining, Redes Neuronales y Bayesianas
Segunda Parte
Aplicaciones a la Seguridad Informática
- Redes Neuronales y Bayesianas para sistemas de IDS - Algoritmos de Clasificación para sistemas de antispam y antivirus - Data Mining para peritajes informáticos y estudios criminalísticos on-line - Inteligencia Artificial para mejorar el rendimiento de redes yservidores
DATA MINING Definición
http://www.ifork.com.ar
Se llama Minería de Datos a un conjunto de herramientas y algoritmos provenientes de la Inteligencia Artificial cuya finalidad es la de encontrar patrones ocultos y no triviales en grandes bases de datos, los cuales resultan imposible de detectar mediantes otras técnicas estadísticas y matemáticas tradicionales. Entre los mencionadosalgoritmos se encuentran: -Redes Neuronales -Redes Bayesianas -Árboles de Decisión -Algoritmos Genéticos Mediante el procesamiento y análisis de las mencionadas bases de datos, se pretende generar CONOCIMENTO que resulte de fundamental importancia a la hora de toma de decisiones. Que puede ir, desde realizar una inversión, otorgar un crédito hasta crear una nueva regla de firewall o subir el umbralen un sistema anti-spam.
REDES NEURONALES Sistema Artificial que emula el funcionamiento del cerebro humano.
http://www.ifork.com.ar
-Son capaces de aprender mediante diferentes algoritmos de entrenamiento y poseen diferentes arquitecturas, dependiento del problema a resolver.
- Son flexibles y resistentes a errores. - Pueden procesar en tiempo real. - Sus principales usos se dan en elreconocimiento de patrones y en los modelos de predicción. - Son aplicables por ejemplo en el Mercado Bursátil, en los sistemas OCR, en la Segmentación de Clientes, en predicciones de Demanda y especialmente en Detección de Fraudes y Riesgos.
REDES NEURONALES Modelos Supervisados Entrenados en base al conocimiento previo
http://www.ifork.com.ar
Modelos NO Supervisados Entrenados en basea aproximaciones estadísticas matemáticas. Se autoorganizan.
En Seguridad Informática Se utilizan los modelos SUPERVISADOS. Se entrenan en base a que el “maestro” determine si una conexión o evento de red, fue una intrusión o no.
REDES BAYESIANAS Son redes basadas en probabilidades, específicamente condicionales. Obtienen su nombre del Teorema de Bayes. Constan de gráficos acíclicos ydirigidos, donde cada nodo representa una variable aleatoria del sistema. Ejemplos
http://www.ifork.com.ar
En medicina, un conjunto de variables representan diferentes síntomas, y en base a ello se calcula la probabilidad de padecer determinada enfermedad. En informática, los clasificadores bayesianos se utilizan en los sistemas de detección de intrusos, asignándole en base a una serie devariables la probabilidad de que un evento sea una intrusión. También en los sistemas anti-spam, asignándole a un mail la probabilidad de que sea un spam. El popular spamassassin es una potente red bayesiana basada en puntajes, que a su vez estos puntajes están basados en probabilidades.
-Se crea un archivo de mails válidos en $HOME/Mail/ham - Se crea un archivo de spam que Spamassassin no detecto en$HOME/Mail/mspam - A medida que crecen las bases, se corre el comando “sa-learn “ que es el agoritmo de entrenamiento bayesiano que asigna a cada mail en dichos archivos un score.
CONCEPTOS IMPORTANTES DE DATA MINING
http://www.ifork.com.ar
Clasificador: Es aquel algoritmo encargado de segmentar y aglomerar instancias de variables que poseen características en común mediante el...
Regístrate para leer el documento completo.