WEKA Análisis de datos: diabetes

Páginas: 6 (1362 palabras) Publicado: 3 de diciembre de 2014


WEKA:
Análisis de datos







Introducción

En este informe se mostrara el uso de la Minería de Datos en “Weka”, con diferentes métodos, ya sea arboles de decisiones, clasificaciones y asociaciones, a través de un ejemplo en donde una cantidad de personas mujeres, con su edad y su masa corporal, cuales tienen la mayor probabilidad de tener diabetes.
También se define losconceptos importantes: “Mineria de Datos” ,“Dataset , para que sirve el programa “Weka” .
Weka es una plataforma de software para el aprendizaje automático y la minería de datos. Data set, o conjunto de datos, es una colección de datos normalmente creada en una tabla. Y por último, “Mineria de Datos” es un proceso en donde se intenta descubrir patrones en grandes volúmenes de conjuntos de datosAntes de comenzar con nuestro informe, primero vamos a definir 3 conceptos fundamentales que servirá para el desarrollo de nuestro trabajo. Estas son “Data Set”, el programa “Weka” y “Minería de datos”.
¿Qué es Weka?
Weka (Waikato Environment for Knowledge Analysis, en español “entorno para análisis del conocimiento de la Universidad de Waikato”) es una plataforma desoftware para el aprendizaje automático y la minería de datos escrito en Java y desarrollado en la Universidad de Waikato. Weka es software libre distribuido bajo la licencia GNU-GPL.
Contiene una colección de herramientas de visualización y algoritmos para análisis de datos y modelado predictivo, unidos a una interfaz gráfica de usuario para acceder fácilmente a sus funcionalidades.
Los puntosfuertes de Weka son:
Está disponible libremente bajo la licencia pública general de GNU.
Es muy portable porque está completamente implementado en Java y puede correr en casi cualquier plataforma.
Contiene una extensa colección de técnicas para preprocesamiento de datos y modelado.
Es fácil de utilizar por un principiante gracias a su interfaz gráfica de usuario.
Weka soporta varias tareasestándar de minería de datos, especialmente, preprocesamiento de datos, clustering, clasificación, regresión, visualización, y selección. Todas las técnicas de Weka se fundamentan en la asunción de que los datos están disponibles en un fichero plano (flat file) o una relación, en la que cada registro de datos está descrito por un número fijo de atributos (normalmente numéricos o nominales, aunquetambién se soportan otros tipos). Weka también proporciona acceso a bases de datos vía SQL gracias a la conexión JDBC (Java Database Connectivity) y puede procesar el resultado devuelto por una consulta hecha a la base de datos. No puede realizar minería de datos multi-relacional, pero existen aplicaciones que pueden convertir una colección de tablas relacionadas de una base de datos en una únicatabla que ya puede ser procesada con Weka.

¿Qué es Data Set?
Data set, o conjunto de datos, es una colección de datos normalmente creada en una tabla
En general y en su versión más simple un conjunto de datos corresponde a los contenidos de una única tabla de base de datos, o una única matriz de datos estadística, donde cada cada de la tabla representa una variable en particular, ycada fila representa a un miembro determinado del conjunto de datos en cuestión. Un conjunto de datos contiene los valores para cada una de las variables, como podrían ser la altura y el peso de un objeto, que corresponden a cada miembro del conjunto de datos. Cada uno de estos valores se conoce con el nombre de datos. El conjunto de datos puede incluir datos para uno o más miembros en función de su número defilas.
En este caso, nuestro Dataset es un muestro de 760 mujeres, en donde tiene 4 columnas que son: La Edad, la masa corporal (donde la calcularemos a través de una fórmula (peso en kg/(altura en m)^2)) , los meses de embarazo ( 0 si es que no está embarazada) y un Test de diabetes (positivo si es diabética y negativo no es diabética).


Minería de Datos.
La minería de datos o...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Analisis De Datos En Weka Pruebas De Selectividad
  • Informática
  • analisis de datos
  • Análisis De Data
  • Analisis de datos
  • Analisis de datos
  • Analisis de datos
  • Analisis de los datos

OTRAS TAREAS POPULARES

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS