Curso R
Plot
x<-c(1:10)
y<-3*x^3+2*x^2
plot(x,y, col=644, pch=3, ylim=c(0,4000), bty="u", xlab="Abcisas", ylab="Ordenandas", main="Gráfico", horiz=TRUE)
lines (x,y, lty=5, col="green",lwd=1)
Boxplot
Boxplot es para ver la distribución de los datos
Para saber los quatiles, se ordenan los datos de menor a mayor, el primer cuartil es al 25% de los datos. La mediana (50%) es el 2doquartil, 3er quartil (75%) y valor máximo 100. Rango entre el máximo y mínimo (intervalo).
Rango interquartil, intervalos de valor entre el 1er y 3er cuartil
La línea negra es la mediana, la medianaminimiza la suma de los desvíos, el promedio minimiza en cambio la suma de los desvíos al cuadrado.
La mediana no es sencible a los outlayer, se usa cuando los datos no son simétricos
La caja es elintervalo de los cuartiles, 1er, mediana,3er.
Bigote se extiende 1, 5 veces de la caja dependiendo del quartil.
Los valores outlayer muestran que esos datos no representan la población
Si es simétrica de lacaja, tiene distribución normal
Tenemos un vector<-c(2,3,5,8,9,10,10,11,20,20,50,100)
vector<-c(2,3,5,8,9,10,10,11,20,20,50,100)
boxplot(vector)
summary(vector)
quantile(vector)
Transformamos elvector a log para ver de mejor forma la dispersión de los datos y sean normales
logvector<-log(vector)
boxplot(logvector, col="turquoise")
Test de normalidad de Shapiro. Cuando el p-valor es cercano a1, mayor normalidad
shapiro.test(vector)
shapiro.test(logvector)
No se rechaza la variable log-transformada
Para agregar la línea del promedio en boxplot
abline (h= 20.67, lty=3, col="red")Datos de base IRIS
?iris
Para mirar las primeras 6 líneas de la tabla
head(iris)
Numero de columnas
ncol(iris)
Numero de filas
nrow(iris)
Atributos de la tabla
levels(iris[,5])
Resumen estadísticadescriptiva
summary(iris)
Graficas las longitudes para las diferentes especies de lirios.
boxplot(iris [,1]~ iris [,5], notch=TRUE, ylab="Longitud de sepalo", col=(c("gold","lightgreen", "blue")))...
Regístrate para leer el documento completo.