martes, 13 de mayo de 2014

Técnicas de visualización de datos a ser utilizadas este semestre

En este lapso académico se les pide a los estudiantes de Estadística General (745) realizar diagramas de tallo y hoja, ojivas de frecuencia y diagramas de caja como parte de las actividades prácticas del objetivo 1. En esta entrada, hablaré un poco sobre estas técnicas de visualización de datos y como se implementan en R / estUNA.

martes, 22 de abril de 2014

Estadística General, Aplicada e Inferencial: Nuevos planes de evaluación y Trabajos Prácticos

Se le informa a los estudiantes inscritos en Estadística General (745), Estadística Aplicada (746) e Inferencia Estadística (738-748) que los planes de evaluación de estas materias han sido modificados para el semestre entrante 2014-1.  Donde antiguamente el objetivo 1 (745), el objetivo 6 (746) y los objetivos 8, 9 y 10 (738/748) eran evaluados mediante la elaboración de un informe cuya entrega era obligatoria, este semestre estos objetivos serán evaluados en la primera parcial (745), segunda parcial (746) y tercera parcial (738/748).  Los trabajos de estas materias son evaluaciones de tipo formativa, lo cual significa que deben ser realizadas por el estudiante, pero no se requiere la entrega de un informe o trabajo al asesor y por eso verán que en los enunciados no hay fechas de entrega, ni para el borrador ni para la versión final del informe.  Sin embargo, es importante que el estudiante realice el trabajo (pueden reunirse en grupos de estudio y con el asesor si requiere asesoría), debido a que las preguntas en los parciales se referirán a la interpretación de los resultados obtenidos tras realizar las actividades indicadas en el enunciado del trabajo.

Seguidamente les indico los enlaces de descarga de los enunciados:
Se ha actualizado la librería estUNA para incluir la data del semestre 2014-1. Pulse el enlace para descargar la librería. El dataframe para este semestre es d20141.  Próximamente, se estarán publicando entradas en este blog referente a la realización de algunas de las actividades prácticas de este semestre, como los diagramas de tallo y hoja, las ojivas, entre otras.

Si te gustó o te pareció útil este contenido, compártelo en las redes sociales y dale tu voto positivo en el botón "me gusta" de G+, para que otros puedan encontrar el contenido también.

martes, 24 de diciembre de 2013

Feliz Navidad en R

¡Feliz navidad 2013!


Por cierto, el árbol de navidad de arriba fue generado mediante el siguiente código en R:


parte <- list(x0=0,y0=0,x1=0,y1=1,
    rama1=NULL,rama2=NULL,extension=NULL,
    lwd=1,nivel=0,col="darkgreen")

par(mfrow=c(1,1),mar=c(5, 4, 4, 2) + 0.1)
segplot <- function(arbol) {
  if (is.null(arbol)) return()
  segments(arbol\(\$\)x0,arbol\(\$\)y0,arbol\(\$\)x1,arbol\(\$\)y1,
      col=arbol\(\$\)col,
      lwd=arbol\(\$\)lwd)
  segplot(arbol\(\$\)rama1)
  segplot(arbol\(\$\)rama2)
  segplot(arbol\(\$\)extension)
}

crear_adornos <- function(arbol) {
  if (is.null(arbol)) return()
  padorno <- 0.002*(arbol\(\$\)x1)^2*abs(arbol\(\$\)y1)^2.5
  adorno <- sample(c(T,F),size=1,prob=c(padorno,1-padorno))
  cadorno <- sample(c("darkred","darkgoldenrod4"),size=1,prob=c(0.6,0.4))
  if (adorno)
    adornos <<- rbind(adornos,data.frame(x=arbol\(\$\)x1,y=arbol\(\$\)y1,color=cadorno))
  crear_adornos(arbol\(\$\)rama1)
  crear_adornos(arbol\(\$\)rama2)
  crear_adornos(arbol\(\$\)extension)
}

crear_luces1 <- function(arbol) {
  if (is.null(arbol)) return()
  padorno <- 0.003*(arbol\(\$\)x1)^2*abs(arbol\(\$\)y1)^2
  adorno <- sample(c(T,F),size=1,prob=c(padorno,1-padorno))
  if (adorno)
luces1 <<- rbind(luces1,data.frame(x=arbol\(\$\)x1,y=arbol\(\$\)y1))
  crear_luces1(arbol\(\$\)rama1)
  crear_luces1(arbol\(\$\)rama2)
  crear_luces1(arbol\(\$\)extension)
}

crear_luces2 <- function(arbol) {
  if (is.null(arbol)) return()
  padorno <- 0.003*(arbol\(\$\)x1)^2*abs(arbol\(\$\)y1)^2
  adorno <- sample(c(T,F),size=1,prob=c(padorno,1-padorno))
  if (adorno)
luces2 <<- rbind(luces2,data.frame(x=arbol\(\$\)x1,y=arbol\(\$\)y1))
  crear_luces2(arbol\(\$\)rama1)
  crear_luces2(arbol\(\$\)rama2)
  crear_luces2(arbol\(\$\)extension)
}

crece <- function(arbol) {
  if (is.null(arbol) ) return(NULL)

  arbol\(\$\)lwd=arbol\(\$\)lwd*1.2

  if (arbol\(\$\)lwd>2.5) arbol\(\$\)col <- "brown"
  if (is.null(arbol\(\$\)extension)) {
    arbol\(\$\)extension <- list(
        x0=arbol\(\$\)x1,
        y0=arbol\(\$\)y1,
        x1=rnorm(1,1,.03)*(2*arbol\(\$\)x1-arbol\(\$\)x0),
        y1=(rnorm(1,.98,.02)+.02*(arbol\(\$\)x1==arbol\(\$\)x0))*(2*arbol\(\$\)y1-arbol\(\$\)y0),
        rama1=NULL,
        rama2=NULL,
        extension=NULL,
        lwd=1,
        nivel=arbol\(\$\)nivel-0.25,
        col=arbol\(\$\)col
    )
    largo=sqrt((arbol\(\$\)x1-arbol\(\$\)x0)^2 + (arbol\(\$\)y1-arbol\(\$\)y0)^2)
    angle <- asin((arbol\(\$\)x1-arbol\(\$\)x0)/largo)
    rama <- list(
        x0=(arbol\(\$\)x1+arbol\(\$\)x0)/2,
        y0=(arbol\(\$\)y1+arbol\(\$\)y0)/2,
        rama1=NULL,
        rama2=NULL,
        extension=NULL,
        lwd=1,
        nivel=arbol\(\$\)nivel-0.25,
        col=arbol\(\$\)col
    )
    shift <- rnorm(2,.5,.1)
    rama\(\$\)x0 <- shift[1]*arbol\(\$\)x1+(1-shift[1])*arbol\(\$\)x0
    rama\(\$\)y0 <- shift[1]*arbol\(\$\)y1+(1-shift[1])*arbol\(\$\)y0
    largo=largo*rnorm(1,.5,.05)
    co <- runif(1,.35,.45)
    rama\(\$\)x1 <- rama\(\$\)x0+sin(angle+co)*largo
    rama\(\$\)y1 <- rama\(\$\)y0+cos(angle+co)*largo
    arbol\(\$\)rama1 <- rama
    rama\(\$\)x0 <- shift[2]*arbol\(\$\)x1+(1-shift[2])*arbol\(\$\)x0
    rama\(\$\)y0 <- shift[2]*arbol\(\$\)y1+(1-shift[2])*arbol\(\$\)y0
    co <- runif(1,.35,.45)
    rama\(\$\)x1 <- rama\(\$\)x0+sin(angle-co)*largo
    rama\(\$\)y1 <- rama\(\$\)y0+cos(angle-co)*largo
    arbol\(\$\)rama2 <- rama 
  } else {
    arbol\(\$\)rama1 <- crece(arbol\(\$\)rama1)
    arbol\(\$\)rama2 <- crece(arbol\(\$\)rama2)
    arbol\(\$\)extension <- crece(arbol\(\$\)extension)
  }
  arbol\(\$\)nivel <- arbol\(\$\)nivel+1
  if (arbol\(\$\)nivel>6)  arbol\(\$\)col <- "brown"

  arbol
}
arbol <- parte
for (i in 1:9) arbol <- crece(arbol)
png("arbol%02d.png")
par(mar=c(0,0,0,0))
plot(x=c(-3,3),y=c(0,9),type="n",axes=FALSE,xlab="",ylab="")
pd<-par("usr")
rect(pd[1],pd[3],pd[2],pd[4],col="black")
adornos <- data.frame(x=numeric(0),y=numeric(0),color=character(0))
crear_adornos(arbol)
luces1 <- data.frame(x=numeric(0),y=numeric(0))
crear_luces1(arbol)
luces2 <- data.frame(x=numeric(0),y=numeric(0))
crear_luces2(arbol)
#dibuja el arbol sin las luces
segplot(arbol)
with(adornos,{points(x=x,y=y,pch=19,cex=1.5,col=as.character(color))})
#dibuja el arbol con las luces1
plot(x=c(-3,3),y=c(0,9),type="n",axes=FALSE,xlab="",ylab="")
pd<-par("usr")
rect(pd[1],pd[3],pd[2],pd[4],col="black")
segplot(arbol)
with(adornos,{points(x=x,y=y,pch=19,cex=1.5,col=as.character(color))})
with(luces1,{points(x=x,y=y,pch="+",cex=0.8,col="white")})
#dibuja el arbol con las luces2
plot(x=c(-3,3),y=c(0,9),type="n",axes=FALSE,xlab="",ylab="")
pd<-par("usr")
rect(pd[1],pd[3],pd[2],pd[4],col="black")
segplot(arbol)
with(adornos,{points(x=x,y=y,pch=19,cex=1.5,col=as.character(color))})
with(luces2,{points(x=x,y=y,pch="+",cex=0.8,col="yellow")})
#dibuja el arbol con todas las luces
plot(x=c(-3,3),y=c(0,9),type="n",axes=FALSE,xlab="",ylab="")
pd<-par("usr")
rect(pd[1],pd[3],pd[2],pd[4],col="black")
segplot(arbol)
with(adornos,{points(x=x,y=y,pch=19,cex=1.5,col=as.character(color))})
with(luces1,{points(x=x,y=y,pch="+",cex=0.8,col="white")})
with(luces2,{points(x=x,y=y,pch="+",cex=0.8,col="yellow")})
#fin
graphics.off()

El código no es enteramente mio. La rutina para crear el arbol fue tomada de http://www.r-bloggers.com/merry-christmas-2/ . El código para crear las lucecitas y los adornos si es mio.

Si te gustó o te pareció útil este contenido, compártelo en las redes sociales y dale tu voto positivo en el botón "me gusta" de G+, para que otros puedan encontrar el contenido también.

domingo, 24 de noviembre de 2013

Trabajo Práctico de Estadística 2013-2 - Bibliografía

En el trabajo práctico de estadística de este semestre (2013-2) se estudia una data relativa a la ceba de la cachama blanca. A tal fín incluyo algunas referencias bibliográficas al final de esta entrada.  Si alguien ha encontrado algunos recursos bibliográficos de interés, por favor indíquelos en los comentarios de esta entrada del blog.

Quisiera sugerirles que para la discusión/interpretación de los resultados tomen en cuenta la información básica sobre la piscicultura, que debe incluirse en el marco teorico de este informe.  La discusión/interpretación de los resultados es eso, no una mera repetición de los resultados. Por ejemplo, la moda de la variable X8 para datos sin agrupar es de 84,04, tal como lo reflejan en alguna tabla de los resultados. ¿Para qué repetir esto en la discusión de los resultados? Más bien, interpreten los resultados a la luz de los procedimientos y técnicas de este cultivo. Por ejemplo, ¿está la temperatura del agua o el Ph dentro del rango sugerido para el cultivo de la cachama blanca? Existe una regla para el suministro de alimento en la cual se toma en cuenta el cálculo de la biomasa (Número de alevines por peso promedio). ¿Concuerdan los datos con esta regla? Seguramente si leen un poco sobre el cultivo de la cachama, encontraran muchos otros elementos que les ayudarán a plantear una buena interpretación de los resultados.

Por último, les recuerdo que "Discusión de los resultados" no es lo mismo que "Conclusión". Básicamente, en la Conclusión ya no van a hacer referencia al cultivo de la cachama. Para más información ver este enlace en mi blog viejo.


Bibliografía

  • TORRES, E. (2010). MANUAL DE PISCICULTURA DE AGUAS DULCES. Disponible en: http://www.alevinos-acuicultura.com/Portals/1/Manual%20Piscicultura%20Clientes.pdf .
  • PEÑUELA-HERNANDEZ, Z., HERNÁNDEZ-AREVALO, G. , CORREDOR MATUS J. R., CRUZ-CASALLAS P. E.  (2007). Consumo de oxígeno en cachama blanca (Piaractus brachypomus) durante diferentes etapas de desarrollo corporal. Revista ORINOQUIA - Universidad de los Llanos. Vol. 11, N° 1. Disponible en: http://www.redalyc.org/pdf/896/89611105.pdf .
  • GOMEZ-TRUJILLO, M. (2010). Manual de piscicultura para comunidades amazónicas. Instituto del Bien Común. Lima. Disponible en: http://www.sisman.utm.edu.ec/libros/FACULTAD%20DE%20CIENCIAS%20VETERINARIAS/CARRERA%20DE%20INGENIER%C3%8DA%20EN%20ACUICULTURA%20Y%20PESQUER%C3%8DAS/LIBROS%201/manual%20pisicultura.pdf.

Si te gustó o te pareció útil este contenido, compártelo en las redes sociales y dale tu voto positivo en el botón "me gusta" de G+, para que otros puedan encontrar el contenido también.

martes, 19 de noviembre de 2013

Estudio de estadística descriptiva en R /estUNA - video Tutorial

Video-tutorial sobre cómo utilizar el lenguaje R y la librería estUNA para realizar análisis exploratorio de datos como los que se piden en los trabajos prácticos de Estadística General (745):

Si te gustó o te pareció útil este contenido, compártelo en las redes sociales y dale tu voto positivo en el botón "me gusta" de G+, para que otros puedan encontrar el contenido también.

lunes, 4 de noviembre de 2013

Video tutorial sobre cómo instalar R

A continuación un breve video tutorial sobre como descargar e instalar R, usar R desde un RWeb server y descargar la librería estUNA. Para descargar el programa de instalación de R, debe navegar al sitio cran.


Si te gustó o te pareció útil este contenido, compártelo en las redes sociales y dale tu voto positivo en el botón "me gusta" de G+, para que otros puedan encontrar el contenido también.

jueves, 3 de octubre de 2013

Trabajos de Estadística para el 2013-2

Ya están disponibles los enunciados para los trabajos prácticos de estadística del semestre 2013-2, elaborados por Nivel Central.  Los enlaces se dan a continuación (según http://areamatematicas.galeon.com/):

Sobre las fechas de entrega, se ha escrito en los enunciados lo siguiente:

La evaluación del trabajo comprende dos entregas obligatorias:
  • 1era Entrega: primera versión del informe final entre el 09/11/2013 y el 16/11/2013, en esta oportunidad el trabajo será revisado por el asesor y el participante debe registrar las observaciones pertinentes a fin de realizar las correcciones, pues el trabajo lo retiene el asesor hasta la entrega final con el objeto de verificar que las correcciones fueron realizadas.
  • 2da Entrega: Versión final del trabajo entre el 11/01/2014 y el 18/01/2014 improrrogable. De no respetar las dos entregas en los lapsos correspondientes queda a discreción del asesor considerar reprobado el trabajo.
 Nota: Me pueden enviar los trabajos (borrador y versión final) en formato Word 2003 o preferiblemente en Libre Office a mi correo: jlaurentum@gmail.com. Por favor no enviar en formato Word 2007 o posterior (extensión de archivo .docx). Ni siquiera abriré el archivo si se encuentra en este formato.

Si te gustó o te pareció útil este contenido, compártelo en las redes sociales y dale tu voto positivo en el botón "me gusta" de G+, para que otros puedan encontrar el contenido también.

lunes, 9 de septiembre de 2013

Modelado con Parabolas y Catenarias

Si tomamos una cadena o una cuerda por sus dos extremos, sin tensarla, y la sometemos a un campo gravitatorio uniforme podremos ver que se deforma describiendo una curva.  Esta curva es semejante a una parábola convexa y de hecho, el gran Galileo Galilei pensaba que la forma descrita por una cadena suspendida como se describe arriba era una parábola.  Poco menos de medio siglo después,  Johann Bernoulli, Christiaan Huygens y Gottfried Leibniz dedujeron la ecuación de esta forma, a la cual llamaron "catenaria", palabra que proviene del latín catena, que significa cadena.  La ecuación de la catenaria contiene un parámetro que permite obtener "curvas colgantes" más o menos estiradas entre los dos puntos extremos desde donde se cuelga la cadena:

\[
y=a\cdot\frac{e^{\tfrac{x}{a}}+e^{-\tfrac{x}{a}}}{2}
\]

Es fácil entender porqué Galileo se equivocó.  Después de todo, las catenarias y las parábolas se parecen mucho.  La deducción de la ecuación de la catenaria proviene de considerar tres fuerzas en equilibrio que actúan sobre cada punto de la cadena suspendida: las tensiones laterales en virtud de las cuales la cadena se mantiene unida y la fuerza gravitatoria hacia abajo.

En lo que sigue intento hacer un poco de "matemática experimental" trabajando con fotos con curvas catenarias para ajustarlas a curvas cuadráticas.  Por ejemplo, el parapente en vuelo parece describir una parábola:






Sin embargo, si seleccionamos algunos puntos de la curva para luego ajustarlos a una función cuadrática, obtenemos la siguiente curva parabólica:


La curvatura del parapente en realidad describe una catenaria. Obsérvese que la parábola ajustada es un poco más "puntiaguda" en el centro, mientras que la curva catenaria del parapente es algo más aplanada en esta región.  Esto es una diferencia característica entre las catenarias y las parábolas.  Seguimos experimentando con otra curva, esta vez la curva que describen los cables de suspensión de un puente colgante, en este caso el Puente de Angostura sobre el río Orinoco:


Esta vez, el ajuste a una parábola resultó ser casi perfecto, observándose que la parábola ajustada no es más puntiaguda hacia la parte central del puente.  Esto parece algo paradójico porque las catenarias se deducen de las fuerzas/tensiones que actúan en cada punto de un cable suspendido, como el del puente.  Sin embargo, los cables suspendidos de los puentes colgantes soportan una vía casi horizontal y en este caso el peso del cable es prácticamente despreciable en comparación con el peso del puente soportado.  En este caso, los cables de soporte no están suspendidos libremente.


Les dejo a continuación el script en R para realizar el ajuste de la curva en una fotografía a una función cuadrática.  Primeramente, se hace uso de una librería llamada png (que hay que instalar mediante el comando install.packages) para colocar la foto como imagen de fondo.  Mediante la función locator, obtenemos un data frame con las coordenadas x/y de los n puntos que seleccionamos sobre la imagen (tratando de que estos puntos caigan exactamente sobre la curva).  Por último, se ajusta el modelo cuadrático y~1+x+x^2 a estos puntos mediante una regresión lineal y se gráfica la curva parabólica obtenida con estos coeficientes.

#Ajuste de los cables de suspensión del Puente de Angostura
#sobre el Río Orinoco a una parabola
#Autor: Prof. José Romero
#Fecha: 09/09/13
  library(png)
  ima <- readPNG("angostura.png")
  plot.new()
  plot.window(c(-211,211),c(-156,156))
  lim <- par()
  rasterImage(ima, lim\(\$\)usr[1], lim\(\$\)usr[3],
  lim\(\$\)usr[2], lim\(\$\)usr[4])
  axis(1)
  axis(2)
  grid()
#selecciona 9 puntos sobre el cable suspendido del puente
  datapoints <- locator(n=9,type="p")
  points(datapoints,col="red")
#ajusta a una función cuadrática
  cuadraticmodel <- lm(y~1+x+I(x^2),data=datapoints)   coefs <- as.numeric(coef(cuadraticmodel))
  a2 <- coefs[3]
  a1 <- coefs[2]
  a0 <- coefs[1]
  parabola <- function(x) return(a2*x^2 + a1*x + a0)
  curve(parabola,from=-200,to=200,col="red",add=TRUE)


Referencias



Si te gustó o te pareció útil este contenido, compártelo en las redes sociales y dale tu voto positivo en el botón "me gusta" de G+, para que otros puedan encontrar el contenido también.

sábado, 13 de julio de 2013

Anuncio de charla sobre Python


Se anuncia una charla titulada

"Hazlo tu mism@ en Python"

Sede de la UNA - Sábado 27/07/2013 - 10:30am

Para mayores detalles abra el enlace en el título.


Si te gustó o te pareció útil este contenido, compártelo en las redes sociales y dale tu voto positivo en el botón "me gusta" de G+, para que otros puedan encontrar el contenido también.

miércoles, 1 de mayo de 2013

Cómo evitarse calculos tediosos en un exámen sobre regresión lineal

Unos cálculos tediosos

El objetivo 5 de la asignatura de Estadística Aplicada de la UNA (código 746) consiste en resolver problemas de regresión lineal simple. Los cálculos en sí no son muy complejos, pero sí muy tediosos cuando no se dispone de una calculadora con capacidades de regresión lineal. Algunas calculadoras científicas como la CASIO fx-85ES poseen estas funciones. Este por cierto es el modelo de mi fiel calculadora, la cual ha batallado duramente conmigo desde mis días de estudiante en la UNA (en la foto de abajo les presento a mi fiel amiga). Este modelo de calculadora es parte de una serie de modelos de la CASIO que tienen la característica de "Natural Display". Esto significa que la pantalla es un poquito más alta que la de los modelos normales porque se visualizan las expresiones matemáticas de un modo más natural o más parecido a como uno escribiría expresiones matemáticas en papel
Este tutorial se enfoca en la resolución de problemas de regresión lineal simple en calculadoras CASIO con natural display. Creo que lo mismo se puede hacer en calculadoras científicas de otras series que poseen funcionalidades de regresión lineal, pero debe consultar el manual de usuario de su calculadora o esperar a que me inspire en hacer otra entrada del blog dedicada a estas calculadoras (sin natural display). En todo caso, si no tiene una calculadora de estas (con regresión lineal), considere pedir una prestada para el examen. ¿Listo? Aquí vamos...

El menú principal de STAT en la calculadora CASIO fx-85ES

Para acceder a este menú, es preciso presionar las teclas [SHIFT] + 1⃣. A continuación se desglosa el contenido de este menú y los sub-menúes que lo constituyen:
  1. Type
    Para indicar el tipo de análisis estadístico a realizar entre las siguientes posibilidades. Las opciones más comúnmente utilizadas son la 1 (estadísticas de una variable) y la 2 (regresión lineal simple sin transformación de variables), resaltadas en rojo. Las opciones 3 a 8 se corresponden a regresión lineal con transformación de variables.
    1. 1-VAR
    2. A+BX
    3. _+cX²
    4. ln X
    5. e^X
    6. A.B^X
    7. A.X^B
    8. 1/X

  2. Data
    Esta opción permite acceder a la ventana de edición de datos, en la cual se tienen dos columnas para las variables X e Y respectivamente. Un cursor, que se puede mover mediante las teclas de flechas (ubicadas en una sola gran tecla circular en la parte superior de la calculadora), indica la celda a editar. Al principio, debe insertar los valores en las celdas presionando la tecla igual  =⃣  tras ingresar el número.
     │   X    │   Y    │
    1│     5.1│     7.2│
    2│     6.5│     8.3│
    3│     7.8│    11.7│
    4│     8.2│    16.1│

  3. Edit
    Presumo que mediante esta opción se puede insertar o borrar celdas en la tabla de datos, pero nunca la he usado.
  4. Sum
    Opciones para las siguientes sumas:
    1. ∑x²
    2. ∑x
    3. ∑y²
    4. ∑y
    5. ∑xy
    6. ∑x³
    7. ∑x²y
    8. ∑x⁴

  5. Var
    Medias muestrales y desviaciones estándar para las variables X e Y.
    1. n     Número de renglones de los datos.
    2. x̄     Media muestral de X
    3. xσn   Desv. estándar de X (con numerador n)
    4. xσn-1 Desv. estándar de X (con numerador n-1)
    5. ȳ     Media muestral de Y
    6. yσn   Desv. estándar de Y (con numerador n)
    7. yσn-1 Desv. estándar de Y (con numerador n-1)

  6. MinMax
    Permite obtener los valores máximos y mínimos para x e Y, según la data tabulada. No se utiliza en los ejercicios de regresión lineal simple.

  7. Reg
    Este sub-menu da acceso a algunos parámetros importantes en la regresión lineal:
    1. Estimación del coeficiente A en el modelo Y=A+BX.
    2. Estimación del coeficiente B en el modelo Y=A+BX.
    3. Estimación del coeficiente de correlación múltiple.
    4. x̂ Predicción para X según un valor de Y dado.
    5. ŷ Predicción para Y según un valor de X dado.
    Para obtener el coeficiente de determinación se debe elevar esta cantidad al cuadrado.

Ejemplo de regresión lineal simple

Como ejemplo, ingresamos los siguientes cuatro renglones en la tabla de datos. Primero debemos indicar que queremos trabajar en modo estadístico con regresión simple. Para ello, tecleamos [MODE] y seleccionamos la regresión lineal simple en la opción 2 (A+BX). Seguidamente aparece la tabla de entrada de datos, en la cual ingresamos la data indicada abajo. Recuerde que tras ingresar cada valor numérico presiona la tecla =⃣. El cursor se desplazará una celda hacia abajo. Puede mover el cursor con las teclas de flecha (tecla grande redonda en la parte superior central de la calculadora).
 │   X    │   Y    │
1│  4582.9│ 3669.88│
2│  5539.8│ 3473.95│
3│  2950.4│  2295.1│
4│  2243.1│ 4675,56│
5│  7747.1│ 6125.96│
6│  3140.6│ 5031.66│
7│  2086.2│ 3367.45│
8│  8846.2│ 6519.45│
La data anterior se corresponde a el problema del objetivo 5 de la parcial del 2010-2 (Nivel Central). En este problema, se estudiaba el volumen de ventas (variable Y) como función del gasto en publicidad (variable X). En el aparte (a) de la pregunta se pide estimar la recta de regresión lineal. Para ello hay que calcular los coeficientes A y B que definen la ecuación de la recta de regresión Y=A+BX. Esto se hace accediendo a las opciones respectivas en el sub-menú Reg del menú de estadística de la calculadora. A continuación se da la secuencia de teclas y el cálculo para cada coeficiente:
Para el cálculo de A: [SHIFT] + 1⃣ + 7⃣ + 1⃣ + = 2552.312142
Para el cálculo de B: [SHIFT] + 1⃣ + 7⃣ + 2⃣ + = 0.3969300352

La ecuación de la recta es por lo tanto Y=2552.3121 + 0.3969X (con 4 decimales de presición). Existe una pequeña discrepancia entre estos resultados y los que aparecen en el modelo de respuestas de la segunda parcial del 2010-2. Ello se debe a que la data se ha almacenado en la calculadora con sólo 1 decimal de precisión. No es un error importante.

Para el siguiente aparte, se requiere hacer inferencia sobre el coeficiente de regresión B. Concretamente, se requiere comprobar la siguiente hipótesis:

\[\begin{align*} H_0\quad &:\quad B=0\\ H_a\quad&:\quad B\neq 0 \end{align*}\]

Para este constraste, necesitamos calcular el estadístico T-Student para el coeficiente B dado en  la fórmula 140 del fórmulario UNA, el cual viene dado por:

\[T=\frac{\hat{\beta}-\beta_0}{S_{\hat{\beta}}}\]

\(\hat{\beta}\) ya lo hemos calculado- es el valor del coeficiente B calculado arriba, el cual es igual a 0,3969. \(\beta_0\) es el valor del coeficiente poblacional según la hipótesis nula, de modo que \(\beta_0=0\). Resta por calcular la desviación estándar muestral del coeficiente \(\hat{\beta}\), representada por \(S_{\hat{\beta}}\). Para ello es preciso utilizar las expresiones disponibles en el sub-menú Sum de las funciones estadísticas que son las sumas ∑x, ∑x², ∑y , ∑y²  y ∑xy. Las fórmulas aparecen en el formulario antes mencionado (fórmulas 125-141) y la secuencia de cálculos en la calculadora es la siguiente:

\(SC_Y=\sum{Y^2}-\frac{\left(\sum{Y}\right)^2}{n}=\) 14833131.2
\(SC_{XY}=\sum{XY}-\frac{\left(\sum{X}\right)\left(\sum{Y}\right)}{n}=\) 18071838.95
\(SC_X=\sum{X^2}-\frac{\left(\sum{X}\right)^2}{n} =\)45529028.66
\(SCE=SC_Y-\frac{(SC_{XY})^2}{SC_X} =\) 7659875.529
\(CME=\frac{SCE}{n-2} =\) 1276645.921
\(S_e=\sqrt{CME} =\) 1129.88757
\(S_{\beta_1}=\frac{S_e}{\sqrt{SC_X}} =\) 0.1674522697

Según esto, el estadístico de contraste T-Student resulta ser:

\[T=\frac{\hat{\beta}-\beta_0}{S_{\hat{\beta}}}=\frac{0,3969}{0,1674}=2,3709\]

Para un nivel de significancia de 5% (2,5% en cada cola), el nivel crítico T-Student de una distribución con \(n-2=6\) grados de libertad es 2,4469. Debido a que el estadístico de contraste obtenido por nosotros no es mayor  al nivel crítico, no se rechaza la hipótesis nula y se debe concluir que la variable X (gasto en publicidad) no incide lineal y significativamente sobre la variable Y (volumen de ventas).

Para el aparte c, debemos calcular el coeficiente de determinación e interpretarlo.  Este valor está disponible directamente en la calculadora (recordando que debemos elevar r al cuadrado):

[SHIFT] + 1⃣ + 7⃣ + 3⃣ + [] + = 0.4835968598

Según el resultado anterior, el 48% de la variabilidad de Y se debe a la variabilidad de X. No es un muy buen modelo el que hemos producido.  De hecho, según el contraste de hipótesis del aparte anterior, concluimos que la variable X no indice significativamente sobre Y.

Si te gustó o te pareció útil este contenido, compártelo en las redes sociales y dale tu voto positivo en el botón "me gusta" de G+, para que otros puedan encontrar el contenido también.