jueves, 18 de octubre de 2012

¿Qué es un valor esperado y cómo se calcula?

En este post abordaré el tema del valor esperado, tal como se evalúa en el objetivo 5 de Estadística General (745). Para poner las cosas en perspectiva, presentamos un enunciado del objetivo 5 que apareció en la segunda parcial del 2009-2:
Una compañía de servicios para oficinas ha recolectado la siguiente información:
Solicitudes de reparación Frecuencia absoluta de observación (días)
5 276
9 59
13 30
25 36
31 38
52 21
El gerente desea saber, el ingreso esperado de la compañía por día si continua el modelo observado en el pasado y todas las solicitudes de servicio se contestan (a una tarifa de 200 Bs. por llamada).
Como es característico de las preguntas de este objetivo, al final se quiere que el estudiante calcule un valor esperado. A veces se pide además calcular la desviación estándar, para lo cual primero se debe calcular la varianza, la cual al fin del día, es un tipo de valor esperado también. Si no sabe o no entiende el concepto de valor esperado, es imposible que apruebe el objetivo 5 de esta asignatura, pues el objetivo 5 trata específicamente de lo siguiente:
Calcular el valor esperado y la varianza de una variable aleatoria dada su distribución de probabilidades, y aplicarlo a la toma de decisiones.

Vamos a comenzar entonces por aclarar de una vez qué es un valor esperado. Imagínese que graficamos la información tabulada en el enunciado de modo que los valores en la columna debajo de las "Solicitudes de reparación" se colocan como puntos sobre el eje X y para cada uno de esos puntos graficamos una barra cuya altura se corresponde al respectivo valor en la columna de "Frecuencia absoluta de observación (días). Tendríamos lo que se denomina una gráfica de barras, que es parecido a un histograma de frecuencias (ver Fig. 1).

Fig. 1 - Un diagrama de barras

diagrama de barras
Imagínese ahora que sobre una barra rígida horizontal como la barra negra de la Fig. 1, las barras verticales sobre cada punto x tienen un peso proporcional a su altura. ¿Cual sería el "centro de gravedad" de la barra horizontal? En otras palabras, ¿donde tendríamos que colocar el punto de apoyo para que la barra quede equilibrada (Ver Fig. 2)? Este "punto de equilibrio" se corresponde al valor esperado de una variable, el cual es el equivalente probabilístico de lo que en física se conoce como "momento de primer orden". Por ser el valor esperado el análogo probabilístico de "centro de gravedad", decimos que el valor esperado es una medida de tendencia central.

Fig. 2 - El "punto de equilibrio" de un diagrama de barras
valor esperado (animación)
Por ser el "momento de primer orden" y el "valor esperado" conceptos tan similares, sus fórmulas son muy parecidas. Para calcular matemáticamente un valor esperado (de una variable discreta), usamos la siguiente fórmula:
\[E(X)=\sum_{i=1}^n x_i\cdot p(x_i)\]

que aparece en el Formulario de Probabilidades y Estadística de la UNA como la fórmula N° 27. Esta fórmula plantea que para calcular el valor esperado de una variable, debemos sumar los productos de los posibles valores de la variable por sus respectivas probabilidades. Esto implica que para calcular el valor esperado de una variable, necesitamos conocer primero cual es su distribución de probabilidad. Este punto es muy importante y en todas las preguntas de este objetivo se da, de una forma u otra, explícita o implícitamente, la distribución de probabilidad de la variable aleatoria cuyo valor esperado debemos calcular.

Para este problema, tenemos que calcular la utilidad esperada, la cual es función de la cantidad de solicitudes de reparación recibidas diariamente (X). Si por cada llamada (solicitud) recibida tenemos un ingreso de 200 Bs., la utilidad (U) sería:

\[U=200\cdot X\]

Por propiedades conocidas del valor esperado, el valor esperado de la utilidad sería igual a 200 por el valor esperado de la variable X, por lo cual el problema se reduce a calcular el valor esperado del número de solicitudes de servicio recibidas diariamente. Para esto necesitamos conocer su distribución de probabilidad, la cual no se está dando directamente...

Observando la tabla de frecuencias dadas en el enunciado, observamos que a para cada valor de la variable X, tenemos una frecuencia correspondiente en "días"- esto significa que se ha registrado diariamente la cantidad de solicitudes de reparación recibidas y, por ejemplo, en 276 días se recibieron 5 solicitudes de servicio (para cada día). ¿Cuanto tiempo duró el periodo de observación? Para ello debemos sumar todos los valores de la columna "Frecuencias de Observación", obteniendo así una cifra total de 460 días (verifique el cálculo).

Es preciso hacer una tabla en la cual colocaremos los posibles valores de la variable X junto a las respectivas probabilidades, que se obtienen dividiendo cada cifra en la columna de frecuencias observadas entre 460.Para aplicar la fórmula del valor esperado, colocamos en una tercera columna todos los productos de los valores de X multiplicados por sus respectivas probabilidades, aunque Usted puede obviar este paso si realiza los cálculos directamente en su calculadora:

x
p(x)
x⋅p(x)
5 276/460 3
9 59/460 1,1543
13 30/460 0,8478
25 36/460 1,9565
31 38/460 2,5609
52 21/460 2,3739
Totales: E(X)=11,8935

El valor esperado de la variable X es 11,8935- esto implica que se reciben, en promedio, 11,8935 solicitudes por día (observe que 11,8935 se corresponde al punto de la barra negra bajo el cual se coloca el punto de apoyo en la Fig. 2). Quizás se esté preguntando si tiene sentido que el valor esperado contenga cifras decimales. Aclaremos de una vez que la interpretación correcta del valor esperado es que este es un promedio y no la cantidad de solicitudes que nosotros esperamos recibir en un día cualquiera. Claramente, no podemos recibir 11,8935 solicitudes en un día (ni siquiera 11, pues 11 no es un valor posible para la variable X). Lo que implica este resultado es que si obervásemos por varios días la cantidad de solicitudes de reparación, el promedio sería un valor muy cercano a 11,8935. En este contexto, vale aclarar que las probabilidades p(x) fueron estimadas a partir de una muestra de 460 días, lo cual estríctamente hablando, es un problema de inferencia estadística (inferir las probabilidades teóricas u otras caracteristicas poblacionales en base a una muestra). Sin embargo, si en el futuro la variable X se comporta como en el pasado y se mantienen igual todas las condiciones que inciden sobre su comportamiento, sería bastante razonable esta estimación. En definitiva, tendriamos una utilidad esperada de 200⋅11,8935=2378,7 Bs.

A veces, para las preguntas de este objetivo, se pide calcular también la desviación estandar, para lo cual habría que calcular primero la varianza, pues la desviación estándar se obtiene tomando la raíz cuadrada de la varianza. La varianza es un valor esperado tambíen- es el valor esperado de las desviaciones cuadráticas de una variable respecto a su media (μ o también E(X)):

\[V(X)=E\left[(X-\mu)^2\right]\]

Podríamos colocar en una cuarta columna los términos \((X-\mu)^2\) que figuran en la fórmula de la varianza, pero optaremos por utilizar una propiedad según la cual la varianza se puede escribir como:

\[V(X)=E(X^2)- \mu^2\]


Los términos \(x_i^2 \cdot p(x_i)\) son más fáciles de calcular y el valor de \(\mu=E(X)\) ya lo hemos calculado. Por lo tanto, nuestra tabla quedaría así:

\(x\) \(p(x)\) \(x\cdot p(x)\) \(x^2 \cdot p(x)\)
5 276/460 3 15
9 59/460 1,1543 10,3891
13 30/460 0,8478 11,0217
25 36/460 1,9565 48,913
31 38/460 2,0659 79,387
52 21/460 2,3739 123,4434
Totales: \(E(X)=11,8935\)\(E(X^2)=288,1542\)

Aplicando la formula de la varianza dada arriba, tendriamos:

\[V(X)=E(X^2)-\mu^2=288,1542-11,8935^2=146,6988\]

Tomando la raiz cuadrada de este resultado obtendríamos la desviación estándar.

Si te gustó o te pareció útil este contenido, compártelo en las redes sociales y dale tu voto positivo en el botón "me gusta" de G+, para que otros puedan encontrar el contenido también.

jueves, 11 de octubre de 2012

Los trabajos prácticos de estadística y el lenguaje R

Estoy elaborando actualmente una página con información sobre el lenguaje R orientada a la elaboración de los trabajos prácticos de las materias de estadística que asesoro. En esta página se suministra información sobre cómo instalar y comenzar a usar este software. He creado una librería complementaria en R que contiene la data de estos trabajos para varios semestres y funciones que facilitan la elaboración de los trabajos prácticos. Se llama estUNA.

Quisiera aclarar que aunque no es obligatorio el uso de R, facilita bastante las cosas. Por otro lado, mi criterio de evaluación para estos trabajos es que realicen todas las actividades señaladas en el enunciado correctamente, utilizando algún tipo de software de cálculo para ello.

Si te gustó o te pareció útil este contenido, compártelo en las redes sociales y dale tu voto positivo en el botón "me gusta" de G+, para que otros puedan encontrar el contenido también.

viernes, 20 de julio de 2012

Publicación de los trabajos de estadística

Hola a todos:

Finalmente se han publicado los enunciados de los trabajos de estadística para las asignaturas 745, 746 y 738/748.  Aquí está el enlace para su descarga.   Deben descargar los archivos de la data y las normas para la elaboración de estos trabajos.

La evaluación del trabajo comprende dos entregas obligatorias:
1era Entrega: primera versión del informe final entre el 24/09/2012 y el 13/10/2012,
en esta oportunidad el trabajo será revisado por el asesor y el participante debe registrar las observaciones pertinentes a fin de realizar las correcciones, pues el trabajo lo retiene el asesor hasta la entrega final con el objeto de verificar que las correcciones fueron realizadas.
2da Entrega: Versión final del trabajo entre el 12/11/2012 y el 17/11/2012
improrrogable. De no respetar las dos entregas en los lapsos correspondientes queda a discreción del asesor considerar reprobado el trabajo.

Información tomada del grupo Multiply admycontuna.

Si te gustó o te pareció útil este contenido, compártelo en las redes sociales y dale tu voto positivo en el botón "me gusta" de G+, para que otros puedan encontrar el contenido también.

domingo, 17 de junio de 2012

Consulta 737 / 747 - Objetivo 1

Por correo electrónico, una estudiante me preguntó lo siguiente:

Profesor encontré un ejercicio que dice lo siguiente:
Se disponen de 5 bolas rojas y 5 bolas negras en 8 cajas numeradas. ¿Cuantas maneras hay de hacerlo?

Mi pregunta es debe desarrollar tomando en cuenta que todas las cajas deben estar llenas? ¿O se puede trabajar por casos?

Mi respuesta:

Vamos a aclarar el problema un poco. Se tienen 5 pelotas negras y 5 pelotas rojas que se van a colocar en 8 cajas numeradas y hay que calcular de cuantas formas de pueden colocar las 10 pelotas (de 2 colores distintos) en las 8 cajas numeradas. Las pelotas negras/rojas son indistintas entre sí mientras que las cajas si son distintas entre sí porque están numeradas. La otra suposición importante es que aparentemente no hay restricciones con respecto a la capacidad de cada caja- por ejemplo, ¡una sola caja pudiese contener las 10 pelotas!

Creo que está claro que primero debemos de calcular de cuantas maneras se puede ubicar 5 pelotas de un color e indistintas entre sí en 8 cajas. Si esta cantidad es x, el número total de formas de distribuir las 10 pelotas (5 pelotas rojas y 5 pelotas negras) en 8 cajas numeradas sería x^2, según el principio de multiplicación.

Primeramente, podríamos distribuir las 5 pelotas en una sola caja y dejar las demás cajas vacías. ¿De cuantas maneras podríamos hacer esto? Pensemos ... Como tenemos 8 opciones, hay 8 formas de colocar un grupo de 5 pelotas en 8 cajas.

Seguidamente, podríamos tener un grupo de 4 pelotas y otro grupo de 1 pelota. Primero debemos de ubicar las 4 pelotas en una caja (8 opciones). Luego tenemos 7 cajas vacías para ubicar la quinta pelota (7 opciones). Por lo tanto hay 8x7=56 maneras de ubicar dos grupos de pelotas (de 4 y 1 pelota) en 8 cajas.


Pero también podríamos tener un grupo de 3 pelotas y otro grupo de 2 pelotas, con lo cual tendríamos también 8x7=56 maneras de distribuir esos dos grupos en 8 cajas numeradas. En total, hay 56+56=112 maneras de distribuir dos grupos de pelotas (de distintos tamaños) en 8 cajas numeradas. Nótese que en ambos casos, el número total de pelotas es 5 hay dos formas de separar esas 5 pelotas en 2 grupos de modo que las cantidades de pelotas en cada grupo sumen a 5.

¿Y si tuviésemos 3 grupos de pelotas? Hay dos formas de dividir 5 pelotas en 3 grupos: 2+2+1=5, 3+1+1=5. En cada caso, tenemos que ubicar el primer grupo de pelotas en una de las 8 cajas, luego el segundo grupo de pelotas en una de las 7 cajas remanentes y finalmente el tercer grupo de pelotas se puede ubicar en alguna de las 6 cajas que quedan. Por lo tanto, hay 3x8x7x6=1008 formas de distribuir 3 grupos de pelotas en 8 cajas numeradas. ¡Un momento! ¿Acaso poner un grupo de 2 pelotas en la caja N° 5 y otro grupo de 2 pelotas en la caja N° 4 no es lo mismo que poner un grupo de 2 pelotas en la caja N° 4 y el otro grupo de 2 pelotas en la caja N° 5? Tanto en el caso 2+2+1 como en el caso 3+1+1, hay dos grupos de igual tamaño. Por lo tanto, hay que dividir 1008 entre 2 (por que hay 2!=2 maneras de permutar 2 objetos) y en consecuencia, hay 504 formas de ubicar 3 grupos de pelotas en cajas numeradas.

En el caso de dividir las 5 pelotas en 4 grupos, tendríamos 1 sola manera de hacerlo: 2+1+1+1=5. En este caso, ubicamos el primer grupo de 2 pelotas en cualquiera de las 8 cajas, el segundo grupo de una pelota en una de las 7 cajas, etc. En total, son 8x7x6x5=1680 las formas de ubicar estos 4 grupos en 8 cajas pero debemos tomar en cuenta que hay 3 grupos de igual tamaño que se pueden permutar de 3!=6 maneras y por lo tanto, hay que dividir 1680 entre 6: 280.

Por último, también hay 1 sola manera de dividir las 5 pelotas en 5 grupos: 1+1+1+1+1=5.  Hay 8!/(3!x5!)=56 formas de ubicar 5 pelotas en 8 cajas de modo que a lo sumo haya una sola pelota en cada caja.

En total, hay 8+112+504+280+56=960 maneras de distribuir 5 pelotas de un color en 8 cajas numeradas.  Por lo tanto, x=960 y la respuesta definitiva al problema es x^2=921600.

Si te gustó o te pareció útil este contenido, compártelo en las redes sociales y dale tu voto positivo en el botón "me gusta" de G+, para que otros puedan encontrar el contenido también.

domingo, 3 de junio de 2012

Presentación de la página

Bienvenidos a la nueva página de asesoría unamatematicaseltigre.

Estoy estrenando la nueva página asesoría, a la cual se ha mudado toda la información pertinente a las asignaturas de la UNA que asesoro.  La página anterior - https://sites.google.com/site/unamatematicaseltigre - será eliminada. Por medio de está nueva página se manejará todo lo referente a la atención a los estudiantes:

Para cada materia se ha creado una página a la cual puede acceder seleccionando la pestaña respectiva en la barra superior:


En cada una de las páginas de asesoría de materias, se tiene información sobre los planes de curso y planes de evaluación, las fechas de los exámenes para el semestre en curso, los modelos de exámenes anteriores y una bibliografía con enlaces para descarga de textos. (Actualización 2016: Para algunas asignaturas, ya existe un sistema de autoevaluación en línea. Más información en esta entrada, donde se explica de qué se trata). La consulta de objetivos logrados y retroalimentación de la evaluación sumativa se realiza a través de la página de "Evaluación", tal como se explica en esta entrada. A través de entradas periódicas en este blog, se suministrara información sobre los talleres y los trabajos prácticos de las materias que asesoro. También se recomienda al estudiante revisar las páginas de "Orientación" y "Apoyo" también. En estas se han incluido herramientas que considero útiles para el desenvolvimiento del estudiante de matemáticas en un sistema de educación a distancia como el nuestro.
Podrán comunicarse conmigo mediante el buzón de mensajes a la derecha de la página. En este buzón pueden dejarme mensajes con su nombre y su correo, a los cuales yo también podré responder en el mismo. Si desean enviarme un correo electrónico, comunicarse conmigo por teléfono o asistir personalmente a la unidad de apoyo de El Tigre, la información de contacto está en la página "Contacto" en la barra superior. Allí encontrarán también mis horarios de atención a los estudiantes.



Una característica muy importante de este blog son las entradas o artículos que publicaré sobre diversos temas, a veces relacionados con contenidos específicos de las materias que asesoro, los cuales generalmente presentan dificultades o dudas para el estudiante. A veces los artículos serán de índole extracurricular para ampliar los conocimientos del estudiante sobre otras áreas de actualidad científica, cultural o académica indirectamente relacionadas  con sus estudios en la Universidad Nacional Abierta.

Si te gustó o te pareció útil este contenido, compártelo en las redes sociales y dale tu voto positivo en el botón "me gusta" de G+, para que otros puedan encontrar el contenido también.