lunes, 10 de noviembre de 2014

Trabajos de Estadística para el 2014-2

A continuación los enlaces para el trabajo práctico de las materias de estadística (738/748, 745 y 746) correspondientes a este semestre 2014-2:

  • 745 (Estadística General)
  • 746 (Estadística Aplicada)
  • 738/748 (Inferencia Estadística)

Hasta la fecha de hoy (10/11/14), no ha sido publicado el enunciado del trabajo de la 738/748. Publicaré el enlace editando esta entrada tan pronto esté disponible y próximamente publicaré los archivos de la data para trabajar en R.

Es de notar que los trabajos de la 745 y la 746 son evaluaciones de tipo formativo tal como el semestre pasado. Es decir, no se entregan para aprobar el objetivo del trabajo práctico, pero se recomienda la realización de las actividades allí planteadas para entender las preguntas que sobre esos objetivos se colocarán en los exámenes. En el caso de la 738/748, tendremos que esperar a que sean publicados los trabajos para saber si se mantendrá el plan de evaluación tal como el semestre pasado.

Indicaciones para usar estUNA (la librería R para trabajos de estadística desarrollada por mí)

  • Puede dirigirse a la página http://unamatematicaseltigre.blogspot.com/p/lenguaje-r.html en mi blog, donde se dan enlaces par mayor información sobre cómo instalar R y la librería estUNA, tutoriales básicos sobre el uso de R para la elaboración de estos trabajos, etc.
  • Existen muchas entradas en este blog con información sobre cómo elaborar los trabajos prácticos de estadística usando R. Inclusive, hay algunos video-tutoriales.
  • La data del trabajo práctico para este semestre es igual a la del semestre 2010-2, por lo menos para los enunciados de los trabajos que han sido publicados (el de la 745 y la 746). Por lo tanto, el data-frame d20102 contiene la data para este semestre. 

miércoles, 22 de octubre de 2014

Talleres para el 2014-2

A continuación las fechas y los contenidos de los talleres:


Matemática 1
Matemática 2
Matemática 3
Talleres
(175/176/177)
(178/179)
(733)
1er Taller
01/11/14
(Técnicas de estudio y obj. 1 y 2)
08/11/14
obj. 1-5
2ndo Taller
15/11/14
obj. 3-6
3er Taller

Nota: los talleres de Mat. 1-3 serán dictados por la preparadora Florangel a las 8am en la E.B Trujillo. Tan pronto me de las fechas de los otros talleres edito esta entrada.

Int. Probab.
Inf. Estadística
Est. General
Est. Aplicada
Talleres
(737 / 747)
(738 / 748)
(745)
(746)
1er Taller
25/10/14
obj. 1-3
01/11/14
obj. 1-4
08/11/14
obj. 1-4
2ndo Taller
22/11/14
obj. 4-5
15/11/14
obj. 4-7
29/11/14
obj. 5-8
13/12/14
obj. 5-8
3er Taller
17/01/15
obj. 6-8
10/01/15
obj. 8-10
31/01/15
obj. 1-8
07/02/15
obj. 1-8
4to Taller
21/02/15
obj. 1-8
14/02/15
obj. 1-10

Nota: los talleres de probabilidades y estadísticas los estaré dictando yo (Prof. José Romero) a las 9:30am en la E.B Trujillo. Traigan sus formularios, calculadoras y planes de evaluación.

viernes, 3 de octubre de 2014

Fraude Academico

Al corregir los exámenes integrales de la 738/748 de este semestre 2014-1, he observado un hecho muy irregular y en extremo grave que quisiera hacer público en este blog. Dos estudiantes, a quienes en lo sucesivo me referiré como Estudiante A y Estudiante B, han cometido una falta tipificada como grave en el Articulo 8, literal c del Reglamento Disciplinario Estudiantil de la Universidad Nacional Abierta, el cual establece lo siguiente:

Articulo 8 – Serán faltas graves:

...

(c) las acciones fraudulentas que el estudiante realice de manera intencional y premeditada, individualmente o con la participación de otras personas, antes, durante, o después de las actividades de evaluación de los aprendizajes, dirigida a alterar los resultados de su propia evaluación o la de otros estudiantes.

En efecto, la falta en cuestión es que ambos estudiantes se han copiado en esta evaluación, como queda en evidencia en las imágenes de los cuadros comparativos, objetivo por objetivo, de los items que respondieron, algunos de los cuales se presentan a continuación. No he considerado relevante ni pertinente nombrar en este blog a los estudiantes “copiones”- ellos sabrán quienes son al ver la escritura de su puño y letra. Tampoco creo necesario incluir imágenes de todas sus respuestas- aburren en la forma tan monótona en que ambos exámenes se parecen “como dos gotas de agua”. De todos modos se les levantará un acta a ambos estudiantes sustanciada debidamente con el cuerpo del delito.

El propósito de este escrito es concientizar a la comunidad estudiantil sobre la gravedad de cometer este tipo de fraudes académicos. He observado con mucha preocupación un alto grado de similitud entre algunas pruebas en ocasiones anteriores. Un alto grado de similitud que raya peligrosamente en las acciones fraudulentas mencionadas supra, aunque a decir verdad, nunca he visto pruebas tan evidentemente idénticas como las de los Estudiantes A y B. Si usted esta entre los estudiantes probos, quienes son mayoría en nuestra Universidad, esta entrada no es con Usted. Puede pulsar “Ir al siguiente blog”. Si no, haría bien en continuar leyendo...

Supongo que la obtención de un titulo universitario es la razón principal por la que los estudiantes se embarcan en el estudio de una carrera universitaria (verdad de perogrullo). El problema cuando se incurre en este tipo de acciones fraudulentas (y me refiero a cualquier acción que comprometa la validez de la evaluación) es que al hacerse práctica común entre el estudiantado (y ojalá que no), esto erosionaría el valor del Titulo Universitario otorgado por la Universidad Nacional Abierta. Siendo este servidor egresado de esta misma Casa de Estudios, habiendo trabajado duro para obtener mi titulo de Licenciado en Matemáticas, mención Probabilidad y Estadísticas y luego habiendo pasado exitosamente por un proceso de selección muy riguroso conocido como “Concurso de Oposición” para convertirme en docente ordinario de mi querida Alma Mater, nunca permitiré tal erosión del valor de mi Título. En resumen, los estudiantes que inconscientemente incurren en este tipo de acciones (y escribo “inconsciente” porque si tuvieran conciencia o aquello que llaman principios, no lo harían) incurren en el clásico “escupir para arriba”.

Huelga recordarle a aquellos pocos estudiantes sin principios y sinvergüenzas que aún cuando no les importe escupir para arriba, la saliva, fiel a la Ley de la Gravedad, de todos modos les caerá en la cara en forma de sanciones y quizás hasta expulsión de la universidad, lo cual retardaría o daría al traste definitivamente con su sueño de obtener el anhelado titulo universitario de la U.N.A.   

Los Estudiantes A y B están entre un minúsculo grupo de estudiantes que recientemente han levantado acusaciones sin fundamento en contra de mi persona como docente de la U.N.A.  En unos escritos que presentaron ante las autoridades universitarias, se me acusa de vender notas aprobatorias para las materias que asesoro y que dichas ventas se concretarían a través de la asistencia obligatoria a asesorías presenciales que supuestamente exijo para pasar las materias.  ¿Acaso dichos estudiantes nunca se enteraron en el Curso Introductorio que las asesorías presenciales (y de cualquier otro tipo como por ejemplo las asesorías en línea de las cuales sobran ejemplos en este mismo blog) son un recurso importante para lograr el éxito en los estudios a distancia? Estas asesorías se dan de forma gratuita como parte del desempeño de nuestras funciones docentes. ¿Leyeron bien? Son gratuitas, a diferencia de cursos pagos o tutores individuales que tendrían que pagar. Tampoco son obligatorias, ¡pero cómo ayudan!   Regularmente, miles de estudiantes de la U.N.A. a lo largo y ancho del país acuden a asesorías con sus asesores para aclarar dudas sobre el contenido estudiado o para discutir sobre el logro de objetivos en los exámenes.  Ciertamente, una buena y constante comunicación docente-estudiante es la clave para el éxito en el aprendizaje y este es el mejor consejo que podría darle a los aspirantes del Curso Introductorio. Sin embargo, por alguna inexplicable razón, estos estudiantes prefirieron nunca asistir a asesorías para aclarar dudas y en vez de ello, se dedicaron a “escupir para arriba”. Dicho sea de paso, ellos tienen otros casos similares de pruebas copiadas que han levantado otros asesores junto a los cuales este caso ahora pasará a engrosar su creciente expediente.

A continuación reproduzco algunas de las imágenes de los exámenes referidos:




Estudiante A - Objetivo 1 Estudiante B - Objetivo 1

Se puede observar que en la tabla de distribución de frecuencias de la media, ambos estudiantes colocan frecuencias en fracciones con denominador de 5 (cuando debería ser 15) a partir del valor de X-barra de 19,5- es decir, ambos cometieron exactamente el mismo error. Si hubiesen ido a asesoría conmigo o asistido a alguno de mis talleres, sabrían que los valores en una distribución de frecuencias relativas deberían sumar a 1, la probabilidad total. Como casi todos mis estudiantes saben (a excepción de ellos dos porque nunca han asistido a asesorías o talleres), esto es un dato que repito ad nauseam para que los estudiantes eviten cometer este tipo de errores. Una mentira repetida mil veces (en este caso dos veces), no se convierte en verdad. Repitan conmigo – la probabilidad total de los eventos elementales de un espacio probabilizado es igual a uno...




Estudiante A - Objetivo 2 Estudiante B - Objetivo 2

Estos exámenes, en cuanto a demostrar que ustedes han logrado el dominio de los objetivos evaluados, tampoco “satisfacen las expectativas exigidas”.



Estudiante A - Objetivo 4 Estudiante B - Objetivo 4

Exactamente los mismos errores en ambas pruebas. ¿Es en serio? Lo que verdaderamente indigna de este tipo de pruebas copiadas es que al pensar que nosotros los profesores nunca nos enteraremos que se copiaron, pretenden tomarnos por idiotas, cuando los idiotas son otros...

Estudiante A - Objetivo 7 Estudiante B - Objetivo 7

Al Estudiante B le diría que las hipótesis nulas nunca se aceptan- se dice más bien que no se rechazan – otra cosa que he explicado hasta el cansancio en mis talleres y asesorías. Si alguien desea indagar más al respecto, le sugiero leer la obra de Karl Popper, específicamente el libro titulado “The Logic of Scientific Discovery”, en el cual hace una excelente exposición sobre la falseabilidad de las hipótesis como pilar fundamental del conocimiento científico. Aquí lo único que han demostrado es que sus exámenes “no difieren significativamente”- es más, son casi idénticos hasta en la letra. Los Estudiantes A y B también han logrado confirmar la creencia de Einstein, quien dudaba de la infinitud del Universo pero si estaba seguro de la infinitud de la estupidez humana. Un aplauso para ellos.


Estudiante A - Objetivo 9 Estudiante B - Objetivo 9

Seguramente los Estudiantes A y B aducirán que trabajaron de manera independiente en sus exámenes. Esto sería como poner dos monos transcribir en sendas máquinas de escribir, algún soneto de Shakespeare y que produzcan, palabra por palabra, punto por punto, el mismo soneto.  Ambos eventos tendrían la misma probabilidad - casi nula – lo cual es en extremo significativo. Shall I compare thee to a summer's day?

Bibliografía


Börger, L. (sf).  “You shall not pass!”: quantifying barrier permeability and proximity avoidance by animals. Disponible en: https://www.academia.edu/8581797/You_shall_not_pass_quantifying_barrier_permeability_and_proximity_avoidance_by_animals

Calaprice, A. (2010). The Ultimate Quotable Einstein. Princeton University Press.

Popper, K. (2005). The Logic of Scientific Discovery.  Taylor & Francis e-Library.

Universidad Nacional Abierta (1999). Reglamento Disciplinario Estudiantil de la Universidad Nacional Abierta. Caracas.

Walter J. Black, Inc. (1937). The Complete Works of William Shakespeare.






martes, 13 de mayo de 2014

Técnicas de visualización de datos a ser utilizadas este semestre

En este lapso académico se les pide a los estudiantes de Estadística General (745) realizar diagramas de tallo y hoja, ojivas de frecuencia y diagramas de caja como parte de las actividades prácticas del objetivo 1. En esta entrada, hablaré un poco sobre estas técnicas de visualización de datos y como se implementan en R / estUNA.

Diagramas de tallo y hoja


Los diagramas de tallo y hoja fueron ideados por John Tukey, un renombrado estadístico estadounidense conocido por otras tantas técnicas de visualización de datos como los diagramas de caja, que también se utilizarán en el trabajo práctico de la 745 para el semestre 2014-1.

Los diagramas de tallo y hoja se basan en agrupar datos cuantitativos según los dígitos de cada valor. La columna de la izquierda en el diagrama de tallo y hoja contendrá los dígitos comunes al grupo correspondiente a la derecha. La columna de la izquierda contiene lo que se denominan los tallos, que son el grupo de dígitos más significativos de la representación decimal de cada valor. La columna de la izquierda contiene los siguientes dígito (menos significativo) para las observaciones con el mismo grupo de dígitos significativos indicado en el tallo- estos son las hojas. Las observaciones se redondean al dígito cuyo lugar representa la hoja. Entre la columna de tallos y hojas hay un caracter de separación, usualmente una línea vertical como esta: |.

A modo de ejemplo, considérese el vector de observaciones x:

> x
 [1] 50.15886 21.76843 54.37469 50.81199 50.84726 23.26372 50.78665 50.83612
 [9] 58.16413 50.95605 50.90962 50.28626 73.72907 50.60134 51.67277 77.72239
[17] 50.40217 50.06982 37.21745 50.52507 50.63772 50.92666 49.98095 69.97754
[25] 50.09227 50.56210 62.32098 50.17898 50.56876 50.02068 50.45380 58.23187
[33] 50.55260 50.60741 58.30804 77.89047 50.03048 50.71370 32.79830 33.70865
[41] 50.25847 50.78177 50.15337 74.58174 50.53656 50.33758 39.51859 77.45064
[49] 50.03587 50.67190


Para construir el diagrama de tallos y hojas, debemos primero decidir cuales dígitos de cada observación serán los tallos y cuales serán las hojas. Tenemos cincuenta observaciones entre un rango de 20 y 80. Tomaremos los dígitos de las decenas como los tallos. Para las hojas, tomaremos los dígitos de las unidades, habiendo redondeado previamente cada valor en las unidades. Es preciso redondear y ordenar las observaciones:

> sort(round(x))
 [1] 22 23 33 34 37 40 50 50 50 50 50 50 50 50 50 50 50 50 50 50 51 51 51 51 51
[26] 51 51 51 51 51 51 51 51 51 51 51 51 51 52 54 58 58 58 62 70 74 75 77 78 78


En R, generamos los diagramas de tallo y hoja mediante la instrucción "stem". No tenemos que realizar la operación previa de redondeo y ordenamiento: esto lo realiza la misma instrucción stem. Sólo se incluye el vector con redondeos y ordenado para que el estudiante pueda entender cómo se generan este tipo de gráficas. Coteje los valores redondeados y ordenados arriba con el resultado de la instrucción stem:

> stem(x)

  The decimal point is 1 digit(s) to the right of the |

  2 | 23
  3 | 347
  4 | 0
  5 | 0000000000000011111111111111111124888
  6 | 2
  7 | 045788


Como podemos observar, hay dos valores en la muestra con decenas de 2: 22 y 23. Estas observaciones se indican en la primera fila del diagrama: 2 | 23. La siguiente fila se corresponden a las observaciones cuyo dígito más significativo es el 3: 33, 34 y 37. El siguiente dígito más significativo de cada observación se indica a la derecha de la barra vertical |. En esencia, el diagrama de tallo y hoja representa cada observación como un dígito en cada fila, y las filas representan las observaciones cuyo dígito más significativo es el indicado. El diagrama de tallo y hojas viene siendo como un histograma de frecuencias dispuesto de arriba hacia abajo. Actualmente, los diagramas de tallo y hoja no se utilizan mucho, pero en una época en que los computadores no tenían capacidades gráficas y solo se podía visualizar la información en un terminal de puro texto, los diagramas de tallo y hoja eran una alternativa para visualizar los datos- un histograma de frecuencias para pobres si se quiere. Compare el diagrama de tallo y hoja con el histograma de frecuencias para los mismos datos:

La función stem en R genera los diagramas de tallo y hoja. Mediante el parámetro scale de esta función podemos controlar en cuantas filas subdividimos los datos. Por defecto, scale es igual a 1. Para esta data, si duplicamos scale tambien duplicamos el número de filas. Con un parámetro scale de dos, el diagrama de tallo y hoja sería como sigue:

> stem(x,scale=2)

  The decimal point is 1 digit(s) to the right of the |

  2 | 23
  2 |
  3 | 34
  3 | 7
  4 | 0
  4 |
  5 | 0000000000000011111111111111111124
  5 | 888
  6 | 2
  6 |
  7 | 04
  7 | 5788


En el diagrama superior, se puede observar que hay dos filas para cada dígito significativo: una fila contendrá las observaciones con el siguiente dígito entre 0 y 4 y la siguiente fila las observaciones con el siguiente dígito entre 5 y 9. Así por ejemplo, hay dos filas con un 5 a la izquierda- la de arriba contiene las observaciones que comienzan por 50 - 54 y la siguiente las observaciones entre 55 y 59.  Se puede apreciar que ambas filas representan la clase modal de los datos.


Ojivas de frecuencia

Las ojivas de frecuencia son esencialmente gráficos que visualizan las frecuencias acumuladas de una variable. En el eje de las X se disponen los distintos niveles de la variable a graficar (o equivalentemente, los límites de clase de los intervalos en los cuales uno agruparía las observaciones para hacer un histograma de frecuencias) y en el eje de las Y se colocan las frecuencias absolutas acumuladas. Mi librería estUNA dispone de una función para graficar ojivas. Su sintaxis es ojiva(x,intervalos), en donde x es la variable a graficar e intervalos es un número indicando el número de clases, un vector numérico indicando los límites de las clases o alguno de los siguientes valores alfanuméricos:

sturgesparticionamiento en clases según la regla de Sturges
sturges.rla regla de Sturges mejorada que usa R
fdLa regla de Freedman-Diaconis
scottLa regla de Scott

Por ejemplo, para construir una gráfica de ojiva de la variable X1 en el dataset del 2014-1, colocamos la siguiente instrucción.

> attach(d20141)
> ojiva(X1)



Diagramas de Caja


Los diagramas de caja, o boxplots, son otras de las técnicas de visualización de datos ideada por John Tukey. En ellos, se presentan las medidas de posición más importantes de una serie de datos: el primer cuartíl, la mediana y el tercer cuartil. Estas tres medidas se visualizan como una caja dispuesta verticalmente (de ahí deriva su nombre). El borde inferior de la caja es el primer cuartil, el borde superior de la caja es el tercer cuartíl y la mediana se visualiza como una línea horizontal que divide la caja.  La posición relativa de la línea mediana respecto a los otros dos cuartiles ya de por sí es una indicación de la asimetría de una distribución. Si la mediana está más cerca del primer cuartil, la distribución es asimétrica hacia la derecha. En caso contrario, si la mediana está más cerca del tercer cuartil, la distribución es asimétrica hacia la izquierda.

Los diagramas de caja también sirven para visualizar los datos atípicos. Lo que se denominan los bigotes del diagrama de caja son los límites de atipicidad moderada. De hecho, el bigote superior por ejemplo se corresponde al valor observacional más alto (supremo) que es menor a 1.5 veces el rango intercuartílico más el tercer cuartíl. Los valores que se encuentran más allá de los límites de la atipicidad moderada, los datos atípicos efectivamente, se visualizan como puntos redondos arriba o abajo de los bigotes. Por ejemplo, para la variable X7 del dataset del semestre 2014-1, el diagrama de caja se obtiene como sigue:

> caja(X7)

Extrayendo las medidas de posición de esta variable a partir de los resultados de la instrucción resumen(X7) en R, observamos lo siguiente:

 Medidas de Posicion
  Minimo     :  85
  Cuartil 1  :  97
  Mediana    :  99
  Cuartil 3  :  100
  Maximo     :  102

 Valores Atipicos
  Moderados :
Ninguno
  Extremos  :
 #9 #10  #6  #7  #8
 85  85  87  87  87

 Medidas de Forma
  Coeficiente de asimetria  :  -1.735933


Como ejercicio, observe el diagrama de cajas de arriba y establezca las correspondencias entre lo que se visualiza allí y la información en este resumen. Les invito a que hagan sus preguntas y discutan e interpreten estos resultados en los comentarios a esta entrada.

jueves, 8 de mayo de 2014

Talleres de Matemática I, II y III

Se le notifica al estudiantado que la preparadora Florangel estará dictando los siguientes talleres los días sábado en la Escuela Trujillo:

Fecha y hora
Contenido
17-05-2014, 8:00-10:00 amMatemática I (175-177)- objetivos 7-11
24-05-2014, 8:00-10:00 amMatemática II (178-179)- objetivos 6-9
07-06-2014, 8:00-10:00 amMatemática III (733)- objetivos 1-8
12-07-2014, 8:00-10:00 amMatemática I (175-177)- objetivos 1-11
19-07-2014, 8:00-10:00 amMatemática II (178-179)- objetivos 1-9


martes, 22 de abril de 2014

Estadística General, Aplicada e Inferencial: Nuevos planes de evaluación y Trabajos Prácticos

Se le informa a los estudiantes inscritos en Estadística General (745), Estadística Aplicada (746) e Inferencia Estadística (738-748) que los planes de evaluación de estas materias han sido modificados para el semestre entrante 2014-1.  Donde antiguamente el objetivo 1 (745), el objetivo 6 (746) y los objetivos 8, 9 y 10 (738/748) eran evaluados mediante la elaboración de un informe cuya entrega era obligatoria, este semestre estos objetivos serán evaluados en la primera parcial (745), segunda parcial (746) y tercera parcial (738/748).  Los trabajos de estas materias son evaluaciones de tipo formativa, lo cual significa que deben ser realizadas por el estudiante, pero no se requiere la entrega de un informe o trabajo al asesor y por eso verán que en los enunciados no hay fechas de entrega, ni para el borrador ni para la versión final del informe.  Sin embargo, es importante que el estudiante realice el trabajo (pueden reunirse en grupos de estudio y con el asesor si requiere asesoría), debido a que las preguntas en los parciales se referirán a la interpretación de los resultados obtenidos tras realizar las actividades indicadas en el enunciado del trabajo.

Seguidamente les indico los enlaces de descarga de los enunciados:
Se ha actualizado la librería estUNA para incluir la data del semestre 2014-1. Pulse el enlace para descargar la librería. El dataframe para este semestre es d20141.  Proximamente, se estarán publicando entradas en este blog referente a la realización de algunas de las actividades prácticas de este semestre, como los diagramas de tallo y hoja, las ojivas, entre otras.

sábado, 29 de marzo de 2014

Próximos Talleres para el 2014-1

Próximos talleres a ser dictados para este semestre:

  • Introducción a la probabilidad 737/747 - sábado 5/04/2014 9am, sede UNA.
  • Estadística General 745 - sábado 03/05/2014 9am, E.B. Trujillo.
  • Estadística Aplicada 746 - sábado 10/05/2014, 9am, E.B. Trujillo.
  • Inferencia Estadística 738/748 - sábado 17/05/2014, 9am, sede UNA.
  • Estadística General 745 - sábado 07/06/2014 9am, E.B. Trujillo.
  • Estadística Aplicada 746 - sábado 14/06/2014, 9am, E.B. Trujillo.
  • Inferencia Estadística 738/748 - sábado 21/06/2014, 9am, sede UNA.
Próximamente, se dictará un taller de Matemática I, según la información publicada en el blog de UNAOrientaciónElTigre.