martes, 30 de junio de 2015

Argumentum ad hominem

El argumentum ad hominem es una falacia lógica que consiste en ataques personales al adversario en un debate para pretender hacer ver que su posición es falsa. Algo de eso ha sucedido en estos últimos días en este blog. Es verdaderamente fastidioso tener que desviar mi energía mental, que pudiese utilizar para cosas mucho más provechosas como ampliar el contenido educativo de este blog, por citar un ejemplo. Pero lo hago, en primer lugar para defenderme de los ataques y en segundo lugar, porque creo que en el fondo, es función del docente formar, no solo impartir contenidos (de matemática en este caso). En tercer lugar, ya que algunos estudiantes han invertido tanta energía mental en averiguar mi vida por internet y darme una importancia que no tengo, espero retribuirles la atención brindada...

Pensé que los estudiantes A y B de aquella entrada de Fraude Académico que publiqué el año pasado habían aprendido que hay labores más provechosas para ellos como estudiantes - aprender y estudiar - que andar ligando líos con profesores que ni siquiera conocen, pero aquí están de vuelta y si no son ellos, han regresado convertidos en "millones y millonas", como dice su Eminencia. Aunque lo de millones es incorrecto porque se trata de un solo estudiante que reclama haciéndose pasar por varios, según veo por su dirección IP. Y comenzó de buen pié este fin de semana, ofendiendo como suele hacer Su Eminencia y su Padre Supremo, ahora convertido en pajarito, acusándome de "ladrón" y "plasta de m***da" (esos mensajes los borré porque no tengo que tolerar insultos a mi persona en mi blog).

Ahora, encuentro una serie de mensajes donde reclama su derecho a copiarse en los examenes y a no ser raspados por ello, algo que el llama "justicia para los estudiantes":

hernandez - eso, ponga la nota y ya, nos queremos graduuuuuuuaarrrrrrrrr     29 Jun 15 14:29 - 190.206.87.52
hernandez - pero es lo que siempre dice siempre que nos copiamos espero que nos coloque todas las notas que sacamos en la 746 a todos lo que le hicimos el examen ya basta de tanto rasparnos y rasparnos para que -    29 Jun 15 14:28 - 190.206.87.52
jromero - Si algún estudiante quiere revisión de prueba, venga a asesoría a revisar o indíqueme su identidad para revisar y discutir el caso. - 29 Jun 15 13:48 - 186.167.243.144
jromero - En cual parte del listado de objetivos logrados dice que hubo estudiantes que se copiaron en los exámenes de la 745? Indíquenme quienes son ustedes (número de cédula), para hacer revisión de sus exmns - 29 Jun 15 13:45 - 186.167.242.61
hernandez - asi mismo es profesor usted cree q nosotros no nos queremos graduar mire la situacion del pais para uno estar pendiendo tiempo q usted diga se copiaron, se copiaron, ya eso no tiene logica mas bien -    29 Jun 15 11:21 - 190.206.87.52
RODRIGUEZ - coloque nos las notas de lo que sacamos y deje de la tonteria que se copiaron. ya basta profesor 746 y 745 queremos justicia - 29 Jun 15 11:15 - 190.206.87.52
RODRIGUEZ - profesor romero es verdad lo que dice el compañero jose dejese de eso de estar raspando tanto ya basta     - 29 Jun 15 11:12 - 190.206.87.52
jose - PIENSE BIEN SI ES VERDAD O NO LO QUE LE NOSOTROS PENSAMOS, POR FAVOR SEA COCIENTE Y COLOQUENOS LA NOTA DE NUESTRO EXAMEN FIJADO O NO FIJADO DEJESE DE ESO YA BASTA Q TANTO . - 29 Jun 15 10:44 - 190.206.87.52
jose - SU EXAMEN SEA COPIADO O NO PORQUE NO ME VA A DECIR Q USTED NUNCA SE COPIO. TODOS LOS ALUMNOS DE LA 746 AL IGUAL 745 - 29 Jun 15 10:38 - 190.206.87.52
jose - PROBLEMA ES QUE NOS ENCUENTREN COPIANDONOS, SINO VENGA USTED MISMO A HACERNOS LOS EXAMENES Y VEA QUIEN O NO SE COPIA, YA ESTA PASADO YA ESO NO LE QUEDA BIEN BASTA DE TONTERIA COLOQUE LA NOTA A QUIEN - 29 Jun 15 10:37 - 190.206.87.52
jose - QUE PUBLIQUE LAS NOTAS BIEN DE LA 746, SINO VAMOS A TENER UNA BUENA PROTESTA CONTRA USTED NO ES JUSTO Q UNO TENGA QUE VER ESA MATETIA 8 Y 10 VECES NADA MAS PORQUE USTED DICE Q NOS FIJAMOS, ESO NO ES - 29 Jun 15 10:35 - 190.206.87.52
jose - PROFESOR VI LAS NOTAS QUE USTED PUBLICO DE LA 745 USTED YO NO SE CUAL ES EL TEMA DE RASPAR A TODO EL MUNDO, QUE LE PASA USTED NO FUE ESTUDIANTE O ERA EL PERFECTO DEL SALON, LAS COSAS NO SON ASI - 29 Jun 15 10:34 - 190.206.87.52

Pero hay un detalle, para el momento en que escriben los mensajes, 29 de junio de 2015 por la mañana, aún no he publicado los objetivos logrados en el primer parcial de la 746. Habiendo corregido y publicado ya los resultados de la 745, no encontré ninguna evidencia significativa de exámenes parecidos y a pesar de eso, para beneplácito mio, hubo bastantes objetivos logrados (luego publicaré otra entrada detallando algunos errores comunes en algunos objetivos de esta prueba).

Sin embargo, estos estudiantes, jugando posición adelantada, se pusieron a mover el avispero de la 746 y auto-confesarse como copiones antes de yo publicar los resultados. Esto obviamente me hizo más atento al momento de corregir estas pruebas y quisiera agradecerles el aviso, pues como dice el proverbio francés: Qui s'excuse, s'accuse. Sin embargo, por los momentos no publicaré una lista de los exámenes que son idénticos, aunque les daré algunas pistas:

Primeramente, se trata de un grupo de estudiantes de Anaco. En el objetivo 1, todos usaron el factor de corrección para poblaciones finitas en los literales a y b, pero no en los literales c y d. En todo este grupo de exámenes, tuvieron el mismo error en el cálculo del tamaño de la muestra para el literal d. En el objetivo 2, todos pusieron "debemos conseguir Z_alfa de tal forma que este valor sea superior a 2,33 y este valor es 0,0096". En el objetivo 3, calcularon mal la proporción de solteros y casados que hicieron uso del seguro, cometiendo exactamente el mismo error todos. En el objetivo 4, a todos les dio "39,19" (sic) como el valor del estadístico chi-cuadrado cuando el verdadero valor es 40,3956. Aún cuando yo admito, en algunos casos, errores de cálculo, es muy curioso que todos estos exámenes tengan los mismos errores de cálculo en las mismas partes de las preguntas, amén de que la redacción de las respuestas es casi idéntica, como cité para el objetivo 2.

¿Si saben ya quienes son? Los invito a que vengan a asesoría para aclarar algunos puntos de estos exámenes. Naturalmente, les haré otra evaluación para darles otra oportunidad a quien así lo solicite, de forma decente y sin insultos. O bien pueden optar por solicitarme groseramanete copia de su examen para remitirla al Nivel Central, donde seguramente les "encantará" que haya tan numeroso grupo de exámenes idénticos. Si quieren, también pueden grabarme por teléfono como lo hicieron los estudiantes A y B. Están en su derecho de exigirle a la Universidad que me sancione por negarles su derecho a copiarse en las pruebas. Pueden aducir que el problema no es que se copien, sino que los encuentren copiándose o con una chuleta del examen resuelto de antemano. Pero si optan por esto, no se pregunten luego porqué este país está como está, porque la respuesta la encontrarán cuando se vean al espejo.

Entre sus mensajes, me increpan por no ser tan "digno" como supuestamente me hago ver. También aseguran que muy probablemente, yo también me copiaba cuando era estudiante. Cada ladrón juzga por su condición. Permítanme contarles que cuando yo estudié la Licenciatura de Matemáticas en la UNA, era el único estudiante de esa carrera en mi oficina de apoyo. !No tenía de quien copiarme! Cuando me gradué, fui el único con cinta color champaña (ese es el color de las carreras de ciencias básicas) en mi promoción en el país y creo que no hubo graduados en Licenciatura de Matemáticas en todo el Centro Local de Anzoategui tres semestres antes o después de que me gradué. No me fue fácil - me tardé 10 años estudiando y repetí algunas materias como Topología o Procesos Estocásticos muchas veces. A veces, reprobaba las materias a propósito porque no me consideraba bien preparado y sabía que debía verlas de nuevo. Mis conocimientos no se los robé a nadie y los adquirí con mi propio esfuerzo y con la ayuda de buenos libros de matemáticas en mi biblioteca personal y sobre todo con buenos profesores, como el profesor Azocar (ya jubilado :( ), el profesor Gascón y el profesor Alvaro Stephens en Nivel Central.

Un consejo si quieren pasar Estadística o cualquier materia de matemáticas, no pierdan el tiempo en difamarme o averiguarme la vida - dedíquense a estudiar y no a "robar" conocimientos.










 

viernes, 22 de mayo de 2015

Trabajos prácticos de Estadística 2015-1

Estan publicados desde hace algún tiempo los enunciados para las actividades prácticas de las asignaturas de estadística: Estadística General (745), Estadística Aplicada (746) e Inferencia Estadística (738/748). Los enlaces de la página principal de evaluación de la UNA (ciberesquina) a estos documentos se da a continuación:

745 enunciado data
746 enunciado data
738/748 enunciado data

Los trabajos prácticos son actividades de evaluación formativa.Esto significa, en la práctica, que no habrá trabajo que entregar y por el cual uds. aprobaran o no un objetivo, ni tampoco fechas de entrega. Sin embargo, es altamente recomendable que revisen esto y realicen las actividades ahí sugeridas ya que esto se evaluará en los exámenes.

Pueden utilizar Excel o cualquier otro paquete estadístico para realizar las actividades del trabajo. Sin embargo, yo recomiendo el uso de R y junto con una librería llamada "estUNA" que he desarrollado para facilitar el desarrollo de las actividades prácticas. En una página fija de este blog se da información para aquellos interesados en usar R.  En este mismo blog he publicado video tutoriales sobre cómo instalar R y la librería estUNA así como un ejemplo del empleo de técnicas de estadística describptiva. También encontrarán muchas entradas ilustrando distintos métodos de estadística en este programa. Es muy probable que en el futuro continue ampliando esta información mediante más entradas y/o video tutoriales, así que estén atentos.

Para este semestre, la data se encuentra en los siguientes data frames de estUNA:

d20151e1 - son los datos para la etapa 1 (data insecticida)
d20151e2 - son los datos para la etapa 2 (data fertilizantes)


martes, 21 de abril de 2015

Talleres Semestre 2015-2

A continuación las fechas y los contenidos de los talleres:


Mat. 1 Lugar: Hora:
(175/176/177)
UE Trujillo 9am - 12pm
25/04/15
(Técnicas de estudio)
02/05/15
09/05/15 16/05/15
13/06/15
20/06/15
27/06/15
18/07/15



19/09/15




Nota: los talleres de Matemática I serán dictados por el preparador Manuel Rodriguez en la Unidad Educativa "Estado Trujillo" cercana a la sede de la UNA de 9am a 12pm.


Int. Probab.
Inf. Estadística
Est. General
Est. Aplicada
Talleres
(737 / 747)
(738 / 748)
(745)
(746)
1er Taller


02/05/15
obj. 1-4
09/05/15
obj. 1-4
2ndo Taller
23/05/15
obj. 4-5
16/05/15
obj. 4-7
04/07/15
obj. 5-8

3er Taller
11/07/15
obj. 6-8

18/07/15
obj. 1-8
25/07/15
obj. 1-8
4to Taller
19/09/15
obj. 1-8
26/09/15
obj. 1-10



Nota: los talleres de probabilidades y estadísticas los estaré dictando yo (Prof. José Romero) a las 9:30am en la E.B Trujillo. Traigan sus formularios, calculadoras y planes de evaluación.

lunes, 10 de noviembre de 2014

Trabajos de Estadística para el 2014-2

A continuación los enlaces para el trabajo práctico de las materias de estadística (738/748, 745 y 746) correspondientes a este semestre 2014-2:

  • 745 (Estadística General)
  • 746 (Estadística Aplicada)
  • 738/748 (Inferencia Estadística)

Hasta la fecha de hoy (10/11/14), no ha sido publicado el enunciado del trabajo de la 738/748. Publicaré el enlace editando esta entrada tan pronto esté disponible y próximamente publicaré los archivos de la data para trabajar en R.

Es de notar que los trabajos de la 745 y la 746 son evaluaciones de tipo formativo tal como el semestre pasado. Es decir, no se entregan para aprobar el objetivo del trabajo práctico, pero se recomienda la realización de las actividades allí planteadas para entender las preguntas que sobre esos objetivos se colocarán en los exámenes. En el caso de la 738/748, tendremos que esperar a que sean publicados los trabajos para saber si se mantendrá el plan de evaluación tal como el semestre pasado.

Indicaciones para usar estUNA (la librería R para trabajos de estadística desarrollada por mí)

  • Puede dirigirse a la página http://unamatematicaseltigre.blogspot.com/p/lenguaje-r.html en mi blog, donde se dan enlaces par mayor información sobre cómo instalar R y la librería estUNA, tutoriales básicos sobre el uso de R para la elaboración de estos trabajos, etc.
  • Existen muchas entradas en este blog con información sobre cómo elaborar los trabajos prácticos de estadística usando R. Inclusive, hay algunos video-tutoriales.
  • La data del trabajo práctico para este semestre es igual a la del semestre 2010-2, por lo menos para los enunciados de los trabajos que han sido publicados (el de la 745 y la 746). Por lo tanto, el data-frame d20102 contiene la data para este semestre. 

miércoles, 22 de octubre de 2014

Talleres para el 2014-2

A continuación las fechas y los contenidos de los talleres:


Matemática 1
Matemática 2
Matemática 3
Talleres
(175/176/177)
(178/179)
(733)
1er Taller
01/11/14
(Técnicas de estudio y obj. 1 y 2)
08/11/14
obj. 1-5
2ndo Taller
15/11/14
obj. 3-6
31-01-15
Obj. 6-9
3er Taller
17-01-15
Obj. 7-11
22-02-15
Obj. 1-9
4to Taller
15-02-15
Obj. 1-11

Nota: los talleres de Mat. 1-3 serán dictados por la preparadora Florangel a las 8am en la E.B Trujillo. Tan pronto me de las fechas de los otros talleres edito esta entrada.

Int. Probab.
Inf. Estadística
Est. General
Est. Aplicada
Talleres
(737 / 747)
(738 / 748)
(745)
(746)
1er Taller
25/10/14
obj. 1-3
01/11/14
obj. 1-4
08/11/14
obj. 1-4
2ndo Taller
22/11/14
obj. 4-5
15/11/14
obj. 4-7
29/11/14
obj. 5-8
13/12/14
obj. 5-8
3er Taller
17/01/15
obj. 6-8
10/01/15
obj. 8-10
31/01/15
obj. 1-8
07/02/15
obj. 1-8
4to Taller
21/02/15
obj. 1-8
14/02/15
obj. 1-10

Nota: los talleres de probabilidades y estadísticas los estaré dictando yo (Prof. José Romero) a las 9:30am en la E.B Trujillo. Traigan sus formularios, calculadoras y planes de evaluación.

viernes, 3 de octubre de 2014

Fraude Academico

Al corregir los exámenes integrales de la 738/748 de este semestre 2014-1, he observado un hecho muy irregular y en extremo grave que quisiera hacer público en este blog. Dos estudiantes, a quienes en lo sucesivo me referiré como Estudiante A y Estudiante B, han cometido una falta tipificada como grave en el Articulo 8, literal c del Reglamento Disciplinario Estudiantil de la Universidad Nacional Abierta, el cual establece lo siguiente:

Articulo 8 – Serán faltas graves:

...

(c) las acciones fraudulentas que el estudiante realice de manera intencional y premeditada, individualmente o con la participación de otras personas, antes, durante, o después de las actividades de evaluación de los aprendizajes, dirigida a alterar los resultados de su propia evaluación o la de otros estudiantes.

En efecto, la falta en cuestión es que ambos estudiantes se han copiado en esta evaluación, como queda en evidencia en las imágenes de los cuadros comparativos, objetivo por objetivo, de los items que respondieron, algunos de los cuales se presentan a continuación. No he considerado relevante ni pertinente nombrar en este blog a los estudiantes “copiones”- ellos sabrán quienes son al ver la escritura de su puño y letra. Tampoco creo necesario incluir imágenes de todas sus respuestas- aburren en la forma tan monótona en que ambos exámenes se parecen “como dos gotas de agua”. De todos modos se les levantará un acta a ambos estudiantes sustanciada debidamente con el cuerpo del delito.

El propósito de este escrito es concientizar a la comunidad estudiantil sobre la gravedad de cometer este tipo de fraudes académicos. He observado con mucha preocupación un alto grado de similitud entre algunas pruebas en ocasiones anteriores. Un alto grado de similitud que raya peligrosamente en las acciones fraudulentas mencionadas supra, aunque a decir verdad, nunca he visto pruebas tan evidentemente idénticas como las de los Estudiantes A y B. Si usted esta entre los estudiantes probos, quienes son mayoría en nuestra Universidad, esta entrada no es con Usted. Puede pulsar “Ir al siguiente blog”. Si no, haría bien en continuar leyendo...

Supongo que la obtención de un titulo universitario es la razón principal por la que los estudiantes se embarcan en el estudio de una carrera universitaria (verdad de perogrullo). El problema cuando se incurre en este tipo de acciones fraudulentas (y me refiero a cualquier acción que comprometa la validez de la evaluación) es que al hacerse práctica común entre el estudiantado (y ojalá que no), esto erosionaría el valor del Titulo Universitario otorgado por la Universidad Nacional Abierta. Siendo este servidor egresado de esta misma Casa de Estudios, habiendo trabajado duro para obtener mi titulo de Licenciado en Matemáticas, mención Probabilidad y Estadísticas y luego habiendo pasado exitosamente por un proceso de selección muy riguroso conocido como “Concurso de Oposición” para convertirme en docente ordinario de mi querida Alma Mater, nunca permitiré tal erosión del valor de mi Título. En resumen, los estudiantes que inconscientemente incurren en este tipo de acciones (y escribo “inconsciente” porque si tuvieran conciencia o aquello que llaman principios, no lo harían) incurren en el clásico “escupir para arriba”.

Huelga recordarle a aquellos pocos estudiantes sin principios y sinvergüenzas que aún cuando no les importe escupir para arriba, la saliva, fiel a la Ley de la Gravedad, de todos modos les caerá en la cara en forma de sanciones y quizás hasta expulsión de la universidad, lo cual retardaría o daría al traste definitivamente con su sueño de obtener el anhelado titulo universitario de la U.N.A.   

Los Estudiantes A y B están entre un minúsculo grupo de estudiantes que recientemente han levantado acusaciones sin fundamento en contra de mi persona como docente de la U.N.A.  En unos escritos que presentaron ante las autoridades universitarias, se me acusa de vender notas aprobatorias para las materias que asesoro y que dichas ventas se concretarían a través de la asistencia obligatoria a asesorías presenciales que supuestamente exijo para pasar las materias.  ¿Acaso dichos estudiantes nunca se enteraron en el Curso Introductorio que las asesorías presenciales (y de cualquier otro tipo como por ejemplo las asesorías en línea de las cuales sobran ejemplos en este mismo blog) son un recurso importante para lograr el éxito en los estudios a distancia? Estas asesorías se dan de forma gratuita como parte del desempeño de nuestras funciones docentes. ¿Leyeron bien? Son gratuitas, a diferencia de cursos pagos o tutores individuales que tendrían que pagar. Tampoco son obligatorias, ¡pero cómo ayudan!   Regularmente, miles de estudiantes de la U.N.A. a lo largo y ancho del país acuden a asesorías con sus asesores para aclarar dudas sobre el contenido estudiado o para discutir sobre el logro de objetivos en los exámenes.  Ciertamente, una buena y constante comunicación docente-estudiante es la clave para el éxito en el aprendizaje y este es el mejor consejo que podría darle a los aspirantes del Curso Introductorio. Sin embargo, por alguna inexplicable razón, estos estudiantes prefirieron nunca asistir a asesorías para aclarar dudas y en vez de ello, se dedicaron a “escupir para arriba”. Dicho sea de paso, ellos tienen otros casos similares de pruebas copiadas que han levantado otros asesores junto a los cuales este caso ahora pasará a engrosar su creciente expediente.

A continuación reproduzco algunas de las imágenes de los exámenes referidos:




Estudiante A - Objetivo 1 Estudiante B - Objetivo 1

Se puede observar que en la tabla de distribución de frecuencias de la media, ambos estudiantes colocan frecuencias en fracciones con denominador de 5 (cuando debería ser 15) a partir del valor de X-barra de 19,5- es decir, ambos cometieron exactamente el mismo error. Si hubiesen ido a asesoría conmigo o asistido a alguno de mis talleres, sabrían que los valores en una distribución de frecuencias relativas deberían sumar a 1, la probabilidad total. Como casi todos mis estudiantes saben (a excepción de ellos dos porque nunca han asistido a asesorías o talleres), esto es un dato que repito ad nauseam para que los estudiantes eviten cometer este tipo de errores. Una mentira repetida mil veces (en este caso dos veces), no se convierte en verdad. Repitan conmigo – la probabilidad total de los eventos elementales de un espacio probabilizado es igual a uno...




Estudiante A - Objetivo 2 Estudiante B - Objetivo 2

Estos exámenes, en cuanto a demostrar que ustedes han logrado el dominio de los objetivos evaluados, tampoco “satisfacen las expectativas exigidas”.



Estudiante A - Objetivo 4 Estudiante B - Objetivo 4

Exactamente los mismos errores en ambas pruebas. ¿Es en serio? Lo que verdaderamente indigna de este tipo de pruebas copiadas es que al pensar que nosotros los profesores nunca nos enteraremos que se copiaron, pretenden tomarnos por idiotas, cuando los idiotas son otros...

Estudiante A - Objetivo 7 Estudiante B - Objetivo 7

Al Estudiante B le diría que las hipótesis nulas nunca se aceptan- se dice más bien que no se rechazan – otra cosa que he explicado hasta el cansancio en mis talleres y asesorías. Si alguien desea indagar más al respecto, le sugiero leer la obra de Karl Popper, específicamente el libro titulado “The Logic of Scientific Discovery”, en el cual hace una excelente exposición sobre la falseabilidad de las hipótesis como pilar fundamental del conocimiento científico. Aquí lo único que han demostrado es que sus exámenes “no difieren significativamente”- es más, son casi idénticos hasta en la letra. Los Estudiantes A y B también han logrado confirmar la creencia de Einstein, quien dudaba de la infinitud del Universo pero si estaba seguro de la infinitud de la estupidez humana. Un aplauso para ellos.


Estudiante A - Objetivo 9 Estudiante B - Objetivo 9

Seguramente los Estudiantes A y B aducirán que trabajaron de manera independiente en sus exámenes. Esto sería como poner dos monos transcribir en sendas máquinas de escribir, algún soneto de Shakespeare y que produzcan, palabra por palabra, punto por punto, el mismo soneto.  Ambos eventos tendrían la misma probabilidad - casi nula – lo cual es en extremo significativo. Shall I compare thee to a summer's day?

Bibliografía


Börger, L. (sf).  “You shall not pass!”: quantifying barrier permeability and proximity avoidance by animals. Disponible en: https://www.academia.edu/8581797/You_shall_not_pass_quantifying_barrier_permeability_and_proximity_avoidance_by_animals

Calaprice, A. (2010). The Ultimate Quotable Einstein. Princeton University Press.

Popper, K. (2005). The Logic of Scientific Discovery.  Taylor & Francis e-Library.

Universidad Nacional Abierta (1999). Reglamento Disciplinario Estudiantil de la Universidad Nacional Abierta. Caracas.

Walter J. Black, Inc. (1937). The Complete Works of William Shakespeare.






martes, 13 de mayo de 2014

Técnicas de visualización de datos a ser utilizadas este semestre

En este lapso académico se les pide a los estudiantes de Estadística General (745) realizar diagramas de tallo y hoja, ojivas de frecuencia y diagramas de caja como parte de las actividades prácticas del objetivo 1. En esta entrada, hablaré un poco sobre estas técnicas de visualización de datos y como se implementan en R / estUNA.

Diagramas de tallo y hoja


Los diagramas de tallo y hoja fueron ideados por John Tukey, un renombrado estadístico estadounidense conocido por otras tantas técnicas de visualización de datos como los diagramas de caja, que también se utilizarán en el trabajo práctico de la 745 para el semestre 2014-1.

Los diagramas de tallo y hoja se basan en agrupar datos cuantitativos según los dígitos de cada valor. La columna de la izquierda en el diagrama de tallo y hoja contendrá los dígitos comunes al grupo correspondiente a la derecha. La columna de la izquierda contiene lo que se denominan los tallos, que son el grupo de dígitos más significativos de la representación decimal de cada valor. La columna de la izquierda contiene los siguientes dígito (menos significativo) para las observaciones con el mismo grupo de dígitos significativos indicado en el tallo- estos son las hojas. Las observaciones se redondean al dígito cuyo lugar representa la hoja. Entre la columna de tallos y hojas hay un caracter de separación, usualmente una línea vertical como esta: |.

A modo de ejemplo, considérese el vector de observaciones x:

> x
 [1] 50.15886 21.76843 54.37469 50.81199 50.84726 23.26372 50.78665 50.83612
 [9] 58.16413 50.95605 50.90962 50.28626 73.72907 50.60134 51.67277 77.72239
[17] 50.40217 50.06982 37.21745 50.52507 50.63772 50.92666 49.98095 69.97754
[25] 50.09227 50.56210 62.32098 50.17898 50.56876 50.02068 50.45380 58.23187
[33] 50.55260 50.60741 58.30804 77.89047 50.03048 50.71370 32.79830 33.70865
[41] 50.25847 50.78177 50.15337 74.58174 50.53656 50.33758 39.51859 77.45064
[49] 50.03587 50.67190


Para construir el diagrama de tallos y hojas, debemos primero decidir cuales dígitos de cada observación serán los tallos y cuales serán las hojas. Tenemos cincuenta observaciones entre un rango de 20 y 80. Tomaremos los dígitos de las decenas como los tallos. Para las hojas, tomaremos los dígitos de las unidades, habiendo redondeado previamente cada valor en las unidades. Es preciso redondear y ordenar las observaciones:

> sort(round(x))
 [1] 22 23 33 34 37 40 50 50 50 50 50 50 50 50 50 50 50 50 50 50 51 51 51 51 51
[26] 51 51 51 51 51 51 51 51 51 51 51 51 51 52 54 58 58 58 62 70 74 75 77 78 78


En R, generamos los diagramas de tallo y hoja mediante la instrucción "stem". No tenemos que realizar la operación previa de redondeo y ordenamiento: esto lo realiza la misma instrucción stem. Sólo se incluye el vector con redondeos y ordenado para que el estudiante pueda entender cómo se generan este tipo de gráficas. Coteje los valores redondeados y ordenados arriba con el resultado de la instrucción stem:

> stem(x)

  The decimal point is 1 digit(s) to the right of the |

  2 | 23
  3 | 347
  4 | 0
  5 | 0000000000000011111111111111111124888
  6 | 2
  7 | 045788


Como podemos observar, hay dos valores en la muestra con decenas de 2: 22 y 23. Estas observaciones se indican en la primera fila del diagrama: 2 | 23. La siguiente fila se corresponden a las observaciones cuyo dígito más significativo es el 3: 33, 34 y 37. El siguiente dígito más significativo de cada observación se indica a la derecha de la barra vertical |. En esencia, el diagrama de tallo y hoja representa cada observación como un dígito en cada fila, y las filas representan las observaciones cuyo dígito más significativo es el indicado. El diagrama de tallo y hojas viene siendo como un histograma de frecuencias dispuesto de arriba hacia abajo. Actualmente, los diagramas de tallo y hoja no se utilizan mucho, pero en una época en que los computadores no tenían capacidades gráficas y solo se podía visualizar la información en un terminal de puro texto, los diagramas de tallo y hoja eran una alternativa para visualizar los datos- un histograma de frecuencias para pobres si se quiere. Compare el diagrama de tallo y hoja con el histograma de frecuencias para los mismos datos:

La función stem en R genera los diagramas de tallo y hoja. Mediante el parámetro scale de esta función podemos controlar en cuantas filas subdividimos los datos. Por defecto, scale es igual a 1. Para esta data, si duplicamos scale tambien duplicamos el número de filas. Con un parámetro scale de dos, el diagrama de tallo y hoja sería como sigue:

> stem(x,scale=2)

  The decimal point is 1 digit(s) to the right of the |

  2 | 23
  2 |
  3 | 34
  3 | 7
  4 | 0
  4 |
  5 | 0000000000000011111111111111111124
  5 | 888
  6 | 2
  6 |
  7 | 04
  7 | 5788


En el diagrama superior, se puede observar que hay dos filas para cada dígito significativo: una fila contendrá las observaciones con el siguiente dígito entre 0 y 4 y la siguiente fila las observaciones con el siguiente dígito entre 5 y 9. Así por ejemplo, hay dos filas con un 5 a la izquierda- la de arriba contiene las observaciones que comienzan por 50 - 54 y la siguiente las observaciones entre 55 y 59.  Se puede apreciar que ambas filas representan la clase modal de los datos.


Ojivas de frecuencia

Las ojivas de frecuencia son esencialmente gráficos que visualizan las frecuencias acumuladas de una variable. En el eje de las X se disponen los distintos niveles de la variable a graficar (o equivalentemente, los límites de clase de los intervalos en los cuales uno agruparía las observaciones para hacer un histograma de frecuencias) y en el eje de las Y se colocan las frecuencias absolutas acumuladas. Mi librería estUNA dispone de una función para graficar ojivas. Su sintaxis es ojiva(x,intervalos), en donde x es la variable a graficar e intervalos es un número indicando el número de clases, un vector numérico indicando los límites de las clases o alguno de los siguientes valores alfanuméricos:

sturgesparticionamiento en clases según la regla de Sturges
sturges.rla regla de Sturges mejorada que usa R
fdLa regla de Freedman-Diaconis
scottLa regla de Scott

Por ejemplo, para construir una gráfica de ojiva de la variable X1 en el dataset del 2014-1, colocamos la siguiente instrucción.

> attach(d20141)
> ojiva(X1)



Diagramas de Caja


Los diagramas de caja, o boxplots, son otras de las técnicas de visualización de datos ideada por John Tukey. En ellos, se presentan las medidas de posición más importantes de una serie de datos: el primer cuartíl, la mediana y el tercer cuartil. Estas tres medidas se visualizan como una caja dispuesta verticalmente (de ahí deriva su nombre). El borde inferior de la caja es el primer cuartil, el borde superior de la caja es el tercer cuartíl y la mediana se visualiza como una línea horizontal que divide la caja.  La posición relativa de la línea mediana respecto a los otros dos cuartiles ya de por sí es una indicación de la asimetría de una distribución. Si la mediana está más cerca del primer cuartil, la distribución es asimétrica hacia la derecha. En caso contrario, si la mediana está más cerca del tercer cuartil, la distribución es asimétrica hacia la izquierda.

Los diagramas de caja también sirven para visualizar los datos atípicos. Lo que se denominan los bigotes del diagrama de caja son los límites de atipicidad moderada. De hecho, el bigote superior por ejemplo se corresponde al valor observacional más alto (supremo) que es menor a 1.5 veces el rango intercuartílico más el tercer cuartíl. Los valores que se encuentran más allá de los límites de la atipicidad moderada, los datos atípicos efectivamente, se visualizan como puntos redondos arriba o abajo de los bigotes. Por ejemplo, para la variable X7 del dataset del semestre 2014-1, el diagrama de caja se obtiene como sigue:

> caja(X7)

Extrayendo las medidas de posición de esta variable a partir de los resultados de la instrucción resumen(X7) en R, observamos lo siguiente:

 Medidas de Posicion
  Minimo     :  85
  Cuartil 1  :  97
  Mediana    :  99
  Cuartil 3  :  100
  Maximo     :  102

 Valores Atipicos
  Moderados :
Ninguno
  Extremos  :
 #9 #10  #6  #7  #8
 85  85  87  87  87

 Medidas de Forma
  Coeficiente de asimetria  :  -1.735933


Como ejercicio, observe el diagrama de cajas de arriba y establezca las correspondencias entre lo que se visualiza allí y la información en este resumen. Les invito a que hagan sus preguntas y discutan e interpreten estos resultados en los comentarios a esta entrada.