He visto que algunos tienen dudas respecto al trabajo de estadística para este semestre, en particular lo referente a la regresión lineal, que forma parte de los objetivos a evaluar para las asignaturas 745, 738 y 748.
Primero, debo aclarar, una vez más, lo siguiente:
NO ES OBLIGATORIO EL USO DE R PARA LA REALIZACIÓN DE ESTE TRABAJO. POR RAZONES HARTO EXPLICADAS EN ESTA PÁGINA, YO RECOMIENDO EL USO DE R, PERO EL ESTUDIANTE PUEDE OPTAR POR USAR EXCEL, SAS, SPSS, MINITAB O CUALQUIER APLICACION ESTADÍSTICA (Excel es un programa de hoja de cálculo, no una aplicación para la estadística). LO QUE SE REQUIERE ES REALIZAR LAS ACTIVIDADES QUE SE PIDEN EN EL ENUNCIADO CORRECTAMENTE.
Al momento de elegir la aplicación con la cual trabajarán, deben preguntarse: ¿Qué es lo que se requiere que el estudiante realice correctamente? Se copia la parte del enunciado detallando las actividades a realizar:
6.1. Obtener los siguientes modelos de regresión lineal múltiple,
Modelo 1: Y = b0 + b1 X1 + b2 X2 + b3 X3 + b4 X4 + b6 X6 +b7 X7 + b8 X8 + b9 X9
Modelo 2: Y = b1 X1 + b2 X2 + b3 X3 + b4 X4 + b6 X6 + b7 X7 + b8 X8 + b9 X9
6.2. Explicar cual de los modelos anteriores consideraría para realizar el estudio.
6.3. Estudiar la posibilidad de colinealidad o multicolinealidad en el modelo
Modelo 1: Y = b0 + b1 X1 + b2 X2 + b3 X3 + b4 X4 + b6 X6 +b7 X7 + b8 X8 + b9 X9
Modelo 2: Y = b1 X1 + b2 X2 + b3 X3 + b4 X4 + b6 X6 + b7 X7 + b8 X8 + b9 X9
6.2. Explicar cual de los modelos anteriores consideraría para realizar el estudio.
6.3. Estudiar la posibilidad de colinealidad o multicolinealidad en el modelo
considerado en la pregunta anterior. Si existe, corregir este problema y obtener el
nuevo modelo.
6.4. Partiendo del modelo obtenido en la pregunta 6.3, explicar todos los resultados
6.4. Partiendo del modelo obtenido en la pregunta 6.3, explicar todos los resultados
arrojados por el programa (coeficientes y estadísticos).
6.5. Utilizar el procedimiento de regresión paso a paso (eliminación hacia atrás) para
6.5. Utilizar el procedimiento de regresión paso a paso (eliminación hacia atrás) para
encontrar el modelo que mejor se ajusta. Interprete los coeficientes de este último
modelo.
6.6. Considere una nueva variable,
X11=(X3+X4)/2.
Construir el siguiente modelo,
Y = b1 X1 + b2 X2 + b7 X7 + b8 X8 + b9 X9 + b11 X11
Realizar el procedimiento indicado en 6.5.
6.7. Explicar cual de los modelos obtenidos en 6.5 y 6.6 representa “mejor” la situación
6.6. Considere una nueva variable,
X11=(X3+X4)/2.
Construir el siguiente modelo,
Y = b1 X1 + b2 X2 + b7 X7 + b8 X8 + b9 X9 + b11 X11
Realizar el procedimiento indicado en 6.5.
6.7. Explicar cual de los modelos obtenidos en 6.5 y 6.6 representa “mejor” la situación
bajo estudio.
6.8. Realizar un análisis de residuos para los modelos obtenidos en los puntos 6.5
6.8. Realizar un análisis de residuos para los modelos obtenidos en los puntos 6.5
y 6.6.
6.9. Explicar los fundamentos teóricos que justifican o no, todos los pasos seguidos
6.9. Explicar los fundamentos teóricos que justifican o no, todos los pasos seguidos
desde el ítem 6.1. hasta el ítem 6.8.
Antes de elaborar el trabajo, asegúrese de manejar los fundamentos de la técnica de regresión lineal. ¿Sabe usted qué es la regresión lineal y qué es un modelo de regresión lineal? ¿Sabe en qué consiste un análisis de residuos y cuál es la importancia de realizarlo? ¿Sabe en que consiste el procedimiento de regresión paso a paso (eliminación hacia atrás)? ¿Sabe cómo determinar la colinealidad entre dos variables? ¿Entre múltiples variables? ¿Sabe porqué es problemático trabajar con variables predictoras que sean colineales entre sí? ¿Sabe cómo evaluar o comparar modelos y cómo esto va más allá de comparar sus coeficiente de determinación? ¿Sabe cómo interpretar un modelo de regresión lineal y determinar cuales variables predictoras son significativas? ¿Sabía que las variables categóricas no se pueden utilizar directamente como variables cuantitativas sin antes transformarlas en variables indicadoras?
He puesto a su alcance ciertos recursos que serán de utilidad. En la parte inferior de la página http://unamatematicaseltigre.blogspot.com/p/estadistica-aplicada.html podrán ubicar la bibliografía más relevante. Los capítulos 13 y 14 del Canavos tratan en detalle el tema de la regresión lineal, incluyendo información detallada sobre el problema de la multicolinealidad, las variables indicadoras y el análisis de residuos. El Webster no es tan extenso, pero lo menciono porque es el texto principal de la asignatura. Además de esto, he escrito una monografía sobre el análisis de residuos cuya lectura recomiendo.
Me he dedicado laboriosamente a poner a su alcance varias herramientas computacionales y guias tutoriales sobre su uso. Consideren estos recursos cómo herramientas- su buen uso depende del criterio de ustedes y de lo que desean realizar. Si optan por usar R y la librería estUNA que he creado para tal fin, estudien detenidamente los siguientes recursos:
- Un tutorial sobre como descargar e instalar R o utilizarlo a través de un servidor web: https://dl.dropbox.com/u/25445316/unamatematicaseltigre/conseguirR.html
- Un tutorial de introducción a la programación en R, cubriendo los aspectos básicos de este lenguaje de programación: https://dl.dropbox.com/u/25445316/unamatematicaseltigre/introduccionR.html
- Un tutorial sobre el uso de la librería estUNA (https://dl.dropbox.com/u/25445316/unamatematicaseltigre/estUNA.html). En este tutorial se trabaja con la data del semestre 2010-2 para ilustrar cómo dar cumplimiento a los distintos requerimientos de los trabajos prácticos de estadística para ese semestre. Debe buscar la parte de este tutorial que ejemplifica lo que usted desee realizar (la regresión lineal).
- La monografía sobre análisis de residuos antes mencionada.
- Una entrada de este blog ilustrando cómo realizar la regresión lineal mediante el procedimiento de regresión paso a paso (eliminación hacia atrás).
- En esta página hay otros ejemplos de cómo usar R que pueden buscar mediante palabras claves como: 746, R, estUNA, entre otras
- Una serie de entradas referentes al problema de determinar cuales factores inciden en la determinación de las tasas de interés de créditos personales: The Lending Club - parte 1, parte 2 y parte 3. En la parte 2 de estas entradas, se da un ejemplo de cómo detectar (y cuantificar) la colinealidad entre las variables. En la parte 3, se construyen y se evalúan varios modelos de regresión lineal.
Si optan por usar R con mi librería y presentan problemas con su descarga o uso, deben describir detalladamente el error que presentan. Si sólo me indican que "no logran usar el R", o "me sale un error", sin indicar la secuencia de comandos que están intentando ejecutar, cuál es la salida del interprete y el aviso de error, cuál plataforma/sistema operativo o versión de R están usando, no les puedo ser de mucha ayuda. Tampoco haré el trabajo por ustedes.
Si te gustó o te pareció útil este contenido, compártelo en las redes sociales y dale tu voto positivo en el botón "me gusta" de G+, para que otros puedan encontrar el contenido también.
No hay comentarios:
Publicar un comentario