Regresión Lineal (1 de 2)
Relación entre horas de estudio y calificaciones
La regresión lineal simple te permite modelar la relación entre una variable dependiente (Y) y una variable independiente (X) usando una línea recta. En esta lección aprenderás a interpretar la ecuación de regresión y evaluar la bondad del ajuste usando datos reales de horas de estudio y calificaciones.
💡 Cosas que puedes probar:
- Observa la línea de regresión que se ajusta a los datos
- Activa/desactiva la línea de regresión para comparar
- Muestra la ecuación de la línea para ver la pendiente e intercepto
- Interpreta el coeficiente R² que indica qué tan bien predice el modelo
- Usa la ecuación para predecir calificaciones para diferentes horas de estudio
- Observa cómo la pendiente indica el cambio en Y por cada unidad de X
¿Qué es la Regresión Lineal?
La regresión lineal es una técnica estadística que modela la relación entre una variable dependiente (Y) y una o más variables independientes (X) usando una línea recta.
Ecuación de la Línea
y = mx + b
Donde:
• m = pendiente (slope)
• b = intercepto (intercept)
• x = variable independiente
• y = variable dependiente
Coeficiente de Determinación
R² indica qué porcentaje de la variabilidad en Y puede ser explicado por X. Un valor más cercano a 1 indica una mejor predicción.
Datos y Visualización
Datos de Ejemplo
| Horas (X) | Calificación (Y) |
|---|---|
| 2 | 65 |
| 3 | 70 |
| 4 | 75 |
| 5 | 80 |
| 6 | 85 |
| 7 | 88 |
| 8 | 92 |
| 9 | 95 |
| 10 | 98 |
| 12 | 100 |
Gráfico de Dispersión
Resultados del Análisis
Pendiente (m)
3.68
Por cada hora adicional de estudio, la calificación aumenta en 3.68 puntos en promedio.
Intercepto (b)
60.50
Calificación esperada cuando no se estudia (0 horas). Nota: este valor puede no tener sentido práctico.
R²
96.2%
Porcentaje de variabilidad explicada por el modelo.
Predicciones
Ecuación de Predicción
Calificación = 3.68 × Horas + 60.50
Usa esta ecuación para predecir calificaciones basadas en horas de estudio.
Ejemplos de Predicción
1 hora:Calificación predicha = 64.2
5 horas:Calificación predicha = 78.9
10 horas:Calificación predicha = 97.3
15 horas:Calificación predicha = 115.7
¿Qué significa la pendiente de 3.7 en este contexto?
¿Cuál sería la calificación predicha para alguien que estudia 6 horas?
💡 Usa la ecuación: Calificación = 3.68 × Horas + 60.5
¿Qué tan bien predice el modelo las calificaciones?
Interpretación de Resultados
Fortalezas del Modelo:
- R² alto indica buena capacidad predictiva
- Pendiente positiva muestra relación directa
- Datos bien distribuidos alrededor de la línea
- Ecuación simple y fácil de interpretar
Limitaciones:
- Asume relación lineal
- No considera otros factores (motivación, inteligencia)
- Predicciones fuera del rango pueden ser poco confiables
- No establece causalidad
Resumen de Conceptos Clave
Regresión Lineal:
- Ecuación: y = mx + b
- Pendiente (m): Cambio en Y por unidad de cambio en X
- Intercepto (b): Valor de Y cuando X = 0
- R²: Porcentaje de variabilidad explicada
Interpretación:
- R² > 0.9: Excelente predicción
- R² 0.7-0.9: Buena predicción
- R² 0.3-0.7: Predicción moderada
- R² < 0.3: Predicción débil
Fórmulas Importantes:
m = (nΣxy - ΣxΣy) / (nΣx² - (Σx)²)Intercepto:
b = (Σy - mΣx) / nR² = 1 - (SSres / SStot)Predicción:
ŷ = mx + b