Entrada

📊 Ejemplo de resumen OLS válido para el análisis

En el post anterior veíamos la explicación de regresión lineal (OLS) y al final un ejemplo del cual se podía sacar como conclusión que no hay relación: el pulso no ayuda a predecir cuántas calorías quema una persona, al menos con estos datos.

Pero cuál sería un ejemplo de gráfica que diese como conclusión que SÍ hay relación.

regresion_lineal_buena

Cruces amarillas: son los datos reales de personas: su pulso promedio y calorías quemadas.

La línea verde: encaja muy bien con los puntos, y eso nos dice que el modelo ha aprendido una relación real.


📊 results.summary() del nuevo modelo

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
                            OLS Regression Results                            
==============================================================================
Dep. Variable:        Calorie_Burnage   R-squared:                       0.679
Model:                            OLS   Adj. R-squared:                  0.677
Method:                 Least Squares   F-statistic:                     341.1
Date:                Sun, 13 Apr 2025   Prob (F-statistic):           1.31e-41
Time:                        16:59:12   Log-Likelihood:                -784.40
No. Observations:                 163   AIC:                             1573.
Df Residuals:                     161   BIC:                             1579.
Df Model:                           1                                         
Covariance Type:            nonrobust                                         
=================================================================================
                    coef    std err          t      P>|t|      [0.025      0.975]
---------------------------------------------------------------------------------
Intercept        38.8844     25.048      1.552      0.123     -10.580      88.349
Average_Pulse     4.6337      0.251     18.469      0.000       4.138       5.129
==============================================================================
Omnibus:                        6.502   Durbin-Watson:                   2.123
Prob(Omnibus):                  0.039   Jarque-Bera (JB):                8.179
Skew:                           0.250   Prob(JB):                       0.0167
Kurtosis:                       3.977   Cond. No.                     1.07e+03
==============================================================================

✅ ¿Qué nos dice este resumen?

🧩 Bloque 1: Información del modelo

  • R-squared: 0.679 → ¡Muy bueno! El modelo explica el 68% de la variación en las calorías quemadas.
  • F-statistic: 341.1 y Prob (F-statistic): 1.31e-41 → p-valor muy pequeño → el modelo sí tiene sentido.
  • AIC y BIC: mucho menores que el ejemplo anterior → modelo más eficiente.

🔢 Bloque 2: Coeficientes

  • Intercept (38.88): el valor base si el pulso fuera 0 (no muy relevante aquí).
  • Coef. de Average_Pulse = 4.63 → Esto quiere decir que por cada aumento de 1 en el pulso promedio, se queman 4.63 calorías más.
  • P>|t| para Average_Pulse es 0.000, lo mas bajo → ¡muy significativo! si es menor de 0.05, es importante.

🧪 Bloque 3: Diagnóstico

  • Omnibus y JB → algo de asimetría y curtosis, pero aceptable.
  • Durbin-Watson = 2.123 → no hay autocorrelación grave.
  • Cond. No. = 1070 → advertencia leve sobre multicolinealidad (pero solo hay una variable, así que no es un problema aquí).

📌 Conclusión:

Este es un ejemplo de modelo bueno. Tiene:

  • Relación fuerte entre las variables.
  • Coeficientes significativos.
  • Diagnósticos aceptables.
Esta entrada está licenciada bajo CC BY 4.0 por el autor.