¿Cuál es el coeficiente de determinación?

El coeficiente de determinación (R² o r-cuadrado) es una medida estadística en un modelo de regresión que determina la proporción de varianza en la variable dependiente que puede ser explicada por la variable independiente Variable independiente Una variable independiente es una entrada, suposición o impulsor que se cambia para evaluar su impacto en una variable dependiente (el resultado). . En otras palabras, el coeficiente de determinación nos dice qué tan bien se ajustan los datos al modelo (la bondad del ajuste).

Coeficiente de determinación

Aunque el coeficiente de determinación proporciona algunas ideas útiles sobre el modelo de regresión, no se debe confiar únicamente en la medida en la evaluación de un modelo estadístico. No revela información sobre la relación de causalidad entre las variables independientes y dependientes. Variable dependiente Una variable dependiente es aquella que cambiará dependiendo del valor de otra variable, llamada variable independiente. y no indica la corrección del modelo de regresión. Por lo tanto, el usuario siempre debe sacar conclusiones sobre el modelo analizando el coeficiente de determinación junto con otras variables en un modelo estadístico.

El coeficiente de determinación puede tomar cualquier valor entre 0 y 1. Además, la métrica estadística se expresa con frecuencia en porcentajes.

Interpretación del coeficiente de determinación (R²)

La interpretación más común del coeficiente de determinación es qué tan bien se ajusta el modelo de regresión a los datos observados. Por ejemplo, un coeficiente de determinación del 60% muestra que el 60% de los datos se ajustan al modelo de regresión. Generalmente, un coeficiente más alto indica un mejor ajuste para el modelo.

Sin embargo, no siempre se da el caso de que un r cuadrado alto sea bueno para el modelo de regresión. La calidad del coeficiente depende de varios factores, incluidas las unidades de medida de las variables, la naturaleza de las variables empleadas en el modelo y la transformación de datos aplicada. Por lo tanto, a veces, un coeficiente alto puede indicar problemas con el modelo de regresión.

Ninguna regla universal gobierna cómo incorporar el coeficiente de determinación en la evaluación de un modelo. El contexto en el que se basa el pronóstico o el experimento es extremadamente importante y, en diferentes escenarios, los conocimientos de la métrica estadística pueden variar.

Cálculo del coeficiente

Matemáticamente, el coeficiente de determinación se puede encontrar usando la siguiente fórmula:

Fórmula

Dónde:

  • Regresión SS : la suma de cuadrados debida a la regresión (suma de cuadrados explicada)
  • Total SS : la suma total de cuadrados

Aunque los términos “suma total de cuadrados” y “suma de cuadrados debido a la regresión” parecen confusos, el significado de las variables es sencillo.

La suma total de cuadrados mide la variación en los datos observados (datos utilizados en modelos de regresión). La suma de cuadrados debido a la regresión mide qué tan bien el modelo de regresión representa los datos que se utilizaron para el modelado.

Más recursos

Finance es el proveedor oficial de la certificación FMVA® de Analista de valoración y modelado financiero global (FMVA) ™ Únase a más de 350,600 estudiantes que trabajan para empresas como Amazon, JP Morgan y el programa de certificación de Ferrari, diseñado para ayudar a cualquiera a convertirse en un analista financiero de clase mundial . Para seguir aprendiendo y avanzando en su carrera, los recursos financieros adicionales a continuación serán útiles:

  • Conceptos básicos de estadística en finanzas Conceptos básicos de estadística para finanzas Una comprensión sólida de la estadística es de vital importancia para ayudarnos a comprender mejor las finanzas. Además, los conceptos estadísticos pueden ayudar a los inversores a controlar
  • Distribución binomial Distribución binomial La distribución binomial es una distribución de probabilidad común que modela la probabilidad de obtener uno de dos resultados bajo un número dado de parámetros
  • Teorema del límite central Teorema del límite central El teorema del límite central establece que la media muestral de una variable aleatoria asumirá una distribución casi normal o normal si el tamaño de la muestra es grande
  • Análisis de regresión Análisis de regresión El análisis de regresión es un conjunto de métodos estadísticos utilizados para la estimación de relaciones entre una variable dependiente y una o más variables independientes. Puede utilizarse para evaluar la fuerza de la relación entre variables y para modelar la relación futura entre ellas.

Recomendado

¿Qué es la tasa de rotación de empleados?
¿Qué es el presupuesto basado en actividades?
¿Qué es un entorno macro?