¿Qué es el R cuadrado ajustado?

El R cuadrado ajustado es una versión modificada de R cuadrado que tiene en cuenta los predictores que no son significativos en un modelo de regresión. En otras palabras, el R cuadrado ajustado muestra si agregar predictores adicionales mejora un modelo de regresión o no. Para comprender el R cuadrado ajustado, se requiere un conocimiento de R cuadrado.

Resumen:

  • El R cuadrado ajustado es una versión modificada de R cuadrado que se ajusta a los predictores que no son significativos en un modelo de regresión.
  • En comparación con un modelo con variables de entrada adicionales, un R-cuadrado ajustado más bajo indica que las variables de entrada adicionales no agregan valor al modelo.
  • En comparación con un modelo con variables de entrada adicionales, un R-cuadrado ajustado más alto indica que las variables de entrada adicionales están agregando valor al modelo.

¿Qué es el R-cuadrado?

El R cuadrado, también llamado coeficiente de determinación Coeficiente de determinación Un coeficiente de determinación (R² o r cuadrado) es una medida estadística en un modelo de regresión que determina la proporción de varianza en el dependiente, se utiliza para explicar el grado de qué variables de entrada (variables predictoras) explican la variación de las variables de salida (variables predichas). Va de 0 a 1. Por ejemplo, si el R-cuadrado es 0,9, indica que el 90% de la variación en las variables de salida se explica por las variables de entrada. En términos generales, un R-cuadrado más alto indica un mejor ajuste para el modelo. Considere el siguiente diagrama:

R cuadrado ajustado

La línea azul se refiere a la línea de mejor ajuste y muestra la relación entre las variables. La línea se calcula mediante análisis de regresión Análisis de regresión El análisis de regresión es un conjunto de métodos estadísticos que se utilizan para estimar las relaciones entre una variable dependiente y una o más variables independientes. Puede utilizarse para evaluar la fuerza de la relación entre variables y para modelar la relación futura entre ellas. y se traza donde se minimizan las distancias verticales (líneas de puntos azules) de los puntos amarillos a la línea de mejor ajuste.

Los puntos amarillos se refieren al gráfico de las variables de entrada y salida. La variable de entrada se traza en el eje x, mientras que la variable de salida se traza en el eje y. Por ejemplo, el gráfico anterior consta del siguiente conjunto de datos:

R-cuadrado ajustado: datos del gráfico

Las líneas de puntos azules se refieren a la distancia del gráfico de las variables de entrada y salida desde la línea de mejor ajuste. La R-cuadrada se deriva de la distancia de todos los puntos amarillos desde la línea de mejor ajuste (la línea azul). Por ejemplo, el siguiente diagrama ilustraría un R cuadrado de 1:

R cuadrado 1

Problemas con el R-cuadrado

R-cuadrado viene con un problema inherente: las variables de entrada adicionales harán que el R-cuadrado permanezca igual o aumente (esto se debe a cómo se calcula matemáticamente el R-cuadrado). Por lo tanto, incluso si las variables de entrada adicionales no muestran relación con las variables de salida, el R cuadrado aumentará. A continuación se proporciona un ejemplo que explica tal caso.

Comprender el R-cuadrado ajustado

Esencialmente, la R-cuadrada ajustada analiza si las variables de entrada adicionales están contribuyendo al modelo. Considere un ejemplo con datos recopilados por el propietario de una pizza, como se muestra a continuación:

Data de muestra

Suponga que el dueño de la pizza ejecuta dos regresiones:

Regresión 1: Precio de la masa (variable de entrada), Precio de la pizza (variable de salida)

La regresión 1 produce un R cuadrado de 0,9557 y un R cuadrado ajustado de 0,9493.

Regresión 2: temperatura (variable de entrada 1), precio de la masa (variable de entrada 2), precio de la pizza (variable de salida)

La regresión 2 produce un R cuadrado de 0,9573 y un R cuadrado ajustado de 0,9431.

Aunque la temperatura no debería ejercer ningún poder predictivo sobre el precio de una pizza, el R cuadrado aumentó de 0.9557 (Regresión 1) a 0.9573 (Regresión 2). Una persona puede creer que la Regresión 2 tiene un mayor poder predictivo ya que el R cuadrado es mayor. Aunque la variable de entrada de temperatura es inútil para predecir el precio de una pizza, aumentó el R-cuadrado. Aquí, entra el R-cuadrado ajustado.

El R-cuadrado ajustado analiza si las variables de entrada adicionales están contribuyendo al modelo. El R cuadrado ajustado en la Regresión 1 fue 0,9493 en comparación con el R cuadrado ajustado en la Regresión 2 de 0,9493. Por lo tanto, la R-cuadrada ajustada puede identificar que la variable de entrada de temperatura no es útil para explicar la variable de salida (el precio de una pizza). En tal caso, el R-cuadrado ajustado indicaría al creador del modelo que use Regresión 1 en lugar de Regresión 2.

Ejemplo de R-cuadrado ajustado

Considere dos modelos:

  • El modelo 1 usa las variables de entrada X1, X2 y X3 para predecir Y1.
  • El modelo 2 usa las variables de entrada X1 y X2 para predecir Y1.

¿Qué modelo debería utilizarse? A continuación, se proporciona información sobre ambos modelos:

Ejemplo

Al comparar el R-cuadrado entre el Modelo 1 y el Modelo 2, el R-cuadrado predice que el Modelo 1 es un mejor modelo ya que tiene un mayor poder explicativo (0.5923 en el Modelo 1 frente a 0.5612 en el Modelo 2).

Al comparar el R cuadrado entre el Modelo 1 y el Modelo 2, el R cuadrado ajustado predice que la variable de entrada X3 contribuye a explicar la variable de salida Y1 (0,4231 en el Modelo 1 frente a 0,3512 en el Modelo 2).

Como tal, se debe utilizar el Modelo 1, ya que la variable de entrada adicional X3 contribuye a explicar la variable de salida Y1.

Recursos adicionales

Finance ofrece la certificación FMVA® de Analista de valoración y modelado financiero (FMVA) ™ Únase a más de 350,600 estudiantes que trabajan para empresas como Amazon, JP Morgan y el programa de certificación Ferrari para aquellos que buscan llevar sus carreras al siguiente nivel. Para seguir aprendiendo y avanzando en su carrera, los siguientes recursos financieros serán útiles:

  • Conceptos básicos de estadística para finanzas Conceptos básicos de estadística para finanzas Una comprensión sólida de las estadísticas es de vital importancia para ayudarnos a comprender mejor las finanzas. Además, los conceptos estadísticos pueden ayudar a los inversores a controlar
  • Método alto-bajo versus análisis de regresión Método alto-bajo versus análisis de regresión El método alto-bajo y el análisis de regresión son los dos métodos principales de estimación de costos utilizados para estimar las cantidades de costos fijos y variables. Por lo general, los gerentes deben dividir los costos mixtos en sus componentes fijos y variables para predecir y planificar el futuro.
  • Variable independiente Variable independiente Una variable independiente es una entrada, suposición o factor determinante que se cambia para evaluar su impacto sobre una variable dependiente (el resultado).
  • Tipos de análisis financiero Tipos de análisis financiero El análisis financiero implica el uso de datos financieros para evaluar el desempeño de una empresa y hacer recomendaciones sobre cómo puede mejorar en el futuro. Los analistas financieros principalmente realizan su trabajo en Excel, utilizando una hoja de cálculo para analizar datos históricos y hacer proyecciones Tipos de análisis financiero

Recomendado

Plantilla de depreciación lineal
¿Qué es Open Credit?
¿Qué es un libro de pedidos?