Guías de finanzas

¿Qué es la regresión lineal múltiple?

La regresión lineal múltiple se refiere a una técnica estadística que se utiliza para predecir el resultado de una variable en función del valor de dos o más variables. A veces se lo conoce simplemente como regresión múltiple y es una extensión de la regresión lineal. La variable que queremos predecir se conoce como variable dependiente, mientras que las variables que usamos para predecir el valor de la variable dependiente Variable dependiente Una variable dependiente es aquella que cambiará dependiendo del valor de otra variable, llamada variable independiente. se conocen como variables independientes o explicativas.

Figura 1: Predicciones del modelo de regresión lineal múltiple para observaciones individuales (Fuente)

Resumen

La regresión lineal múltiple se refiere a una técnica estadística que utiliza dos o más variables independientes para predecir el resultado de una variable dependiente.
La técnica permite a los analistas determinar la variación del modelo y la contribución relativa de cada variable independiente en la varianza total.
La regresión múltiple puede tomar dos formas, es decir, regresión lineal y regresión no lineal.

Fórmula de regresión lineal múltiple

Dónde:

yi es la variable dependiente o predicha
β0 es la intersección con el eje y, es decir, el valor de y cuando tanto xi como x2 son 0.
β1 y β2 son los coeficientes de regresión que representan el cambio en y relativo a un cambio de una unidad en xi1 y xi2 , respectivamente.
βp es el coeficiente de pendiente para cada variable independiente
ϵ es el término de error aleatorio (residual) del modelo.

Comprensión de la regresión lineal múltiple

La regresión lineal simple permite a los estadísticos predecir el valor de una variable utilizando la información disponible sobre otra variable. La regresión lineal intenta establecer la relación entre las dos variables a lo largo de una línea recta.

La regresión múltiple es un tipo de regresión donde la variable dependiente muestra una relación lineal con dos o más variables independientes. También puede ser no lineal , donde las variables dependientes e independientes Variable independiente Una variable independiente es una entrada, suposición o factor que cambia para evaluar su impacto en una variable dependiente (el resultado). no sigas una línea recta.

Tanto la regresión lineal como la no lineal realizan un seguimiento de una respuesta particular utilizando dos o más variables gráficamente. Sin embargo, la regresión no lineal suele ser difícil de ejecutar, ya que se crea a partir de supuestos derivados de prueba y error.

Supuestos de regresión lineal múltiple

La regresión lineal múltiple se basa en los siguientes supuestos:

1. Una relación lineal entre las variables dependientes e independientes

El primer supuesto de la regresión lineal múltiple es que existe una relación lineal entre la variable dependiente y cada una de las variables independientes. La mejor manera de verificar las relaciones lineales es crear diagramas de dispersión y luego inspeccionar visualmente los diagramas de dispersión para determinar la linealidad. Si la relación que se muestra en la gráfica de dispersión no es lineal, entonces el analista deberá ejecutar una regresión no lineal o transformar los datos utilizando software estadístico, como SPSS.

2. Las variables independientes no están muy correlacionadas entre sí.

Los datos no deben mostrar multicolinealidad, que ocurre cuando las variables independientes (variables explicativas) están altamente correlacionadas entre sí. Cuando las variables independientes muestran multicolinealidad, habrá problemas para determinar la variable específica que contribuye a la varianza en la variable dependiente. El mejor método para probar el supuesto es el método del factor de inflación de la varianza.

3. La varianza de los residuos es constante

La regresión lineal múltiple supone que la cantidad de error en los residuales es similar en cada punto del modelo lineal. Este escenario se conoce como homocedasticidad. Al analizar los datos, el analista debe graficar los residuos estandarizados contra los valores predichos para determinar si los puntos se distribuyen equitativamente entre todos los valores de las variables independientes. Para probar la suposición, los datos se pueden trazar en un diagrama de dispersión o mediante software estadístico para producir un diagrama de dispersión que incluya el modelo completo.

4. Independencia de observación

El modelo asume que las observaciones deben ser independientes entre sí. En pocas palabras, el modelo supone que los valores de los residuos son independientes. Para probar este supuesto, utilizamos la estadística de Durbin Watson.

La prueba mostrará valores de 0 a 4, donde un valor de 0 a 2 muestra autocorrelación positiva y los valores de 2 a 4 muestran autocorrelación negativa. El punto medio, es decir, un valor de 2, muestra que no hay autocorrelación.

5. Normalidad multivariante

La normalidad multivariante ocurre cuando los residuos se distribuyen normalmente. Para probar este supuesto, observe cómo se distribuyen los valores de los residuos. También se puede probar utilizando dos métodos principales, es decir, un histograma con una curva normal superpuesta o el método de gráfico de probabilidad normal.

Más recursos

Finance ofrece la certificación Certified Banking & Credit Analyst (CBCA) ™ CBCA ™ La acreditación Certified Banking & Credit Analyst (CBCA) ™ es un estándar global para analistas de crédito que cubre finanzas, contabilidad, análisis crediticio, análisis de flujo de efectivo, modelado de convenios, préstamos reembolsos y más. programa de certificación para aquellos que buscan llevar sus carreras al siguiente nivel. Para seguir aprendiendo y desarrollando su base de conocimientos, explore los recursos financieros relevantes adicionales a continuación:

Métodos de pronóstico Métodos de pronóstico Principales métodos de pronóstico. En este artículo, explicaremos cuatro tipos de métodos de pronóstico de ingresos que utilizan los analistas financieros para predecir ingresos futuros.
Distribución de Poisson Distribución de Poisson La distribución de Poisson es una herramienta utilizada en las estadísticas de la teoría de probabilidad para predecir la cantidad de variación de una tasa promedio conocida de ocurrencia, dentro de
Variable aleatoria Variable aleatoria Una variable aleatoria (variable estocástica) es un tipo de variable en estadística cuyos posibles valores dependen de los resultados de un determinado fenómeno aleatorio
Análisis de regresión Análisis de regresión El análisis de regresión es un conjunto de métodos estadísticos utilizados para la estimación de relaciones entre una variable dependiente y una o más variables independientes. Puede utilizarse para evaluar la fuerza de la relación entre variables y para modelar la relación futura entre ellas.