¿Qué es el factor de inflación de varianza (VIF)?

El factor de inflación de la varianza (VIF) mide la gravedad de la multicolinealidad en el análisis de regresión Análisis de regresión El análisis de regresión es un conjunto de métodos estadísticos utilizados para la estimación de relaciones entre una variable dependiente y una o más variables independientes. Puede utilizarse para evaluar la fuerza de la relación entre variables y para modelar la relación futura entre ellas. . Es un concepto estadístico que indica el aumento de la varianza de un coeficiente de regresión como resultado de la colinealidad.

Factor de inflación de la varianza

Resumen

  • El factor de inflación de la varianza (VIF) se utiliza para detectar la gravedad de la multicolinealidad en el análisis de regresión de mínimos cuadrados ordinarios (MCO).
  • La multicolinealidad infla la varianza y el error de tipo II. Hace que el coeficiente de una variable sea consistente pero poco confiable.
  • VIF mide el número de variaciones infladas causadas por la multicolinealidad.

Factor de inflación de varianza y multicolinealidad

En el análisis de regresión de mínimos cuadrados ordinarios (MCO), la multicolinealidad existe cuando dos o más de las variables independientes Variable independiente Una variable independiente es una entrada, suposición o impulsor que se cambia para evaluar su impacto en una variable dependiente (el resultado) . demostrar una relación lineal entre ellos. Por ejemplo, para analizar la relación del tamaño de las empresas y los ingresos con los precios de las acciones en un modelo de regresión, las capitalizaciones de mercado y los ingresos son las variables independientes.

Capitalización de mercado de una empresa Capitalización de mercado La capitalización de mercado (Market Cap) es el valor de mercado más reciente de las acciones en circulación de una empresa. Market Cap es igual al precio actual de la acción multiplicado por el número de acciones en circulación. La comunidad inversora a menudo utiliza el valor de capitalización de mercado para clasificar empresas y sus ingresos totales están fuertemente correlacionados. A medida que una empresa obtiene mayores ingresos, también crece en tamaño. Conduce a un problema de multicolinealidad en el análisis de regresión de OLS. Si las variables independientes en un modelo de regresión muestran una relación lineal perfectamente predecible, se conoce como multicolinealidad perfecta.

Con la multicolinealidad, los coeficientes de regresión siguen siendo consistentes pero ya no son fiables porque los errores estándar están inflados. Significa que el poder predictivo del modelo no se reduce, pero los coeficientes pueden no ser estadísticamente significativos con un error de Tipo II Error de Tipo II En la prueba de hipótesis estadísticas, un error de tipo II es una situación en la que una prueba de hipótesis no rechaza la hipótesis nula de que Es falso. En otra .

Por lo tanto, si los coeficientes de las variables no son individualmente significativos - no pueden rechazarse en la prueba t, respectivamente - pero pueden explicar conjuntamente la varianza de la variable dependiente con rechazo en la prueba F y un coeficiente de determinación alto (R2), podría existir multicolinealidad. Es uno de los métodos para detectar la multicolinealidad.

VIF es otra herramienta de uso común para detectar si existe multicolinealidad en un modelo de regresión. Mide cuánto se infla la varianza (o error estándar) del coeficiente de regresión estimado debido a la colinealidad.

Uso del factor de inflación de la varianza

El VIF se puede calcular mediante la siguiente fórmula:

Factor de inflación de la varianza - Fórmula

Donde R i 2 representa el coeficiente de determinación no ajustado para hacer una regresión de la i-ésima variable independiente sobre las restantes. El recíproco de VIF se conoce como tolerancia . Se puede utilizar VIF o tolerancia para detectar la multicolinealidad, según las preferencias personales.

Si R i 2 es igual a 0, la varianza de las restantes variables independientes no se puede predecir a partir de la i-ésima variable independiente. Por lo tanto, cuando VIF o tolerancia es igual a 1, la i-ésima variable independiente no se correlaciona con las restantes, lo que significa que no existe multicolinealidad en este modelo de regresión. En este caso, la varianza del i-ésimo coeficiente de regresión no está inflada.

Generalmente, un VIF por encima de 4 o una tolerancia por debajo de 0,25 indica que podría existir multicolinealidad y se requiere más investigación. Cuando el VIF es superior a 10 o la tolerancia es inferior a 0,1, existe una multicolinealidad significativa que debe corregirse.

Sin embargo, también hay situaciones en las que los VFI altos pueden ignorarse de manera segura sin sufrir multicolinealidad. Las siguientes son tres situaciones de este tipo:

1. Los VIF altos solo existen en las variables de control, pero no en las variables de interés. En este caso, las variables de interés no son colineales entre sí ni con las variables de control. Los coeficientes de regresión no se ven afectados.

2. Cuando los VIF altos se originan como consecuencia de la inclusión de los productos o potencias de otras variables, la multicolinealidad no genera impactos negativos. Por ejemplo, un modelo de regresión incluye tanto x como x2 como sus variables independientes.

3. Cuando una variable ficticia que representa más de dos categorías tiene un VIF alto, no necesariamente existe multicolinealidad. Las variables siempre tendrán VIF altos si hay una pequeña porción de casos en la categoría, independientemente de si las variables categóricas están correlacionadas con otras variables.

Corrección de multicolinealidad

Dado que la multicolinealidad infla la varianza de los coeficientes y provoca errores de tipo II, es fundamental detectarla y corregirla. Hay dos formas sencillas y de uso común para corregir la multicolinealidad, que se enumeran a continuación:

1. El primero es eliminar una (o más) de las variables altamente correlacionadas. Dado que la información proporcionada por las variables es redundante, el coeficiente de determinación no se verá muy afectado por la eliminación.

2. El segundo método consiste en utilizar el análisis de componentes principales (PCA) o la regresión de mínimos cuadrados parciales (PLS) en lugar de la regresión OLS. La regresión PLS puede reducir las variables a un conjunto más pequeño sin correlación entre ellas. En PCA, se crean nuevas variables no correlacionadas. Minimiza la pérdida de información y mejora la previsibilidad de un modelo.

Más recursos

Finance es el proveedor oficial de la certificación global Certified Banking & Credit Analyst (CBCA) ™ CBCA ™ La acreditación Certified Banking & Credit Analyst (CBCA) ™ es un estándar global para analistas de crédito que cubre finanzas, contabilidad, análisis de crédito, análisis de flujo de efectivo , modelos de convenios, reembolsos de préstamos y más. programa de certificación, diseñado para ayudar a cualquier persona a convertirse en un analista financiero de clase mundial. Para seguir avanzando en su carrera, los recursos adicionales a continuación serán útiles:

  • Conceptos básicos de estadística en finanzas Conceptos básicos de estadística para finanzas Una comprensión sólida de la estadística es de vital importancia para ayudarnos a comprender mejor las finanzas. Además, los conceptos estadísticos pueden ayudar a los inversores a controlar
  • Métodos de pronóstico Métodos de pronóstico Principales métodos de pronóstico. En este artículo, explicaremos cuatro tipos de métodos de pronóstico de ingresos que utilizan los analistas financieros para predecir ingresos futuros.
  • Regresión lineal múltiple Regresión lineal múltiple La regresión lineal múltiple se refiere a una técnica estadística utilizada para predecir el resultado de una variable dependiente basada en el valor de variables independientes
  • Variable aleatoria Variable aleatoria Una variable aleatoria (variable estocástica) es un tipo de variable en estadística cuyos posibles valores dependen de los resultados de un determinado fenómeno aleatorio

Recomendado

¿Se cerró Crackstreams?
2022
¿Es seguro el centro de comando de MC?
2022
¿Está Taliesin dejando un papel crítico?
2022