¿Qué es LASSO?

LASSO, abreviatura de Operador de Selección y Contracción Mínima Absoluta, es una fórmula estadística cuyo propósito principal es la selección de características y la regularización de modelos de datos. El método fue introducido por primera vez en 1996 por el profesor de estadística Robert Tibshirani. LASSO introduce parámetros a la suma de un modelo, dándole un límite superior que actúa como una restricción para que la suma incluya parámetros absolutos dentro de un rango permitido.

lazo

El método LASSO regulariza los parámetros del modelo reduciendo los coeficientes de regresión, reduciendo algunos de ellos a cero. La fase de selección de características ocurre después de la contracción, donde se selecciona cada valor distinto de cero para ser utilizado en el modelo. Este método es importante para minimizar los errores de predicción que son comunes en los modelos estadísticos Análisis cuantitativo El análisis cuantitativo es el proceso de recopilar y evaluar datos medibles y verificables como ingresos, participación de mercado y salarios para comprender el comportamiento y el desempeño de una empresa. negocio. En la era de la tecnología de datos, el análisis cuantitativo se considera el enfoque preferido para tomar decisiones informadas. .

LASSO ofrece modelos con alta precisión de predicción. La precisión aumenta ya que el método incluye la reducción de coeficientes, lo que a cambio reduce la varianza y minimiza el sesgo. Funciona mejor cuando el número de observaciones es bajo y el número de características es alto. Se basa en gran medida en el parámetro λ, que es el factor que controla la contracción. Cuanto más grande se vuelve λ, más coeficientes se ven obligados a ser cero.

Cuando λ es igual a cero, entonces el modelo se convierte en la regresión de mínimos cuadrados ordinarios. En consecuencia, cuando λ aumenta, la varianza disminuye significativamente y el sesgo en el resultado también aumenta. Lasso también es una herramienta útil para eliminar todas las variables que son irrelevantes y que no están relacionadas con la variable de respuesta.

LASSO en modelos estadísticos lineales

Un modelo estadístico es una representación matemática de la vida real de un problema. El modelo debe expresar el problema lo más cerca posible del mundo real y al mismo tiempo hacerlo simple y fácil de entender. Un modelo se compone de variables explicativas y de respuesta.

La variable explicativa es una variable independiente que queda a criterio del investigador. Las variables independientes son las entradas en el modelo que el investigador puede medir para determinar su efecto sobre los resultados del modelo.

La variable de respuesta es una variable dependiente. Variable dependiente Una variable dependiente es aquella que cambiará dependiendo del valor de otra variable, llamada variable independiente. que forma el foco principal del experimento. Forma el resultado del experimento, que puede ser un único resultado en el caso de modelos univariados o, en el caso de modelos multivariados, resultados múltiples.

LASSO forma una parte integral del proceso de construcción del modelo, especialmente utilizando la selección de características. La fase de selección de características ayuda en la selección de variables explicativas, que son las variables independientes y, por lo tanto, las variables de entrada en el modelo.

Las variables de entrada son elementos importantes que determinan la salida del modelo y que ayudan en la medición de su efecto sobre las variables de respuesta. La elección de las variables correctas determina la precisión del modelo. La fase de selección de características del LASSO ayuda en la selección adecuada de las variables.

Estimación con LASSO

Los modelos estadísticos se basan en LASSO para una selección y regularización precisas de variables. En regresión lineal Análisis de regresión El análisis de regresión es un conjunto de métodos estadísticos que se utilizan para estimar las relaciones entre una variable dependiente y una o más variables independientes. Puede utilizarse para evaluar la fuerza de la relación entre variables y para modelar la relación futura entre ellas. , por ejemplo, LASSO introduce un límite superior para la suma de cuadrados, minimizando así los errores presentes en el modelo. El estimador LASSO depende del parámetro λ.

El parámetro λ controla la fuerza de la contracción, donde un aumento de λ da como resultado un aumento de la contracción. El límite superior de la suma de todos los coeficientes es inversamente proporcional al parámetro λ. Cuando el límite superior aumenta de valor, el parámetro λ disminuye. Cuando el límite superior disminuye, el parámetro λ aumenta simultáneamente.

A medida que el límite superior aumenta hacia el infinito, el parámetro λ se acerca a cero, por lo que el experimento se convierte en Mínimos Cuadrados Ordinarios, donde el parámetro λ es siempre igual a cero. Cuando los coeficientes del límite superior se acercan a cero, el valor del parámetro λ aumenta hacia el infinito.

LASSO Geometría

LASSO forma una forma de diamante en el gráfico para su región de restricción, como se muestra en la imagen siguiente. La forma de diamante incluye esquinas, a diferencia de la forma circular formada por regresión de crestas. La proximidad del primer punto a la esquina muestra que el modelo viene con un coeficiente, que es igual a cero.

La región de restricciones de regresión de cresta forma una forma circular que no incluye esquinas similar a la formada por la región de restricciones LASSO cuando se traza. Por tanto, los coeficientes de regresión de la cresta no pueden ser iguales a cero.

LASSO ponderado

LASSO ponderado es el resultado de un investigador que penaliza los coeficientes de regresión de forma aislada. Esto significa que en lugar de penalizar un parámetro común λ a todos los coeficientes, los coeficientes se penalizan individualmente, utilizando diferentes parámetros.

Los pesos se pueden determinar mediante el uso de un algoritmo LASSO para asignar pesos de forma adecuada para un modelado preciso. Una ponderación similar de los coeficientes de regresión es el LASSO cooperativo, donde los coeficientes se penalizan en grupos que se consideran similares.

Recursos adicionales

Finance es el proveedor oficial de Certified Banking & Credit Analyst (CBCA) ™ Certificación CBCA ™ La acreditación Certified Banking & Credit Analyst (CBCA) ™ es un estándar global para analistas de crédito que cubre finanzas, contabilidad, análisis de crédito, análisis de flujo de efectivo, modelos de convenios, pagos de préstamos y más. programa de certificación, diseñado para transformar a cualquier persona en un analista financiero de clase mundial.

Para seguir aprendiendo y desarrollando su conocimiento del análisis financiero, recomendamos encarecidamente los recursos financieros adicionales a continuación:

  • Métodos de pronóstico Métodos de pronóstico Principales métodos de pronóstico. En este artículo, explicaremos cuatro tipos de métodos de pronóstico de ingresos que utilizan los analistas financieros para predecir ingresos futuros.
  • Variable independiente Variable independiente Una variable independiente es una entrada, suposición o factor determinante que se cambia para evaluar su impacto sobre una variable dependiente (el resultado).
  • Múltiple de regresión lineal Regresión lineal múltiple La regresión lineal múltiple se refiere a una técnica estadística utilizada para predecir el resultado de una variable dependiente en función del valor de las variables independientes
  • Análisis de escenarios Análisis de escenarios El análisis de escenarios es una técnica utilizada para analizar decisiones especulando varios resultados posibles en inversiones financieras. En modelos financieros, este

Recomendado

¿Qué es el análisis estratégico?
¿Qué es un Price Taker?
¿Qué es la gestión de operaciones?