¿Qué son las estadísticas no paramétricas?

La estadística no paramétrica es un método que hace inferencias estadísticas sin tener en cuenta ninguna distribución subyacente. El método se ajusta a una distribución normal bajo ningún supuesto. Habitualmente, el enfoque utiliza datos que a menudo son ordinales Datos ordinales En estadística, los datos ordinales son el tipo de datos en los que los valores siguen un orden natural. Una de las características más notables de los datos ordinales es que se basan en clasificaciones más que en números.

Estadísticas no paramétricas

Las estadísticas no paramétricas se pueden contrastar con las estadísticas paramétricas. El último enfoque hace suposiciones explícitas sobre la distribución de los datos observados y estima los parámetros de la distribución utilizando los mismos datos.

Resumen

  • La estadística no paramétrica es un método que ignora cualquier distribución subyacente al hacer inferencias estadísticas.
  • Los métodos estadísticos no paramétricos tienen como objetivo descubrir la distribución subyacente desconocida de los datos observados, así como hacer una inferencia estadística en ausencia de la distribución subyacente.
  • Se aconseja a los investigadores que consideren las debilidades, fortalezas y peligros potenciales de las estadísticas no paramétricas.

Comprensión de las estadísticas no paramétricas

Considere los datos con parámetros desconocidos µ (media) y σ2 (varianza). Mientras que las estadísticas paramétricas asumen que los datos se extrajeron de una distribución normal Distribución normal La distribución normal también se conoce como distribución Gaussiana o Gauss. Este tipo de distribución es muy utilizado en ciencias naturales y sociales. El, una estadística no paramétrica no asume que los datos se distribuyen normalmente o son cuantitativos. En ese sentido, las estadísticas no paramétricas estimarían la forma de la distribución en sí, en lugar de estimar los µ y σ2 individuales.

Por otro lado, la estadística paramétrica emplearía la media muestral y la desviación estándar muestral para estimar los valores de µ y σ2, respectivamente. La estructura del modelo de las estadísticas no paramétricas se deduce de los datos observados, a diferencia de un priori especificado . El término no paramétrico en sí mismo implica que el número y la naturaleza de los parámetros son flexibles, y no que carezcan por completo de parámetros.

Tipos de estadísticas no paramétricas

Hay dos tipos principales de métodos estadísticos no paramétricos. El primer método busca descubrir la distribución subyacente desconocida de los datos observados, mientras que el segundo método intenta hacer una inferencia estadística sin tener en cuenta la distribución subyacente.

Histogramas y métodos de kernel Histograma Se utiliza un histograma para resumir datos discretos o continuos. En otras palabras, un histograma proporciona una interpretación visual de los datos numéricos al mostrar el número de puntos de datos que se encuentran dentro de un rango específico de valores (llamados "contenedores"). Un histograma es similar a un gráfico de barras verticales. Sin embargo, un histograma se usa comúnmente para estimar los valores de los parámetros en el primer enfoque. En contraste, el último método implica probar hipótesis sin los valores reales de los datos, sino más bien basándose en el orden de clasificación de los datos.

Las pruebas de estadística no paramétrica tienden a ser más fáciles de aplicar que las estadísticas paramétricas, dada la falta de suposición sobre los parámetros de población. Los procedimientos matemáticos estándar para la prueba de hipótesis no hacen suposiciones sobre las distribuciones de probabilidad, incluidas las pruebas t de distribución, las pruebas de signos y las inferencias de una sola población.

Por ejemplo, cuando se prueba la hipótesis de que "hay una diferencia en las medianas", las dos variables aleatorias, X e Y, definen dos distribuciones continuas entre donde se realiza la hipótesis y se extraen muestras pareadas. Además de tener aplicabilidad general, la prueba también carece del poder estadístico de otras pruebas, dado que funciona bajo algunos supuestos.

Ejemplos de estadísticas no paramétricas

Supongamos que un investigador está interesado en estimar el número de bebés que nacen con ictericia en el estado de California. Se puede realizar un análisis del conjunto de datos tomando una muestra de 5,000 bebés. Una estimación de toda la población de bebés con ictericia nacidos al año siguiente es la medida derivada.

Para un segundo caso, considere dos grupos de investigadores diferentes. Están interesados ​​en saber si el marketing general o el marketing comercial están asociados con la rapidez con la que una empresa gana posicionamiento de marca. Suponiendo que el tamaño de la muestra se elija al azar, su distribución con respecto a la rapidez con la que una empresa realiza un posicionamiento de marca. Se puede suponer que el objetivo del mercado es normal. Sin embargo, no se puede asumir que un experimento que mide los objetivos estratégicos de la empresa para abordar la dinámica del mercado (que también determina el posicionamiento de la marca) asuma una distribución normal.

La idea principal detrás del fenómeno es que los datos seleccionados al azar pueden contener factores como la dinámica del mercado. En el otro extremo, si entran en juego factores como el segmento de mercado y la competencia, es poco probable que los objetivos estratégicos de la empresa afecten al tamaño de la muestra. Este enfoque es eficaz cuando los datos carecen de una interpretación numérica clara.

Por ejemplo, las pruebas sobre si los clientes prefieren un producto en particular debido a su valor nutricional pueden incluir una clasificación de sus métricas como totalmente de acuerdo, de acuerdo, indiferente, en desacuerdo y totalmente en desacuerdo. En tal escenario, un método no paramétrico es útil.

Conclusiones clave

El uso de enfoques estadísticos no paramétricos en la investigación requiere la debida diligencia sobre sus debilidades, fortalezas y posibles dificultades. Es cierto que para la distribución de datos que tienen un exceso de curtosis o asimetría; Las pruebas no paramétricas basadas en rangos resultan ser más potentes que las pruebas paramétricas.

Aun así, no en todos los casos en los que, si no se cumplen los supuestos paramétricos, adoptamos estadísticas no paramétricas como métodos sustitutos debido al grado de confianza comparativamente bajo obtenido de las estadísticas anteriores.

Se agradecen las estadísticas no paramétricas porque se pueden aplicar con facilidad. Los datos se vuelven más aplicables a varias pruebas ya que los parámetros no son obligatorios. Más importante aún, las estadísticas se pueden utilizar en ausencia de información vital, como la media, la desviación estándar o el tamaño de la muestra. Las características hacen que las estadísticas no paramétricas tengan un ámbito de aplicación más amplio en comparación con las estadísticas paramétricas.

Recursos adicionales

Finance es el proveedor oficial de la certificación global Certified Banking & Credit Analyst (CBCA) ™ CBCA ™ La acreditación Certified Banking & Credit Analyst (CBCA) ™ es un estándar global para analistas de crédito que cubre finanzas, contabilidad, análisis de crédito, análisis de flujo de efectivo , modelos de convenios, reembolsos de préstamos y más. programa de certificación, diseñado para ayudar a cualquier persona a convertirse en un analista financiero de clase mundial. Para seguir avanzando en su carrera, los recursos financieros adicionales a continuación serán útiles:

  • Conceptos básicos de estadística en finanzas Conceptos básicos de estadística para finanzas Una comprensión sólida de la estadística es de vital importancia para ayudarnos a comprender mejor las finanzas. Además, los conceptos estadísticos pueden ayudar a los inversores a controlar
  • Prueba de hipótesis Prueba de hipótesis Prueba de hipótesis es un método de inferencia estadística. Se utiliza para probar si una declaración sobre un parámetro de población es correcta. Evaluación de la hipótesis
  • Datos nominales Datos nominales En estadística, los datos nominales (también conocidos como escala nominal) son un tipo de datos que se utilizan para etiquetar variables sin proporcionar ningún valor cuantitativo
  • Pruebas no paramétricas Pruebas no paramétricas En estadística, las pruebas no paramétricas son métodos de análisis estadístico que no requieren una distribución para cumplir con los supuestos requeridos para ser analizados

Recomendado

¿Qué es el análisis estratégico?
¿Qué es un Price Taker?
¿Qué es la gestión de operaciones?