¿Qué es una medida de variación general?

1. Indicadores para medir el grado general de variación

1. Rango, = valor máximo - valor mínimo, se ve fácilmente afectado por el contenido de la muestra y es muy inestable. No debe utilizarse cuando el tamaño de la muestra es muy diferente

2. Rango intercuartil (Q), adecuado para variables con varias distribuciones. Q=P75-P25, cuanto mayor sea Q, mayor será el grado de variación. Puede describir el grado de dispersión de datos sin valores definidos al principio y al final de la distribución.

3 Varianza, adecuada para distribución simétrica, especialmente variables que obedecen a distribución normal.

4. Desviación estándar, adecuada para distribución simétrica, especialmente variables que obedecen a distribución normal.

5. Coeficiente de variación, utilizado a menudo para comparar el grado de variación entre variables cuando las dimensiones (relación funcional) son diferentes. o las medias son muy diferentes

Distribución normal: suele combinar la media aritmética y la desviación estándar. Cuanto menor sea la desviación estándar, mejor representa la media el valor de cada variable

Distribución sesgada: a menudo se combina la mediana con los cuartiles superior e inferior

Rango

.

El método más directo y simple es el valor máximo_valor mínimo (es decir, el rango) para evaluar la dispersión de un conjunto de datos. Este método es más común en la vida diaria. Por ejemplo, eliminar las puntuaciones más altas y más bajas en una competición es una aplicación específica muy pobre.

1. Rango Móvil (Moving Range)

La diferencia entre el valor máximo y el valor mínimo entre dos o más valores de muestra consecutivos. Esta diferencia se calcula de esta manera: Siempre que se produzca un. Se obtiene un punto de datos adicional, el nuevo punto se agrega a la muestra, el punto "más antiguo" en el tiempo se elimina y se calcula el rango asociado con este punto, de modo que el cálculo de cada rango se utiliza al menos un valor de punto para el cálculo del rango anterior. En términos generales, el rango móvil se usa para gráficos de control de un solo valor, y generalmente se usan dos puntos (puntos continuos) para calcular el rango móvil.

2. Suma de cuadrados de desviaciones de la media

Debido a la incontrolabilidad del error, no es científico juzgar un conjunto de datos por solo dos datos. Por eso la gente no usa el rango para juzgar en campos más exigentes. De hecho, la dispersión es el grado en que los datos se desvían de la media. Por lo tanto, sumar las diferencias entre los datos y la media (lo llamamos desviación de la media) puede reflejar un grado preciso de dispersión. Cuanto mayor es la suma, mayor es la dispersión.

Sin embargo, dado que el error aleatorio se distribuye normalmente, la desviación de la media puede ser positiva o negativa. Para una muestra grande, la suma algebraica de la desviación de la media es cero. Para evitar el problema de lo positivo y lo negativo, existen dos métodos en matemáticas: uno es tomar el valor absoluto, que a menudo se dice que es la suma de los valores absolutos de las desviaciones de la media. Para evitar problemas de signos, otro método más utilizado en matemáticas es el __ cuadrado, para que todos se conviertan en números no negativos. Por tanto, la suma de las desviaciones al cuadrado de la media se convierte en un indicador para evaluar la dispersión.

2. Varianza

Es el grado de dispersión al cambiar aleatoriamente un conjunto de datos en teoría de probabilidad y equilibrio de varianza estadística.

En teoría de la probabilidad, la varianza se utiliza para medir el grado de desviación entre una variación aleatoria y su expectativa matemática (es decir, la media). La varianza en estadística (varianza muestral) es la diferencia entre cada valor muestral. y el valor completo de la muestra. La media de los valores al cuadrado de la diferencia entre medias.