Derivación de la fórmula de covarianza
La definición de covarianza, EX es la expectativa matemática de la variable aleatoria x. De manera similar, EXY es la expectativa matemática de XY, que es más problemática. Se recomienda consultar la teoría de probabilidad CoV (x, y) = exy-ex * ey.
La definición de covarianza, EX es la expectativa matemática de la variable aleatoria x, EXY es la expectativa matemática de XY, que es más problemática. Te sugiero que eches un vistazo a la teoría de la probabilidad.
Por ejemplo:
Xi 1.1.93
Yi 5.0 10.4 14.6
e(X)=(1.1+1.9+3 ) /3 = 2
e(Y)=(5,10,4+14,6)/3 = 10
e(XY)=(1,1×5,1,9×10,4+3 × 14,6)/3 = 23,02
Cov(X,Y)= E(XY)-E(X)E(Y)= 23,02-2×10 = 3,02
En Además, también podemos calcular: d(x)= e(x^2)-e^2(x)=(1.1.2+1.9^2+3^2)/3-4 = 4.60-4 = 0.
d(y)=e(y^2)-e^2(y)=(5^2+10,4^2+14,6^2)/3-100=15,44σy = 3,93 p>
Coeficiente de correlación entre x e y:
r(X,Y)=Cov(X,Y)/(σXσY)= 3,02/(0,77×3,93)= 0,9979
¡Muestra que la correlación entre xey de este conjunto de datos es muy buena!
Datos ampliados:
La covarianza se utiliza en teoría de probabilidad y estadística para medir el error total de dos variables. La varianza es un caso especial de covarianza, que ocurre cuando dos variables son iguales.
La covarianza representa el error total de dos variables, a diferencia de la varianza del error de una sola variable. Si las tendencias de dos variables son consistentes, es decir, una de ellas es mayor que la expectativa y la otra es mayor que la expectativa, entonces la covarianza entre las dos variables es positiva.
Si dos variables tienen tendencias opuestas, es decir, una es mayor que su valor esperado y la otra es menor que su valor esperado, la covarianza entre las dos variables es negativa.
Si las dos variables aleatorias X e Y son independientes entre sí, entonces E[(X-E(X))(Y-E(Y))]=0, por lo que si la expectativa matemática anterior no es cero, entonces X e Y no son independientes entre sí, es decir, existe una cierta relación entre ellos.
Existe la siguiente relación entre covarianza y varianza:
D(X+Y)=D(X)+D(Y)+2Cov(X,Y)
D(X-Y)=D(X)+D(Y)-2Cov(X,Y)
La covarianza y el valor esperado tienen la siguiente relación:
Cov( X , Y)=E(XY)-E(X)E(Y).
Atributos de covarianza:
(1)Cov(X,Y)=Cov(Y , X);
(2) Cov (a X2, Y)=Cov(X1, Y)+Cov(X2, Y).
Se puede ver en la definición. de covarianza que Cov(X, X)=D(X), Cov(Y ,Y)=D(Y).
Al ser una cantidad que describe el grado de correlación entre X e Y, la covarianza juega un papel determinado en una misma dimensión física, pero las mismas dos cantidades adoptan dimensiones diferentes, haciendo que su covarianza numérica marque una gran diferencia. Para ello se introducen los siguientes conceptos:
Definición
Se denomina coeficiente de correlación de Pearson de las variables aleatorias X e Y.
La varianza es una Función de la teoría de la probabilidad y la estadística. La varianza es una medida de la dispersión de una variable aleatoria o de un conjunto de datos. La varianza en la teoría de la probabilidad mide la desviación de una variable aleatoria de su expectativa matemática (es decir, su media). La varianza (varianza de la muestra) en estadística es el promedio de las diferencias al cuadrado entre cada valor de muestra y la media de todos los valores de muestra. En muchos problemas prácticos, es de gran importancia estudiar la varianza, es decir, la desviación.
La varianza es una medida de la diferencia entre los datos de origen y el valor esperado.
La varianza tiene diferentes definiciones y fórmulas en descripciones estadísticas y distribuciones de probabilidad.
En la descripción estadística, la varianza se utiliza para calcular la diferencia entre cada variable (observación) y la media poblacional. Para evitar el fenómeno de que la desviación media de la suma de cuadrados sea cero y la desviación media de la suma de cuadrados se vea afectada por el tamaño de la muestra, se utiliza la desviación media de la suma media de cuadrados para describir el grado de variación de la variable. Fórmula de cálculo de la varianza poblacional:
¿Para la varianza poblacional? es una variable. ¿La población es promedio? es el número total de casos.
En el trabajo práctico, cuando la media poblacional es difícil de obtener, se utilizan estadísticas muestrales en lugar de parámetros poblacionales. Después de la corrección, la fórmula para calcular la varianza muestral es: s 2 = ∑ (x-?)^2 / (n-1)
S 2 es la varianza muestral y x es la variable. es la media muestral, n es el número de muestras.
Materiales de referencia:
Enciclopedia Baidu-Covarianza