Calcule la matriz de varianza-covarianza de muestra usando datos en Excel
2. La varianza solo se puede utilizar para explicar la dispersión de datos paralela al eje del espacio de características.
3. Para estos datos, se puede calcular la varianza en la dirección X y la varianza en la dirección Y. Pero la transmisión horizontal y vertical de datos no puede explicar la obvia relación diagonal. Esta correlación se puede captar extendiendo el concepto de varianza a lo que se conoce como "covarianza" de los datos.
4. Si la matriz de covarianza de los datos es diagonal, de modo que la covarianza es cero, entonces esto significa que la varianza debe ser igual al valor propio λ. Como se muestra en la figura, los vectores propios están representados en verde y magenta, y los valores propios son claramente iguales a los componentes de varianza de la matriz de covarianza. ?
5. Sin embargo, si la matriz de covarianza no es diagonal, de modo que la covarianza no es cero, entonces la situación es un poco más complicada. El valor propio todavía representa la varianza en la dirección de propagación máxima de los datos, y el componente de varianza de la matriz de covarianza todavía representa la varianza en las direcciones de los ejes X e Y. Sin embargo, debido a que los datos no están alineados con los ejes. ?