Red de conocimientos sobre prescripción popular - Cuidado de la salud en otoño - Notas sobre Ecología Cuantitativa||Análisis de Redundancia (RDA)

Notas sobre Ecología Cuantitativa||Análisis de Redundancia (RDA)

En la última sección de "Notas de ecología cuantitativa||Descripción general del análisis de redundancia (RDA)", revisamos el proceso de cálculo de RDA. Ya sea que tengamos un conocimiento profundo de este proceso o no, espero que sepa que RDA es un análisis PCA de la matriz de valores ajustados de una regresión lineal múltiple entre la matriz de variables de respuesta y las variables explicativas. En esta sección, veremos específicamente un caso de análisis de RDA para comprender los parámetros y la interpretación de los resultados.

Vegan Pack tiene dos modos diferentes para ejecutar RDA. El primero es el modo simple, que ingresa el objeto de matriz de datos directamente en la función rda(), separado por comas:

Entre ellos se encuentran la matriz de variables de respuesta, la matriz de variables explicativas y la covarianza requerida para algunos análisis de RDA. matriz.

Esta fórmula tiene una desventaja: no puede tener variables factoriales (variables cualitativas). Si existen variables factoriales, se recomienda utilizar el segundo modo:

donde está la matriz de la variable respuesta. La matriz de variables explicativas incluye la variable cuantitativa (var1), la variable factorial (factorA) y el término de interacción entre la variable 2 y la variable 3, y la covariable (var4) se coloca en la condición (). Todos los datos utilizados se colocan en el marco de datos XWdata.

Esta fórmula es la misma que la función lm() y otras funciones de regresión. El lado izquierdo es la variable de respuesta y el lado derecho es la variable explicativa.

Extracto del resultado de RDA:

Fórmula de RDA:

Partición de varianza: la varianza total se divide en dos partes: varianza restringida y varianza no restringida. La parte restringida representa la parte de la varianza total de la matriz de variables de respuesta que puede explicarse por las variables explicativas. Si se expresa en una escala, su valor equivale al de la regresión múltiple. En RDA, este valor de proporción explicado también se denomina estadística de redundancia binaria. Sin embargo, la RDA no corregida similar a la regresión múltiple está sesgada y necesita correcciones adicionales.

Valores propios y su contribución a la varianza: Actualmente, este análisis RDA ha producido 12 ejes canónicos (las raíces características están representadas por RDA 1 ~ RDA 12) y 16 ejes no restringidos (las raíces características están representadas por PC 1 ~ PC 65438 representa). Los resultados de salida no solo incluyen las raíces características de cada eje, sino que también brindan la tasa de explicación de la varianza acumulada (eje restringido) o el eje de rumbo (eje no restringido). El valor acumulado final debe ser de 1,12 ejes canónicos, que también representa la porción de la varianza total de la variable de respuesta que puede explicarse por las variables explicativas.

La diferencia importante entre las dos raíces características es que la raíz característica canónica RDAx es la parte de la varianza total de la variable de respuesta que puede ser explicada por las variables explicativas, mientras que la raíz característica residual RCx es la parte de la varianza total de la variable de respuesta que puede explicarse por la parte del eje residual no tiene nada que ver con la RDA.

El valor propio restringido acumulativo representa la proporción acumulada de varianza que se puede explicar en el eje canónico de este eje y todos los ejes anteriores a toda la varianza explicada.

En gráficos de segundo y tercer orden de puntuaciones de especies, las coordenadas de vértice de las flechas representan las variables de respuesta. Al igual que PCA, las coordenadas dependen de la escala elegida.

Suma ponderada de puntuaciones de especies (puntuación de sitio (suma ponderada de puntuaciones de categorías)): coordenadas de muestra obtenidas mediante cálculo utilizando la matriz de variables de respuesta.

Restricción de sitio de restricción de cuadrante (combinación lineal de variables de restricción): Las coordenadas de cuadrante calculadas utilizando la matriz de variables explicativas son las coordenadas de cuadrante ajustadas.

Puntuaciones de biplot para variables restringidas: las coordenadas de las flechas de las variables explicativas en el gráfico de clasificación se obtienen siguiendo el siguiente procedimiento: ejecutando un análisis de correlación entre las variables explicativas y las coordenadas del cuadrante ajustado, y luego combinando todas Los coeficientes de correlación se convierten en coordenadas en el biplot. Todas las variables, incluidos los puertos de factor de nivel, pueden tener sus propias coordenadas. Es más apropiado utilizar el centroide de cada factor para representar las coordenadas de la variable del factor en el eje de clasificación.

Centroide de restricción del factor: Las coordenadas del punto centroide de cada capa de la variable del factor, es decir, el centroide del cuadrado de muestra marcado uno para cada capa.

En la función rda(), los coeficientes característicos canónicos que interesan a todos (es decir, el coeficiente de regresión entre cada variable explicativa y cada eje canónico) se pueden obtener a través de la función coef():

Rectificación

Ahora dibuje el diagrama de clasificación de RDA.

Si hay tres entidades en un gráfico de ordenación: cuadrante, variable de respuesta y variable explicativa, el gráfico de ordenación se denomina gráfico triple. Para distinguir entre variables de respuesta y explicativas, las variables explicativas cuantitativas se representan mediante flechas y las variables de respuesta se representan mediante líneas sin flechas.

La linealidad de cada variable se puede medir mediante el factor de inflación de varianza (VIF) de la variable. VIF es una medida del índice de inflación de la varianza del coeficiente de regresión de la variable causada por la linealidad. Si el valor VIF excede 20, significa * * * que la linealidad es muy grave. De hecho, si el VIF excede 10, es posible que tengas que lidiar con problemas de linealidad.