Red de conocimientos sobre prescripción popular - Recetas de medicina tradicional china - ¿Por qué decimos estimación del espectro del modelo ar y espectro de potencia de predicción lineal?

¿Por qué decimos estimación del espectro del modelo ar y espectro de potencia de predicción lineal?

3.3 Análisis de secuencia

3.3.1 Descripción general de la secuencia

1. Conceptos básicos

(1) Concepto general: dividir el valor observado de una determinada variable en el sistema. en intervalos Organizar en orden (con el mismo intervalo), mostrar y estudiar secuencias numéricas, como descubrir las características cambiantes y las tendencias de desarrollo de las cosas dentro de un período determinado, y resumir la influencia de varios elementos en una determinada variable del sistema.

(2) Esencia de la investigación: al procesar los datos de secuencia del objeto de predicción en sí, podemos obtener las características y leyes evolutivas de las cosas a lo largo del tiempo, predecir cosas que aún no se han desarrollado y estudiar la interdependencia entre cosas.

(3) Base de la suposición: el principio de inercia, es decir, la continuación de las predicciones condicionales de las cosas, no significa que haya algún tipo de información en los datos históricos, y la secuencia entre explicación y predicción aún no está disponible.

El principio de distancia (cuanto más cerca estén los datos, mayor será el impacto) es estacionalidad, tendencia, linealidad, diferencia numérica, etc.

(4) Importancia de la investigación: muchos datos económicos, financieros y comerciales son datos secuenciales.

La tecnología de evaluación de predicción entre secuencias está completa y los escenarios de predicción son claros.

Preste especial atención a la cantidad y calidad de los datos utilizados para predecir el objetivo, es decir, la frecuencia predicha de los grados entre secuencias.

2. Características cambiantes

(1) Tendencia: una variable muestra un período relativamente lento de ascenso y descenso continuo, permanece sin cambios y cambia con el tiempo o de forma automática. en magnitud.

(2) Periodicidad: Debido a influencias externas, ciertos elementos muestran un patrón alterno de picos y valles con cambios estacionales.

(3) Aleatoriedad: No conviertas arbitrariamente el todo en una ley estadística.

(4) Integralidad: los cambios reales son como la superposición o predicción combinada de varios cambios, y las mutaciones regulares están configuradas para reflejar los cambios cíclicos en las tendencias.

3. Identificación de características

Las características variables de las secuencias cognitivas facilitan la predicción y selección del sistema utilizando la misma predicción y selección.

(1) Aleatoriedad: Uniforme y regular las distribuciones pueden ajustarse a una determinada distribución estadística (use el histograma del diagrama de dispersión de variables y su distribución de estado incluida para probar la distribución de estado del servicio de números aleatorios).

(2) Estacionariedad: la función de autocorrelación de la secuencia oscila cerca de una línea horizontal fija, que es el número de estabilidad esperado de la diferencia.

La función de intervalo entre las funciones de autocorrelación de la serie está relacionada con el punto de partida, y su desempeño nominal refleja los cambios periódicos de la serie estacionaria.

El reconocimiento de características utiliza la función de autocorrelación ACF: ρ k = γ k/γ 0.

El orden γkytk es autocovarianza, ρ0=1, -1

El coeficiente de autocorrelación de la trayectoria estacionaria tiende a cero de alguna manera. El primero mide la correlación simple entre la secuencia anterior y la secuencia anterior, mientras que el primero controla la correlación entre la secuencia anterior y la secuencia anterior.

Es difícil que los modelos de predicción reales cumplan determinadas condiciones. Las secuencias de la economía real, las finanzas y los negocios son inestables y el procesamiento de datos es estable.

4. Tipos de predicción

(1) Predicción puntual: determine el intervalo de confianza de solo valores de predicción puntuales cuyos valores de predicción sean simples y produzcan directamente errores de predicción distintos de cero. .

(2) Predicción de intervalo: el intervalo de valores impredecibles se refiere al valor predicho de un punto del intervalo con una cierta probabilidad de que el valor real de la secuencia esperada caiga dentro del intervalo.

(3) Predicción de densidad: una distribución de probabilidad completa de una serie de valores impredecibles. Establecer intervalos de niveles de confianza basados ​​en predicciones de densidad requiere suposiciones adicionales e implica cálculos complejos.

5. Pasos básicos

(1) Análisis de las características de cambio de secuencia de datos

(2) Prueba de parámetros formales del modelo seleccionado

(3) Utilice modelos para predecir tendencias.

(4) Evaluar y predecir conexiones y modelos de reparación.

Secuencia interna aleatoria

La forma de cambio incierto de los datos de secuencia entre ciertas variables primas en el sistema se puede describir mediante una función definida intermedia, y se puede encontrar una secuencia aleatoria más adecuada usando métodos de probabilidad y estadística para reflejar aproximadamente su patrón cambiante (las variables independientes contienen directamente variables intermedias y elementos intermedios implícitos).

1. Modelo AR(p) autorregresivo

(r: nombre del modelo p: parámetros del modelo) (autoinfluencia, error de autoalmacenamiento, es decir, no considerado)

(1) Forma del modelo (cuanto más εt pueda ser 0: ε 0 significa que se ve afectado por la historia anterior de Y y sus números primos)

yt =φ1yt-1+φ2yt-2 +……+φpyt-p+ εt

Hipótesis: los cambios de yt están relacionados principalmente con datos históricos entre secuencias y sus números primos

εt están relacionados con yt secuencias históricas.

Símbolo de fórmula: el período entre etapas del modelo P se determina mediante parámetros experimentales.

El valor predicho antes de yt y el valor observado yt-1,..., yt- en el; misma secuencia y al mismo tiempo La relación lineal de p refleja la relación de retraso;

yt-1, yt-2,..., yt-p son iguales que la secuencia estacionaria;

Φ 1, Φ 2,... ., φP coeficiente autorregresivo indica que yt depende del grado, y la dependencia es una constante;

εt término de error de interferencia aleatoria tiene media 0, diferencia σ2, la secuencia de ruido blanco independiente generalmente se estima para especificar el modelo a obtener

(2) Condiciones de identificación

k & gtPφk=0 o φk obedece a la distribución asintótica N (0, 1 /n) y (|φk | >; 2/n1/2) número ≤ 4,5%, es decir, el tamaño del paso del coeficiente de correlación parcial φkp trunca el coeficiente de autocorrelación rk y atenúa gradualmente el modelo AR(p) de secuencia truncada.

En la práctica, la función ACF de la ruta AR es una disminución unilateral o una oscilación amortiguada, que se juzga mediante la función PACF (el coeficiente de autocorrelación de orden P es todo 0).

(3) Condiciones de estabilidad

Orden: |φ1 | < Segundo orden de 1: φ 1+φ 2 < 1, φ1-φ2 ​​​​& lt; | & lt;Cuanto mayor sea 1φ, mayor será la influencia de la onda de referencia.

(4) Importancia del modelo

Solo los valores de observación históricos de las variables de secuencia intermitente reflejan la influencia del objetivo de predicción de correlación. El modelo está restringido por la suposición de que el modelo. Las variables del modelo son independientes entre sí, por lo que eliminar las predicciones de regresión comunes es difícil debido a la selección de variables independientes y al énfasis en la linealidad.

2. Modelo de media móvil MA(q)

(1) Forma del modelo

yt =εt-θ1εt-1-θ2εt-2-……- θpεt-p

(2) El significado del modelo

El valor de predicción está representado por la combinación lineal de perturbación aleatoria o error de predicción en cada período

AR( p) Suponga que las condiciones satisfacen el formulario de consideración.

Cuando siempre se cumple la condición estacionaria, la influencia de la secuencia entre los valores del parámetro θ no es tan grande como la influencia del parámetro P del modelo AR, es decir, la dirección de la La secuencia cambia de forma más aleatoria.

(3) Condiciones de identificación

k & gtq coeficiente de autocorrelación rk=0 o coeficiente de autocorrelación rk es igual a n (0, 1/n(1+2∑R2i)1/ 2) Y (|rk| >2/n 1/2(1+2∑R2i)1/2) número ≤ 4.5%, es decir, el coeficiente de autocorrelación rkq tamaño de paso trunca el coeficiente de correlación parcial φk decae gradualmente y trunca la secuencia MA (q) Modelo.

La función ACF se utiliza para determinar si la función PACF de la ruta MA real es una oscilación decreciente o amortiguada unilateralmente (los coeficientes de autocorrelación a partir del orden Q son todos 0)

(4) Condición inversa

Primer orden: | θ 1 | < 1 Segundo orden: | θ 2 | < 1, θ1+θ2 & lt; modelo de transformación AR(p).

3. Modelo ARMA de media móvil autorregresiva (p, q).

(1) Forma del modelo

yt =φ1yt-1+φ2yt-2+……+φpyt-p+εt-θ1εt-1-θ2εt-2-……-θpεt -p

Símbolo: modelo pq orden autorregresivo orden promedio móvil;

φ θ coeficiente indeterminado cero; εt término de error independiente;

Yt estacionario, suma normal cero secuencia media

El significado del modelo (2)

La aproximación de la razón binomial es un caso especial de este modelo en comparación con el binomial AR, es decir, su razón p+q es AR ( p ) El orden P del modelo.

Energía del rango ARMA Los errores de medición del rango AR y MA, varios rangos AR y la energía superpuesta del rango AR y ARMA son mayores que los errores de medición del rango AR.

(3) Condiciones de identificación

Si el coeficiente de correlación parcial φk y el coeficiente de autocorrelación rk de la secuencia estacionaria convergen rápidamente a 0, entonces el modelo ARMA(p, q) de esta secuencia El número real de problemas debe verificarse mediante el uso de modelos para resolver los valores de p, qφ y θ.

(4) Orden del modelo

Criterio AIC: El criterio de información es el mismo que una buena estimación de los parámetros de orden del modelo ARMA y es adecuado para problemas con menos datos. El propósito es determinar qué ruta aleatoria está cerca de la ruta de desarrollo objetivo prevista y qué ruta aleatoria está cerca de la ruta original, de modo que la función de autocorrelación no esté cerca de la función de autocorrelación principal. Los valores AIC se calculan reduciendo y aumentando el orden del modelo dentro del rango especificado para determinar el orden apropiado para un modelo de orden de valor.

Parámetros del modelo como AIC=(n-d)logσ2+2(p+q+2).

La estimación de mínimos cuadrados de los parámetros del modelo AIC=nlogσ2+(p+q+1)logn.

Ecuación: n número σ_2 ajustando los parámetros D, P, Q del cuadrado residual.

Entre ellos: la línea de rango de valores N de P y Q es mayor que la relación de N, y N es mayor que un múltiplo de logn.

Aplicación práctica del modelo P, Q super 2

4. Modelo ARIMA (p, d, q) de media móvil integrada autorregresiva.

(1) Identificación del modelo

Si el coeficiente de correlación parcial φk y el coeficiente de autocorrelación rk de la secuencia estacionaria se truncan y decaen y convergen lentamente, entonces ARIMA puede utilizar la secuencia ( p, d, q) para modelar.

El significado del modelo (2)

Este modelo es similar al modelo ARMA (p, q) y los datos deben procesarse especialmente. En particular, las secuencias interlineales no estacionarias se pueden estabilizar directamente utilizando el modelo ARMA (p, q) y diferencias de orden finito. Aplicaciones prácticas de Clase D Super 2.

Si hay ondas periódicas entre secuencias, las diferencias se realizan según el período y el impacto a largo plazo de los errores aleatorios solo afectará temporalmente a las secuencias.

Es decir, la nueva secuencia de procesamiento diferencial se ajusta al modelo ARMA (p, q), y la secuencia original se ajusta al modelo ARMA (p, d, q).

Proceso de modelado

1. Verificación de datos

Verificar la estacionariedad, estado, periodicidad y media cero de los libros entre las series, y realizar el procesamiento y procesamiento de datos necesarios. Convertir.

(1) Dibuja una gráfica de línea recta: prueba el estado y la media cero.

Marque las casillas de la Figura 3.15 en el orden del gráfico y el histograma.

Figura 3.15

Estos datos se envían al cuadro de variables, mostrando que la curva de estado está seleccionada. Haga clic en Aceptar para ejecutar la curva de estado de transmisión, como se muestra en la Figura 3.16.

Figura 3.16

Mire la imagen: la desviación estándar es 1, la media es aproximadamente 0 y se requiere conversión de datos.

(2) Hacer un diagrama de correlación: comprobar la estacionariedad y la periodicidad.

El cuadro es el diagrama de secuencia que se muestra en la Figura 3.17 - series de tiempo - autocorrelación autocorrelación.

Figura 3.17

Estos datos se envían al cuadro de variable seleccionado entre Autocorrelación correlacionada, Autocorrelación parcial, Autocorrelación parcial, Transformación de datos temporales, Transformación y haga clic en Establecer opciones. El cuadro ahora se parece a la Figura 3.18.

Figura 3.18

Requisitos generales para datos entre secuencias n > 50 período de desfase k

Figura 3.19

Mire la imagen; la secuencia Los datos oscilan alrededor de una línea horizontal fija con un coeficiente de autocorrelación y decaen gradualmente periódicamente, por lo que la serie es básicamente estable.

(3) Transformación de datos:

Si el estado entre series o la estacionariedad es suficiente, los datos deben transformarse y los datos deben transformarse repetidamente (use Transformar— para crear una serie de tiempo) y se requiere transformación de datos (usando Transform-Compute), que es mejor que el estado y la estabilidad de la secuencia de datos directa.

2. Identificación del modelo

Al analizar el prefacio, identifique el tipo formal del modelo y determine el orden de P, D y Q.

(1) La secuencia formal del modelo discriminante

(1) Diagrama de correlación:

Ejecute el diagrama de autocorrelación para mostrar el diagrama de autocorrelación (Figura 3.19) y el diagrama de autocorrelación parcial (Figura 3.20).

Figura 3.20

Como se puede ver en la figura, el coeficiente de correlación parcial del coeficiente de autocorrelación tiene características de atenuación similares: atenuación rápida, el coeficiente de correlación binaria adyacente es de aproximadamente 0,42. El coeficiente de correlación retrasado de dos períodos es cercano a 0,1 y el coeficiente de correlación retrasado de tres períodos es cercano a 0,03. Básicamente, se determina la forma del modelo ARMA (p, q) de esta serie de tiempo y el ARMA (1, 1) o. Se puede determinar el modelo ARMA (2, 2).

Además, los valores numéricos indican que el modelo ARMA necesita probar la estacionariedad entre series. Si la función de correlación parcial de la secuencia es significativa, se selecciona directamente el modelo AR.

En aplicaciones prácticas, se deben prestar atención a cuestiones clave al utilizar diagramas de autocorrelación para la selección de modelos y la observación de funciones ACF y PACF: si el valor de la función decae rápidamente no ACF-0.5 indica un progreso deficiente; , ACF y PACF son obviamente fáciles de explicar los picos, pero es difícil identificar el modelo entre capas solo a partir del gráfico ACF.

②Estimación de parámetros:

(m, m-1) es la misma que en el experimento inicial, en aplicaciones prácticas, m=p+q=1/n, (1, 1), ..., (2, 2) calcula y compara los valores AIC (o valores SBC) uno por uno para determinar el modelo.

(2) Establecer una nueva serie de intervalos de variables

En cuyo modelo se forman las variables entre series siempre se ven afectadas por cambios en sus propias series de datos históricos, y las series de datos históricos son requerido como nuevas variables entre series.

Transformación - Basado en datos - Crear expansión de secuencia de series de tiempo Figura 3.21

Figura 3.21

(1) Seleccione la función de conversión de variables del menú desplegable de funciones. cuadro abajo:

Diferencia no estacional: Calcula la diferencia no estacional entre una serie de valores consecutivos.

Diferencia Estacional: Calcula la diferencia estacional entre valores constantes del intervalo entre tramos de series en función del período definido.

Promedio Móvil Líder: Calcula el promedio de la serie anterior.

Promedio Móvil Centrado: Calcula el promedio de los números alrededor de la serie, incluidos los valores anteriores.

Mediana de dígitos en ejecución: Calcula el número de dígitos que rodean la secuencia que contiene los valores anteriores.

Suma acumulada: Calcula la suma acumulada de valores de secuencia que incluyen directamente el valor anterior.

Serie de retardo: calcula las observaciones en función de la serie de retardo especificada.

Secuencia principal: Calcula observaciones continuas en función de la secuencia principal especificada.

Suavizado: Calcula observaciones continuas basándose en el suavizado de datos mixtos.

Utilizamos principalmente variables diferenciales, variables de retraso y variables de traducción, enfocándonos en las diferencias, retrasos y números de traducción para construir modelos y estimar parámetros para lograr nuestros objetivos.

(2) Complete el cuadro de orden de secuencia con el número de intervalos antes o entre los valores de secuencia.

El cuadro Nueva variable acepta el margen izquierdo para mover la variable de origen.

El cuadro Nombre define el nombre de la nueva variable, debes hacer clic en Cambiar para cambiarlo.

③Haga clic en Aceptar para ejecutar la nueva columna de variable en la base de datos original del sistema.

Además, si es necesario generar variables de período, expanda los cuadros que se muestran en la Figura 3.22 en el orden de fecha de definición de datos.

Figura 3.22

En este ejemplo de columna positiva, seleccione el intervalo para definir la variable periódica, inicie la primera columna positiva, establezca el valor de observación de la variable periódica y haga clic en Aceptar para definición completa.

3. Estimación de parámetros

Los valores de los parámetros de φ y θ se estimaron cuasi o cuadráticamente y se realizaron pruebas de significancia.

Ampliar el cuadro 3.23 en el orden de Análisis - Serie temporal - Modelo ARIMA.

Figura 3.23

Figura 3.23:

Seleccione la variable de secuencia original e ingrese al cuadro de variables

Identifique el modelo según el; nudo de identificación del modelo; realizar temporalmente la conversión de datos variables;

Los valores de p, (d) y q deben establecerse en función de los resultados de la identificación del modelo o las ideas experimentales;

No haga clic en el botón Guardar conjunto para expandir el cuadro 3.243.25.

Figura 3.24

Figura 3.24:

Cree una columna de variable, seleccione un nuevo nodo de variable, almacene temporalmente el archivo de datos original y agréguelo al elemento del archivo y seleccione el nuevo nudo de cálculo del archivo de datos original de reemplazo de variable que reemplaza los elementos existentes;

Establezca el intervalo de confianza 100% intervalo de confianza seleccione 95;

Seleccione la columna de caso de pronóstico en el libro de pronóstico , dado según el período Predecir los resultados.

Figura 3.25

Figura 3.25:

En la columna de criterios de convergencia, seleccione el número de iteraciones, la precisión del cambio de parámetros y la suma de cambios al cuadrado, y el la iteración finaliza una vez completada la configuración del parámetro;

La columna de valor inicial estimado utilizada para estimar el valor inicial es seleccionada automáticamente por el proceso o toma de forma predeterminada la primera, según lo proporcionado por el modelo anterior Aplicar desde el modelo anterior.

Selección de columna del método de predicción de pronóstico Mínimos cuadrados incondicionales o indefinidos condicionales;

En la columna Visualización de control de entrada, seleccione los parámetros iniciales y finales y el resumen o detalles de la iteración, o visualice. Sólo los parámetros finales.

Haga clic en Aceptar y el sistema ingresará inmediatamente la información:

Modelo: MOD_1

Número de grupo dividido: 1 Longitud de serie: 48

No se pierde nada.

Para la estimación se utilizará el algoritmo de Maillard.

La fase de evaluación ha finalizado.

La estimación finaliza en la 7ª iteración porque: la suma de cuadrados disminuye menos del 0%.

Parámetros finales:

Cantidad restante 48

Error estándar 1.1996949

Logaritmo de probabilidad -75.463915

AIC 156.92783

SBC 162.54143

Análisis de varianza:

DF suma de cuadrados ajustada de la varianza residual

Residual 45 65.099923 1.4392678

p>

Variables en el modelo:

Aproximación del ratio B SEB T. PROB.

ar 1. 02318739. 31945836. 0725365

ma 1-44871554. 28829314-1.5564558.

Constant-.02421308.25505018-.09493856

Se están creando las siguientes nuevas variables:

Etiquetas de nombre

FIT_1 se ajusta a esto de ARIMA Datos para MOD_1 CON

ERR_1Estos datos provienen de ARIMA, MOD_1 CON 0 con

LCL_1 95% LCL para Estos datos provienen de ARIMA, MOD_1 CON.

UCL_1 95% UCL, estos datos provienen de ARIMA, MOD_1 CON

SEP_1 SE ajusta a los datos de ARIMA, MOD_1 CON 0 con

Importancia de cada estadística de salida :

Número: tome una variable numérica con un valor de 1 y su coeficiente de variable independiente es 0. El valor predicho óptimo de esta variable se denomina valor de referencia de predicción.

Número de coeficientes: refleja el peso de influencia de la variable independiente.

Error estándar: indica que el parámetro de confiabilidad (error residual) de los datos es aproximadamente más o menos el doble del coeficiente condicional de la distribución conforme. El error estándar es aproximadamente igual al intervalo de confianza del 95% de la. parámetro general Cuanto mayor sea el valor, más estrecho será el intervalo de confianza y cuanto mayor sea el valor de fase de los coeficientes, con mayor precisión se estimará la unión.

Estadístico t: La relación entre el coeficiente estimado y el error estándar prueba la correlación de variables. Dado un nivel de significancia del 5%, para rechazar la hipótesis original de que el valor 0 está fuera del intervalo de confianza del 95%, su valor absoluto debe ser 2.

t Valor de probabilidad: Cuanto mayor sea el valor, más relevante será el rechazo de la hipótesis nula y la evidencia. Su valor es cercano a 0,05, lo que corresponde a un estadístico T cercano a 2.

Media: mide el grado de configuración de la variable para transmitir la información de posición de la variable aleatoria.

Desviación estándar: mide la dispersión de una variable para transmitir información de escala de una variable aleatoria.

Ping: Estudiar el aislamiento de componentes de las estadísticas de tolerancia residual es muy valioso.

Criterio: cuantos más criterios de información utilice AICSBC en la selección de modelos, más severamente estará restringido por los grados de libertad.

Corrección R2: Las variables independientes del modelo describen qué tan bien funcionan los predictores de rango de banda proporcional, y el error normalizado de la variable en comparación con la desviación estándar, y el error normalizado en comparación con la media multivariada es 10 % , luego el modelo.

Estadístico DW: se utiliza para comprobar si existe correlación serial en términos de error aleatorio.

Similitud LN: Cuantas más pruebas de hipótesis se utilicen para la comparación de modelos.

Resto de gráficos:

4. Comprobación del modelo

Comprueba la racionalidad del nuevo modelo. Si la regla de prueba general ajusta el valor de (p, q) y reestima la prueba de parámetros, la interacción entre los tres procesos de identificación del modelo, estimación de parámetros y reparación de pruebas que se detiene directamente requiere experimentos repetidos cruzados para finalmente determinar el modelo. forma.

(1) El gráfico de correlación prueba el ruido blanco residual;

El gráfico de autocorrelación de la función de autocorrelación parcial del rango de ruido blanco en la barra del programa de ruido blanco es igual a 0 líneas rectas horizontales.

(2) Diagrama de dispersión para probar la independencia residual:

Utilice el valor del error como ordenada y el valor predicho como abscisa para observar la uniformidad y aleatoriedad de la distribución de puntos dispersos.

El error de predicción del modelo de predicción ideal está relacionado con predicciones, patrones y secuencias.

Las estadísticas de DW correspondientes solo están disponibles para series de pedidos de prueba.

(3) La gráfica de línea recta prueba la media cero de los residuos:

Si la distribución es normal, la media cero solo prueba la independencia de la secuencia residual.

(4) Autocorrelación residual de la prueba gráfica de probabilidad: el nivel de significancia es 0,05, calcule el valor de probabilidad χ2().

(5) Efecto de predicción de la prueba de diferencia de medias: estándar de diferencia de medias del error de predicción. Tenga en cuenta que el error de predicción solo está relacionado con el período de predicción y el momento inicial.

5. Método de predicción del modelo

El sistema de predicción aprende el modelo de predicción de la secuencia de estados en un momento determinado y calcula el valor de predicción.