Acerca del modelado matemático "modelo de regresión estadística"~~~Por favor ayúdenme~~Urgente~Le daré 100 puntos~~
Preguntas del Concurso Nacional de Modelado Matemático de Pregrado de la Copa de la Sociedad de Educación Superior 2006
(Lea primero los "Requisitos uniformes para el formato en papel")
Pregunta B: Terapia del SIDA Evaluación y predicción de la eficacia
El SIDA es una de las plagas más graves de la sociedad humana. En los más de 20 años transcurridos desde su descubrimiento en 1981, ha matado a casi 30 millones de personas.
El nombre médico completo del SIDA es “Síndrome de Inmunodeficiencia Adquirida”, o SIDA en inglés. Es causado por el VIH (el nombre médico completo es “Virus de Inmunodeficiencia Humana”, o VIH en inglés). Este virus destruye el sistema inmunológico humano y hace que el cuerpo humano pierda su capacidad de resistir diversas enfermedades, poniendo así en grave peligro la vida humana. Las células CD4 del sistema inmunológico humano desempeñan un papel importante en la resistencia a la invasión del VIH. Cuando la infección por VIH destruye las células CD4, su número disminuirá drásticamente y el VIH aumentará rápidamente, lo que provocará la aparición del SIDA.
El objetivo del tratamiento del SIDA es reducir la cantidad de VIH en el cuerpo humano tanto como sea posible, mientras se produce más CD4, o al menos reducir efectivamente la tasa de reducción de CD4, para mejorar la la inmunidad del cuerpo.
Hasta ahora, los humanos no han encontrado una cura para el SIDA. Algunos tratamientos actuales para el SIDA no sólo tienen efectos secundarios en el cuerpo humano, sino que también son muy costosos. Muchos países y organizaciones médicas están probando y buscando activamente mejores tratamientos contra el SIDA.
Ahora tenemos dos conjuntos de datos publicados por ACTG, la agencia estadounidense de ensayos médicos sobre el SIDA. ACTG320 (ver Apéndice 1) es una prueba de las concentraciones de CD4 y VIH cada pocas semanas en más de 300 pacientes que toman 3 medicamentos: zidovudina, lamivudina e indinavir (cantidad por mililitro de sangre). 193A (ver Apéndice 2) dividió aleatoriamente a más de 1300 pacientes en 4 grupos, cada grupo tomó una de las siguientes 4 terapias y analizó la concentración de CD4 aproximadamente cada 8 semanas (este grupo de datos carece de concentración de VIH, es costoso realizar la prueba). Los medicamentos diarios para los cuatro tratamientos son: 600 mg de zidovudina o 400 mg de didanosina (desanosina), que se utilizan en rotación mensual; 600 mg de zidovudina más 2,25 mg de zalcitabina (zalcitabina); 400 mg de didanosina, más 400 mg de nevirapina.
Complete las siguientes preguntas:
(1) Utilice los datos del Apéndice 1 para predecir el efecto de continuar el tratamiento o determinar el mejor momento para finalizar el tratamiento (continuar el tratamiento se refiere a Después de finalizar la prueba, continúe tomando el medicamento. Si cree que el efecto de continuar tomando el medicamento no es bueno, puede optar por finalizar el tratamiento antes de tiempo.
(2) Utilice los datos del Apéndice 2 para evaluar las ventajas y desventajas de los cuatro tratamientos (utilizando únicamente CD4 como estándar) y predecir el efecto de continuar el tratamiento para el mejor tratamiento, o determinar el Mejor momento para finalizar el tratamiento.
(3) Los precios de los medicamentos proporcionados por los principales proveedores de medicamentos contra el SIDA a los países subdesarrollados son los siguientes: 600 mg de zidovudina US$ 1,60, 400 mg de didanosina US$ 0,85, 2,25 mg de zalcitabina US$ 1,85 y 400 mg de nevirapina US$ 1,20 . Si el paciente necesita considerar el costo de 4 terapias, ¿qué cambia en la evaluación y predicción (o terminación anticipada) en (2)?
Modelo de regresión estadística
Resumen:
Cuando las personas tienen una comprensión relativamente completa de las características intrínsecas del objeto de investigación y la relación entre varios factores, el mecanismo se utiliza generalmente Los métodos analíticos se utilizan para establecer modelos matemáticos si es imposible analizar las relaciones de factores internos de los objetos y establecer modelos matemáticos que se ajusten a las leyes de los mecanismos debido a la complejidad de las leyes internas de las cosas objetivas y las limitaciones de. Según la comprensión de las personas, el método habitual es recopilar una gran cantidad de datos y construir modelos y establecer modelos de regresión estadística basados en el análisis estadístico de los datos. La eficacia de los fármacos en medicina también se analiza a través de datos obtenidos de una gran cantidad de experimentos. A continuación, estableceremos un modelo matemático de regresión estadística para realizar un análisis razonable.
Palabras clave:
Tiempo de alivio del dolor, dosis del medicamento, sexo, grupo de presión arterial
Se plantea una pregunta:
Un medicamento en Para comprender la eficacia de un nuevo analgésico, el departamento de investigación de nuevos fármacos de la empresa diseñó un ensayo farmacológico para administrar a pacientes con la misma enfermedad una de las siguientes cuatro dosis del nuevo analgésico: 2 g, 5 gy 10 g, y registrar el momento en que el dolor de cada paciente se alivia significativamente. Para comprender la relación entre la eficacia del nuevo fármaco y el sexo y la presión arterial del paciente, durante el ensayo, los investigadores asignaron uniformemente a los pacientes a niveles de presión arterial baja, media y alta según su sexo y presión arterial para realizar las pruebas. Al comparar los datos históricos de presión arterial de cada paciente, de mayor a mayor, las puntuaciones más bajas se dividen en tres grupos, contabilizados como 0,25, 0,50 y 0,75 respectivamente. Después del experimento, los resultados del registro de la empresa se muestran en la siguiente tabla (0 representa mujeres, 1 representa hombres).
Cree un modelo para la empresa basado en estos datos según la dosis del medicamento del paciente y el sexo. y grupo de presión arterial, predecir el momento en que el dolor se aliviará significativamente después de tomar el medicamento
Número de paciente Tiempo de alivio del dolor Dosis del medicamento Género Grupo de presión arterial
1 35 2 0 0,25
2 43 2 0 0,5
3 55 2 0 0,75
4 47 2 1 0,25
5 43 2 1 0,5
6 57 2 1 0,75
7 26 5 0 0,25
8 27 5 0 0,5
9 28 5 0 0,75
10 29 5 1 0.25
11 22 5 1 0.5
12 29 5 1 0.75
13 19 7 0 0.25
14 11 7 0 0,5
15 14 7 0 0,75
16 23 7 1 0,25
17 20 7 1 0,5
18 22 7 1 0,75
19 13 10 0 0,25
20 8 10 0 0,5
21 3 10 0 0,75
22 27 10 1 0,25
23 26 10 1 0,5
24 5 10 1 0,75
Análisis de dos modelos y supuestos:
De los datos que obtuvimos , podemos analizar el tiempo de alivio del dolor y la presión arterial. La dosis y el género están relacionados.
Supongamos que el tiempo de dolor es Y, la dosis del medicamento es x1, la presión arterial es x2 y el sexo es x3. Los datos en la misma columna tienen los mismos valores pero diferentes tiempos de dolor, lo que muestra que el tiempo de dolor está realmente relacionado con las tres variables dependientes que estamos buscando.
A continuación, utilizamos herramientas de Matlab para analizar la relación entre Y y tres variables.
El rojo representa la relación entre x2 e Y, y el verde representa la relación entre x1 e Y. el azul representa la relación entre x3 e Y.
A partir de la figura anterior, estimamos que existe una relación muy compleja entre Y y x1, x2, x3. Esta es una relación multivariada, por lo que asumimos un modelo matemático:
. Y=b0 b1*x1^(-1) b2*x2 b3*x3 b4*x2.^2 b5*x1.^2 b6*x1*x2 b7*x3*x2 b8*x1*x3 ε
El modelo asume esto.
Establecimiento y solución de tres modelos
Y=b0 b1*x1^(-1) b2*x2 b3*x3 b4*x2.^2 b5*x1.^2 b6 *x1*x2 b7*x3*x2 b8*x1*x3 Si tal modelo de ε es razonable requiere que lo verifiquemos.
Utilice el comando de regresión en matlab para encontrar el resultado.
El resultado obtenido por primera vez es
B = [b bint] =
13.662 -5.6564 32.98
42,81 17,188 68,432
23,428 -52,668 99,524
3,439 -10,701 17,579
0,011172 -0,13567 0,15801
12 -59.606 83.606
-5.3213 -8.8549 -1.7877
-20 -40.671 0.67096
1.7602 0.31369 3.2067
R=[r rint]=
-4.0578 -10.85 2.7348
-1.5042 -9.9542 6.9459
3.5495 -3.3525 10.452
5.9829 -0.33157 12.297
1.5365 -6.9187 9.9917
-6.4098 -12.625 -0.19447
3.5415 -5.1727 12.256
3.0861 -6.107 12.279
1.1308 - 7.7466 10.008
-0.69838 -9.6193 8.2225
-4.1537 -13.195 4.8877
4.891 -3.5476 13.33
1.3802 - 7.7566 10.517 p>
-5.4144 -14.475 3.6458
-2.7091 -11.695 6.2764
-5.3799 -14.004 3.2443
-2.1746 -11.648 7.2986
4,5307 -4,1953 13,257
0,63615 -6,5528 7,8251
0,83246 -7,6901 9,355
-0,47123 -7,7354 6,793
-1.4045 -8.5766 5.7675
7.7918 0.47479 15.109
-4.5119 -11.348 2.3241
Estadísticas =[ 0.91844 21.113 7.7489e-007]
De Podemos ver que el valor R.^2 es 91.844 y el valor F es 21.113. El valor de R ^ 2 no es suficiente para cumplir con los requisitos y F es muy pequeño, por lo que el modelo que establecimos no cumple con los requisitos. Podemos utilizar el análisis residual para construir un modelo relativamente bueno. Por lo tanto, consideramos si algunos de los elementos no son necesarios o si necesitamos agregar algunos elementos.
Luego usamos el comando paso a paso para analizar:
Cuando establecemos Y= b0*x0 b1*x1.^(-1) b2*x2 b3*x3 b4*x2.^(-1) b5 * x1.*x2 b6*x1.*x3 b7*x2.*x3 modelo estadístico, realizar análisis residual
La mejor representación residual es
En este momento, R.^2= 91.0316 F = 36.5407, por lo que el valor de F es un poco mayor. El análisis residual muestra que los valores de b0, b3 y b4 son 0. Sus elementos correspondientes tienen poco impacto en la función objetivo y pueden ignorarse.
Pero, ¿podemos encontrar un modelo mejor para reemplazar el modelo actual obtenido, porque el artículo F no es muy razonable?
Seguimos analizando los requisitos de la pregunta. Según el sentido común, la dosis del medicamento en cuestión debe ser inversamente proporcional a la duración del dolor, porque cuanto menor sea la dosis del medicamento, mayor será la duración del dolor. Además, si la presión arterial es alta, el dolor debería durar más. Además, la presión arterial debe estar relacionada con el género,
Cuando establecemos Y= b0*x0 b1*x1 b2*x2 b3*x3 b4*x2.^2 b5*x1.*x2 b6*x1 *x3 b7*x2.*x3 b8*x.^2 Cuando utilice el modelo estadístico, realice un análisis residual y los resultados se muestran en la figura.
Obviamente es mucho mejor que los datos simplemente. Ahora sigamos haciendo esto. Al ajustar el modelo, es posible que pueda encontrar un conjunto de datos mejor que el gráfico anterior.
Después de continuar con la búsqueda, se obtiene otro resultado como se muestra en la figura.
De la figura anterior podemos ver que R^2 = 94.0512, F = 56.9166, que es otro bien resultado de los datos,
El modelo matemático establecido en base a esta figura es
Y= b0*x0 b1*x1 b2*x.1^2 b3*x2.^2 b4*x1 .*x2 b5*x1.*x3 b6*x2.*x3
Esto muestra que el tiempo del dolor tiene una relación cuadrática con la cantidad de medicamento y una relación cuadrática con la presión arterial. El modelo contiene una cruz. términos de todas las variables.
Para otros modelos
Por ejemplo, Y= b0*x0 b1*x1.^(-1) b2*x2 b3*x3 b4*x2.^2 b5*x1. * x2 b6*x1.*x3 b7*x2.*x3 b8*x.^2
El resultado obtenido es el que se muestra a continuación
Este resultado es obviamente peor que el resultado anterior .
R.^2 es pequeño.
Así que determinamos el modelo
Y= b0*x0 b1*x1 b2*x.1^2 b3*x2.^2 b4*x1.*x2 b5*x1. *x3 b6*x2.*x3
Veamos su intervalo de confianza
bint=
43.642 61.974
-10.213 - 3,9083
0,28145 0,74077
24,195 60,862
-10,151 -4,5978
0,43864 1,4715
Todos los coeficientes El intervalo de confianza no pasa por el origen y los datos son razonables.
Mire los residuos
r =
-4,7019
1,4086
5,388
-2,8987
1,4985
2,2782
4.5224
4.5224 p>
1.4506
0.50291
-5.2529
-2.3247
0.82047
-2,248
0,36743
-1,8649
0,066566
1,682
- 4,5328
0,92964
1,0761
-0,083352
9,3791
-6,4745
El tamaño de cada dato no es muy grande, por lo que luego tomamos los valores reales de todas las variables para construir el modelo real
Y= 52.808-7.0608*x1 0.51111*x.1^2 42.528* x2.^2 -7.3746*x1.*x2 0.95506*x1 .*x3
Este modelo básicamente cumple con los requisitos.
Así que me decidí por el modelo.
Cuatro resultados del modelo
Y= 52.808-7.0608*x1 0.51111*x.1^2 42.528*x2.^2 -7.3746*x1.*x2 0.95506*x1.*x3
Aplicación de cinco modelos
Al usar este modelo para encontrar el tiempo de dolor, siempre que recibamos los datos básicos de las tres variables, podemos obtener el resultado muy bien.
Por ejemplo, x1 = 2 x2 = 0,5, x3 = 0
Entonces Y = 40,7308 no es muy diferente de los datos dados 43 y el modelo está bien aplicado.
"Modelado matemático"
Editor: Higher Education Press Autor: Jiang Qiyuan, Xie Jinxing, Ye Jun
Material didáctico del profesor Luo Jizhou Introducción al software MATLAB Modelado matemático Material didáctico