Red de conocimientos sobre prescripción popular - Conocimiento dental - Cómo escribir artículos de análisis de la República de China de alta calidad

Cómo escribir artículos de análisis de la República de China de alta calidad

1. La base del análisis de la República de China.

Los artículos sobre medicina de laboratorio se pueden dividir en dos categorías, una trata sobre metodología, siempre que se trate de control de calidad, evaluación metodológica y comparación, la otra trata sobre la aplicación de indicadores de prueba, utilizando indicadores para diagnóstico Enfermedad, la relación entre los indicadores de observación y el pronóstico de la enfermedad y la estadificación patológica. Los artículos de análisis de la República de China pertenecen a este último y su objetivo principal es evaluar la importancia diagnóstica de un determinado indicador para una determinada enfermedad. Como por ejemplo "El papel de la AFP en el diagnóstico del cáncer de hígado", "Diagnóstico combinado de CEA y NSE del cáncer de pulmón", etc.

Como todos sabemos, cuando se utiliza un único indicador de laboratorio para diagnosticar una enfermedad, el simple hecho de aumentar la sensibilidad reducirá inevitablemente la especificidad y, viceversa, en otras palabras, reducir los diagnósticos erróneos inevitablemente aumentará los diagnósticos erróneos; Por ejemplo, un médico quiere utilizar AFP para diagnosticar cáncer de hígado. El estándar de diagnóstico del médico es que la AFP sea superior a 10 mmol/L. Obviamente, la sensibilidad del diagnóstico de cáncer de hígado de acuerdo con este estándar es alta y no se pasará por alto el cáncer de hígado. , porque casi todos los pacientes con cáncer de hígado tienen AFP superior a 10 mmol/L. Pero, por otro lado, es fácil que se diagnostique erróneamente según este estándar, porque después de que los médicos se dieron cuenta de este problema en pacientes con AFP superior a 10, plantearon el aumento. estándar de diagnóstico para el cáncer de hígado de 100 mmol/L a 1000 mmol/L, y lo utilizó como criterio de diagnóstico de cáncer de hígado. Obviamente, con este estándar, los pacientes no serán diagnosticados erróneamente, porque si la AFP es superior a 1000 mmol/L, es casi seguro que se trata de cáncer de hígado. Pero, por otro lado, aumenta el diagnóstico erróneo, porque no todos los pacientes con cáncer de hígado tienen AFP superior a 1000 mmol/L. Se puede observar que el diagnóstico erróneo y el diagnóstico erróneo son contradictorios. La reducción de los diagnósticos erróneos debe producirse a costa de aumentar los diagnósticos erróneos, y la reducción de los diagnósticos erróneos debe producirse a costa de aumentar los diagnósticos erróneos. La sensibilidad y la especificidad son siempre un equilibrio.

Entonces, ¿cómo conciliar sensibilidad y especificidad? La mejor manera es realizar un análisis ROC (nota: ROC solo se centra en indicadores de medición). Junte el grupo de casos con enfermedades que son difíciles de diagnosticar diferencialmente y utilice los indicadores que deben estudiarse para diagnosticar la enfermedad, con 1-especificidad como abscisa y sensibilidad como ordenada. Observe la relación entre sensibilidad y especificidad cuando cambia el índice y dibuje la curva ROC (el procedimiento específico lo completa SPSS). Luego juzgue el indicador basándose en los resultados de la curva.

¿Para qué sirve la República de China? En términos generales, los objetivos principales son los siguientes: 1. Juzgar la eficacia diagnóstica de un solo indicador. Cuanto mayor sea el área bajo la curva, mayor será la eficacia diagnóstica del indicador. 2. Comparar la eficacia diagnóstica de diferentes indicadores.

Si no lo entiende, lea los libros pertinentes.

2. Cómo diseñar un análisis ROC de alta calidad

2.1 Estimación del tamaño de la muestra

Antes de realizar la mayoría de los estudios, debemos estimar el número de muestras. El tamaño de la muestra es demasiado pequeño, la eficiencia estadística es baja y es fácil cometer dos tipos de errores. Un tamaño de muestra excesivo no sólo provoca un desperdicio económico, sino que también añade muchos factores incontrolables y reduce la calidad del experimento. Parte del personal médico nacional simplemente cree que cuanto mayor sea el tamaño de la muestra, más confiables serán los resultados de la investigación. Esto es unilateral. De hecho, personalmente creo que en la investigación general es suficiente controlar el tamaño de la muestra hasta el límite superior del tamaño de muestra mínimo estimado más un 20% (principalmente para evitar el abandono en estudios prospectivos).

No escribiré una estimación del tamaño de la muestra porque no puedo resolver la fórmula en el jardín. Consulte los libros relevantes para obtener más detalles.

2.2 Configuración del grupo de control y del grupo experimental

Los indicadores de laboratorio no sólo deben enfatizar su sensibilidad, sino también su especificidad. La configuración del grupo de control refleja principalmente la especificidad de los indicadores, es decir, la capacidad de diagnóstico diferencial. En base a esto, se debe formar un grupo de control con síntomas similares a los del grupo de la enfermedad, y es difícil identificar la enfermedad sin utilizar indicadores de diagnóstico de laboratorio. Como cirrosis hepática, cáncer de hígado, etc. En algunos artículos nacionales, no es científico agregar personas sanas al grupo de control. Dado que las personas sanas y las enfermas se pueden distinguir básicamente por los síntomas y signos, no son necesarios indicadores de laboratorio. Por supuesto, si un indicador es un indicador nuevo o un diagnóstico de enfermedad asintomática (tales enfermedades son relativamente raras), entonces agregue un grupo de control sano al primer estudio o al estudio inicial para observar si el grupo de enfermedad y el grupo de control sano lo son. Es comprensible que existan diferencias, pero para enfermedades con síntomas evidentes que son fáciles de distinguir de las personas sanas, no es necesario establecer un grupo de control sano. El grupo experimental y el grupo de control deben reflejar plenamente la homogeneidad, es decir, un grupo de personas para quienes es difícil hacer un diagnóstico diferencial sólo a través de la historia de los síntomas sin utilizar indicadores de laboratorio. El mejor enfoque es adoptar criterios de inclusión uniformes.

Por ejemplo, si desea utilizar AFP para diagnosticar cáncer de hígado, un mejor criterio de inclusión es incluir a todos los pacientes recién diagnosticados en el hospital que tengan más de 40 años, tengan ictericia u otros síntomas de enfermedad hepática y se sospeche que tienen cáncer de hígado. pacientes. En cuanto a si las personas incluidas en el estudio tienen cáncer de hígado u otras enfermedades hepáticas benignas, no hay necesidad de preocuparse, basta con utilizar los indicadores para el diagnóstico diferencial. Cabe señalar que los estándares específicos dependen del conocimiento profesional y los estándares enumerados anteriormente son solo como referencia. La calidad de la investigación de la República de China depende en gran medida de la naturaleza científica de los criterios de inclusión, que también es una prueba de la capacidad del investigador.

Algunas revistas nacionales e incluso algunas revistas extranjeras, al incluir sujetos de investigación, solo dicen cuántos casos hay en el grupo experimental, y hay * *casos* *enfermedades y * *casos* *enfermedades en el grupo de control. En realidad, esto no es científico o no vale la pena defenderlo. Por ejemplo, también se ha estudiado el diagnóstico por radiofrecuencia de la artritis reumatoide. Un investigador explicó brevemente que el grupo de control estaba formado por 20 pacientes con espondilitis anquilosante y 30 pacientes con lupus eritematoso sistémico. Esto difícilmente refleja si estas enfermedades deben diferenciarse del cáncer de hígado, porque algunas espondilitis anquilosante y lupus eritematoso no necesitan diferenciarse de la AR debido a sus síntomas típicos. Al mismo tiempo, hay otro problema: no existe una etapa patológica de la enfermedad.

Muchos indicadores están relacionados con el estadio patológico de la enfermedad. como marcadores tumorales. Otros están estrechamente relacionados con el curso de la enfermedad, como los marcadores de daño miocárdico. Al estudiar estos indicadores, se debe considerar la estratificación de las enfermedades. Por ejemplo, al estudiar el efecto diagnóstico de la CK en el IAM, el tiempo de tratamiento debe limitarse en los criterios de inclusión. Por ejemplo, se estipula que este estudio solo incluye a personas que buscan tratamiento dentro de las 2 horas posteriores al dolor torácico agudo, y a todos se les realiza la prueba dentro de un período de tiempo (como 3 a 4 horas después del dolor torácico). Por supuesto, cuanto más estrecho sea el límite de tiempo, mayor será la calidad del estudio, pero cuantos menos casos, más difícil será el estudio, por lo que debo decidir los criterios de inclusión en función de mis propias capacidades y experiencia de investigación. Para enfermedades relacionadas con la estadificación patológica, si hay suficientes casos para estratificar, podemos hacer una investigación estratificada, de lo contrario, se debe explicar la composición de los casos y debe ser cercana a la situación real (basada en el conocimiento profesional); En algunos casos, se pueden comparar otras características básicas basándose en la experiencia profesional. Por ejemplo, en el estudio del diagnóstico de cáncer de hígado por AFP, podemos comparar la función hepática (clasificación) del grupo de casos y el grupo de control mediante la prueba de chi-cuadrado. De hecho, antes del análisis de la República de China, es mejor comparar si otros indicadores de los dos grupos están equilibrados. Si está desequilibrado significa que los criterios de inclusión no son muy estrictos, o este indicador también se puede utilizar como indicador de diagnóstico, o se puede utilizar el análisis ROC.

La mayoría de los periódicos nacionales no explican la composición de los casos, ni comparan otras características de los dos grupos, ni siquiera comparan la edad y el género básicos. Esto hace imposible que los lectores juzguen si los dos conjuntos de casos son homogéneos y si la investigación es significativa.

Cabe señalar que cuanto más estrictos sean los criterios de inclusión de los estudios, más refinada será la estratificación de los casos y mayor será la calidad de la investigación, pero mayor será la dificultad de la investigación. Qué propósito de la investigación se debe lograr, si se necesita estratificación y restricciones estrictas, etc. , depende de la situación real.

2.3 El grupo experimental debe tener un estándar de oro.

El llamado estándar de oro es un método o plan para diagnosticar una enfermedad. Para los casos incluidos en el grupo experimental se debe utilizar el estándar de oro para el diagnóstico. Es decir, los casos incluidos en el grupo experimental deben contarse como uno. Por el contrario, a veces los requisitos para los grupos de casos no son demasiado estrictos.

Los métodos de diagnóstico comunes, como la AR, deben diagnosticarse según los criterios de diagnóstico del Colegio Americano de Reumatología (1987), los tumores deben diagnosticarse basándose en los casos y los cálculos biliares deben diagnosticarse basándose en los hallazgos intraoperatorios. . Para conocer los estándares de oro específicos, consulte los conocimientos relevantes de cada especialización. La mayoría de los artículos de análisis nacionales de la República de China no son claros acerca del estándar de oro, lo que hace imposible que los lectores juzguen la calidad de la investigación. Esta es una representación imprecisa.

2.4 Interpretación de los parámetros relacionados con ROC

Hay muchos parámetros generados por la curva ROC, como el valor de corte, la sensibilidad, la especificidad, el área bajo la curva (AUC) y el valor predictivo positivo. , valor predictivo negativo, índice de probabilidad positivo, índice de probabilidad negativo, índice de Jordan, etc. En las explicaciones profesionales, generalmente no es necesario enumerarlos todos, pero sí se debe indicar el valor crítico, la sensibilidad, la especificidad y el AUC.

Cuando algunos artículos nacionales analizan indicadores relacionados, los errores comunes incluyen: no tener un intervalo de confianza para cada indicador, usar muestras en lugar del conjunto y simplemente pensar que cuanto mayor sea el AUC, mayor será la validez del diagnóstico. Algunos incluso creen que el índice de Jordan es la clave para juzgar la validez del diagnóstico. De hecho, el índice de Jordan es solo para un punto y no puede reflejar los cambios en sensibilidad y especificidad después de que cambia el índice. Al mismo tiempo, el índice de Jordan sólo puede determinar de forma aproximada el límite.

Al comparar dos indicadores en el mismo experimento, se debe utilizar la comparación AUC para obtener una alta eficiencia diagnóstica de un solo indicador. Sin embargo, esta comparación no es una comparación numérica simple, sino que se deben utilizar métodos estadísticos relevantes. . El método es más complicado, por lo que se recomienda buscar ayuda de un profesional. En cuanto a la comparación de sensibilidad y especificidad, también deberían existir métodos de prueba comparativos relevantes. Debido a que somos una muestra de investigación y hay un error de muestreo, no podemos usar la muestra para reemplazar el todo para la discusión.

Al mismo tiempo, el valor de AUC está entre 0,5 y 1, y no puede ser inferior a 0,5. En algunos artículos nacionales, debido a la influencia del pensamiento fijo, el AUC es inferior a 0,5. Esto es una completa tontería.

Por ejemplo, a algunas personas les gusta predecir si otras tendrán un niño o una niña. Si el 90% de las predicciones son correctas, se puede decir que alguien ha hecho una predicción relativamente acertada. Si el 90% de las predicciones son erróneas, ¿entonces la predicción es inútil? Las personas más inteligentes pensarán al revés. Si predices tener un niño, puedes entender que quieres tener una niña, lo cual no es exacto, el 90% de las veces.

2.5 Diagnóstico conjunto de múltiples indicadores

El diagnóstico conjunto entre indicadores se puede dividir en experimentos de diagnóstico en serie (series) y experimentos de diagnóstico paralelos (paralelos). El método de combinación específico depende del principal. . Algunas enfermedades, como el infarto agudo de miocardio, requieren un diagnóstico precoz y un tratamiento concomitante, lo que puede tener un gran impacto en el pronóstico. Algunas enfermedades enfatizan la especificidad, como el LES, que se pueden conectar en serie para mejorar la especificidad. En pocas palabras: la conexión en serie significa que todos los indicadores son positivos y la conexión en paralelo significa que mientras un indicador sea positivo, es positivo.

Por supuesto, para casi todas las enfermedades, cuanto antes se diagnostique, mejor, y cuanto más preciso sea, mejor. A excepción de algunas enfermedades, a veces resulta difícil diferenciar entre ambas. Por lo tanto, desde un punto de vista prudente, los investigadores pueden enumerar tanto el modo serie como el modo paralelo para que los lectores elijan.

Cuando algunos periódicos nacionales utilizan el diagnóstico conjunto de indicadores, o no explican el método conjunto o utilizan conexiones en serie y paralelo indiscriminadamente, lo que dificulta la comprensión de los lectores.

De hecho, basándose en el sentido común, se puede inferir que, independientemente de si los dos indicadores están conectados en serie o en paralelo, aumentar la sensibilidad reducirá la especificidad. Sólo cuando múltiples indicadores son positivos en serie se puede establecer el diagnóstico, mejorando así la especificidad y reduciendo la sensibilidad. Cuando un indicador es positivo en paralelo se establece el diagnóstico, aumentando la sensibilidad y reduciendo la especificidad. Es imposible que el diagnóstico conjunto de múltiples indicadores mejore la sensibilidad y la especificidad al mismo tiempo. En otras palabras, el diagnóstico conjunto significa que si la sensibilidad es mayor que cualquier indicador (al menos igual), significa que el autor utiliza una combinación paralela, y la especificidad debe ser menor que cualquier indicador individual involucrado en el diagnóstico conjunto; Por otro lado, si la especificidad del diagnóstico conjunto es Si la sensibilidad es mayor que cualquier indicador (al menos igual), significa que el autor utiliza una conexión en serie, y la sensibilidad debe ser menor que cualquier indicador individual involucrado en el diagnóstico conjunto; En los documentos nacionales, después del diagnóstico conjunto, la sensibilidad y especificidad de los indicadores. Es ilógico que en realidad hayan aumentado simultáneamente. Para decirlo a la ligera, es un error de cálculo, para decirlo en serio, es DDD.

Al mismo tiempo, la combinación entre indicadores es una combinación punto a punto y una combinación de dos puntos de corte. No existe una métrica como el AUC. AUC es el área de la curva generada cuando el indicador cambia. El indicador se ha fijado en un valor determinado, por lo que no hay AUC. No tiene sentido que algunos periódicos nacionales se combinen para tener una AUC conjunta.

Algunos artículos incluso abandonan la curva ROC y utilizan el límite superior del rango de referencia como límite de diagnóstico. Esto en realidad se debe a que no se comprende el análisis ROC.

2.6 Desde una perspectiva clínica, evaluar objetivamente el análisis ROC.

En teoría, en la mayoría de los casos, el uso combinado de múltiples indicadores puede ayudar a mejorar la precisión del diagnóstico de la enfermedad, pero debe reconocerse que el uso combinado de múltiples indicadores aumentará la carga financiera de los pacientes. Cuando la eficacia diagnóstica sea similar, se dará prioridad para el diagnóstico a un pequeño número de indicadores baratos. Al mismo tiempo, para que un indicador se utilice con éxito en la práctica clínica, debe combinar sus ventajas y desventajas en todos los aspectos, como si es fácil de detectar, si es estable, si es barato y si es oportuno. La mayoría de los artículos de análisis de la República de China sobre diagnóstico conjunto de índices múltiples en mi país ignoran las necesidades clínicas y recomiendan ciegamente el diagnóstico conjunto de índices múltiples, lo que está divorciado de la realidad clínica y debilita el valor de uso y promoción del artículo. Por lo tanto, al recomendar indicadores de diagnóstico o combinaciones de indicadores, las recomendaciones deben hacerse con precaución sin considerar plenamente los factores anteriores.

2.7 Tratar racionalmente el análisis ROC

Aunque el análisis ROC combina sensibilidad y especificidad para evaluar objetivamente la eficacia diagnóstica de los indicadores, también tiene sus propias deficiencias, tales como: a veces prestar especial atención a Especificidad de la enfermedad Diagnóstico sexual, como el diagnóstico de SIDA.

Si se descubre que un indicador cuantitativo es útil en el diagnóstico del SIDA, el análisis ROC no debería utilizarse en este momento, sino que debería combinarse con la realidad clínica. Preste atención a la situación en la que la especificidad es del 100% y no piense demasiado en la sensibilidad. Al mismo tiempo, el diagnóstico de algunas enfermedades no depende mucho de los indicadores de laboratorio. Los cambios en muchos indicadores se deben únicamente a la enfermedad, por lo que no es adecuado utilizar el análisis ROC porque los indicadores de laboratorio también enfrentan desafíos debido a las imágenes. patología, historia médica y desafíos de exploración física, etc. No utilice ciegamente el análisis ROC cuando los indicadores de laboratorio no tengan ventajas. En teoría, el recuento de glóbulos blancos se puede utilizar para diagnosticar un trauma, pero el diagnóstico de un trauma definitivamente no se basa en los glóbulos blancos, porque su diagnóstico se basa principalmente en el historial médico. Y no es broma, utilice el análisis ROC para analizar el papel de los glóbulos blancos en el diagnóstico de trauma.