Red de conocimientos sobre prescripción popular - Como perder peso - Tecnología analítica|Construya un modelo predictivo y dibuje la curva ROC del modelo

Tecnología analítica|Construya un modelo predictivo y dibuje la curva ROC del modelo

El 27 de mayo de 2020, un compañero de clase me encargó que hiciera un modelo de predicción para su artículo de análisis del gen Hub del cáncer, así como la curva ROC del modelo y el valor AUC para verificar la confiabilidad del gen Hub. Si los genes Hub son significativos, los modelos de predicción basados ​​en genes Hub deberían poder clasificar eficazmente tejidos cancerosos o tejidos normales.

La estructura de este artículo es la siguiente:

El primero es la limpieza de datos y la detección del gen hub. En otras palabras, pueden omitir los datos directamente. etapas de limpieza e ingeniería de características.

1 ***10 genes clave, divididos en tres categorías, cáncer de alta malignidad (3), cáncer de baja malignidad (2) y tejido de control normal (1), las muestras son 9, 20 y 20 respectivamente. individual.

Primero, crea dos. txt para almacenar el contenido del valor de la característica y el contenido de la etiqueta de la Figura 2, características.txt y etiqueta_2.txt (por supuesto, también puede usar Panda para leer la tabla directamente, este es un hábito personal), y luego usar Python para leer el datos.

Aquí defino una función. Necesito usar la función principal para configurar what_class y elegir qué tipo de ROC dibujar.

La teoría ROC, el AUC y la curva ROC promedio micro/macro se pueden ver en esta teoría ROC. Esta sección explica brevemente los resultados del gráfico ROC de clases múltiples:

Este es un conjunto de entrenamiento directo de tres clases: la curva ROC del conjunto de prueba = 1: 1, la clase 0 representa la identificación del tejido normal. y dos tipos de tejido canceroso, clase1, clase2 representa la identificación de cáncer de bajo grado y otros dos tejidos, y clase2 representa la identificación de cáncer de alto grado y otros dos tejidos. Se puede observar que el valor AUC de la clase 2 es 1, lo que indica que el modelo establecido por el gen Hub es real.

[1] Documento oficial chino de sklearn: Máquina de vectores de soporte

[2] Características operativas del receptor (ROC)

[3] Receptor con dispositivo de validación cruzada Características operativas (ROC)