Red de conocimientos sobre prescripción popular - Conocimiento dental - Cómo utilizar la relación señal-ruido para la selección de genes característicos

Cómo utilizar la relación señal-ruido para la selección de genes característicos

Con la aparición de la tecnología de microarrays de ADN, se han publicado en Internet una gran cantidad de conjuntos de datos de perfiles de expresión genética sobre diferentes tumores, lo que convierte el estudio de la selección de genes característicos de los tumores y la clasificación de subtipos en un campo de la bioinformática. puntos calientes. El método de selección de características K-split Lasso se propone basado en el método Lasso (operador de selección y contracción mínima absoluta). La idea básica es dividir el conjunto de datos en K partes de manera uniforme y utilizar el método Lasso para seleccionar características para cada parte. luego use el seleccionado. Cada subconjunto de características se combina y la selección de características se realiza nuevamente para obtener el gen de característica final. El experimento utiliza una máquina de vectores de soporte como clasificador. Los resultados muestran que el método K-split Lasso reduce las características redundantes, mejora la precisión de la clasificación y tiene buena estabilidad. Dado que la dimensionalidad de cada cálculo se reduce, el método K-split Lasso resuelve el problema de la sobrecarga computacional excesiva y resuelve el problema de sobreajuste hasta cierto punto. Por lo tanto, el método K-split Lasso es un método eficaz para seleccionar genes característicos de tumores.