¿Cuáles son algunos programas básicos de uso común en bioinformática?
Debe aprender: 1. Conceptos básicos de informática (linux perl R o python matlab)
2 Conocimientos básicos de bioinformática (formato de datos de base de datos de secuenciación)
3. Campos de investigación de la bioinformática (genoma completo, transcriptoma completo, exoma completo, secuenciación de la región objetivo de captura)
4. Campos de aplicación de la bioinformática (detección de tumores, diagnóstico prenatal, epidemiología, medicina química de la personalidad)
Divide y vencerás:
1. Para los conceptos básicos de informática, debes leer tres libros y aprender a dominarlos paso a paso. No es necesario buscar ningún libro deliberadamente. Generalmente, Linux es Brother Bird Private. cocinando, perl significa pequeño camello, R significa R en acción, pero solo puedes comenzar leyendo un libro. Si realmente quieres convertirte en un novato, ¡debes leer más de cinco libros cada uno! Tengo esta versión impresa básica de alta definición en mi disco en la nube. Puedes ir a Taobao e imprimirla por solo unas pocas docenas de yuanes con envío gratuito. Aquellos que sean más exigentes con los libros también pueden comprar la versión original, que solo cuesta. ¡Más de cien yuanes!
2. Conocimientos básicos de bioinformática y secuenciación. Encuentre más de una docena de artículos sobre secuenciadores de primera, segunda y tercera generación en la biblioteca de Baidu y léalos atentamente. Luego vaya a Youku para descargar explicaciones animadas. de los principales secuenciadores convencionales, y luego eche un vistazo a la explicación genética de Chen Wei; primero, consulte las tres bases de datos principales: NCBI, ENSEMBL, UCSC y algunas otras sobre las que también puede aprender (uniprot, IMGT, KEGG, OMIN, TIGR, GO) La biblioteca Baidu también busca información por sí misma, pero esta vez debe ir al sitio web oficial, hacer clic en cada página y traducir cada una al chino para comprenderla a fondo; se hablará mucho sobre el formato de los datos. Esto se aprende principalmente lentamente durante el proceso del proyecto, o si tienes la oportunidad de ir a clase; de lo contrario, leerás. Inmediatamente lo olvidé, que incluye principalmente sam, vcf, fasta, fastq, bed, gtf, gff, genbank, ensembl. , psl, etc.
3. Campo de investigación de bioinformática, cada campo contiene principalmente una variedad de software. Se estima que hay cientos de software de uso común en total, generalmente solo personas que han estado en el. Es probable que la industria los utilice todos durante más de cinco o seis años. Además, esto requiere completamente capacitación en proyectos, no solo leer el manual del software, sino también investigar. las revisiones de los principales expertos.
a) Software de bioinformática básica (blast suite, fastqc, flash, blast, solexaQA, NGS-QC-toolkit, SRA-toolkit, fastx-toolkit)
b) snp-calling software relacionado (bwa, bowtie, samtools, GATK, VarScan.jar, annovar)
c) Software relacionado con el genoma (velvet, SOAPdenovo2, repetición, repetición, pilar, orthoMCL, inparanoid, clustw, músculo, MAFFT, quickparanoid, blast2go, RAxML, phyML)
d) Software relacionado con el transcriptoma (trinity, tophat, cufflinks, RseQC, RNAseq, GOseq, MISO, RSEM, khmer, screed, trimmomatic, transDecoder, vast-tools, picard-tools, htseq, cuffdiff, edgeR, DEseq, funnet, davidgo, wego, kobas, KEGG, Amigo, go)