Pipeline de Expressão diferencial em R aplicado à Arabidopsis thaliana
Devido a imensa complexidade genômica das plantas, a análise de transcriptômica assume um papel relevante para entendimento do mecanismo biológico, visto que além de dar indícios de como o organismo responde em determinada situação, o sequenciamento de RNA também pode ser utilizado para auxiliar a resolução de problemas de ordem genômica. A análise de expressão diferencial pode ser dividida em quatro etapas: i) análise de qualidade e trimagem dos dados; ii) alinhamento dos fragmentos à referência; iii) quantificação dos transcritos; e iv) análise de expressão diferencial. Em geral, apenas a etapa de análise de expressão diferencial (iv) é realizada em linguagem R, porém, nesse capítulo apresentamos uma versão diferenciada, em que os softwares externos também foram executados por comandos no R. Como estudo de caso foi utilizado um experimento de Arabidopsis thaliana, um organismo modelo que apresenta um ciclo de vida curto, é facilmente manipulado em laboratório e tem seu genoma bem estudado.
Pipeline de Expressão diferencial em R aplicado à Arabidopsis thaliana
-
DOI: 10.22533/at.ed.35520090311
-
Palavras-chave: Transcriptômica de plantas, expressão diferencial, Arabidopsis thaliana, RNA-seq
-
Keywords: Plant transcriptomics, differential expression, Arabidopsis thaliana, RNA-seq
-
Abstract:
Due to the immense complexity of plant genomes, transcriptomic analysis plays a relevant role in understanding the biological mechanism, since in addition to providing evidence of how the organism responds in a given situation, RNA sequencing can also be used to aid genomic information. The analysis can be divided into four steps: i) quality analysis and data trimming; ii) alignment of fragments to the reference; iii) quantification of transcripts; and iv) differential expression analysis. In general, only the differential expression analysis step (iv) is performed in R language, but in this chapter we present a different version, in which external software was executed by commands in R. As an example was used an experiment of Arabidopsis thaliana, a model organism with a short life cycle, a well studied genome and easy to manipulate in laboratory.
-
Número de páginas: 15
- Sheila Tiemi Nagamatsu
- Lucas Miguel de Carvalho
- Nicholas Vinícius Silva
- Marcelo Falsarella Carazzolle
- Gonçalo Amarante Guimarães Pereira
- Luciana Souto Mofatto