Métodos para mapeamento de QTL através de marcadores tipo SNP: uma comparação
O mapeamento de regiões no genoma associadas a traços quantitativos (QTLs) através de marcadores genéticos do tipo SNP tem sido um dos problemas centrais em Genética e Biologia Molecular e vários métodos de detecção e identificação de QTLs tem sido propostos na literatura. Neste trabalho, três diferentes metodologias foram aplicadas e comparadas nos dados GAW17 quanto ao seus desempenhos em identificar corretamente SNPs relevantes e reguladores de um traço quantitativo. São elas: regressão linear simples com e sem a correção de Bonferroni no nível de significância, LASSO e SPLS. A fim de comparar o desempenho dessas metodologias, utilizamos a sensibilidade e a especificidade como métricas e notamos que o LASSO e a regressão linear simples com nível de significância de 5% apresentam os melhores resultados, uma vez que equilibram valores relativamente altos de sensibilidade e especificidade. O LASSO, por sua vez, também identifica SNPs influentes mais raros. Para realizar esse estudo, utilizamos algoritmos que já estão implementados em pacotes estatísticos, tais como R, e que estão disponíveis para utilização.
Métodos para mapeamento de QTL através de marcadores tipo SNP: uma comparação
-
DOI: 10.22533/at.ed.50823150210
-
Palavras-chave: Teste de significância; LASSO; SPLS; variantes raras; seleção de variáveis.
-
Keywords: Test of significance; LASSO; SPLS; rare variants; variable selection.
-
Abstract:
Mapping regions in the genome associated with quantitative traits (QTLs) through SNP-type genetic markers has been one of the central problems in Genetics and Molecular Biology and several methods of detection and identification of QTLs have been proposed in the literature. In this work, three different methodologies are applied and compared in the data GAW17 regarding their performance in correctly identifying relevant and regulatory SNPs of a quantitative trait. They are: simple linear regression with and without Bonferroni correction for the significance level, LASSO and SPLS. For comparing the performance of these methodologies, we use sensitivity and specificity as metrics and noted that LASSO and simple linear regression with a significance level of 5% show the best results, since they balance relatively high values of sensitivity and specificity. LASSO, in turn, also identifies rarer influential SNPs. To carry out this study, we used algorithms that are already implemented in statistical packages, such as R, and that are available for use.
- Lara Midena João
- Daiane Aparecida Zuanetti