南湖网讯(通讯员 章元明)近日,国际数学与计算生物学领域知名期刊《Briefings in Bioinformatics》在线发表了我校植物科技学院统计基因组学团队在关联分析和连锁分析方法学方面的系列研究成果。论文题为“Methodological implementation of mixed linear models in multi-locus genome-wide association studies"(多位点关联分析混合线性模型方法学的实施),提出了高效、计算准确的多位点关联分析新算法。
在全基因组关联分析中,为控制其假阳性率,研究人员一般采用Bonferroni矫正,从而造成单标记扫描的显著水平过低、常常丢失重要关联位点。为此,我校新葡的京集团3512vip统计基因组学团队提出模型变换新算法,根据快速计算算法和多位点遗传模型思想,构建了多位点关联分析的新框架。该框架是利用新算法扫描全基因所有标记,再选择大量潜在关联的标记进行多位点贝叶期压缩估计分析,最后将非零效应进行似然比检验以获得真QTN。这种方法称为快速检测多位点随机SNP效应混合模型方法。
Monte Carlo模拟研究和实际数据分析表明,新方法优于EMMA、SUPER、CMLM和ECMLM等方法。为了让新方法快速应用于人类、动物和植物关联分析研究,团队也研制了在R环境运行的带有界面功能的免费软件包mrMLM 。为了进一步验证新方法的正确性,团队从多个侧面提出多种多位点关联分析新方法,例如ISIS EM-BLASSO、mrMLM和pLARmEB,分别在统计基因组学领域主流期刊PLoS Computational Biology、Scientific Reports和Heredity等刊物上发表。经拟南芥实际数据分析表明,这些方法间具有互补性,可相互结合使用。
在QTL定位连锁分析中,目前广泛使用的复合区间作图CIM方法存在背景控制时未考虑小效应与微效应的QTL、背景标记的筛选受各种因素的影响等不足。为此,团队提出了全基因组复合区间作图(Genome-wide Composite Interval Mapping)的新方法。利用上述关联分析新方法进行背景控制以扫描基因组上的所有可能位置,并认为-log10(P-value)曲线峰值点有存在QTL的可能,将这些潜在QTL放入多位点遗传模型进行贝叶期压缩估计分析,将非零效应进行似然比检验以获得真QTL。通过Monte Carlo模拟研究和实际数据分析表明,在检测小效应和连锁(特别是异号) QTL时,新方法显著优于CIM等方法。
针对关联分析未考虑显性效应和F2群体连锁分析中显性所占份额较小的不足,团队提出了利用部分NCII遗传交配设计群体进行数量性状遗传分析的新方法(PLoS ONE 2015,10(3): e0121034)。利用这种策略和EBLASSO参数估计方法剖析了杂种优势的遗传基础,获得各遗传组分对杂种优势的相对贡献大小(Scientific Reports 2015, 5: 18376)。日前,中国农科院作物研究所利用我们两年前提出的策略和国际上已有的软件包剖析了玉米开花时间相关性状的遗传基础和杂种优势,并予以报道。
据悉,自2014年7月以来,我校新葡的京集团3512vip统计基因组学团队在统计基因组学领域提出了三类全新的连锁分析与关联分析框架与方法,已发表通讯作者论文13篇,团队负责人章元明被遴选为Heredity(英国遗传学会会刊和国际数量遗传学主流刊物,2017-)、BMC Genetics(2011-)、Canadian Journal of Plant Science(2011-)和作物学报(2014-)等知名刊物编委,并被授予加拿大作物学会荣誉会员。
【相关链接】
https://academic.oup.com/bib/article-abstract/2965637/Methodological-implementation-of-mixed-linear
https://cran.r-project.org/web/packages/mrMLM/index.html
http://journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1005357
http://www.nature.com/articles/srep19444
http://www.nature.com/articles/srep29951
http://icscaas.com.cn/Html/2017_01_17/17968_18131_2017_01_17_115031.htm
审核人:朱正宁