基于机器学习策略优化猪基因组选择的方法研究
项目介绍
AI项目解读
基本信息
- 批准号:31702087
- 项目类别:青年科学基金项目
- 资助金额:25.0万
- 负责人:
- 依托单位:
- 学科分类:C1702.家畜种质资源与遗传育种学
- 结题年份:2020
- 批准年份:2017
- 项目状态:已结题
- 起止时间:2018-01-01 至2020-12-31
- 项目参与者:付明; 李岑岑; 候晔; 尹立林; 胡岸;
- 关键词:
项目摘要
Advances of high-throughput sequencing technologies have dramatically reduced the cost of genotyping and have made genomic prediction (selection) widely applied in livestock breeding programs and statistical model plays a key role. GBLUP (Genomic Best Linear Unbiased Prediction), owing to its computational efficiency, has been widely used in breeding practice. However, GBLUP assumes that all available markers have the same effect-size distribution, which limits the prediction accuracy. In contrast, Bayesian methods assume that variants have different effect distribution, have a higher prediction accuracy but the optimize process is very time-consuming, which limits the application of Bayesian methods in practice. So, it is important to balance the prediction accuracy and computational efficient. This study is designed to build a one thousand large white pig reference population database based on available samples and related phenotype record; using the database, combing with the feature of GWAS (Genome-Wide Association Study) results, new method optimize the fixed effects and random effects using machine learning based multivariate linearity regression method and cross-validation based model selection strategy, respectively; Test and optimize the method using both simulation data and multi-species data in order to expand the application of new method; Speed up model selection procedure using parallel, set up a CPU-GPU mixed parallel compute platform. The study will innovate a new idea for optimizing genomic selection and will provide new method and tool for genomic selection on swine breeding.
高通量基因分型价格的降低使得基因组选择广泛地应用于家畜育种,统计模型扮演着关键角色。GBLUP模型由于计算高效,广泛用于育种实践,然而,其假设所有标记具有相同效应分布,限制了预测准确度。与此相反,贝叶斯方法假设标记效应服从不同分布,预测准确度较优,但模型优化过程极为耗时,限制了其在育种中的应用。因此,平衡预测准确度和计算效率具有重要的实践意义。本研究拟在课题组已采集样品和性状基础上构建千头大白猪参考群数据库;利用该数据库,结合目标性状全基因组关联分析结果特征,基于机器学习的多元线性回归方法和交叉验证的模型选择策略,分别对预测模型中的固定效应和随机效应部分进行优化;利用模拟、多物种数据对参数进行测试优化,拓展新方法的广泛适用性;对模型选择等过程进行并行加速优化,搭建CPU-GPU混合并行加速的计算平台。本研究将创新机器学习策略优化基因组选择的新思路,为猪基因组选择育种提供新的方法和工具。
结项摘要
基因组选择/预测是指利用覆盖于基因组的高密度遗传标记对未知表型(或育种值)进行预测的技术。在动植物育种领域,利用该技术可对不同经济性状进行早期选择,保留优势个体,淘汰劣势个体,既能提高群体总体性能表现以获得丰厚的经济效益,还能极大降低饲养及表型测量成本。预测准确性是基因组预测应用于实际的基本保证,而统计方法发挥至关重要的作用。线性混合模型(LMM,又称GBLUP)以其高效的计算效率优势成为目前基因组预测使用最广泛的方法,然而由于其简单的标记效应假设,预测准确性往往偏低,尤其对于受大效应基因影响的性状。另一类以贝叶斯(Bayes)理论为基础的方法,假设遗传标记对性状的影响可能有大、中、小或无影响,并遵循不同的分布,未知参数可以通过MCMC(蒙特卡洛马尔科夫)方法进行估计和优化,其预测准确性往往高于LMM方法,然而其复杂的假设导致众多的未知待估超参,参数的求解过程无法并行运算,计算效率低下,因此难以广泛应用于育种实践。高计算效率的方法预测准确性较低,高预测准确性的方法计算效率较低。为了解决这一难题,开展了本项目研究,获得的主要结果包括:(1)研发了可适用于不同遗传复杂程度性状的基因组选择新算法KAML,该算法给出了一个性状特异的、可加权遗传标记权重的方法,模拟数据与猪、人类、牛、马、玉米等物种的多个真实数据对其评估结果显示,新算法的预测准确性和计算效率综合表现超过GBLUP、BSLMM、BayesR等广泛应用的算法;(2)KAML给出了一个基于交叉验证、多元回归、网格搜索以及二分求极值等机器学习方法的模型框架,可灵活地对任意信息(如多组学)给出的标记权重进行评估、优化;(3)对于数十万个体以上的大群体,可随机选取部分群体来估计KAML模型中的未知参数。然后KAML可以利用预估计的参数和所有个体构建的亲缘关系矩阵,像GBLUP(或SSGBLUP)一样高效的处理育种大数据。本项目研发的KAML算法可助力我国猪等动植物的基因组育种产业发展。
项目成果
期刊论文数量(7)
专著数量(0)
科研奖励数量(1)
会议论文数量(0)
专利数量(1)
Factors Affecting the Accuracy of Genomic Selection for Agricultural Economic Traits in Maize, Cattle, and Pig Populations
影响玉米、牛和猪农业经济性状基因组选择准确性的因素
- DOI:10.3389/fgene.2019.00189
- 发表时间:2019-03
- 期刊:Frontiers in Genetics
- 影响因子:3.7
- 作者:Zhang Haohao;Yin Lilin;Wang Meiyue;Yuan Xiaohui;Liu Xiaolei
- 通讯作者:Liu Xiaolei
An integration analysis based on genomic, transcriptomic and QTX information reveals credible candidate genes for fat-related traits in pigs
基于基因组、转录组和 QTX 信息的整合分析揭示了猪脂肪相关性状的可靠候选基因
- DOI:10.1111/age.12971
- 发表时间:2020-06-18
- 期刊:ANIMAL GENETICS
- 影响因子:2.4
- 作者:Fu,Y.;Wang,L.;Liu,X.
- 通讯作者:Liu,X.
G2P: a Genome-Wide-Association-Study simulation tool for genotype simulation, phenotype simulation and power evaluation
G2P:用于基因型模拟、表型模拟和功效评估的全基因组关联研究模拟工具
- DOI:10.1093/bioinformatics/btz126
- 发表时间:2019-10-01
- 期刊:BIOINFORMATICS
- 影响因子:5.8
- 作者:Tang, You;Liu, Xiaolei
- 通讯作者:Liu, Xiaolei
KAML: improving genomic prediction accuracy of complex traits using machine learning determined parameters
KAML:使用机器学习确定的参数提高复杂性状的基因组预测准确性
- DOI:10.1186/s13059-020-02052-w
- 发表时间:2020-06-17
- 期刊:GENOME BIOLOGY
- 影响因子:12.3
- 作者:Yin, Lilin;Zhang, Haohao;Liu, Xiaolei
- 通讯作者:Liu, Xiaolei
A gene prioritization method based on a swine multi-omics knowledgebase and a deep learning model
基于猪多组学知识库和深度学习模型的基因优先排序方法
- DOI:10.1038/s42003-020-01233-4
- 发表时间:2020-09-10
- 期刊:COMMUNICATIONS BIOLOGY
- 影响因子:5.9
- 作者:Fu, Yuhua;Xu, Jingya;Zhao, Shuhong
- 通讯作者:Zhao, Shuhong
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
混沌序列OCDMA系统性能分析
- DOI:10.13756/j.gtxyj.2015.04.021
- 发表时间:2015
- 期刊:光通信研究
- 影响因子:--
- 作者:刘小磊;赵锋;张中卫;王立国
- 通讯作者:王立国
滇东黔西多煤层地区煤层气“层次递阶”地质选区指标体系构建
- DOI:--
- 发表时间:2018
- 期刊:煤炭学报
- 影响因子:--
- 作者:吴财芳;刘小磊;张莎莎
- 通讯作者:张莎莎
高压下页岩吸附特性及吸附异常原因分析
- DOI:--
- 发表时间:2014
- 期刊:中国矿业
- 影响因子:--
- 作者:刘小磊;吴财芳;夏大平
- 通讯作者:夏大平
多孔生物质混凝土的制备及其对水环境影响的模拟试验
- DOI:--
- 发表时间:2013
- 期刊:生态与农村环境学报
- 影响因子:--
- 作者:徐建平;廖斌;刘小磊;王强
- 通讯作者:王强
全光混沌序列发生器设计
- DOI:--
- 发表时间:2013
- 期刊:光电技术应用
- 影响因子:--
- 作者:刘小磊;恩德;王立国
- 通讯作者:王立国
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}

内容获取失败,请点击重试

查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图

请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
刘小磊的其他基金
基于多类遗传变异的猪基因组选择方法研究
- 批准号:32372843
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
复杂群体遗传背景下的猪基因组选择方法研究
- 批准号:
- 批准年份:2020
- 资助金额:58 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}