基于高维数据和全基因组标记的数量性状基因定位方法研究
项目介绍
AI项目解读
基本信息
- 批准号:31571558
- 项目类别:面上项目
- 资助金额:63.0万
- 负责人:
- 依托单位:
- 学科分类:C1301.农业信息学
- 结题年份:2019
- 批准年份:2015
- 项目状态:已结题
- 起止时间:2016-01-01 至2019-12-31
- 项目参与者:陈永雪; 郑珂晖; 颜吉强; 余尘; 冯盼峰; 庄虹莉;
- 关键词:
项目摘要
The classical methods of quantitative trait loci mapping cannot adapt to the high-dimensional and high-density genetic marker data. The genetic analysis for quantitative trait is one of the hot-spots on statistical genetics based on biological big data. There are four approachs based on the original work and the existing resources in this project: First, statistical test and Random Forest algorithm are applied to select marker and improve the existing statistical method on quantitative trait loci mapping; Second, Support Vector Machine and Particle Swarm Optimization algorithm on data mining technology are used to cluster and decrease the dimension of the models. The new method for gene selection and gene mapping is proposed; Third, Empirical Bayesian and Weighting Elastic net are used to gene mapping and gene selection for quantitative trait; Fourth, the genetic model of discrete linear equation is converted into that of continuous integral equation. Numerical integration is performed to find the integral. Exploring new data using the existing methods, the theory for gene mapping and gene selection is developed. Using cloud computing and parallel computing of computer technology, the feasibility and efficiency of the four methods are examined by computer simulations and real data. A series of the solution of genetic mapping and genomic selection are paved using high-dimensional data and whole genome sequence data, which are accurately and rapidly. All study provide for the theories reference and mean of genomic selection in practice. It is pushed the application of biological big data.
传统的数量性状基因定位方法已不适应高维和高密度的遗传标记数据,基于生物大数据的遗传数据分析是当代统计遗传学研究热点之一. 本项目基于原有工作基础和现有资源,开展下列研究:第一,应用随机森林算法进行标记选择,改进已有的数量性状基因定位统计方法;第二,应用支持向量机与粒子群算法等数据挖掘技术,进行聚类和降维,发展新的基因选择和基因定位方法;第三,应用Empirical Bayesian与加权Elastic net 统计学方法,提出新的数量性状基因定位统计方法;第四,将离散的线性遗传模型转换成连续的积分遗传模型,数值积分被应用,产生新的数据,拓展基因选择和定位理论研究. 以上四种方法均采用计算机模拟和实际数据验证它们的有效性和可行性,计算机技术中的云计算和并行计算被采用. 由此提出一系列基于高维数据、全基因组范围内、能准确和快速地进行数量性状基因定位的方法,对生物大数据的应用起到积极的推动作用.
结项摘要
项目《基于高维数据和全基因组标记的数量性状基因定位方法研究》(31571558)2015年获得国家自然基金面上项目资助,项目执行期:2016年1月至2019年12月。本项目主要是在高密度遗传标记的情况下,遗传标记的选择(即高维数据降维)和基因关联分析方法的研究。历经四年主要取得以下结果:第一,传统的复合区间作图方法进行QTL定位,通常是采用逐步回归的分析方法选择余因子,然余因子选择不同影响了QTL定位的结果. 我们提出了一个适用于高密度遗传图谱QTL定位的统计分析方法,称为复合标记检验方法,并得出当遗传线性模型的F检验值达到最大时,所选择的余因子最合适,在此基础上进行QTL定位,能提高QTL定位的效率和精度;第二,由于高密度遗传标记之间经常存在共线性,故可以通过随机森林算法进行遗传标记选择,我们发展了基于随机森林两阶段逐步变量选择算法,即第一阶段变量重要性排序的改进方法,以进一步提高重要变量与噪声变量的区分度;第二阶段基于随机森林算法的逐步变量选择方法;通过该方法选择变量后确定线性遗传模型以及进行基因定位分析;第三,我们针对基于惩罚函数的变量选择开展基因关联分析的应用研究,我们提出了高维遗传标记数据的多性状联合基因关联分析方法,该方法主要是利用基于协方差估计的稀疏的多因变量回归模型,通过构造惩罚函数进行遗传标记的选择和关联分析;第四,当遗传标记密度越来越高时,我们可以将传统线性遗传模型转换成积分遗传模型,利用函数型数据分析方法进行基因关联分析,我们提出了基于函数线性回归模型局部稀疏估计的基因关联分析方法,改进了基因关联分析检测的“假阳性”,该方法适合于罕见变异的基因关联分析。我们还拓展到进行印迹QTL定位等研究工作,总之,我们从理论上构建了一系列基于高密度遗传标记的数量性状基因关联分析方法;本项目现已发表文章10篇,其中SCI收录四篇,软件著作权三个,研究生毕业五人,完成预期目标。
项目成果
期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Impact on the predator population while lethal disease spreads in the prey
致命疾病在猎物中传播时对捕食者种群的影响
- DOI:10.1002/mma.3737
- 发表时间:2016-07
- 期刊:Mathematical Methods in the Applied Sciences
- 影响因子:2.9
- 作者:Chen Yongxue;Wen Yongxian
- 通讯作者:Wen Yongxian
基于网络搜索数据的福州市商品房价格指数预测模型研究
- DOI:10.19374/j.cnki.14-1145/f.2017.02.025
- 发表时间:2017
- 期刊:生产力研究
- 影响因子:--
- 作者:庄虹莉;李立婷;林雨婷;刘艺辉;温永仙
- 通讯作者:温永仙
惩罚函数下的我国中小上市公司价值影响因素研究
- DOI:10.14155/j.cnki.35-1293/g4.2017.03.009
- 发表时间:2017
- 期刊:武夷学院学报
- 影响因子:--
- 作者:庄虹莉;李立婷;林雨婷;温永仙
- 通讯作者:温永仙
基于随机森林算法的两阶段变量选择研究
- DOI:--
- 发表时间:2018
- 期刊:系统科学与数学
- 影响因子:--
- 作者:冯盼峰;温永仙
- 通讯作者:温永仙
基于Logistic回归惩罚函数的企业财务危机预警
- DOI:--
- 发表时间:2017
- 期刊:科技和产业
- 影响因子:--
- 作者:李立婷;庄虹莉;林雨婷;温永仙
- 通讯作者:温永仙
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
结合色彩特征和空域特征的成捆原木轮廓识别
- DOI:--
- 发表时间:2013
- 期刊:计算机系统应用
- 影响因子:--
- 作者:林耀海;温永仙;黄世国;林宜宽
- 通讯作者:林宜宽
基于E-bayes的F_2群体胚乳性状QTL上位性的分析
- DOI:--
- 发表时间:2015
- 期刊:福建农林大学学报(自然科学版)
- 影响因子:--
- 作者:余尘;温永仙
- 通讯作者:温永仙
基于BC1F1:2种子的胚乳QTL区间定位
- DOI:--
- 发表时间:2011
- 期刊:生物数学学报
- 影响因子:--
- 作者:温永仙
- 通讯作者:温永仙
改进的模拟退火算法在蛋白质结构预测中的应用
- DOI:--
- 发表时间:2013
- 期刊:福建农林大学学报(自然科学版)
- 影响因子:--
- 作者:朱均燕;温永仙
- 通讯作者:温永仙
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}

内容获取失败,请点击重试

查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图

请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
温永仙的其他基金
基于函数型线性模型的数量性状基因关联分析新方法研究
- 批准号:
- 批准年份:2020
- 资助金额:58 万元
- 项目类别:面上项目
禾谷类作物胚乳性状多QTL定位统计方法研究
- 批准号:31171448
- 批准年份:2011
- 资助金额:61.0 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}