复杂疾病非线性基因效应探测的高维统计推断模型研究
项目介绍
AI项目解读
基本信息
- 批准号:81872717
- 项目类别:面上项目
- 资助金额:54.0万
- 负责人:
- 依托单位:
- 学科分类:H3011.流行病学方法与卫生统计
- 结题年份:2022
- 批准年份:2018
- 项目状态:已结题
- 起止时间:2019-01-01 至2022-12-31
- 项目参与者:李少玉; 高霞; 闫丽娜; 冯彦成; 郭志旺; 秦璞;
- 关键词:
项目摘要
Genome-wide association studies have identified numerous genetic variants associated with complex disease. However, these variants can only explain a small portion of heritability in many diseases. Gene-based association methods have been proved to be alternative strategies to capture some missing heritability, but the majority of these methods are based on linear model and cannot be generalized to high-dimensional data. Recent advances in high-dimensional model development have been shifted from high-dimensional variable selection to high-dimensional statistical inference. While most inference procedures are still built upon linear models, they fail to capture any potential nonlinear relationship. Moreover, these models have limited power to detect weak genetic signals. Our previous study revealed that a composite kernel can substantially improve the performance of dealing with nonlinear problems, and a maximum statistic method distribution and a p-value combination method can respectively improve the power of two genetic effect hypotheses which are main loci determinism and loci micro effect accumulation theory. Motivated by this, in this project we propose to construct a gene-based nonlinear high-dimensional statistical inference procedure that can be adaptive to the two genetic effect hypotheses by combing the composite kernel idea, linear high-dimensional statistical inference procedure and Omnibus Test, to improve the power of detecting genetic variants, and to provide a novel statistical framework for the study of genetic mechanism underlying complex human diseases.
目前全基因组关联分析已找到了大量复杂疾病相关遗传变异,但这些变异只能解释很小一部分遗传力。基于基因的方法被认为可以弥补一些缺失的遗传力,但这些方法大多基于线性模型,也无法拓展到高维数据上。近年来高维统计模型的开发已从高维变量筛选发展到高维统计推断,但大多仍为线性模型,无法捕捉遗传变异与复杂疾病间的非线性关系,且对微效变异的探测能力不高。我们前期研究发现应用复合核(Composite kernel)可以提高核方法处理非线性问题的能力,也发现“最大统计量”分布和合并p值方法可以分别提高两种遗传效应假设(主要位点决定论和位点微效累加论)的检验效能。本项目将联合应用复合核方法、线性高维统计推断模型以及混合检验(Omnibus Test)方法,构建能够自适应两种遗传效应假设的基于基因的非线性高维统计推断模型,以提高对遗传变异的探测能力,为研究复杂疾病的遗传机制提供统计学新方法。
结项摘要
传统GWAS大多是对单一SNP进行分析,所识别的易感位点只解释了复杂疾病中一小部分的遗传力。若能同时考虑一组SNPs,那么将能够解释复杂疾病中大部分的遗传力,从而减少遗传力的缺失,即从基因水平(一组SNPs)上研究遗传变异与复杂疾病的关联可以很好地弥补传统遗传力的缺失,有助于理解复杂疾病背后的遗传学机制。目前,在探测基因对复杂疾病的效应时,通常采用的是线性模型,然而基因对复杂疾病的效应通常是未知的,而且很有可能是非线性的,因此不具备自适应不同遗传效应的线性模型的应用就有一定的局限性,且易致假阴性。本项目提出非线性基因效应探测的高维统计推断模型,基于群体关联分析原理,将线性高维统计推断模型拓展到非线性模型研究,以解决基因效应探测方法中模型假设性过强、检验效能过低等的不足。基于核方法理论、引入Omnibus Test思想,我们提出了以下的模型框架和开展了以下的工作:.1.针对基因组内超高维的SNP数据,我们提出了一个三阶段的建模框架,即第一阶段先应用变量筛选的方法将超高维数据降至高维;第二阶段应用高维统计推断方法得到每一个SNP的P值;第三阶段将SNPs映射到相应的基因,并利用Omnibus test的思想得到基因水平的P值,并实现遗传效应的自适应探测。此模型考虑以基因为单位,具备自适应不同遗传效应的能力;.2.通过引入核方法理论,构建高维数据环境下核主成分回归模型,解决了模型捕捉非线性效应的问题。.3.为了解决核主成分个数保留的问题,我们提出基于pre-image理论的核主成分个数保留技术,使模型的推断结果更加稳健。.4.为了解决ART-A中最小P值个数的选择问题,我们提出了iATR-A方法,使P值整合方法更稳健,检验效能更高。.5.通过大量的模拟证实了模型对线性和非线性效应的探测能力,对其有效性和实用性进行评价,相关计算程序采用R语言编写,可以广泛推广。.6.应用于阿尔兹海默症SNP数据,通过实际数据分析来验证模型的实证性。.我们开发的方法和程序为复杂疾病的基因诊断和预防以及遗传机制研究提供了研究工具与有效的方法。
项目成果
期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Risk Prediction in Patients With Heart Failure With Preserved Ejection Fraction Using Gene Expression Data and Machine Learning.
使用基因表达数据和机器学习对射血分数保留的心力衰竭患者进行风险预测
- DOI:10.3389/fgene.2021.652315
- 发表时间:2021
- 期刊:Frontiers in genetics
- 影响因子:3.7
- 作者:Zhou L;Guo Z;Wang B;Wu Y;Li Z;Yao H;Fang R;Yang H;Cao H;Cui Y
- 通讯作者:Cui Y
Cancer subtyping with heterogeneous multi-omics data via hierarchical multi -kernel learning
通过分层多核学习利用异构多组学数据进行癌症亚型分析
- DOI:10.1093/bib/bbac488
- 发表时间:2022-11-25
- 期刊:BRIEFINGS IN BIOINFORMATICS
- 影响因子:9.5
- 作者:Wei,Yifang;Li,Lingmei;Cui,Yuehua
- 通讯作者:Cui,Yuehua
基于因果推断方法检验mRNA在年龄和低级别胶质瘤中的中介效应
- DOI:10.3969/j.issn.1002-3674.2020.06.010
- 发表时间:2020
- 期刊:中国卫生统计
- 影响因子:--
- 作者:王碧珏;郭志飞;杨海涛;李治;王菊平;曹红艳;周立业
- 通讯作者:周立业
Multilevel heterogeneous omics data integration with kernel fusion
通过核融合进行多级异构组学数据集成
- DOI:10.1093/bib/bby115
- 发表时间:2020-01-01
- 期刊:BRIEFINGS IN BIOINFORMATICS
- 影响因子:9.5
- 作者:Yang, Haitao;Cao, Hongyan;Cui, Yuehua
- 通讯作者:Cui, Yuehua
Multi-omics data integration for subtype identification of Chinese lower-grade gliomas: A joint similarity network fusion approach.
用于中国低级别胶质瘤亚型识别的多组学数据集成:联合相似性网络融合方法
- DOI:10.1016/j.csbj.2022.06.065
- 发表时间:2022
- 期刊:Computational and structural biotechnology journal
- 影响因子:6
- 作者:
- 通讯作者:
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
聚乙烯亚胺功能化石墨烯修饰电极同时测定抗坏血酸、多巴胺、尿酸和色氨酸
- DOI:--
- 发表时间:2015
- 期刊:高等学校化学学报
- 影响因子:--
- 作者:李冲;贾丽萍;马荣娜;贾文丽;王怀生;杨海涛;郭爱香
- 通讯作者:郭爱香
木质纤维素聚氨酯共聚型高强度功
- DOI:--
- 发表时间:--
- 期刊:包装工程. 27(1). 4-6,2006年2月
- 影响因子:--
- 作者:范建云;王鹏;杨志勇;杨海涛
- 通讯作者:杨海涛
铝离子对锌电积用Al/Pb-0.2%Ag合金阳极电化学性能的影响
- DOI:10.19476/j.ysxb.1004.0609.2018.07.12
- 发表时间:2018
- 期刊:中国有色金属学报
- 影响因子:--
- 作者:陈步明;杨健;郭忠诚;黄惠;杨海涛
- 通讯作者:杨海涛
仿酶絮凝法处理制浆造纸综合废水
- DOI:--
- 发表时间:--
- 期刊:纸和造纸
- 影响因子:--
- 作者:邵震宇;杨海涛;王松;帅兴华;谢益民
- 通讯作者:谢益民
大豆秸秆乙醇预处理脱木素动力学研究
- DOI:--
- 发表时间:2017
- 期刊:中国造纸学报
- 影响因子:--
- 作者:樊富广;涂洪峰;陈从鑫;姚兰;杨海涛
- 通讯作者:杨海涛
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}