微生物组大数据研究中辅助信息协助的高维模型变量选择
项目介绍
AI项目解读
基本信息
- 批准号:11801571
- 项目类别:青年科学基金项目
- 资助金额:22.0万
- 负责人:
- 依托单位:
- 学科分类:A0402.统计推断与统计计算
- 结题年份:2021
- 批准年份:2018
- 项目状态:已结题
- 起止时间:2019-01-01 至2021-12-31
- 项目参与者:Chen Jun; 魏金龙; 魏巍;
- 关键词:
项目摘要
The big data research on microbiome data has played an important role in ecological environment, human health and disease research. The project mainly uses three practical problems in the analysis of microbiome data to drive us to develop the auxiliary information (predictor graph and covariate information) assisted variable selection in high-dimensional model. Firstly, using parameter estimation, obtained from the proposed high-dimensional sparse Gaussian copula regression model incorporating predictor graph information, to select useful bacterial species; Secondly, utilizing parameter estimation, obtained from the proposed high-dimensional sparse vary coefficient model incorporating predictor graph information, to identify the nonlinear interaction effects between the bacterial species and the other covariates. Thirdly, based on the framework of covariate information assisted high-dimensional regression model with the latent variables, using variable selection results on model parameters owning conditional sparsity structure by the proposed multiple testing procedure to find potential confounders adjusted bacterial species. The first two questions propose the novel models and consider high-dimensional and sparsity statistical inference, and the third one considers high dimensional and non-sparsity (high-dimensional conditional sparsity) variable selection case. All the methods can be applied to data sets in other fields. In addition, the project will study the theoretical property of the new methods.
微生物组大数据研究在生态环境、人类健康和疾病研究方面都起到了重要作用。本项目主要以微生物组数据研究中三个实际问题来驱动研究相应的辅助信息(预测变量图、协变量信息)协助的高维模型变量选择。第一,提出含有预测变量图的高维稀疏高斯Copula回归模型并用其参数估计来选择有用细菌种类;第二,提出含有预测变量图的高维稀疏变系数模型并用其参数估计来识别细菌种类与其它协变量的非线性交互效应;第三,基于协变量信息辅助的含有潜在变量高维回归模型框架,提出一个多重检验过程对模型中条件稀疏结构参数进行变量选择来找出潜在混杂因素矫正后的有用细菌种类。前两个问题提出的模型都是新颖的而且都是考虑高维稀疏变量选择,第三个问题考虑高维非稀疏(条件稀疏)变量选择情形。所有新方法都具有一般性,可以应用于很多其它领域数据。另外,本项目还将研究新方法的理论性质。
结项摘要
微生物组大数据研究在生态环境、人类健康和疾病研究方面都起到了重要作用。本项目主要以微生物组数据研究中实际问题来驱动研究相应的高维模型变量选择以及辅助信息(进化树信息、预测变量图、协变量信息) 协助的高维模型变量选择。分析过程主要涉及两个问题:第一,首先需要提出新颖的适合微生物组数据的高维模型或者先验信息(进化树信息、预测变量图、协变量信息)辅助的高维模型;第二,基于构造的高维模型该如何进行细菌种群的自变量选择。本项目正是基于这两个问题做了一些研究工作。首先申请人在项目前期,已发表一篇本基金项目支持的高水平期刊SCI论文(2021年影响因子5.640,JCR一区)。该工作提出了一个新颖的利用进化树信息协助的稀疏惩罚回归方法来进行微生物中大规模细菌种群变量的选择,提出的方法相比较现有方法在某些情形下具有较好的预测性能,另外在实际数据分析中也有新的发现。在该项目中后期,申请者围绕本项目研究的问题,分别做出了以下几个工作:1、提出允许非线性关联关系的高维组合数据模型,并提出稳健的大规模多重检验框架下的False discovery rate(FDR)控制方法对其进行变量选择;2、提出微生物组数据网络信息辅助的高维组合数据模型,并提出稳健的FDR控制方法对其进行变量选择;3、提出基于高维组合数据模型的环境变量协助的FDR控制的变量选择方法。目前这些工作都在投稿中,另外还有一些包括利用混杂协变量信息矫正的高维模型并提出FDR控制方法对其预测变量进行变量选择等工作也在攥写中。总之,申请人的工作内容都紧扣项目的研究问题,先利用额外的结构信息或其它协变量信息来提出新颖的高维模型,再针对模型进行基于惩罚或者FDR控制的自变量选择。
项目成果
期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A Phylogeny-Regularized Sparse Regression Model for Predictive Modeling of Microbial Community Data
用于微生物群落数据预测建模的系统发育正则稀疏回归模型
- DOI:10.3389/fmicb.2018.03112
- 发表时间:2018-12
- 期刊:Frontiers in Microbiology
- 影响因子:5.2
- 作者:Xiao Jian;Chem Li;Yu Yue;Zhang Xianyang;Chen Jun
- 通讯作者:Chen Jun
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
span style=font-family:宋体;font-size:10.5pt;硫化氢调节/spanspan style=font-family:#39;Times New Roman#39;,#39;serif#39;;font-size:10.5pt;miRNA-455/spanspan style=font-family:宋
- DOI:--
- 发表时间:2014
- 期刊:医学研究生学报
- 影响因子:--
- 作者:刘红明;洪江;朱晓燕;薛乾;肖健;张宇峰;杨潜;倪鑫;王志农
- 通讯作者:王志农
统计能量参数获取技术的应用研究
- DOI:--
- 发表时间:2017
- 期刊:航天器环境工程
- 影响因子:--
- 作者:秦朝红;任方;张忠;刘振皓;原凯;肖健;张鹏飞
- 通讯作者:张鹏飞
丽江2.4米望远镜观测日志辅助系统的设计与研发
- DOI:--
- 发表时间:2020
- 期刊:天文研究与技术
- 影响因子:--
- 作者:王传军;王德清;肖健;尹树成;王锋;范玉峰;和寿圣;丁旭
- 通讯作者:丁旭
基于MapReduce模型的分布式天文交叉证认
- DOI:--
- 发表时间:--
- 期刊:计算机应用研究
- 影响因子:--
- 作者:赵青;孙济洲;肖健;于策;崔辰州;刘旭;袁鳌
- 通讯作者:袁鳌
基于光纤环形镜的铒镱共掺双包层光纤放大器的增益平坦化
- DOI:--
- 发表时间:--
- 期刊:光电子-激光
- 影响因子:--
- 作者:胡贵军;肖健;刘聪;李莉
- 通讯作者:李莉
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}

内容获取失败,请点击重试

查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图

请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}