基于随机森林的高维生物医学数据因果推断方法研究
项目介绍
AI项目解读
基本信息
- 批准号:81872709
- 项目类别:面上项目
- 资助金额:25.0万
- 负责人:
- 依托单位:
- 学科分类:H3011.流行病学方法与卫生统计
- 结题年份:2020
- 批准年份:2018
- 项目状态:已结题
- 起止时间:2019-01-01 至2020-12-31
- 项目参与者:谢璐; 杨琳; 尤东方; 蔡晶晶; 岳园萍; 何文静;
- 关键词:
项目摘要
It is one of the ultimate goals to identify the causality in philosophy, natural science, social science and medicine. Modern biomedical researches have generated big and confounded datasets. Thus the analysis on high dimensional biomedical data should focus on not only association, but also causality. The present research introduces the definitions of causal inference into a framework of random forests (RF). After adjusting for complex confounding effects, we will use the RF to estimate the causal effects and make the corresponding hypothesis testing. We will also study on how to construct the mediation network for multi-omics data. Based on the above methodological study, we aim to set up the steps and strategies for causal inference using machine learning-based methods. Extensive simulations and real world –omics or longitudinal datasets will be used to evaluate the performance of the proposed methods. The present study will provide the methodology, theoretical references, and software supports for the causal inference on complex datasets.
探讨事物之间的因果关系,一直是哲学、自然科学、社会科学、医学等几乎所有科学研究的最终目的之一。现代生物医学研究产生了大而混杂的数据,因而高维生物医学数据的分析,不能只求关联,不求因果。本研究在随机森林框架下,引入因果推断的概念,在控制了复杂混杂后,实现因果分析中的效应估计和假设检验;探讨多组学数据高维中介网络的构建方法。通过以上的方法学研究,实现基于机器学习的高维生物医学数据的因果推断。本研究采用理论推导建立相关方法,利用计算机模拟试验评价所提出方法的性质,并结合真实数据考察相应方法的实际表现和应用条件。课题的顺利实施将为复杂数据的因果推断分析提供理论依据、方法参考和软件支持,具有重大的科学意义和实用价值。
结项摘要
探索因果关系是生物医学研究的最终目的之一。传统因果推断多基于回归模型,需要较多假设。本研究将随机森林等机器学习方法引入因果推断领域,开展了方法学与应用研究,取得了一系列成果。研究主要围绕效应估计和网络构建两个角度展开。在效应估计方面:申请人首先提出了srRF和倾向性加权随机森林法,模拟研究表明,这两种方法较传统随机森林能更好地控制混杂因素;课题组进一步比较了基于反事实框架下的因果森林、因果MARS等方法用于估计个体处理效应时的表现,并针对随机对照研究中的个体处理效应,提出了一套处理效应异质性,并优化最佳治疗措施选择的策略,用于SPRINT和ACCORD两个大型心血管病研究中的个体处理效应估计及亚组识别;提出了针对纵向队列数据,通过历史随机森林进行特征筛选,结合联合建模进行个体精准预测的思路,用于COVID-19和H7N9病人预后预测,准确率令人满意;在解决混杂因素后,利用因果森林进行中介效应估计,可以便捷地处理复杂混杂和多维中介变量问题,进行直接效应、间接效应等因果推断中重要统计量的估计。在网络构建方面:提出了交互随机森林法,其对于一阶交互作用的识别好于目前最佳的迭代随机森林法;比较了经典随机森林以及两种改进随机森林iRafNet和dynGENIE3从基因表达数据中推断调控网络的能力;基于代谢组学数据,建立交互作用网络;提出了随机森林用于调控网络识别的分析策略。本研究也基于方法学研究成果,开发了多个免费软件,提供了公共网址,供研究者进行使用。本研究的顺利完成,促进了机器学习与因果推断的有机整合,取得的成果将有力推进健康医疗大数据领域分析方法和应用研究的发展。
项目成果
期刊论文数量(9)
专著数量(0)
科研奖励数量(1)
会议论文数量(0)
专利数量(0)
利用因果森林估计异质性人群下个体的处理效应
- DOI:10.3760/cma.j.issn.0254-6450.2019.06.020
- 发表时间:2019
- 期刊:中华流行病学杂志
- 影响因子:--
- 作者:何文静;尤东方;张汝阳;于浩;陈峰;胡志斌;赵杨
- 通讯作者:赵杨
观察性研究中针对未测量混杂干扰的敏感性分析方法
- DOI:10.3760/cma.j.issn.0254-6450.2019.11.023
- 发表时间:2019
- 期刊:中华流行病学杂志
- 影响因子:--
- 作者:王丹华;尤东方;黄丽红;赵杨
- 通讯作者:赵杨
随机森林在基因调控网络推断上的比较与应用
- DOI:--
- 发表时间:2019
- 期刊:中国卫生统计
- 影响因子:--
- 作者:张铭智;尤东方;何文静;张汝阳;陈峰;胡志斌;赵杨
- 通讯作者:赵杨
临床试验数据人工审核清单的SAS宏实现
- DOI:--
- 发表时间:2019
- 期刊:中国临床药理学与治疗学
- 影响因子:--
- 作者:吴彩萍;赵杨
- 通讯作者:赵杨
Identification of genetic features associated with fine particulate matter (PM2.5) modulated DNA damage using improved random forest analysis
使用改进的随机森林分析识别与细颗粒物 (PM2.5) 调节的 DNA 损伤相关的遗传特征
- DOI:10.23919/ecc.2018.8550380
- 发表时间:2020
- 期刊:Gene
- 影响因子:3.5
- 作者:Dongfang You;Na Qing;Mingzhi Zhang;Juncheng Dai;Mulong Du;Yongyue Wei;RuyangZhang;Zhibin Hu;David C. Christiani;Yang Zhao;Feng Chen
- 通讯作者:Feng Chen
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
卵巢癌中E2F1通过影响miR-106b-5P调节RhoC的表达
- DOI:10.16695/j.cnki.1006-2947.2017.03.011
- 发表时间:2017
- 期刊:解剖科学进展
- 影响因子:--
- 作者:关雪;刘瑶;王丽丽;宗志红;陈说;赵杨
- 通讯作者:赵杨
ADaM在仿制药生物等效性试验安全性分析中的应用
- DOI:10.12092/j.issn.1009-2501.2020.06.008
- 发表时间:2020
- 期刊:中国临床药理学与治疗学
- 影响因子:--
- 作者:朱天一;蔡晶晶;黄家俊;耿正;赵杨;娄冬华;于浩;柏建岭
- 通讯作者:柏建岭
免耕对稻油轮作系统土壤结构的影响
- DOI:10.11766/trxb201911110460
- 发表时间:2021
- 期刊:土壤学报
- 影响因子:--
- 作者:刘玲玲;李超;房焕;赵杨;张中彬;彭新华;尹力初;周虎
- 通讯作者:周虎
新视角解读临床试验中的意向性原则
- DOI:10.12092/j.issn.1009-2501.2021.04.013
- 发表时间:2021
- 期刊:中国临床药理学与治疗学
- 影响因子:--
- 作者:黄丽红;王陵;言方荣;魏朝晖;赵杨;夏结来;陈峰
- 通讯作者:陈峰
健康中国人面部动静态对称性研究
- DOI:--
- 发表时间:2014
- 期刊:中华耳科学杂志
- 影响因子:--
- 作者:赵杨;冯国栋;庄园;田旭;高志强
- 通讯作者:高志强
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
赵杨的其他基金
环境混合污染物的健康效应统计分析方法研究
- 批准号:82373690
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
基于真实世界数据的个体处理效应估计方法研究
- 批准号:
- 批准年份:2021
- 资助金额:55 万元
- 项目类别:面上项目
整合常见和罕见变异进行肺癌风险预测的统计方法研究
- 批准号:81373102
- 批准年份:2013
- 资助金额:70.0 万元
- 项目类别:面上项目
基于基因表达数据的风险得分函数在肿瘤诊断和预后评价中的应用研究
- 批准号:30901232
- 批准年份:2009
- 资助金额:19.0 万元
- 项目类别:青年科学基金项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}