Semi-supervised Approaches to Denoising Electronic Health Records Data for Risk Prediction

用于风险预测的电子健康记录数据去噪半监督方法

基本信息

  • 批准号:
    10453558
  • 负责人:
  • 金额:
    $ 33.74万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2021
  • 资助国家:
    美国
  • 起止时间:
    2021-08-01 至 2025-04-30
  • 项目状态:
    未结题

项目摘要

Project Summary While clinical trials remain a critical source for oncology research, their study findings may not be gener- alizable to the real world due to the restricted patient population. In recent years, due to the increasing adoption of electronic health records (EHR) and the linkage of EHR with specimen bio-repositories and other research registries, integrated large datasets now exist as a new source for translational research. These integrated datasets open opportunities for developing accurate EHR-based prediction models for disease progression and treatment response, which can be easily incorporated into clinical practice. These models can also be contrasted with models derived from clinical trials, bridging the gap between clinical trials and the real world. However, efficiently deriving and evaluating personalized prediction models using such real world data (RWD) remains challenging due to practical and methodological obstacles. For example, validated outcome information from EHR, such as development of colon cancer and 1-year treatment response, requires laborious medical record review and hence is often not readily available for research. Naive use of error prone surrogates of the outcome, such as billing codes or procedure codes, as the true outcome may greatly hamper the power of EHR studies and produce biased results. Semi-supervised risk prediction methods, leveraging noisy surrogates and a small amount of human annotations on the outcome, may greatly improve the utility of EHR for precision medicine research. Deriving a precise estimate of the risk model becomes even more challenging when the number of candidate features is not small relative to the number of annotated outcomes. Another major challenge with EHR risk modeling lies in the transportability. Complex machine learning models trained in one EHR system often attain low accuracy in another EHR system, due to the heterogeneity in the patient population and healthcare system. Transfer learning methods that can automatically adjust model developed for one EHR cohort to better fit to another EHR cohort is of great value. Synthesizing information from multiple data sources can improve the quality of evidence. However, meta analyzing EHR from multiple EHR cohorts faces an additional challenge due to patient privacy. We address these challenges by developing semi-supervised risk prediction methods with high dimensional predictions in Aim 1; semi-supervised transfer learning methods to enable risk prediction modeling in target populations with no gold standard labels uted learin Aim 2; and distributed learning methods for high dimensional predictive modeling in Aim.
项目摘要 尽管临床试验仍然是肿瘤学研究的关键来源,但他们的研究结果可能并非产生。 由于患者人数受到限制,可与现实世界相称。近年来,由于采用的越来越多 电子健康记录(EHR)以及EHR与标本生物重新构件和其他研究的联系 注册表,集成的大数据集现在是转化研究的新来源。这些整合 数据集开放机会开发基于EHR的疾病进展的准确预测模型 和治疗反应,可以很容易地将其纳入临床实践中。这些模型也可以是 与临床试验得出的模型形成鲜明对比,弥合了临床试验与现实世界之间的差距。 但是,使用此类现实世界数据(RWD)有效地得出和评估个性化预测模型 由于实用和方法论上的障碍,仍然具有挑战性。例如,验证结果 EHR的信息,例如结肠癌的发展和1年治疗反应,需要 因此,经常不容易获得研究的病历审查,因此通常不容易获得研究。幼稚地使用易犯错 结果的替代物,例如计费代码或程序代码,因为真正的结果可能会大大妨碍 EHR研究的力量并产生有偏见的结果。半监督风险预测方法,利用 关于结果的吵闹代孕和少量人类注释可能会大大改善 EHR用于精确医学研究。得出对风险模型的确切估计变得更加 相对于注释结果的数量,候选功能的数量并不小时,具有挑战性。 EHR风险建模的另一个主要挑战在于运输能力。复杂的机器学习模型 在一个EHR系统中受过训练通常在另一个EHR系统中获得较低的精度,因为该系统的异质性 患者人群和医疗保健系统。可以自动调整模型的转移学习方法 为一个EHR队列开发以更好地适合另一个EHR队列。综合信息 来自多个数据源可以提高证据质量。但是,元分析来自多个的EHR EHR队列由于患者隐私而面临另一个挑战。我们通过发展来应对这些挑战 AIM 1中具有高维预测的半监督风险预测方法;半监督转移 学习方法可以在目标种群中启用风险预测建模,而没有黄金标签标签 Learin Aim 2;以及针对AIM中高维预测建模的分布式学习方法。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

TIANXI CAI其他文献

TIANXI CAI的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('TIANXI CAI', 18)}}的其他基金

Bridging clinical trial and real-world data via machine learning to advance rheumatoid arthritis treatment strategies
通过机器学习连接临床试验和真实世界数据,以推进类风湿性关节炎的治疗策略
  • 批准号:
    10652251
  • 财政年份:
    2022
  • 资助金额:
    $ 33.74万
  • 项目类别:
Bridging clinical trial and real-world data via machine learning to advance rheumatoid arthritis treatment strategies
通过机器学习连接临床试验和真实世界数据,以推进类风湿性关节炎的治疗策略
  • 批准号:
    10339668
  • 财政年份:
    2022
  • 资助金额:
    $ 33.74万
  • 项目类别:
Studying exceptional treatment non-responders and genetics to predict treatment response in rheumatoid arthritis
研究特殊治疗无反应者和遗传学以预测类风湿关节炎的治疗反应
  • 批准号:
    10430273
  • 财政年份:
    2021
  • 资助金额:
    $ 33.74万
  • 项目类别:
Semi-supervised Approaches to Denoising Electronic Health Records Data for Risk Prediction
用于风险预测的电子健康记录数据去噪半监督方法
  • 批准号:
    10185327
  • 财政年份:
    2021
  • 资助金额:
    $ 33.74万
  • 项目类别:
Studying exceptional treatment non-responders and genetics to predict treatment response in rheumatoid arthritis
研究特殊治疗无反应者和遗传学以预测类风湿关节炎的治疗反应
  • 批准号:
    10301407
  • 财政年份:
    2021
  • 资助金额:
    $ 33.74万
  • 项目类别:
Semi-supervised Approaches to Denoising Electronic Health Records Data for Risk Prediction
用于风险预测的电子健康记录数据去噪半监督方法
  • 批准号:
    10617781
  • 财政年份:
    2021
  • 资助金额:
    $ 33.74万
  • 项目类别:
Robust Approaches to the Development and Evaluation of Prognostic Classifiers
预后分类器开发和评估的稳健方法
  • 批准号:
    8181612
  • 财政年份:
    2007
  • 资助金额:
    $ 33.74万
  • 项目类别:
Robust Approaches to the Development and Evaluation of Prognostic Classifiers
预后分类器开发和评估的稳健方法
  • 批准号:
    7356026
  • 财政年份:
    2007
  • 资助金额:
    $ 33.74万
  • 项目类别:
Robust Approaches to the Development and Evaluation of Prognostic Classifiers
预后分类器开发和评估的稳健方法
  • 批准号:
    7185413
  • 财政年份:
    2007
  • 资助金额:
    $ 33.74万
  • 项目类别:
Robust Approaches to the Development and Evaluation of Prognostic Classifiers
预后分类器开发和评估的稳健方法
  • 批准号:
    8501533
  • 财政年份:
    2007
  • 资助金额:
    $ 33.74万
  • 项目类别:

相似国自然基金

采用新型视觉-电刺激配对范式长期、特异性改变成年期动物视觉系统功能可塑性
  • 批准号:
    32371047
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
破解老年人数字鸿沟:老年人采用数字技术的决策过程、客观障碍和应对策略
  • 批准号:
    72303205
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
通过抑制流体运动和采用双能谱方法来改进烧蚀速率测量的研究
  • 批准号:
    12305261
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
采用多种稀疏自注意力机制的Transformer隧道衬砌裂缝检测方法研究
  • 批准号:
    62301339
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
政策激励、信息传递与农户屋顶光伏技术采用提升机制研究
  • 批准号:
    72304103
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Enhancing Hypnotic Medication Discontinuation in Primary Care through Supervised Medication Tapering and Digital Cognitive Behavioral Insomnia Therapy
通过监督药物逐渐减量和数字认知行为失眠治疗,加强初级保健中催眠药物的停药
  • 批准号:
    10736443
  • 财政年份:
    2023
  • 资助金额:
    $ 33.74万
  • 项目类别:
Development of an endometrial ablation drug-device combination to treat heavy menstrual bleeding
开发子宫内膜消融药物装置组合来治疗月经出血
  • 批准号:
    10759501
  • 财政年份:
    2023
  • 资助金额:
    $ 33.74万
  • 项目类别:
A comprehensive platform for low-cost screening and image-guided photodynamic therapy (PDT) of pre-malignant and malignant oral lesions in low resource settings
一个综合平台,用于在资源匮乏的环境中对癌前和恶性口腔病变进行低成本筛查和图像引导光动力治疗 (PDT)
  • 批准号:
    10648426
  • 财政年份:
    2023
  • 资助金额:
    $ 33.74万
  • 项目类别:
SCALE: Strategies for Implementing GlobalConsent to Prevent Sexual Violence in University Men
SCALE:实施全球共识以防止大学男性性暴力的策略
  • 批准号:
    10672800
  • 财政年份:
    2023
  • 资助金额:
    $ 33.74万
  • 项目类别:
Adapting Online Obesity Treatment for Primary Care Patients in Poverty
为贫困初级保健患者采用在线肥胖治疗
  • 批准号:
    10722366
  • 财政年份:
    2023
  • 资助金额:
    $ 33.74万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了