Joint learning methods for event and relation extraction from clinical narratives

从临床叙述中提取事件和关系的联合学习方法

基本信息

  • 批准号:
    10507223
  • 负责人:
  • 金额:
    $ 42.49万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2022
  • 资助国家:
    美国
  • 起止时间:
    2022-08-10 至 2025-07-31
  • 项目状态:
    未结题

项目摘要

Project Summary Electronic health records (EHRs), detailing patient status and all aspects of clinical care, can greatly facilitate quality improvement and surveillance initiatives as well as revolutionize clinical research. The unstructured clinical narratives in EHRs document critical information, including medical problems, treatments, and diagnostic tests as well as the rationale for care and outcomes. Natural Language Processing (NLP) and Information Extraction (IE) systems target the identification of such critical information from clinical narratives. These systems extract clinical concepts such as medical problems, treatments, and tests, determine the attributes of these concepts to get clarity on their presence/absence and other details in a patient; and identify the interactions of these concepts with each other in terms of predefined relations. Most clinical NLP systems that tackle the extraction of this information are pipeline based: i.e., extraction of clinical concepts precedes the determination of their attributes and the determination of relations between clinical concepts. While producing promising results, these systems suffer from two major limitations: (1) when faced with data imbalance, they perform best on the more prevalent classes of observations found in the data and suffer on the less prevalent ones, and (2) they allow errors to cascade between the components. These two limitations can also compound each other. As a result, the information extracted by NLP systems can be incomplete and coarse- grained, unable to support clinical applications that require a more fine-grained picture of the patient condition. In this project, we propose to address these limitations on a clinical information extraction task that aims to capture a more complete picture of the patient condition with a novel, fine-grained, hierarchical schema for clinically-salient events and their relations. We define clinically-salient events as medical problems, treatments, and tests that are documented during patient care. We capture each event in a frame that consists of a trigger and a set of fine-grained attributes. We build event–event relations on top of events. To address data imbalance, we propose (i) a novel active learning framework that guides manual annotation efforts towards diverse and informative samples that can boost automated recognition of less prevalent attributes and relations. To address cascading errors, we propose (ii) a novel joint learning system that enables multiple tasks to inform each other for better performance across all tasks. We evaluate our work on multiple note types from multiple institutions. Expected outcomes include (1) a comprehensive heterogeneous gold-standard dataset created from multiple institutions for clinically-salient events and relations, (2) NLP methods that generate state-of-the-art results in extraction of events and relations, and (3) publications that document our findings. The annotation guidelines and schema, the gold-standard annotations, and the NLP models and tools created during the project will be shared with the research community.
项目摘要 电子健康记录(EHR),详细介绍患者状况和临床护理的各个方面,可以极大地促进 质量改进和监视计划以及彻底改变临床研究。非结构化 EHRS中的临床叙述记录了关键信息,包括医疗问题,治疗和 诊断测试以及护理和结果的基本原理。自然语言处理(NLP)和 信息提取(IE)系统的目标是从临床叙述中识别此类关键信息。 这些系统提取临床概念,例如医疗问题,治疗和测试,确定 这些概念的属性是为了清楚其存在/不存在以及患者的其他细节;并确定 这些概念在预定义的关系方面彼此之间的相互作用。大多数临床NLP系统 解决此信息的提取是基于管道的:即,提取临床概念之前 确定其属性和临床概念之间关系的确定。同时生产 有希望的结果,这些系统受到了两个主要局限性:(1)面临数据不平衡时,它们 在数据中发现的较普遍的观察结果中表现最好 其中一个,(2)它们允许在组件之间级联的错误。这两个限制也可以 互相复合。结果,NLP系统提取的信息可能不完整,粗糙 粒状,无法支持需要对患者病情进行更细粒度的临床应用。 在这个项目中,我们建议解决针对临床信息提取任务的这些限制,旨在 使用新颖的,细粒度的分层模式来捕获患者状况的更完整的情况 临床上的事件及其关系。我们将临床上的事件定义为医疗问题, 治疗和在患者护理过程中记录的测试。我们在一个框架中捕获每个事件 触发器和一组细粒属性。我们在事件之外建立事件 - 事件关系。解决 数据失衡,我们提出了一个新型的主动学习框架,以指导手动注释工作 迈向潜水和信息丰富的样本,这些样本可以提高对较少普遍属性的自动识别和 关系。为了解决级联错误,我们建议(ii)一个新型的联合学习系统,可以实现多个任务 互相告知对所有任务的表现更好。我们在多种音符类型上评估我们的工作 来自多个机构。预期结果包括(1)全面的异质金标准 数据集由多个机构创建的用于临床上的事件和关系,(2)NLP方法 生成最先进的结果会导致事件和关系的提取,以及(3)证明我们的 发现。注释指南和架构,金标准注释以及NLP模型和工具 在项目期间创建的将与研究社区共享。

项目成果

期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
The Leaf Clinical Trials Corpus: a new resource for query generation from clinical trial eligibility criteria.
  • DOI:
    10.1038/s41597-022-01521-0
  • 发表时间:
    2022-08-11
  • 期刊:
  • 影响因子:
    9.8
  • 作者:
    Dobbins, Nicholas J.;Mullen, Tony;Uzuner, Ozlem;Yetisgen, Meliha
  • 通讯作者:
    Yetisgen, Meliha
MT-clinical BERT: scaling clinical information extraction with multitask learning.
MT-clinical BERT:通过多任务学习扩展临床信息提取。
Adverse drug event detection using reason assignments in FDA drug labels.
  • DOI:
    10.1016/j.jbi.2020.103552
  • 发表时间:
    2020-10
  • 期刊:
  • 影响因子:
    4.5
  • 作者:
    Sutphin C;Lee K;Yepes AJ;Uzuner Ö;McInnes BT
  • 通讯作者:
    McInnes BT
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Ozlem Uzuner其他文献

Ozlem Uzuner的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Ozlem Uzuner', 18)}}的其他基金

National NLP Clinical Challenges (n2c2): Challenges in Natural Language Processing for Clinical Narratives
国家 NLP 临床挑战 (n2c2):临床叙述自然语言处理的挑战
  • 批准号:
    10670801
  • 财政年份:
    2019
  • 资助金额:
    $ 42.49万
  • 项目类别:
Leveraging Unlabeled and Pseudo Data for Clinical Information Extraction
利用未标记和伪数据进行临床信息提取
  • 批准号:
    9813134
  • 财政年份:
    2019
  • 资助金额:
    $ 42.49万
  • 项目类别:
National NLP Clinical Challenges (n2c2): Challenges in Natural Language Processing for Clinical Narratives
国家 NLP 临床挑战 (n2c2):临床叙述自然语言处理的挑战
  • 批准号:
    9759499
  • 财政年份:
    2019
  • 资助金额:
    $ 42.49万
  • 项目类别:
National NLP Clinical Challenges (n2c2): Challenges in Natural Language Processing for Clinical Narratives
国家 NLP 临床挑战 (n2c2):临床叙述自然语言处理的挑战
  • 批准号:
    10393499
  • 财政年份:
    2019
  • 资助金额:
    $ 42.49万
  • 项目类别:
Challenges in Natural Language Processing in Clinical Text
临床文本自然语言处理的挑战
  • 批准号:
    9597333
  • 财政年份:
    2017
  • 资助金额:
    $ 42.49万
  • 项目类别:
Challenges in Natural Language Processing for Clinical Narratives
临床叙述自然语言处理的挑战
  • 批准号:
    8722031
  • 财政年份:
    2012
  • 资助金额:
    $ 42.49万
  • 项目类别:
Challenges in Natural Language Processing for Clinical Narratives
临床叙述自然语言处理的挑战
  • 批准号:
    8913773
  • 财政年份:
    2012
  • 资助金额:
    $ 42.49万
  • 项目类别:
Challenges in Natural Language Processing for Clinical Narratives
临床叙述自然语言处理的挑战
  • 批准号:
    8400218
  • 财政年份:
    2012
  • 资助金额:
    $ 42.49万
  • 项目类别:

相似国自然基金

时空序列驱动的神经形态视觉目标识别算法研究
  • 批准号:
    61906126
  • 批准年份:
    2019
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
本体驱动的地址数据空间语义建模与地址匹配方法
  • 批准号:
    41901325
  • 批准年份:
    2019
  • 资助金额:
    22.0 万元
  • 项目类别:
    青年科学基金项目
大容量固态硬盘地址映射表优化设计与访存优化研究
  • 批准号:
    61802133
  • 批准年份:
    2018
  • 资助金额:
    23.0 万元
  • 项目类别:
    青年科学基金项目
IP地址驱动的多径路由及流量传输控制研究
  • 批准号:
    61872252
  • 批准年份:
    2018
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目
针对内存攻击对象的内存安全防御技术研究
  • 批准号:
    61802432
  • 批准年份:
    2018
  • 资助金额:
    25.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Postnatal and Prenatal Therapeutic Base Editing for Metabolic Diseases
代谢性疾病的产后和产前治疗碱基编辑
  • 批准号:
    10668614
  • 财政年份:
    2023
  • 资助金额:
    $ 42.49万
  • 项目类别:
Developing RNA Vaccines to Treat Peanut Hypersensitivity
开发治疗花生过敏的 RNA 疫苗
  • 批准号:
    10570339
  • 财政年份:
    2023
  • 资助金额:
    $ 42.49万
  • 项目类别:
Elucidating the Role of Cutaneous Environmental Factors in the Development of Allergic Disease
阐明皮肤环境因素在过敏性疾病发展中的作用
  • 批准号:
    10664255
  • 财政年份:
    2023
  • 资助金额:
    $ 42.49万
  • 项目类别:
Mechanisms of enhanced food allergy by S. aureus skin colonization in Atopic Dermatitis
特应性皮炎中金黄色葡萄球菌皮肤定植增强食物过敏的机制
  • 批准号:
    10638821
  • 财政年份:
    2023
  • 资助金额:
    $ 42.49万
  • 项目类别:
LEAD PROJECT 1: PHENYLKETONURIA (PKU)
牵头项目 1:苯丙酮尿症 (PKU)
  • 批准号:
    10668618
  • 财政年份:
    2023
  • 资助金额:
    $ 42.49万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了