DeconDTN: Deconfounding Deep Transformer Networks for Clinical NLP

DeconDTN:为临床 NLP 解构深度 Transformer 网络

基本信息

  • 批准号:
    10711315
  • 负责人:
  • 金额:
    $ 31.12万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2022
  • 资助国家:
    美国
  • 起止时间:
    2022-06-01 至 2026-02-28
  • 项目状态:
    未结题

项目摘要

Abstract This proposal relates to ongoing efforts to develop automated methods for the detection of linguistic manifestations of cognitive changes in Alzheimer’s Disease (AD). These methods have the potential to alleviate the personal and societal burden of AD, by reducing time to diagnosis. Delayed AD diagnosis has adverse effects on care planning and family relationships, and has been estimated to cost the healthcare system close to $8 trillion dollars. Language reflects cognitive status, and contemporary neural network models have been shown to discriminate between transcribed speech from patients with AD and that from healthy controls with promising accuracy. However, most of this work has been conducted in the context of recorded responses to picture description tasks, which are not suitable for repeated, continuous or passive monitoring for linguistic indicators of AD-related decline. In contrast, our recent work has identified the task-agnostic linguistic construct of semantic coherence as a sound basis for machine learning models for detection of language from people with AD in casual conversations, with classification performance in this context exceeding that of Bidirectional Encoder Representations from Transformers (BERT) based classifiers, the state-of-the-art for text-based AD detection. Unfortunately, recent work has shown that automated coherence estimates are vulnerable to bias, with lower estimates for speech from people identifying as black irrespective of diagnosis. Interrogation of coherence- and BERT-based classifiers reveals they dramatically underperform in this group also. For the parent award for this supplement proposal (R01 LM0104056), we will develop methods to debias deep transformer networks to mitigate for the confounding variable of provenance in multi-institutional datasets, culminating in the release of a toolkit to Deconfound Deep Transformer Networks, the DeconDTN suite. In this proposal we will apply these methods to deconfound coherence- and BERT-based AD detection models for the confounding variable of race and/or ethnicity, and evaluate the effects on model performance across groups. In addition, we will evaluate the utility of fine-tuning semantic coherence models and models used to generate automated transcripts on text and speech from the recently-released Corpus of Regional African American Language (CORAAL). We hypothesize that both improvements in these underlying models, and explicit deconfounding for race/ethnicity will reduce the performance differential across groups, resulting in equitable models for language-based AD detection.
抽象的 该建议涉及开发自动化方法以检测语言的努力 阿尔茨海默氏病认知变化的表现(AD)。这些方法有可能减轻 AD的个人和社会负担,通过减少诊断时间。延迟的广告诊断有不良影响 关于护理计划和家庭关系,据估计使医疗保健系统接近8美元 万亿美元。语言反映了认知状况,并且已经显示了当代神经网络模型 区分AD患者的转录语音以及有承诺的健康对照 准确性。但是,这项工作的大部分是在记录对图片的响应的背景下进行的 描述任务,不适合重复,连续或被动监视语言指标 与广告有关的下降。相反,我们最近的工作确定了语义的任务不足语言构造 连贯性作为机器学习模型的合理基础,用于从休闲中从广告中检测语言 对话,在此上下文中的分类性能超过双向编码器 基于变形金刚(BERT)分类器的表示形式,基于文本的AD检测的最新图表。 不幸的是,最近的工作表明,自动相干估计很容易受到偏见的影响,较低 不论诊断如何,从识别为黑人的人的言语估计。询问连贯性和 基于BERT的分类器也揭示了他们在该组中的表现明显不足。为此父母奖 补充提案(R01 LM0104056),我们将开发出Debias Deep Transformer网络的方法 减轻多机构数据集中出处的混杂变量,最终发行 Decondtn Suite的Deconfonfungrom Deep Transformer网络的工具包。在此提案中,我们将应用这些 对种族混杂变量的脱致相干和基于BERT的广告检测模型的方法 和/或种族,并评估跨组对模型绩效的影响。此外,我们将评估 微调语义连贯模型和模型用于在文本和 最近发行的非裔美国人语言语料库(Coraal)的演讲。我们假设 这些基本模型的改进以及对种族/种族的明确变形都将减少 跨组的性能差异,导致基于语言的广告检测的公平模型。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Trevor Cohen其他文献

Trevor Cohen的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Trevor Cohen', 18)}}的其他基金

DeconDTN: Deconfounding Deep Transformer Networks for Clinical NLP
DeconDTN:为临床 NLP 解构深度 Transformer 网络
  • 批准号:
    10626888
  • 财政年份:
    2022
  • 资助金额:
    $ 31.12万
  • 项目类别:
Professional to Plain Language Neural Translation: A Path Toward Actionable Health Information
专业到通俗语言的神经翻译:通向可行健康信息的道路
  • 批准号:
    10349319
  • 财政年份:
    2022
  • 资助金额:
    $ 31.12万
  • 项目类别:
Professional to Plain Language Neural Translation: A Path Toward Actionable Health Information
专业到通俗语言的神经翻译:通向可行健康信息的道路
  • 批准号:
    10579898
  • 财政年份:
    2022
  • 资助金额:
    $ 31.12万
  • 项目类别:
DeconDTN: Deconfounding Deep Transformer Networks for Clinical NLP
DeconDTN:为临床 NLP 解构深度 Transformer 网络
  • 批准号:
    10467107
  • 财政年份:
    2022
  • 资助金额:
    $ 31.12万
  • 项目类别:
Computerized assessment of linguistic indicators of lucidity in Alzheimer's Disease dementia
阿尔茨海默病痴呆症语言清醒度指标的计算机化评估
  • 批准号:
    10093304
  • 财政年份:
    2020
  • 资助金额:
    $ 31.12万
  • 项目类别:
Using Biomedical Knowledge to Identify Plausible Signals for Pharmacovigilance
利用生物医学知识识别药物警戒的合理信号
  • 批准号:
    8914098
  • 财政年份:
    2013
  • 资助金额:
    $ 31.12万
  • 项目类别:
Using Biomedical Knowledge to Identify Plausible Signals for Pharmacovigilance
利用生物医学知识识别药物警戒的合理信号
  • 批准号:
    8727094
  • 财政年份:
    2013
  • 资助金额:
    $ 31.12万
  • 项目类别:
Encoding Semantic Knowledge in Vector Space for Biomedical Information
在生物医学信息的向量空间中编码语义知识
  • 批准号:
    8138564
  • 财政年份:
    2010
  • 资助金额:
    $ 31.12万
  • 项目类别:
Encoding Semantic Knowledge in Vector Space for Biomedical Information
在生物医学信息的向量空间中编码语义知识
  • 批准号:
    7977263
  • 财政年份:
    2010
  • 资助金额:
    $ 31.12万
  • 项目类别:

相似国自然基金

基因与家庭不利环境影响儿童反社会行为的表观遗传机制:一项追踪研究
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    58 万元
  • 项目类别:
    面上项目
不利地质结构对地下洞室群围岩地震响应影响研究
  • 批准号:
    51009131
  • 批准年份:
    2010
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
列车制动力对铁路桥梁的作用机理及最不利影响的研究
  • 批准号:
    50178004
  • 批准年份:
    2001
  • 资助金额:
    23.0 万元
  • 项目类别:
    面上项目

相似海外基金

Targeting Alcohol-Opioid Co-Use Among Young Adults Using a Novel MHealth Intervention
使用新型 MHealth 干预措施针对年轻人中酒精与阿片类药物的同时使用
  • 批准号:
    10456380
  • 财政年份:
    2023
  • 资助金额:
    $ 31.12万
  • 项目类别:
Endocrine tissue molecular pathways dysregulated by immune checkpoint inhibitors causing ICI-triggered adverse events
免疫检查点抑制剂导致内分泌组织分子通路失调,导致 ICI 引发的不良事件
  • 批准号:
    10648465
  • 财政年份:
    2023
  • 资助金额:
    $ 31.12万
  • 项目类别:
Maternal inflammation in relation to offspring epigenetic aging and neurodevelopment
与后代表观遗传衰老和神经发育相关的母体炎症
  • 批准号:
    10637981
  • 财政年份:
    2023
  • 资助金额:
    $ 31.12万
  • 项目类别:
The role of extracellular vesicle-associated MicroRNAs in HIV-associated atherosclerosis
细胞外囊泡相关 MicroRNA 在 HIV 相关动脉粥样硬化中的作用
  • 批准号:
    10619831
  • 财政年份:
    2023
  • 资助金额:
    $ 31.12万
  • 项目类别:
Environmental factors in pathobiology of dementia: the role of PCB exposure, microbiome, and tissue barrier dysfunction
痴呆病理学中的环境因素:PCB 暴露、微生物组和组织屏障功能障碍的作用
  • 批准号:
    10558120
  • 财政年份:
    2023
  • 资助金额:
    $ 31.12万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了