Clinical Text Automatic De-Identification to Support Large Scale Data Reuse and Sharing

临床文本自动去识别化,支持大规模数据重用和共享

基本信息

  • 批准号:
    9908962
  • 负责人:
  • 金额:
    $ 75.93万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2016
  • 资助国家:
    美国
  • 起止时间:
    2016-02-15 至 2022-01-31
  • 项目状态:
    已结题

项目摘要

The adoption of Electronic Health Record (EHR) systems is growing at a fast pace in the U.S., and this growth results in very large quantities of patient clinical data becoming available in electronic format with tremendous potential but an equally large concern for patient confidentiality breaches. Secondary use of clinical data is essential to fulfill the potential for high quality healthcare, improved healthcare management, and effective clinical research. NIH expects that larger research projects share their research data in a way that protects the confidentiality of research subjects. De-identification of patient data has been proposed as a solution to both facilitate secondary use of clinical data and protect patient data confidentiality. The majority of clinical data found in the EHR is represented as narrative text clinical notes, and de-identification of clinical text is a tedious and costly manual endeavor. Automated approaches based on Natural Language Processing have been implemented and evaluated, allowing for higher accuracy and much faster de- identification than manual approaches. Clinacuity, Inc. proposes to advance a text de-identification system from a prototype to an accurate, adaptable, and robust system, integrated into the research infrastructure at our implementation and testing site (Medical University of South Carolina, Charleston, SC), and ready for commercialization efforts. To accomplish this undertaking, we will focus on the following specific aims and related objectives, while continuing to prepare the commercialization of the integrated system, with detailed market analysis, commercial roadmap development, and modern media communication: 1) Enhance the text de-identification system performance, scalability, and quality to produce an enterprise-grade solution ready for deployment; 2) Enable use of structured data for enhanced text de-identification (when structured PII is available) and for complete patient records de-identification (i.e., records combining structured and unstructured data). This aim also includes implementing “one-way” pseudo-identifier cryptographic hashing to enable securely linking already de-identified patient records; 3) Integrate the text de-identification system with a research data capture and management system. This includes implementation of the de-identification system as a secure web service, with standards-based access and integration. This de-identification system has potential commercial applications in clinical research and in healthcare settings. It will improve access to richer, more detailed, and more accurate clinical data (in clinical text) for clinical researchers. It will ease research data sharing (as expected for larger NIH-funded research projects) and help healthcare organizations protect patient data confidentiality. Significant time-savings will also be offered, with a process at least 200-1000 times faster than manual de-identification.
电子健康记录(EHR)系统的采用在美国快速增长,这 增长导致大量患者临床数据以电子格式获得 巨大的潜力,但对患者置信度的关注也同样重要。次要使用 临床数据对于满足高质量医疗保健,改善医疗保健管理的潜力至关重要, 和有效的临床研究。 NIH期望较大的研究项目以某种方式共享他们的研究数据 这保护了研究主题的机密性。已经提出了将患者数据的识别作为一个 解决临床数据的紧急次要使用并保护患者数据机密性。大多数 EHR中发现的临床数据表示为叙事文本临床注释,并取消识别临床 文字是一项繁琐且昂贵的手动努力。基于自然语言的自动方法 处理和评估已经实施和评估,可以提高准确性和更快的速度 识别比手动方法。 Clinacuity,Inc。提议将文本去识别系统从原型推进到准确的, 在我们的实施和测试中,适应性和健壮的系统集成到研究基础架构中 站点(南卡罗来纳州医科大学,南卡罗来纳州查尔斯顿),并准备进行商业化工作。到 完成这项工作,我们将专注于以下特定目标和相关对象,而 继续通过详细的市场分析来准备集成系统的商业化, 商业路线图开发和现代媒体通讯:1)增强文本识别 系统性能,可伸缩性和质量生产企业级解决方案准备部署; 2) 启用结构化数据以增强文本去识别(可用结构化PII时),并且用于 完整的患者记录去识别(即结合结构化和非结构化数据的记录)。这个目标 还包括实施“单向”伪识别仪加密散列以启用安全链接 已经被识别的患者记录; 3)将文本去识别系统与研究数据集成 捕获和管理系统。这包括实现去识别系统作为安全的 Web服务,具有基于标准的访问和集成。 这种去识别系统在临床研究和医疗保健中具有潜在的商业应用 设置。它将改善获得更丰富,更详细和更准确的临床数据(在临床文本中)的获取 临床研究人员。它将简化研究数据共享(正如NIH资助的大型研究项目所预期的那样) 并帮助医疗组织保护患者数据机密性。大量的时空也将是 提供的过程至少要比手动去识别快200-1000倍。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

STEPHANE MEYSTRE其他文献

STEPHANE MEYSTRE的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('STEPHANE MEYSTRE', 18)}}的其他基金

Automated Dynamic Lists for Efficient Electronic Health Record Management
用于高效电子健康记录管理的自动化动态列表
  • 批准号:
    8830154
  • 财政年份:
    2014
  • 资助金额:
    $ 75.93万
  • 项目类别:
Automated Problem and Allergy Lists Enrichment Based on High Accuracy Information Extraction from the Electronic Health Record
基于电子健康记录中高精度信息提取的自动化问题和过敏列表丰富
  • 批准号:
    9138574
  • 财政年份:
    2013
  • 资助金额:
    $ 75.93万
  • 项目类别:
Automated Dynamic Lists for Efficient Electronic Health Record Management
用于高效电子健康记录管理的自动化动态列表
  • 批准号:
    8590856
  • 财政年份:
    2013
  • 资助金额:
    $ 75.93万
  • 项目类别:
Automated Dynamic Lists for Efficient Electronic Health Record Management
用于高效电子健康记录管理的自动化动态列表
  • 批准号:
    8926527
  • 财政年份:
    2013
  • 资助金额:
    $ 75.93万
  • 项目类别:
Automated Problem and Allergy Lists Enrichment Based on High Accuracy Information Extraction from the Electronic Health Record
基于电子健康记录中高精度信息提取的自动化问题和过敏列表丰富
  • 批准号:
    9357564
  • 财政年份:
    2013
  • 资助金额:
    $ 75.93万
  • 项目类别:

相似国自然基金

基于生长轨迹的儿童性早熟风险因素早期识别与临床鉴别诊断的纵向数据预测模型研究
  • 批准号:
    82373691
  • 批准年份:
    2023
  • 资助金额:
    47 万元
  • 项目类别:
    面上项目
基于可解释Transformer框架分析真实临床数据预测克罗恩病生物制剂疗效的方法研究
  • 批准号:
    62371303
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
多模态重症大数据上结合临床决策过程的可解释表征学习算法研究
  • 批准号:
    62302413
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
融合知识图谱与深度学习构建临床数据和先验知识联合驱动的中风病智能辨证决策模型
  • 批准号:
    82305058
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于多维临床和大数据MRI影像组学“虚拟活检”技术对乳腺癌术后远处转移预测模型研究
  • 批准号:
    82302302
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Mental Health and Occupational Functioning in Nurses: An investigation of anxiety sensitivity and factors affecting future use of an mHealth intervention
护士的心理健康和职业功能:焦虑敏感性和影响未来使用移动健康干预措施的因素的调查
  • 批准号:
    10826673
  • 财政年份:
    2024
  • 资助金额:
    $ 75.93万
  • 项目类别:
Implementation of Innovative Treatment for Moral Injury Syndrome: A Hybrid Type 2 Study
道德伤害综合症创新治疗的实施:2 型混合研究
  • 批准号:
    10752930
  • 财政年份:
    2024
  • 资助金额:
    $ 75.93万
  • 项目类别:
Leveraging COVID-19 to modernize depression care for VA primary care populations
利用 COVID-19 实现 VA 初级保健人群的抑郁症护理现代化
  • 批准号:
    10636681
  • 财政年份:
    2023
  • 资助金额:
    $ 75.93万
  • 项目类别:
Computational Infrastructure for Automated Force Field Development and Optimization
用于自动力场开发和优化的计算基础设施
  • 批准号:
    10699200
  • 财政年份:
    2023
  • 资助金额:
    $ 75.93万
  • 项目类别:
Allogeneic BAFF Ligand Based CAR T Cells as a Novel Therapy for B Cell Malignancies
基于同种异体 BAFF 配体的 CAR T 细胞作为 B 细胞恶性肿瘤的新疗法
  • 批准号:
    10698759
  • 财政年份:
    2023
  • 资助金额:
    $ 75.93万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了