Annotation, development and evaluation for clinical information extraction
临床信息提取的注释、开发和评估
基本信息
- 批准号:8133360
- 负责人:
- 金额:$ 66.46万
- 依托单位:
- 依托单位国家:美国
- 项目类别:
- 财政年份:2010
- 资助国家:美国
- 起止时间:2010-09-01 至 2014-06-30
- 项目状态:已结题
- 来源:
- 关键词:AddressAlgorithmsAutomated AnnotationClinicalClinical ResearchCodeCommunitiesComputerized Medical RecordConsensusCountryData SetDevelopmentDiseaseEvaluationGoalsGoldGuidelinesIndividualJudgmentKnowledgeLinguisticsManualsMedical RecordsMethodologyMethodsMetricNatural Language ProcessingPerformanceRelianceReportingResearchResearch InfrastructureResearch PersonnelSigns and SymptomsSystemTechnologyTerminologyTextTrainingTranslational ResearchTranslationsbaseclinical carecostdesignflexibilityinnovationknowledge translationphrasespreventpublic health relevanceresearch clinical testingresearch studytool
项目摘要
DESCRIPTION (provided by applicant): Much of the clinical information required for accurate clinical research, active decision support, and broad-coverage surveillance is locked in text files in an electronic medical record (EMR). The only feasible way to leverage this information for translational science is to extract and encode the information using natural language processing (NLP). Over the last two decades, several research groups have developed NLP tools for clinical notes, but a major bottleneck preventing progress in clinical NLP is the lack of standard, annotated data sets for training and evaluating NLP applications. Without these standards, individual NLP applications abound without the ability to train different algorithms on standard annotations, share and integrate NLP modules, or compare performance. We propose to develop standards and infrastructure that can enable technology to extract scientific information from textual medical records, and we propose the research as a collaborative effort involving NLP experts across the U.S. To accomplish this goal, we will address three specific aims: Aim 1: Extend existing standards and develop new consensus standards for annotating clinical text in a way that is interoperable, extensible, and usable. Aim 2: Apply existing methods and tools, and develop new methods and tools where necessary for manually annotating a set of publicly available clinical texts in a way that is efficient and accurate. Aim 3: Develop a publicly available toolkit for automatically annotating clinical text and perform a shared evaluation to evaluate the toolkit, using evaluation metrics that are multidimensional and flexible.
PUBLIC HEALTH RELEVANCE: In this project, we will develop a publicly available corpus of annotated clinical texts for NLP research. We will experiment with methods for increasing the efficiency of annotation and will annotate de-identified reports of nine types for linguistic and clinical information. In addition, we will create an NLP toolkit that can be shared and will evaluate it against other NLP systems in a shared task evaluation with the community.
描述(由申请人提供):准确的临床研究、积极的决策支持和广泛覆盖的监测所需的大部分临床信息都被锁定在电子病历 (EMR) 的文本文件中。利用这些信息进行转化科学的唯一可行方法是使用自然语言处理 (NLP) 提取和编码信息。在过去的二十年里,多个研究小组开发了用于临床笔记的 NLP 工具,但阻碍临床 NLP 进展的一个主要瓶颈是缺乏用于训练和评估 NLP 应用的标准注释数据集。如果没有这些标准,单个 NLP 应用程序就会大量存在,无法根据标准注释训练不同的算法、共享和集成 NLP 模块或比较性能。我们建议开发标准和基础设施,使技术能够从文本医疗记录中提取科学信息,并且我们建议将这项研究作为全美 NLP 专家参与的合作项目。为了实现这一目标,我们将实现三个具体目标:目标 1:扩展现有标准并制定新的共识标准,以可互操作、可扩展和可用的方式注释临床文本。目标 2:应用现有方法和工具,并在必要时开发新方法和工具,以高效、准确的方式手动注释一组公开可用的临床文本。目标 3:开发一个公开可用的工具包,用于自动注释临床文本,并使用多维且灵活的评估指标执行共享评估来评估该工具包。
公共健康相关性:在这个项目中,我们将为 NLP 研究开发一个公开的带注释的临床文本语料库。我们将尝试提高注释效率的方法,并对九种类型的去识别化报告进行语言和临床信息注释。此外,我们将创建一个可以共享的 NLP 工具包,并在与社区的共享任务评估中针对其他 NLP 系统进行评估。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
WENDY W. CHAPMAN其他文献
WENDY W. CHAPMAN的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('WENDY W. CHAPMAN', 18)}}的其他基金
University of Utah Interdisciplinary Training Program in Computational Approaches to Diabetes and Metabolism Research
犹他大学糖尿病和代谢研究计算方法跨学科培训项目
- 批准号:
9183480 - 财政年份:2016
- 资助金额:
$ 66.46万 - 项目类别:
Interactive Search and Review of Clinical Records with Multi-layered Semantic Ann
使用多层语义安娜对临床记录进行交互式搜索和审查
- 批准号:
8022026 - 财政年份:2011
- 资助金额:
$ 66.46万 - 项目类别:
Interactive Search and Review of Clinical Records with Multi-layered Semantic Ann
使用多层语义安娜对临床记录进行交互式搜索和审查
- 批准号:
8714052 - 财政年份:2011
- 资助金额:
$ 66.46万 - 项目类别:
Interactive Search and Review of Clinical Records with Multi-layered Semantic Ann
使用多层语义安娜对临床记录进行交互式搜索和审查
- 批准号:
8333306 - 财政年份:2011
- 资助金额:
$ 66.46万 - 项目类别:
Annotation, development and evaluation for clinical information extraction
临床信息提取的注释、开发和评估
- 批准号:
8288078 - 财政年份:2010
- 资助金额:
$ 66.46万 - 项目类别:
Annotation, development and evaluation for clinical information extraction (transfer)
临床信息提取(传输)的注释、开发和评估
- 批准号:
8868500 - 财政年份:2010
- 资助金额:
$ 66.46万 - 项目类别:
Annotation, development and evaluation for clinical information extraction
临床信息提取的注释、开发和评估
- 批准号:
8501543 - 财政年份:2010
- 资助金额:
$ 66.46万 - 项目类别:
Annotation, development and evaluation for clinical information extraction
临床信息提取的注释、开发和评估
- 批准号:
8231171 - 财政年份:2010
- 资助金额:
$ 66.46万 - 项目类别:
Annotation, development and evaluation for clinical information extraction
临床信息提取的注释、开发和评估
- 批准号:
7985218 - 财政年份:2010
- 资助金额:
$ 66.46万 - 项目类别:
NLP Foundational Studies & Ontologies for Syndromic Surveillance from ED Reports
NLP基础研究
- 批准号:
7908086 - 财政年份:2009
- 资助金额:
$ 66.46万 - 项目类别:
相似国自然基金
地表与大气层顶短波辐射多分量一体化遥感反演算法研究
- 批准号:42371342
- 批准年份:2023
- 资助金额:52 万元
- 项目类别:面上项目
高速铁路柔性列车运行图集成优化模型及对偶分解算法
- 批准号:72361020
- 批准年份:2023
- 资助金额:27 万元
- 项目类别:地区科学基金项目
随机密度泛函理论的算法设计和分析
- 批准号:12371431
- 批准年份:2023
- 资助金额:43.5 万元
- 项目类别:面上项目
基于全息交通数据的高速公路大型货车运行风险识别算法及主动干预方法研究
- 批准号:52372329
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
高效非完全信息对抗性团队博弈求解算法研究
- 批准号:62376073
- 批准年份:2023
- 资助金额:51 万元
- 项目类别:面上项目
相似海外基金
Computer-Aided Triage of Body CT Scans with Deep Learning
利用深度学习对身体 CT 扫描进行计算机辅助分类
- 批准号:
10585553 - 财政年份:2023
- 资助金额:
$ 66.46万 - 项目类别:
Image Tools for Computational Cellular Barcoding and Automated Annotation
用于计算细胞条形码和自动注释的图像工具
- 批准号:
10552638 - 财政年份:2022
- 资助金额:
$ 66.46万 - 项目类别:
Image Tools for Computational Cellular Barcoding and Automated Annotation
用于计算细胞条形码和自动注释的图像工具
- 批准号:
10367874 - 财政年份:2022
- 资助金额:
$ 66.46万 - 项目类别:
The Human Phenotype Ontology: Accelerating Computational Integration of Clinical Data for Genomics
人类表型本体论:加速基因组学临床数据的计算整合
- 批准号:
10269338 - 财政年份:2021
- 资助金额:
$ 66.46万 - 项目类别:
The Human Phenotype Ontology: Accelerating Computational Integration of Clinical Data for Genomics
人类表型本体论:加速基因组学临床数据的计算整合
- 批准号:
10681348 - 财政年份:2021
- 资助金额:
$ 66.46万 - 项目类别: