面向临床医疗文本的实体时序化问题研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61402128
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    26.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0211.信息检索与社会计算
  • 结题年份:
    2017
  • 批准年份:
    2014
  • 项目状态:
    已结题
  • 起止时间:
    2015-01-01 至2017-12-31

项目摘要

In recent years, natural language processing (NLP) has received a great deal of attention in clinic area, and has been an important component of this area. Our government is pushing ahead with hospital informatization based on electronic medical record (EMR). The development of clinical NLP will help to construct and upgrade hospital information systems. In this project, we will study the key issues of temporal serialization for entities in clinical text. It aims to map all clinical entities of a person into a universal timeline, and to generate a sequence of clinical entities in time to support other medical information systems. Compared with temporal relationship extraction in clinical text, temporal serialization for clinical entities mines temporal information that is embedded in clinical text at a deeper level. The project includes the following three aspects: 1) clinical entity extraction in clinical text; 2) temporal expression extraction in clinical text; 2) temporal serialization for entities in clinical text. The study will focus on Chinese and English clinic text. The research results are of great theoretical and practical significance. On the one hand, they further complement and perfect the theory about temporal serialization for entities in clinical text; on the other hand, they fill up the blank of temporal serialization for entities in Chinese clinical text.
近年来,自然语言处理技术在临床医学领域受到了广泛关注,成为这一领域的一个重要分支。我国正在推进以电子病历为核心的医院信息化建设工作,临床医学NLP技术的发展将有利于医院信息化的建设和升级。课题将研究临床医疗文本中实体时序化的关键问题,目的在于把一个病人的所有临床医疗实体准确定位到统一的时间轴上,形成按时间顺序排列的医疗实体序列,为其他医疗信息处理系统提供支持。与临床医疗实体时间关系抽取相比,临床医疗实体时序化从更深层次挖掘蕴含在临床医疗文本中的时间信息,包括以下三个方面的内容:1)临床医疗实体抽取;2)临床医疗文本中的时间表达式抽取;3)临床医疗实体时序化。课题将分别对中文和英文临床医疗文本进行研究。研究成果具有重要的理论价值和实际意义。一方面进一步补充和完善临床医疗实体时序化理论体系;另一方面填补了面向中文临床医疗文本的临床医疗实体时序化技术空白。

结项摘要

近些年,随着医疗信息化进程的不断推进,临床医疗信息处理技术逐渐成为一个新的研究热点。本课题对临床医疗文本中实体时序化问题进行了深入研究,目的在于把一个病人的所有临床医疗实体准确定位到统一的时间轴上,形成按时间顺序排列的医疗实体序列,为其他医疗信息处理系统提供支持。课题的主要研究内容包括:1)临床医疗文本中的隐私信息识别。依据美国HIPAA法案的规定,所有临床医疗文本数据必须进行匿名化之后才能用于科研和商业。因此课题提出了一种基于集成学习的隐私信息识别方法,并在2014 i2b2和2016 N-GRID国际公开数据集上分别取得了95.11%和91.43%的性能,达到了国际较高的水平。2)连续及非连续临床医疗实体识别。课题采用BIOHD1234和Multi-label两种方法对连续和非连续医疗实体进行统一的表示,然后进一步提出了基于深度神经网络的实体识别方法,该方法在人工构建的数据集上取得83.32%的性能,明显优于其他传统方法。3)时间表达式抽取及其归一化。课题针对临床医疗文本中的时间信息,提出了一种基于规则的抽取方法。该方法在人工构建的数据集上的取得了93.40%的性能,对于时间表达式的归一化则达到了92.58%的准确率,能够很好地满足后续任务对于时间信息的抽取需求,也为课题的顺利进行打下了基础。3)临床医疗实体时间标引方法研究。课题提出了一种基于循环卷积神经网络的医疗实体时间关系分类方法。该方法结合循环神经网络和卷积神经网络对医疗实体和时间表达式的向量表示进行学习,然后再进一步结合大量人工特征共同实现对医疗实体时间关系的预测。在人工标注数据集上取得了71.10%的准确率。然后通过标引时间的顺序进一步实现了临床医疗实体的时序化。综述所述,课题不仅构建了大规模的中文医疗实体时序化语料库,还针对相关任务提出了相应的解决方法且取得了良好的性能,为临床医疗信息处理技术的研究具有推动作用。

项目成果

期刊论文数量(8)
专著数量(0)
科研奖励数量(0)
会议论文数量(8)
专利数量(0)
Drug-Drug Interaction Extraction via Convolutional Neural Networks.
通过卷积神经网络提取药物相互作用
  • DOI:
    10.1155/2016/6918381
  • 发表时间:
    2016
  • 期刊:
    Computational and mathematical methods in medicine
  • 影响因子:
    --
  • 作者:
    Liu S;Tang B;Chen Q;Wang X
  • 通讯作者:
    Wang X
De-identification of clinical notes via recurrent neural network and conditional random field.
通过循环神经网络和条件随机场对临床记录进行去识别
  • DOI:
    10.1016/j.jbi.2017.05.023
  • 发表时间:
    2017-11
  • 期刊:
    Journal of biomedical informatics
  • 影响因子:
    4.5
  • 作者:
    Liu Z;Tang B;Wang X;Chen Q
  • 通讯作者:
    Chen Q
Effects of Semantic Features on Machine Learning-Based Drug Name Recognition Systems: Word Embeddings vs. Manually Constructed Dictionaries
语义特征对基于机器学习的药物名称识别系统的影响:词嵌入与手动构建的词典
  • DOI:
    10.3390/info6040848
  • 发表时间:
    2015-12-01
  • 期刊:
    INFORMATION
  • 影响因子:
    3.1
  • 作者:
    Liu, Shengyu;Tang, Buzhou;Wang, Xiaolong
  • 通讯作者:
    Wang, Xiaolong
Entity recognition from clinical texts via recurrent neural network.
通过循环神经网络从临床文本中进行实体识别
  • DOI:
    10.1186/s12911-017-0468-7
  • 发表时间:
    2017-07-05
  • 期刊:
    BMC medical informatics and decision making
  • 影响因子:
    3.5
  • 作者:
    Liu Z;Yang M;Wang X;Chen Q;Tang B;Wang Z;Xu H
  • 通讯作者:
    Xu H
Feature engineering for drug name recognition in biomedical texts: feature conjunction and feature selection.
生物医学文本中药物名称识别的特征工程:特征连接和特征选择
  • DOI:
    10.1155/2015/913489
  • 发表时间:
    2015
  • 期刊:
    Computational and mathematical methods in medicine
  • 影响因子:
    --
  • 作者:
    Liu S;Tang B;Chen Q;Wang X;Fan X
  • 通讯作者:
    Fan X

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

基于竞赛视角探讨文本语义匹配技术在中文医学文本领域中的应用
  • DOI:
    --
  • 发表时间:
    2021
  • 期刊:
    中国数字医学
  • 影响因子:
    --
  • 作者:
    骆迅;倪渊;汤步洲;雷健波
  • 通讯作者:
    雷健波
基于Android的智能中文输入法
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机工程
  • 影响因子:
    --
  • 作者:
    刘峰;王晔晗;汤步洲;王晓龙;王轩;LIU Feng,WANG Ye-han,TANG Bu-zhou,WANG Xiao-long,W
  • 通讯作者:
    LIU Feng,WANG Ye-han,TANG Bu-zhou,WANG Xiao-long,W
置信度加权在线序列标注算法
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    自动化学报
  • 影响因子:
    --
  • 作者:
    汤步洲;王晓龙;王轩;TANG Bu-Zhou 1 WANG Xiao-Long 1 WANG Xuan 1 1. Ins
  • 通讯作者:
    TANG Bu-Zhou 1 WANG Xiao-Long 1 WANG Xuan 1 1. Ins
基于句子级 Lattice- 长短记忆神经网络的中文电子病历命名实体识别
  • DOI:
    10.16781/j.0258-879x.2019.05.0497
  • 发表时间:
    2019
  • 期刊:
    第二军医大学学报
  • 影响因子:
    --
  • 作者:
    潘璀然;王青华;汤步洲;姜磊;黄勋;王理
  • 通讯作者:
    王理
语句级汉字拼音输入技术评估方法的研究
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    中文信息学报
  • 影响因子:
    --
  • 作者:
    张强;汤步洲;王轩;王晓龙
  • 通讯作者:
    王晓龙

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

汤步洲的其他基金

基于电子病历多粒度语义分析的动态临床辅助决策方法研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    55 万元
  • 项目类别:
    面上项目
基于电子病历多粒度语义分析的动态临床辅助决策方法研究
  • 批准号:
    62276082
  • 批准年份:
    2022
  • 资助金额:
    55.00 万元
  • 项目类别:
    面上项目
基于电子病历分析的慢病趋势预测方法研究
  • 批准号:
    61876052
  • 批准年份:
    2018
  • 资助金额:
    62.0 万元
  • 项目类别:
    面上项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码