面向临床医疗文本的实体时序化问题研究
项目介绍
AI项目解读
基本信息
- 批准号:61402128
- 项目类别:青年科学基金项目
- 资助金额:26.0万
- 负责人:
- 依托单位:
- 学科分类:F0211.信息检索与社会计算
- 结题年份:2017
- 批准年份:2014
- 项目状态:已结题
- 起止时间:2015-01-01 至2017-12-31
- 项目参与者:陈毅; 刘增健; 房佳; 郑文; 文博; 袁博;
- 关键词:
项目摘要
In recent years, natural language processing (NLP) has received a great deal of attention in clinic area, and has been an important component of this area. Our government is pushing ahead with hospital informatization based on electronic medical record (EMR). The development of clinical NLP will help to construct and upgrade hospital information systems. In this project, we will study the key issues of temporal serialization for entities in clinical text. It aims to map all clinical entities of a person into a universal timeline, and to generate a sequence of clinical entities in time to support other medical information systems. Compared with temporal relationship extraction in clinical text, temporal serialization for clinical entities mines temporal information that is embedded in clinical text at a deeper level. The project includes the following three aspects: 1) clinical entity extraction in clinical text; 2) temporal expression extraction in clinical text; 2) temporal serialization for entities in clinical text. The study will focus on Chinese and English clinic text. The research results are of great theoretical and practical significance. On the one hand, they further complement and perfect the theory about temporal serialization for entities in clinical text; on the other hand, they fill up the blank of temporal serialization for entities in Chinese clinical text.
近年来,自然语言处理技术在临床医学领域受到了广泛关注,成为这一领域的一个重要分支。我国正在推进以电子病历为核心的医院信息化建设工作,临床医学NLP技术的发展将有利于医院信息化的建设和升级。课题将研究临床医疗文本中实体时序化的关键问题,目的在于把一个病人的所有临床医疗实体准确定位到统一的时间轴上,形成按时间顺序排列的医疗实体序列,为其他医疗信息处理系统提供支持。与临床医疗实体时间关系抽取相比,临床医疗实体时序化从更深层次挖掘蕴含在临床医疗文本中的时间信息,包括以下三个方面的内容:1)临床医疗实体抽取;2)临床医疗文本中的时间表达式抽取;3)临床医疗实体时序化。课题将分别对中文和英文临床医疗文本进行研究。研究成果具有重要的理论价值和实际意义。一方面进一步补充和完善临床医疗实体时序化理论体系;另一方面填补了面向中文临床医疗文本的临床医疗实体时序化技术空白。
结项摘要
近些年,随着医疗信息化进程的不断推进,临床医疗信息处理技术逐渐成为一个新的研究热点。本课题对临床医疗文本中实体时序化问题进行了深入研究,目的在于把一个病人的所有临床医疗实体准确定位到统一的时间轴上,形成按时间顺序排列的医疗实体序列,为其他医疗信息处理系统提供支持。课题的主要研究内容包括:1)临床医疗文本中的隐私信息识别。依据美国HIPAA法案的规定,所有临床医疗文本数据必须进行匿名化之后才能用于科研和商业。因此课题提出了一种基于集成学习的隐私信息识别方法,并在2014 i2b2和2016 N-GRID国际公开数据集上分别取得了95.11%和91.43%的性能,达到了国际较高的水平。2)连续及非连续临床医疗实体识别。课题采用BIOHD1234和Multi-label两种方法对连续和非连续医疗实体进行统一的表示,然后进一步提出了基于深度神经网络的实体识别方法,该方法在人工构建的数据集上取得83.32%的性能,明显优于其他传统方法。3)时间表达式抽取及其归一化。课题针对临床医疗文本中的时间信息,提出了一种基于规则的抽取方法。该方法在人工构建的数据集上的取得了93.40%的性能,对于时间表达式的归一化则达到了92.58%的准确率,能够很好地满足后续任务对于时间信息的抽取需求,也为课题的顺利进行打下了基础。3)临床医疗实体时间标引方法研究。课题提出了一种基于循环卷积神经网络的医疗实体时间关系分类方法。该方法结合循环神经网络和卷积神经网络对医疗实体和时间表达式的向量表示进行学习,然后再进一步结合大量人工特征共同实现对医疗实体时间关系的预测。在人工标注数据集上取得了71.10%的准确率。然后通过标引时间的顺序进一步实现了临床医疗实体的时序化。综述所述,课题不仅构建了大规模的中文医疗实体时序化语料库,还针对相关任务提出了相应的解决方法且取得了良好的性能,为临床医疗信息处理技术的研究具有推动作用。
项目成果
期刊论文数量(8)
专著数量(0)
科研奖励数量(0)
会议论文数量(8)
专利数量(0)
Drug-Drug Interaction Extraction via Convolutional Neural Networks.
通过卷积神经网络提取药物相互作用
- DOI:10.1155/2016/6918381
- 发表时间:2016
- 期刊:Computational and mathematical methods in medicine
- 影响因子:--
- 作者:Liu S;Tang B;Chen Q;Wang X
- 通讯作者:Wang X
De-identification of clinical notes via recurrent neural network and conditional random field.
通过循环神经网络和条件随机场对临床记录进行去识别
- DOI:10.1016/j.jbi.2017.05.023
- 发表时间:2017-11
- 期刊:Journal of biomedical informatics
- 影响因子:4.5
- 作者:Liu Z;Tang B;Wang X;Chen Q
- 通讯作者:Chen Q
Effects of Semantic Features on Machine Learning-Based Drug Name Recognition Systems: Word Embeddings vs. Manually Constructed Dictionaries
语义特征对基于机器学习的药物名称识别系统的影响:词嵌入与手动构建的词典
- DOI:10.3390/info6040848
- 发表时间:2015-12-01
- 期刊:INFORMATION
- 影响因子:3.1
- 作者:Liu, Shengyu;Tang, Buzhou;Wang, Xiaolong
- 通讯作者:Wang, Xiaolong
Entity recognition from clinical texts via recurrent neural network.
通过循环神经网络从临床文本中进行实体识别
- DOI:10.1186/s12911-017-0468-7
- 发表时间:2017-07-05
- 期刊:BMC medical informatics and decision making
- 影响因子:3.5
- 作者:Liu Z;Yang M;Wang X;Chen Q;Tang B;Wang Z;Xu H
- 通讯作者:Xu H
Feature engineering for drug name recognition in biomedical texts: feature conjunction and feature selection.
生物医学文本中药物名称识别的特征工程:特征连接和特征选择
- DOI:10.1155/2015/913489
- 发表时间:2015
- 期刊:Computational and mathematical methods in medicine
- 影响因子:--
- 作者:Liu S;Tang B;Chen Q;Wang X;Fan X
- 通讯作者:Fan X
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
基于竞赛视角探讨文本语义匹配技术在中文医学文本领域中的应用
- DOI:--
- 发表时间:2021
- 期刊:中国数字医学
- 影响因子:--
- 作者:骆迅;倪渊;汤步洲;雷健波
- 通讯作者:雷健波
基于Android的智能中文输入法
- DOI:--
- 发表时间:--
- 期刊:计算机工程
- 影响因子:--
- 作者:刘峰;王晔晗;汤步洲;王晓龙;王轩;LIU Feng,WANG Ye-han,TANG Bu-zhou,WANG Xiao-long,W
- 通讯作者:LIU Feng,WANG Ye-han,TANG Bu-zhou,WANG Xiao-long,W
置信度加权在线序列标注算法
- DOI:--
- 发表时间:--
- 期刊:自动化学报
- 影响因子:--
- 作者:汤步洲;王晓龙;王轩;TANG Bu-Zhou 1 WANG Xiao-Long 1 WANG Xuan 1 1. Ins
- 通讯作者:TANG Bu-Zhou 1 WANG Xiao-Long 1 WANG Xuan 1 1. Ins
基于句子级 Lattice- 长短记忆神经网络的中文电子病历命名实体识别
- DOI:10.16781/j.0258-879x.2019.05.0497
- 发表时间:2019
- 期刊:第二军医大学学报
- 影响因子:--
- 作者:潘璀然;王青华;汤步洲;姜磊;黄勋;王理
- 通讯作者:王理
语句级汉字拼音输入技术评估方法的研究
- DOI:--
- 发表时间:--
- 期刊:中文信息学报
- 影响因子:--
- 作者:张强;汤步洲;王轩;王晓龙
- 通讯作者:王晓龙
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}

内容获取失败,请点击重试

查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图

请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
汤步洲的其他基金
基于电子病历多粒度语义分析的动态临床辅助决策方法研究
- 批准号:
- 批准年份:2022
- 资助金额:55 万元
- 项目类别:面上项目
基于电子病历多粒度语义分析的动态临床辅助决策方法研究
- 批准号:62276082
- 批准年份:2022
- 资助金额:55.00 万元
- 项目类别:面上项目
基于电子病历分析的慢病趋势预测方法研究
- 批准号:61876052
- 批准年份:2018
- 资助金额:62.0 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}