融合语义控制实体识别和结构化要素识别的生物医学事件抽取
项目介绍
AI项目解读
基本信息
- 批准号:61672126
- 项目类别:面上项目
- 资助金额:63.0万
- 负责人:
- 依托单位:
- 学科分类:F0211.信息检索与社会计算
- 结题年份:2020
- 批准年份:2016
- 项目状态:已结题
- 起止时间:2017-01-01 至2020-12-31
- 项目参与者:张宏颖; 王占杰; 蒋振超; 何馨宇; 宋鼎新; 秦美越; 郑洁琼; 姜宇新; 万佳;
- 关键词:
项目摘要
In recent years, biomedical event extraction from literature has become a new research focus in the field of biomedical natural language processing, which provides inspirations and evidence for diagnosis, prevention, treatment of diseases as well as new drug research and development. By far, three related issues demand urgent solutions: the uninformative representation of biomedical text data caused by limited annotated corpora, the weak generalization ability of existing biomedical named entity recognition tools and the lower performance of the complex biomedical event extraction. Therefore, this project proposes: (1) a fire-new biomedical domain oriented word representation model by integrating multiple functional units containing rich biomedical and linguistic information into the improved architecture of neural network, to enrich the information of data representation; (2) a new bidirectional LSTM-CRF deep learning model with embedded category semantic control to improve the accuracy and generalization performance of biomedical named entities recognition; (3) a novel structured argument recognition model to improve the performance of the complex event extraction, fused with the advanced dual decomposition method to overcome cascading errors in pipeline approach, so a biomedical event extraction model of high-performance will be obtained. Taking the cancer-related event extraction as an important example, this project will construct cancer-related biomedical event databases and an interactive network in cooperation with domain experts, aiming to provide biomedical knowledge for cancer research and verify the authenticity and validity of our model.
基于文献的生物医学事件抽取是生物医学自然语言处理领域的新兴研究热点,为疾病的诊断、预防、治疗和新药研发提供启发和依据。目前的方法存在如下亟待解决的问题:标注语料规模小而导致数据表示信息量不足、已有生物实体识别工具或方法泛化性较差、复杂事件抽取精度较低等。由此,本项目提出:1. 融入丰富的生物医学和语言学功能单位,并改进原有神经网络结构,建立全新的生物医学领域相关的词表示模型,改善数据表示信息不足的问题;2.研制新的嵌入类型语义控制的双向LSTM-CRF深度学习模型,提高生物实体识别的泛化性和精度;3.提出新的结构化要素识别方法,提高复杂事件抽取精度;并与先进的双分解算法相融合,避免分阶段方法中的级联错误,最终获得高性能的生物事件抽取模型。本项目与领域专家合作,以癌症相关的事件抽取为重要实例,通过构建癌症相关的生物事件数据库和交互网络,验证系统的真实有效性,同时为癌症的研究提供生物医学知识。
结项摘要
基于文献的生物医学事件抽取是生物医学自然语言处理领域的新兴研究热点,旨在把含有事件信息的非结构化文本以结构化的形式呈现出来,为疾病的诊断、预防、治疗和新药研发提供启发和依据。本项目针对生物医学文献,着重研究融合结构化要素识别和双分解算法的生物医学事件抽取。内容主要包括:研究融入多功能单位和多顶层的生物医学词表示模型、基于读入控制门的双向LSTM-CRF深度学习方法进行生物医学命名实体识别、融合结构化要素识别和双分解算法的生物医学事件联合抽取,最终获得高性能的生物医学事件抽取模型,以及包括生物医学命名实体识别和事件抽取的可视化系统平台。并与领域专家合作,构建了癌症相关的生物医学事件数据库和交互网络,为癌症的研究提供生物医学知识。本项目对于自然语言处理领域的信息抽取技术相关研究也起到了积极的推动作用。
项目成果
期刊论文数量(20)
专著数量(0)
科研奖励数量(0)
会议论文数量(12)
专利数量(6)
融合依存信息Attention机制的药物关系抽取研究
- DOI:--
- 发表时间:2019
- 期刊:中文信息学报
- 影响因子:--
- 作者:李丽双;钱爽;周安桥;刘阳;郭元凯
- 通讯作者:郭元凯
Associative attention networks for temporal relation extraction from electronic health records
用于从电子健康记录中提取时间关系的关联注意网络
- DOI:10.1016/j.jbi.2019.103309
- 发表时间:2019
- 期刊:Journal of Biomedical Informatics
- 影响因子:4.5
- 作者:Zhao Shiyi;Li Lishuang;Lu Hongbin;Zhou Anqiao;Qian Shuang
- 通讯作者:Qian Shuang
Dynamic extended tree conditioned LSTM-based biomedical event extraction
基于动态扩展树条件 LSTM 的生物医学事件提取
- DOI:10.1504/ijdmb.2017.10006249
- 发表时间:2017
- 期刊:International Journal of Data Mining and Bioinformatics
- 影响因子:0.3
- 作者:Li Lishuang;Zheng Jieqiong;Wan Jia
- 通讯作者:Wan Jia
Multi-Level Attention Based BLSTM Neural Network for Biomedical Event Extraction
基于多级注意力的 BLSTM 神经网络用于生物医学事件提取
- DOI:10.1587/transinf.2018edp7268
- 发表时间:2019
- 期刊:IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS
- 影响因子:0.7
- 作者:He Xinyu;Li Lishuang;Song Xingchen;Huang Degen;Ren Fuji
- 通讯作者:Ren Fuji
Exploiting dependency information to improve biomedical event detection via gated polar attention mechanism
通过门控极性注意机制利用依赖性信息来改进生物医学事件检测
- DOI:10.1016/j.neucom.2020.09.020
- 发表时间:2021
- 期刊:Neurocomputing
- 影响因子:6
- 作者:Li Lishuang;Zhang Beibei
- 通讯作者:Zhang Beibei
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
基于组合核的蛋白质交互关系抽取
- DOI:--
- 发表时间:2013
- 期刊:中文信息学报
- 影响因子:--
- 作者:李丽双;刘洋;黄德根
- 通讯作者:黄德根
CRF与规则相结合的中文地名识别
- DOI:--
- 发表时间:2012
- 期刊:大连理工大学学报
- 影响因子:--
- 作者:李丽双;党延忠;廖文平;黄德根;张颖
- 通讯作者:张颖
基于句法结构约束的模糊限制信息范围检测
- DOI:--
- 发表时间:2013
- 期刊:中文信息学报
- 影响因子:--
- 作者:杨欢;黄德根;李瑶;李丽双
- 通讯作者:李丽双
基于迁移学习的蛋白质交互关系抽取
- DOI:--
- 发表时间:--
- 期刊:中文信息学报 (录用)
- 影响因子:--
- 作者:李丽双;郭瑞;黄德根;周惠巍
- 通讯作者:周惠巍
基于组合核的中文实体关系抽取研究
- DOI:--
- 发表时间:2012
- 期刊:情报学报
- 影响因子:--
- 作者:李丽双;党延忠;张婧;王敏
- 通讯作者:王敏
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
李丽双的其他基金
融合实体关系路径推理的生物事件关系抽取关键技术研究
- 批准号:62076048
- 批准年份:2020
- 资助金额:58 万元
- 项目类别:面上项目
融合指代消解和迁移学习的蛋白质交互关系抽取的研究
- 批准号:61173101
- 批准年份:2011
- 资助金额:55.0 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}