构式语法的计算模型研究
项目介绍
AI项目解读
基本信息
- 批准号:61473101
- 项目类别:面上项目
- 资助金额:80.0万
- 负责人:
- 依托单位:
- 学科分类:F03.自动化
- 结题年份:2018
- 批准年份:2014
- 项目状态:已结题
- 起止时间:2015-01-01 至2018-12-31
- 项目参与者:徐军; 王丹丹; 刘胜宇; 户保田; 张超; 李昊迪; 陈毅; 康龙彪; 王巍达;
- 关键词:
项目摘要
Though construction Grammar (CG), with strong explanatory power for language phenomena and learning, has been a matural liunguistics theory,it is still a stranger for most of NLP tasks. The main reasons include the absent of compuation oriented formal representation, the lack of a large scale construction knowledge base and its construction tool, and the missing of practice experience for CG to be applied in NLP, which are big obstacles for effectively applying CG in addressing NLP tasks. In this project, we are trying to build a construction computing bridge between linguistics and NLP: at first, according to the linguistics definition of constructions and their propterties, build the the computation oriented formal representation of contruction grammar. Then we will develop the open platform with functions of new construction defintion, corpra annotation with contructions and annotation result visialization ect to broke the bottlenect of lacking basis construction resources and tools. Based on it, we research on the models and methodology of parsing, anto annotation and quantity representation learning of contruction grammars by introducing deep learning, word embedding learning etc. NLP techniques, which fulfills us to the compuational modelling of construction grammars, and builds the foundation of applying construction grammars in real NLP tasks. Via this project, our goal is to provide NLP researchers and engineers usable tool and models for constructionb based NLP techniques, and to deliver contributions to both the improvement of construction grammar theory the development of NLP techniques.
构式语法作为具有很强语言现象解释能力的认知语法体系,虽然在语言学理论上已经较为成熟,但由于缺乏可计算的形式化定义、基础资源严重缺乏、计算机制尚不明确等关键问题,难以有效支撑自然语言处理及其应用技术的发展。为此,本项目致力于为语言学与自然语言处理之间搭建起构式计算的有效桥梁:通过对从语言学角度阐述的认知构式语法探索具有可计算性的形式化表示模型,构建具有构式定义、构式语料库标注、构式可视化表示和构式分析的开放性平台系统,解决构式研究的基础资源和工具缺乏问题,在此基础上,以典型构式为出发点,基于深度学习等自然语言处理热点技术来开展构式语法的自动分析与标注、构式量化表示的学习模型机构式应用等构式计算的方法与机制研究,为构式语法的计算模型构建与应用建立初步的理论与实践基础,为构式语法的发展与推广即自然语言处理技术的发展做出积极贡献。
结项摘要
构式语法是具有很强语言现象解释能力的认知语法体系,但由于缺乏可计算的形式化定义、基础资源严重缺乏、计算机制尚不明确等关键问题,难以有效支撑自然语言处理及其应用的发展,为此提出本项目。项目主要研究内容包括4部分:.1. 语言的表示模型研究:作为国内较早从事深度学习研究的课题组,我们从认知学中动名分离的角度,提出了一种新的词向量学习方法来构建词语的向量表示;探索了基于RNN与CNN联合的问答系统答案选择方法以及基于RNN的短文本摘要生成方法;针对在社区问答中回答之间的关系,构建了表示模型,并提出了“二阶式”学习算法完成模型的训练,提高了模型对于答案语义关联信息的学习表示能力。.2. 基于构式语法的语法分析研究:课题组参加了SemEval 2015 Task15的子任务1,基于构式语法的开放性本质提出了语料库中自动学习和挖掘动词模式的方法,获得参赛团队中的第一名;研究了基于不同的文本表示模型和聚类算法的动词聚类,将动词模式聚类的的微平均F1值提高了21.6%;研究了动词模式中论元的语义类型标注问题,完成了对动词模式论元的语义类型标注任务。.3. 中文大规模基础语料库构建:课题组创建并发布了一个由200多万中文短文本组成的大型自动文摘生成语料库,发布了侧重于意图匹配的大规模汉语问题匹配语料库LCQMC,基础语料库已被清华、CMU等100多家著名高校、机构使用,为推动中文的国际化做出了重要贡献。.4. 基于深度学习的医疗文本实体与关系挖掘研究:开展了基于深度学习的心脏病风险因子挖掘研究;将词之间的依存关系融入序列卷积神经网络模型,提升了药物相互作用抽取的性能;提出基于深度神经网络的非连续医疗实体识别方法,提高了对连续及非连续医疗实体的识别能力,研究成果在多项国际国内公开评测中胜出。.综上,本课按照项目计划的研究方向和内容开展了较为深入的研究工作,共发表了重要国际期刊和会议论文27篇;培养了博士生4人,硕士12人,申请了发明专利2项;获中国中文信息学会优博提名奖1人,项目按计划完成。
项目成果
期刊论文数量(17)
专著数量(0)
科研奖励数量(0)
会议论文数量(10)
专利数量(3)
Entity recognition from clinical texts via recurrent neural network.
通过循环神经网络从临床文本中进行实体识别
- DOI:10.1186/s12911-017-0468-7
- 发表时间:2017-07-05
- 期刊:BMC medical informatics and decision making
- 影响因子:3.5
- 作者:Liu Z;Yang M;Wang X;Chen Q;Tang B;Wang Z;Xu H
- 通讯作者:Xu H
HITSZ_CDR: an end-to-end chemical and disease relation extraction system for BioCreative V
HITSZ_CDR:BioCreative V 的端到端化学和疾病关系提取系统
- DOI:10.1093/database/baw077
- 发表时间:2016-06
- 期刊:Database-The Journal of Biological Databases and Curation
- 影响因子:5.8
- 作者:Haodi Li;Buzhou Tang;Qingcai Chen;Kai Chen;Xiaolong Wang;Wang Baohua;Wang Zhe
- 通讯作者:Wang Zhe
An automatic risk factor identification system forheart disease in clinical texts over time
随着时间的推移临床文本中心脏病的自动危险因素识别系统
- DOI:--
- 发表时间:2015
- 期刊:Journal of Biomedical Informatics
- 影响因子:4.5
- 作者:Xin Liu;Zengjian Liu;Shu Liu;Weida Wang
- 通讯作者:Weida Wang
Recognizing Continuous and Discontinuous Adverse Drug Reaction Mentions from Social Media Using LSTM-CRF
使用 LSTM-CRF 识别社交媒体中连续和不连续的药物不良反应提及
- DOI:10.1155/2018/2379208
- 发表时间:2018-01-01
- 期刊:WIRELESS COMMUNICATIONS & MOBILE COMPUTING
- 影响因子:--
- 作者:Tang, Buzhou;Hu, Jianglu;Chen, Qingcai
- 通讯作者:Chen, Qingcai
Distant Supervision for Relation Extraction with Ranking-Based Methods
基于排序方法的关系抽取的远程监督
- DOI:10.3390/e18060204
- 发表时间:2016-05
- 期刊:Entropy
- 影响因子:2.7
- 作者:Yang Xiang;Qingcai Chen;Xiaolong Wang;Yang Qin
- 通讯作者:Yang Qin
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
中文问答系统中时间敏感问句的识别和检索
- DOI:--
- 发表时间:2013
- 期刊:计算机研究与发展
- 影响因子:--
- 作者:王晓龙;陈清财;王宇亮;户保田
- 通讯作者:户保田
CHIP2019评测任务1概述:临床术语标准化任务
- DOI:--
- 发表时间:2021
- 期刊:中文信息学报
- 影响因子:--
- 作者:黄源航;焦晓康;汤步洲;陈清财;闫峻
- 通讯作者:闫峻
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
陈清财的其他基金
基于多模态融合的语义表示学习方法
- 批准号:61872113
- 批准年份:2018
- 资助金额:64.0 万元
- 项目类别:面上项目
网络信息自主整合关键技术研究
- 批准号:61173075
- 批准年份:2011
- 资助金额:56.0 万元
- 项目类别:面上项目
异构信息互动模型中的关键技术研究
- 批准号:60703015
- 批准年份:2007
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}