构式语法的计算模型研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61473101
  • 项目类别:
    面上项目
  • 资助金额:
    80.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F03.自动化
  • 结题年份:
    2018
  • 批准年份:
    2014
  • 项目状态:
    已结题
  • 起止时间:
    2015-01-01 至2018-12-31

项目摘要

Though construction Grammar (CG), with strong explanatory power for language phenomena and learning, has been a matural liunguistics theory,it is still a stranger for most of NLP tasks. The main reasons include the absent of compuation oriented formal representation, the lack of a large scale construction knowledge base and its construction tool, and the missing of practice experience for CG to be applied in NLP, which are big obstacles for effectively applying CG in addressing NLP tasks. In this project, we are trying to build a construction computing bridge between linguistics and NLP: at first, according to the linguistics definition of constructions and their propterties, build the the computation oriented formal representation of contruction grammar. Then we will develop the open platform with functions of new construction defintion, corpra annotation with contructions and annotation result visialization ect to broke the bottlenect of lacking basis construction resources and tools. Based on it, we research on the models and methodology of parsing, anto annotation and quantity representation learning of contruction grammars by introducing deep learning, word embedding learning etc. NLP techniques, which fulfills us to the compuational modelling of construction grammars, and builds the foundation of applying construction grammars in real NLP tasks. Via this project, our goal is to provide NLP researchers and engineers usable tool and models for constructionb based NLP techniques, and to deliver contributions to both the improvement of construction grammar theory the development of NLP techniques.
构式语法作为具有很强语言现象解释能力的认知语法体系,虽然在语言学理论上已经较为成熟,但由于缺乏可计算的形式化定义、基础资源严重缺乏、计算机制尚不明确等关键问题,难以有效支撑自然语言处理及其应用技术的发展。为此,本项目致力于为语言学与自然语言处理之间搭建起构式计算的有效桥梁:通过对从语言学角度阐述的认知构式语法探索具有可计算性的形式化表示模型,构建具有构式定义、构式语料库标注、构式可视化表示和构式分析的开放性平台系统,解决构式研究的基础资源和工具缺乏问题,在此基础上,以典型构式为出发点,基于深度学习等自然语言处理热点技术来开展构式语法的自动分析与标注、构式量化表示的学习模型机构式应用等构式计算的方法与机制研究,为构式语法的计算模型构建与应用建立初步的理论与实践基础,为构式语法的发展与推广即自然语言处理技术的发展做出积极贡献。

结项摘要

构式语法是具有很强语言现象解释能力的认知语法体系,但由于缺乏可计算的形式化定义、基础资源严重缺乏、计算机制尚不明确等关键问题,难以有效支撑自然语言处理及其应用的发展,为此提出本项目。项目主要研究内容包括4部分:.1. 语言的表示模型研究:作为国内较早从事深度学习研究的课题组,我们从认知学中动名分离的角度,提出了一种新的词向量学习方法来构建词语的向量表示;探索了基于RNN与CNN联合的问答系统答案选择方法以及基于RNN的短文本摘要生成方法;针对在社区问答中回答之间的关系,构建了表示模型,并提出了“二阶式”学习算法完成模型的训练,提高了模型对于答案语义关联信息的学习表示能力。.2. 基于构式语法的语法分析研究:课题组参加了SemEval 2015 Task15的子任务1,基于构式语法的开放性本质提出了语料库中自动学习和挖掘动词模式的方法,获得参赛团队中的第一名;研究了基于不同的文本表示模型和聚类算法的动词聚类,将动词模式聚类的的微平均F1值提高了21.6%;研究了动词模式中论元的语义类型标注问题,完成了对动词模式论元的语义类型标注任务。.3. 中文大规模基础语料库构建:课题组创建并发布了一个由200多万中文短文本组成的大型自动文摘生成语料库,发布了侧重于意图匹配的大规模汉语问题匹配语料库LCQMC,基础语料库已被清华、CMU等100多家著名高校、机构使用,为推动中文的国际化做出了重要贡献。.4. 基于深度学习的医疗文本实体与关系挖掘研究:开展了基于深度学习的心脏病风险因子挖掘研究;将词之间的依存关系融入序列卷积神经网络模型,提升了药物相互作用抽取的性能;提出基于深度神经网络的非连续医疗实体识别方法,提高了对连续及非连续医疗实体的识别能力,研究成果在多项国际国内公开评测中胜出。.综上,本课按照项目计划的研究方向和内容开展了较为深入的研究工作,共发表了重要国际期刊和会议论文27篇;培养了博士生4人,硕士12人,申请了发明专利2项;获中国中文信息学会优博提名奖1人,项目按计划完成。

项目成果

期刊论文数量(17)
专著数量(0)
科研奖励数量(0)
会议论文数量(10)
专利数量(3)
Entity recognition from clinical texts via recurrent neural network.
通过循环神经网络从临床文本中进行实体识别
  • DOI:
    10.1186/s12911-017-0468-7
  • 发表时间:
    2017-07-05
  • 期刊:
    BMC medical informatics and decision making
  • 影响因子:
    3.5
  • 作者:
    Liu Z;Yang M;Wang X;Chen Q;Tang B;Wang Z;Xu H
  • 通讯作者:
    Xu H
HITSZ_CDR: an end-to-end chemical and disease relation extraction system for BioCreative V
HITSZ_CDR:BioCreative V 的端到端化学和疾病关系提取系统
  • DOI:
    10.1093/database/baw077
  • 发表时间:
    2016-06
  • 期刊:
    Database-The Journal of Biological Databases and Curation
  • 影响因子:
    5.8
  • 作者:
    Haodi Li;Buzhou Tang;Qingcai Chen;Kai Chen;Xiaolong Wang;Wang Baohua;Wang Zhe
  • 通讯作者:
    Wang Zhe
An automatic risk factor identification system forheart disease in clinical texts over time
随着时间的推移临床文本中心脏病的自动危险因素识别系统
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    Journal of Biomedical Informatics
  • 影响因子:
    4.5
  • 作者:
    Xin Liu;Zengjian Liu;Shu Liu;Weida Wang
  • 通讯作者:
    Weida Wang
Recognizing Continuous and Discontinuous Adverse Drug Reaction Mentions from Social Media Using LSTM-CRF
使用 LSTM-CRF 识别社交媒体中连续和不连续的药物不良反应提及
  • DOI:
    10.1155/2018/2379208
  • 发表时间:
    2018-01-01
  • 期刊:
    WIRELESS COMMUNICATIONS & MOBILE COMPUTING
  • 影响因子:
    --
  • 作者:
    Tang, Buzhou;Hu, Jianglu;Chen, Qingcai
  • 通讯作者:
    Chen, Qingcai
Distant Supervision for Relation Extraction with Ranking-Based Methods
基于排序方法的关系抽取的远程监督
  • DOI:
    10.3390/e18060204
  • 发表时间:
    2016-05
  • 期刊:
    Entropy
  • 影响因子:
    2.7
  • 作者:
    Yang Xiang;Qingcai Chen;Xiaolong Wang;Yang Qin
  • 通讯作者:
    Yang Qin

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

中文问答系统中时间敏感问句的识别和检索
  • DOI:
    --
  • 发表时间:
    2013
  • 期刊:
    计算机研究与发展
  • 影响因子:
    --
  • 作者:
    王晓龙;陈清财;王宇亮;户保田
  • 通讯作者:
    户保田
CHIP2019评测任务1概述:临床术语标准化任务
  • DOI:
    --
  • 发表时间:
    2021
  • 期刊:
    中文信息学报
  • 影响因子:
    --
  • 作者:
    黄源航;焦晓康;汤步洲;陈清财;闫峻
  • 通讯作者:
    闫峻

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

陈清财的其他基金

基于多模态融合的语义表示学习方法
  • 批准号:
    61872113
  • 批准年份:
    2018
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目
网络信息自主整合关键技术研究
  • 批准号:
    61173075
  • 批准年份:
    2011
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
异构信息互动模型中的关键技术研究
  • 批准号:
    60703015
  • 批准年份:
    2007
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码