词汇化句法分析若干关键技术研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61262035
  • 项目类别:
    地区科学基金项目
  • 资助金额:
    43.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0211.信息检索与社会计算
  • 结题年份:
    2016
  • 批准年份:
    2012
  • 项目状态:
    已结题
  • 起止时间:
    2013-01-01 至2016-12-31

项目摘要

The study of lexicalized syntactic parsing has achieved certain progress, but its precision and efficiency yet do not satisfy the need of practical applications, especially there are still many key technologies about Chinese lexicalized syntactic parsing to be solved. In recent years, there has arised a study tendency to merge varied technologies in the field of syntactic parsing, and how to integrate varied existing syntactic parsing technologies and complement each other will be an important trend in the field of syntactic parsing. So this project will study how to merge varied syntactic parsing technologies, and propose new theories and calculation models about syntax and semantics on the base of Head-Driven syntactic parsing models combined with dependency grammars and valence grammars: (1) Propose a new word clustering model and algorithm, build syntactic parsing models based on semantic category and solve the data sparseness problem; (2) Introduce semantic information for statistical syntactic parsing models, the semantic information include semantic dependency and semantic collocation such as valence structure; (3) Part-of-speech tagging plays a vital role in syntactic parsing, the syntactic parsing models proposed in this project will combine part-of-speech tagging with syntactic parsing. The goals of this project are to bring semantic information into full play in syntactic parsing, solve the key problems existing in syntactic parsing and semantic calculation, and significantly improve the performance of syntactic parsing.
虽然目前词汇化句法分析研究取得了一定的进展,但是其准确率和效率仍然不能满足实际应用的需要,特别是汉语词汇化句法分析,还有许多关键技术有待解决。近年来,句法分析领域出现了将多种技术进行融合的研究趋势,如何整合多项现有的技术,取长补短,将是句法分析领域的一个重要研究方向。因此本课题将对多项技术的融合问题展开研究,在中心词驱动句法分析模型的基础上结合依存语法、配价语法,提出新的句法语义理论和计算模型:(1)提出一种新的词聚类模型和算法,建立基于语义类的句法分析模型,解决数据稀疏问题;(2)在句法分析统计模型中引入语义信息, 既包括语义依存信息,也包括配价结构等语义搭配信息;(3)词性标注在句法分析中起到了至关重要的作用, 本课题提出的句法分析模型将结合词性标注进行句法分析。目标是充分发挥语义信息在句法分析中的作用,解决句法分析和语义计算中存在的关键问题,较大幅度提高句法分析的性能。

结项摘要

虽然目前词汇化句法分析研究取得了一定的进展,但是其准确率和效率仍然不能满足实际应用的需要,特别是汉语词汇化句法分析,还有许多关键技术有待解决。近年来,句法分析领域出现了将多种技术进行融合的研究趋势,如何整合多项现有的技术,取长补短,将是句法分析领域的一个重要研究方向。因此本课题对多项技术的融合问题展开了研究,在中心词驱动句法分析模型的基础上结合依存语法、配价语法,提出了一些新的句法语义理论和计算模型:. 1.数据稀疏问题是一个严重影响句法分析系统性能的重要因素, 而基于词类的句法分析统计模型是解决这一问题的主要方法之一。本课题利用相邻词语的互信息定义了一种词相似度,并在语义结构信息标注的基础上提出了一种基于语义搭配关系的词语义相似度定义。在词相似度的基础上定义了词集合的相似度,进而提出了一种能得到全局最优结果,自下而上的词聚类算法。实验结果表明,该词聚类算法执行效率高、聚类效果较好: 常规贪婪聚类方法如布朗词聚类算法的困惑度为278,而基于词相似度的词聚类算法和基于语义相似度的词聚类算法的困惑度分别为213,209.3。. 2.针对隐马尔可夫(HMM)词性标注模型状态输出独立同分布等与语言实际特性不够协调的假设,对隐马尔可夫模型进行改进,引入了马尔可夫族模型。马尔可夫族模型用条件独立性假设取代了HMM模型的独立性假设,相对条件独立性假设,独立性假设是过强假设,因而基于马尔可夫族模型的语言模型更符合语言等实际物理过程。将马尔可夫族模型成功应用于词性标注,并结合句法分析进行词性标注。用改进的隐马尔可夫模型进行词性标注实验,实验结果表明: 在相同的测试条件下, 马尔可夫族模型明显好于隐马尔可夫模型,词性标注准确率从94.642%提高到97.126%。. 3. 目前主流的词汇化句法分析方法仅仅考虑词语之间的语义依存关系, 而没有引入语义搭配和语义类等语义信息。本课题结合中心词驱动句法分析模型,提出了基于配价结构和语义依存关系的句法分析模型。模型在规则的分解及概率计算中引入丰富的语义信息,既包括语义依存信息,也包括配价结构等语义搭配信息。用改进的句法分析模型进行句法分析实验,实验结果表明,精确率和召回率分别为88.76%和87.43%,综合指标F值比Collins的中心词驱动句法分析模型提高了6.65个百分点。

项目成果

期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(1)
专利数量(0)
利用配价信息的语义角色标注
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    电子学报
  • 影响因子:
    --
  • 作者:
    袁里驰
  • 通讯作者:
    袁里驰
Research on Word Clustering Algorithms Based on Word similarity
基于词相似度的词聚类算法研究
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    Chinese Journal of Electronics
  • 影响因子:
    1.2
  • 作者:
    YUAN Li-chi
  • 通讯作者:
    YUAN Li-chi
融合语义类信息的句法分析统计模型
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    数据采集与处理
  • 影响因子:
    --
  • 作者:
    袁里驰
  • 通讯作者:
    袁里驰
利用语义信息的句法分析统计模型
  • DOI:
    --
  • 发表时间:
    2019
  • 期刊:
    小型微型计算机系统
  • 影响因子:
    --
  • 作者:
    袁里驰
  • 通讯作者:
    袁里驰
A Part-of-speech Tagging Model Employing Word Clustering and Syntactic Parsing
采用词聚类和句法分析的词性标注模型
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    Chinese Journal of Electronics
  • 影响因子:
    1.2
  • 作者:
    YUAN Li-chi
  • 通讯作者:
    YUAN Li-chi

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

一种基于互信息的词聚类算法
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    系统工程
  • 影响因子:
    --
  • 作者:
    袁里驰
  • 通讯作者:
    袁里驰
基于依存关系的句法分析统计模型
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    中南大学学报(自然科学版)
  • 影响因子:
    --
  • 作者:
    袁里驰
  • 通讯作者:
    袁里驰
基于改进的隐马尔科夫模型的语音识别方法
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    中南大学学报(自然科学版)
  • 影响因子:
    --
  • 作者:
    袁里驰
  • 通讯作者:
    袁里驰
基于相似度的词聚类算法和可变长语言模型
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    小型微型计算机系统
  • 影响因子:
    --
  • 作者:
    袁里驰
  • 通讯作者:
    袁里驰

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

袁里驰的其他基金

结合深度学习的句法语义联合分析模型研究
  • 批准号:
    61962025
  • 批准年份:
    2019
  • 资助金额:
    39 万元
  • 项目类别:
    地区科学基金项目
融合语义信息的句法分析统计模型研究
  • 批准号:
    61562034
  • 批准年份:
    2015
  • 资助金额:
    38.0 万元
  • 项目类别:
    地区科学基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码