基于规则和统计的蒙古语多层级文本查错及纠错推理模型研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61662050
  • 项目类别:
    地区科学基金项目
  • 资助金额:
    40.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0211.信息检索与社会计算
  • 结题年份:
    2020
  • 批准年份:
    2016
  • 项目状态:
    已结题
  • 起止时间:
    2017-01-01 至2020-12-31

项目摘要

At present, automatic error detection and error correction technology is an important research field of natural language processing. With the continuous advance of Mongolian network technology development and language resources digitization process, in the application and research fields, such as education, office, publishing, late OCR processing, speech synthesis and corpus construction, there is an urgent need to develop an automatic error detection and error correction software systems. This project will be on the basis of previous research, focused on solving the key problems faced by the Mongolian word level, grammatical level and semantic level proofreading: how to build a high efficiency, wide coverage of checking and correcting knowledge base, how to develop a high quality check and error correction algorithm, how to integrate the triple proofreading model into the existing pronunciation correction software. The main research contents include: 1) Homographs automatic identification and correction, 2) automatic detection and correction for real-word errors and non-word errors, 3) automatic detection and correction for common syntax errors, 4) automatic detection and correction for semantic errors.
自动查错与纠错技术是自然语言处理的一个重要的研究领域。随着蒙古语网络技术的发展以及语言资源数字化进程的不断推进,在教育、办公、出版、OCR后期处理、语音合成以及语料库建设等应用领域和科研领域迫切需求自动查错与纠错软件系统。本项目将在前期研究的基础上,重点解决蒙古语词级、语法级和语义级校对所面临的关键问题:如何建立效率高,覆盖面广的查错和纠错知识库,如何研制高效高质量的查错和纠错建议生成算法,如何将三级校对模型融合到现有读音纠错软件中。主要研究内容包括:1)同形异音词读音自动纠错,2)词形非词和真词错误的查错与纠错,3)常见语法错误的查错与纠错,4)语义错误的查错与纠错等四个方面。

结项摘要

文本自动校对是蒙古文信息处理核心技术之一,是基础研究和应用技术的有机融合。随着办公软件和打字排版软件的普及以及互联网的快速发展,键盘和屏幕代替了笔和纸,电子文档代替了纸质文档。目前,在教育、办公、新闻、出版和语言资源加工领域迫切需要研发一款蒙古文自动查错与纠错软件系统。.本课题以研究和应用领域实际需求为导向,以蒙古文正字法词典、语法信息词典等词典资源为基础,综合运用蒙古文正字法规则、语法规则等语言学规则研究开发了具有正字法校对、语法校对、语义校对功能的软件系统。课题组以本项目重要研究成果——“蒙古文文本校对引擎MEC60”为基础,针对不同用户开发了5款自动校对软件,分别为:蒙古文纯文本校对系统Mongolian Editor for Plain Text V6.0(简称MET6.0)、蒙古文PDF文档校对系统Mongolian Editor for PDF V2.0(简称MEp2.0)、方正大样文件校对系统 Mongolian Editor for S2 V1.0(简称MEs1.0)、蒙古文网络版校对系统 Mongolian Editor for Web V1.0(简称MEw1.0)、蒙古文批处理版校对系统 Mongolian Editor for Batch Processing V1.0(简称MEb1.0)。.蒙古语多层级查错与纠错软件的成功研制,首先解决蒙古语出版印刷行业缺少校对人员的实际问题。其次,蒙古语语言资源的数字化需要OCR 等处理手段,而多层级校对软件很大程度上能够解决编码纠错、词级校对、语法级校对和语义级校对等后期处理问题。再次,蒙古语网络资源的检索难是普遍存在的问题,其主要原因是未能有效解决蒙古语读音非词的自动纠错和同形异音词的识别问题。本项目的研究成果可以直接用于网站建设或搜索引擎的开发中,提供多层级校对服务,从而解决检索难或不能检索的问题。.本项研究最终成果——“蒙古文文本校对系统”目前广泛被应用于新闻出版单位、教学科研机构、企事业单位和政府系统,在实际应用过程中带来了良好的经济社会效益。

项目成果

期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(2)
专利数量(0)
基于词典匹配的蒙古文命名实体识别研究
  • DOI:
    10.15970/j.cnki.1005-8575.2017.03.022
  • 发表时间:
    2017
  • 期刊:
    中央民族大学学报(哲学社会科学版)
  • 影响因子:
    --
  • 作者:
    包敏娜;斯劳格劳
  • 通讯作者:
    斯劳格劳
一种传统蒙古文拼写检查系统的实现
  • DOI:
    10.15970/j.cnki.1005-8575.2021.01.019
  • 发表时间:
    2021
  • 期刊:
    中央民族大学学报(哲学社会科学版)
  • 影响因子:
    --
  • 作者:
    斯劳格劳;白斯勤;白庆格勒图
  • 通讯作者:
    白庆格勒图
蒙古语固定短语识别算法的设计与实现
  • DOI:
    --
  • 发表时间:
    2017
  • 期刊:
    中文信息学报
  • 影响因子:
    --
  • 作者:
    斯劳格劳
  • 通讯作者:
    斯劳格劳
A Lexical Dependency Probability Model for Mongolian Based On Integration of Morphological and Syntactic Features
基于词法特征整合的蒙古语词汇依存概率模型
  • DOI:
    10.1088/1742-6596/1624/2/022030
  • 发表时间:
    2020-01-01
  • 期刊:
    Journal of Physics: Conference Series
  • 影响因子:
    --
  • 作者:
    Loglo, S.
  • 通讯作者:
    Loglo, S.

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码