细颗粒度维吾尔语文本意见挖掘方法的研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61262064
  • 项目类别:
    地区科学基金项目
  • 资助金额:
    45.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0607.知识表示与处理
  • 结题年份:
    2016
  • 批准年份:
    2012
  • 项目状态:
    已结题
  • 起止时间:
    2013-01-01 至2016-12-31

项目摘要

This project regards Uyghur web texts as the research object. Our research methods are based on the theory of computational linguistics and artificial intelligence, closely combine the language laws of Uyghur, construct the construction standard of corpus for Uyghur opinioned texts, establish corpus for Uyghur opinioned texts. This project proposes and realizes the fine-grained opinion mining methods which are suitable for Uyghur opinioned texts. Our research methods will develop the comprehensive advantages of statistics and natural language processing methods, in order to achieve the purpose of mining the available fine-grained information and knowledge to a maximum extent. This project studies the fine-grained opinion mining methods for the first time in the Altaic family at home and abroad. It has a certain degree of particularity and innovation, and can fill in the gaps of minority language information processing research in our country. This project will make an important influence and significance at home and abroad, and it is a great subject to be solved. The research results can provide applications for other natural language processing systems, such as text categorization, automatic summarization, question answering system, machine translation, etc. Our research can be widely applied to many areas of our daily life, such as ecommerce, business intelligence, information monitoring, public opinion poll, e-learning, newspaper and publication compilation, business management, etc. Furthermore, it can lay a solid theoretical and practical foundation for language information processing of Uyghur.
本项目以互联网上的维吾尔语网络文本为研究对象,以计算语言学和人工智能理论为基础,紧密结合维吾尔语语言规律,建立维吾尔语意见型文本语料库的构建规范,创建维吾尔语意见型文本语料库;提出并实现适合于维吾尔语意见型文本的细颗粒度意见挖掘方法;所采用的研究方法将发挥统计和自然语言处理方法的综合优势,以达到最大程度地挖掘可用的细颗粒度信息和知识的目的。本项研究在国内外阿勒泰语系中首次研究细颗粒度维吾尔语文本意见挖掘方法,具有一定的特殊性和创新性,弥补我国少数民族语言信息处理研究的空白,有着重大国内外影响和意义,是目前亟待解决的重大课题。研究成果不仅可以提供给其它自然语言处理系统(应用)使用,如文本分类、自动摘要、问答系统、机器翻译等;还可应用于许多日常生活的领域,如电子商务、商业智能、信息监控、民意调查、电子学习、报刊编辑、企业管理等,为维吾尔语语言信息处理研究打下扎实的理论和实践基础。

结项摘要

项目总体进展顺利,所有研究计划已按要求完成,达到预期目标。特别是:.1) 收集了包含新闻评论、人物评论以及产品评论等领域的生语料,标注了包含一般型和比较型意见句在内的13 990个意见句,为了将非结构化意见文本转化为结构化表示,采用系统性、一致性的解决方案,规范文本的标注。开发了维吾尔语情感语料辅助整理软件。.2)隐式主题抽取方面:结合维吾尔语语法规则和特征,提出了隐式主题推断算法,不仅考虑了当前意见陈述中的意见词,还考虑了与前一陈述主题的关系、当前陈述的局部主题和全局主题。最终为每个意见陈述建立意见陈述-主题四元组 。特定领域和开放领域的各项实验评价指标均在70%以上, 说明了方法的有效性。.3)意见持有者抽取方面:提出一种细粒度的三层模型抽取意见持有者。采用CRFs模型,结合人工启发式规则和维吾尔语命名规则,识别评论中的所有候选意见持有者。然后根据分类算法,将意见句分为四个不同类别,并对相应的意见持有者类型分别提出不同的抽取方法。引入扩展规则修正意见持有者结果。实验结果显示,平均准确率达到80.14%,平均召回率达到84.39%,证明方法的有效性。.4)多陈述的定界方面:提出了一种基于Bootstrapping算法的陈述定界方法。在每一次迭代过程中,根据改进的评分公式选取最优模式抽取主题词-意见词对;迭代结束后,对于主题-意见词对为空的评论语句,使用最近匹配算法抽取主题-意见词对;用并联模式和否定模式对抽取的主题-意见词对进行扩展和修正。.5)隐式情感分析方面:提出基于条件随机场模型的隐式情感分析方法。利用互信息衡量上下文的依赖度,结合词法、语境依赖词、标点符号和习语等特征用于隐式情感分析。在特征选择时,通过对信息增益进行改进,解决语料中数据集不平衡的问题。方法用于维吾尔语文本隐式情感分析的准确率为77.11%,召回率为78.37%。.6)比较型意见的挖掘方面,比较句及比较类型识别是细粒度意见挖掘的重要组成部分。通过对维吾尔语比较句特征的深层次分析,提出基于规则的双向CSR挖掘算法。算法能有效的减少无效比较模式,同时利用规则提升实验性能。对于类型识别,利用有序比较关键词策略进行类型识别,实验F值达到70.93%,证明模型的有效性。.发表论文16篇,其中EI 收录源期刊论文7篇,中文核心期刊论文9篇(中文信息学报5篇);获软件著作权9项;获省部级优秀论文1项。

项目成果

期刊论文数量(16)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Uyghur text clustering based on semantic word set
基于语义词集的维吾尔语文本聚类
  • DOI:
    --
  • 发表时间:
    2013
  • 期刊:
    Journal of Computational Information Systems
  • 影响因子:
    --
  • 作者:
    Zhai; Xianmin;Yu; Long;Guo; Hanjun
  • 通讯作者:
    Hanjun
维吾尔语意见挖掘关系抽取研究
  • DOI:
    --
  • 发表时间:
    2013
  • 期刊:
    计算机工程与设计
  • 影响因子:
    --
  • 作者:
    禹龙;田生伟;吐尔根·依布拉音;艾斯卡尔· 艾木都拉
  • 通讯作者:
    艾斯卡尔· 艾木都拉
Topic extraction based on product reviews
基于产品评论的主题提取
  • DOI:
    --
  • 发表时间:
    2013
  • 期刊:
    Journal of Computational Information Systems
  • 影响因子:
    --
  • 作者:
    禹龙;段祥超;田生伟;郭汉军
  • 通讯作者:
    郭汉军
Uyghur comparative sentences and types identification
维吾尔语比较句及类型识别
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    ICIC Express Letters
  • 影响因子:
    --
  • 作者:
    禹龙;王慧云;田生伟
  • 通讯作者:
    田生伟
深度学习的维吾尔语语句隐式情感分类
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    计算机工程与设计
  • 影响因子:
    --
  • 作者:
    田生伟;禹龙;艾斯卡尔·艾木都拉;吐尔根·依布拉音
  • 通讯作者:
    吐尔根·依布拉音

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

MD-MLI: Prediction of miRNA-lncRNA Interaction by Using Multiple Features and Hierarchical Deep Learning
MD-MLI:利用多重特征和分层深度学习预测 miRNA-lncRNA 相互作用
  • DOI:
    10.1016/j.media.2017.11.011
  • 发表时间:
    2020
  • 期刊:
    IEEE/ACM Transactions on Computational Biology and Bioinformatics
  • 影响因子:
    --
  • 作者:
    宋金淼;田生伟;禹龙;杨启萌;邢艳;张超;代启国;段晓东
  • 通讯作者:
    段晓东
基于Bi-LSTM的维吾尔语人称代词指代消解
  • DOI:
    --
  • 发表时间:
    2018
  • 期刊:
    电子学报
  • 影响因子:
    --
  • 作者:
    田生伟;秦越;禹龙;吐尔根·依布拉音;冯冠军
  • 通讯作者:
    冯冠军
汉维语短语搭配的识别和对齐
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机应用与软件
  • 影响因子:
    --
  • 作者:
    禹龙;田生伟;杨飞宇
  • 通讯作者:
    杨飞宇
深度学习的维吾尔语语句隐式情感分类
  • DOI:
    10.16208/j.issn1000-7024.2016.09.053
  • 发表时间:
    2016
  • 期刊:
    计算机工程与设计
  • 影响因子:
    --
  • 作者:
    李冬白;田生伟;禹龙;艾斯卡尔·艾木都拉;吐尔根·依布拉音
  • 通讯作者:
    吐尔根·依布拉音
结合注意力机制的Bi-LSTM维吾尔语事件时序关系识别
  • DOI:
    --
  • 发表时间:
    2018
  • 期刊:
    东南大学学报(自然科学版)
  • 影响因子:
    --
  • 作者:
    田生伟;胡伟;禹龙;吐尔根·依布拉音;赵建国;李圃
  • 通讯作者:
    李圃

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

禹龙的其他基金

多模态皮肤病辅助诊断关键技术研究
  • 批准号:
    62362061
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目
面向内容安全的情感隐喻分析研究
  • 批准号:
    61962057
  • 批准年份:
    2019
  • 资助金额:
    38 万元
  • 项目类别:
    地区科学基金项目
维语实体指代消歧关键技术研究
  • 批准号:
    61563051
  • 批准年份:
    2015
  • 资助金额:
    40.0 万元
  • 项目类别:
    地区科学基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码