Web文本意见挖掘关键技术研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61250010
  • 项目类别:
    专项基金项目
  • 资助金额:
    20.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0211.信息检索与社会计算
  • 结题年份:
    2013
  • 批准年份:
    2012
  • 项目状态:
    已结题
  • 起止时间:
    2013-01-01 至2013-12-31

项目摘要

Web opinion mining mines and analyzes the type of texts including blogs, micro blogs to online reviews from WWW automatically.With the rapid development of Web 2.0, opinion mining has become a hot research topic in the fields of intelligent information processing, data mining, computational linguistics, etc.This proposal will focus on some of the challenges problems of opinion mining including Sentimental lexicon construction, Fine-grained opinion mining and Opinion retrieval. In accordance with accuracy of overall system and dependency of sentimental feed, we proposed a Graph-based Coupled Building Approach for Domain Sentiment, Entity and Attribute Lexicon including three approaches to construct graph of sentiment words.Feature space of fine-grained opinion mining is usually very large whereas the scale of training dataset is relatively small and the sparsity is obvious. Therefore, we study and proposal the approach for fine-grained opinion mining task based on tree kernels. With regard to the key question of design in tree kernel spaces, it proposes varius types of tree kernel spaces, followed by combining the above tree kernels with polynomial kernel. Concerning the massive opinion text, a topic-opinion mixture model for opinion retrieval in the light of the specific characteristic of opinion retrieval comparing with traditional IR. The problem with fusion of results of retrieval and sentiment classification in traditional two-stages processing which has little theoretical basis is solved. A prototype system of opinion system is also proposed and will be evaluated by TREC datasets.
Web文本意见挖掘通过自动的方法对博克、微博、在线评论等新媒体文本信息进行挖掘和分析。随Web 2.0快速发展,它是智能信息处理、数据挖掘、计算语言学等领域的一个研究热点。本项目主要研究情感词典构建、细粒度意见挖掘方法和意见检索模型等关键技术。针对情感词典构造的整体准确率和基准词依赖性问题,研究基于图的耦合半监督情感词典及领域词典构造方法。针对向量模型在细粒度意见挖掘存在特征稀疏,无法表示结构特征的问题,提出基于树核的细粒度意见挖掘方法,并针对意见两阶段任务设计多种树核空间,将树核与多项式核进行组合。针对文本意见检索,研究文本检索结果和情感分类结果的融合方法,研究新的主题意见混合模型,该方法解决了传统两阶段处理所带来的检索结果和情感分类结果的融合问题,更具理论基础。此外,项目将设计实现一个原型检索系统,并通过TREC所提供的公开数据验证其有效性。

结项摘要

Web 文本意见挖掘通过自动的方法对博客、微博、在线评论等新媒体文本信息进行挖掘和分析。随Web 2.0 快速发展,它是智能信息处理、数据挖掘、计算语言学等领域的一个研究热点。本项目主要研究Web文本意见挖掘中情感词典构建和意见检索模型等关键技术,围绕课题的任务和目标,本课题的主要成果包括:(1)采用混合语言模型理论,提出基于主题意见混合模型的意见检索方法。该模型假设主题模型与意见模型具有一定的关联性,即每个主题都有特定的意见模型,不同主题具有不同的意见模型。基于主题意见混合模型的意见检索方法,能更好的解决传统信息检索技术和情感分类技术的融合问题。我们的方法不需要任何标记数据。(2)针对情感词典构建存在的算法领域自适应性、种子词依赖性和准确率不高问题,提出了一种基于约束标签传播的领域情感词典自动构建方法。该方法针对情感词的领域性,利用组块依存树和先验通用情感词典抽取领域候选情感词和短语,通过分析领域评论文本中存在的局部上下文情感的一致性和转折性,以及情感词之间的词法关系,定义和抽取情感词之间的上下文和词法情感倾向约束关系,能够增强情感词之间领域依赖的情感关联相似度。采用约束传播算法能够有效地将局部约束关系传播到全局情感词空间,从而解决了局部约束关系的稀疏性问题;最后使用半监督的标签传播算法,在融合先验约束知识的同时,计算候选词的情感倾向性,构建领域情感词典。(3)开展了检索推荐模型等相关研究并设计实现一个文本意见检索原型系统,通过实验验证了相关方法的有效性。. 针对上述研究,课题组已公开发表SCI检索论文2篇,EI国际会议论文8篇,软件系统1套;另外,录用SCI论文1篇,会议论文3篇,申请专1个,并有2篇论文待投,培养研究生多名,完成了项目目标,并为后续研究提供了较好的基础。

项目成果

期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(9)
专利数量(0)
Interest before liking: Two-step recommendation approaches
先感兴趣后喜欢:两步推荐方法
  • DOI:
    10.1016/j.knosys.2013.04.009
  • 发表时间:
    2013-08
  • 期刊:
    Knowledge-Based Systems
  • 影响因子:
    8.8
  • 作者:
    Xiangyu Zhao;Zhendong Niu;Wei Chen
  • 通讯作者:
    Wei Chen
Automatic construction of domain-specific sentiment lexicon based on constrained label propagation
基于约束标签传播的领域特定情感词典自动构建
  • DOI:
    10.1016/j.knosys.2013.11.009
  • 发表时间:
    2014-01-01
  • 期刊:
    KNOWLEDGE-BASED SYSTEMS
  • 影响因子:
    8.8
  • 作者:
    Huang, Sheng;Niu, Zhendong;Shi, Chongyang
  • 通讯作者:
    Shi, Chongyang
An Improved Personalized Genetic Algorithm Incorporated Item Distribution for Test Sheet Assembling
一种改进的结合项目分布的个性化遗传算法用于试纸组装
  • DOI:
    10.12785/amis/080421
  • 发表时间:
    2014-07
  • 期刊:
    Applied Mathematics & Information Sciences (SCI源)
  • 影响因子:
    --
  • 作者:
    Peipei Gu;zhendong niu;Wei Chen, Xuting Chen, Ke Niu;Jia Sun
  • 通讯作者:
    Jia Sun

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

贝叶斯分类器集成的增量学习方法
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    北京理工大学学报
  • 影响因子:
    --
  • 作者:
    郑建军;牛振东;原达;张全新
  • 通讯作者:
    张全新
基于概念和小世界网络的近似网页去重
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    软件学报
  • 影响因子:
    --
  • 作者:
    彭学平;牛振东;赵堃;曹玉娟
  • 通讯作者:
    曹玉娟
A hybrid recommendation approachfor e-learning based on context awareness and sequential pattern mining
基于上下文感知和序列模式挖掘的电子学习混合推荐方法
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    Soft computing
  • 影响因子:
    4.1
  • 作者:
    John Tarus;牛振东;Arshad Ahmed
  • 通讯作者:
    Arshad Ahmed
基于代码库和特征匹配的函数名称推荐方法
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    软件学报
  • 影响因子:
    --
  • 作者:
    高原;刘辉;樊孝忠;牛振东
  • 通讯作者:
    牛振东
代码坏味的处理顺序
  • DOI:
    --
  • 发表时间:
    2012
  • 期刊:
    软件学报
  • 影响因子:
    --
  • 作者:
    高原;刘辉;樊孝忠;牛振东;邵维忠
  • 通讯作者:
    邵维忠

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

牛振东的其他基金

融合多源企业声誉的就职推荐技术研究
  • 批准号:
    62272048
  • 批准年份:
    2022
  • 资助金额:
    53.00 万元
  • 项目类别:
    面上项目
融合多源企业声誉的就职推荐技术研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    53 万元
  • 项目类别:
    面上项目
面向Web主观性文本意见挖掘研究
  • 批准号:
    61370137
  • 批准年份:
    2013
  • 资助金额:
    75.0 万元
  • 项目类别:
    面上项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码