语义约束主题模型的细粒度商品特征和情感词提取研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61662032
  • 项目类别:
    地区科学基金项目
  • 资助金额:
    36.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0202.系统软件、数据库与工业软件
  • 结题年份:
    2020
  • 批准年份:
    2016
  • 项目状态:
    已结题
  • 起止时间:
    2017-01-01 至2020-12-31

项目摘要

With the development of online shopping, a large number of product reviews mainly exist in the form of text have been produced on the Web, which contains a lot of knowledge about product evaluation. Using data mining and natural language processing technology, to extract fine-grained product aspects and opinion words from the massive review texts, and further obtain the sentiment tendency at the aspect level poses great challenges towards sentiment analysis. .According to the features of Chinese reviews, the semantic relations between words are acquired from the syntactic analysis, word meaning comprehension and context correlation, and then it is embedded into the topic model as the constrained knowledge, which can guide the topic model semantically for finding fine-grained topical words. The project focuses on the following problems. First, the must-link and the cannot-link semantic relation networks are constructed, and use it as the semantic knowledge to constrain the words assigned to the topic in topic model. Second, the topic-word allocation algorithm that meets the semantic relation between product aspects and opinions is designed, and which aims to find more local aspects and local opinion words as possible. Third, the SRC-LDA (semantic relation constrained LDA) model is put forward for extraction of the fine-grained aspects and opinion words. .The project will bring forward a new mechanism to realize the semantic constraints in topic model, and construct a new model for topical words extraction that conforms to the distribution features of aspects and opinions in Chinese review texts, which will bring to new ideas and explore new ways for topical knowledge mining of Chinese product reviews under the background of big data.
随着网络购物的发展,Web上产生了大量的商品评论文本数据,其中蕴含了丰富的评价知识。运用数据挖掘和自然语言处理技术,从海量的评论文本中提取细粒度商品特征和情感词,进而获取特征级别的情感倾向,是商品评论情感分析面临的新挑战。本项目研究根据中文商品评论文本的特点,从句法分析、词义理解和语境相关等多角度获取词语间的语义关系,然后将其作为约束知识嵌入到主题模型,从而实现有语义指导的细粒度主题词发现,研究内容有:①构建词语语义关系网,利用其语义知识来约束词语对于主题的隶属关系;②设计符合商品特征和情感词语义关系特点的主题-词语分配算法,以尽可能多地发现局部特征词和局部情感词;③提出语义关系约束的主题模型,有效提取细粒度特征和情感词。本项目研究将提出主题模型的语义约束新机制,构建符合特征和情感词分布特点的主题词提取新模型,为实现大数据背景下的中文商品评论文本的主题知识挖掘提供新思路和探索新途径。

结项摘要

随着互联网的普及,Web上产生了大量的评论类文本数据,其中蕴含了丰富的评价知识,这些知识的提取对于电子商务、商业智能、信息监控和舆情分析等方面都有着重要的应用。本项目以商品评论等文本为主要研究对象,运用数据挖掘和自然语言处理等相关技术,从海量的评论文本中提取细粒度特征和情感词,获取特征级别的情感倾向,进而实现评论文本的细粒度情感分析。.本项目研究根据中文评论文本的特点,从句法分析、词义理解和语境相关等多角度获取词语间的语义关系,然后将其作为约束知识嵌入到主题模型,从而实现有语义指导的细粒度主题词发现,主要研究内容包括:(1) 构建词语语义关系网,利用其语义知识来约束词语对于主题的隶属关系;(2) 设计符合商品特征和情感词语义关系特点的主题-词语分配算法,以尽可能多地发现局部特征词和局部情感词;(3) 提出语义关系约束的主题模型,有效提取细粒度特征和情感词。.从语义约束角度对主题模型进行弱监督改造,提升LDA主题模型对中文商品评论文本的语义理解能力,使它能够按照预定语义目标进行主题词挖掘,实现了细粒度商品特征和情感词的提取。设计了弱监督的SRC-LDA(semantic relation constrained LDA)、AC-LDA(association constrained LDA)等系列算法和模型,对商品评论及微博等文本数据进行了大规模数据量的测试和分析,并验证了算法和模型的有效性。.本项目研究以实际Web评论文本为数据源,从新的角度对评论类文本中主题模型的作用机理进行了研究,对大数据背景下的文本语义提取进行了探索,提出了符合中文文本语法、语义结构特点的主题模型的语义约束新机制,提升了主题模型对海量文本数据进行语义提取和知识挖掘的能力。

项目成果

期刊论文数量(10)
专著数量(1)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
一种图编辑距离的软件体系结构变化性度量方法及应用研究
  • DOI:
    --
  • 发表时间:
    2018
  • 期刊:
    小型微型计算机系统
  • 影响因子:
    --
  • 作者:
    钟林辉;夏鲸;彭云;谢冰
  • 通讯作者:
    谢冰
基于版本的多重软件重构自动检测技术研究
  • DOI:
    --
  • 发表时间:
    2018
  • 期刊:
    江西师范大学学报(自然科学版)
  • 影响因子:
    --
  • 作者:
    钟林辉;黄小明;薛良波;叶海涛
  • 通讯作者:
    叶海涛
软件演化历史的逆向工程生成方法研究
  • DOI:
    --
  • 发表时间:
    2020
  • 期刊:
    计算机科学
  • 影响因子:
    --
  • 作者:
    钟林辉;扶丽娟;叶海涛;齐杰;徐静
  • 通讯作者:
    徐静
基于语义分析的评价对象-情感词对抽取
  • DOI:
    --
  • 发表时间:
    2017
  • 期刊:
    计算机学报
  • 影响因子:
    --
  • 作者:
    江腾蛟;万常选;刘德喜;刘喜平;廖国琼
  • 通讯作者:
    廖国琼
An association-constrained LDA model for joint extraction of product aspects and opinions
用于联合提取产品方面和意见的关联约束 LDA 模型
  • DOI:
    10.1016/j.ins.2020.01.036
  • 发表时间:
    2020-05
  • 期刊:
    Information Sciences
  • 影响因子:
    8.1
  • 作者:
    万常选;彭云;Keli Xiao;刘喜平;江腾蛟;刘德喜
  • 通讯作者:
    刘德喜

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

集装箱码头危险品堆场经济选址仿真研究
  • DOI:
    10.16403/j.cnki.ggjs20190409
  • 发表时间:
    2019
  • 期刊:
    港工技术
  • 影响因子:
    --
  • 作者:
    段志男;彭云;王文渊;宋向群;李相达
  • 通讯作者:
    李相达
面向可再生能源利用的集装箱港口环境经济效益仿真
  • DOI:
    10.16233/j.cnki.issn1002-4972.20190805.032
  • 发表时间:
    2019
  • 期刊:
    水运工程
  • 影响因子:
    --
  • 作者:
    彭云;董猛;李相达
  • 通讯作者:
    李相达
庐山杉木林与黄山松林的土壤层水源涵养能力和土壤侵蚀敏感性探究
  • DOI:
    10.13870/j.cnki.stbcxb.2022.02.032
  • 发表时间:
    2022
  • 期刊:
    水土保持学报
  • 影响因子:
    --
  • 作者:
    温林生;彭云;邓文平;肖廷琦;黄家辉;邹芹;刘晓君;刘苑秋
  • 通讯作者:
    刘苑秋
无肌病皮肌炎相关性肺间质病变研究进展
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    中华风湿病学杂志
  • 影响因子:
    --
  • 作者:
    彭云;严冰;刘毅
  • 通讯作者:
    刘毅
一种词聚类LDA的商品特征提取算法
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    小型微型计算机系统
  • 影响因子:
    --
  • 作者:
    彭云;万常选;江腾蛟;刘德喜;刘喜平
  • 通讯作者:
    刘喜平

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

彭云的其他基金

泛型Web文本多粒度融合的深度情感分析研究
  • 批准号:
  • 批准年份:
    2019
  • 资助金额:
    39 万元
  • 项目类别:
    地区科学基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码