语义约束主题模型的细粒度商品特征和情感词提取研究
项目介绍
AI项目解读
基本信息
- 批准号:61662032
- 项目类别:地区科学基金项目
- 资助金额:36.0万
- 负责人:
- 依托单位:
- 学科分类:F0202.系统软件、数据库与工业软件
- 结题年份:2020
- 批准年份:2016
- 项目状态:已结题
- 起止时间:2017-01-01 至2020-12-31
- 项目参与者:万红新; 程柏良; 钟林辉; 李雪斌; 聂伟强; 李俊杰; 龚文辉;
- 关键词:
项目摘要
With the development of online shopping, a large number of product reviews mainly exist in the form of text have been produced on the Web, which contains a lot of knowledge about product evaluation. Using data mining and natural language processing technology, to extract fine-grained product aspects and opinion words from the massive review texts, and further obtain the sentiment tendency at the aspect level poses great challenges towards sentiment analysis. .According to the features of Chinese reviews, the semantic relations between words are acquired from the syntactic analysis, word meaning comprehension and context correlation, and then it is embedded into the topic model as the constrained knowledge, which can guide the topic model semantically for finding fine-grained topical words. The project focuses on the following problems. First, the must-link and the cannot-link semantic relation networks are constructed, and use it as the semantic knowledge to constrain the words assigned to the topic in topic model. Second, the topic-word allocation algorithm that meets the semantic relation between product aspects and opinions is designed, and which aims to find more local aspects and local opinion words as possible. Third, the SRC-LDA (semantic relation constrained LDA) model is put forward for extraction of the fine-grained aspects and opinion words. .The project will bring forward a new mechanism to realize the semantic constraints in topic model, and construct a new model for topical words extraction that conforms to the distribution features of aspects and opinions in Chinese review texts, which will bring to new ideas and explore new ways for topical knowledge mining of Chinese product reviews under the background of big data.
随着网络购物的发展,Web上产生了大量的商品评论文本数据,其中蕴含了丰富的评价知识。运用数据挖掘和自然语言处理技术,从海量的评论文本中提取细粒度商品特征和情感词,进而获取特征级别的情感倾向,是商品评论情感分析面临的新挑战。本项目研究根据中文商品评论文本的特点,从句法分析、词义理解和语境相关等多角度获取词语间的语义关系,然后将其作为约束知识嵌入到主题模型,从而实现有语义指导的细粒度主题词发现,研究内容有:①构建词语语义关系网,利用其语义知识来约束词语对于主题的隶属关系;②设计符合商品特征和情感词语义关系特点的主题-词语分配算法,以尽可能多地发现局部特征词和局部情感词;③提出语义关系约束的主题模型,有效提取细粒度特征和情感词。本项目研究将提出主题模型的语义约束新机制,构建符合特征和情感词分布特点的主题词提取新模型,为实现大数据背景下的中文商品评论文本的主题知识挖掘提供新思路和探索新途径。
结项摘要
随着互联网的普及,Web上产生了大量的评论类文本数据,其中蕴含了丰富的评价知识,这些知识的提取对于电子商务、商业智能、信息监控和舆情分析等方面都有着重要的应用。本项目以商品评论等文本为主要研究对象,运用数据挖掘和自然语言处理等相关技术,从海量的评论文本中提取细粒度特征和情感词,获取特征级别的情感倾向,进而实现评论文本的细粒度情感分析。.本项目研究根据中文评论文本的特点,从句法分析、词义理解和语境相关等多角度获取词语间的语义关系,然后将其作为约束知识嵌入到主题模型,从而实现有语义指导的细粒度主题词发现,主要研究内容包括:(1) 构建词语语义关系网,利用其语义知识来约束词语对于主题的隶属关系;(2) 设计符合商品特征和情感词语义关系特点的主题-词语分配算法,以尽可能多地发现局部特征词和局部情感词;(3) 提出语义关系约束的主题模型,有效提取细粒度特征和情感词。.从语义约束角度对主题模型进行弱监督改造,提升LDA主题模型对中文商品评论文本的语义理解能力,使它能够按照预定语义目标进行主题词挖掘,实现了细粒度商品特征和情感词的提取。设计了弱监督的SRC-LDA(semantic relation constrained LDA)、AC-LDA(association constrained LDA)等系列算法和模型,对商品评论及微博等文本数据进行了大规模数据量的测试和分析,并验证了算法和模型的有效性。.本项目研究以实际Web评论文本为数据源,从新的角度对评论类文本中主题模型的作用机理进行了研究,对大数据背景下的文本语义提取进行了探索,提出了符合中文文本语法、语义结构特点的主题模型的语义约束新机制,提升了主题模型对海量文本数据进行语义提取和知识挖掘的能力。
项目成果
期刊论文数量(10)
专著数量(1)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
一种图编辑距离的软件体系结构变化性度量方法及应用研究
- DOI:--
- 发表时间:2018
- 期刊:小型微型计算机系统
- 影响因子:--
- 作者:钟林辉;夏鲸;彭云;谢冰
- 通讯作者:谢冰
基于版本的多重软件重构自动检测技术研究
- DOI:--
- 发表时间:2018
- 期刊:江西师范大学学报(自然科学版)
- 影响因子:--
- 作者:钟林辉;黄小明;薛良波;叶海涛
- 通讯作者:叶海涛
软件演化历史的逆向工程生成方法研究
- DOI:--
- 发表时间:2020
- 期刊:计算机科学
- 影响因子:--
- 作者:钟林辉;扶丽娟;叶海涛;齐杰;徐静
- 通讯作者:徐静
基于语义分析的评价对象-情感词对抽取
- DOI:--
- 发表时间:2017
- 期刊:计算机学报
- 影响因子:--
- 作者:江腾蛟;万常选;刘德喜;刘喜平;廖国琼
- 通讯作者:廖国琼
An association-constrained LDA model for joint extraction of product aspects and opinions
用于联合提取产品方面和意见的关联约束 LDA 模型
- DOI:10.1016/j.ins.2020.01.036
- 发表时间:2020-05
- 期刊:Information Sciences
- 影响因子:8.1
- 作者:万常选;彭云;Keli Xiao;刘喜平;江腾蛟;刘德喜
- 通讯作者:刘德喜
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
集装箱码头危险品堆场经济选址仿真研究
- DOI:10.16403/j.cnki.ggjs20190409
- 发表时间:2019
- 期刊:港工技术
- 影响因子:--
- 作者:段志男;彭云;王文渊;宋向群;李相达
- 通讯作者:李相达
面向可再生能源利用的集装箱港口环境经济效益仿真
- DOI:10.16233/j.cnki.issn1002-4972.20190805.032
- 发表时间:2019
- 期刊:水运工程
- 影响因子:--
- 作者:彭云;董猛;李相达
- 通讯作者:李相达
庐山杉木林与黄山松林的土壤层水源涵养能力和土壤侵蚀敏感性探究
- DOI:10.13870/j.cnki.stbcxb.2022.02.032
- 发表时间:2022
- 期刊:水土保持学报
- 影响因子:--
- 作者:温林生;彭云;邓文平;肖廷琦;黄家辉;邹芹;刘晓君;刘苑秋
- 通讯作者:刘苑秋
无肌病皮肌炎相关性肺间质病变研究进展
- DOI:--
- 发表时间:2015
- 期刊:中华风湿病学杂志
- 影响因子:--
- 作者:彭云;严冰;刘毅
- 通讯作者:刘毅
一种词聚类LDA的商品特征提取算法
- DOI:--
- 发表时间:2015
- 期刊:小型微型计算机系统
- 影响因子:--
- 作者:彭云;万常选;江腾蛟;刘德喜;刘喜平
- 通讯作者:刘喜平
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
彭云的其他基金
泛型Web文本多粒度融合的深度情感分析研究
- 批准号:
- 批准年份:2019
- 资助金额:39 万元
- 项目类别:地区科学基金项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}