中文社交化短文本情感分析与话题挖掘研究
项目介绍
AI项目解读
基本信息
- 批准号:71501003
- 项目类别:青年科学基金项目
- 资助金额:17.4万
- 负责人:
- 依托单位:
- 学科分类:G0112.信息系统与管理
- 结题年份:2018
- 批准年份:2015
- 项目状态:已结题
- 起止时间:2016-01-01 至2018-12-31
- 项目参与者:张辉; 左源; 陈勇; 蒋贤林; 张伟凡;
- 关键词:
项目摘要
Sentiment analysis and topic mining for large scale text have always been the core research points in business intelligence field. With the rapid growth of social media, users generate more and more reviews on a product, a news event or a life experience. The huge-volume, high-dimensional, high-sparse characteristics of these social media and the lack of Chinese corpora post severe challenges to the traditional sentiment analysis and topic mining algorithms. In this project, we try to handle the issue by cross-lingual sentiment analysis and non-negative matrix factorization (NMF) with soft orthogonal constraint techniques. Specifically, 1) To avoid high sparseness of large scale social short texts, we combine word co-occurrence matrix and orthogonalization process to propose an unsupervised feature selection algorithm; 2) We propose a semi-supervised learning algorithm with space transfer for cross-lingual sentiment analysis of Chinese short text, which employs existing abundant English sentiment corpora and extends structural correspondence learning; 3) To conquer the weakness of topic coherence and indicators of traditional topic model methods, we introduce soft orthogonal constraints into NMF-based topic mining model of social short text; 4) We will finally develop a prototypical system, which will be used for product-users’ micro blog reviews to verify its effectiveness. The project will provide great values in terms of both theories and practices to business intelligence under social media environment.
面向大规模文本的情感分析与话题挖掘一直以来都是商务智能领域的核心研究问题。随着社交媒体的迅速发展,用户对某一产品、新闻事件或生活体验的评价越来越丰富。这些社交化短文本的海量、高维、高稀疏特点以及中文语料的匮乏对传统的情感分析和话题挖掘算法提出了严峻的挑战。本项目尝试采用跨语言的情感分析和软正交约束的非负矩阵分解技术来解决上述问题。具体包括:1)针对社交短文本高稀疏的特点,将词语共现矩阵和正交化相结合,研究大规模短文本的非监督特征选择问题;2)利用现有的、丰富的英文情感语料和结构对应学习算法,研究并提出空间迁移的跨语言短文本半监督情感分类算法;3)针对传统方法挖掘的话题语义内聚性不强及指示词不突出问题,引入软正交约束,研究基于非负矩阵分解的短文本话题挖掘算法;4)研发系统原型,并针对产品-用户微博评论展开应用研究。本项目将为社会化媒体环境下的商务智能理论与实践提供有益参考。
结项摘要
大规模文本的情感分析与话题挖掘是产品评论领域的研究热点,本项目主要利用迁移学习和非负矩阵分解技术来解决现有的问题。具体成果包括:1)研究并提出一种基于随机投影和GS的特征选择算法,并在大规模短文本数据集上进行了实验的验证;2)利用现有的、丰富的英文情感语料和结构对应学习算法,研究并提出一种软关联的迁移学习算法,解决跨领域或者跨语言的产品评论情感分类问题;3)提出一种互补的方面级观点挖掘算法,为产品评论意见挖掘提供支持;4)提出一种基于稀疏表示的软正交约束的非负矩阵分解的层次主题算法,实现文本数据的层级话题分析。本项目的成果为社会化媒体环境下的商务智能理论与实践提供有益参考。
项目成果
期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(6)
专利数量(0)
Unsupervised feature selection through Gram-Schmidt orthogonalization-A word co-occurrence perspective
通过 Gram-Schmidt 正交化进行无监督特征选择——词共现视角
- DOI:10.1016/j.neucom.2015.08.038
- 发表时间:2016
- 期刊:Neurocomputing
- 影响因子:6
- 作者:Wang Deqing;Zhang Hui;Liu Rui;Liu Xianglong;Wang Jing
- 通讯作者:Wang Jing
Softly Associative Transfer Learning for Cross-Domain Classification
用于跨域分类的软关联迁移学习
- DOI:10.1109/tcyb.2019.2891577
- 发表时间:2020-11
- 期刊:IEEE Transactions on Cybernetics
- 影响因子:11.8
- 作者:Wang Deqing;Lu Chenwei;Wu Junjie;Liu Hongfu;Zhang Wenjie;Zhuang Fuzhen;Zhang Hui
- 通讯作者:Zhang Hui
Complementary Aspect-Based Opinion Mining
基于互补方面的意见挖掘
- DOI:10.1109/tkde.2017.2764084
- 发表时间:2018-02
- 期刊:IEEE Transactions on Knowledge and Data Engineering
- 影响因子:8.9
- 作者:Zuo Yuan;Wu Junjie;Zhang Hui;Wang Deqing;Xu Ke;Wu JJ
- 通讯作者:Wu JJ
Topic Splitting: A Hierarchical Topic Model Based on Non-Negative Matrix Factorization
主题分裂:一种基于非负矩阵分解的层次主题模型
- DOI:10.1007/s11518-018-5375-7
- 发表时间:2018-07
- 期刊:Journal of Systems Science and Systems Engineering
- 影响因子:1.2
- 作者:Rui Liu;Xingguang Wang;Deqing Wang;Yuan Zuo;He Zhang;Xianzhu Zheng
- 通讯作者:Xianzhu Zheng
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
往复搅拌流场中气体射流两相流数值研究
- DOI:--
- 发表时间:--
- 期刊:工程热物理学报
- 影响因子:--
- 作者:于静;王德庆;解茂昭;刘红
- 通讯作者:刘红
发泡工艺参数对闭孔泡沫铝胞结构
- DOI:--
- 发表时间:--
- 期刊:材料热处理学报, 27 (6) 5-9, 2006
- 影响因子:--
- 作者:孟祥鋆*;王德庆;郭昭君;薛微
- 通讯作者:薛微
甲基硼酸衍生法测定丁四醇中的碳同位素
- DOI:--
- 发表时间:--
- 期刊:分析化学
- 影响因子:--
- 作者:傅家谟;郑柯文;余应新;汪午;王德庆;陈华山;李黎;盛国英
- 通讯作者:盛国英
金属熔池往复搅拌流场中气泡运动特性数值模拟研究
- DOI:--
- 发表时间:--
- 期刊:大连理工大学学报
- 影响因子:--
- 作者:解茂昭;YU Jing;LIU Hong;于静;刘红;XIE Mao-zhao;王德庆;WANG De-qing
- 通讯作者:WANG De-qing
碳纳米管的快速糖基化及用于糖-凝集素特异性识别作用的研究
- DOI:--
- 发表时间:--
- 期刊:高等学校化学学报
- 影响因子:--
- 作者:付群;吴明红;焦正;王德庆;FU Qun;WU Ming-Hong;JIAO Zheng;WANG De-Qing
- 通讯作者:WANG De-Qing
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
王德庆的其他基金
基于预训练和图神经网络的技术趋势挖掘与预测算法研究
- 批准号:
- 批准年份:2022
- 资助金额:53 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}