基于主题建模的微博语义理解与热点话题识别研究
项目介绍
AI项目解读
基本信息
- 批准号:61363058
- 项目类别:地区科学基金项目
- 资助金额:45.0万
- 负责人:
- 依托单位:
- 学科分类:F0607.知识表示与处理
- 结题年份:2017
- 批准年份:2013
- 项目状态:已结题
- 起止时间:2014-01-01 至2017-12-31
- 项目参与者:张志昌; 马慧莉; 冯德成; 黄萍; 何尔利; 靳洁; 姚伟; 孙曰昕;
- 关键词:
项目摘要
Aiming at the novel research area, microblog semantic understanding and hot topic extraction, this project starts from topic modeling for microblog, and analyzes ways of feature extraction and representation for microblog to construct semantic mapping model.Hot topic extraction and tracking will be adopted to verify usefulness of these techniques. The main content focuses on the following aspects.Firstly, a dynamic information extension model, which combines text, hashtag and link, is proposed to improve the representation of microblog. Secondly, an online Nonnegative Matrix Tri-Factorization framework is presented to capture the evolution and emergence of themes in microblog under a novel temporal regularization framework.Thirdly, probabilistic topic modeling for microblog and incremental algorithms are designed, effective microblog semantic learning methods based on time and burst are provided. Thereafter, hot topic extraction and tacking can be fully investigated. Fourthly, compared with the existing semantic representation methods and models, a new semantic representation model is proposed, which can effectively support the microblog semtantic understanding. This project can provide new theories, methods and models for pattern recognition and machine learning. When the theory and method of the project are put into practical application, it can be applied to such areas as hot topic extraction and tracking. Therefore, it has very wide application prospect.
本项目瞄准微博语义理解和热点话题发现这一新兴课题,从微博数据的主题建模出发,分析微博特征提取与表示方法,构建语义映射模型,实现微博的语义理解和应用,并以热点话题发现为应用背景进行验证。主要特点和创新点包括:以文本、标签和链接等多模态信息关联为基础,研究基于动态信息扩充技术的微博特征表示方法;以非负矩阵分解算法为基础,研究在线获取进化主题和新出现主题的优化算法;研究微博的概率主题建模方法和增量算法,提出新的基于时序和突发的微博语义学习方法;在发现微博数据语义主题的基础上,深入研究微博热点话题发现和识别的模型和方法;分析、比较现有的语义表征方法和模型,研究新的语义描述模型,使其能够有效地支持微博热点话题提取应用。本项目的成果能够为微博热点话题检测和跟踪提供新的理论、方法与模型,具有重要的理论意义和实用前景。
结项摘要
本项目瞄准微博语义理解和热点话题提取这一新兴课题,以主题建模为基础,分析微博内容、用户标签关系和用户交互关系的特点与表示方法,构建语义映射模型,实现微博的语义理解和应用,并构建用户兴趣表示模型,最终实现对微博丰富网络信息的分析与有效整理。首先,以文本、标签和链接等多模态信息关联为基础,研究基于动态信息扩充技术的微博特征表示方法;接着,对粒子群优化算法离散化以适用于微博话题发现过程,并对粒子、速度以及适应度函数进行新的定义,高效地实现对优化过程中粒子质量的评价和正向优化反馈。然后,设计了融合标签间关联关系与用户间社交关系的微博推荐方法。通过标签检索策略获取相应标签,考虑标签与标签间的关联关系,通过挖掘被同一用户标注的多标签的内联关系与被不同用户标注的多标签外联的关系,构建合理的多标签关联关系矩阵,对用户-标签矩阵进行更新,最后,提出基于核心标签的可重叠微博社区发现策略TagCut。该策略在整体社区中提取包含某一标签的用户作为临时分组并利用评价函数评估划分的优劣,选出最合适的核心标签根据其对应分组与其他分组距离的远近来决定将其划分为新的分组还是并入其他分组。用此策略反复迭代直到满足要求。经真实数据实验表明该方法内聚高社区重叠度可控且拥有实际意义。本项目的成果能够为微博文本分析、用户兴趣建模、热点话题检测和兴趣推荐等知识领域提供新的理论、方法与模型。具有重要的理论意义和实用前景。
项目成果
期刊论文数量(33)
专著数量(0)
科研奖励数量(0)
会议论文数量(14)
专利数量(2)
一种基于标签概率相关性的微博推荐方法
- DOI:10.3969/j.issn.1007-130x.2017.09.022
- 发表时间:2017
- 期刊:计算机工程与科学
- 影响因子:--
- 作者:张迪;马慧芳;贾俊杰;余丽
- 通讯作者:余丽
Some oscillatory properties for a class of partial difference equations
一类偏微分方程的一些振荡性质
- DOI:--
- 发表时间:2017
- 期刊:JOURNAL OF NONLINEAR SCIENCES AND APPLICATIONS
- 影响因子:--
- 作者:MA Hui-Li;JF Wang
- 通讯作者:JF Wang
脉冲神经网络的监督学习算法研究综述
- DOI:--
- 发表时间:2015
- 期刊:电子学报
- 影响因子:--
- 作者:蔺想红;王向文;张宁;马慧芳
- 通讯作者:马慧芳
融合用户行为和内容的微博用户影响力方法
- DOI:10.3969/j.issn.1001-3695.2016.10.006
- 发表时间:2016
- 期刊:计算机应用研究
- 影响因子:--
- 作者:师亚凯;马慧芳;张迪;鲁小勇
- 通讯作者:鲁小勇
一类偏差分方程的振动性
- DOI:--
- 发表时间:2017
- 期刊:数学的实践与认识
- 影响因子:--
- 作者:王娇凤;马慧莉
- 通讯作者:马慧莉
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
融合用户兴趣偏好与影响力的目标社区发现方法
- DOI:--
- 发表时间:2021
- 期刊:计算机研究与发展
- 影响因子:--
- 作者:刘海姣;马慧芳;赵琪琪;李志欣
- 通讯作者:李志欣
一种结合主动学习的半监督文档聚类算法
- DOI:--
- 发表时间:2012
- 期刊:软件学报
- 影响因子:--
- 作者:赵卫中;马慧芳;李志清;史忠植
- 通讯作者:史忠植
基于多头注意力网络的无监督跨媒体哈希检索
- DOI:10.1360/ssi-2020-0264
- 发表时间:2021-06
- 期刊:中国科学:信息科学
- 影响因子:--
- 作者:李志欣;凌锋;唐振军;马慧芳;施智平
- 通讯作者:施智平
融合结构-属性交互二部图随机游走的社区搜索方法
- DOI:--
- 发表时间:2021
- 期刊:计算机工程与科学
- 影响因子:--
- 作者:李举;马慧芳;李青青;宿云
- 通讯作者:宿云
融合两级相似度的跨媒体图像文本检索
- DOI:--
- 发表时间:2021
- 期刊:电子学报
- 影响因子:--
- 作者:李志欣;凌锋;张灿龙;马慧芳
- 通讯作者:马慧芳
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
马慧芳的其他基金
基于图聚集技术的微博用户重叠社区发现方法研究
- 批准号:61762078
- 批准年份:2017
- 资助金额:39.0 万元
- 项目类别:地区科学基金项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}