社会媒体中的垃圾用户集团识别方法研究
项目介绍
AI项目解读
基本信息
- 批准号:61572376
- 项目类别:面上项目
- 资助金额:63.0万
- 负责人:
- 依托单位:
- 学科分类:F0211.信息检索与社会计算
- 结题年份:2019
- 批准年份:2015
- 项目状态:已结题
- 起止时间:2016-01-01 至2019-12-31
- 项目参与者:Bing Liu; 钟鸣; 黄浩; 王飞; 李琳; 杨喆; 陈丽; 尤珍妮; 陈林;
- 关键词:
项目摘要
The viral marketing and malicious speculation operated by spam user groups on social media will destroy the business rules, the public opinion environment, and the government credibility. Compared to individual spam users, spam groups are more damaging as they can take total control of whole marketing or public opinions. However, due to a huge number of users, various types of features, and hidden and complex ways that the spammers collaborate, it is difficult to apply traditional methods to spam user group detection. This project will identify spam user groups in a collaborative setting. First, we will present several fast searching strategies for finding users with similar user names or abnormal structures to deal with the problem caused by a huge number of users. Second, we will propose an integrated framework for better utilizing various types of features based on a systematic comparison of the performance of features and the analysis of their correlation or redundancy. Finally, we will develop a set of unsupervised or semi-supervised algorithms which use both the users’ personal features and collaborative features among users in the same group. This study will reveal the relationship between individual spam users and spam user groups, and provide the theoretical and technical foundation for the application of identifying spam groups on social media.
社会媒体中的垃圾用户集团从事的病毒营销、恶意炒作等活动,严重破坏商业秩序、舆论环境和政府公信力。与传统垃圾用户相比,垃圾集团的操控能力和危害更强。然而,社会媒体的用户数目巨大、用户特征多模、用户间集体协作方式隐藏而复杂,很多垃圾用户识别技术难以适用。本项目拟针对社会媒体环境下的垃圾用户集团识别方法进行创新性研究,包括:(1)研究相似用户名和异常子结构快速查找方法,以解决海量社会媒体数据中的疑似集团定位困难问题;(2)研究用户多模态特征的有效集成方法,利用特征的相关互补性提升垃圾指标计算的精度;(3)研究融合用户个体特征和用户之间协同特征的无监督、半监督学习算法,在挖掘用户协同工作模式的基础上实现对垃圾用户集团的准确识别。. 本项目有望揭示个体垃圾用户和垃圾用户集团之间的内在联系,并为社会媒体中垃圾用户集团的自动区分这一重要问题提供可行的理论支持和技术基础,具有重要的理论意义和实际应用价值。
结项摘要
本项目研究社会媒体中的垃圾用户集团识别方法。申报书所列的五项研究内容:1) 数据集构造方法;2)支持海量数据的疑似垃圾集团快速定位方法;3)社会媒体中用户多模态特征集成方法;4)基于协同模式挖掘的垃圾集团高效区分算法;5) 具有垃圾用户集团辨识能力的原型系统,均已完全按照计划执行完毕。此外,我们还研究了方面级情感分析、推荐系统等技术,有利于对多种不同类型垃圾用户集团的深入挖掘。. .本项目整体进展顺利,已经形成了一套可行的理论与方法,包括:1)针对垃圾用户集团式运作、爆发式注册特点,创造性提出利用属性增强和领域适应的协同训练、以及真实样本和生成样本的对抗训练等技术,实现冷启动环境下垃圾信息的有效检测。2)创新性地设计了一系列基于深度学习技术的多模态特征融合方法,有效地改善用户特征空间表示,极大地提升了社会媒体中海量用户区分算法的性能。3)探索利用用户的社交网络结构特征扩展该类用户的特征,并提出将用户简介、用户社交关系等多个要素进行集成学习,大幅提高了算法的分类效果;4)提出了基于胶囊网络、深度记忆网络的方面级情感分类新方法,成功解决了评论数据中的方面短语和方面类别的表示问题,以及从文档级别到句子级别的迁移学习问题。5)提出了结合评论的商品推荐方法,设计了时空上下文感知的POI推荐,以及基于用户长短期兴趣的序列推荐新方法,有效提升了稀疏数据条件下的推荐系统性能。. .本项目的研究成果具有很强的科学意义。在ACL、AAAI、TOIS、TKDD、COLING、CIKM、DASFAA等自然语言处理和数据挖掘领域的顶级和权威国际学术会议或期刊上发表了36篇论文(其中28篇为第一标注,且上述重要论文均由项目负责人担任第一或通信作者)。研究成果引起如都柏林城市大学、中科院等研究者的关注和引用,引用来源包括TKDE、ICDM、IJCNN、ACL等自然语言处理和数据挖掘领域的一流刊物和会议。
项目成果
期刊论文数量(13)
专著数量(0)
科研奖励数量(0)
会议论文数量(22)
专利数量(0)
基于边采样的网络表示学习模型
- DOI:10.13328/j.cnki.jos.005435
- 发表时间:2018
- 期刊:软件学报
- 影响因子:--
- 作者:陈丽;朱裴松;钱铁云;朱辉;周静
- 通讯作者:周静
基于多模态融合技术的用户画像方法
- DOI:--
- 发表时间:--
- 期刊:北京大学学报(自然科学版)
- 影响因子:--
- 作者:张壮;冯小年;钱铁云
- 通讯作者:钱铁云
Time and Location Aware Points of Interest Recommendation in Location-Based Social Networks
基于位置的社交网络中时间和位置感知的兴趣点推荐
- DOI:10.1007/s11390-018-1883-7
- 发表时间:2018-11
- 期刊:JOURNAL OF COMPUTER SCIENCE AND TECHNOLOGY
- 影响因子:0.7
- 作者:Qian TieYun;Liu Bei;Hong Liang;You Zhen-Ni
- 通讯作者:You Zhen-Ni
Relation constrained attributed network embedding
关系约束属性网络嵌入
- DOI:10.1016/j.ins.2019.12.033
- 发表时间:2020-04
- 期刊:INFORMATION SCIENCES
- 影响因子:8.1
- 作者:Chen Yiqi;Qian Tieyun
- 通讯作者:Qian Tieyun
Towards a semantics representation framework for narrative images
走向叙事图像的语义表示框架
- DOI:10.1108/el-09-2018-0187
- 发表时间:2019-06
- 期刊:ELECTRONIC LIBRARY
- 影响因子:1.9
- 作者:Li Xuhui;Wu Yanqiu;Wang Xiaoguang;Qian Tieyun;Hong Liang
- 通讯作者:Hong Liang
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
基于量化情感的网店垃圾评论检测
- DOI:--
- 发表时间:2013
- 期刊:山东大学学报(理学版)
- 影响因子:--
- 作者:彭庆喜;钱铁云
- 通讯作者:钱铁云
基于兴趣标签的缄默用户性别预测研究
- DOI:--
- 发表时间:2015
- 期刊:华中科技大学学报
- 影响因子:--
- 作者:钱铁云;尤珍妮;陈丽;王飞
- 通讯作者:王飞
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}

内容获取失败,请点击重试

查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图

请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
钱铁云的其他基金
面向细粒度自然语言处理的反事实数据增强方法研究
- 批准号:62276193
- 批准年份:2022
- 资助金额:53 万元
- 项目类别:面上项目
基于语言特征的网络用户身份属性识别方法研究
- 批准号:61272275
- 批准年份:2012
- 资助金额:80.0 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}