大图数据管理与分析的基础理论与关键技术研究
项目介绍
AI项目解读
基本信息
- 批准号:61732003
- 项目类别:重点项目
- 资助金额:315.0万
- 负责人:
- 依托单位:
- 学科分类:F0202.系统软件、数据库与工业软件
- 结题年份:2022
- 批准年份:2017
- 项目状态:已结题
- 起止时间:2018-01-01 至2022-12-31
- 项目参与者:李建中; 王波涛; 乔百友; 毕鑫; 张岩; 王金宝; 马玉亮; 王一舒; 李发明;
- 关键词:
项目摘要
In big data environment, close relationships are among multisource and heterogeneous data. Graphs, as a kind of fundamental structure expressing data relationships, have a wide application in many fields such as social network analysis, brain network analysis, and knowledge graph analysis. Compared with other types of data, big graphs have characters of large scales, complex structures, and dynamic changes. These characters make the management and analysis of big graphs face three main challenges: heterogeneous storage and partition, efficient calculation, and lightweight execution guarantee. Existing techniques of graph management and analysis cannot solve these three challenge well, and cannot meet the requirement of current big graph applications. Thus, this project focuses on the basic theories and key techniques of big graph management and analysis, including: (1) the model and storage of big graphs (physic models, partition and distribution, and compressed storage); (2) techniques of big graph queries and optimizations (matching query, information retrieval, and distance query); (3) techniques on big graph mining and analysis (community detection, graph mining, clustering and classification); (4) execution guarantees of big graph tasks (error-tolerant techniques, task scheduling, and load balance). This project meets the requirement of the real world and technique development, which has a wide application in the future.
在大数据时代海量多源异构的数据间存在着紧密的关联性,图作为表示数据之间关系的基本结构在社交网络分析、人脑网络分析、知识图谱分析等领域有着广泛应用。与其它数据类型相比,大图数据具有规模宏大、结构复杂、动态变化等特点,这些独有的特点使管理和分析大图数据面临三大挑战:异构的存储和划分、高效的计算和轻量级的执行保证。目前的图数据管理和分析技术不能很好地解决这三个挑战,无法满足当前大图数据应用的需求。为此,本项目将重点研究大图数据管理与分析的基础理论和关键技术,包括1) 大图数据的模型和存储技术(物理模型、划分和布局、压缩存储);2) 大图数据的查询处理与优化技术(匹配查询、信息检索、距离查询);3) 大图数据的挖掘和分析技术(社区发现、图挖掘、聚类和分类);4) 大图数据任务的执行保证(容错技术、任务调度、负载平衡)。本项目的研究符合现实应用需求和技术发展趋势,具有广阔的应用前景。
结项摘要
在大数据时代海量多源异构的数据间存在着紧密的关联性,图作为表示数据之间关系的基本结构在社交网络分析、人脑网络分析、知识图谱分析等领域有着广泛应用。与其它数据类型相比,大图数据具有规模宏大、结构复杂、动态变化等特点,这些独有的特点使管理和分析大图数据面临三大挑战:异构的存储和划分、高效的计算和轻量级的执行保证。目前的图数据管理和分析技术不能很好地解决这三个挑战,无法满足当前大图数据应用的需求。为此,本项目重点研究了大图数据管理与分析的基础理论和关键技术,包括大图数据模型与存储技术、大图数据查询处理与优化技术、大图数据的挖掘和分析技术、分布式系统的执行保障技术四个方面。并且实现了提出的大图数据查询处理和分析算法、大图数据存储和分割算法以及大图数据各种任务执行保障的策略,最后设计与实现了大图数据管理与分析原型系统。本项目实施过程中,项目组已在VLDB Journal、IEEE TKDE、等国际权威期和本领域重要的国际会议(SIGMOD、VLDB、ICDE等)上发表(含已录用)论文110篇,其中CCF A类论文46篇。培养毕业研究生20余名,李长升获批优秀青年科学基金,张志威入选青年千人计划,李荣华当选青年长江学者,成雨蓉荣获CCF优博提名,冯凯宇获批海外优青基金。申请公开国家发明专利12项。此外,项目组通过积极参与相关领域主流国际会议、邀请国外专家访问等方式,与国外同行进行了深入的学术交流与合作。
项目成果
期刊论文数量(61)
专著数量(0)
科研奖励数量(0)
会议论文数量(30)
专利数量(12)
时序图节点嵌入策略的研究
- DOI:10.13328/j.cnki.jos.006173
- 发表时间:2021
- 期刊:软件学报
- 影响因子:--
- 作者:吴安彪;袁野;马玉亮;王国仁
- 通讯作者:王国仁
Group homophily based facility location selection in geo-social networks
地理社交网络中基于组同质性的设施位置选择
- DOI:10.1007/s11280-022-01008-3
- 发表时间:2022-03
- 期刊:World Wide Web
- 影响因子:--
- 作者:Yuliang Ma;Ningning Cui;Zhong-Zhong Jiang;Ye Yuan;Guoren Wang
- 通讯作者:Guoren Wang
HyperISO: Efficiently Searching Subgraph Containment in Hypergraphs
HyperISO:高效搜索超图中的子图包含
- DOI:10.1109/tkde.2022.3203856
- 发表时间:2023-08
- 期刊:Institute of Electrical and Electronics Engineers
- 影响因子:--
- 作者:Lingling Zhang;Zhiwei Zhang;Guoren Wang;Ye Yuan;Shuai Zhao;Jianliang Xu
- 通讯作者:Jianliang Xu
Continuous similarity join over geo-textual data streams
地理文本数据流的连续相似性连接
- DOI:10.1007/s11280-022-01063-w
- 发表时间:2022-06
- 期刊:Springer Nature
- 影响因子:--
- 作者:Hongwei Liu;Yongjiao Sun;Guoren Wang
- 通讯作者:Guoren Wang
存储容量可扩展区块链系统的高效查询模型
- DOI:10.13328/j.cnki.jos.005774
- 发表时间:2019
- 期刊:软件学报
- 影响因子:--
- 作者:贾大宇;信俊昌;王之琼;郭薇;王国仁
- 通讯作者:王国仁
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
基于DOM的XML数据库的索引技术研究
- DOI:--
- 发表时间:--
- 期刊:计算机研究与发展,
- 影响因子:--
- 作者:贾福林;王国仁;于戈
- 通讯作者:于戈
一种大规模双网络中k-连通Truss子图发现算法
- DOI:10.11897/sp.j.1016.2020.01721
- 发表时间:2020
- 期刊:计算机学报
- 影响因子:--
- 作者:李源;盛飞;孙晶;赵宇海;王国仁
- 通讯作者:王国仁
面向微博用户的消费意图识别算法
- DOI:--
- 发表时间:2020
- 期刊:北京大学学报(自然科学版)
- 影响因子:--
- 作者:贾云龙;韩东红;林海原;王国仁;夏利
- 通讯作者:夏利
基于集成分类器的数据流分类算法
- DOI:--
- 发表时间:2018
- 期刊:数据采集与处理
- 影响因子:--
- 作者:韩东红;马宪哲;李莉莉;王国仁
- 通讯作者:王国仁
Learning Phenotypes Structure Using Sequence Model
使用序列模型学习表型结构
- DOI:--
- 发表时间:2014
- 期刊:IEEE Trans.Knowl.Data Eng.
- 影响因子:--
- 作者:赵宇海;王国仁
- 通讯作者:王国仁
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
王国仁的其他基金
大规模数据驱动的机器学习理论与方法
- 批准号:U2001211
- 批准年份:2020
- 资助金额:274 万元
- 项目类别:联合基金项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}