大图数据管理与分析的基础理论与关键技术研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61732003
  • 项目类别:
    重点项目
  • 资助金额:
    315.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0202.系统软件、数据库与工业软件
  • 结题年份:
    2022
  • 批准年份:
    2017
  • 项目状态:
    已结题
  • 起止时间:
    2018-01-01 至2022-12-31

项目摘要

In big data environment, close relationships are among multisource and heterogeneous data. Graphs, as a kind of fundamental structure expressing data relationships, have a wide application in many fields such as social network analysis, brain network analysis, and knowledge graph analysis. Compared with other types of data, big graphs have characters of large scales, complex structures, and dynamic changes. These characters make the management and analysis of big graphs face three main challenges: heterogeneous storage and partition, efficient calculation, and lightweight execution guarantee. Existing techniques of graph management and analysis cannot solve these three challenge well, and cannot meet the requirement of current big graph applications. Thus, this project focuses on the basic theories and key techniques of big graph management and analysis, including: (1) the model and storage of big graphs (physic models, partition and distribution, and compressed storage); (2) techniques of big graph queries and optimizations (matching query, information retrieval, and distance query); (3) techniques on big graph mining and analysis (community detection, graph mining, clustering and classification); (4) execution guarantees of big graph tasks (error-tolerant techniques, task scheduling, and load balance). This project meets the requirement of the real world and technique development, which has a wide application in the future.
在大数据时代海量多源异构的数据间存在着紧密的关联性,图作为表示数据之间关系的基本结构在社交网络分析、人脑网络分析、知识图谱分析等领域有着广泛应用。与其它数据类型相比,大图数据具有规模宏大、结构复杂、动态变化等特点,这些独有的特点使管理和分析大图数据面临三大挑战:异构的存储和划分、高效的计算和轻量级的执行保证。目前的图数据管理和分析技术不能很好地解决这三个挑战,无法满足当前大图数据应用的需求。为此,本项目将重点研究大图数据管理与分析的基础理论和关键技术,包括1) 大图数据的模型和存储技术(物理模型、划分和布局、压缩存储);2) 大图数据的查询处理与优化技术(匹配查询、信息检索、距离查询);3) 大图数据的挖掘和分析技术(社区发现、图挖掘、聚类和分类);4) 大图数据任务的执行保证(容错技术、任务调度、负载平衡)。本项目的研究符合现实应用需求和技术发展趋势,具有广阔的应用前景。

结项摘要

在大数据时代海量多源异构的数据间存在着紧密的关联性,图作为表示数据之间关系的基本结构在社交网络分析、人脑网络分析、知识图谱分析等领域有着广泛应用。与其它数据类型相比,大图数据具有规模宏大、结构复杂、动态变化等特点,这些独有的特点使管理和分析大图数据面临三大挑战:异构的存储和划分、高效的计算和轻量级的执行保证。目前的图数据管理和分析技术不能很好地解决这三个挑战,无法满足当前大图数据应用的需求。为此,本项目重点研究了大图数据管理与分析的基础理论和关键技术,包括大图数据模型与存储技术、大图数据查询处理与优化技术、大图数据的挖掘和分析技术、分布式系统的执行保障技术四个方面。并且实现了提出的大图数据查询处理和分析算法、大图数据存储和分割算法以及大图数据各种任务执行保障的策略,最后设计与实现了大图数据管理与分析原型系统。本项目实施过程中,项目组已在VLDB Journal、IEEE TKDE、等国际权威期和本领域重要的国际会议(SIGMOD、VLDB、ICDE等)上发表(含已录用)论文110篇,其中CCF A类论文46篇。培养毕业研究生20余名,李长升获批优秀青年科学基金,张志威入选青年千人计划,李荣华当选青年长江学者,成雨蓉荣获CCF优博提名,冯凯宇获批海外优青基金。申请公开国家发明专利12项。此外,项目组通过积极参与相关领域主流国际会议、邀请国外专家访问等方式,与国外同行进行了深入的学术交流与合作。

项目成果

期刊论文数量(61)
专著数量(0)
科研奖励数量(0)
会议论文数量(30)
专利数量(12)
时序图节点嵌入策略的研究
  • DOI:
    10.13328/j.cnki.jos.006173
  • 发表时间:
    2021
  • 期刊:
    软件学报
  • 影响因子:
    --
  • 作者:
    吴安彪;袁野;马玉亮;王国仁
  • 通讯作者:
    王国仁
Group homophily based facility location selection in geo-social networks
地理社交网络中基于组同质性的设施位置选择
  • DOI:
    10.1007/s11280-022-01008-3
  • 发表时间:
    2022-03
  • 期刊:
    World Wide Web
  • 影响因子:
    --
  • 作者:
    Yuliang Ma;Ningning Cui;Zhong-Zhong Jiang;Ye Yuan;Guoren Wang
  • 通讯作者:
    Guoren Wang
HyperISO: Efficiently Searching Subgraph Containment in Hypergraphs
HyperISO:高效搜索超图中的子图包含
  • DOI:
    10.1109/tkde.2022.3203856
  • 发表时间:
    2023-08
  • 期刊:
    Institute of Electrical and Electronics Engineers
  • 影响因子:
    --
  • 作者:
    Lingling Zhang;Zhiwei Zhang;Guoren Wang;Ye Yuan;Shuai Zhao;Jianliang Xu
  • 通讯作者:
    Jianliang Xu
Continuous similarity join over geo-textual data streams
地理文本数据流的连续相似性连接
  • DOI:
    10.1007/s11280-022-01063-w
  • 发表时间:
    2022-06
  • 期刊:
    Springer Nature
  • 影响因子:
    --
  • 作者:
    Hongwei Liu;Yongjiao Sun;Guoren Wang
  • 通讯作者:
    Guoren Wang
存储容量可扩展区块链系统的高效查询模型
  • DOI:
    10.13328/j.cnki.jos.005774
  • 发表时间:
    2019
  • 期刊:
    软件学报
  • 影响因子:
    --
  • 作者:
    贾大宇;信俊昌;王之琼;郭薇;王国仁
  • 通讯作者:
    王国仁

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

基于DOM的XML数据库的索引技术研究
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机研究与发展,
  • 影响因子:
    --
  • 作者:
    贾福林;王国仁;于戈
  • 通讯作者:
    于戈
一种大规模双网络中k-连通Truss子图发现算法
  • DOI:
    10.11897/sp.j.1016.2020.01721
  • 发表时间:
    2020
  • 期刊:
    计算机学报
  • 影响因子:
    --
  • 作者:
    李源;盛飞;孙晶;赵宇海;王国仁
  • 通讯作者:
    王国仁
面向微博用户的消费意图识别算法
  • DOI:
    --
  • 发表时间:
    2020
  • 期刊:
    北京大学学报(自然科学版)
  • 影响因子:
    --
  • 作者:
    贾云龙;韩东红;林海原;王国仁;夏利
  • 通讯作者:
    夏利
基于集成分类器的数据流分类算法
  • DOI:
    --
  • 发表时间:
    2018
  • 期刊:
    数据采集与处理
  • 影响因子:
    --
  • 作者:
    韩东红;马宪哲;李莉莉;王国仁
  • 通讯作者:
    王国仁
Learning Phenotypes Structure Using Sequence Model
使用序列模型学习表型结构
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    IEEE Trans.Knowl.Data Eng.
  • 影响因子:
    --
  • 作者:
    赵宇海;王国仁
  • 通讯作者:
    王国仁

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

王国仁的其他基金

大规模数据驱动的机器学习理论与方法
  • 批准号:
    U2001211
  • 批准年份:
    2020
  • 资助金额:
    274 万元
  • 项目类别:
    联合基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码