Computing over Compressed Graph-Structured Data

压缩图结构数据的计算

基本信息

  • 批准号:
    EP/X039447/1
  • 负责人:
  • 金额:
    $ 52.92万
  • 依托单位:
  • 依托单位国家:
    英国
  • 项目类别:
    Research Grant
  • 财政年份:
    2024
  • 资助国家:
    英国
  • 起止时间:
    2024 至 无数据
  • 项目状态:
    未结题

项目摘要

The project aims to bring computation over compressed data to massive graph-structured datasets by extending optimally-compressed tree data structures we developed to certain classes of graphs. Graph-structured datasets such as knowledge graphs or social networks are growing in importance and size; at the same time, computation is increasingly pushed to mobile devices with limited memory capacity. Many applications yield large, but partially repetitive and predictable datasets, which makes them compressible; but on mobile devices, data is only useful when it can be queried directly in a compressed representation that fits into the device memory. Current methods for computing over compressed data do not yet work well for this scenario.In order to enable queries on compressed graph-structured data we need to answer three research questions.1. We need to know the intrinsic information content of graph-structured data so that we can decide whether a dataset can be sufficiently compressed to fit into local memory. 2. We need to know how to effectively compress graph-structured data, so that we can economically transmit and store graph-structured data on mobile devices. 3. We need to know how to answer queries on a compressed representation, so that we can make effective use of its compressibility while querying over a graph-structured dataset. This project will combine methods from information theory, data compression, and succinct data structures, to carry out three work packages.1. We will propose new notions of random sources and empirical entropy in order to approximate the intrinsic information content of graph-structured data. 2. We will develop new compression methods based on probabilistic context-free grammars (PCFGs) and probabilistic multiple context-free grammars (PMCFGs) in order to effectively compress graph-structured data. 3. We will apply and extend our tools for succinct tree data structures to new types of graphs and RNA structure data in order to enable computing directly over compressed graph-structured data. We will use the outcomes of the work packages to create a versatile toolbox of space-efficient data structures to ease the development of applications working with massive graph-structured datasets.
该项目旨在通过将开发到某些图形类别的最佳压缩树数据结构扩展到大量的图形结构数据集中。图形结构的数据集(例如知识图或社交网络)的重要性和规模正在增长;同时,越来越多地将计算推向具有有限内存容量的移动设备。许多应用程序产生了大型但部分重复且可预测的数据集,这使其可压缩;但是,在移动设备上,只有在可以直接在适合设备内存的压缩表示中查询数据时才有用。当前用于压缩数据计算的方法在这种情况下还不能很好地工作。为了对压缩的图形结构数据进行查询,我们需要回答三个研究问题1。我们需要了解图形结构化数据的内在信息内容,以便我们可以决定是否可以充分压缩数据集以适合本地内存。 2。我们需要知道如何有效地压缩图形结构化数据,以便我们可以在移动设备上经济传输和存储图形结构化数据。 3。我们需要知道如何在压缩表示形式上回答查询,以便在通过图形结构的数据集查询时,可以有效利用其可压缩性。该项目将结合信息理论,数据压缩和简洁数据结构的方法,以执行三个工作包。1。我们将提出新的随机来源和经验熵的概念,以近似图形结构化数据的内在信息内容。 2。我们将基于概率无上下文语法(PCFG)和概率多个无上下文的语法(PMCFG)开发新的压缩方法,以有效地压缩图形结构化数据。 3。我们将应用并扩展我们的工具将简洁的树数据结构用于新类型的图形和RNA结构数据,以直接通过压缩的图形结构数据启用计算。我们将使用工作包的结果来创建一个多功能工具箱的空间有效数据结构,以简化使用大量的图形结构数据集的应用程序的开发。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Sebastian Wild其他文献

RNA secondary structures: from ab initio prediction to better compression, and back
RNA 二级结构:从从头开始预测到更好的压缩,然后返回
  • DOI:
    10.1109/dcc55655.2023.00036
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Eva Onokpasa;Sebastian Wild;Prudence W. H. Wong
  • 通讯作者:
    Prudence W. H. Wong
Polyamorous Scheduling
多角调度
  • DOI:
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    L. Gąsieniec;Benjamin Smith;Sebastian Wild
  • 通讯作者:
    Sebastian Wild
Dual-Pivot Quicksort and Beyond: Analysis of Multiway Partitioning and Its Practical Potential
双枢轴快速排序及其他:多路分区分析及其实际潜力
Succinct Permutation Graphs
简洁排列图
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    1.1
  • 作者:
    Konstantinos Tsakalidis;Sebastian Wild;V. Zamaraev
  • 通讯作者:
    V. Zamaraev
The iron–sulfur helicase DDX11 promotes the generation of single-stranded DNA for CHK1 activation
铁硫解旋酶 DDX11 促进 CHK1 激活的单链 DNA 的生成
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    4.4
  • 作者:
    A. Simon;S. Kummer;Sebastian Wild;Aleksandra Lezaja;Federico Teloni;Stanislaw K Jozwiakowski;M. Altmeyer;K. Gari
  • 通讯作者:
    K. Gari

Sebastian Wild的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似国自然基金

超过400GPa金刚石对顶砧的研制与应用验证
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    438 万元
  • 项目类别:
电阻型超导限流器失超过程激增气泡对液氮绝缘击穿特性影响规律研究
  • 批准号:
    51907153
  • 批准年份:
    2019
  • 资助金额:
    27.0 万元
  • 项目类别:
    青年科学基金项目
分枝过程的随机流与随机合并
  • 批准号:
    11871032
  • 批准年份:
    2018
  • 资助金额:
    50.0 万元
  • 项目类别:
    面上项目
连续时空分枝过程与相关带跳随机方程
  • 批准号:
    11771018
  • 批准年份:
    2017
  • 资助金额:
    49.0 万元
  • 项目类别:
    面上项目
面向IP over EON多层网络生存性流量疏导机理的研究
  • 批准号:
    61671313
  • 批准年份:
    2016
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目

相似海外基金

Low NOx stratified combustion of a compressed natural gas with an over-expansion injector
使用过膨胀喷射器进行压缩天然气的低氮氧化物分层燃烧
  • 批准号:
    15560168
  • 财政年份:
    2003
  • 资助金额:
    $ 52.92万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Channel Coding Problems Associated with the Transmission of Compressed Signals over Mobile Radio Channels
与通过移动无线信道传输压缩信号相关的信道编码问题
  • 批准号:
    9996222
  • 财政年份:
    1999
  • 资助金额:
    $ 52.92万
  • 项目类别:
    Standard Grant
Channel Coding Problems Associated with the Transmission of Compressed Signals over Mobile Radio Channels
与通过移动无线信道传输压缩信号相关的信道编码问题
  • 批准号:
    9623318
  • 财政年份:
    1996
  • 资助金额:
    $ 52.92万
  • 项目类别:
    Standard Grant
Compressed gas insulated systems, particle contamination and spacer flash over surge aging of solid insulation
压缩气体绝缘系统、固体绝缘的颗粒污染和间隔闪络浪涌老化
  • 批准号:
    4168-1990
  • 财政年份:
    1992
  • 资助金额:
    $ 52.92万
  • 项目类别:
    Discovery Grants Program - Individual
Compressed gas insulated systems, particle contamination and spacer flash over surge aging of solid insulation
压缩气体绝缘系统、固体绝缘的颗粒污染和间隔闪络浪涌老化
  • 批准号:
    4168-1990
  • 财政年份:
    1991
  • 资助金额:
    $ 52.92万
  • 项目类别:
    Discovery Grants Program - Individual
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了