Computing over Compressed Graph-Structured Data
压缩图结构数据的计算
基本信息
- 批准号:EP/X039447/1
- 负责人:
- 金额:$ 52.92万
- 依托单位:
- 依托单位国家:英国
- 项目类别:Research Grant
- 财政年份:2024
- 资助国家:英国
- 起止时间:2024 至 无数据
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
The project aims to bring computation over compressed data to massive graph-structured datasets by extending optimally-compressed tree data structures we developed to certain classes of graphs. Graph-structured datasets such as knowledge graphs or social networks are growing in importance and size; at the same time, computation is increasingly pushed to mobile devices with limited memory capacity. Many applications yield large, but partially repetitive and predictable datasets, which makes them compressible; but on mobile devices, data is only useful when it can be queried directly in a compressed representation that fits into the device memory. Current methods for computing over compressed data do not yet work well for this scenario.In order to enable queries on compressed graph-structured data we need to answer three research questions.1. We need to know the intrinsic information content of graph-structured data so that we can decide whether a dataset can be sufficiently compressed to fit into local memory. 2. We need to know how to effectively compress graph-structured data, so that we can economically transmit and store graph-structured data on mobile devices. 3. We need to know how to answer queries on a compressed representation, so that we can make effective use of its compressibility while querying over a graph-structured dataset. This project will combine methods from information theory, data compression, and succinct data structures, to carry out three work packages.1. We will propose new notions of random sources and empirical entropy in order to approximate the intrinsic information content of graph-structured data. 2. We will develop new compression methods based on probabilistic context-free grammars (PCFGs) and probabilistic multiple context-free grammars (PMCFGs) in order to effectively compress graph-structured data. 3. We will apply and extend our tools for succinct tree data structures to new types of graphs and RNA structure data in order to enable computing directly over compressed graph-structured data. We will use the outcomes of the work packages to create a versatile toolbox of space-efficient data structures to ease the development of applications working with massive graph-structured datasets.
该项目旨在通过将我们开发的最佳压缩树数据结构扩展到某些类别的图,将压缩数据的计算引入大规模图结构数据集。图结构数据集(例如知识图或社交网络)的重要性和规模正在不断增长;与此同时,计算越来越多地转移到内存容量有限的移动设备上。许多应用程序都会产生大量但部分重复且可预测的数据集,这使得它们可压缩;但在移动设备上,只有当数据可以以适合设备内存的压缩表示形式直接查询时,数据才有用。当前计算压缩数据的方法还不能很好地适应这种情况。为了能够对压缩的图结构数据进行查询,我们需要回答三个研究问题。1.我们需要知道图结构数据的内在信息内容,以便我们可以决定数据集是否可以充分压缩以适应本地内存。 2.我们需要知道如何有效地压缩图结构数据,以便我们可以经济地在移动设备上传输和存储图结构数据。 3.我们需要知道如何回答对压缩表示的查询,以便我们在查询图结构数据集时可以有效利用其可压缩性。该项目将结合信息论、数据压缩和简洁数据结构的方法,开展三个工作包: 1.我们将提出随机源和经验熵的新概念,以近似图结构数据的内在信息内容。 2.我们将开发基于概率上下文无关语法(PCFG)和概率多重上下文无关语法(PMCFG)的新压缩方法,以有效压缩图结构数据。 3.我们将把我们的简洁树数据结构工具应用并扩展到新型图和RNA结构数据,以便能够直接在压缩的图结构数据上进行计算。我们将使用工作包的成果来创建一个多功能的节省空间的数据结构工具箱,以简化处理大量图形结构数据集的应用程序的开发。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Sebastian Wild其他文献
The iron–sulphur cluster in human DNA2 is required for all biochemical activities of DNA2
人类 DNA2 中的铁硫簇是 DNA2 的所有生化活动所必需的
- DOI:
10.1038/s42003-020-1048-4 - 发表时间:
2020-06-23 - 期刊:
- 影响因子:5.9
- 作者:
L. Mariotti;Sebastian Wild;Giulia Brunoldi;Aless;ra Piceni;ra;I. Ceppi;S. Kummer;Richard E. Lutz;P. Cejka;K. Gari - 通讯作者:
K. Gari
Succinct Permutation Graphs
简洁排列图
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:1.1
- 作者:
Konstantinos Tsakalidis;Sebastian Wild;V. Zamaraev - 通讯作者:
V. Zamaraev
Dual-Pivot Quicksort and Beyond: Analysis of Multiway Partitioning and Its Practical Potential
双枢轴快速排序及其他:多路分区分析及其实际潜力
- DOI:
10.1109/isit.2017.8006830 - 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
Sebastian Wild - 通讯作者:
Sebastian Wild
Entropy Trees and Range-Minimum Queries In Optimal Average-Case Space
最优平均情况空间中的熵树和最小范围查询
- DOI:
10.1145/2344422.2344432 - 发表时间:
2019-03-06 - 期刊:
- 影响因子:0
- 作者:
J. Munro;Sebastian Wild - 通讯作者:
Sebastian Wild
The iron–sulphur cluster in human DNA2 is required for all biochemical activities of DNA2
人类 DNA2 中的铁硫簇是 DNA2 的所有生化活动所必需的
- DOI:
10.1038/s42003-020-1048-4 - 发表时间:
2020-06-23 - 期刊:
- 影响因子:5.9
- 作者:
L. Mariotti;Sebastian Wild;Giulia Brunoldi;Aless;ra Piceni;ra;I. Ceppi;S. Kummer;Richard E. Lutz;P. Cejka;K. Gari - 通讯作者:
K. Gari
Sebastian Wild的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似国自然基金
超过400GPa金刚石对顶砧的研制与应用验证
- 批准号:
- 批准年份:2020
- 资助金额:438 万元
- 项目类别:
电阻型超导限流器失超过程激增气泡对液氮绝缘击穿特性影响规律研究
- 批准号:51907153
- 批准年份:2019
- 资助金额:27.0 万元
- 项目类别:青年科学基金项目
分枝过程的随机流与随机合并
- 批准号:11871032
- 批准年份:2018
- 资助金额:50.0 万元
- 项目类别:面上项目
连续时空分枝过程与相关带跳随机方程
- 批准号:11771018
- 批准年份:2017
- 资助金额:49.0 万元
- 项目类别:面上项目
超过程的极限理论
- 批准号:11671017
- 批准年份:2016
- 资助金额:48.0 万元
- 项目类别:面上项目
相似海外基金
Channel Coding Problems Associated with the Transmission of Compressed Signals over Mobile Radio Channels
与通过移动无线信道传输压缩信号相关的信道编码问题
- 批准号:
9996222 - 财政年份:1999
- 资助金额:
$ 52.92万 - 项目类别:
Standard Grant
Channel Coding Problems Associated with the Transmission of Compressed Signals over Mobile Radio Channels
与通过移动无线信道传输压缩信号相关的信道编码问题
- 批准号:
9623318 - 财政年份:1996
- 资助金额:
$ 52.92万 - 项目类别:
Standard Grant
Compressed gas insulated systems, particle contamination and spacer flash over surge aging of solid insulation
压缩气体绝缘系统、固体绝缘的颗粒污染和间隔闪络浪涌老化
- 批准号:
4168-1990 - 财政年份:1992
- 资助金额:
$ 52.92万 - 项目类别:
Discovery Grants Program - Individual
Compressed gas insulated systems, particle contamination and spacer flash over surge aging of solid insulation
压缩气体绝缘系统、固体绝缘的颗粒污染和间隔闪络浪涌老化
- 批准号:
4168-1990 - 财政年份:1992
- 资助金额:
$ 52.92万 - 项目类别:
Discovery Grants Program - Individual
Compressed gas insulated systems, particle contamination and spacer flash over surge aging of solid insulation
压缩气体绝缘系统、固体绝缘的颗粒污染和间隔闪络浪涌老化
- 批准号:
4168-1990 - 财政年份:1991
- 资助金额:
$ 52.92万 - 项目类别:
Discovery Grants Program - Individual