CIF: Small: Collaborative Research: Ordinal Data Compression

CIF:小型:协作研究:有序数据压缩

基本信息

项目摘要

With the emergence of Big Data platforms in social and life sciences, it is becoming of paramount importance to develop efficient lossless and lossy data compression methods catering to the need of such information systems. Although many near-optimal compression methods exist for classical text, image and video data, they tend to perform poorly on data which naturally appears in fragmented or ordered form. This is especially the case for so called ordinal data, arising in crowd-voting, recommender systems, and genome rearrangement studies. There, information is represented with respect to a ?relative,? rather than ?absolute? scale, and the particular constraints of the ordering cannot be properly captured via simple dictionary constructions. This project seeks to improve the operational performance of a number of data management, cloud computing and communication systems by developing theoretical, algorithmic and software solutions for ordinal data compaction.The main goal of the project is to develop the first general and comprehensive theoretical framework for ordinal compression. In particular, the investigators propose to investigate new distortion measures for ordinal data and rate-distortion functions for lossy ordinal compression; rank aggregation and learning methods for probabilistic ordinal models, used for ordinal clustering and quantization; and smooth compression and compressive computing in the ordinal domain. The proposed analytical framework will also allow for addressing algorithmic challenges arising in the context of compressing complete, partial and weak rankings. The accompanying software solutions are expected to find broad applications in areas as diverse as theoretical computer science (sorting, searching and selection), machine learning (clustering and learning to rank), and gene prioritization and phylogeny (reconstruction of lists of influential genes and ancestral genomes, respectively).
随着社会和生命科学中大数据平台的出现,这对于开发有效的无损和有损数据压缩方法的重要性至关重要,以满足此类信息系统的需求。尽管对于经典文本,图像和视频数据存在许多近乎最佳的压缩方法,但它们在自然出现的数据上往往会表现不佳,而这些数据以碎片或有序形式出现。对于所谓的序数数据,尤其是在人群投票,推荐系统和基因组重排研究中产生的情况。在那里,信息表示相对的信息?而不是绝对?比例无法通过简单的词典结构正确捕获订购的特定约束。该项目旨在通过为序数数据压实开发理论,算法和软件解决方案,以改善许多数据管理,云计算和通信系统的运营性能。该项目的主要目标是开发第一个通用和全面的理论框架来进行序数。特别是,研究人员建议研究序数数据的新变形措施和损失序列压缩的率延伸功能;概率序数模型的秩集合和学习方法,用于顺序聚类和量化;以及顺序域中的平滑压缩和压缩计算。提出的分析框架还将允许在压缩完整,部分和弱排名的背景下解决算法挑战。随附的软件解决方案有望在理论计算机科学(分类,搜索和选择),机器学习(聚类和学习排名)以及基因优先和系统发育(分别重建有影响力的基因和祖先基因组清单的重建)等领域中找到广泛的应用。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Olgica Milenkovic其他文献

On the generalized Hamming weight enumerators and coset weight distributions of even isodual codes
关于偶等对码的广义汉明权重枚举器和陪集权重分布
Detection and Mapping of dsDNA Breaks using Graphene Nanopore Transistor
  • DOI:
    10.1016/j.bpj.2018.11.1580
  • 发表时间:
    2019-02-15
  • 期刊:
  • 影响因子:
  • 作者:
    Nagendra Athreya;Olgica Milenkovic;Jean-Pierre Leburton
  • 通讯作者:
    Jean-Pierre Leburton
Query-based selection of optimal candidates under the Mallows model
  • DOI:
    10.1016/j.tcs.2023.114206
  • 发表时间:
    2023-11-10
  • 期刊:
  • 影响因子:
  • 作者:
    Xujun Liu;Olgica Milenkovic;George V. Moustakides
  • 通讯作者:
    George V. Moustakides

Olgica Milenkovic的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Olgica Milenkovic', 18)}}的其他基金

Collaborative Research: CIF-Medium: Privacy-preserving Machine Learning on Graphs
合作研究:CIF-Medium:图上的隐私保护机器学习
  • 批准号:
    2402815
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Medium: Group testing for Real-Time Polymerase Chain Reactions: From Primer Selection to Amplification Curve Analysis
合作研究:CIF:中:实时聚合酶链式反应的分组测试:从引物选择到扩增曲线分析
  • 批准号:
    2107344
  • 财政年份:
    2021
  • 资助金额:
    $ 25万
  • 项目类别:
    Continuing Grant
Collaborative Research: CIF: Small: Coded String Reconstruction Problems in Molecular Storage
合作研究:CIF:小型:分子存储中的编码串重建问题
  • 批准号:
    2008125
  • 财政年份:
    2020
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Medium: New Methods for Learning on Hypergraphs for Single-Cell Chromatin Data Analysis
合作研究:CIF:Medium:用于单细胞染色质数据分析的超图学习新方法
  • 批准号:
    1956384
  • 财政年份:
    2020
  • 资助金额:
    $ 25万
  • 项目类别:
    Continuing Grant
CIF: Small: Collaborative Research:Leveraging Data Popularity in Distributed Storage Systems via Constrained Design Theory
CIF:小型:协作研究:通过约束设计理论利用分布式存储系统中的数据流行度
  • 批准号:
    1816913
  • 财政年份:
    2018
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
SemiSynBio: An On-Chip Nanoscale Storage System Using Chimeric DNA
SemiSynBio:使用嵌合 DNA 的片上纳米级存储系统
  • 批准号:
    1807526
  • 财政年份:
    2018
  • 资助金额:
    $ 25万
  • 项目类别:
    Continuing Grant
CIF: Small: Coding for DNA-Based Storage Systems
CIF:小型:基于 DNA 的存储系统的编码
  • 批准号:
    1618366
  • 财政年份:
    2016
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
CIF: Small: Collaborative Research:Synchronization and Deduplication of Distributed Coded Data: Fundamental Limits and Algorithms
CIF:小型:协作研究:分布式编码数据的同步和重复数据删除:基本限制和算法
  • 批准号:
    1526875
  • 财政年份:
    2015
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
CIF: Small: Collaborative Research: A General Theory of Group Testing for Genotyping
CIF:小型:协作研究:基因分型群体测试的一般理论
  • 批准号:
    1218764
  • 财政年份:
    2012
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
CIF: Small: Nonlinear Matrix and Tensor Completion with Applications in Systems Biology
CIF:小:非线性矩阵和张量补全及其在系统生物学中的应用
  • 批准号:
    1117980
  • 财政年份:
    2011
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant

相似国自然基金

基于超宽频技术的小微型无人系统集群协作关键技术研究与应用
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    57 万元
  • 项目类别:
    面上项目
异构云小蜂窝网络中基于协作预编码的干扰协调技术研究
  • 批准号:
    61661005
  • 批准年份:
    2016
  • 资助金额:
    30.0 万元
  • 项目类别:
    地区科学基金项目
密集小基站系统中的新型接入理论与技术研究
  • 批准号:
    61301143
  • 批准年份:
    2013
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
ScFVCD3-9R负载Bcl-6靶向小干扰RNA治疗EAMG的试验研究
  • 批准号:
    81072465
  • 批准年份:
    2010
  • 资助金额:
    31.0 万元
  • 项目类别:
    面上项目
基于小世界网络的传感器网络研究
  • 批准号:
    60472059
  • 批准年份:
    2004
  • 资助金额:
    21.0 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: CIF: Small: Mathematical and Algorithmic Foundations of Multi-Task Learning
协作研究:CIF:小型:多任务学习的数学和算法基础
  • 批准号:
    2343599
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Mathematical and Algorithmic Foundations of Multi-Task Learning
协作研究:CIF:小型:多任务学习的数学和算法基础
  • 批准号:
    2343600
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research:CIF:Small:Acoustic-Optic Vision - Combining Ultrasonic Sonars with Visible Sensors for Robust Machine Perception
合作研究:CIF:Small:声光视觉 - 将超声波声纳与可见传感器相结合,实现强大的机器感知
  • 批准号:
    2326905
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research:CIF:Small:Fisher-Inspired Approach to Quickest Change Detection for Score-Based Models
合作研究:CIF:Small:Fisher 启发的基于评分模型的最快变化检测方法
  • 批准号:
    2334898
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research:CIF:Small:Fisher-Inspired Approach to Quickest Change Detection for Score-Based Models
合作研究:CIF:Small:Fisher 启发的基于评分模型的最快变化检测方法
  • 批准号:
    2334897
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了