AF: Small: Efficient Algorithms for Querying Noisy Distributed/Streaming Datasets

AF:小:查询嘈杂分布式/流数据集的高效算法

基本信息

  • 批准号:
    1525024
  • 负责人:
  • 金额:
    $ 44.43万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2015
  • 资助国家:
    美国
  • 起止时间:
    2015-06-15 至 2019-05-31
  • 项目状态:
    已结题

项目摘要

This project aims to study the design of efficient query algorithms for noisy datasets in distributed and streaming applications. Noisy data is universal in today's world. Imprecise and varying references to the same real-world entities are ubiquitous in scientific and commercial databases. This noise poses significant obstructions to accurate data analytics. As an example of "noisy data," consider YouTube videos. YouTube tracks the views of individual videos. However, there are frequently many similar versions of the same event and answering a basic question such as "How many people viewed this event?" is challenging using current techniques. This project will provide new techniques and insights to combat the noisy nature of large datasets, and hence will enhance our ability to process the ever-increasing quantity of business and scientific data. The products of this project will be integrated into a trilogy of graduate and undergraduate courses on algorithms, databases, and data mining. The PI will disseminate research outcomes by giving talks at conferences/workshops, universities, industrial labs, as well as online media.More technically, this project tries to answer the following question: can we run distributed and streaming algorithms directly on the noisy datasets, resolve the noise "on the fly", and retain communication and space efficiency compared with the noise-free setting? The PI plans to study statistical, relational and graph problems. This project has the potential to impact a wide range of active research areas in theoretical computer science, including distributed and streaming algorithms, group testing, compressed sensing, communication complexity, clustering, and locality sensitive hashing.
该项目旨在研究分布式和流媒体应用程序中嘈杂数据集的有效查询算法的设计。 嘈杂的数据在当今世界是普遍的。对同一现实世界实体的不精确和不同的引用在科学和商业数据库中无处不在。 这种噪声对准确的数据分析构成了重大障碍。 作为“嘈杂数据”的示例,请考虑YouTube视频。 YouTube跟踪各个视频的观点。但是,通常有许多类似版本的同一事件,并回答一个基本问题,例如“有多少人查看此事件?”使用当前技术具有挑战性。 该项目将提供新的技术和见解,以打击大型数据集的嘈杂性质,因此将增强我们处理不断增加的业务和科学数据的能力。该项目的产品将集成为算法,数据库和数据挖掘的研究生和本科课程的三部曲。 PI将通过在会议/研讨会,大学,工业实验室以及在线媒体上进行演讲来传播研究成果。从技术上讲,该项目试图回答以下问题:我们可以直接在嘈杂的数据集中进行分发和流式传输算法,从而飞跃地解决噪音”,并保留与噪音和空间效率相比,与噪音相关的设置相比 PI计划研究统计,关系和图形问题。 该项目有可能影响理论计算机科学的广泛活跃研究领域,包括分布式和流媒体算法,组测试,压缩感应,沟通复杂性,聚类和局部敏感性散列。

项目成果

期刊论文数量(8)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Communication-Efficient Distributed Skyline Computation
A Practical Algorithm for Distributed Clustering and Outlier Detection
  • DOI:
  • 发表时间:
    2018-05
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jiecao Chen;Erfan Sadeqi Azer;Qin Zhang
  • 通讯作者:
    Jiecao Chen;Erfan Sadeqi Azer;Qin Zhang
MinJoin: Efficient Edit Similarity Joins via Local Hash Minima
EmbedJoin: Efficient Edit Similarity Joins via Embeddings
Distributed Statistical Estimation of Matrix Products with Applications
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Qin Zhang其他文献

Catalyst- and additive-free three-component construction of isoxazolidinyl nucleosides and azoles via 1,3-dipolar cycloaddition
通过 1,3-偶极环加成构建异恶唑烷基核苷和唑类的无催化剂和无添加剂三组分
  • DOI:
    10.1039/d3nj05276a
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    3.3
  • 作者:
    Xinyufei Yuan;Hang Gao;Xing Li;Qin Zhang;Wenwen Chen;Hui Wang
  • 通讯作者:
    Hui Wang
Effect of Sr2+ substitution on the Raman spectrum, phase composition and microwave dielectric properties of CaMg1−Sr Si2O6 ceramics
Sr2取代对CaMg1-Sr Si2O6陶瓷拉曼光谱、物相组成及微波介电性能的影响
  • DOI:
    10.1016/j.ceramint.2021.10.177
  • 发表时间:
    2021-10
  • 期刊:
  • 影响因子:
    5.2
  • 作者:
    Fangyi Huang;Hua Su;Qin Zhang;Xiaohui Wu;Xiaoli Tang
  • 通讯作者:
    Xiaoli Tang
Types and genesis of the Neoproterozoic glauconites, Longshan area, Changping District, Beijing
北京市昌平区龙山地区新元古代海绿岩类型及成因
  • DOI:
    10.1016/j.geoen.2022.211412
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Qin Zhang;Chen Zhou;Shifa Zhu;Hanyun Tian;Ronald J Steel;Zeping Song
  • 通讯作者:
    Zeping Song
The Spatially Separated Polarization Sensitive FDA-MIMO Radar: A New Antenna Structure for Unambiguous Parameter Estimation
空间分离偏振敏感 FDA-MIMO 雷达:一种用于明确参数估计的新型天线结构
  • DOI:
    10.1051/matecconf/201817302015
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Binbin Li;Weixiong Bai;Qin Zhang;Guimei Zheng;Mingliang Zhang;Pengcheng Wan
  • 通讯作者:
    Pengcheng Wan
A Vertical Search Engine Based on Visual and Textual Features
基于视觉和文本特征的垂直搜索引擎
  • DOI:
    10.1007/978-3-642-14533-9_49
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    6.7
  • 作者:
    Kun Wu;Hai Jin;Ran Zheng;Qin Zhang
  • 通讯作者:
    Qin Zhang

Qin Zhang的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Qin Zhang', 18)}}的其他基金

Collaborative Research: AF: Small: Parallel Reinforcement Learning with Communication and Adaptivity Constraints
协作研究:AF:小型:具有通信和适应性约束的并行强化学习
  • 批准号:
    2006591
  • 财政年份:
    2020
  • 资助金额:
    $ 44.43万
  • 项目类别:
    Standard Grant
CAREER:Foundation of Communication-Efficient Distributed Computation and Monitoring
职业:通信高效的分布式计算和监控的基础
  • 批准号:
    1844234
  • 财政年份:
    2019
  • 资助金额:
    $ 44.43万
  • 项目类别:
    Continuing Grant
BIGDATA: Collaborative Research: F: Efficient Distributed Computation of Large-Scale Graph Problems in Epidemiology and Contagion Dynamics
BIGDATA:协作研究:F:流行病学和传染动力学中大规模图问题的高效分布式计算
  • 批准号:
    1633215
  • 财政年份:
    2016
  • 资助金额:
    $ 44.43万
  • 项目类别:
    Standard Grant
AF: Small: Redundancy exploiting algorithms for high throughput genomics
AF:小:利用冗余算法实现高通量基因组学
  • 批准号:
    1619081
  • 财政年份:
    2016
  • 资助金额:
    $ 44.43万
  • 项目类别:
    Standard Grant

相似国自然基金

含高密度活性位点并可高效催化小分子氧化还原反应的碳基电催化剂的逆向设计
  • 批准号:
    52372254
  • 批准年份:
    2023
  • 资助金额:
    52.00 万元
  • 项目类别:
    面上项目
海洋节菱孢菌中靶向RORγ-DLL3信号轴抗小细胞肺癌的Arthpyrone类吡啶酮生物碱的高效发掘及作用机制研究
  • 批准号:
    42376124
  • 批准年份:
    2023
  • 资助金额:
    51 万元
  • 项目类别:
    面上项目
小分子高效诱导人成纤维细胞重编程为功能肝细胞的研究
  • 批准号:
    32300610
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于亲和超滤高效筛选苗药榜看雾中治疗类风湿性关节炎的小分子TNF-α抑制剂
  • 批准号:
    82360834
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目
全稠环小分子受体聚合物化构建高效稳定的聚合物受体光伏材料
  • 批准号:
    22305076
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Collaborative Research: NSF-AoF: CIF: AF: Small: Energy-Efficient THz Communications Across Massive Dimensions
合作研究:NSF-AoF:CIF:AF:小型:大尺寸的节能太赫兹通信
  • 批准号:
    2225576
  • 财政年份:
    2022
  • 资助金额:
    $ 44.43万
  • 项目类别:
    Standard Grant
Collaborative Research: AF: Small: Efficient Algorithms for Optimal Transport in Geometric Settings
合作研究:AF:小:几何设置中最佳传输的高效算法
  • 批准号:
    2223871
  • 财政年份:
    2022
  • 资助金额:
    $ 44.43万
  • 项目类别:
    Standard Grant
Collaborative Research: AF: Small: Efficient Massively Parallel Algorithms
合作研究:AF:小型:高效大规模并行算法
  • 批准号:
    2218677
  • 财政年份:
    2022
  • 资助金额:
    $ 44.43万
  • 项目类别:
    Standard Grant
Collaborative Research: AF: Small: Efficient Algorithms for Optimal Transport in Geometric Settings
合作研究:AF:小:几何设置中最佳传输的高效算法
  • 批准号:
    2223870
  • 财政年份:
    2022
  • 资助金额:
    $ 44.43万
  • 项目类别:
    Standard Grant
AF: Small: Efficient Representation of Large Networks
AF:小型:大型网络的高效表示
  • 批准号:
    2153680
  • 财政年份:
    2022
  • 资助金额:
    $ 44.43万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了