Sublinear Algorithms for Approximating Probability Distributions
用于近似概率分布的次线性算法
基本信息
- 批准号:EP/L021749/1
- 负责人:
- 金额:$ 12.59万
- 依托单位:
- 依托单位国家:英国
- 项目类别:Research Grant
- 财政年份:2014
- 资助国家:英国
- 起止时间:2014 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The goal of this proposal is to advance a research program of developing sublinear-time algorithms for estimating a wide range of natural and important classes of probability distributions.We live in an era of "big data," where the amount of data that can be brought to bearon questions of biology, climate, economics, etc, is vast and expanding rapidly.Much of this raw data frequently consists of example points without corresponding labels.The challenge of how to make sense of this unlabeled data has immediate relevanceand has rapidly become a bottleneck in scientific understanding across many disciplines.An important class of big data is most naturally modeled as samples from a probability distribution over a very large domain. The challenge of big data is that the sizes of the domains of the distributions are immense, typically resulting in unacceptably slow algorithms. Scaling up a computational framework to comfortably deal with ever-larger data presents a series of challenges in algorithms. This prompts the basic question: Given samples from some unknown distribution, what can we infer?While this question has been studied for several decades by various different communities of researchers,both the number of samples and running time required for such estimation tasksare not yet well understood, even for some surprisingly simple types of discrete distributions.The proposed research focuses on sublinear-time algorithms, that is,algorithms that run in time that is significantly less than the domain of the underlying distributions.In this project we will develop sublinear-time algorithms for estimating various classes of discrete distributions over very large domains. Specific problems we will address include:(1) Developing sublinear algorithms to estimate probability distributions that satisfy variousnatural types of "shape restrictions" on the underlying probability density function.(2) Developing sublinear algorithms for estimating complex distributions that result from the aggregation of many independent simple sources of randomness.We believe that highly efficient algorithms for these estimation tasks may play an important role for the next generation of large-scale machine learning applications.
该提案的目标是推进开发亚线性时间算法的研究计划,以估计各种自然且重要的概率分布类别。我们生活在“大数据”时代,可以计算的数据量涉及生物学、气候、经济学等问题的数据量巨大且正在迅速扩展。这些原始数据中的大部分通常由没有相应标签的示例点组成。如何理解这些未标记数据的挑战具有直接相关性,并且已迅速成为许多人科学理解的瓶颈一类重要的大数据最自然地被建模为来自非常大的域的概率分布的样本。大数据的挑战在于分布域的大小巨大,通常会导致算法速度慢得令人无法接受。扩展计算框架以轻松处理越来越大的数据给算法带来了一系列挑战。这就提出了一个基本问题:给定来自某个未知分布的样本,我们可以推断出什么?虽然这个问题已经被各个不同领域的研究人员研究了几十年,但此类估计任务所需的样本数量和运行时间尚不清楚可以理解,即使对于一些令人惊讶的简单类型的离散分布。所提出的研究重点是次线性时间算法,即运行时间明显小于基础分布域的算法。在这个项目中,我们将开发次线性时间算法时间算法估计非常大的域上的各种类别的离散分布。我们将解决的具体问题包括:(1) 开发次线性算法来估计概率分布,以满足底层概率密度函数的各种自然类型的“形状限制”。(2) 开发次线性算法来估计由许多集合产生的复杂分布。独立的简单随机源。我们相信,用于这些估计任务的高效算法可能会在下一代大规模机器学习应用中发挥重要作用。
项目成果
期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Testing Shape Restrictions of Discrete Distributions
测试离散分布的形状限制
- DOI:
- 发表时间:2016
- 期刊:
- 影响因子:0
- 作者:Canonne, C.L.
- 通讯作者:Canonne, C.L.
On the Complexity of Optimal Lottery Pricing and Randomized Mechanisms for a Unit-Demand Buyer
关于单位需求购买者的最优彩票定价和随机机制的复杂性
- DOI:10.1137/17m1136481
- 发表时间:2022
- 期刊:
- 影响因子:1.6
- 作者:Chen, Xi;Diakonikolas, Ilias;Orfanou, Anthi;Paparas, Dimitris;Sun, Xiaorui;Yannakakis, Mihalis
- 通讯作者:Yannakakis, Mihalis
Fast Algorithms for Segmented Regression
- DOI:
- 发表时间:2016-06
- 期刊:
- 影响因子:0
- 作者:Jayadev Acharya;Ilias Diakonikolas;Jerry Li;Ludwig Schmidt
- 通讯作者:Jayadev Acharya;Ilias Diakonikolas;Jerry Li;Ludwig Schmidt
Near-Optimal Density Estimation in Near-Linear Time Using Variable-Width Histograms
使用可变宽度直方图的近线性时间中的近最优密度估计
- DOI:10.48550/arxiv.1411.0169
- 发表时间:2014
- 期刊:
- 影响因子:0
- 作者:Chan S
- 通讯作者:Chan S
Fourier-Based Testing for Families of Distributions
基于傅立叶的分布族测试
- DOI:10.48550/arxiv.1706.05738
- 发表时间:2017
- 期刊:
- 影响因子:0
- 作者:Canonne C
- 通讯作者:Canonne C
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Ilias Diakonikolas其他文献
A Regularity Lemma, and Low-Weight Approximators, for Low-Degree Polynomial Threshold Functions
低次多项式阈值函数的正则引理和低权重近似器
- DOI:
- 发表时间:
2009 - 期刊:
- 影响因子:0
- 作者:
Ilias Diakonikolas;R. Servedio;Li;Andrew Wan - 通讯作者:
Andrew Wan
Super Non-singular Decompositions of Polynomials and Their Application to Robustly Learning Low-Degree PTFs
多项式的超非奇异分解及其在鲁棒学习低次 PTF 中的应用
- DOI:
- 发表时间:
2024 - 期刊:
- 影响因子:0
- 作者:
Ilias Diakonikolas;Daniel Kane;Vasilis Kontonis;Sihan Liu;Nikos Zarifis - 通讯作者:
Nikos Zarifis
Online Learning of Halfspaces with Massart Noise
使用 Massart 噪声在线学习半空间
- DOI:
10.48550/arxiv.2405.12958 - 发表时间:
2024 - 期刊:
- 影响因子:0
- 作者:
Ilias Diakonikolas;Vasilis Kontonis;Christos Tzamos;Nikos Zarifis - 通讯作者:
Nikos Zarifis
Threshold Phenomena in Learning Halfspaces with Massart Noise
使用 Massart 噪声学习半空间的阈值现象
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
Ilias Diakonikolas;D. Kane;Vasilis Kontonis;Christos Tzamos;Nikos Zarifis - 通讯作者:
Nikos Zarifis
Near-Optimal Closeness Testing of Discrete Histogram Distributions
离散直方图分布的近最优紧密度测试
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
Ilias Diakonikolas;D. Kane;Vladimir Nikishkin - 通讯作者:
Vladimir Nikishkin
Ilias Diakonikolas的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Ilias Diakonikolas', 18)}}的其他基金
CAREER: Learning Algorithms with Robustness and Efficiency Guarantees
职业:学习具有鲁棒性和效率保证的算法
- 批准号:
2144298 - 财政年份:2022
- 资助金额:
$ 12.59万 - 项目类别:
Continuing Grant
Collaborative Research: AF: Medium: Algorithmic High-Dimensional Robust Statistics
合作研究:AF:中:算法高维稳健统计
- 批准号:
2107079 - 财政年份:2021
- 资助金额:
$ 12.59万 - 项目类别:
Continuing Grant
AitF: Collaborative Research: Fast, Accurate, and Practical: Adaptive Sublinear Algorithms for Scalable Visualization
AitF:协作研究:快速、准确和实用:用于可扩展可视化的自适应次线性算法
- 批准号:
2006206 - 财政年份:2019
- 资助金额:
$ 12.59万 - 项目类别:
Standard Grant
CAREER: Efficient Algorithms for Learning and Testing Structured Probabilistic Models
职业:学习和测试结构化概率模型的有效算法
- 批准号:
2011255 - 财政年份:2019
- 资助金额:
$ 12.59万 - 项目类别:
Continuing Grant
CAREER: Efficient Algorithms for Learning and Testing Structured Probabilistic Models
职业:学习和测试结构化概率模型的有效算法
- 批准号:
1652862 - 财政年份:2017
- 资助金额:
$ 12.59万 - 项目类别:
Continuing Grant
AitF: Collaborative Research: Fast, Accurate, and Practical: Adaptive Sublinear Algorithms for Scalable Visualization
AitF:协作研究:快速、准确和实用:用于可扩展可视化的自适应次线性算法
- 批准号:
1733796 - 财政年份:2017
- 资助金额:
$ 12.59万 - 项目类别:
Standard Grant
相似国自然基金
基于超图的装填与覆盖问题的多项式时间可解性及近似算法设计研究
- 批准号:12361065
- 批准年份:2023
- 资助金额:27 万元
- 项目类别:地区科学基金项目
正则次模最大化问题的近似算法研究
- 批准号:12301419
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
非对称旅行商相关问题的近似算法研究
- 批准号:12301414
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
整数格上流次模最大化近似算法研究
- 批准号:12301417
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
车辆路径规划及其相关问题的近似算法研究
- 批准号:62372095
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
相似海外基金
乱雑位相近似を用いた準粒子自己無撞着法による第一原理電子状態計算の開発と応用
基于随机相位近似的准粒子自洽法第一性原理电子结构计算的开发与应用
- 批准号:
24K17608 - 财政年份:2024
- 资助金额:
$ 12.59万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
近似計算手法の確立による大規模なシステムの情報統合の解明
通过建立近似计算方法阐明大规模系统中的信息集成
- 批准号:
23K11790 - 财政年份:2023
- 资助金额:
$ 12.59万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
バリア・オプションのGreeksの統一的な計算手法の確立
建立统一的希腊障碍期权计算方法
- 批准号:
22K01556 - 财政年份:2022
- 资助金额:
$ 12.59万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
一般化確率変数の期待値型汎関数に対する推測誤差への漸近分布論的アプローチ
广义随机变量期望型泛函估计误差的渐近分布理论方法
- 批准号:
21K03358 - 财政年份:2021
- 资助金额:
$ 12.59万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
On the Study of Symbolic-Numeric Computation Using Randomized and/or Approximation Algorithms
关于使用随机和/或近似算法的符号数值计算的研究
- 批准号:
21K11760 - 财政年份:2021
- 资助金额:
$ 12.59万 - 项目类别:
Grant-in-Aid for Scientific Research (C)