CIF: Small: Information Theory Meets Deep Learning: Universal Probability and Common Information for High-Dimensional Data

CIF:小:信息论遇见深度学习:高维数据的普遍概率和公共信息

基本信息

  • 批准号:
    1911238
  • 负责人:
  • 金额:
    $ 50万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2019
  • 资助国家:
    美国
  • 起止时间:
    2019-07-15 至 2022-06-30
  • 项目状态:
    已结题

项目摘要

Information theory is a scientific discipline that studies how well we can communicate, compress, and otherwise process various signals and data. Over the past 70 years, the tenets of information theory have driven the digital transformation of our daily lives, with ubiquitous and reliable communication of 0s and 1s over wireless networks as an indispensable operation in diverse public and private enterprises. Beyond such "bits," however, conventional methods in information theory often encounter several limitations when dealing with real-world data of multiple dimensions, large alphabets, and complex spatial dependence. This project aims to develop new mathematical tools and engineering techniques for handling such complicated real-world data by incorporating deep learning into the tenets of information theory. In this synergistic combination, information theory provides performance guarantees and a systematic decomposition of complex problems. Deep learning, in turn, provides working procedures for efficient processing of high-dimensional data.This project explores two concrete research directions in which the combination prompts new data science frameworks. The first direction builds on the notion of universal probability, which is a close proxy to the unknown distribution of the data. Although conventional algorithms based on universal probability converge rather slowly for high-dimensional, large alphabet, long-range dependent data, the proposed framework leverages deep neural networks to efficiently learn the universal probability distribution across multiple data contexts by aggregating them smoothly. The resulting combination of information theory and deep learning provides a new paradigm to address general data science problems in a principled yet pragmatic manner, with theoretical performance guarantees and practical performance improvements. The second direction is inspired by the notion of common information in information theory, and develops a new neural network model for statistical inference among multiple high-dimensional data sets (for example, drawing a picture automatically that describes a given text the best). This model and associated training algorithms can be applied to various data processing tasks such as joint and conditional generation as well as supervised or semisupervised learning of high-dimensional output data.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
信息论是一门科学学科,研究我们如何更好地通信、压缩和处理各种信号和数据。在过去的 70 年里,信息论的原理推动了我们日常生活的数字化转型,通过无线网络进行无处不在且可靠的 0 和 1 通信成为各种公共和私营企业不可或缺的操作。然而,除了这些“位”之外,信息论中的传统方法在处理多维、大字母表和复杂空间依赖性的现实世界数据时常常遇到一些限制。该项目旨在通过将深度学习融入信息论的原则,开发新的数学工具和工程技术来处理如此复杂的现实世界数据。在这种协同组合中,信息论提供了性能保证和复杂问题的系统分解。反过来,深度学习为高效处理高维数据提供了工作程序。该项目探索了两个具体的研究方向,两者的结合催生了新的数据科学框架。第一个方向建立在普遍概率的概念之上,它是数据未知分布的近似代理。尽管基于通用概率的传统算法对于高维、大字母表、长范围相关数据收敛得相当慢,但所提出的框架利用深度神经网络通过平滑聚合来有效地学习跨多个数据上下文的通用概率分布。由此产生的信息论和深度学习的结合提供了一种新的范式,以原则性但务实的方式解决一般数据科学问题,具有理论性能保证和实际性能改进。第二个方向受到信息论中公共信息概念的启发,开发了一种新的神经网络模型,用于多个高维数据集之间的统计推断(例如,自动绘制最能描述给定文本的图片)。该模型和相关的训练算法可应用于各种数据处理任务,例如联合和条件生成以及高维输出数据的监督或半监督学习。该奖项反映了 NSF 的法定使命,并通过使用评估结果被认为值得支持。基金会的智力价值和更广泛的影响审查标准。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Young-Han Kim其他文献

Entropymetry for non-destructive structural analysis of LiCoO2cathodes
  • DOI:
    10.1039/c9ee02964h
  • 发表时间:
    2019-12
  • 期刊:
  • 影响因子:
    32.5
  • 作者:
    Hye Jin Kim;Youngkyu Park;Yoonjin Kwon;Jaeho Shin;Young-Han Kim;Hyun-Seok Ahn;Rachid Yazami;Jang Wook Choi
  • 通讯作者:
    Jang Wook Choi

Young-Han Kim的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Young-Han Kim', 18)}}的其他基金

CIF: Small: New Directions in Network Information Theory
CIF:小型:网络信息理论的新方向
  • 批准号:
    1320895
  • 财政年份:
    2013
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CIF: Small: Collaborative Research: A New Approach to Joint Source-Channel Coding
CIF:小型:协作研究:联合源通道编码的新方法
  • 批准号:
    1116139
  • 财政年份:
    2011
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
CAREER: Network Information Theory: Coding for Communication, Control, and Computing
职业:网络信息理论:通信、控制和计算编码
  • 批准号:
    0747111
  • 财政年份:
    2008
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
Collaborative Research: The Role of Feedback in Two-Way Communication Networks
协作研究:反馈在双向通信网络中的作用
  • 批准号:
    0729195
  • 财政年份:
    2007
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant

相似国自然基金

蛋白质营养调控橘小实蝇雄虫直肠腺中性信息素合成的分子机制
  • 批准号:
    32372520
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
传粉榕小蜂基于卵的化学信息调控后代性比的机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
卫星重力提取中-小尺度陆地水变化的先验信息约束与联合反演研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    56 万元
  • 项目类别:
    面上项目
卫星重力提取中-小尺度陆地水变化的先验信息约束与联合反演研究
  • 批准号:
    42274110
  • 批准年份:
    2022
  • 资助金额:
    56 万元
  • 项目类别:
    面上项目
小域上保密信息提取的方案构造问题研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

CIF: Small: Shared Information: Theory and Applications
CIF:小:共享信息:理论与应用
  • 批准号:
    2310203
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CIF: Small: Information-theoretic privacy and security for personalized distributed learning
CIF:小型:个性化分布式学习的信息论隐私和安全
  • 批准号:
    2139304
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: A New Paradigm for Distributed Information Processing, Simulation and Inference in Networks: The Promise of Law of Small Numbers
合作研究:CIF:小:网络中分布式信息处理、模拟和推理的新范式:小数定律的承诺
  • 批准号:
    2241057
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: A New Paradigm for Distributed Information Processing, Simulation and Inference in Networks: The Promise of Law of Small Numbers
合作研究:CIF:小:网络中分布式信息处理、模拟和推理的新范式:小数定律的承诺
  • 批准号:
    2132843
  • 财政年份:
    2021
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: A New Paradigm for Distributed Information Processing, Simulation and Inference in Networks: The Promise of Law of Small Numbers
合作研究:CIF:小:网络中分布式信息处理、模拟和推理的新范式:小数定律的承诺
  • 批准号:
    2132815
  • 财政年份:
    2021
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了