Collaborative Research: MLWiNS: Dino-RL: A Domain Knowledge Enriched Reinforcement Learning Framework for Wireless Network Optimization

合作研究:MLWiNS:Dino-RL:用于无线网络优化的领域知识丰富的强化学习框架

基本信息

  • 批准号:
    2003131
  • 负责人:
  • 金额:
    $ 18.16万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2020
  • 资助国家:
    美国
  • 起止时间:
    2020-06-01 至 2024-05-31
  • 项目状态:
    已结题

项目摘要

Reinforcement learning (RL) methods have met with renewed interest in recent years for adaptively configuring wireless networks. Despite the promising early results and the conceptual match, many existing approaches do not develop and tailor the RL methods to fit the unique characteristics of wireless networking. The goal of this project is to develop a novel domain knowledge enriched RL framework, or Dino-RL, to address this problem. The Dino-RL framework aims to seamlessly integrate the physical-law based modeling and an abstract episodic memory into the RL process, and has the potential to revamp the operation and management of future wireless networks. Developing this novel technology would also help maintain the nation's continued leadership in wireless technologies and its pipeline of highly qualified engineers. The project pursues synergistic activities for the successful design and implementation of Dino-RL, followed by a comprehensive, real-world data driven evaluation. Episodic RL is first studied with the objective to incorporate domain knowledge into building an efficient episodic memory. In addition, a hierarchical hidden variable model is built to enable meta-reinforcement learning for knowledge transfer and efficient exploration. Lastly, the conflict between enhancing the physical-law based modeling and reinforcement learning is balanced via novel sample-efficient model selection algorithms.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
近年来,增强学习方法(RL)方法已引起了新的兴趣,以适应无线网络。尽管有希望的早期结果和概念上的匹配,但许多现有方法并未开发和量身定制RL方法以适合无线网络的独特特征。该项目的目的是开发一种新颖的领域知识丰富的RL框架或Dino-RL来解决此问题。 Dino-RL框架旨在将基于物理法的建模和抽象的情节内存无缝整合到RL过程中,并有可能改进未来无线网络的操作和管理。开发这种新颖的技术还将有助于维持美国在无线技术方面的持续领导力及其高素质工程师的管道。该项目为成功设计和实施Dino-RL提供协同活动,然后进行全面的现实数据驱动的评估。首先研究了情节RL的目标,其目标是将域知识纳入建立有效的情节记忆中。此外,构建了一个层次隐藏的变量模型,以实现用于知识转移和有效探索的荟萃方面学习。最后,通过新颖的样本效率模型选择算法增强基于物理法的建模和增强学习之间的冲突是平衡的。该奖项反映了NSF的法定任务,并认为通过基金会的知识分子的优点和更广泛的影响,认为值得通过评估来支持。

项目成果

期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Safe Exploration Incurs Nearly No Additional Sample Complexity for Reward-free RL
  • DOI:
    10.48550/arxiv.2206.14057
  • 发表时间:
    2022-06
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ruiquan Huang;J. Yang;Yingbin Liang
  • 通讯作者:
    Ruiquan Huang;J. Yang;Yingbin Liang
Provably Efficient Offline Reinforcement Learning with Perturbed Data Sources
  • DOI:
    10.48550/arxiv.2306.08364
  • 发表时间:
    2023-06
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Chengshuai Shi;Wei Xiong;Cong Shen;Jing Yang
  • 通讯作者:
    Chengshuai Shi;Wei Xiong;Cong Shen;Jing Yang
On Federated Learning with Energy Harvesting Clients
Federated Linear Contextual Bandits
  • DOI:
  • 发表时间:
    2021-10
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ruiquan Huang;Weiqiang Wu;Jing Yang;Cong Shen
  • 通讯作者:
    Ruiquan Huang;Weiqiang Wu;Jing Yang;Cong Shen
Heterogeneous Multi-player Multi-armed Bandits: Closing the Gap and Generalization
  • DOI:
  • 发表时间:
    2021-10
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Chengshuai Shi;Wei Xiong;Cong Shen;Jing Yang
  • 通讯作者:
    Chengshuai Shi;Wei Xiong;Cong Shen;Jing Yang
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Jing Yang其他文献

Experimental and simulation studies on the mechanical performance of concrete T-Girder bridge strengthened with K-Brace composite trusses
K-Brace组合桁架加固混凝土T梁桥力学性能试验与模拟研究
  • DOI:
    10.1016/j.istruc.2022.06.069
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    4.1
  • 作者:
    Peng Hou;Jing Yang;Yong Pan;Changjun Ma;W. Du;C. Yang;Yangxi Zhang
  • 通讯作者:
    Yangxi Zhang
Development of a standard set of data variables and a database platform for panvascular disease
开发全血管疾病的标准数据变量集和数据库平台
  • DOI:
    10.1097/cp9.0000000000000066
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jing Yang;Xi Su;Zhihui Dong;P. Yang;Xiaoming Shi;Jiangang Wang;Xueying Zheng;Zhu Tong;Hongjian Zhang;Hao Hu;S. Luo;Wen Sun;Xiaotong Sun;Yingmei Zhang;Junbo Ge
  • 通讯作者:
    Junbo Ge
The potential of XPO1 inhibitors as a game changer in relapsed/refractory hematologic malignancies
XPO1 抑制剂在复发/难治性血液恶性肿瘤中具有改变游戏规则的潜力
Research of Influence of Forced Cooling on Secondary Motion and Force of Piston
The Influence of the Team Climate on Team Innovation performance: An Empirical Study Based on Chinese High Technology Innovation Teams
团队氛围对团队创新绩效的影响——基于中国高技术创新团队的实证研究

Jing Yang的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Jing Yang', 18)}}的其他基金

Collaborative Research: Optimized Testing Strategies for Fighting Pandemics: Fundamental Limits and Efficient Algorithms
合作研究:抗击流行病的优化测试策略:基本限制和高效算法
  • 批准号:
    2133170
  • 财政年份:
    2022
  • 资助金额:
    $ 18.16万
  • 项目类别:
    Standard Grant
Collaborative Research: CNS Core: Small: Timely Computing and Learning over Communication Networks
合作研究:CNS 核心:小型:通过通信网络进行及时计算和学习
  • 批准号:
    2114542
  • 财政年份:
    2021
  • 资助金额:
    $ 18.16万
  • 项目类别:
    Standard Grant
Collaborative Research: SWIFT: SMALL: Learning-Efficient Spectrum Access for No-Sensing Devices in Shared Spectrum
合作研究:SWIFT:SMALL:共享频谱中无感知设备的学习高效频谱访问
  • 批准号:
    2030026
  • 财政年份:
    2020
  • 资助金额:
    $ 18.16万
  • 项目类别:
    Standard Grant
CNS Core: Medium: When Next Generation Wireless Networks Meet Machine Learning
CNS 核心:中:当下一代无线网络遇到机器学习时
  • 批准号:
    1956276
  • 财政年份:
    2020
  • 资助金额:
    $ 18.16万
  • 项目类别:
    Standard Grant
Development of a 3D human in vitro model of pancreatic beta cell health
开发胰腺 β 细胞健康的 3D 人体体外模型
  • 批准号:
    EP/N510099/1
  • 财政年份:
    2017
  • 资助金额:
    $ 18.16万
  • 项目类别:
    Research Grant
CAREER: When Energy Harvesting Meets "Big Data": Designing Smart Energy Harvesting Wireless Sensor Networks
职业:当能量收集遇到“大数据”:设计智能能量收集无线传感器网络
  • 批准号:
    1650299
  • 财政年份:
    2016
  • 资助金额:
    $ 18.16万
  • 项目类别:
    Standard Grant
SI2-SSE: Collaborative Research: TrajAnalytics: A Cloud-Based Visual Analytics Software System to Advance Transportation Studies Using Emerging Urban Trajectory Data
SI2-SSE:合作研究:TrajAnalytics:基于云的视觉分析软件系统,利用新兴城市轨迹数据推进交通研究
  • 批准号:
    1535081
  • 财政年份:
    2015
  • 资助金额:
    $ 18.16万
  • 项目类别:
    Standard Grant
CAREER: When Energy Harvesting Meets "Big Data": Designing Smart Energy Harvesting Wireless Sensor Networks
职业:当能量收集遇到“大数据”:设计智能能量收集无线传感器网络
  • 批准号:
    1454471
  • 财政年份:
    2015
  • 资助金额:
    $ 18.16万
  • 项目类别:
    Standard Grant
EAGER: Collaborative Research: Visualizing Event Dynamics with Narrative Animation
EAGER:协作研究:用叙事动画可视化事件动态
  • 批准号:
    1352893
  • 财政年份:
    2013
  • 资助金额:
    $ 18.16万
  • 项目类别:
    Standard Grant
EAGER: Link Free Graph Visualization for Exploring Large Complex Graphs
EAGER:用于探索大型复杂图的链接自由图可视化
  • 批准号:
    0946400
  • 财政年份:
    2009
  • 资助金额:
    $ 18.16万
  • 项目类别:
    Standard Grant

相似国自然基金

支持二维毫米波波束扫描的微波/毫米波高集成度天线研究
  • 批准号:
    62371263
  • 批准年份:
    2023
  • 资助金额:
    52 万元
  • 项目类别:
    面上项目
腙的Heck/脱氮气重排串联反应研究
  • 批准号:
    22301211
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
水系锌离子电池协同性能调控及枝晶抑制机理研究
  • 批准号:
    52364038
  • 批准年份:
    2023
  • 资助金额:
    33 万元
  • 项目类别:
    地区科学基金项目
基于人类血清素神经元报告系统研究TSPYL1突变对婴儿猝死综合征的致病作用及机制
  • 批准号:
    82371176
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
FOXO3 m6A甲基化修饰诱导滋养细胞衰老效应在补肾法治疗自然流产中的机制研究
  • 批准号:
    82305286
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Collaborative Research: MLWiNS:Physical Layer Communication revisited via Deep Learning
合作研究:MLWiNS:通过深度学习重新审视物理层通信
  • 批准号:
    2240916
  • 财政年份:
    2022
  • 资助金额:
    $ 18.16万
  • 项目类别:
    Standard Grant
Collaborative Research: MLWiNS: Distributed Learning over Multi-Access Channels: From Bandlimited Coordinate Descent to Gradient Sketching
协作研究:MLWiNS:多访问通道上的分布式学习:从带限坐标下降到梯度草图
  • 批准号:
    2203412
  • 财政年份:
    2021
  • 资助金额:
    $ 18.16万
  • 项目类别:
    Standard Grant
Collaborative Research: MLWiNS: A Coding-Centric Approach to Robust, Secure, and Private Distributed Learning over Wireless
协作研究:MLWiNS:一种以编码为中心的方法,通过无线实现稳健、安全和私密的分布式学习
  • 批准号:
    2002821
  • 财政年份:
    2020
  • 资助金额:
    $ 18.16万
  • 项目类别:
    Standard Grant
Collaborative Research: MLWiNS: A Coding-Centric Approach to Robust, Secure, and Private Distributed Learning over Wireless
协作研究:MLWiNS:一种以编码为中心的方法,通过无线实现稳健、安全和私密的分布式学习
  • 批准号:
    2002874
  • 财政年份:
    2020
  • 资助金额:
    $ 18.16万
  • 项目类别:
    Standard Grant
Collaborative Research: MLWiNS: Distributed Learning over Multi-Access Channels: From Bandlimited Coordinate Descent to Gradient Sketching
协作研究:MLWiNS:多访问通道上的分布式学习:从带限坐标下降到梯度草图
  • 批准号:
    2003081
  • 财政年份:
    2020
  • 资助金额:
    $ 18.16万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了