Collaborative Research: MLWiNS: Dino-RL: A Domain Knowledge Enriched Reinforcement Learning Framework for Wireless Network Optimization
合作研究:MLWiNS:Dino-RL:用于无线网络优化的领域知识丰富的强化学习框架
基本信息
- 批准号:2002902
- 负责人:
- 金额:$ 18.51万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2020
- 资助国家:美国
- 起止时间:2020-06-01 至 2025-05-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
Reinforcement learning (RL) methods have met with renewed interest in recent years for adaptively configuring wireless networks. Despite the promising early results and the conceptual match, many existing approaches do not develop and tailor the RL methods to fit the unique characteristics of wireless networking. The goal of this project is to develop a novel domain knowledge enriched RL framework, or Dino-RL, to address this problem. The Dino-RL framework aims to seamlessly integrate the physical-law based modeling and an abstract episodic memory into the RL process, and has the potential to revamp the operation and management of future wireless networks. Developing this novel technology would also help maintain the nation's continued leadership in wireless technologies and its pipeline of highly qualified engineers. The project pursues synergistic activities for the successful design and implementation of Dino-RL, followed by a comprehensive, real-world data driven evaluation. Episodic RL is first studied with the objective to incorporate domain knowledge into building an efficient episodic memory. In addition, a hierarchical hidden variable model is built to enable meta-reinforcement learning for knowledge transfer and efficient exploration. Lastly, the conflict between enhancing the physical-law based modeling and reinforcement learning is balanced via novel sample-efficient model selection algorithms.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
近年来,增强学习方法(RL)方法已引起了新的兴趣,以适应无线网络。尽管有希望的早期结果和概念上的匹配,但许多现有方法并未开发和量身定制RL方法以适合无线网络的独特特征。该项目的目的是开发一种新颖的领域知识丰富的RL框架或Dino-RL来解决此问题。 Dino-RL框架旨在将基于物理法的建模和抽象的情节内存无缝整合到RL过程中,并有可能改进未来无线网络的操作和管理。开发这种新颖的技术还将有助于维持美国在无线技术方面的持续领导力及其高素质工程师的管道。该项目为成功设计和实施Dino-RL提供协同活动,然后进行全面的现实数据驱动的评估。首先研究了情节RL的目标,其目标是将域知识纳入建立有效的情节记忆中。此外,构建了一个层次隐藏的变量模型,以实现用于知识转移和有效探索的荟萃方面学习。最后,通过新颖的样本效率模型选择算法,增强基于物理法的建模和增强学习之间的冲突是平衡的。该奖项反映了NSF的法定任务,并被认为是值得通过基金会的知识分子的评估和更广泛的影响来支持的,并具有更广泛的影响。标准。
项目成果
期刊论文数量(23)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Reward Teaching for Federated Multiarmed Bandits
- DOI:10.1109/tsp.2023.3333658
- 发表时间:2023
- 期刊:
- 影响因子:5.4
- 作者:Chengshuai Shi;Wei Xiong;Cong Shen;Jing Yang
- 通讯作者:Chengshuai Shi;Wei Xiong;Cong Shen;Jing Yang
On High-dimensional and Low-rank Tensor Bandits
关于高维低阶张量老虎机
- DOI:
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:Shi, C.;Shen, C.;Sidiropoulos. N. D.
- 通讯作者:Sidiropoulos. N. D.
Teaching Reinforcement Learning Agents via Reinforcement Learning
通过强化学习教授强化学习代理
- DOI:10.1109/ciss56502.2023.10089695
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:Yang, Kun;Shi, Chengshuai;Shen, Cong
- 通讯作者:Shen, Cong
Cascading Bandits with Two-Level Feedback
具有两级反馈的级联 Bandits
- DOI:10.1109/isit50566.2022.9834892
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Cheng, Duo;Huang, Ruiquan;Shen, Cong;Yang, Jing
- 通讯作者:Yang, Jing
Multi-Agent Reinforcement Learning for Wireless User Scheduling: Performance, Scalablility, and Generalization
- DOI:10.1109/ieeeconf56349.2022.10051992
- 发表时间:2022-10
- 期刊:
- 影响因子:0
- 作者:Kun Yang;Donghao Li;Cong Shen;Jing Yang;Shu-ping Yeh;J. Sydir
- 通讯作者:Kun Yang;Donghao Li;Cong Shen;Jing Yang;Shu-ping Yeh;J. Sydir
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Cong Shen其他文献
On the Design of Modern Multilevel Coded Modulation for Unequal Error Protection
论现代多级编码调制的不等差错保护设计
- DOI:
10.1109/icc.2008.263 - 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
Cong Shen;M. Fitz - 通讯作者:
M. Fitz
Multi-relation graph embedding for predicting miRNA-target gene interactions by integrating gene sequence information
通过整合基因序列信息预测 miRNA-靶基因相互作用的多关系图嵌入
- DOI:
10.1109/jbhi.2022.3168008 - 发表时间:
2022 - 期刊:
- 影响因子:7.7
- 作者:
Jiawei Luo;Wenjue Ouyang;Cong Shen;Jie Cai - 通讯作者:
Jie Cai
Stability analysis for interval time-varying delay systems based on time-varying bound integral method
基于时变界限积分法的区间时变时滞系统稳定性分析
- DOI:
10.1016/j.jfranklin.2014.07.015 - 发表时间:
2014-10 - 期刊:
- 影响因子:0
- 作者:
Qian Wei;Li Tao;Cong Shen;Fei Shumin - 通讯作者:
Fei Shumin
Stochastic Linear Contextual Bandits with Diverse Contexts
具有不同上下文的随机线性上下文强盗
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
Weiqiang Wu;Jing Yang;Cong Shen - 通讯作者:
Cong Shen
Output-feedback stabilization control of systems with random switchings and state jumps
具有随机切换和状态跳跃的系统的输出反馈稳定控制
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
Qian Wei;Cong Shen;Zheng Zheng - 通讯作者:
Zheng Zheng
Cong Shen的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Cong Shen', 18)}}的其他基金
Collaborative Research: CPS Medium: Learning through the Air: Cross-Layer UAV Orchestration for Online Federated Optimization
合作研究:CPS 媒介:空中学习:用于在线联合优化的跨层无人机编排
- 批准号:
2313110 - 财政年份:2023
- 资助金额:
$ 18.51万 - 项目类别:
Standard Grant
CAREER: Towards a Communication Foundation for Distributed and Decentralized Machine Learning
职业:为分布式和去中心化机器学习建立通信基础
- 批准号:
2143559 - 财政年份:2022
- 资助金额:
$ 18.51万 - 项目类别:
Continuing Grant
CCSS: Collaborative Research: Towards a Resource Rationing Framework for Wireless Federated Learning
CCSS:协作研究:无线联邦学习的资源配给框架
- 批准号:
2033671 - 财政年份:2020
- 资助金额:
$ 18.51万 - 项目类别:
Standard Grant
Collaborative Research: SWIFT: SMALL: Learning-Efficient Spectrum Access for No-Sensing Devices in Shared Spectrum
合作研究:SWIFT:SMALL:共享频谱中无感知设备的学习高效频谱访问
- 批准号:
2029978 - 财政年份:2020
- 资助金额:
$ 18.51万 - 项目类别:
Standard Grant
相似国自然基金
基于FRET受体上升时间的单分子高精度测量方法研究
- 批准号:22304184
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
脂质多聚复合物mRNA纳米疫苗的构筑及抗肿瘤治疗研究
- 批准号:52373161
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
屏障突破型原位线粒体基因递送系统用于治疗Leber遗传性视神经病变的研究
- 批准号:82304416
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
细胞硬度介导口腔鳞癌细胞与CD8+T细胞间力学对话调控免疫杀伤的机制研究
- 批准号:82373255
- 批准年份:2023
- 资助金额:48 万元
- 项目类别:面上项目
乙酸钙不动杆菌上调DUOX2激活PERK/ATF4内质网应激在炎症性肠病中的作用机制研究
- 批准号:82300623
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
Collaborative Research: MLWiNS:Physical Layer Communication revisited via Deep Learning
合作研究:MLWiNS:通过深度学习重新审视物理层通信
- 批准号:
2240916 - 财政年份:2022
- 资助金额:
$ 18.51万 - 项目类别:
Standard Grant
Collaborative Research: MLWiNS: Distributed Learning over Multi-Access Channels: From Bandlimited Coordinate Descent to Gradient Sketching
协作研究:MLWiNS:多访问通道上的分布式学习:从带限坐标下降到梯度草图
- 批准号:
2203412 - 财政年份:2021
- 资助金额:
$ 18.51万 - 项目类别:
Standard Grant
Collaborative Research: MLWiNS: A Coding-Centric Approach to Robust, Secure, and Private Distributed Learning over Wireless
协作研究:MLWiNS:一种以编码为中心的方法,通过无线实现稳健、安全和私密的分布式学习
- 批准号:
2002821 - 财政年份:2020
- 资助金额:
$ 18.51万 - 项目类别:
Standard Grant
Collaborative Research: MLWiNS: A Coding-Centric Approach to Robust, Secure, and Private Distributed Learning over Wireless
协作研究:MLWiNS:一种以编码为中心的方法,通过无线实现稳健、安全和私密的分布式学习
- 批准号:
2002874 - 财政年份:2020
- 资助金额:
$ 18.51万 - 项目类别:
Standard Grant
Collaborative Research: MLWiNS: Distributed Learning over Multi-Access Channels: From Bandlimited Coordinate Descent to Gradient Sketching
协作研究:MLWiNS:多访问通道上的分布式学习:从带限坐标下降到梯度草图
- 批准号:
2003081 - 财政年份:2020
- 资助金额:
$ 18.51万 - 项目类别:
Standard Grant