Collaborative Research: MLWiNS: Dino-RL: A Domain Knowledge Enriched Reinforcement Learning Framework for Wireless Network Optimization
合作研究:MLWiNS:Dino-RL:用于无线网络优化的领域知识丰富的强化学习框架
基本信息
- 批准号:2003131
- 负责人:
- 金额:$ 18.16万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2020
- 资助国家:美国
- 起止时间:2020-06-01 至 2024-05-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Reinforcement learning (RL) methods have met with renewed interest in recent years for adaptively configuring wireless networks. Despite the promising early results and the conceptual match, many existing approaches do not develop and tailor the RL methods to fit the unique characteristics of wireless networking. The goal of this project is to develop a novel domain knowledge enriched RL framework, or Dino-RL, to address this problem. The Dino-RL framework aims to seamlessly integrate the physical-law based modeling and an abstract episodic memory into the RL process, and has the potential to revamp the operation and management of future wireless networks. Developing this novel technology would also help maintain the nation's continued leadership in wireless technologies and its pipeline of highly qualified engineers. The project pursues synergistic activities for the successful design and implementation of Dino-RL, followed by a comprehensive, real-world data driven evaluation. Episodic RL is first studied with the objective to incorporate domain knowledge into building an efficient episodic memory. In addition, a hierarchical hidden variable model is built to enable meta-reinforcement learning for knowledge transfer and efficient exploration. Lastly, the conflict between enhancing the physical-law based modeling and reinforcement learning is balanced via novel sample-efficient model selection algorithms.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
近年来,强化学习(RL)方法在自适应配置无线网络方面重新引起了人们的兴趣。尽管早期结果令人鼓舞且概念匹配,但许多现有方法并未开发和定制 RL 方法以适应无线网络的独特特征。该项目的目标是开发一种新颖的领域知识丰富的强化学习框架(Dino-RL)来解决这个问题。 Dino-RL 框架旨在将基于物理定律的建模和抽象情景记忆无缝集成到 RL 过程中,并有可能改进未来无线网络的运营和管理。开发这项新技术还将有助于保持国家在无线技术及其高素质工程师队伍方面的持续领先地位。该项目追求协同活动,以成功设计和实施 Dino-RL,然后进行全面的、真实世界数据驱动的评估。情景强化学习首先研究的目的是将领域知识融入构建有效的情景记忆。此外,还构建了分层隐变量模型,以实现知识转移和高效探索的元强化学习。最后,通过新颖的样本有效模型选择算法来平衡增强基于物理定律的建模和强化学习之间的冲突。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力优点和更广泛的影响审查进行评估,被认为值得支持标准。
项目成果
期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Safe Exploration Incurs Nearly No Additional Sample Complexity for Reward-Free RL
安全探索几乎不会为无奖励强化学习带来额外的样本复杂性
- DOI:
- 发表时间:2023-01
- 期刊:
- 影响因子:0
- 作者:Huang, R.;Yang, J.;Liang, Y.
- 通讯作者:Liang, Y.
Multi-Agent Reinforcement Learning for Wireless User Scheduling: Performance, Scalablility, and Generalization
用于无线用户调度的多代理强化学习:性能、可扩展性和泛化
- DOI:10.1109/ieeeconf56349.2022.10051992
- 发表时间:2022-10
- 期刊:
- 影响因子:0
- 作者:Yang, Kun;Li, Donghao;Shen, Cong;Yang, Jing;Yeh, Shu;Sydir, Jerry
- 通讯作者:Sydir, Jerry
Near-optimal Conservative Exploration in Reinforcement Learning under Episode-wise Constraints
逐集约束下强化学习的近最优保守探索
- DOI:
- 发表时间:2023-01
- 期刊:
- 影响因子:0
- 作者:Li, D.;Huang, R.;Shen, C.;Yang, J.
- 通讯作者:Yang, J.
Federated Linear Contextual Bandits
联合线性上下文强盗
- DOI:
- 发表时间:2021-10-27
- 期刊:
- 影响因子:0
- 作者:Ruiquan Huang;Weiqiang Wu;Jing Yang;Cong Shen
- 通讯作者:Cong Shen
Near-optimal Conservative Exploration in Reinforcement Learning under Episode-wise Constraints
逐集约束下强化学习的近最优保守探索
- DOI:
- 发表时间:2023-07
- 期刊:
- 影响因子:0
- 作者:Li, D.;Huang, R.;Shen C.;Yang J.
- 通讯作者:Yang J.
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Jing Yang其他文献
Immunosuppressive Treatment Can Alter Visual Performance in the Royal College of Surgeons Rat.
免疫抑制治疗可以改变皇家外科学院大鼠的视觉表现。
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:2.3
- 作者:
A. Cooper;Jang‐Hyeon Cho;Steven Menges;S. Masood;Junmuzi Xie;Jing Yang;H. Klassen - 通讯作者:
H. Klassen
[An experimental study of cell apoptosis and correlative gene expression after tractive spinal cord injury in rats].
大鼠脊髓牵引损伤后细胞凋亡及相关基因表达的实验研究
- DOI:
- 发表时间:
2004 - 期刊:
- 影响因子:0
- 作者:
Lei Liu;B. Shen;Jing Yang;Bo Lü;Xiao;Zong;F. Pei - 通讯作者:
F. Pei
Challenges and promises of developing thrombin receptor antagonists.
开发凝血酶受体拮抗剂的挑战和前景。
- DOI:
- 发表时间:
2010 - 期刊:
- 影响因子:0
- 作者:
Jing Yang;Ke Xu;D. Seiffert - 通讯作者:
D. Seiffert
Decentralized Multi-player Multi-armed Bandits with No Collision Information
无碰撞信息的去中心化多人多臂强盗
- DOI:
10.1109/isit44484.2020.9174297 - 发表时间:
2020-02-29 - 期刊:
- 影响因子:0
- 作者:
Chengshuai Shi;Wei Xiong;Cong Shen;Jing Yang - 通讯作者:
Jing Yang
Mendelian randomization to explore the direct or mediating associations between socioeconomic status and lung cancer
孟德尔随机化探索社会经济地位与肺癌之间的直接或中介关联
- DOI:
- 发表时间:
2023 - 期刊:
- 影响因子:4.7
- 作者:
Hong Wu;Jing Yang;Hui Wang;Lei Li - 通讯作者:
Lei Li
Jing Yang的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Jing Yang', 18)}}的其他基金
Collaborative Research: Optimized Testing Strategies for Fighting Pandemics: Fundamental Limits and Efficient Algorithms
合作研究:抗击流行病的优化测试策略:基本限制和高效算法
- 批准号:
2133170 - 财政年份:2022
- 资助金额:
$ 18.16万 - 项目类别:
Standard Grant
Collaborative Research: CNS Core: Small: Timely Computing and Learning over Communication Networks
合作研究:CNS 核心:小型:通过通信网络进行及时计算和学习
- 批准号:
2114542 - 财政年份:2021
- 资助金额:
$ 18.16万 - 项目类别:
Standard Grant
Collaborative Research: SWIFT: SMALL: Learning-Efficient Spectrum Access for No-Sensing Devices in Shared Spectrum
合作研究:SWIFT:SMALL:共享频谱中无感知设备的学习高效频谱访问
- 批准号:
2030026 - 财政年份:2020
- 资助金额:
$ 18.16万 - 项目类别:
Standard Grant
CNS Core: Medium: When Next Generation Wireless Networks Meet Machine Learning
CNS 核心:中:当下一代无线网络遇到机器学习时
- 批准号:
1956276 - 财政年份:2020
- 资助金额:
$ 18.16万 - 项目类别:
Standard Grant
Development of a 3D human in vitro model of pancreatic beta cell health
开发胰腺 β 细胞健康的 3D 人体体外模型
- 批准号:
EP/N510099/1 - 财政年份:2017
- 资助金额:
$ 18.16万 - 项目类别:
Research Grant
CAREER: When Energy Harvesting Meets "Big Data": Designing Smart Energy Harvesting Wireless Sensor Networks
职业:当能量收集遇到“大数据”:设计智能能量收集无线传感器网络
- 批准号:
1650299 - 财政年份:2016
- 资助金额:
$ 18.16万 - 项目类别:
Standard Grant
SI2-SSE: Collaborative Research: TrajAnalytics: A Cloud-Based Visual Analytics Software System to Advance Transportation Studies Using Emerging Urban Trajectory Data
SI2-SSE:合作研究:TrajAnalytics:基于云的视觉分析软件系统,利用新兴城市轨迹数据推进交通研究
- 批准号:
1535081 - 财政年份:2015
- 资助金额:
$ 18.16万 - 项目类别:
Standard Grant
CAREER: When Energy Harvesting Meets "Big Data": Designing Smart Energy Harvesting Wireless Sensor Networks
职业:当能量收集遇到“大数据”:设计智能能量收集无线传感器网络
- 批准号:
1454471 - 财政年份:2015
- 资助金额:
$ 18.16万 - 项目类别:
Standard Grant
EAGER: Collaborative Research: Visualizing Event Dynamics with Narrative Animation
EAGER:协作研究:用叙事动画可视化事件动态
- 批准号:
1352893 - 财政年份:2013
- 资助金额:
$ 18.16万 - 项目类别:
Standard Grant
EAGER: Link Free Graph Visualization for Exploring Large Complex Graphs
EAGER:用于探索大型复杂图的链接自由图可视化
- 批准号:
0946400 - 财政年份:2009
- 资助金额:
$ 18.16万 - 项目类别:
Standard Grant
相似国自然基金
IGF-1R调控HIF-1α促进Th17细胞分化在甲状腺眼病发病中的机制研究
- 批准号:82301258
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
CTCFL调控IL-10抑制CD4+CTL旁观者激活促口腔鳞状细胞癌新辅助免疫治疗抵抗机制研究
- 批准号:82373325
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
RNA剪接因子PRPF31突变导致人视网膜色素变性的机制研究
- 批准号:82301216
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
血管内皮细胞通过E2F1/NF-kB/IL-6轴调控巨噬细胞活化在眼眶静脉畸形中的作用及机制研究
- 批准号:82301257
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于多元原子间相互作用的铝合金基体团簇调控与强化机制研究
- 批准号:52371115
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
相似海外基金
Collaborative Research: MLWiNS:Physical Layer Communication revisited via Deep Learning
合作研究:MLWiNS:通过深度学习重新审视物理层通信
- 批准号:
2240916 - 财政年份:2022
- 资助金额:
$ 18.16万 - 项目类别:
Standard Grant
Collaborative Research: MLWiNS: Distributed Learning over Multi-Access Channels: From Bandlimited Coordinate Descent to Gradient Sketching
协作研究:MLWiNS:多访问通道上的分布式学习:从带限坐标下降到梯度草图
- 批准号:
2203412 - 财政年份:2021
- 资助金额:
$ 18.16万 - 项目类别:
Standard Grant
Collaborative Research: MLWiNS: Deep Neural Networks Meet Physical Layer Communications -- Learning with Knowledge of Structure
合作研究:MLWiNS:深度神经网络满足物理层通信——利用结构知识进行学习
- 批准号:
2002908 - 财政年份:2020
- 资助金额:
$ 18.16万 - 项目类别:
Standard Grant
Collaborative Research: MLWiNS:Physical Layer Communication revisited via Deep Learning
合作研究:MLWiNS:通过深度学习重新审视物理层通信
- 批准号:
2002932 - 财政年份:2020
- 资助金额:
$ 18.16万 - 项目类别:
Standard Grant
Collaborative Research: MLWiNS: Hyperdimensional Computing for Scalable IoT Intelligence Beyond the Edge
协作研究:MLWiNS:用于超越边缘的可扩展物联网智能的超维计算
- 批准号:
2003277 - 财政年份:2020
- 资助金额:
$ 18.16万 - 项目类别:
Standard Grant