Collaborative Research: Continuous-State Reinforcement Learning for Remanufacturing
协作研究:再制造的连续状态强化学习
基本信息
- 批准号:2027527
- 负责人:
- 金额:$ 24.37万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2022
- 资助国家:美国
- 起止时间:2022-07-01 至 2025-06-30
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
This award will contribute to the national prosperity and U.S. manufacturing competitiveness by developing new reinforcement learning (a subfield of artificial intelligence) methods to address inventory-control problems arising in remanufacturing industry. Remanufacturing is a product-management manufacturing process that aims to reduce the energy consumption and carbon footprint of traditional manufacturing. Effective production/inventory management to match the supply with the demand is a key element to the success of remanufacturing industry. However, the complexity of such problems and the uncertainties involved in the remanufacturing process make the conventional production planning methods difficult to apply. The resulting algorithms and tools will be fully tested using real-world data collected from the industry and are expected to achieve significant savings in raw materials and energy resources, leading to practical management policies of industrial interest. The PIs will involve both graduate and undergraduate students in this research and incorporate case studies into the advanced courses taught at different institutions.This research will be based on a fusion of techniques from reinforcement learning and the field of simulation optimization. Through novel adaptations of the-state-of-the-art variance reduction and function approximation techniques from simulation optimization, the PIs will investigate a new class of learning techniques especially tailored to remanufacturing decision-making problems. These include an extension of classical Q-learning for solving continuous-state semi-Markov decision processes and more general gradient-free actor-critic-like algorithms that overcome the local convergence of existing approaches. The algorithms developed will be studied for their theoretical properties such as convergence and performance consistency, and then assessed and validated on remanufacturing simulation models built on real-world data to investigate their practical impact.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
该奖项将通过开发新的强化学习(人工智能的一个子领域)方法来解决再制造行业中出现的库存控制问题,从而为国家繁荣和美国制造业竞争力做出贡献。再制造是一种产品管理制造过程,旨在减少传统制造的能源消耗和碳足迹。有效的生产/库存管理以匹配供应与需求是再制造行业成功的关键要素。然而,此类问题的复杂性以及再制造过程中涉及的不确定性使得传统的生产计划方法难以应用。 由此产生的算法和工具将使用从行业收集的真实数据进行全面测试,预计将显着节省原材料和能源,从而制定符合行业利益的实用管理政策。 PI 将让研究生和本科生参与这项研究,并将案例研究纳入不同机构教授的高级课程中。这项研究将基于强化学习和模拟优化领域技术的融合。通过对最先进的方差减少和模拟优化的函数逼近技术进行新颖的改造,PI 将研究一类专门针对再制造决策问题而定制的新型学习技术。其中包括用于解决连续状态半马尔可夫决策过程的经典 Q 学习的扩展,以及克服现有方法的局部收敛性的更通用的无梯度行动评论家算法。所开发的算法将研究其收敛性和性能一致性等理论特性,然后在基于真实世界数据的再制造仿真模型上进行评估和验证,以研究其实际影响。该奖项反映了 NSF 的法定使命,并被认为是值得的通过使用基金会的智力优势和更广泛的影响审查标准进行评估来提供支持。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Jiaqiao Hu其他文献
A stochastic search algorithm for voltage and reactive power control with switching costs and ZIP load model
具有切换成本和 ZIP 负载模型的电压和无功功率控制的随机搜索算法
- DOI:
10.1016/j.epsr.2015.12.025 - 发表时间:
2016 - 期刊:
- 影响因子:3.9
- 作者:
E. Feinberg;Jiaqiao Hu;E. Yuan - 通讯作者:
E. Yuan
Multi-stage Adaptive Sampling Algorithms
多级自适应采样算法
- DOI:
- 发表时间:
2013 - 期刊:
- 影响因子:0
- 作者:
H. Chang;Jiaqiao Hu;M. Fu;S. Marcus - 通讯作者:
S. Marcus
Model-building semi-Markov adaptive critics
模型构建半马尔可夫自适应批评家
- DOI:
10.1109/adprl.2011.5967374 - 发表时间:
2011 - 期刊:
- 影响因子:0
- 作者:
A. Gosavi;S. Murray;Jiaqiao Hu - 通讯作者:
Jiaqiao Hu
Model Reference Adaptive Search
模型参考自适应搜索
- DOI:
10.1007/978-1-4471-5022-0_4 - 发表时间:
2013 - 期刊:
- 影响因子:0
- 作者:
H. Chang;Jiaqiao Hu;M. Fu;S. Marcus - 通讯作者:
S. Marcus
Dynamic hedge fund asset allocation under multiple regimes
多种制度下的动态对冲基金资产配置
- DOI:
10.1109/allerton.2010.5707074 - 发表时间:
2010 - 期刊:
- 影响因子:0
- 作者:
D. Cru;Jiaqiao Hu - 通讯作者:
Jiaqiao Hu
Jiaqiao Hu的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Jiaqiao Hu', 18)}}的其他基金
Actor-Critic-Like Stochastic Adaptive Search Algorithms for Simulation Optimization
用于仿真优化的类似 Actor-Critic 的随机自适应搜索算法
- 批准号:
1634627 - 财政年份:2016
- 资助金额:
$ 24.37万 - 项目类别:
Standard Grant
Collaborative Research: A New Paradigm for Simulation Optimization: Marriage between Expectation-Maximization and Model-Based Optimization
协作研究:仿真优化的新范式:期望最大化与基于模型的优化的结合
- 批准号:
1130761 - 财政年份:2011
- 资助金额:
$ 24.37万 - 项目类别:
Standard Grant
Collaborative Research: Combining Gradient and Adaptive Search in Simulation Optimization
协作研究:在仿真优化中结合梯度和自适应搜索
- 批准号:
0900332 - 财政年份:2009
- 资助金额:
$ 24.37万 - 项目类别:
Standard Grant
相似国自然基金
融合多源生物信息-连续知识追踪解码-无关意图拒识机制的康复外骨骼人体运动意图识别研究
- 批准号:62373344
- 批准年份:2023
- 资助金额:51 万元
- 项目类别:面上项目
基于聚合松香诱导的高取向聚乳酸纳米纤维的连续纺丝新方法及机理研究
- 批准号:52303039
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
连续层化内孤立波对潜式结构的荷载及运动响应研究
- 批准号:52301323
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于片上中红外超连续光与狭缝波导的化学传感器研究
- 批准号:62305304
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
面向经鼻颅底手术的微型复合连续体机器人研究
- 批准号:52375020
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
相似海外基金
Collaborative Research: Scalable Nanomanufacturing of Perovskite-Analogue Nanocrystals via Continuous Flow Reactors
合作研究:通过连续流反应器进行钙钛矿类似物纳米晶体的可扩展纳米制造
- 批准号:
2315997 - 财政年份:2024
- 资助金额:
$ 24.37万 - 项目类别:
Standard Grant
Collaborative Research: Scalable Nanomanufacturing of Perovskite-Analogue Nanocrystals via Continuous Flow Reactors
合作研究:通过连续流反应器进行钙钛矿类似物纳米晶体的可扩展纳米制造
- 批准号:
2315996 - 财政年份:2024
- 资助金额:
$ 24.37万 - 项目类别:
Standard Grant
Collaborative Research: CCSS: Continuous Facial Sensing and 3D Reconstruction via Single-ear Wearable Biosensors
合作研究:CCSS:通过单耳可穿戴生物传感器进行连续面部传感和 3D 重建
- 批准号:
2401415 - 财政年份:2023
- 资助金额:
$ 24.37万 - 项目类别:
Standard Grant
Collaborative Research: IIBR Instrumentation: A continuous metabolite sensor for lab and field studies
合作研究:IIBR Instrumentation:用于实验室和现场研究的连续代谢物传感器
- 批准号:
2324717 - 财政年份:2023
- 资助金额:
$ 24.37万 - 项目类别:
Continuing Grant
Collaborative Research: SaTC: CORE: Small: Self-Driving Continuous Fuzzing
协作研究:SaTC:核心:小型:自驱动连续模糊测试
- 批准号:
2247880 - 财政年份:2023
- 资助金额:
$ 24.37万 - 项目类别:
Continuing Grant