Prediction and Planning: Bridging the Gap
预测和规划:弥合差距
基本信息
- 批准号:0209088
- 负责人:
- 金额:$ 29.17万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2002
- 资助国家:美国
- 起止时间:2002-09-01 至 2006-08-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
This project is fundamental research to improve the performance of intelligent software agents, based on the observation that an agent's past experiences are a valuable and generally underutilized database. The goal is to produce algorithms that make stronger use of data than existing reinforcement learning algorithms, enabling a view of the agent's stored experiences as a repository that can be mined for performance-improving information. More generally, the agent may choose to use data obtained by observing other agents, or even from mining the web.The impact of this research may be felt in many areas. For example, software learning agents can be expected to learn in a much more human-like manner; noteworthy experiences will be remembered, and their influence on future performance will not attenuate. There will be no sampling requirements on the data, so it will be possible to learn from watching others and possible to use repositories of stored data to learn new behaviors. Among the likely practical applications of this work are network management and electronic commerce.
该项目是基础研究,旨在提高智能软件代理的性能,这是基于代理商的过去经验是一种有价值且普遍不足的数据库的观察。 目的是生成比现有的强化学习算法更强大地使用数据的算法,从而可以将代理商存储的体验视为可以开采以进行绩效改善信息的存储库的视图。 更一般而言,代理可以选择使用通过观察其他代理或挖掘网络获得的数据,在许多领域都可以感受到这项研究的影响。 例如,可以期望软件学习代理以更像人性化的方式学习。值得注意的经历将被记住,他们对未来表现的影响不会减弱。 数据上没有采样要求,因此可以从观看其他人那里学习,并可以使用存储数据的存储库来学习新的行为。 这项工作的可能实际应用包括网络管理和电子商务。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Ronald Parr其他文献
Amazing Things Come From Having Many Good Models
令人惊奇的事情来自于拥有许多好的模型
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
Cynthia Rudin;Chudi Zhong;Lesia Semenova;Margo Seltzer;Ronald Parr;Jiachang Liu;Srikar Katta;Jon Donnelly;Harry Chen;Zachery Boner - 通讯作者:
Zachery Boner
An Optimal Tightness Bound for the Simulation Lemma
模拟引理的最优紧界
- DOI:
- 发表时间:
2024 - 期刊:
- 影响因子:0
- 作者:
Sam Lobel;Ronald Parr - 通讯作者:
Ronald Parr
Ronald Parr的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Ronald Parr', 18)}}的其他基金
RI: Small: Feature Encoding for Reinforcement Learning
RI:小型:强化学习的特征编码
- 批准号:
1815300 - 财政年份:2018
- 资助金额:
$ 29.17万 - 项目类别:
Continuing Grant
EAGER: Collaborative Research: An Unified Learnable Roadmap for Sequential Decision Making in Relational Domains
EAGER:协作研究:关系领域顺序决策的统一可学习路线图
- 批准号:
1836575 - 财政年份:2018
- 资助金额:
$ 29.17万 - 项目类别:
Standard Grant
RI: Small: Non-parametric Approximate Dynamic Programming for Continuous Domains
RI:小:连续域的非参数近似动态规划
- 批准号:
1218931 - 财政年份:2012
- 资助金额:
$ 29.17万 - 项目类别:
Standard Grant
EAGER: IIS: RI: Learning in Continuous and High Dimensional Action Spaces
EAGER:IIS:RI:在连续和高维行动空间中学习
- 批准号:
1147641 - 财政年份:2011
- 资助金额:
$ 29.17万 - 项目类别:
Standard Grant
Collaborative: RI: Feature Discovery and Benchmarks for Exportable Reinforcement Learning
协作:RI:可导出强化学习的特征发现和基准
- 批准号:
0713435 - 财政年份:2007
- 资助金额:
$ 29.17万 - 项目类别:
Standard Grant
CAREER: Observing to Plan - Planning to Observe
职业生涯:观察到计划 - 计划到观察
- 批准号:
0546709 - 财政年份:2006
- 资助金额:
$ 29.17万 - 项目类别:
Continuing Grant
相似国自然基金
创新走廊的生长机理、空间绩效与规划策略研究——以长三角地区为例
- 批准号:52378045
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
乡村聚落空间分异机制及规划调控研究——以浙江地区为例
- 批准号:52378067
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
面向地下受限空间的无人机同时探索与覆盖规划研究
- 批准号:62303249
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
抛光机器人柔性变刚度并联执行器宏微协调运动规划与主被动柔顺控制
- 批准号:52305016
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
膝关节置换的患者个性化磨损功能智能规划原理
- 批准号:52375207
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
相似海外基金
Integrating Qualified Exercise Professionals into Health Service Delivery: Bridging the Gap between Exercise and Health Professionals and Primary Health Care to community physical activity
将合格的运动专业人员纳入健康服务提供:弥合运动和健康专业人员以及初级卫生保健与社区体育活动之间的差距
- 批准号:
480780 - 财政年份:2023
- 资助金额:
$ 29.17万 - 项目类别:
Miscellaneous Programs
Bridging clinical trial and real-world data via machine learning to advance rheumatoid arthritis treatment strategies
通过机器学习连接临床试验和真实世界数据,以推进类风湿性关节炎的治疗策略
- 批准号:
10652251 - 财政年份:2022
- 资助金额:
$ 29.17万 - 项目类别:
Bridging clinical trial and real-world data via machine learning to advance rheumatoid arthritis treatment strategies
通过机器学习连接临床试验和真实世界数据,以推进类风湿性关节炎的治疗策略
- 批准号:
10339668 - 财政年份:2022
- 资助金额:
$ 29.17万 - 项目类别:
Collaborative Planning Grant: Bridging Rural Access in Virginia – Building Partnerships for STEM Pathways
协作规划补助金:架起弗吉尼亚州农村的桥梁 — 为 STEM 途径建立伙伴关系
- 批准号:
2221391 - 财政年份:2022
- 资助金额:
$ 29.17万 - 项目类别:
Standard Grant
Planning Grant: Bridging the STEM Gap - Enhancing STEM Education Using a Multitier Approach
规划拨款:弥合 STEM 差距 - 使用多层方法加强 STEM 教育
- 批准号:
1912085 - 财政年份:2019
- 资助金额:
$ 29.17万 - 项目类别:
Standard Grant