RI: Medium: Learning to Map and Navigate with Vision and Language

RI:媒介:学习用视觉和语言绘制地图和导航

基本信息

  • 批准号:
    2212433
  • 负责人:
  • 金额:
    $ 120万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2022
  • 资助国家:
    美国
  • 起止时间:
    2022-09-01 至 2026-08-31
  • 项目状态:
    未结题

项目摘要

This project aims to advance the state of the art in robotic mapping and navigation by enabling spatial understanding using semantic maps and spatial reasoning for following language instructions given only visual inputs. Current performance in those tasks is low because of the inability to ground semantic entities and instructions spatially. Instead of grounding semantics to images, spatial understanding and navigation can be achieved if a system uses maps as an intermediate representation, as also indicated by behavioral and neural findings in spatial cognition. Building a map of an unseen space without exhaustive exploration can be learned, and this process can be facilitated by cross-modal language-vision attentional mechanisms. The project will integrate research with education and outreach underrepresented groups in Philadelphia neighborhoods as a target broadening the participation.This research is centered around understanding how vision and language interact to create better spatial representations like maps and facilitate navigation. The project will approach the vision-language from three angles. (i) How robots can learn to predict a map when entering an unseen environment using active learning. (ii) How navigation instructions can be encoded into spatial configuration schemata and navigational concepts that can be better aligned to maps and paths than raw language embeddings, and (iii) how navigational language representations can facilitate the creation of maps in unseen environments, and how one can follow instructions by using maps and language to create paths to follow.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
该项目旨在通过使用语义地图和空间推理来实现空间理解,以遵循仅给出视觉输入的语言指令,从而推进机器人测绘和导航的最新技术。由于无法在空间上定位语义实体和指令,这些任务的当前性能较低。如果系统使用地图作为中间表示,则可以实现空间理解和导航,而不是将语义扎根于图像,空间认知中的行为和神经发现也表明了这一点。无需进行详尽的探索即可构建看不见的空间地图,并且可以通过跨模态语言视觉注意力机制来促进这一过程。该项目将把研究与教育和推广费城社区中代表性不足的群体结合起来,作为扩大参与的目标。这项研究的重点是了解视觉和语言如何相互作用,以创建更好的空间表示(如地图)并促进导航。该项目将从三个角度探讨视觉语言。 (i) 机器人如何使用主动学习在进入看不见的环境时学习预测地图。 (ii)如何将导航指令编码为空间配置模式和导航概念,从而比原始语言嵌入更好地与地图和路径对齐,以及(iii)导航语言表示如何促进在看不见的环境中创建地图,以及如何人们可以通过使用地图和语言来创建遵循的路径来遵循指示。该奖项反映了 NSF 的法定使命,并且通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Cross-modal Map Learning for Vision and Language Navigation
用于视觉和语言导航的跨模态地图学习
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Kostas Daniilidis其他文献

Nonmyopic View Planning for Active Object Detection
用于活动物体检测的非近视视图规划
  • DOI:
    10.48550/arxiv.2311.05046
  • 发表时间:
    2013-09-20
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Nikolay A. Atanasov;Bharathwaj Sankaran;J. L. Ny;George Pappas;Kostas Daniilidis
  • 通讯作者:
    Kostas Daniilidis
Distributed 3-D Bearing-Only Orientation Localization
分布式 3D 仅方位定向定位
Hybrid control for visibility-based pursuit-evasion games
基于可见性的追击躲避游戏的混合控制
A Survey on Rotation Optimization in Structure from Motion
运动结构旋转优化研究综述
Attentive Visual Motion Processing: Computations in the Log-Polar Plane
专注的视觉运动处理:对数极平面中的计算
  • DOI:
    10.1007/978-3-7091-6586-7_1
  • 发表时间:
    1994-03-01
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kostas Daniilidis
  • 通讯作者:
    Kostas Daniilidis

Kostas Daniilidis的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Kostas Daniilidis', 18)}}的其他基金

Collaborative Research: Visual Tactile Neural Fields for Active Digital Twin Generation
合作研究:用于主动数字孪生生成的视觉触觉神经场
  • 批准号:
    2220868
  • 财政年份:
    2022
  • 资助金额:
    $ 120万
  • 项目类别:
    Standard Grant
RI: Medium: Collaborative Research: Closed Loop Perceptual Planning for Dynamic Locomotion
RI:中:协作研究:动态运动的闭环感知规划
  • 批准号:
    1703319
  • 财政年份:
    2017
  • 资助金额:
    $ 120万
  • 项目类别:
    Continuing Grant
MRI: Development of an Observatory for Quantitative Analysis of Collective Behavior in Animals
MRI:开发动物集体行为定量分析观测站
  • 批准号:
    1626008
  • 财政年份:
    2016
  • 资助金额:
    $ 120万
  • 项目类别:
    Standard Grant
I/UCRC Phase I: Robots and Sensors for the Human Well-being
I/UCRC 第一阶段:造福人类福祉的机器人和传感器
  • 批准号:
    1439681
  • 财政年份:
    2014
  • 资助金额:
    $ 120万
  • 项目类别:
    Continuing Grant
NRI: Small: Collaborative Research: Active Sensing for Robotic Cameramen
NRI:小型:协作研究:机器人摄影师的主动传感
  • 批准号:
    1317947
  • 财政年份:
    2013
  • 资助金额:
    $ 120万
  • 项目类别:
    Standard Grant
I-Corps: BlindNav: Indoor Navigation for the Visually Impaired
I-Corps:BlindNav:为视障人士提供室内导航
  • 批准号:
    1265129
  • 财政年份:
    2012
  • 资助金额:
    $ 120万
  • 项目类别:
    Standard Grant
IGERT: Complex Scene Perception
IGERT:复杂场景感知
  • 批准号:
    0966142
  • 财政年份:
    2010
  • 资助金额:
    $ 120万
  • 项目类别:
    Continuing Grant
CDI-Type II: Collaborative Research: Perception of Scene Layout by Machines and Visually Impaired Users
CDI-Type II:协作研究:机器和视障用户对场景布局的感知
  • 批准号:
    1028009
  • 财政年份:
    2010
  • 资助金额:
    $ 120万
  • 项目类别:
    Standard Grant
CDI-Type II: Collaborative Research: Cyber Enhancement of Spatial Cognition for the Visually Impaired
CDI-Type II:协作研究:视觉障碍者空间认知的网络增强
  • 批准号:
    0835714
  • 财政年份:
    2008
  • 资助金额:
    $ 120万
  • 项目类别:
    Standard Grant
RI: Collaborative Research: Bio-inspired Navigation
RI:合作研究:仿生导航
  • 批准号:
    0713260
  • 财政年份:
    2007
  • 资助金额:
    $ 120万
  • 项目类别:
    Continuing Grant

相似国自然基金

基于挥发性分布和氧化校正的大气半/中等挥发性有机物来源解析方法构建
  • 批准号:
    42377095
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
基于机器学习和经典电动力学研究中等尺寸金属纳米粒子的量子表面等离激元
  • 批准号:
    22373002
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
中等质量黑洞附近的暗物质分布及其IMRI系统引力波回波探测
  • 批准号:
    12365008
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目
复合低维拓扑材料中等离激元增强光学响应的研究
  • 批准号:
    12374288
  • 批准年份:
    2023
  • 资助金额:
    52 万元
  • 项目类别:
    面上项目
托卡马克偏滤器中等离子体的多尺度算法与数值模拟研究
  • 批准号:
    12371432
  • 批准年份:
    2023
  • 资助金额:
    43.5 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: RI: Medium: Superhuman Imitation Learning from Heterogeneous Demonstrations
合作研究:RI:媒介:异质演示中的超人模仿学习
  • 批准号:
    2312956
  • 财政年份:
    2023
  • 资助金额:
    $ 120万
  • 项目类别:
    Standard Grant
RI: Medium: Foundations of Recourse Verification in Machine Learning
RI:媒介:机器学习资源验证的基础
  • 批准号:
    2313105
  • 财政年份:
    2023
  • 资助金额:
    $ 120万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Medium: Lie group representation learning for vision
协作研究:RI:中:视觉的李群表示学习
  • 批准号:
    2313151
  • 财政年份:
    2023
  • 资助金额:
    $ 120万
  • 项目类别:
    Continuing Grant
Collaborative Research: RI: Medium: Lie group representation learning for vision
协作研究:RI:中:视觉的李群表示学习
  • 批准号:
    2313149
  • 财政年份:
    2023
  • 资助金额:
    $ 120万
  • 项目类别:
    Continuing Grant
Collaborative Research: RI:Medium:Understanding Events from Streaming Video - Joint Deep and Graph Representations, Commonsense Priors, and Predictive Learning
协作研究:RI:Medium:理解流视频中的事件 - 联合深度和图形表示、常识先验和预测学习
  • 批准号:
    2348689
  • 财政年份:
    2023
  • 资助金额:
    $ 120万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了