RI: Medium: Collaborative Research: Write A Classifier: Learning Fine-Grained Visual Classifiers from Text and Images

RI:媒介:协作研究:编写分类器:从文本和图像中学习细粒度视觉分类器

基本信息

  • 批准号:
    1409683
  • 负责人:
  • 金额:
    $ 50万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2014
  • 资助国家:
    美国
  • 起止时间:
    2014-06-15 至 2021-05-31
  • 项目状态:
    已结题

项目摘要

This project develops the learning strategy using textual narrative and images makes the learning effective without a huge number of images that a typical visual learning algorithm would need to learn the class boundaries. The research team investigates computational models for joint learning of visual concepts from images and textual descriptions of fine-grained categories, for example, discriminating between bird species. The research activities have broader impact in three fields: computer vision, natural language processing, and machine learning. There is a huge need to develop algorithms to automatically understand the content of images and videos, with numerous potential applications in web searches, image and video archival and retrieval, surveillance applications, robot navigation and others. There are various applications for developing an intelligent system that can use narrative to define and recognize categories.This project addresses two research questions: First, given a visual corpus and a textual corpus about a specific domain, how to jointly and effectively learn visual concepts? Second, given these two modalities how to facilitate learning novel visual concepts using only pure textual descriptions of novel categories in the domain? The research team approaches the problem on three integrated fronts: Learning, Natural Language Processing (NLP), and Computer Vision. On the learning front, the project investigates and develops algorithms suitable for learning and predicting visual classifiers with side textual information. On the NLP front, the project aims to develop novel methods for learning global and local discriminative category-level attributes and their values from text, with feedback from human computation and visual signal. The project investigates supervised and unsupervised methods for detecting visual text, and learning methods for deep language understanding to build such rich domain models from the noisy visual text. On the Vision front, the project addresses the tasks of detection and classification with side textual information. The project investigates models for the shape and appearance of a general category that can specialize to different subordinates, in a way that allows interpreting information from text within a proper geometric context, and handle variability in viewpoints and articulation.
该项目使用文本叙述制定学习策略,图像使学习有效,而无需大量的图像,而典型的视觉学习算法将需要学习类界限。 研究小组研究了从图像和细颗粒类别的文本描述中联合学习视觉概念的计算模型,例如,区分鸟类。 研究活动在三个领域具有更大的影响:计算机视觉,自然语言处理和机器学习。需要开发算法来自动理解图像和视频的内容,并且在Web搜索,图像和视频档案和检索,监视应用程序,机器人导航等中具有许多潜在的应用程序。开发一个可以使用叙述来定义和识别类别的智能系统有各种应用程序。该项目解决了两个研究问题:首先,给定视觉语料库和有关特定领域的文本语料库,如何共同有效地学习视觉概念?其次,鉴于这两种方式如何仅使用域中新颖类别的纯文本描述来促进学习新颖的视觉概念?研究团队在三个综合方面解决了问题:学习,自然语言处理(NLP)和计算机视觉。在学习方面,该项目研究和开发了适合通过侧面文本信息学习和预测视觉分类器的算法。在NLP方面,该项目旨在开发新的方法,以通过人类计算和视觉信号的反馈来学习全球和局部歧视类别级别的属性及其值。该项目调查了被监督和无监督的方法,用于检测视觉文本,以及学习深入的语言理解的学习方法,以从嘈杂的视觉文本中构建这种丰富的领域模型。在视觉方面,该项目通过侧面文本信息解决了检测和分类的任务。该项目研究了可以专门针对不同下属的一般类别的形状和外观的模型,该模型允许在适当的几何环境中解释文本的信息,并处理观点和表达中的可变性。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

暂无数据

数据更新时间:2024-06-01

Ahmed Elgammal其他文献

<strong>POSTER:</strong> ABCL-262 Diffuse Large B Cell Lymphoma in a Child With Epidermodysplasia Verruciformis, Case Report
  • DOI:
    10.1016/s2152-2650(23)00746-2
    10.1016/s2152-2650(23)00746-2
  • 发表时间:
    2023-09-01
    2023-09-01
  • 期刊:
  • 影响因子:
  • 作者:
    Ahmed Elgammal;Eman N khorshed
    Ahmed Elgammal;Eman N khorshed
  • 通讯作者:
    Eman N khorshed
    Eman N khorshed
ABCL-262 Diffuse Large B Cell Lymphoma in a Child With Epidermodysplasia Verruciformis, Case Report
  • DOI:
    10.1016/s2152-2650(23)01309-5
    10.1016/s2152-2650(23)01309-5
  • 发表时间:
    2023-09-01
    2023-09-01
  • 期刊:
  • 影响因子:
  • 作者:
    Ahmed Elgammal;Eman N Khorshed
    Ahmed Elgammal;Eman N Khorshed
  • 通讯作者:
    Eman N Khorshed
    Eman N Khorshed
共 2 条
  • 1
前往

Ahmed Elgammal的其他基金

I-Corps: Artificial Intelligence for Analysis Of Visual Art
I-Corps:用于分析视觉艺术的人工智能
  • 批准号:
    1636932
    1636932
  • 财政年份:
    2016
  • 资助金额:
    $ 50万
    $ 50万
  • 项目类别:
    Standard Grant
    Standard Grant
RI: Small: Collaborative Research: Detecting Abnormalities in Images
RI:小型:协作研究:检测图像中的异常情况
  • 批准号:
    1218872
    1218872
  • 财政年份:
    2013
  • 资助金额:
    $ 50万
    $ 50万
  • 项目类别:
    Standard Grant
    Standard Grant
US Egypt Cooperative Research: Computer Aided Pronunciation Learning Application
美埃合作研究:计算机辅助发音学习应用
  • 批准号:
    0923658
    0923658
  • 财政年份:
    2009
  • 资助金额:
    $ 50万
    $ 50万
  • 项目类别:
    Standard Grant
    Standard Grant
CAREER: Generalized Separation of Style and Content on Nonlinear Manifolds with Application to Human Motion Analysis
职业:非线性流形上风格和内容的广义分离及其在人体运动分析中的应用
  • 批准号:
    0546372
    0546372
  • 财政年份:
    2006
  • 资助金额:
    $ 50万
    $ 50万
  • 项目类别:
    Continuing Grant
    Continuing Grant
Nonlinear Spatiotemporal Models for Decomposing Style Variations using Kernel Methods
使用核方法分解风格变化的非线性时空模型
  • 批准号:
    0328991
    0328991
  • 财政年份:
    2003
  • 资助金额:
    $ 50万
    $ 50万
  • 项目类别:
    Continuing Grant
    Continuing Grant

相似国自然基金

复合低维拓扑材料中等离激元增强光学响应的研究
  • 批准号:
    12374288
  • 批准年份:
    2023
  • 资助金额:
    52 万元
  • 项目类别:
    面上项目
基于管理市场和干预分工视角的消失中等企业:特征事实、内在机制和优化路径
  • 批准号:
    72374217
  • 批准年份:
    2023
  • 资助金额:
    41.00 万元
  • 项目类别:
    面上项目
托卡马克偏滤器中等离子体的多尺度算法与数值模拟研究
  • 批准号:
    12371432
  • 批准年份:
    2023
  • 资助金额:
    43.5 万元
  • 项目类别:
    面上项目
中等质量黑洞附近的暗物质分布及其IMRI系统引力波回波探测
  • 批准号:
    12365008
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目
中等垂直风切变下非对称型热带气旋快速增强的物理机制研究
  • 批准号:
    42305004
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Collaborative Research: RI: Medium: Principles for Optimization, Generalization, and Transferability via Deep Neural Collapse
合作研究:RI:中:通过深度神经崩溃实现优化、泛化和可迁移性的原理
  • 批准号:
    2312841
    2312841
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
    $ 50万
  • 项目类别:
    Standard Grant
    Standard Grant
Collaborative Research: RI: Medium: Principles for Optimization, Generalization, and Transferability via Deep Neural Collapse
合作研究:RI:中:通过深度神经崩溃实现优化、泛化和可迁移性的原理
  • 批准号:
    2312842
    2312842
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
    $ 50万
  • 项目类别:
    Standard Grant
    Standard Grant
Collaborative Research: RI: Medium: Lie group representation learning for vision
协作研究:RI:中:视觉的李群表示学习
  • 批准号:
    2313151
    2313151
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
    $ 50万
  • 项目类别:
    Continuing Grant
    Continuing Grant
Collaborative Research: RI: Medium: Principles for Optimization, Generalization, and Transferability via Deep Neural Collapse
合作研究:RI:中:通过深度神经崩溃实现优化、泛化和可迁移性的原理
  • 批准号:
    2312840
    2312840
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
    $ 50万
  • 项目类别:
    Standard Grant
    Standard Grant
Collaborative Research: RI: Medium: Lie group representation learning for vision
协作研究:RI:中:视觉的李群表示学习
  • 批准号:
    2313149
    2313149
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
    $ 50万
  • 项目类别:
    Continuing Grant
    Continuing Grant