生成对抗网络在图像文本跨模态检索中的研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61862050
  • 项目类别:
    地区科学基金项目
  • 资助金额:
    40.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0211.信息检索与社会计算
  • 结题年份:
    2022
  • 批准年份:
    2018
  • 项目状态:
    已结题
  • 起止时间:
    2019-01-01 至2022-12-31

项目摘要

It is a typical problem that using a text query to search for image and using a image query to search for text. Convolutional neural network and generative adversarial network have been applied in a wide variety of fields, including image processing and natural language processing and so on, provides a strong basis for modal information retrieval technology. This project study two kinds of model data information retrieval task. This project takes image and text modal data as the research object. This project's purpose is to effectively solve the problem of the construction of image-text common subspace and semantic association between features in subspace is not strong, and to enhance cross-modal retrieval performance. First of all, we used convolution neural network to establish image-text feature projection model and modal classification model, and then used generative adversarial network's idea to construct cross-modal retrieval model .This model can be used to construct image-text common subspace which can integrate the representation learning and the related learning.Secondly, the semantic classifier based on depth classification network and the negative sample constraints are introduced to cross-modal retrieval model for digging deeper into the semantic association features. This method can reduce the loss of semantic information of thie data features, and to ensure the semantic discrimination between the features in the modal in the common subspace at the same time ensure inter-modal semantic consistency.Thirdly, for training the cross-modal retrieval model, we have designed training method and objective function, in order to accomplish the training task of cross-modal retrieval model efficiently. In the end, we use public real data set to validate models in this project, and develop a cross modal retrieval demo system.
图文互检是跨模态检索任务中的典型问题。卷积神经网络、生成对抗网络在图像及自然语言处理等领域的成功应用,为跨模态检索技术提供了有力依据。本项目以图像和文本两种模态数据作为研究对象,期望能够有效解决图文共享子空间构建与子空间中特征间语义关联不强的问题,提升图文跨模态检索性能。为此首先采用卷积神经网络建立图文特征投影模型和模态特征分类器,随后应用生成对抗网络的思想融合二者搭建跨模态检索模型,用以构建将表示学习和关联学习有机统一的图文共享子空间;接着引入基于深度分类网络的语义分类器和负样本约束,深入挖掘图文模态数据的语义关联特征来降低数据特征语义信息的损失,以期在共享子空间中同时保证模态内特征间的语义区分性和模态间特征的语义一致性,并以此为目的设计对应的训练方法和目标函数,期望高效完成跨模态检索模型的训练任务;最后选取公开的真实数据集对本研究构建的各种模型进行验证,并研制一个跨模态检索演示系统。

结项摘要

近年来,文本、图像、视频和音频等不同模态的数据呈现爆炸式增长,单一的数据检索模式已渐渐无法满足用户日益丰富的检索需求。跨模态检索的目标是以某一模态的数据(如文本)作为输入,从数据库中查找与输入相似的其他模态数据(如图像)。然而,由于不同模态数据存在异构性,使得衡量它们之间的相似性变得非常困难。本项目着眼于图像和文本两个模态,针对图文跨模态检索研究中目前存在的问题,将原申请计划内容进行拓展,从单模态表示学习和多模态关联学习、图文共享语义特征的表示学习、模态间特征的一致性及模态内特征的区分性、细粒度图像分类和细粒度图文跨模态检索五个方面展开研究。并将上述方法在自建的超声图文、枸杞虫害图文跨模态检索数据集进行验证,为行业检索应用提供了新方法和新手段。. 依托本项目,累计发表学术论文15篇,包括EI期刊检索3篇,EI会议检索4篇,CSSCI期刊检索1篇,CSCD期刊前15% 3篇,CSCD核心期刊1篇,CSCD扩展版期刊3篇;申请发明专利2项(授权1项);申请获批软件著作权3项;进行成果登记1项;培养年青教师2名,硕士研究生7名。项目负责人刘立波教授在项目执行期间,2022年入选宁夏科技领军人才、晋升中国计算机学会高级会员。

项目成果

期刊论文数量(11)
专著数量(0)
科研奖励数量(0)
会议论文数量(4)
专利数量(2)
面向细粒度图像分类的双线性残差注意力网络
  • DOI:
    --
  • 发表时间:
    2020
  • 期刊:
    激光与光电子学进展
  • 影响因子:
    --
  • 作者:
    王阳;刘立波
  • 通讯作者:
    刘立波
双线性聚合残差注意力的细粒度图像分类模型
  • DOI:
    10.3778/j.issn.1673-9418.2010031
  • 发表时间:
    2022
  • 期刊:
    计算机科学与探索
  • 影响因子:
    --
  • 作者:
    李宽宽;刘立波
  • 通讯作者:
    刘立波
图文跨模态检索的概率分布表示学习
  • DOI:
    10.3724/sp.j.1089.2022.18990
  • 发表时间:
    2022
  • 期刊:
    计算机辅助设计与图形学学报
  • 影响因子:
    --
  • 作者:
    杨晨;刘立波
  • 通讯作者:
    刘立波
基于注意力和视觉语义推理的枸杞虫害检索
  • DOI:
    --
  • 发表时间:
    2022
  • 期刊:
    计算机科学
  • 影响因子:
    --
  • 作者:
    韩会珍;刘立波
  • 通讯作者:
    刘立波
基于生成对抗网络的甲状腺超声图像文本跨模态检索方法
  • DOI:
    --
  • 发表时间:
    2020
  • 期刊:
    生物医学工程学杂志
  • 影响因子:
    --
  • 作者:
    徐峰;马小萍;刘立波
  • 通讯作者:
    刘立波

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

武汉地区垂直等效风场季节变化
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    电波科学学报
  • 影响因子:
    --
  • 作者:
    栾晓莉;刘立波;雷久侯;万卫星
  • 通讯作者:
    万卫星
NeQuick模式在亚太地区扇区电离层参数f0F2的预测能力
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    空间科学学报
  • 影响因子:
    --
  • 作者:
    刘立波;芦琳伶
  • 通讯作者:
    芦琳伶
内皮-单核细胞激活多肽酶Ⅱ增强血肿瘤屏障通透性的机制
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    解剖科学进展
  • 影响因子:
    --
  • 作者:
    李振;刘云会;薛一雪;刘立波;LI Zhen1,LIU Yun-hui1,XUE Yi-xue2,LIU Li-bo2(1.Dep;2.Department of Neurobiology,College of Basic Medi
  • 通讯作者:
    2.Department of Neurobiology,College of Basic Medi
赤道地区电离层foF2在第23/24太阳活动周极低年期间创造了极低纪录?
  • DOI:
    --
  • 发表时间:
    2012
  • 期刊:
    地球物理学报
  • 影响因子:
    --
  • 作者:
    杨君;刘立波;陈一定;乐会军;YANG Jun1,2,3,LIU Li-Bo1,CHEN Yi-Ding1,LE Hui-Jun1
  • 通讯作者:
    YANG Jun1,2,3,LIU Li-Bo1,CHEN Yi-Ding1,LE Hui-Jun1
磁暴期间低纬电离层效应的数值模拟
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    电波科学学报
  • 影响因子:
    --
  • 作者:
    刘立波;蔡红涛;周云良;马淑英;颜伟男
  • 通讯作者:
    颜伟男

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

刘立波的其他基金

文本-视频跨模态检索中的弱语义相关性研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    34 万元
  • 项目类别:
    地区科学基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码