基于多模态融合的语义表示学习方法

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61872113
  • 项目类别:
    面上项目
  • 资助金额:
    64.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0211.信息检索与社会计算
  • 结题年份:
    2022
  • 批准年份:
    2018
  • 项目状态:
    已结题
  • 起止时间:
    2019-01-01 至2022-12-31

项目摘要

Recently, based on deep learning techniques, researchers have reached great achievements on picture/text and video/text union learning. Nevertheless, most of the natural language processing (NLP) tasks still not benefit from such achievements. On the other hand, it is well known that the semantic understanding of human beings is based on the fusion of multiple senses like vision, auditory, symbols of language etc. Up to now, most of NLP applications are based on the word embeddings generated via the single model representation learning of text. The foundation of text based word embedding is not fulfilled, which becomes one of the main bottlenecks of further improvement of natural understanding and language generation applications. To address this problem, building the solid foundation of semantic is emergent. In this paper, we goal at the construction of common multimodal fusion word semantic representations. First, for different type of words, we construct the standard learning corpora for their multimodal fusion representation learning (MFRL) respectively. Then the MFRL models and methods are designed and implement by the constraints of semantic relationships proposed by common semantic knowledge bases. The reinforcement learning mechanism is applied to normalize different semantic representation spaces learnt by different MFRL models. At last, a common and full covered multimodal word embeddings will be presented. The research of this project is expected to make significant contributions to the natural language understanding and generating applications, as well as to the study of nature of word senses.
近年来,借助深度学习技术,研究者在图片文本联合学习、视频文本联合学习等领域取得了重要成果。但是,集成了语言知识的多模态联合学习并未能在自然语言处理中得到有效应用。尽管人类对语义的认知与理解显然是建立在视觉、听觉与语言符号等多模态融合基础上的,但当前自然语言应用仍然主要构建在单文本表示学习所获得的词嵌入基础之上,语义表示基础并不完整,这在一定程度上阻碍了语义的深度理解、语言生成等应用的发展。为解决这一问题,迫切需要夯实语义表示的认知基础。本项目以构建通用的、基于多模态融合的语义表示为目标,通过对不同类别词语构建相应的多模态融合语义学习标准数据集,并将语义关系作为约束和通用学习目标,构建多模态融合语义表示学习的模型与方法,通过强化学习机制来完成不同模态学习得到的语义空间的规范化,从而初步构建起覆盖完整词典的多模态词嵌入,为自然语言理解与语言生成等应用的发展以及探究语义的本质特征等作出积极贡献。

结项摘要

尽管人类对语义的认知与理解显然是建立在视觉、听觉与语言符号等多模态融合基础上的,但当前自然语言应用仍然主要构建在单文本表示学习的基础之上,语义表示基础并不完整,这在一定程度上阻碍了语义的深度理解、语言生成等应用的发展。为解决这一问题,课题组根据项目研究计划对基于多模态融合的语义表示方法开展了以下四个方面进行了研究:1)基于图文联合学习的语义表示学习机制研究,实现了快速高效的多模态表示方法,提高了模型对于答案语义关联信息的学习表示能力;2)多模态联合学习的语义表示空间规范化研究,实现了高效、可解释、且鲁棒性强的语义表示;3)多模态联合学习语料库的构建规范指定和语料库建设,构建了大规模中文开放医学知识图谱及开放式医学知识在线协同构建平台,构造了书法知识图谱,提出了信息抽取方法,构建了医学知识表达体系;4)基于多模态融合的语义表示应用技术研究,课题组在图像分类、图像修复、医学领域中的自动诊断问题。进行了场景化的落地研究。.项目研究过程中共发表了包括JAMIA,TMM等重要国际期刊和AAAI等重要国际会议在内的论文29篇,其中CCF A/T1的会议、期刊文章6篇,CCF B会议、期刊论文14篇;申请发明专利4项;培养了博士生8人,硕士生13名;项目的研究已经华为公司完成了工业化场景的应用;基于相关研究工作,课题组还建立了深圳中国书法数字仿真技术工程实验室,建设了书法知识图谱与在线检索教学平台、多风格数字墨水仿真技术和系统、书法数字化技术和查询系统等;课题组成员共参加了20余次重要国际会议,承办了5次重要的国际会议和1次重要的学术论坛。综上,课题按照申请书的研究按计划执行,达到了项目计划目标,取得了预期的研究成果。

项目成果

期刊论文数量(11)
专著数量(0)
科研奖励数量(0)
会议论文数量(18)
专利数量(0)
VLDeformer: Vision–Language Decomposed Transformer for fast cross-modal retrieval
VLDeformer:用于快速跨模态检索的视觉语言分解变压器
  • DOI:
    10.1016/j.knosys.2022.109316
  • 发表时间:
    2021
  • 期刊:
    Knowledge Based Systems
  • 影响因子:
    --
  • 作者:
    Lisai Zhang;Hongfa Wu;Qingcai Chen;Yimeng Deng;Zhonghua Li;Dejiang Kong;Zhao Cao;Joanna Siebert;Yunpeng Han
  • 通讯作者:
    Yunpeng Han
Biomedical relation extraction via knowledge-enhanced reading comprehension.
通过知识增强阅读理解进行生物医学关系提取
  • DOI:
    10.1186/s12859-021-04534-5
  • 发表时间:
    2022-01-06
  • 期刊:
    BMC bioinformatics
  • 影响因子:
    3
  • 作者:
    Chen J;Hu B;Peng W;Chen Q;Tang B
  • 通讯作者:
    Tang B
Distantly supervised biomedical relation extraction using piecewise attentive convolutional neural network and reinforcement learning
使用分段注意力卷积神经网络和强化学习进行远程监督生物医学关系提取。
  • DOI:
    10.1093/jamia/ocab176
  • 发表时间:
    2021-09-15
  • 期刊:
    JOURNAL OF THE AMERICAN MEDICAL INFORMATICS ASSOCIATION
  • 影响因子:
    6.4
  • 作者:
    Zhu, Tiantian;Qin, Yang;Peng, Weihua
  • 通讯作者:
    Peng, Weihua
Stroke Sequence-Dependent Deep Convolutional Neural Network for Online Handwritten Chinese Character Recognition
用于在线手写汉字识别的笔画序列相关深度卷积神经网络
  • DOI:
    10.1109/tnnls.2019.2956965
  • 发表时间:
    2020-11-01
  • 期刊:
    IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS
  • 影响因子:
    10.4
  • 作者:
    Liu, Xin;Hu, Baotian;You, Jinghan
  • 通讯作者:
    You, Jinghan
Attentive capsule network for click-through rate and conversion rate prediction in online advertising
用于在线广告点击率和转化率预测的注意力胶囊网络
  • DOI:
    10.1016/j.knosys.2020.106522
  • 发表时间:
    2021-01-09
  • 期刊:
    KNOWLEDGE-BASED SYSTEMS
  • 影响因子:
    8.8
  • 作者:
    Li, Dongfang;Hu, Baotian;Liu, Haishan
  • 通讯作者:
    Liu, Haishan

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

中文问答系统中时间敏感问句的识别和检索
  • DOI:
    --
  • 发表时间:
    2013
  • 期刊:
    计算机研究与发展
  • 影响因子:
    --
  • 作者:
    王晓龙;陈清财;王宇亮;户保田
  • 通讯作者:
    户保田
CHIP2019评测任务1概述:临床术语标准化任务
  • DOI:
    --
  • 发表时间:
    2021
  • 期刊:
    中文信息学报
  • 影响因子:
    --
  • 作者:
    黄源航;焦晓康;汤步洲;陈清财;闫峻
  • 通讯作者:
    闫峻

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

陈清财的其他基金

构式语法的计算模型研究
  • 批准号:
    61473101
  • 批准年份:
    2014
  • 资助金额:
    80.0 万元
  • 项目类别:
    面上项目
网络信息自主整合关键技术研究
  • 批准号:
    61173075
  • 批准年份:
    2011
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
异构信息互动模型中的关键技术研究
  • 批准号:
    60703015
  • 批准年份:
    2007
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码