基于对抗深度学习的下一代视频编码方法研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61901459
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    24.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0108.多媒体通信
  • 结题年份:
    2022
  • 批准年份:
    2019
  • 项目状态:
    已结题
  • 起止时间:
    2020-01-01 至2022-12-31

项目摘要

Video coding is an effective solution for the video storage and transmission, and it is also a hot research topic. However, brute force search for the optimal coding parameter and manually designed prediction functions are utilized in the traditional video coding, which greatly limits the improvement of video coding performance. From the perspective of computer vision and artificial intelligence, the key modules in video coding, including predictive coding, mode decision and motion compensation can be modeled as image inpainting, classification and super-resolution respectively, where the deep learning tool will be adopted. In addition, the attack and defense of neural network with coding distortion will be exploited to design and train the adversarial neural networks for versatile video coding, aims to achieve the theoretical innovation and technical breakthroughs of intelligent video coding.
视频编码是解决视频数据存储和传输的有效手段,也是当前国内外研究的热点问题。然而,传统的视频编码技术大都采用全遍历暴力搜索最优编码参数和凭统计经验以手工设计预测函数的编码方案,这在很大程度上限制了视频编码性能的提升。本项目拟从计算机视觉和人工智能的角度出发,将信号处理领域问题模型化为人工智能领域问题,即将视频编码中的关键模块,预测编码、模式决策和运动补偿建模为图像修复、分类和超分辨率重建问题,利用神经网络为工具进行求解,同时探索编码失真环境下神经网络的攻击与防御,进而设计与训练对抗神经网络以应用于下一代视频编码标准,实现快速决策、自适应、智能化的高效编码,最终取得智能视频编码优化理论与方法的创新。

结项摘要

目前,以视频为载体的多媒体数据成为了信息时代发展的关键,并开始占据主导地位、呈现爆炸式增长的趋势,给存储和传输带来了前所未有的挑战。为了缓解视频数据的爆炸式增长,下一代视频编码标准已经制定,但凭统计经验手工设计的方案限制了编码性能的提升。因此,如何利用学习工具在有限带宽条件下最大化视频重建质量成为了视频编码优化的关键。本项目针对亮度、色度以及模式预测模块,实现从信号处理到人工智能的问题建模,解决现有方法遇到的瓶颈。.针对亮度预测,提出了基于生成对抗网络的图像修复方法,以有效消除空间冗余并生成灵活的预测模式。亮度预测被建模为图像修复任务,通过周围邻域的重构像素填充缺失部分,学习好的神经网络被集成到视频编解码器,并执行率失真优化以获得更好的编码性能。.针对色度预测,提出了基于深度学习的帧内色度预测方法,以充分利用亮度和色度分量之间的高度相关性提升性能。色度预测问题被模型化为上色任务,包括亮度下采样和色度预测两个子网络,它们被联合优化以充分利用空间和交叉域信息。此外,线性预测结果被用作色度初始化以提高性能,并将量化参数作为特征输入网络,消除压缩失真带来的负面影响。.针对模式预测,提出了智能化的帧内模式预测方法,以跳过帧内模式编码模块减少编码比特。全遍历候选帧内模式获取最佳模式的过程被建模为多分类任务,并设计了神经网络框架以适应不同的量化参数和可变编码块(包括非对称编码块)。特别地,手工特征和学习特征相结合的方式被用来弥补它们各自的局限性。.综上所述,本项目以多媒体视频快速发展及广泛应用为契机,针对现有视频编码模块的局限性问题,从人工智能的角度出发,以海量视频/图像为数据基础,研究结合对抗神经网络的视频编码方法,最终实现智能视频编码优化理论与方法的创新。预期成果能应用于下一代视频编码标准及视频压缩的各个相关领域,提高我国在视频信号处理领域的国际竞争力。

项目成果

期刊论文数量(7)
专著数量(0)
科研奖励数量(0)
会议论文数量(2)
专利数量(2)
Highly Efficient Multiview Depth Coding Based on Histogram Projection and Allowable Depth Distortion
基于直方图投影和允许深度畸变的高效多视图深度编码
  • DOI:
    --
  • 发表时间:
    2021
  • 期刊:
    IEEE Transactions on Image Processing
  • 影响因子:
    10.6
  • 作者:
    Yun Zhang;Linwei Zhu;Raouf Hamzaoui;Sam Kwong;Yo-Sung Ho
  • 通讯作者:
    Yo-Sung Ho
Deep Learning Based Intra Mode Derivation for Versatile Video Coding
基于深度学习的多功能视频编码的帧内模式推导
  • DOI:
    10.1145/3563699
  • 发表时间:
    2023
  • 期刊:
    ACM Transactions on Multimedia Computing Communications and Applications
  • 影响因子:
    5.1
  • 作者:
    Linwei Zhu;Yun Zhang;Na Li;Gangyi Jiang;Sam Kwong
  • 通讯作者:
    Sam Kwong
Deep Learning-based Perceptual Video Quality Enhancement for 3D Synthesized View
基于深度学习的 3D 合成视图感知视频质量增强
  • DOI:
    10.1109/tcsvt.2022.3147788
  • 发表时间:
    2022
  • 期刊:
    IEEE Transactions on Circuits and Systems for Video Technology
  • 影响因子:
    8.4
  • 作者:
    Huan Zhang;Yun Zhang;Linwei Zhu;Weisi Lin
  • 通讯作者:
    Weisi Lin
Circular Intra Prediction for 360 Degree Video Coding
360 度视频编码的循环帧内预测
  • DOI:
    10.1016/j.jvcir.2020.103000
  • 发表时间:
    2021
  • 期刊:
    Journal of Visual Communication and Image Representation
  • 影响因子:
    2.6
  • 作者:
    Linwei Zhu;Yun Zhang;Na Li;Jinyong Pi;Shiqi Wang
  • 通讯作者:
    Shiqi Wang
A Survey on Perceptually Optimized Video Coding
感知优化视频编码调查
  • DOI:
    10.1145/3571727
  • 发表时间:
    2023
  • 期刊:
    ACM Computing Surveys
  • 影响因子:
    16.6
  • 作者:
    Yun Zhang;Linwei Zhu;Gangyi Jiang;Sam Kwong;C. -C. Jay Kuo
  • 通讯作者:
    C. -C. Jay Kuo

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

View-spatial-temporal post-refinement for view synthesis in 3Dvideo systems
3D 视频系统中视图合成的视图时空后细化
  • DOI:
    --
  • 发表时间:
    2013
  • 期刊:
    Signal Processing: Image Communication
  • 影响因子:
    --
  • 作者:
    朱林卫;张云;郁梅;蒋刚毅;邝得互
  • 通讯作者:
    邝得互
View Synthesis Distortion Elimination Filter for Mutliview Depth Coding in 3D Video System
3D 视频系统中多视图深度编码的视图合成失真消除滤波器
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    Multimedia Tools and Applications
  • 影响因子:
    3.6
  • 作者:
    朱林卫;张云;王旭;邝得互
  • 通讯作者:
    邝得互
Allowable depth distortion based fast mode decision and reference frame selection for 3Ddepth coding
用于 3D 深度编码的基于允许深度失真的快速模式决策和参考帧选择
  • DOI:
    10.1007/s11042-015-3109-0
  • 发表时间:
    2017
  • 期刊:
    Multimedia Tools and Applications
  • 影响因子:
    3.6
  • 作者:
    张云;潘兆庆;周洋;朱林卫
  • 通讯作者:
    朱林卫
视频大数据研究综述
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    集成技术
  • 影响因子:
    --
  • 作者:
    刘祥凯;张云;张欢;李娜;樊春玲;谢祖庆;朱林卫
  • 通讯作者:
    朱林卫

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码