基于视觉感知的HEVC优化策略研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61401167
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    24.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0108.多媒体通信
  • 结题年份:
    2017
  • 批准年份:
    2014
  • 项目状态:
    已结题
  • 起止时间:
    2015-01-01 至2017-12-31

项目摘要

Since the optimization strategy of the newest video coding standard HEVC is still based on the objective criterion (e.g., SSE), this proposal aims to study the perceptual-oriented optimization strategy for HEVC, mainly on the perceptual rate distortion optimization model, content adaptive JND model based quantization adjustment strategy, and fast hierarchical coding unit and prediction unit decision. First, by considering the perceptual characteristics of the input video, an efficient perceptual rate distortion optimization model is proposed to achieve the optimal trade-off between the perceptual distortion and bit rate so as to improve the perceptual coding efficiency of HEVC. Second, a content adaptive JND model is firstly developed based on the multiple DCT transform unit sizes in HEVC, and then the quantization adjustment strategy and quantization parameter predictive coding method are introduced to reduce the bit rate while maintaining the perceptual quality of the reconstructed video. Third, by using the proposed perceptual rate distortion optimization model as the criterion, the relationship between the perceptual rate distortion gain and the depth of coding unit and the prediction unit partitions is analyzed, and then a hierarchical mode decision is presented to effectively speed up the HEVC mode decision process without losing the perceptual coding efficiency. In summary, this proposal is expected to improve the performance of HEVC in terms of perceptual coding efficiency and computational complexity.
鉴于最新一代视频编码标准HEVC仍采用的是SSE等客观失真准则下的优化方案,本项目拟从人眼视觉感知的角度研究其优化策略,重点解决基于视觉感知的率失真优化模型、基于内容自适应JND模型的量化调整策略及视觉感知准则下的快速分层搜索这三个问题。首先考虑人眼视觉在不同图像特征下的失真容忍度,提出基于视觉感知的率失真优化模型以获得感知失真和码率的最佳折中,提高HEVC的感知编码效率;其次根据HEVC具有多尺寸DCT变换的特性建立内容自适应JND模型,在此基础上提出量化调整策略和量化参数预测编码方案,实现在保证重建视频感知质量的前提下尽可能地降低码率;最后在基于视觉感知的率失真准则下,建立HEVC的编码单元分割深度和预测单元划分模式和其感知率失真增益的关系模型,从而提出快速分层搜索策略,以在保证感知编码效率的前提下有效地加速HEVC模式选择过程。研究成果有望提高HEVC感知编码效率及降低其计算复杂度。

结项摘要

鉴于最新一代视频编码标准HEVC仍采用的是SSE等客观失真准则下的优化方案且人眼是视频最终接收者,如何根据人眼视觉特性进一步提高HEVC编码性能成为视频技术领域兼具理论和实际应用价值的研究热点。.本项目从人眼视觉感知的角度系统研究HEVC优化策略,在基于视觉感知的率失真优化模型、内容自适应JND模型、低复杂度和容错编码技术、图像质量评价模型、基于感兴趣目标的优化方法方面取得一系列进展:(1)考虑人眼视觉在不同视频特征下的失真容忍度,提出视觉感知失真模型,应用于率失真优化模块、码率控制模块,以获得感知失真和码率的最佳折中,提高HEVC感知编码效率;(2)建立多种内容自适应JND模型,应用于量化模块、帧内预测编码模块,实现在保证重建视频感知质量的前提下尽可能地降低码率;(3)建立HEVC的编码单元分割深度和预测单元划分模式和其感知率失真增益的关系模型,应用于模式选择过程,有效地提高HEVC编码速度。在提高编码器鲁棒性方面,利用视频时空相关性提出一种基于自适应数据复用的多描述编码结构;(4)为系统探索人眼视觉感知特性,构建了大规模图像质量评价数据库并提出了多个能够准确反映人眼视觉对于图像质量主观感知的图像质量评价模型;(5)提出多种视频感兴趣目标跟踪和识别策略并设计感兴趣目标和背景区域差异化编码方案。.在本项目研究工作中,我们共发表22篇学术论文,其中SCI收录11篇(IEEE Transactions on Image Processing等SCI二区论文5篇),国际学术会议论文7篇,获得第十八届全国信号处理学术会议优秀论文奖;申请了5项发明专利并已授权1项;获得授权计算机软件著作权1项;培养了1名博士生和4名硕士生;承办了IEEE ISPACS2017国际学术会议并多次参加国内外学术会议,积极促进了学术交流与合作。本项目研究成果为推动高感知编码效率、低计算复杂度、鲁棒的视频技术发展提供一定的理论依据和技术支持,有望在数字电视、视频监控、移动多媒体等产业得到实际应用。

项目成果

期刊论文数量(15)
专著数量(0)
科研奖励数量(1)
会议论文数量(7)
专利数量(5)
SIFT-Flow-Based Color Correction for Multi-view Video
基于 SIFT 流的多视图视频色彩校正
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    Signal Processing: Image Communication
  • 影响因子:
    --
  • 作者:
    Huanqiang Zeng;Kai-Kuang Ma;Chen Wang;Canhui Cai
  • 通讯作者:
    Canhui Cai
Gradient Direction for Screen Content Image Quality Assessment
屏幕内容图像质量评估的梯度方向
  • DOI:
    10.1109/lsp.2016.2599294
  • 发表时间:
    2016
  • 期刊:
    IEEE Signal Processing Letters
  • 影响因子:
    3.9
  • 作者:
    Zhangkai Ni;Lin Ma;Huanqiang Zeng;Canhui Cai;Kai-Kuang Ma
  • 通讯作者:
    Kai-Kuang Ma
Multiple Description Video Coding Based on Adaptive Data Reuse
基于自适应数据重用的多描述视频编码
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    Journal of Visual Communication and Image Representation
  • 影响因子:
    2.6
  • 作者:
    Meng Dong;Huanqiang Zeng;Jing Chen;Canhui Cai;Kai-Kuang Ma
  • 通讯作者:
    Kai-Kuang Ma
Deep Hybrid Similarity Learning for Person Re-identification
用于人员重新识别的深度混合相似性学习
  • DOI:
    10.1109/tcsvt.2017.2734740
  • 发表时间:
    2017
  • 期刊:
    IEEE Transactions on Circuits and Systems for Video Technology
  • 影响因子:
    8.4
  • 作者:
    Jianqing Zhu;Huanqiang Zeng;Shengcai Liao;Zhen Lei;Canhui Cai;Lixin Zheng
  • 通讯作者:
    Lixin Zheng
采用灰度共生矩阵进行深度预判的3D-HEVC深度图帧内快速编码算法
  • DOI:
    --
  • 发表时间:
    2017
  • 期刊:
    信号处理
  • 影响因子:
    --
  • 作者:
    廖洁;陈婧;曾焕强;蔡灿辉
  • 通讯作者:
    蔡灿辉

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

采用联合特征的H.266/WC屏幕内容快速模式选择算法
  • DOI:
    10.16798/j.issn.1003-0530.2021.08.015
  • 发表时间:
    2021
  • 期刊:
    信号处理
  • 影响因子:
    --
  • 作者:
    岳洋洋;曾焕强;陈婧;林晓丹;蔡灿辉
  • 通讯作者:
    蔡灿辉
基于多细节卷积神经网络的单幅图像去雨方法
  • DOI:
    10.16798/j.issn.1003-0530.2019.03.018
  • 发表时间:
    2019
  • 期刊:
    信号处理
  • 影响因子:
    --
  • 作者:
    林向伟;曾焕强;侯进辉;朱建清;蔡灿辉
  • 通讯作者:
    蔡灿辉
基于结构张量的H.266帧内预测快速算法
  • DOI:
    10.16798/j.issn.1003-0530.2021.08.019
  • 发表时间:
    2021
  • 期刊:
    信号处理
  • 影响因子:
    --
  • 作者:
    李鸿辉;曾焕强;陈婧;朱建清;蔡灿辉
  • 通讯作者:
    蔡灿辉
采用SIFT和VLAD特征编码的布匹检索算法
  • DOI:
    doi:10.16798/j.issn.1003-0530.2019.10.013
  • 发表时间:
    2019
  • 期刊:
    信号处理
  • 影响因子:
    --
  • 作者:
    朱建清;林露馨;沈飞;曾焕强;蔡灿辉;郑力新
  • 通讯作者:
    郑力新
基于多细节卷积神经网络的单幅图像去雨方法
  • DOI:
    --
  • 发表时间:
    2019
  • 期刊:
    信号处理
  • 影响因子:
    --
  • 作者:
    林向伟;曾焕强;侯进辉;朱建清;蔡灿辉
  • 通讯作者:
    蔡灿辉

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

曾焕强的其他基金

基于视觉感知的屏幕视频质量评价及编码优化策略研究
  • 批准号:
    61871434
  • 批准年份:
    2018
  • 资助金额:
    59.0 万元
  • 项目类别:
    面上项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码