喵ID:yFeSUu免责声明

End-to-End Neural Speech Coding for Real-Time Communications

用于实时通信的端到端神经语音编码

基本信息

DOI:
10.1109/icassp43922.2022.9746296
发表时间:
2022
期刊:
ICASSP 2022 - 2022 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)
影响因子:
--
通讯作者:
Yan Lu
中科院分区:
文献类型:
--
作者: Xue Jiang;Xiulian Peng;Chengyu Zheng;Huaying Xue;Yuan Zhang;Yan Lu研究方向: -- MeSH主题词: --
关键词: --
来源链接:pubmed详情页地址

文献摘要

Deep-learning based methods have shown their advantages in audio coding over traditional ones but limited attention has been paid on real-time communications (RTC). This paper proposes the TFNet, an end-to-end neural speech codec with low latency for RTC. It takes an encoder-temporal filtering-decoder paradigm that has seldom been investigated in audio coding. An interleaved structure is proposed for temporal filtering to capture both short-term and long-term temporal dependencies. Furthermore, with end-to-end optimization, the TFNet is jointly optimized with speech enhancement and packet loss concealment, yielding a one-for-all network for three tasks. Both subjective and objective results demonstrate the efficiency of the proposed TFNet.
基于深度学习的方法在音频编码方面相较于传统方法已展现出优势,但在实时通信(RTC)领域却鲜受关注。本文提出了TFNet,这是一种面向实时通信的低延迟端到端神经语音编解码器。它采用了编码器 - 时间滤波 - 解码器范式,而这种范式在音频编码中鲜有人研究。为时间滤波提出了一种交错结构,以捕捉短期和长期的时间依赖关系。此外,通过端到端优化,TFNet与语音增强和丢包隐藏功能进行联合优化,形成了一个可兼顾这三项任务的通用网络。主观和客观结果均证明了所提出的TFNet的有效性。
参考文献
被引文献
Conv-TasNet: Surpassing Ideal Time-Frequency Magnitude Masking for Speech Separation
DOI:
10.1109/taslp.2019.2915167
发表时间:
2019-08-01
期刊:
IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING
影响因子:
5.4
作者:
Luo, Yi;Mesgarani, Nima
通讯作者:
Mesgarani, Nima

数据更新时间:{{ references.updateTime }}

Yan Lu
通讯地址:
--
所属机构:
--
电子邮件地址:
--
免责声明免责声明
1、猫眼课题宝专注于为科研工作者提供省时、高效的文献资源检索和预览服务;
2、网站中的文献信息均来自公开、合规、透明的互联网文献查询网站,可以通过页面中的“来源链接”跳转数据网站。
3、在猫眼课题宝点击“求助全文”按钮,发布文献应助需求时求助者需要支付50喵币作为应助成功后的答谢给应助者,发送到用助者账户中。若文献求助失败支付的50喵币将退还至求助者账户中。所支付的喵币仅作为答谢,而不是作为文献的“购买”费用,平台也不从中收取任何费用,
4、特别提醒用户通过求助获得的文献原文仅用户个人学习使用,不得用于商业用途,否则一切风险由用户本人承担;
5、本平台尊重知识产权,如果权利所有者认为平台内容侵犯了其合法权益,可以通过本平台提供的版权投诉渠道提出投诉。一经核实,我们将立即采取措施删除/下架/断链等措施。
我已知晓