喵ID:AXqdEu免责声明

Latent acoustic topic models for unstructured audio classification

用于非结构化音频分类的潜在声学主题模型

基本信息

DOI:
10.1017/atsip.2012.7
发表时间:
2012
影响因子:
3.2
通讯作者:
Shrikanth Narayanan
中科院分区:
文献类型:
--
作者: Samuel Kim;P. Georgiou;Shrikanth Narayanan研究方向: -- MeSH主题词: --
关键词: --
来源链接:pubmed详情页地址

文献摘要

We propose the notion of latent acoustic topics to capture contextual information embedded within a collection of audio signals. The central idea is to learn a probability distribution over a set of latent topics of a given audio clip in an unsupervised manner, assuming that there exist latent acoustic topics and each audio clip can be described in terms of those latent acoustic topics. In this regard, we use the latent Dirichlet allocation (LDA) to implement the acoustic topic models over elemental acoustic units, referred as acoustic words, and perform text-like audio signal processing. Experiments on audio tag classification with the BBC sound effects library demonstrate the usefulness of the proposed latent audio context modeling schemes. In particular, the proposed method is shown to be superior to other latent structure analysis methods, such as latent semantic analysis and probabilistic latent semantic analysis. We also demonstrate that topic models can be used as complementary features to content-based features and offer about 9% relative improvement in audio classification when combined with the traditional Gaussian mixture model (GMM)–Support Vector Machine (SVM) technique.
我们提出潜在声学主题的概念,以捕捉嵌入在一组音频信号中的上下文信息。核心思想是以无监督的方式学习给定音频片段在一组潜在主题上的概率分布,假设存在潜在声学主题,并且每个音频片段都可以用这些潜在声学主题来描述。在这方面,我们使用潜在狄利克雷分配(LDA)在基本声学单元(称为声学词)上实现声学主题模型,并进行类似文本的音频信号处理。使用英国广播公司音效库进行的音频标签分类实验证明了所提出的潜在音频上下文建模方案的有效性。特别是,所提出的方法被证明优于其他潜在结构分析方法,如潜在语义分析和概率潜在语义分析。我们还证明了主题模型可以用作基于内容的特征的补充特征,并且当与传统的高斯混合模型(GMM) - 支持向量机(SVM)技术相结合时,在音频分类中提供了约9%的相对改进。
参考文献(1)
被引文献(2)
Finding scientific topics
DOI:
10.1073/pnas.0307752101
发表时间:
2004-04-06
期刊:
PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES OF THE UNITED STATES OF AMERICA
影响因子:
11.1
作者:
Griffiths, TL;Steyvers, M
通讯作者:
Steyvers, M

数据更新时间:{{ references.updateTime }}

Shrikanth Narayanan
通讯地址:
--
所属机构:
--
电子邮件地址:
--
免责声明免责声明
1、猫眼课题宝专注于为科研工作者提供省时、高效的文献资源检索和预览服务;
2、网站中的文献信息均来自公开、合规、透明的互联网文献查询网站,可以通过页面中的“来源链接”跳转数据网站。
3、在猫眼课题宝点击“求助全文”按钮,发布文献应助需求时求助者需要支付50喵币作为应助成功后的答谢给应助者,发送到用助者账户中。若文献求助失败支付的50喵币将退还至求助者账户中。所支付的喵币仅作为答谢,而不是作为文献的“购买”费用,平台也不从中收取任何费用,
4、特别提醒用户通过求助获得的文献原文仅用户个人学习使用,不得用于商业用途,否则一切风险由用户本人承担;
5、本平台尊重知识产权,如果权利所有者认为平台内容侵犯了其合法权益,可以通过本平台提供的版权投诉渠道提出投诉。一经核实,我们将立即采取措施删除/下架/断链等措施。
我已知晓