CI-P: Planning for AudioNet: A New Community Infrastructure for Audio Annotations for Acoustic Event Identification
CI-P:规划 AudioNet:用于声学事件识别的音频注释的新社区基础设施
基本信息
- 批准号:1629990
- 负责人:
- 金额:$ 10万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2016
- 资助国家:美国
- 起止时间:2016-07-01 至 2018-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
This effort lays the groundwork for AudioNet, a public-domain corpus of audio labels for the nearly 800,000 videos in the open-access YFCC100M dataset. Audio information provides an important complement to visual information in the automatic analysis of video data, allowing systems to detect situations that may not be clearly identifiable from the visual stream alone. However, there are as yet no truly large-scale labeled audio datasets of the kind needed as input to build flexible, accurate analysis systems. Creating such a large-scale corpus will serve as an impetus for better multimedia algorithms to be developed by more researchers and computer science students, translating into an impact on the everyday life of the public at large. Social media videos are increasingly used for scientific research, as they provide an opportunity to observe and model many phenomena in the social sciences, economics, meteorology, and medicine. New capabilities for content analysis will therefore impact many scientific fields. In addition, audio analysis could be used in real-time security surveillance and in robotics applications like autonomous vehicles and household robots to aid and monitor the elderly.AudioNet is part of a multi-institution collaboration, the Multimedia Commons initiative, which is developing a variety of resources around the YFCC100M dataset of Creative Commons-licensed photos and videos. AudioNet is annotating the audio tracks from the YFCC100M videos, focusing on audio concepts. Audio concepts can be thought of as acoustic "objects": concrete, localizable units of sound like "crowd cheering" or "fire alarm". The approach will be modeled on ImageNet, an image dataset labeled and organized using the WordNet hierarchy of synsets (groups of synonyms); ImageNet has enabled major enabled advances in image processing. However, while ImageNet focuses largely on entities (noun synsets), audio data is inherently temporal. The label set for AudioNet will therefore focus on events and actions, though similarly organized using semantic resources like WordNet.
这项工作为 AudioNet 奠定了基础,AudioNet 是一个公共域音频标签语料库,包含开放访问 YFCC100M 数据集中的近 800,000 个视频。音频信息在视频数据的自动分析中为视觉信息提供了重要的补充,使系统能够检测仅从视觉流中无法清楚识别的情况。然而,目前还没有真正大规模的标记音频数据集,可以作为构建灵活、准确的分析系统的输入。创建如此大规模的语料库将推动更多研究人员和计算机科学专业的学生开发更好的多媒体算法,从而对广大公众的日常生活产生影响。社交媒体视频越来越多地用于科学研究,因为它们提供了观察和建模社会科学、经济学、气象学和医学中许多现象的机会。因此,内容分析的新功能将影响许多科学领域。此外,音频分析还可用于实时安全监控以及自动驾驶汽车和家用机器人等机器人应用,以帮助和监控老年人。AudioNet 是多机构合作多媒体共享计划的一部分,该计划正在开发一个围绕知识共享许可的照片和视频的 YFCC100M 数据集的各种资源。 AudioNet 正在注释 YFCC100M 视频中的音轨,重点关注音频概念。音频概念可以被认为是声学“对象”:具体的、可本地化的声音单元,如“人群欢呼”或“火警”。该方法将以 ImageNet 为模型,ImageNet 是一个使用 WordNet 同义词集层次结构进行标记和组织的图像数据集; ImageNet 使图像处理领域取得了重大进展。然而,虽然 ImageNet 主要关注实体(名词同义词集),但音频数据本质上是时间性的。因此,AudioNet 的标签集将重点关注事件和操作,尽管使用 WordNet 等语义资源进行类似的组织。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Gerald Friedland其他文献
SRI-Sarnoff AURORA System at TRECVID 2013 Multimedia Event Detection and Recounting
SRI-Sarnoff AURORA 系统参加 TRECVID 2013 多媒体事件检测和重算
- DOI:
- 发表时间:
2013 - 期刊:
- 影响因子:0
- 作者:
Jingen Liu;Hui Cheng;O. Javed;Qian Yu;Ishani Chakraborty;Weiyu Zhang;Ajay Divakaran;H. Sawhney;James Allan;R. Manmatha;John Foley;Mubarak Shah;Afshin Dehghan;Michael Witbrock;Jon Curtis;Gerald Friedland - 通讯作者:
Gerald Friedland
Protecting health care workers: the critical role of airborne infection control.
保护医护人员:空气传播感染控制的关键作用。
- DOI:
- 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
Gerald Friedland - 通讯作者:
Gerald Friedland
Adherence, compliance, and HAART.
依从性、依从性和 HAART。
- DOI:
- 发表时间:
1997 - 期刊:
- 影响因子:0
- 作者:
RN Ann Williams;Gerald Friedland - 通讯作者:
Gerald Friedland
Antiretroviral Prophylaxis of Health Care Workers at Two Urban Medical Centers
两个城市医疗中心医护人员的抗逆转录病毒预防
- DOI:
- 发表时间:
2000 - 期刊:
- 影响因子:3.2
- 作者:
M. Russi;Martha I. Buitrago;J. Goulet;D. Calello;James Perlotto;D. van Rhijn;E. Nash;Gerald Friedland;W. Hierholzer - 通讯作者:
W. Hierholzer
Investigating Social Network as Complex Network and Dynamics of User Activities
研究社交网络作为复杂网络和用户活动的动态
- DOI:
10.5120/ijca2015905952 - 发表时间:
2015 - 期刊:
- 影响因子:0
- 作者:
Hradesh Kumar;Sanjeev Kumar Yadav;Khanh Nguyen;D. Tran;Pinghui Wang;Wenbo He;Junzhou Zhao;Darren Quinn;Liming Chen;Maurice Mulvenna;R. Farahbakhsh;Xiao Han;Angel Cuevas;Noel Crespi;R. Serra;M. Villani;Luca Agostini;Fabrício Benevenuto;Tiago Rodrigues;Meeyoung Cha;Virgilio Almeida;Aniket Mahanti;Niklas Carlsson;A. Mahanti;M. Arlitt;Oana Goga;Howard Lei;S. Parthasarathi;Gerald Friedland;Putu Wuri Handayani - 通讯作者:
Putu Wuri Handayani
Gerald Friedland的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Gerald Friedland', 18)}}的其他基金
EDU: Teachers' Resources for Online Privacy Education (TROPE)
EDU:在线隐私教育教师资源 (TROPE)
- 批准号:
1419319 - 财政年份:2014
- 资助金额:
$ 10万 - 项目类别:
Standard Grant
I-Corps: Commercializing the Integration of Human and Artificial Intelligence for Large Scale Multimedia Analysis
I-Corps:将人类和人工智能集成商业化以进行大规模多媒体分析
- 批准号:
1339552 - 财政年份:2013
- 资助金额:
$ 10万 - 项目类别:
Standard Grant
BIGDATA: Small: DCM: DA: Collaborative Research: SMASH -- Scalable Multimedia content AnalysiS in a High-level language
大数据: 小: DCM: DA: 协作研究: SMASH - 使用高级语言进行可扩展多媒体内容分析
- 批准号:
1251276 - 财政年份:2013
- 资助金额:
$ 10万 - 项目类别:
Standard Grant
EAGER: Collecting Training Videos for Location Estimation with Mechanical Turk
EAGER:使用 Mechanical Turk 收集用于位置估计的培训视频
- 批准号:
1138599 - 财政年份:2011
- 资助金额:
$ 10万 - 项目类别:
Standard Grant
相似国自然基金
轮足人形机器人多模式运动规划与控制方法研究
- 批准号:62373217
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
颅颌面手术机器人辅助半面短小牵张成骨术的智能规划与交互协作研究
- 批准号:
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:
抛光机器人柔性变刚度并联执行器宏微协调运动规划与主被动柔顺控制
- 批准号:52305016
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
高密度建成环境生态空间韧性机理探析及协同规划响应
- 批准号:52308080
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
面向时空信号场探测的数据/模型混合驱动轨迹规划方法
- 批准号:62303054
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
Planning Grant: Developing capacity to attract diverse students to the geosciences: A public relations framework
规划补助金:培养吸引多元化学生学习地球科学的能力:公共关系框架
- 批准号:
2326816 - 财政年份:2024
- 资助金额:
$ 10万 - 项目类别:
Standard Grant
Planning: Advancing Discovery on a Sustainable National Research Enterprise
规划:推进可持续国家研究企业的发现
- 批准号:
2412406 - 财政年份:2024
- 资助金额:
$ 10万 - 项目类别:
Standard Grant
Planning: Artificial Intelligence Assisted High-Performance Parallel Computing for Power System Optimization
规划:人工智能辅助高性能并行计算电力系统优化
- 批准号:
2414141 - 财政年份:2024
- 资助金额:
$ 10万 - 项目类别:
Standard Grant
Planning: FIRE-PLAN: Exploring fire as medicine to revitalize cultural burning in the Upper Midwest
规划:FIRE-PLAN:探索火作为药物,以振兴中西部北部的文化燃烧
- 批准号:
2349282 - 财政年份:2024
- 资助金额:
$ 10万 - 项目类别:
Standard Grant
CC* Planning: Strengthening Central Michigan University's Cyberinfrastructure
CC* 规划:加强中央密歇根大学的网络基础设施
- 批准号:
2345749 - 财政年份:2024
- 资助金额:
$ 10万 - 项目类别:
Standard Grant