深層学習を利用した実環境下悲鳴検出システムの開発

使用深度学习在真实环境中开发尖叫检测系统

基本信息

  • 批准号:
    19K04935
  • 负责人:
  • 金额:
    $ 1.58万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2019
  • 资助国家:
    日本
  • 起止时间:
    2019-04-01 至 2024-03-31
  • 项目状态:
    已结题

项目摘要

2021年度まで,【課題1】の「劣悪な環境下における高い検出性能の達成」および【課題3】の「小型PCやモバイル端末への実装」に向けた演算量の削減に取り組み,一定の成果を達成することができた.しかしながら,【課題2】である「悲鳴とその類似音との識別精度向上」については十分な成果を上げることができていない状況であった.まず,【課題3】の実装状況については,Raspberry Pi 4 model Bへの実装が完了し,実時間でWave-U-Netを用いた悲鳴強調が可能であることを確認した.次に,【課題2】の悲鳴と類似音の識別精度向上については,2-stage Wave-U-Netについて検討した.これまでは雑音と悲鳴を分離するための深層ネットワーク(Wave-U-Net)を学習させ,当該ネットワークを利用し雑音重畳悲鳴から悲鳴のみを分離していたが,類似音は悲鳴と見なされ十分に分離することができていなかった.そこで,分離された悲鳴と類似音を分離するための深層ネットワーク(2-stage Wave-U-Net)を新たに学習させた.当該ネットワークに対し様々な類似音によるシミュレーションを実施したところ,平均-14dB程度となり高い類似音除去効果が得られた.一方,実運用した場合を考えると,類似音が常に混入するとは限らないため,同ネットワークに類似音が重畳されていない悲鳴を入力し,劣化の程度を測定した.その結果,約0.5dB程度の劣化に抑えられていることが確認され,2-stage Wave-U-Netの有効性が明らかとなった.2-stage Wave-U-Netの小型PCやモバイル端末への実装が未完了の状態であり,次年度の早期に実装し,実運用する予定である.
在2021财年之前,我们能够通过减少[项目1]的计算量,“在贫困环境中实现高检测性能”和[项目3],“在小型PC和移动设备上实施它”,从而实现了某些结果。但是,关于[问题2]缺乏足够的结果,“尖叫声和类似声音之间的歧视准确性提高了”。首先,关于问题3的实施状态,我们确认了Raspberry Pi 4模型B上的实现已完成,并且可以实时使用Wave-U-NET强调尖叫声。接下来,我们讨论了2阶段的Wave-U-NET,以提高问题2中的尖叫声和类似声音之间歧视的准确性。直到现在,训练了一个深层网络(Wave-U-NET)来分开噪音和尖叫声,并使用此网络将尖叫声与噪音补充的尖叫声分开,但是类似的声音被认为是尖叫声,并且还没有足够的尖叫声。因此,我们新学到了一个2阶段的Wave-U-NET,以分开分离的尖叫声和类似的声音。当网络上执行各种类似的声音时,平均值约为-14dB,导致消除相似声音的高效果。另一方面,考虑到实际操作,并不总是混合使用类似的声音,因此我们输入了一个尖叫声,在网络上不会叠加类似的声音并测量劣化程度。结果,已确认它被抑制至约0.5dB的恶化,并且揭示了2阶段波-U-NET的有效性。在小型PC和移动设备上实施2阶段Wave-U-NET是不完整的,并计划在下一个财政年度初实施,并在实践中使用。

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Scream Enhancement using Wave-U-Net
使用 Wave-U-Net 增强尖叫
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Riku Kasai;Noboru Hayasaka;Takuya Futagami;Yoshikazu Miyanaga
  • 通讯作者:
    Yoshikazu Miyanaga
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

早坂 昇其他文献

エネルギー特徴量を選択的に用いた音声区間検出
有选择地使用能量特征的语音区间检测
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    若杉 淳一郎;早坂 昇;飯國 洋二
  • 通讯作者:
    飯國 洋二
基本周波数の分散に着目した悲鳴信頼度に関する検討
关注基频色散的尖叫可靠性研究
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Hiroyuki Sakuno;Noboru Hayasaka;Youji Iiguni;早坂 昇
  • 通讯作者:
    早坂 昇

早坂 昇的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('早坂 昇', 18)}}的其他基金

難聴児向けモバイル端末用発話訓練アプリケーションの開発
听力损失儿童移动终端语音训练应用程序的开发
  • 批准号:
    23K02623
  • 财政年份:
    2023
  • 资助金额:
    $ 1.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
高等学校新指導要領による領域別指導の実践的研究-平面・空間ベクトルの一貫指導-
基于高中新课程纲领的针对性教学实践研究——平面与空间向量的一致性教学——
  • 批准号:
    X00220----591301
  • 财政年份:
    1980
  • 资助金额:
    $ 1.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了