アクティブ視聴覚統合に関する研究
主动视听集成研究
基本信息
- 批准号:11J09496
- 负责人:
- 金额:$ 0.83万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for JSPS Fellows
- 财政年份:2011
- 资助国家:日本
- 起止时间:2011 至 2012
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
平成23年度は,話者が発話している区間を切り出す発話区間検出を行う際に,視覚・聴覚情報がどの程度有効であるかを因果ベイジアンネットワーク[1]を用いて推定する手法を提案した.平成24年度は,その推定にロボットの能動的な動作による影響を考慮するように拡張した.具体的には,能動的な動作としてロボットの移動を扱い,因果ベイジアンネットワークを用いて予測した結果から動作を生成する部分を含めた枠組みを構築した.ロボットの動作生成は,(1)現在の位置の近傍に離散グリッドを設定する,(2)離散グリッドの格子点上に移動した場合の発話区間検出性能の期待値を因果ベイジアンネットワークを用いて予測する,(3)期待値が最大となる点へ移動する,という3つのステップによりモデル化した.この提案手法を,全方位台車の上に上半身が設置されている台車ベースのヒューマノイドロボットHearboに実装し評価実験を行った.このロボットはマイクロホンアレイから聴覚情報を,カメラから視覚情報を取得する.また,台車のタイヤに取り付けられたエンコーダからロボットの位置情報を取得する.これらの情報を因果ベイジアンネットワークの入力となり,動作を生成する.評価では,部屋の中に話者が一人と雑音源が一つある状態を想定し,提案したアクティブ視聴覚統合の有効性を評価した.ロボットの初期位置から因果ベイジアンネットワークを用いて予測した最適な到達点までの間で複数の中間点を設定し,それらの点で発話区間検出性能実験を行った.まず,学習用データと評価データで同じ話者の場合の簡単な評価実験を行い,提案したアクティブ視聴覚統合が発話区間検出性能の向上に有効であることを示した.本手法では,従来は扱われなかった,動作による影響を予測するステップが含まれており,音声認識などロボット聴覚で研究されている様々なタスクへの応用が期待できる.[1]J.Pearl,"Causality:Models, Reasoning and Inference,"Cambridge University Press.
在2011年,我们提出了一种方法,以使用因果贝叶斯网络[1]估算视觉和听觉信息的有效性[1],以检测说话者说的语音间隔,并估计视觉和听觉信息有效的程度。 2012年,我们扩展了估计,以考虑机器人主动运动的影响。具体而言,我们创建了一个框架,其中包括使用因果贝叶斯网络预测的结果产生动作的零件。使用三个步骤对基于T的运动的运动产生进行建模:(1)将离散的网格设置在当前位置,(2)当移动到使用因果贝叶斯网络的离散网格的网格点时,预测说话间隔检测性能的期望值,(3)移动到预期值的最大值。这种提出的方法是在基于车的类人机器人赫尔博(Hearbo)上实现的,其上半身安装在全向车上,并进行了评估实验。该机器人是麦克风轴向推车。声学信息是从射线和相机的视觉信息中获得的。机器人的位置信息也是从附着在购车轮胎上的编码器获得的。此信息用作因果贝叶斯网络的输入,并生成动议。在评估中,我们假设房间中有一个扬声器和一个噪声源,并且评估了提出的主动视听整合的有效性。在机器人的初始位置和使用因果贝叶斯网络预测的最佳覆盖范围之间设置了多个中点。我们在这些点上进行了语音间隔的检测性能测试。首先,我们使用培训数据和评估数据对同一说话者进行了简单的评估实验,并表明所提出的主动视听整合可有效提高语音间隔的检测性能。该方法包括预测运动效果的步骤,该运动的影响(以前尚未处理过),并且可以预计将应用于机器人听力中研究的各种任务,例如语音识别。[1] J.Pearl,“因果关系:模型,推理和推理,”剑桥大学出版社。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
ロボットのための情報量レベルに基づくアクティブ視聴覚統合の検討
基于信息水平的机器人主动视听集成研究
- DOI:
- 发表时间:2011
- 期刊:
- 影响因子:0
- 作者:吉田尚水;中臺一博;吉田尚水;吉田尚水
- 通讯作者:吉田尚水
Active Audio-Visual Integration for Voice Activity Detection based on A Causal Bayesian Network
基于因果贝叶斯网络的主动视听集成语音活动检测
- DOI:
- 发表时间:2012
- 期刊:
- 影响因子:0
- 作者:Takami Yoshida;Kazuhiro Nakadai
- 通讯作者:Kazuhiro Nakadai
Audio-Visual Voice Activity Detection based on An Utterance State Transition Model
基于话语状态转移模型的视听语音活动检测
- DOI:
- 发表时间:2012
- 期刊:
- 影响因子:2
- 作者:Takami Yoshida
- 通讯作者:Takami Yoshida
ロボット聴覚のための因果モデルを用いたアクティブ視聴覚統合発話区間検出の検討
基于机器人听觉因果模型的主动视听集成语音区间检测研究
- DOI:
- 发表时间:2012
- 期刊:
- 影响因子:0
- 作者:吉田尚水;中臺一博
- 通讯作者:中臺一博
Audio-Visual Integration for Voice Activity Detection
用于语音活动检测的视听集成
- DOI:
- 发表时间:2012
- 期刊:
- 影响因子:0
- 作者:吉田尚水;中臺一博;吉田尚水
- 通讯作者:吉田尚水
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
吉田 尚水其他文献
Semi-Blind Infinite NMFを用いたロボットの 動作雑音抑圧手法の検討
基于半盲无限NMF的机器人运动噪声抑制方法研究
- DOI:
- 发表时间:
2013 - 期刊:
- 影响因子:0
- 作者:
手塚 太貴;吉田 尚水;中臺 一博 - 通讯作者:
中臺 一博
東日本大震災の経済的影響:阪神・淡路大震災との比較
东日本大地震的经济影响:与阪神淡路大地震的比较
- DOI:
- 发表时间:
2012 - 期刊:
- 影响因子:0
- 作者:
中臺 一博;インジュ ギョカン;吉田 尚水;中村 圭佑;永松伸吾 - 通讯作者:
永松伸吾
吉田 尚水的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似海外基金
精神疾患における視聴覚統合様式のメカニズムの探索
视听整合模式治疗精神疾病的机制探讨
- 批准号:
24KJ1262 - 财政年份:2024
- 资助金额:
$ 0.83万 - 项目类别:
Grant-in-Aid for JSPS Fellows
オンライン・コミュニケーションにおける視聴覚統合の時空間特性
网络传播中视听融合的时空特征
- 批准号:
23K22377 - 财政年份:2024
- 资助金额:
$ 0.83万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
ASDモデルマウスにおける視聴覚統合とその障害
ASD 模型小鼠视听整合及其损伤
- 批准号:
23K12938 - 财政年份:2023
- 资助金额:
$ 0.83万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
時間間隔知覚における多感覚情報統合過程とその脳内機序の解明
时间间隔知觉中多感官信息整合过程及其脑机制的阐明
- 批准号:
22KJ0456 - 财政年份:2023
- 资助金额:
$ 0.83万 - 项目类别:
Grant-in-Aid for JSPS Fellows
視覚経験に基づく顔の親近性がマルチモーダルな顔処理に与える影響の検討
基于视觉体验的人脸熟悉度对多模态人脸处理的影响
- 批准号:
22K13880 - 财政年份:2022
- 资助金额:
$ 0.83万 - 项目类别:
Grant-in-Aid for Early-Career Scientists