音声および顔情報の融合解析に基づく対話型人物認識システムに関する研究
基于语音与面部信息融合分析的交互式人物识别系统研究
基本信息
- 批准号:06780358
- 负责人:
- 金额:$ 0.64万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Encouragement of Young Scientists (A)
- 财政年份:1994
- 资助国家:日本
- 起止时间:1994 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究では、音声の個人的特徴と発話時の顔の特徴を高精度で抽出し、総合的あるいは選択的に活用し、端末を操作する人物を認識するシステムの開発を研究目的とする。具体的には、複数の視覚センサと音響センサを設置した視聴覚融合センシングシステムの開発,音声生成過程の解析に基づく個人性情報の抽出を研究目的とする。研究成果は以下の通りである。1.視聴覚融合センシングシステムの開発:端末に複数のビデオカメラとマイクロホンを設置した視聴覚融合センシングシステムを開発する。まず、4本のマイクロホンを用いて音源(口唇)位置の推定を行う手法を開発した。本手法はマイクロホンと音源との距離の差に伴う信号の位相差をマイクロホン信号の相互相関関数より推定し、音源位置を同定する。端末から50cm離れた音源位置を誤差2.4cm以内で推定することに成功した。次に音源位置が既知である場合、周囲雑音を含むマイクロホン信号から音源信号を抽出する適応フィルタを開発し、周囲雑音中より話者の発生音抽出のS/Nを向上させた。2.カラー顔画像による口唇位置の推定:カラー顔画像より口唇の位置を推定する手法を提案した。本手法では口唇が肌の色より赤みがかっている点に着目し、カラー顔画像のHSI変換により口唇部の位置を推定する。被験者6名の顔画像を用いて口唇位置推定実験を行った結果、100%の識別結果が得られた。3.音声生成過程の解析に基づく個人性情報の抽出:磁気共鳴映像法(MRI)により歯冠部を含む声道形状の精密測定に初めて成功し、摩擦子音声時の声道形状データを得ることができた。また、子音の明瞭度を決定する舌-口蓋接触面の垂直応力の計測に成功した。さらに声道及び鼻腔の音響特性を推定し、実音声の分析結果と一致すること、このような音声生成過程の解析より得られた特徴量が、個人識別に有効なパラメータであることを示した。
在这项研究中,研究的目的是开发一种系统,以高度或有选择性地提取语音时的个人特征和面部特征,以识别操作终端的人。具体而言,研究的目的是开发具有多个视觉传感器和声传感器的受众传感系统,并根据语音生成过程的分析提取个人信息。研究结果如下。 1。视听融合传感系统的开发:开发一个视听融合传感系统,并在终端上具有多个摄像机和麦克风。首先,我们开发了一种使用四个麦克风估算声源(LIP)位置的方法。在这种方法中,根据麦克风信号的相互关联关节函数估计信号引起的信号的相位差,并确定了声源位置。距端子50厘米的声源位置成功地估计了2.4 cm的误差。接下来,如果知道声源位置,则会开发出从包含周围噪声的麦克风信号中提取声源信号的自适应滤波器,并从周围的噪声中提高了扬声器扬声器的S/N。 2。嘴唇的颜色面图像估计:提出一种估算颜色面图像的唇部位置的方法。在这种方法中,嘴唇比肤色更红,嘴唇的位置是通过颜色面部图像的HSI转换来估计的。由于使用六个受试者的面部图像估算唇部位置的实验,获得了100%的识别结果。 3.基于音频生成过程的分析的个人信息提取:磁共振视频方法(MRI)成功地测量了包括皇冠在内的人声形状,并在摩擦声音时获得声音数据。我能够做到。此外,它成功地测量了舌头的垂直应力和确定辅音清晰度的中央接触表面。此外,估计了声音和鼻腔的声音特征,它表明对实际声音的分析,并且从这种音频生成过程的分析中获得的特征是一个有效的参数。
项目成果
期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
松村雅史: "カセンサー体型人工口蓋床による舌-口蓋接触面の垂直応力分布の計測" 電気学会論文誌(C). 114-C. 1073-1077 (1994)
Masashi Matsumura:“使用 Cassensor 型人工腭底测量舌腭接触面的垂直应力分布”,日本电气工程师学会汇刊 (C) 114-C 1073-1077 (1994)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
松村雅史: "MRIによる歯冠部を含む声道と鼻腔の3次元形状の計測" 電気学会論文誌(C). 114-C. 1067-1072 (1994)
Masashi Matsumura:“使用 MRI 测量声道和鼻腔(包括牙冠)的三维形状”,日本电气工程师学会汇刊 (C) 114-1072 (1994)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
吉田正樹: "手の運動機能を取り入れたディジタル制御方式にる筋電義手の開発" バイオメカニズム. 12. 303-311 (1994)
Masaki Yoshida:“使用结合手部运动功能的数字控制系统开发肌电假手”生物机制。12. 303-311 (1994)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
松村 雅史其他文献
喉頭マイクロフォンを用いた嚥下回数測定デバイスの開発〜信頼性の検討
使用喉部麦克风的吞咽频率测量装置的开发 - 可靠性检查
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
Makoto Enomoto;Jun Ohya;松村 雅史 - 通讯作者:
松村 雅史
口腔咽喉音・SpO2センサ一体型ネックバンドデバイスによる無呼吸・低呼吸の検出
使用集成口咽音和 SpO2 传感器的颈带设备检测呼吸暂停和呼吸不足
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
櫃田 毅;西庵 良彦;宮本 孝;池田 志帆;石村 仁志;松村 雅史;山本卓矢,酒井徳昭,奥村英史,松村雅史 - 通讯作者:
山本卓矢,酒井徳昭,奥村英史,松村雅史
廃用性委縮防止のための喉頭マイクロフォンを用いた嚥下回数計測システム
使用喉部麦克风的吞咽频率测量系统可防止废用性萎缩
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
山下 光美;松村 雅史 - 通讯作者:
松村 雅史
ネックバンド型血圧急変モニタリングデバイスの基礎研究~透析治療中における新たな生体情報の無拘束モニタリング~
颈带式血压突变监测装置的基础研究-透析治疗过程中生物信息的新型无拘束监测-
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
櫃田 毅;西庵 良彦;宮本 孝;池田 志帆;石村 仁志;松村 雅史 - 通讯作者:
松村 雅史
松村 雅史的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('松村 雅史', 18)}}的其他基金
ネックバンド型スマートセンサによる日常生活動作時の連続血圧計測と血管障害発症予防
使用颈带式智能传感器在日常活动中连续测量血压并预防血管疾病
- 批准号:
24K15853 - 财政年份:2024
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
音声と顔画像の融合解析に基づく対話型人物認識システムに関する研究
基于语音与人脸图像融合分析的交互式人物识别系统研究
- 批准号:
07780379 - 财政年份:1995
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
3次元声道モデルと音声の並列分散処理による個人性情報の抽出と対話型話者認識
使用 3D 声道模型和并行分布式语音处理提取个人信息和交互式说话人识别
- 批准号:
04750366 - 财政年份:1992
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
磁気共鳴映像法(MRI)による三次元声道形状の解析と音声の個人性情報の抽出
利用磁共振成像(MRI)分析三维声道形状并提取个体语音信息
- 批准号:
03750313 - 财政年份:1991
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
音声生成過程での特徴とニューラルネットワークを用いた話者認識システムの開発
利用语音生成过程和神经网络中的特征开发说话人识别系统
- 批准号:
01780057 - 财政年份:1989
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
音源定位の応用による防犯カメラ音声からの発話者特定技術の開発
应用声源定位开发安全摄像头音频说话人识别技术
- 批准号:
24H02551 - 财政年份:2024
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Encouragement of Scientists
Age and hearing loss effects on subcortical neural encoding
年龄和听力损失对皮层下神经编码的影响
- 批准号:
10652139 - 财政年份:2023
- 资助金额:
$ 0.64万 - 项目类别:
神経グリア連関を介したシナプス制御の聴覚情報処理における意義の解明
通过神经胶质连接阐明突触控制在听觉信息处理中的重要性
- 批准号:
23K06333 - 财政年份:2023
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
音源定位技術で測る鳥類の歌と繁殖行動理解への展開
利用声源定位技术理解鸟鸣和繁殖行为的进展
- 批准号:
23K13968 - 财政年份:2023
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
CRCNS:US-lsrael Research Proposal: To Elucidate Fundamental Mechanisms of Transformed Saliency Map to
CRCNS:美国-以色列研究提案:阐明显着图转变的基本机制
- 批准号:
10831116 - 财政年份:2023
- 资助金额:
$ 0.64万 - 项目类别: