口話を併用する音声認識

使用口语进行语音识别

基本信息

  • 批准号:
    62608505
  • 负责人:
  • 金额:
    $ 0.64万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
  • 财政年份:
    1987
  • 资助国家:
    日本
  • 起止时间:
    1987 至 无数据
  • 项目状态:
    已结题

项目摘要

音声認識は実用化の域に達しつつあるが, 雑音の多い環境下での使用が困難であること, 類似音(とくに子音)の判別が依然難しいという問題がある. この問題を克服するため, 本研究では, 音声信号だけでなく唇の動きの情報も併用して音声認識を行なった.1.口形特徴の抽出単語を発生している時のビデノ画像から, 口の幅や高さなどの口形特徴が抽出された. このとき, 歯を含めた場合と含めない場合の2つに分けて処理を行なった.2.音声特徴・口形特徴併用による音声認識研究のステップの都合上, この場合の口形特徴は安定して求めることのできるX-Yトラッカを使用した.音声は4KH_2, 12ビットでサンプルされ, 12次までのLPCケプストラム係数およびLPC係数が各24次まで拡張され, 各0次を加えた50次元特徴と登録データ間の非線形時間伸縮を考慮した距離がDP法により計算された.一方, 話者の前方右約60度の位置に置いたX-Yトラッカ・カメラにより, 下唇の上下の動き, 前後の突き出し量が1/60秒毎に計測された. これらの特徴と登録データとの間の距離も同様に計算された.これらの二つの距離の重み和で単語の識別を行なった. 類似した10単語(KAMAやKANAなど)の認識率は, 音声特徴のみの場合84%, 音声特徴に口形特徴を加えた場合は90%に向上した.3.今後の課題口形特徴の効率的抽出法および音声特徴と口形特徴を合わせてDPマッチングを行なう方式を開発したい.
语音识别变得越来越实用,但是在嘈杂的环境中很难使用,并且仍然很难区分类似的声音(尤其是辅音)。为了克服这个问题,在这项研究中,不仅使用语音信号,而且还使用有关唇部运动的信息进行语音识别。1。当提取口腔形状特征时产生单词时,从视频图像中提取了口腔形状的特征,例如口腔宽度和高度。目前,该过程分为两类:有或没有牙齿。2。由于使用语音和口形特征的组合进行了语音识别研究的步骤,在这种情况下,使用X-Y跟踪器稳定地确定了口腔形状特征。将语音在4KH_2、12位采样,LPC CEPSTRUM系数和LPC系数最高为第12阶,扩展到第24阶。考虑到注册数据之间的非线性时间扩展和收缩,使用DP方法计算50维特征与注册数据之间的50维特征与注册数据之间的距离。另一方面,每1/60秒钟,使用X-Y跟踪器摄像机每1/60秒测量下唇的运动和前后的突起,位于扬声器右侧约60度。这些功能与注册数据之间的距离类似。使用这两个距离的权重总和来识别单词。仅语音功能,将10个相似单词的识别率提高到84%,而添加到语音功能的语音功能的90%。 3。未来的任务,我想开发一种有效的方法来提取口腔功能,并通过结合语音功能和口腔功能来提取DP匹配的方法。

项目成果

期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
田村 進一: 第35回(昭和62年後期)情報処理学会全国大会2M-3. 1587-1588 (1987)
Shinichi Tamura:第 35 届(1987 年末)日本信息处理学会全国会议 2M-3(1987 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
小川 均: 電子情報通信学会技術研究報告(人工知能と知識処理研究会). AI87-19. 9-16 (1987)
小川仁:IEICE 技术研究报告(人工智能和知识处理研究组)。AI87-19(1987)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Shinichi Tamura: Pattern Relognition. 21. (1988)
田村新一:模式重新登录。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
松岡 清利: 電子情報通信学会論文誌D. J70-D. 2167-2171 (1987)
松冈清俊:IEICE Transactions D. J70-D 2167-2171 (1987)
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

田村 進一其他文献

ループ型脳内通信回路モデルにおけるM系列の出現
循环型大脑通讯回路模型中M序列的出现
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    上村 拓矢,八木 康史,陳 延偉;田村 進一
  • 通讯作者:
    田村 進一

田村 進一的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('田村 進一', 18)}}的其他基金

人工生命集団における遊び心と多様な個性の発現
人工生命群体的俏皮性和多样化个性的表达
  • 批准号:
    12878060
  • 财政年份:
    2000
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
方向スケール空間フィルタリング法とその応用
定向尺度空间滤波方法及其应用
  • 批准号:
    99F00078
  • 财政年份:
    1999
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
MRIにおける体動アーチファクト除去ソフトの臨床応用システムの構築
MRI体动伪影去除软件临床应用系统的构建
  • 批准号:
    98F00221
  • 财政年份:
    1998
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
MRIにおける体動アーチファクト除去システム
MRI 中的身体运动伪影去除系统
  • 批准号:
    07558254
  • 财政年份:
    1995
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
時空間フィルタによる微小血管中の白血球追跡
使用时空滤波器追踪微血管中的白细胞
  • 批准号:
    07680942
  • 财政年份:
    1995
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
コネクショニスト・アプロ-チによる空間的推論・連想と物体理解
使用联结主义方法进行空间推理/关联和对象理解
  • 批准号:
    01633518
  • 财政年份:
    1989
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
コネクショニスト・アプローチによる空間的推論連想と物体理解
使用联结主义方法进行空间推理关联和对象理解
  • 批准号:
    63633516
  • 财政年份:
    1988
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
口形を併用する音声認識と文理解
利用口型进行语音识别和句子理解
  • 批准号:
    63608505
  • 财政年份:
    1987
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
推論手法の統合化と多元知識情報の取り扱いに関する研究
推理方法集成与多维知识信息处理研究
  • 批准号:
    60210017
  • 财政年份:
    1985
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Special Project Research
推論手法の統合化と多元知識情報の取り扱いに関する研究
推理方法集成与多维知识信息处理研究
  • 批准号:
    59218014
  • 财政年份:
    1984
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Special Project Research

相似海外基金

フォーカルスタック画像処理がもたらす撮像から表示処理までの利用価値の創出
创造焦点堆栈图像处理带来的从成像到显示处理的利用价值
  • 批准号:
    24KJ1962
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
ハニカム画素構造を有し3軸離散座標系を活用した画像処理系
具有蜂窝像素结构并采用三轴离散坐标系的图像处理系统
  • 批准号:
    24K14832
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
メタマテリアルによる撮像前多次元画像処理の実現
利用超材料实现成像前的多维图像处理
  • 批准号:
    24K02952
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
煙等の散乱媒質による視界不良現場を可視化するための画像処理技術の研究
研究图像处理技术,以可视化因烟雾等散射介质而导致能见度较差的场所
  • 批准号:
    24K01120
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
統計的画像処理と機械学習を併用した文化財のデジタル復元技術の基盤創出
利用统计图像处理和机器学习为文化财产数字修复技术奠定基础
  • 批准号:
    23K22020
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了