口話を併用する音声認識

使用口语进行语音识别

基本信息

  • 批准号:
    62608505
  • 负责人:
  • 金额:
    $ 0.64万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
  • 财政年份:
    1987
  • 资助国家:
    日本
  • 起止时间:
    1987 至 无数据
  • 项目状态:
    已结题

项目摘要

音声認識は実用化の域に達しつつあるが, 雑音の多い環境下での使用が困難であること, 類似音(とくに子音)の判別が依然難しいという問題がある. この問題を克服するため, 本研究では, 音声信号だけでなく唇の動きの情報も併用して音声認識を行なった.1.口形特徴の抽出単語を発生している時のビデノ画像から, 口の幅や高さなどの口形特徴が抽出された. このとき, 歯を含めた場合と含めない場合の2つに分けて処理を行なった.2.音声特徴・口形特徴併用による音声認識研究のステップの都合上, この場合の口形特徴は安定して求めることのできるX-Yトラッカを使用した.音声は4KH_2, 12ビットでサンプルされ, 12次までのLPCケプストラム係数およびLPC係数が各24次まで拡張され, 各0次を加えた50次元特徴と登録データ間の非線形時間伸縮を考慮した距離がDP法により計算された.一方, 話者の前方右約60度の位置に置いたX-Yトラッカ・カメラにより, 下唇の上下の動き, 前後の突き出し量が1/60秒毎に計測された. これらの特徴と登録データとの間の距離も同様に計算された.これらの二つの距離の重み和で単語の識別を行なった. 類似した10単語(KAMAやKANAなど)の認識率は, 音声特徴のみの場合84%, 音声特徴に口形特徴を加えた場合は90%に向上した.3.今後の課題口形特徴の効率的抽出法および音声特徴と口形特徴を合わせてDPマッチングを行なう方式を開発したい.
语音识别已达到实际应用阶段,但仍存在诸如在嘈杂环境中使用困难以及难以区分相似声音(尤其是辅音)等问题。为了克服这个问题,在本研究中,我们使用不仅是音频信号,还包括嘴唇运动信息 1. 在生成单词时从视频图像中提取嘴型特征。提取了嘴的宽度和高度等嘴形特征,此时处理分为包含牙齿时和不包含牙齿时两种情况。 2.利用语音特征和嘴部相结合的语音识别研究。形状特征由于这一步的方便,我们使用了X-Y跟踪器,可以稳定获取嘴形特征。音频以4KH_2、12位采样,将LPC倒谱系数扩展到12阶,并将LPC系数扩展到24阶,并使用DP方法计算注册数据与包含0阶的50维特征之间的距离。在受试者前方右60度处,每隔1/60秒测量下唇的垂直运动和前后突出量。以同样的方式计算这些特征和注册数据之间的距离。使用这两个距离的加权和来识别单词。10个相似单词(KAMA、KANA等)的识别率提高到84%仅使用特征时,在语音特征中添加口型特征时达到90%。3.未来问题我们将开发一种提取口型特征的有效方法以及一种使用语音特征和口型特征进行DP匹配的方法。来开发它。

项目成果

期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
田村 進一: 第35回(昭和62年後期)情報処理学会全国大会2M-3. 1587-1588 (1987)
Shinichi Tamura:第 35 届(1987 年末)日本信息处理学会全国会议 2M-3(1987 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
小川 均: 電子情報通信学会技術研究報告(人工知能と知識処理研究会). AI87-19. 9-16 (1987)
小川仁:IEICE 技术研究报告(人工智能和知识处理研究组)。AI87-19(1987)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Shinichi Tamura: Pattern Relognition. 21. (1988)
田村新一:模式重新登录。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
松岡 清利: 電子情報通信学会論文誌D. J70-D. 2167-2171 (1987)
松冈清俊:IEICE Transactions D. J70-D 2167-2171 (1987)
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

田村 進一其他文献

ループ型脳内通信回路モデルにおけるM系列の出現
循环型大脑通讯回路模型中M序列的出现
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    上村 拓矢,八木 康史,陳 延偉;田村 進一
  • 通讯作者:
    田村 進一

田村 進一的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('田村 進一', 18)}}的其他基金

人工生命集団における遊び心と多様な個性の発現
人工生命群体的俏皮性和多样化个性的表达
  • 批准号:
    12878060
  • 财政年份:
    2000
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
方向スケール空間フィルタリング法とその応用
定向尺度空间滤波方法及其应用
  • 批准号:
    99F00078
  • 财政年份:
    1999
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
MRIにおける体動アーチファクト除去ソフトの臨床応用システムの構築
MRI体动伪影去除软件临床应用系统的构建
  • 批准号:
    98F00221
  • 财政年份:
    1998
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
MRIにおける体動アーチファクト除去システム
MRI 中的身体运动伪影去除系统
  • 批准号:
    07558254
  • 财政年份:
    1995
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
時空間フィルタによる微小血管中の白血球追跡
使用时空滤波器追踪微血管中的白细胞
  • 批准号:
    07680942
  • 财政年份:
    1995
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
コネクショニスト・アプロ-チによる空間的推論・連想と物体理解
使用联结主义方法进行空间推理/关联和对象理解
  • 批准号:
    01633518
  • 财政年份:
    1989
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
コネクショニスト・アプローチによる空間的推論連想と物体理解
使用联结主义方法进行空间推理关联和对象理解
  • 批准号:
    63633516
  • 财政年份:
    1988
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
口形を併用する音声認識と文理解
利用口型进行语音识别和句子理解
  • 批准号:
    63608505
  • 财政年份:
    1987
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
推論手法の統合化と多元知識情報の取り扱いに関する研究
推理方法集成与多维知识信息处理研究
  • 批准号:
    60210017
  • 财政年份:
    1985
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Special Project Research
推論手法の統合化と多元知識情報の取り扱いに関する研究
推理方法集成与多维知识信息处理研究
  • 批准号:
    59218014
  • 财政年份:
    1984
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Special Project Research

相似海外基金

Uncovering Mechanisms of Racial Inequalities in ADRD: Psychosocial Risk and Resilience Factors for White Matter Integrity
揭示 ADRD 中种族不平等的机制:心理社会风险和白质完整性的弹性因素
  • 批准号:
    10676358
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
フォーカルスタック画像処理がもたらす撮像から表示処理までの利用価値の創出
创造焦点堆栈图像处理带来的从成像到显示处理的利用价值
  • 批准号:
    24KJ1962
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
ハニカム画素構造を有し3軸離散座標系を活用した画像処理系
具有蜂窝像素结构并采用三轴离散坐标系的图像处理系统
  • 批准号:
    24K14832
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
SBIR Phase I: Lightweight Learning-based Camera Image Signal Processing (ISP) for Photon-Limited Imaging
SBIR 第一阶段:用于光子限制成像的轻量级基于学习的相机图像信号处理 (ISP)
  • 批准号:
    2335309
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Standard Grant
メタマテリアルによる撮像前多次元画像処理の実現
利用超材料实现成像前的多维图像处理
  • 批准号:
    24K02952
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了