音素の精密な特徴抽出に基づいた音声認識方法の研究
基于音素精确特征提取的语音识别方法研究
基本信息
- 批准号:62608502
- 负责人:
- 金额:$ 0.64万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research on Priority Areas
- 财政年份:1987
- 资助国家:日本
- 起止时间:1987 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
1.音声の音響処理と音素の特徴抽出 基本周派数間隔標本化に基づく音声パワー, スペクトル包絡分析法によって子音のスペクトル分析を行った. 線形予測分析と比較して, 特に, 鼻子音の場合に認識精度が向上することを確認した.2.音素の特徴の統計処理と特徴の抽出 より厳密に定義したセグメンテーションとして調音事象の自動抽出を行った. 我々は次の3方式を試みた. (1)知識光学的手法に基づく方式 仮定(破裂子音, 鼻子音など)をたて, その仮定の証明を試みる. 試行錯誤の結果得られた知識を順次付加し, 知識を体系化したり修正したりする. このための枠組みは, Prolog言語のバック・トラック機構を利用して実現している. (2)音声波形から得られた規則に基づく方式 視察によって破裂時点を決定する過程を規則として記述することを試みている. ここで抽出した規則を適用したときの有効性を評価した. (3)学習に基づく方式 短時間パワーの変化の時系列を入力して与えたときに破裂時点で出力するニューラルネットワークを構成した.3.音素の識別理論の構築 多群パターンの認識で, すべての対について2群間の識別を行い, この結果を用いて多群への識別を行なう認識方法をすでに提案している. この対識別の理論のなかでの変数選択の効果と無効な対識別が最終結果に及ぼす影響について考察した. こうしてミニマックス法を用いることの根拠を明らかにすることができた.4.音素識別機構の簡略化 我々は, 手軽に高精度の音声入出力が行なえる装置としてPCMプロセッサとパーソナルコンピュータを接続した実時間音声入出力システムを製作した. 音声信号処理の高速化のためにパーソナルコンピュータと接続できるディジタル・シグナル・プロセッサ・ボードを開発した.
1。语音的声学处理和音素的特征提取。基于基本间隔的采样,使用语音能力和光谱包络分析对辅音进行了光谱分析。与线性预测分析相比,我们确认尤其是鼻音辅音可以提高识别精度。 2。音素特征的统计处理和特征的提取。将自动发音事件提取为更严格定义的分割。我们尝试了以下三种方法:(1)基于知识光学方法的方法。做出了假设(破裂的辅音,鼻辅音等),并证明了假设。通过反复试验获得的知识将接一个地添加,并且知识被系统化和修改。使用序言语言的回溯机制来实现此框架。 (2)基于从语音波形获得的规则的方法。我们试图描述通常通过检查确定破裂点的过程。我们评估了应用提取规则时该过程的有效性。 (3)基于学习的方法,当输入并给出短期功率变化的时间序列时,会输出破裂点的神经网络。3。音素识别理论的构建为了识别多个组,我们已经提出了一种使用结果来识别多个组的识别方法。我们检查了可变选择在该对识别理论中的影响以及无效对识别对最终结果的影响。通过这种方式,我们能够阐明使用最小最大方法的基础4。简化音素识别机制,我们创建了一个实时语音输入/输出系统,该系统将PCM处理器和个人计算机连接为可以轻松执行高精度语音输入/输出的设备。为了加快音频信号处理,我们已经开发了一个可以连接到个人计算机的数字信号处理器板。
项目成果
期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Shigeyoshi Kitazawa and J.P.Tubach: Proc. of Eupecon Conferance on Sperch Technology. 91-94 (1987)
Shigeyoshi Kitazawa 和 J.P.Tubach:Proc。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
野々山 秀文 北澤茂良: 日本音響学会講演論文集. 91-92 (1987)
Hidefumi Nonoyama 和 Shigeru Kitazawa:日本声学学会会议记录 91-92 (1987)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
北澤 茂良其他文献
発話行動のマルチモーダル記述による幼児の発達過程観察(コミュニケーション・対話,第9回音声言語シンポジウム)
使用言语行为的多模态描述观察幼儿的发展过程(沟通/对话,第九届口语研讨会)
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
笠見 朋彦;桐山 伸也;竹林 洋一;北澤 茂良 - 通讯作者:
北澤 茂良
北澤 茂良的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('北澤 茂良', 18)}}的其他基金
聴覚モデルに基づく新しい人工内耳による音声・音楽信号処理の研究
基于听觉模型的新型人工耳蜗的语音和音乐信号处理研究
- 批准号:
21650036 - 财政年份:2009
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
聴覚モデルに基づく新しい人工内耳の音声・音楽情報処理の研究
基于听觉模型的新型人工耳蜗语音和音乐信息处理研究
- 批准号:
19650038 - 财政年份:2007
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Exploratory Research
聴覚モデルに基づく新しい人工内耳システムの研究
基于听觉模型的新型人工耳蜗系统研究
- 批准号:
17650049 - 财政年份:2005
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Exploratory Research
人工内耳のスピーチプロセッサのための新しい信号処理方式の評価
人工耳蜗语音处理器新信号处理方法的评估
- 批准号:
04F04287 - 财政年份:2004
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for JSPS Fellows
韻律コーパスとその作成自動化
韵律语料库及其创建的自动化
- 批准号:
12132204 - 财政年份:2000
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
聴覚末梢系の生理モデルに基づく新しい人工内耳システムの研究
基于听觉外围系统生理模型的新型人工耳蜗系统研究
- 批准号:
06680351 - 财政年份:1994
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
音素の精密な特徴抽出に基づいた音声認識方法の研究
基于音素精确特征提取的语音识别方法研究
- 批准号:
63608504 - 财政年份:1988
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
日本語無声破裂子音の破裂区間の特徴の抽出に関する研究
日语清爆破辅音爆破音程特征提取研究
- 批准号:
X00210----575230 - 财政年份:1980
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
空間における自己の姿勢をヒトが認識可能な音の要素の解明
阐明使人类能够识别自己在空间中的姿势的声音元素
- 批准号:
24K15730 - 财政年份:2024
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Research and Production of a Manual on English Phoneme Recognition for International Students
留学生英语音素识别手册的研究与制作
- 批准号:
23K12201 - 财政年份:2023
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
ハワイ・クレオールにおける視覚的語彙認識―ニ言語変種併用の及ぼす影響―
夏威夷克里奥尔语中的视觉词汇识别:使用双语变体的效果
- 批准号:
21K00506 - 财政年份:2021
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
日本語と外国語との音声の違い等に気付く活動は,音素単位で行うべきか
关注日语和外语的发音差异的活动是否应该以音素为单位进行?
- 批准号:
21K00680 - 财政年份:2021
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
音韻認識と形態素認識に基づく英語の「語の読み書き」指導を通した小中接続
基于语音意识和形态意识的英语“单词读写”教学连接中小学
- 批准号:
21K00790 - 财政年份:2021
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Scientific Research (C)