音素の精密な特徴抽出に基づいた音声認識方法の研究
基于音素精确特征提取的语音识别方法研究
基本信息
- 批准号:63608504
- 负责人:
- 金额:$ 0.96万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research on Priority Areas
- 财政年份:1988
- 资助国家:日本
- 起止时间:1988 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
1.音響処理機構の研究に関して。線形予測分析法の分析次数を変更したときの判別率を破裂子音、鼻子音について求めた。その結果、破裂子音については17次以下では認識率が低くなるが、17次以上に増やしてもあまり改善されない。鼻子音については19次が最適であった。聴覚フィルターモデルをシミュレートするプログラムの開発を行なった。このモデルを用いた子音の判別率について今後実験を行なう予定である。2.調音事象の自動検出に関して。当初考えていたエキスパートシステムの手法と並行して、ニューラル・ネットによる手法について試み、音声パワーの傾斜係数および、LPCスペクトルを入力とするとき、未学習話者の有声破裂子音に関して/b/および/d/では100%、/g/については92%が±3ms以内の精度で検出できた。3.弁別的特徴の自動認識への適用に関して。本年度は音響音声変換に弁別素性レベルを導入することについて、新しい素性モデルを提案した。このモデルは、音素、異音、素性、音響パラメータの各レベルを導入する。音響パラメータの有限個のメンバーは階層構造を成し、発話時に生起する代償作用をある程度予測する。素性は複数の音響パラメータの部分集合から成る。人間の聴覚機構の特性に基づいて、素性間に階層構造を設定し、音韻環境によって異音に生起する素性の脱落をある程度予測する。素性は音素ではなく異音と多対多の対応関係にあるとする。4.音素の特徴の言語間の非核に関して。破裂子音/p,t,k,b,d,g/を対象として破裂の位置や強さ、ホルマント等スペクトログラムから抽出できる音響的特徴について日仏二か国語間で対照を行なった。日本語と対応するフランス語の音節の特徴のほとんどが共通であることが分かった。しかし、日本語で欠落している「チ、ツ、ヂ(ジ)、ヅ(ズ)」に対応した歯茎音/t,d/の特徴の相違は顕著に認められた。
1。关于声学处理机制的研究。确定破裂辅音和鼻辅音的线性预测分析分析顺序时的判别率。结果,破裂的辅音的识别率低于第17阶,但是将率提高到第17阶或更高的率并没有太大改善。对于鼻辅音,第19阶是最佳的。我们开发了一个程序来模拟听觉过滤器模型。我们计划将来对使用此模型进行有关辅音的判别率进行实验。 2。关于发音事件的自动检测。与我们最初考虑的专家系统技术并联,我们尝试了一种神经网技术,当我们使用语音功率和LPC频谱的坡度系数作为输入时,我们能够以 /b /and /d /g /g的准确性检测 /b /and /d /g /g /g /g /g /g /g /g /g /g /g /g /g /g /g /g /g /g /g /g /g /g /g /g。 3。关于将歧视特征应用于自动识别。今年,我们提出了一个新功能模型,用于将判别功能水平引入声音转换。该模型介绍了音素,奇怪的声音,身份和声学参数的水平。声学参数的成员数量有限,形成了分层结构,在某种程度上预测了语音过程中发生的补偿性效应。身份由多个声学参数的子集组成。基于人类听觉机制的特征,在特征之间设置了层次结构,并且在某种程度上预测了由于语音环境而导致的奇怪声音中发生的特征下降。让我们假设身份不是音素,而是与奇怪声音的多一对信件。 4。关于音素特征的语言间无核化。我们将两种日语和法语语言在破裂辅音/ p,t,k,b,d,g/ g/ for中的破裂位置和强度以及可以从增强仪频谱图中提取的声学特征进行了比较。已经发现,日语的大多数音节特征和相应的法语单词很常见。但是,牙龈声音 / t,d /对应于日语中缺少的“ chi,tsu,ji,zu”的特征的差异是显着的。
项目成果
期刊论文数量(16)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
M.Dantsuji: A bstracts of the Sixth Int.Phonology heeting. 25. 25 (1988)
M.Dantsuji:第六届国际音系学会议摘要。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
北澤、児島、堂下: 電子情報通信学会論文誌. J72-4. 41-48 (1989)
Kitazawa、Kojima、Doshita:电子、信息和通信工程师协会学报 J72-48 (1989)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
S.Kitazawa;M.Fourati;S.Ichikawa: J.ASA. Sup.184. S59 (1988)
S.Kitazawa;M.Fourati;S.Ichikawa:J.ASA。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
北澤: 電子情報通信学会 音声研究会資料. SP88-32. 9-16 (1988)
北泽:IEICE 语音研究组材料 SP88-32 (1988)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
北澤 茂良其他文献
発話行動のマルチモーダル記述による幼児の発達過程観察(コミュニケーション・対話,第9回音声言語シンポジウム)
使用言语行为的多模态描述观察幼儿的发展过程(沟通/对话,第九届口语研讨会)
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
笠見 朋彦;桐山 伸也;竹林 洋一;北澤 茂良 - 通讯作者:
北澤 茂良
北澤 茂良的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('北澤 茂良', 18)}}的其他基金
聴覚モデルに基づく新しい人工内耳による音声・音楽信号処理の研究
基于听觉模型的新型人工耳蜗的语音和音乐信号处理研究
- 批准号:
21650036 - 财政年份:2009
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
聴覚モデルに基づく新しい人工内耳の音声・音楽情報処理の研究
基于听觉模型的新型人工耳蜗语音和音乐信息处理研究
- 批准号:
19650038 - 财政年份:2007
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Exploratory Research
聴覚モデルに基づく新しい人工内耳システムの研究
基于听觉模型的新型人工耳蜗系统研究
- 批准号:
17650049 - 财政年份:2005
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Exploratory Research
人工内耳のスピーチプロセッサのための新しい信号処理方式の評価
人工耳蜗语音处理器新信号处理方法的评估
- 批准号:
04F04287 - 财政年份:2004
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for JSPS Fellows
韻律コーパスとその作成自動化
韵律语料库及其创建的自动化
- 批准号:
12132204 - 财政年份:2000
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
聴覚末梢系の生理モデルに基づく新しい人工内耳システムの研究
基于听觉外围系统生理模型的新型人工耳蜗系统研究
- 批准号:
06680351 - 财政年份:1994
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
音素の精密な特徴抽出に基づいた音声認識方法の研究
基于音素精确特征提取的语音识别方法研究
- 批准号:
62608502 - 财政年份:1987
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
日本語無声破裂子音の破裂区間の特徴の抽出に関する研究
日语清爆破辅音爆破音程特征提取研究
- 批准号:
X00210----575230 - 财政年份:1980
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
脳神経疾患による構音障害を克服するための,音声認識および音声合成AIシステムの開発
开发语音识别与语音合成AI系统,克服脑神经疾病引起的构音障碍
- 批准号:
24K10630 - 财政年份:2024
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
画像認識と音声認識の複合AIによる災害状況認識ユニットの基礎研究
图像识别与语音识别相结合的AI灾情识别单元基础研究
- 批准号:
23K23017 - 财政年份:2024
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
画像・音声認識と料理データベースによる食事記録システム開発、及び疫学研究での応用
基于图像/语音识别和烹饪数据库的用餐记录系统的开发及其在流行病学研究中的应用
- 批准号:
23K20170 - 财政年份:2024
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
非母語話者のスマートフォン音声認識機能での誤認識傾向を考慮した発音学習システム
使用智能手机语音识别功能,考虑到非母语人士的误识别倾向的发音学习系统。
- 批准号:
24K06231 - 财政年份:2024
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
自動音声認識を利用したbilingual speech-to-textシステム構築と授業分析への応用
自动语音识别双语语音转文本系统的构建及其在课程分析中的应用
- 批准号:
24K04125 - 财政年份:2024
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Scientific Research (C)