音声知覚特性の解析に対する音声認識技術の適用
应用语音识别技术分析语音感知特征
基本信息
- 批准号:18652040
- 负责人:
- 金额:$ 2.11万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Exploratory Research
- 财政年份:2006
- 资助国家:日本
- 起止时间:2006 至 2008
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
劣化させた音声を聞き取る時の知覚特性と、音声認識器での認識結果を対比させることにより、人間の音声言語知覚の特性を数理的に定量化することを目的としている。本年度は、H19年度に収集した人間の知覚特性データと対比するために、同一の単語音声データ(FW03)を用いて、音声認識実験をH18年度に行ったものより改善して実施した。まず認識系を最も標準的なHTK(http://htk.eng.cam.ac.uk/)とした。また、人間の知覚実験に用いた1話者分だけでなく、FW03中の他の話者に関しても、音韻ラベルを自動的に付け、学習データを1話者から4話者までとした場合のそれぞれの認識結果も出すことができるようにした。得られた結論として、音声認識器でも、劣化の度合いや単語親密度に関わらず、第1・第3モーラ目の認識率が、第2・第4モーラ目の認識率よりも低いという、人間と同じ傾向のデータが得られた。劣化度合いが大きい場合、人間も認識器と同様に音節遷移情報にかなり依存していた。これに対し、劣化度合が小さい場合には、人間の認識率は認識器の認識率より優れていることがわかった。また、異聴表を対比させて両者を比較した。認識器の場合は、劣化度合の変化に関わらず異聴傾向はそれほど変化せず、人間のばらつきのある結果と対照的であった。今後さらに、認識用の特徴ベクトルの選択や、人間の高次認知的な振舞いに関して検討の余地がある。従来、音声明瞭度試験は単音節で行われてきたが、日常会話音声の知覚特性は必ずしも明確ではなかった。今回使用した親密度統制単語音声リストFW03(FW07)は、そのために開発され、活用が期待されている。しかし、その単語音声自体が持つ統計的/定量的な特性把握はまだ行われていなかった。本研究はその第一歩で、今後の音声知覚研究の基盤となるものと考える。
本研究的目的是通过将聆听退化语音时的感知特征与语音识别器的识别结果进行比较,从数学上量化人类语音语言感知的特征。今年,为了与2009财年收集的人类感知特征数据进行比较,我们使用相同单词的语音数据(FW03)进行了比2018财年进行的改进的语音识别实验。首先,我们使用最标准的HTK(http://htk.eng.cam.ac.uk/)作为识别系统。此外,语音标签不仅会自动附加到人类感知实验中使用的一个说话人上,而且还会自动附加到FW03中的其他说话人上,并且当训练数据从一个说话人到四个说话人时,现在可以显示识别结果。每个结果。得到的结论是,即使使用语音识别器,第一和第三音节的识别率也低于第二和第四音节的识别率,无论劣化程度或单词熟悉程度如何,都获得了显示相同趋势的数据。当恶化程度较大时,人类像识别器一样严重依赖音节转换信息。另一方面,发现当劣化程度小时,人类的识别率优于识别器。我们还使用不同的听力图表对两者进行了比较。就识别器而言,无论恶化程度如何,听力异常的趋势都没有太大变化,这与人类中发现的可变结果形成鲜明对比。对于人类识别和高阶认知行为的特征向量选择,未来仍有进一步研究的空间。传统上,语音清晰度测试是使用单音节进行的,但日常会话语音的感知特征并不总是清晰的。此次使用的熟悉度控制单词音频列表FW03(FW07)就是为此目的而开发的,预计将被使用。然而,单词发音本身的统计/定量特征尚未被掌握。这项研究是朝着这个方向迈出的第一步,我们相信它将成为未来语音感知研究的基础。
项目成果
期刊论文数量(8)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
弁別素性に基づく異聴表による健聴者と難聴者の音声知覚の対比
使用基于判别特征的听力图比较正常听力者和听力受损者的言语感知
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:中家諒;入野俊夫;中市健志;坂本真一;河原英紀
- 通讯作者:河原英紀
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
入野 俊夫其他文献
授業の熟達化に伴う視点の変容に関する探索的検討
随着课程变得更加熟练,视角发生变化的探索性研究
- DOI:
- 发表时间:
2015 - 期刊:
- 影响因子:0
- 作者:
西村竜一;牧野さやか;入野 俊夫;川上綾子,木下光二,森康彦,益子典文 - 通讯作者:
川上綾子,木下光二,森康彦,益子典文
模擬難聴とそれを支える聴覚心理実験
模拟听力损失和支持它的心理听觉实验
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
和田壽弘;坂本貴志;木俣元一;H.M.シュラルプ;中村靖子;安川晴基;戸田山和久;大平英樹;三浦俊彦;三石初雄・坂井俊樹;Maxine Berg ed.;入野 俊夫 - 通讯作者:
入野 俊夫
The analysis of the role of DISC1 in the cortical neuronal migration
DISC1在皮质神经元迁移中的作用分析
- DOI:
- 发表时间:
2009 - 期刊:
- 影响因子:0
- 作者:
大西 壮登;高橋 徹;入野 俊夫;河原 英紀;仲嶋一範 - 通讯作者:
仲嶋一範
暗騒音と高調波歪みに頑健なインパルス応答測定用信号:Warped-TSP
脉冲响应测量信号对背景噪声和谐波失真具有鲁棒性:Warped-TSP
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
森勢 将雅;入野 俊夫;坂野 秀樹;河原 英紀 - 通讯作者:
河原 英紀
STRAIGHTスペクトルの時間方向補間におけるERB_N 周波数尺度上でのスペクトル距離の声質について
直接频谱时间插值中的 ERB_N 关于频率尺度上频谱距离的语音质量
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
畑 宏明;坂野 秀樹;高橋 徹;入野 俊夫;河原 英紀 - 通讯作者:
河原 英紀
入野 俊夫的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('入野 俊夫', 18)}}的其他基金
高齢難聴者の聴知覚特性のモデル化とそれに基づく音声聴覚支援基盤の構築
对老年听障人群听觉感知特征进行建模并基于其构建语音听力支持平台
- 批准号:
24K02961 - 财政年份:2024
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Transfer characteristics of emotional speech information toward elderly persons with hearing loss and development of novel speech morphing methods
情感语音信息向听力损失老年人的传递特性及新型语音变形方法的开发
- 批准号:
21K19794 - 财政年份:2021
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Challenging Research (Exploratory)
Foundation of speech communication support based on auditory perception models for everyone including elderly persons with hearing impairment
为包括听力障碍老年人在内的所有人提供基于听觉模型的语音交流支持
- 批准号:
21H03468 - 财政年份:2021
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
相似海外基金
脳神経疾患による構音障害を克服するための,音声認識および音声合成AIシステムの開発
开发语音识别与语音合成AI系统,克服脑神经疾病引起的构音障碍
- 批准号:
24K10630 - 财政年份:2024
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
画像認識と音声認識の複合AIによる災害状況認識ユニットの基礎研究
图像识别与语音识别相结合的AI灾情识别单元基础研究
- 批准号:
23K23017 - 财政年份:2024
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
非母語話者のスマートフォン音声認識機能での誤認識傾向を考慮した発音学習システム
使用智能手机语音识别功能,考虑到非母语人士的误识别倾向的发音学习系统。
- 批准号:
24K06231 - 财政年份:2024
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
画像・音声認識と料理データベースによる食事記録システム開発、及び疫学研究での応用
基于图像/语音识别和烹饪数据库的用餐记录系统的开发及其在流行病学研究中的应用
- 批准号:
23K20170 - 财政年份:2024
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
自動音声認識を利用したbilingual speech-to-textシステム構築と授業分析への応用
自动语音识别双语语音转文本系统的构建及其在课程分析中的应用
- 批准号:
24K04125 - 财政年份:2024
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research (C)