音声知覚特性の解析に対する音声認識技術の適用
应用语音识别技术分析语音感知特征
基本信息
- 批准号:18652040
- 负责人:
- 金额:$ 2.11万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Exploratory Research
- 财政年份:2006
- 资助国家:日本
- 起止时间:2006 至 2008
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
劣化させた音声を聞き取る時の知覚特性と、音声認識器での認識結果を対比させることにより、人間の音声言語知覚の特性を数理的に定量化することを目的としている。本年度は、H19年度に収集した人間の知覚特性データと対比するために、同一の単語音声データ(FW03)を用いて、音声認識実験をH18年度に行ったものより改善して実施した。まず認識系を最も標準的なHTK(http://htk.eng.cam.ac.uk/)とした。また、人間の知覚実験に用いた1話者分だけでなく、FW03中の他の話者に関しても、音韻ラベルを自動的に付け、学習データを1話者から4話者までとした場合のそれぞれの認識結果も出すことができるようにした。得られた結論として、音声認識器でも、劣化の度合いや単語親密度に関わらず、第1・第3モーラ目の認識率が、第2・第4モーラ目の認識率よりも低いという、人間と同じ傾向のデータが得られた。劣化度合いが大きい場合、人間も認識器と同様に音節遷移情報にかなり依存していた。これに対し、劣化度合が小さい場合には、人間の認識率は認識器の認識率より優れていることがわかった。また、異聴表を対比させて両者を比較した。認識器の場合は、劣化度合の変化に関わらず異聴傾向はそれほど変化せず、人間のばらつきのある結果と対照的であった。今後さらに、認識用の特徴ベクトルの選択や、人間の高次認知的な振舞いに関して検討の余地がある。従来、音声明瞭度試験は単音節で行われてきたが、日常会話音声の知覚特性は必ずしも明確ではなかった。今回使用した親密度統制単語音声リストFW03(FW07)は、そのために開発され、活用が期待されている。しかし、その単語音声自体が持つ統計的/定量的な特性把握はまだ行われていなかった。本研究はその第一歩で、今後の音声知覚研究の基盤となるものと考える。
目的是数学上通过比较聆听恶化的语音和语音识别设备的识别结果时的感知特征来量化人类语言感知的特征。在今年,为了比较2007年收集的人类的感知特征数据,我们使用相同的语音数据(FW03)进行了语音识别实验,并与2006年进行的语音识别实验进行了改进的语音识别实验。首先,识别系统是最标准的HTK(http:////htk.eng.eng.cam.cam.cam.ac.uk/)。此外,语音标签会自动添加到人类感知实验中使用的单个扬声器以及FW03中的其他扬声器中,当学习数据是从一到四个说话者中学习时,可以为每个说话者识别结果。得出的结论是,即使是语音识别者也具有与人类相同的趋势,其趋势与人类相同,在这种趋势中,第一和第三莫拉的识别率都低于第二和第四莫拉的识别率,而不论其恶化程度如何。当恶化程度很大时,人类像识别剂一样高度依赖于音节过渡信息。相反,当劣化程度很小时,发现人类的识别率优于识别剂的识别率。另外,通过比较差异来比较两者。在识别者的情况下,与人类结果的变化相反,听力趋势并没有改变太大。将来,关于选择识别特征向量和人类高阶认知行为的特征向量还有进一步的考虑。过去,语音清晰度测试是使用单音节进行的,但是日常演讲的感知特征并不总是很清楚。为此目的开发了此次使用的亲密控制单词语音列表FW03(FW07),并有望使用。但是,声音本身的统计/定量特征尚未被理解。这项研究是第一步,将作为语音感知的未来研究的基础。
项目成果
期刊论文数量(8)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
弁別素性に基づく異聴表による健聴者と難聴者の音声知覚の対比
使用基于判别特征的听力图比较正常听力者和听力受损者的言语感知
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:中家諒;入野俊夫;中市健志;坂本真一;河原英紀
- 通讯作者:河原英紀
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
入野 俊夫其他文献
授業の熟達化に伴う視点の変容に関する探索的検討
随着课程变得更加熟练,视角发生变化的探索性研究
- DOI:
- 发表时间:
2015 - 期刊:
- 影响因子:0
- 作者:
西村竜一;牧野さやか;入野 俊夫;川上綾子,木下光二,森康彦,益子典文 - 通讯作者:
川上綾子,木下光二,森康彦,益子典文
模擬難聴とそれを支える聴覚心理実験
模拟听力损失和支持它的心理听觉实验
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
和田壽弘;坂本貴志;木俣元一;H.M.シュラルプ;中村靖子;安川晴基;戸田山和久;大平英樹;三浦俊彦;三石初雄・坂井俊樹;Maxine Berg ed.;入野 俊夫 - 通讯作者:
入野 俊夫
The analysis of the role of DISC1 in the cortical neuronal migration
DISC1在皮质神经元迁移中的作用分析
- DOI:
- 发表时间:
2009 - 期刊:
- 影响因子:0
- 作者:
大西 壮登;高橋 徹;入野 俊夫;河原 英紀;仲嶋一範 - 通讯作者:
仲嶋一範
有声/無声(ささやき)母音系列における寸法変調の検知閾
浊音/清音(耳语)元音序列中大小调制的检测阈值
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
竹島 千尋;津崎 実;入野 俊夫 - 通讯作者:
入野 俊夫
暗騒音と高調波歪みに頑健なインパルス応答測定用信号:Warped-TSP
脉冲响应测量信号对背景噪声和谐波失真具有鲁棒性:Warped-TSP
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
森勢 将雅;入野 俊夫;坂野 秀樹;河原 英紀 - 通讯作者:
河原 英紀
入野 俊夫的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('入野 俊夫', 18)}}的其他基金
高齢難聴者の聴知覚特性のモデル化とそれに基づく音声聴覚支援基盤の構築
对老年听障人群听觉感知特征进行建模并基于其构建语音听力支持平台
- 批准号:
24K02961 - 财政年份:2024
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Transfer characteristics of emotional speech information toward elderly persons with hearing loss and development of novel speech morphing methods
情感语音信息向听力损失老年人的传递特性及新型语音变形方法的开发
- 批准号:
21K19794 - 财政年份:2021
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Challenging Research (Exploratory)
Foundation of speech communication support based on auditory perception models for everyone including elderly persons with hearing impairment
为包括听力障碍老年人在内的所有人提供基于听觉模型的语音交流支持
- 批准号:
21H03468 - 财政年份:2021
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
相似海外基金
脳神経疾患による構音障害を克服するための,音声認識および音声合成AIシステムの開発
开发语音识别与语音合成AI系统,克服脑神经疾病引起的构音障碍
- 批准号:
24K10630 - 财政年份:2024
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
画像認識と音声認識の複合AIによる災害状況認識ユニットの基礎研究
图像识别与语音识别相结合的AI灾情识别单元基础研究
- 批准号:
23K23017 - 财政年份:2024
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
画像・音声認識と料理データベースによる食事記録システム開発、及び疫学研究での応用
基于图像/语音识别和烹饪数据库的用餐记录系统的开发及其在流行病学研究中的应用
- 批准号:
23K20170 - 财政年份:2024
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
非母語話者のスマートフォン音声認識機能での誤認識傾向を考慮した発音学習システム
使用智能手机语音识别功能,考虑到非母语人士的误识别倾向的发音学习系统。
- 批准号:
24K06231 - 财政年份:2024
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
自動音声認識を利用したbilingual speech-to-textシステム構築と授業分析への応用
自动语音识别双语语音转文本系统的构建及其在课程分析中的应用
- 批准号:
24K04125 - 财政年份:2024
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research (C)