韻律コーパスとその作成自動化
韵律语料库及其创建的自动化
基本信息
- 批准号:12132204
- 负责人:
- 金额:$ 41.34万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research on Priority Areas
- 财政年份:2000
- 资助国家:日本
- 起止时间:2000 至 2003
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
1.新規の韻律コーパスの作成(静岡大学)韻律コーパスとして日本語のMULTEXT韻律データベースの40パッセジにJ-ToBI韻律タグ付けを完了し、同様の手法で、筑波大学と千葉大学と東京大孝と東工大グループの既存音声コーパスの各種案内読上げと模擬対話と対話音声、マルチモーダル対話音声、天気予報、模擬感情音声へのJ-ToBIタグ付けを行った。これらのラベリング作業について研究支援者を雇用して行った。言語情報を利用した韻律ラベリング手法の開発と、音素ラベリング支援のための音素自動セグメンテーションと、連接境界における音響的特徴の詳細について研究成果を発表した。2.既存の音声コーパスの韻律分析と韻律コーパスの作成(筑波大学)既存の音声コーパスとして、日本音響学会「研究用連続音声データベース」の各種案内読上げ文と模擬対話、重点領域研究「音声対話」の対話音声コーパス、の3種のコーパスに基本周波数分析と発話ラベルと付与した。200ms以上の無音区間で区切られた音声区間を発話単位として、発話単位長を読上げ音声と模擬対話音声で比較した。模擬対話では間投詞や割込みによって発話単位が短くなる。音声パワーと基本周波数の標準偏差は対話に比べて読上げは狭い範囲に集中していることが分かった。3.ジェスチャー・顔表情付の対話音声収録(千葉大学)音声対話における視線や頷きなどジェスチャーを記録・分析するため、二台のプロンプター(映像提示装置)を介したマルチモーダルな自然対話の収録を行い、音声・ジェスチャーの収録とタグ付け作業を行った。話し手と聞き手のジェスチャーの相互作用に関して、話者継続時における発話単位終了時での話し手の頷きによって聞き手が相槌や頷きを9割近く返していること、話し手が頷かない場合でも言語情報や音声の韻律情報によって聞き手は反応を3割程度返していることを明らかにした。
1. Creating a new prosodic corpus (Shizuoka University) J-ToBI prosodic tagging was completed on 40 passages in the MULTEXT prosodic database in Japanese as prosodic corpus, and using the same method, various guide reading and mock dialogue and dialogue voices, multimodal dialogue voices, weather forecasts, and mock emotional voices were used to attach J-ToBI to the existing speech corpus of Tsukuba University, Chiba大学,东京大学高什大学和东京科技集团。为这些标签操作雇用了研究支持者。研究结果介绍了使用语言信息,自动音素分割以支持音素标记的韵律标记技术的开发以及在串联边界处的声学特征的详细信息。 2。对现有语音语料库的韵律分析和蓬松动力学语料库的创建(Tsukuba大学)作为现有的语音语料库,基本频率分析和话语标签被分配给三个语料库:来自日本的声音持续语音数据库的各种指导性的阅读句子和模拟对话,以及来自“对话”语言语料库,“与对话”语料库,以及来自关键研究的对话。将语音单位长度与语音间隔(以200毫秒或更多的语音单位单元为单位分隔)进行了比较,并将语音单位长度与读取和模拟对话语音进行了比较。在模拟对话中,插入和中断缩短了语音单元。发现与对话相比,音频功率和基本频率的标准偏差集中在狭窄的读数范围内。 3。用手势和面部表情对话(Chiba University)进行对话的音频记录,以记录和分析音频对话中的凝视和点头的手势,通过两个提示器(视频演示设备)记录了多模式的自然对话,并记录和标记了音频和姿势。关于说话者和听众的手势之间的相互作用,据透露,听众在讲话者继续时在演讲单位结束时点头的响应近90%,即使说话者不点头,听众也会对30%的响应,大约30%的声音信息和声音的张贴信息。
项目成果
期刊论文数量(92)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Kitazawa Shigeyoshi, Kitamura T., Mochiduki K., Itoh T.: "Preliminary Study of Japanese MULTEXT : a Prosodic Corpus"International Conference on Speech Processing, Taejon, Korea. 825-828 (2001)
Kitazawa Shigeyoshi、Kitamura T.、Mochiduki K.、Itoh T.:“日语多文本的初步研究:韵律语料库”语音处理国际会议,韩国大田。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
S-H Bu: "Evaluation of a Method for Automatic Determination of Fo Model Parameters"Proc.International Conference : Speech Prosody 2004. 431-434 (2004)
S-H Bu:“自动确定 Fo 模型参数的方法的评估”Proc.国际会议:语音韵律 2004. 431-434 (2004)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Kitazawa Shigeyoshi: "Japanese MULTEXT : a Prosodic Corpus"LREC 2004. 発表予定. (2004)
Kitazawa Shigeyoshi:“日语多文本:韵律语料库”LREC 2004。演示时间表(2004)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Tomoko Osuga: "Estimating Syntactic Structure from Prosody in Japanese Speech"IEICE Transaction D. Vol.8, No.3. 558-564 (2003)
Tomoko Osuga:“从日语语音韵律中估计句法结构”IEICE Transaction D. Vol.8,No.3。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
大須賀智子: "韻律のみによる文構造推定手法の検討"日本音響学会 2003年秋季研究発表会全国大会音響学会講演論文集. 1-8-24. 229-230 (2003)
Tomoko Osuga:“仅使用韵律的句子结构估计方法的研究”日本声学学会 2003 年秋季研究报告日本声学学会全国会议论文集 1-8-24(2003)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
北澤 茂良其他文献
発話行動のマルチモーダル記述による幼児の発達過程観察(コミュニケーション・対話,第9回音声言語シンポジウム)
使用言语行为的多模态描述观察幼儿的发展过程(沟通/对话,第九届口语研讨会)
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
笠見 朋彦;桐山 伸也;竹林 洋一;北澤 茂良 - 通讯作者:
北澤 茂良
北澤 茂良的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('北澤 茂良', 18)}}的其他基金
聴覚モデルに基づく新しい人工内耳による音声・音楽信号処理の研究
基于听觉模型的新型人工耳蜗的语音和音乐信号处理研究
- 批准号:
21650036 - 财政年份:2009
- 资助金额:
$ 41.34万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
聴覚モデルに基づく新しい人工内耳の音声・音楽情報処理の研究
基于听觉模型的新型人工耳蜗语音和音乐信息处理研究
- 批准号:
19650038 - 财政年份:2007
- 资助金额:
$ 41.34万 - 项目类别:
Grant-in-Aid for Exploratory Research
聴覚モデルに基づく新しい人工内耳システムの研究
基于听觉模型的新型人工耳蜗系统研究
- 批准号:
17650049 - 财政年份:2005
- 资助金额:
$ 41.34万 - 项目类别:
Grant-in-Aid for Exploratory Research
人工内耳のスピーチプロセッサのための新しい信号処理方式の評価
人工耳蜗语音处理器新信号处理方法的评估
- 批准号:
04F04287 - 财政年份:2004
- 资助金额:
$ 41.34万 - 项目类别:
Grant-in-Aid for JSPS Fellows
聴覚末梢系の生理モデルに基づく新しい人工内耳システムの研究
基于听觉外围系统生理模型的新型人工耳蜗系统研究
- 批准号:
06680351 - 财政年份:1994
- 资助金额:
$ 41.34万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
音素の精密な特徴抽出に基づいた音声認識方法の研究
基于音素精确特征提取的语音识别方法研究
- 批准号:
63608504 - 财政年份:1988
- 资助金额:
$ 41.34万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
音素の精密な特徴抽出に基づいた音声認識方法の研究
基于音素精确特征提取的语音识别方法研究
- 批准号:
62608502 - 财政年份:1987
- 资助金额:
$ 41.34万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
日本語無声破裂子音の破裂区間の特徴の抽出に関する研究
日语清爆破辅音爆破音程特征提取研究
- 批准号:
X00210----575230 - 财政年份:1980
- 资助金额:
$ 41.34万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
Effects of pesonality traits and affective factors on speaking skills and teaching prosody
人格特质和情感因素对口语技能和韵律教学的影响
- 批准号:
22K00686 - 财政年份:2022
- 资助金额:
$ 41.34万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
音響学的アプローチによる韓国語破裂子音の知覚学習法とその神経生理学的評価
韩语爆破辅音的声学感知学习方法及其神经生理学评估
- 批准号:
22K19996 - 财政年份:2022
- 资助金额:
$ 41.34万 - 项目类别:
Grant-in-Aid for Research Activity Start-up
雑音下における音声基本周波数抽出のための気導音、骨導音の利用に関する統合的研究
噪声下利用气导声和骨导声提取语音基频的综合研究
- 批准号:
22K12068 - 财政年份:2022
- 资助金额:
$ 41.34万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Construction and evaluation of a prosody control model for effective information transmission by speech to the elderly
老年人语音信息有效传递的韵律控制模型构建与评价
- 批准号:
20K11869 - 财政年份:2020
- 资助金额:
$ 41.34万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Utterance training method for maintaining throat function -Evaluation and training program using speech recognition and deep learning -
维护喉咙功能的言语训练方法 -利用语音识别和深度学习的评估和训练计划 -
- 批准号:
20K11894 - 财政年份:2020
- 资助金额:
$ 41.34万 - 项目类别:
Grant-in-Aid for Scientific Research (C)