話者・地域・スタイルモーフィング音声合成による実環境リスニング学習支援
使用说话者/区域/风格变形语音合成来支持真实世界的听力学习
基本信息
- 批准号:22H00673
- 负责人:
- 金额:$ 10.9万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (B)
- 财政年份:2022
- 资助国家:日本
- 起止时间:2022-04-01 至 2025-03-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
本研究課題では、「音響工学および音声知覚の観点から、リスニング能力の効率的な向上のための方法論とはなにか?」という学術的問いに対する解を導くため、これまで我々が統計的音声合成、機 械学習、対話型英会話学習システムなどの研究により培ってきた個別の要素技術を融合・発展させ、話者・地域・スタイル・訛りといった英語音声の特徴を深層学習に基づくモーフィング技術に より段階的にシミュレーション可能な全く新しい実環境リスニング学習支援の実現を目指し、以 下の具体的な 4項目について検討を行うことを目的とする。(a)多様な話者・地域・スタイルを有する音声コーパスの設計と構築、(b)深層学習に基づくモーフィング音声合成技術の確立、(c)モーフィング音声合成を用いたリスニング学習支援システムの開発、(d)提案システムによる実環境におけるリスニング能力向上の実証実験。2022年度は上記のうち(a)の専用音声コーパスの構築のための諸検討を行った。具体的には英語音声合成の予備的実験、およびそれに基づくバランスコーパスの設定および分量の検討、予備的な収録に基づく異なる話速の音声の収録、分析を行った。分析の結果、話速が早い場合にリンキング・リダクションなどの発音特徴が増加することで、英語初学者の聞き取り精度が低下することを確認し、一様な伸縮により作成された低速な 音声の聴解を調査した。
In order to guide the academic question "What is a methodology for efficient improvement of listening ability from the perspective of acoustic engineering and speech perception?", this research topic aims to fusion and develop individual elemental technologies that we have cultivated through research such as statistical speech synthesis, machine learning, and interactive English conversation learning systems, and to realize a completely new real-world listening learning support that can simulate English speech characteristics such as speakers, regions, styles, and accents在阶段使用基于深度学习的变形技术。 (a)设计和构建语料库,具有不同的说话者,区域和样式,(b)基于深度学习的形变语音合成技术,(c)使用变形的语音综合来开发听力学习支持系统,以及(d)使用建议的系统在实际环境中提高听力的演示实验。在2022年,提出了各种考虑,以在上述(a)的(a)中建立专用的音频语料库。具体而言,我们在英语语音综合中进行了初步实验,并基于实验平衡语料库的设置和音量,并根据初步记录记录和分析了不同的语音速度。该分析证实,当语音速度快速时,由于发音特征的增加(例如链接降低)以及对均匀伸展的慢速语音的聆听理解,因此降低了英语初学者的聆听精度。
项目成果
期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
英語リスニング学習支援のための低話速音声の聞き取りに関する検討
低速语音听力支持英语听力学习的研究
- DOI:
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:小野正樹;牧原功;大和啓子;Koichi Nishida;李丹;李丹;山岡政紀;斉藤幸一;千葉 理揮,能勢 隆,伊藤 彰則
- 通讯作者:千葉 理揮,能勢 隆,伊藤 彰則
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
能勢 隆其他文献
スパース近似と畳み込みカーネルを用いたガウス過程回帰に基づく音声合成
使用稀疏近似和卷积核的基于高斯过程回归的语音合成
- DOI:
- 发表时间:
2013 - 期刊:
- 影响因子:0
- 作者:
郡山知樹;能勢 隆;小林隆夫 - 通讯作者:
小林隆夫
Regional Characteristics of Heavy Summertime Rainfall in and around Urban Tokyo from the Viewpoint of the Spatial Extent of Rainfall Area
从降雨区空间范围看东京市区及周边地区夏季强降雨的区域特征
- DOI:
10.4157/ejgeo.14.233 - 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
山中麻衣;能勢 隆;千葉祐弥;伊藤彰則;岡 暁子・高橋日出男・中島 虹・鈴木博人 - 通讯作者:
岡 暁子・高橋日出男・中島 虹・鈴木博人
脳MRI画像の局所特徴量に基づく年齢推定手法の検討
基于脑部MRI图像局部特征的年龄估计方法研究
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
舘野英樹;能勢 隆;郡山知樹;篠崎隆宏;小林隆夫;菅原幸弘;近藤千裕 - 通讯作者:
近藤千裕
多視点ステレオのための高精度ウィンドウマッチング手法とその精度評価
多视立体高精度窗口匹配方法及其精度评估
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
小林友哉;能勢 隆;篠崎隆宏;小林隆夫;酒井修二 - 通讯作者:
酒井修二
隠れセミマルコフモデルに基づく音声合成システムにおける最尤線形回帰によるスタイル適応の検討
基于隐半马尔可夫模型的语音合成系统中使用最大似然线性回归的风格适应研究
- DOI:
- 发表时间:
2004 - 期刊:
- 影响因子:0
- 作者:
Makoto Tachibana;Katsumi Ogata;Junichi Yamagishi;Yuji Nakano;Makoto Tachibana;緒方克海;山岸順一;中野雄資;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;磯貝 朱里;橘 誠;山岸 順一;磯貝 朱里;橘 誠;野村 大輔;中野 雄資;能勢 隆;橘 誠;磯貝 朱里;小林 隆夫;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;Juri Isogai;Makoto Tachibana;Junichi Yamagishi;Juri Isogai;Makoto Tachibana;Daisuke Nomura;Yuji Nakano;Takashi Nose;Makoto Tachibana;Juri Isogai;Takao Kobayashi;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;磯貝朱里;小林隆夫;磯貝朱里;中野雄資;川島啓吾;山岸順一;磯貝朱里;橘 誠;野村大輔;Dhany Arifianto;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Junichi Yamagishi;Heiga Zen;Keisuke Miyanaga;宮永 圭介;尾関 創;山岸 順一 - 通讯作者:
山岸 順一
能勢 隆的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('能勢 隆', 18)}}的其他基金
話者・地域・スタイルモーフィング音声合成による実環境リスニング学習支援
使用说话者/区域/风格变形语音合成来支持真实世界的听力学习
- 批准号:
23K21945 - 财政年份:2024
- 资助金额:
$ 10.9万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
相似海外基金
Technically-enhanced high variability phonetic training and its effective application to English listening training for Japanese learners
技术强化的高变异性语音训练及其在日语学习者英语听力训练中的有效应用
- 批准号:
18F18724 - 财政年份:2018
- 资助金额:
$ 10.9万 - 项目类别:
Grant-in-Aid for JSPS Fellows
Research and development of multi-modal interactive English learning system based on deep learning
基于深度学习的多模态互动英语学习系统研发
- 批准号:
17H00823 - 财政年份:2017
- 资助金额:
$ 10.9万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
Research and development of a Japanese pronunciation training system using average voice morphing
基于平均语音变形的日语发音训练系统的研发
- 批准号:
16K13253 - 财政年份:2016
- 资助金额:
$ 10.9万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
Pronunciation education system based on the systematization of non-mothor tongue speech prosody using generation process model and speech synthesis
基于生成过程模型和语音合成的非母语语音韵律系统化的发音教育系统
- 批准号:
24652115 - 财政年份:2012
- 资助金额:
$ 10.9万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
音声認識、合成技術を中心とするマルチメディア手法を用いた中国語学習支援システム
以语音识别与合成技术为核心的多媒体汉语学习支持系统
- 批准号:
15700524 - 财政年份:2003
- 资助金额:
$ 10.9万 - 项目类别:
Grant-in-Aid for Young Scientists (B)