話者・地域・スタイルモーフィング音声合成による実環境リスニング学習支援
使用说话者/区域/风格变形语音合成来支持真实世界的听力学习
基本信息
- 批准号:22H00673
- 负责人:
- 金额:$ 10.9万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (B)
- 财政年份:2022
- 资助国家:日本
- 起止时间:2022-04-01 至 2025-03-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
本研究課題では、「音響工学および音声知覚の観点から、リスニング能力の効率的な向上のための方法論とはなにか?」という学術的問いに対する解を導くため、これまで我々が統計的音声合成、機 械学習、対話型英会話学習システムなどの研究により培ってきた個別の要素技術を融合・発展させ、話者・地域・スタイル・訛りといった英語音声の特徴を深層学習に基づくモーフィング技術に より段階的にシミュレーション可能な全く新しい実環境リスニング学習支援の実現を目指し、以 下の具体的な 4項目について検討を行うことを目的とする。(a)多様な話者・地域・スタイルを有する音声コーパスの設計と構築、(b)深層学習に基づくモーフィング音声合成技術の確立、(c)モーフィング音声合成を用いたリスニング学習支援システムの開発、(d)提案システムによる実環境におけるリスニング能力向上の実証実験。2022年度は上記のうち(a)の専用音声コーパスの構築のための諸検討を行った。具体的には英語音声合成の予備的実験、およびそれに基づくバランスコーパスの設定および分量の検討、予備的な収録に基づく異なる話速の音声の収録、分析を行った。分析の結果、話速が早い場合にリンキング・リダクションなどの発音特徴が増加することで、英語初学者の聞き取り精度が低下することを確認し、一様な伸縮により作成された低速な 音声の聴解を調査した。
在这个研究项目中,我们开发了统计语音合成,通过融合和开发在机器学习、交互式英语会话学习系统等研究中培育的各个基本技术,我们创建了一种基于深度学习的变形技术,捕捉了语音的特征。英语演讲,例如说话人、地区、风格和口音。为了实现一种全新的、可以更加分步模拟的真实环境听力学习支持,本研究的目的是考虑以下四个具体项目。 (a) 设计和构建具有不同说话者、地区和风格的语音语料库; (b) 建立基于深度学习的变形语音合成技术; (c) 开发使用变形语音合成的听力学习支持系统; )在真实环境中使用所提出的系统来提高听力能力的演示实验。 2022 财年,我们进行了各种研究,为上述 (a) 构建了专用语音语料库。具体来说,我们进行了英语语音合成的初步实验,根据实验检验了平衡语料库的设置和大小,并根据初步录音记录和分析了不同语速的语音。分析结果证实,英语初学者的听力准确性下降是由于语速较高时连音、缩音等发音特征的增加,以及均匀扩张和收缩造成的慢速语音的听力理解造成的。被证实。
项目成果
期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
英語リスニング学習支援のための低話速音声の聞き取りに関する検討
低速语音听力支持英语听力学习的研究
- DOI:
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:小野正樹;牧原功;大和啓子;Koichi Nishida;李丹;李丹;山岡政紀;斉藤幸一;千葉 理揮,能勢 隆,伊藤 彰則
- 通讯作者:千葉 理揮,能勢 隆,伊藤 彰則
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
能勢 隆其他文献
スパース近似と畳み込みカーネルを用いたガウス過程回帰に基づく音声合成
使用稀疏近似和卷积核的基于高斯过程回归的语音合成
- DOI:
- 发表时间:
2013 - 期刊:
- 影响因子:0
- 作者:
郡山知樹;能勢 隆;小林隆夫 - 通讯作者:
小林隆夫
Regional Characteristics of Heavy Summertime Rainfall in and around Urban Tokyo from the Viewpoint of the Spatial Extent of Rainfall Area
从降雨区空间范围看东京市区及周边地区夏季强降雨的区域特征
- DOI:
10.4157/ejgeo.14.233 - 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
山中麻衣;能勢 隆;千葉祐弥;伊藤彰則;岡 暁子・高橋日出男・中島 虹・鈴木博人 - 通讯作者:
岡 暁子・高橋日出男・中島 虹・鈴木博人
脳MRI画像の局所特徴量に基づく年齢推定手法の検討
基于脑部MRI图像局部特征的年龄估计方法研究
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
舘野英樹;能勢 隆;郡山知樹;篠崎隆宏;小林隆夫;菅原幸弘;近藤千裕 - 通讯作者:
近藤千裕
多視点ステレオのための高精度ウィンドウマッチング手法とその精度評価
多视立体高精度窗口匹配方法及其精度评估
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
小林友哉;能勢 隆;篠崎隆宏;小林隆夫;酒井修二 - 通讯作者:
酒井修二
統計動態モデルを用いた人工膝関節のロバスト3次元動態計測
使用统计动态模型对人工膝关节进行稳健的 3D 动态测量
- DOI:
- 发表时间:
2013 - 期刊:
- 影响因子:0
- 作者:
郡山知樹;能勢 隆;小林隆夫;亀井亮吾,山崎隆治,岡田俊之,福田紀生,菅本一臣,吉川秀樹,陳延偉,富山憲幸,佐藤嘉伸 - 通讯作者:
亀井亮吾,山崎隆治,岡田俊之,福田紀生,菅本一臣,吉川秀樹,陳延偉,富山憲幸,佐藤嘉伸
能勢 隆的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('能勢 隆', 18)}}的其他基金
話者・地域・スタイルモーフィング音声合成による実環境リスニング学習支援
使用说话者/区域/风格变形语音合成来支持真实世界的听力学习
- 批准号:
23K21945 - 财政年份:2024
- 资助金额:
$ 10.9万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
相似海外基金
Technically-enhanced high variability phonetic training and its effective application to English listening training for Japanese learners
技术强化的高变异性语音训练及其在日语学习者英语听力训练中的有效应用
- 批准号:
18F18724 - 财政年份:2018
- 资助金额:
$ 10.9万 - 项目类别:
Grant-in-Aid for JSPS Fellows
Research and development of multi-modal interactive English learning system based on deep learning
基于深度学习的多模态互动英语学习系统研发
- 批准号:
17H00823 - 财政年份:2017
- 资助金额:
$ 10.9万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
Research and development of a Japanese pronunciation training system using average voice morphing
基于平均语音变形的日语发音训练系统的研发
- 批准号:
16K13253 - 财政年份:2016
- 资助金额:
$ 10.9万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
Pronunciation education system based on the systematization of non-mothor tongue speech prosody using generation process model and speech synthesis
基于生成过程模型和语音合成的非母语语音韵律系统化的发音教育系统
- 批准号:
24652115 - 财政年份:2012
- 资助金额:
$ 10.9万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
音声認識、合成技術を中心とするマルチメディア手法を用いた中国語学習支援システム
以语音识别与合成技术为核心的多媒体汉语学习支持系统
- 批准号:
15700524 - 财政年份:2003
- 资助金额:
$ 10.9万 - 项目类别:
Grant-in-Aid for Young Scientists (B)