混合口音语音识别中自适应分层发音变异模型研究
项目介绍
AI项目解读
基本信息
- 批准号:60975018
- 项目类别:面上项目
- 资助金额:27.0万
- 负责人:
- 依托单位:
- 学科分类:F0605.模式识别与数据挖掘
- 结题年份:2012
- 批准年份:2009
- 项目状态:已结题
- 起止时间:2010-01-01 至2012-12-31
- 项目参与者:夏云庆; 刘建; 曹文晓; 侯珏; 张超; 肖熙;
- 关键词:
项目摘要
本课题提出并研究自适应分层发音变异模型在混合口音语音识别上的应用。根据混合口音发音变异的单方向性和非对称性特点,建立二维发音变异平面,采用置信度准则和非对称距离在多状态多高斯分布的模型上度量方法对变异程度的高低进行描述,构造四类发音变异模型子空间,实现发音变异模型的分层描述方法。同时,采用数据驱动和规则相结合及语音学和语言学知识相结合的方法,对基本发音单元构造自适应辅助决策树,实现发音变异模型对具有不同发音变异复杂度的自适应描述。由于发音变异不仅仅存在于口音中,也存在于各种自发式语音中,包括对话语音,讲座语音,访谈语音等。因此本课题的研究既针对语音识别技术的应用需求,也为口音及其他自发式语音识别研究提供新思路和新方法。
结项摘要
说话人口音的多样性,多态性和地方性是普遍存在的现象,这造成一般说话人的发音和标准发音存在较大的差异,形成声学层和语音层的发音变异,从而导致带口音语音识别性能的大幅度下降。本课题针对混合口音发音变异的灵活性和多样性,以中文语音为研究语言,建立了自适应分层发音变异模型,研究了发音变异声学层和语音层相互间的关联和区分关系以及他们与语音识别系统不同模块的结合方法,以及具有自适应能力的通用完备发音变异模型。该模型对不同类型的发音变异同时具有良好的覆盖能力和精细的区分能力,并通过实验论证自适应分层发音模型适用性和实用性。根据混合口音发音变异的单方向性和非对称性特点,建立二维发音变异平面,采用置信度准则和非对称距离在多状态多高斯分布的模型上度量方法对变异程度的高低进行描述,构造四类发音变异模型子空间,实现发音变异模型的分层描述方法。同时,采用数据驱动和规则相结合及语音学和语言学知识相结合的方法,对基本发音单元构造自适应辅助决策树,实现发音变异模型对具有不同发音变异复杂度的自适应描述。本课题完备了通用自适应分层发音模型对混合口音中的灵活多变的发音变异进行度量和描述方法,并建立与语音识别系统不同模块的结合方法,提高系统的识别率和鲁棒性。在基金的资助下,研究团队累计发表同行公认的高质量论文12篇,包括IEEE Transaction文章1篇和清华大学学报文章1篇,本领域最高水平的国际会议ICASSP和ASRU2篇等,并获得优秀学生论文2篇。通过本项目的研究,我们完成了重要的中文混合口音语音数据资源库,数据总量达到百小时,可以提供给训练测试等使用。申请并获得了国家专利1项,软件著作权1项,开发的部分支撑软件成果在实际的语音识别系统中得到了应用并取得了较好的效果,并初步应用到复杂环境下移动设备的鲁棒性语音识别系统中。在基金的资助下,2名硕士生获得了清华大学优秀毕业生称号,获得Google和语音联合会奖学金。在基金的资助下,本项研究全部达到了预期的研究目标,项目的研究思路和方法也可为口音及其他具有关联性的自发式语音识别研究提供宝贵的借鉴。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
一种硬件事务存储系统模拟环境的研究与实现
- DOI:--
- 发表时间:--
- 期刊:小型微型计算机系统.
- 影响因子:--
- 作者:张翠;吴名瑜;王永会;刘轶
- 通讯作者:刘轶
限购、股价波动与信用风险——基于房地产上市公司的实证研究
- DOI:--
- 发表时间:2015
- 期刊:金融发展研究
- 影响因子:--
- 作者:刘轶;李旭彪;杨萌萌
- 通讯作者:杨萌萌
PPAT:一种Pthread并行程序线程性能分析工具
- DOI:--
- 发表时间:2012
- 期刊:计算机应用与软件
- 影响因子:--
- 作者:温莎莎;刘轶;刘弢;宋平;李博;钱德沛
- 通讯作者:钱德沛
拟南芥AtPI基因植物表达载体的构建及其在烟草中的遗传转化
- DOI:--
- 发表时间:2016
- 期刊:植物研究
- 影响因子:--
- 作者:刘彩霞;郑唐春;代丽娟;刘轶;曲冠证
- 通讯作者:曲冠证
基于InfiniBand的多链路mesh/torus大规模并行系统互连网络
- DOI:--
- 发表时间:2012
- 期刊:计算机研究与发展
- 影响因子:--
- 作者:夏晓爽;刘轶;王允彬;钱德沛
- 通讯作者:钱德沛
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}