多少数民族语言连续语音识别方法及应用
项目介绍
AI项目解读
基本信息
- 批准号:61633013
- 项目类别:重点项目
- 资助金额:245.0万
- 负责人:
- 依托单位:
- 学科分类:F0304.系统工程理论与技术
- 结题年份:2021
- 批准年份:2016
- 项目状态:已结题
- 起止时间:2017-01-01 至2021-12-31
- 项目参与者:王东; 艾斯卡尔·艾木都拉; 于洪志; 李冠宇; 山拜·达拉拜; 格根塔娜; 加羊吉;
- 关键词:
项目摘要
China involves multiple nations, and each nation has its unique language. The research on cross-lingual and multi-lingual phenomenon is highly important for national amalgamation, cultural harmonics and social stability. This research focuses on automatic speech recognition (ASR) for minority languages, particularly the techniques for multi- and minor- lingual ASR. The goal is to establish a unified framework for model training and decoding, which can not only support minority languages with relatively rich resources (e.g., Uyghur and Mongolia), but can also be migrated to other low-resource languages. At the same time, this project will establish and open a series of data, tools and standards. We hope it can motivate the research on ASR and related fields including information retrieval and natural language understanding.
中国是一个多民族国家,每个民族都有自己独特的语言。研究多民族背景下的多语言和跨语言现象,对促进语言互通互融、建设文化和谐、维护民族稳定具有重要意义。本研究关注少数民族语音识别技术,特别是多少数民族语言的语音识别技术,实现一个可适用于多少数民族语言的统一建模方法和识别系统,该方法和系统既可以支持资源相对丰富的少数民族语言(如维吾尔语,蒙古语),也可快速移植到其它资源稀缺的少数民族语言。同时,本项目还将建设公开一系列数据资源、测试标准、标注平台和处理工具,推动多少数民族语言语音识别和相关领域(如信息抽取、自然语言理解等)的研究进程。
结项摘要
中国是一个多民族国家,每个民族都有自己独特的语言。研究多民族背景下的多语言和跨语言现象,对促进语言互通互融、建设文化和谐、维护民族稳定具有重要意义。本项目研究关注多少数民族语言的语音语言信息处理技术,涉及研究任务覆盖了多少数民族语言的语音识别、语种识别、说话人识别、语音合成、机器翻译等;代表性研究工作包括面向数据稀缺问题的语音信息深度分解与重构、面向零/低资源条件的无/半监督迁移学习、面向领域知识长尾问题的符号化神经模型建模与推理等。基于这些研究工作,实现了可适用于多少数民族语言的语音语言信息处理的方法和系统。本项目面向少数民族语言的语音和语言资源建设,公开一系列数据资源、测试标准、标注平台和处理工具,推动了多少数民族语言的语音语言信息处理和相关领域(如信息抽取、自然语言理解等)的研究发展。本项目不仅从科学研究的角度探索了多少数民族语音语言信息处理中的关键问题,还实现了科学研究的成果转化。基于本项目研究成果的动态密码语音认证技术,现已支持汉语、维语、蒙语、藏语等多个语种,在公共服务、金融支付等领域有着广泛应用,为国家信息安全、社会民生提供了重要保障。
项目成果
期刊论文数量(12)
专著数量(3)
科研奖励数量(4)
会议论文数量(52)
专利数量(11)
Collaborative Joint Training With Multitask Recurrent Model for Speech and Speaker Recognition
用于语音和说话人识别的多任务循环模型的协作联合训练
- DOI:10.1109/taslp.2016.2639323
- 发表时间:2017-03
- 期刊:IEEE Transactions on Audio, Speech and Language Processing
- 影响因子:--
- 作者:Tang Zhiyuan;Li Lantian;Wang Dong;Vipperla Ravich;er
- 通讯作者:er
Uyghur short-text classification based on reliable sub-word morphology
基于可靠子词形态的维吾尔语短文本分类
- DOI:10.1504/ijris.2019.102606
- 发表时间:2019
- 期刊:International Journal of Reasoning-based Intelligent Systems
- 影响因子:--
- 作者:Sardar Parhat;Mijit Ablimit;Askar Hamdulla
- 通讯作者:Askar Hamdulla
Analysis of phonemes and tones confusion rules obtained by ASR
ASR获得的音素和声调混淆规则分析
- DOI:10.1007/s11276-019-02220-2
- 发表时间:2020
- 期刊:Wireless Networks
- 影响因子:3
- 作者:Gulnur Arkin;Askar Hamdulla;Mijit Ablimit
- 通讯作者:Mijit Ablimit
A Robust Morpheme Sequence and Convolutional Neural Network-Based Uyghur and Kazakh Short Text Classification
基于鲁棒语素序列和卷积神经网络的维吾尔语和哈萨克语短文本分类
- DOI:10.3390/info10120387
- 发表时间:2019
- 期刊:Information-An International Interdisciplinary Journal
- 影响因子:--
- 作者:Sardar Parhat;Mijit Ablimit;Askar Hamdulla
- 通讯作者:Askar Hamdulla
Deep Normalization for Speaker Vectors
说话人向量的深度归一化
- DOI:10.1109/taslp.2020.3039573
- 发表时间:2020-04
- 期刊:IEEE Transactions on Audio, Speech and Language Processing
- 影响因子:--
- 作者:Yunqi Cai;Lantian Li;Andrew Abel;Xiaoyan Zhu;Dong Wang
- 通讯作者:Dong Wang
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
生物特征识别学科发展报告
- DOI:10.11834/jig.210078
- 发表时间:2021
- 期刊:中国图象图形学报
- 影响因子:--
- 作者:孙哲南;赫然;王亮;阚美娜;冯建江;郑方;郑伟诗;左旺孟;康文雄;邓伟洪;张杰;韩琥;山世光;王云龙;茹一伟;朱宇豪;刘云帆;何勇
- 通讯作者:何勇
连锁董事网络与企业动态创新能力——基于多重治理情境的调节作用
- DOI:--
- 发表时间:2021
- 期刊:财经论丛
- 影响因子:--
- 作者:郑方;单文涛;王永青
- 通讯作者:王永青
声纹识别技术及其应用现状
- DOI:--
- 发表时间:2016
- 期刊:信息安全研究
- 影响因子:--
- 作者:郑方;李蓝天;张慧;艾斯卡尔·肉孜
- 通讯作者:艾斯卡尔·肉孜
南通大学学生营养知识态度行为调查
- DOI:--
- 发表时间:2011
- 期刊:中国学校卫生
- 影响因子:--
- 作者:朱奇;郑方;范从娟;徐湘;周苏;叶长青
- 通讯作者:叶长青
资源、创新决策取向与后发企业 创新追赶路径演化研究
- DOI:--
- 发表时间:2020
- 期刊:科技进步与对策
- 影响因子:--
- 作者:徐娜娜;张雅辉;郑方
- 通讯作者:郑方
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
郑方的其他基金
说话人识别中时变鲁棒的声纹特征研究
- 批准号:61271389
- 批准年份:2012
- 资助金额:80.0 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}