面向连续语音的哈萨克语关键词识别技术研究
项目介绍
AI项目解读
基本信息
- 批准号:61462084
- 项目类别:地区科学基金项目
- 资助金额:45.0万
- 负责人:
- 依托单位:
- 学科分类:F0211.信息检索与社会计算
- 结题年份:2018
- 批准年份:2014
- 项目状态:已结题
- 起止时间:2015-01-01 至2018-12-31
- 项目参与者:努尔麦麦提·尤鲁瓦斯; 木合亚提·尼亚孜别克; 刘艳; 海拉提·克孜尔别克; 吐尔逊·库尔班; 沙力木别克·毕山汗; 于智娟;
- 关键词:
项目摘要
According to the Strategic Conception of the Silk Road Economic Belt and the urgent need of information construction of Xinjiang, we will research the key technologies of Kazakh Continuous Speech Keyword Spotting for Xinjiang and Central Asia region . Create a network and phone short message based Kazakh language speech corpus, which will be collected from phone, mobile and web. Extract and analyze the Kazakh oral speech feature parameters, the noise cancellation technologies, feature extraction methods, study continuous speech Kazakh keywords retrieval technology, construct network and communication equipments based Kazakh keyword retrieval system. This project not only provide a strong technical support for Intelligence collection from Kazakh speech document, but also create great social and economic value for the regions of Xinjiang and Central Asia in the future.
本项目根据国家丝绸之路经济带战略构想及新疆信息化建设的迫切需要,研究面向新疆及中亚地区信息领域的面向连续语音的哈萨克语关键词识别关键技术。面向网络和手机短信语料,创建哈萨克语电话、手机、互联网以及口语对话语音语料库,提取并分析哈萨克语口语语音特征参数、噪音消除技术、特征提取方法、研究基于连续语音识别技术的哈萨克语关键词检索技术,搭建基于网络及通讯设备的哈萨克语关键词检索系统。该项成果不仅对哈萨克语语音文档内容进行情报搜集等提供强大的技术支撑,并且将来会在新疆和中亚地区创造深远的社会及经济价值。
结项摘要
本项目根据国家构建“一带一路”经济带战略构想及新疆信息化构建的迫切需要,研究面向新疆及中亚地区信息领域的面向连续语音的哈萨克语关键词识别关键技术。在语料库方面,重点研究了哈萨克语语音语料的三音子选取方法,研发了哈萨克语语音标注及管理平台,建立了大约200人规模的哈萨克语语音语料库并对其进行了标注。构建了214MB规模的哈萨克语文本语料库,并对其进行了进一步加工和处理。特征方面,研究了哈萨克语音素的声学图像特征和哈萨克语音的韵律特征,建立了1000句规模的哈萨克语语音参数数据库。模型方面,研究了说话人自适应技术在哈萨克语连续语音识别中的应用,研究了基于长短期记忆网络的跨语言声学模型建模方法;研究了哈萨克语构词方法,研究了音节,词干词缀,词首词尾等不同建模单元及其在哈萨克语语音识别任务的性能。系统方面,研究了哈萨克语语音检索技术,研发了基于连续语音的哈萨克语关键词识别基线系统。与此同时,针对需求研究了哈萨克、柯尔克孜文文种识别技术,哈萨克文文本分类技术,哈萨克语情感分类技术。本项目部分研究成果在国内外学术会议上进行了交流为学术界提供了参考,并且在一些产品当中应用。本项成果为属于黏着语系的中亚语言语音识别技术提供了重要的参考价值。
项目成果
期刊论文数量(5)
专著数量(0)
科研奖励数量(1)
会议论文数量(1)
专利数量(0)
跨语言声学模型在维吾尔语语音识别中的应用
- DOI:10.16511/j.cnki.qhdxxb.2018.22.020
- 发表时间:2018
- 期刊:清华大学学报(自然科学版)
- 影响因子:--
- 作者:努尔麦麦提·尤鲁瓦斯;刘俊华;吾守尔·斯拉木;达吾勒·阿布都哈依尔
- 通讯作者:达吾勒·阿布都哈依尔
采用CRF模型的哈萨克语信息技术术语
- DOI:10.16783/j.cnki.nwnuz.2016.01.012
- 发表时间:2016
- 期刊:西北师范大学学报(自然科学版)
- 影响因子:--
- 作者:木合亚提·尼亚孜别克;古力沙吾利·塔里甫;达吾勒·阿布都哈依尔
- 通讯作者:达吾勒·阿布都哈依尔
面向哈萨克语LVCSR的语言模型构建方法研究
- DOI:10.3778/j.issn.1002-8331.1605-0240
- 发表时间:2016
- 期刊:计算机工程与应用
- 影响因子:--
- 作者:达吾勒·阿布都哈依尔;努尔买买提·尤鲁瓦斯;刘艳
- 通讯作者:刘艳
柯尔克孜语语料库语言资源管理平台的设计和开发
- DOI:--
- 发表时间:2015
- 期刊:南昌大学学报(理科版)
- 影响因子:--
- 作者:木合亚提·尼亚孜别克;古力沙吾利·塔里甫;达吾勒·阿布都哈依尔
- 通讯作者:达吾勒·阿布都哈依尔
哈萨克语元音格局研究
- DOI:--
- 发表时间:2018
- 期刊:中文信息学报
- 影响因子:--
- 作者:达吾勒.阿布都哈依尔;努尔买买提.尤鲁瓦斯;刘艳
- 通讯作者:刘艳
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
基于HMM的哈萨克文联机手写文字识别研究
- DOI:--
- 发表时间:2014
- 期刊:计算机工程与应用
- 影响因子:--
- 作者:达吾勒·阿布都哈依尔;古丽拉·阿东别克
- 通讯作者:古丽拉·阿东别克
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}