A Study on Ambiguous Utterance Understanding for Speech Input

语音输入的歧义话语理解研究

基本信息

  • 批准号:
    03452167
  • 负责人:
  • 金额:
    $ 4.54万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for General Scientific Research (B)
  • 财政年份:
    1991
  • 资助国家:
    日本
  • 起止时间:
    1991 至 1993
  • 项目状态:
    已结题

项目摘要

We proposed an unsupervised speaker adaptation method on sequencial concatenation training that used the theory of MAPE(Maximum A Posteriori probabitity Estimation) for continuous parameter HMM.In this method, we should only specify the syllable label sequence for the utterrance. The label sequences were provided automatically by the recognizer which used a speaker-independent model in advance. The experimental results on continuous speech recognition showed that the better model gave a performance comparable to that of supervised adaptation.Secondly, we proposed a method to process interjection and unknown words so that a speech recognition system could deal with spontaneous speech in dialog. We have evaluated the peerformance of our speech recognition system using test sentence sets including interjection or unknown words, and confirmed that the proposed method worked well.Thirdly we investigated the menu-guided spoken natural language understanding system that could understand all user's inputs. This work was motivated by the following fact that a user could not understand what to say or how to say to a computer in natural language. The system displays a menu that consists of acceptable content words and the usur chooses one word from the menu and speaks out phrase that includes the word. The experimental showed that our system performed well for the novice users.
我们提出了一种对序列串联训练的无监督说话者适应方法,该方法使用MAPE理论(最大a后验概率估计)对这种方法进行了连续参数hmm.mm.,我们只能为讲述指定音节标记序列。标签序列是由识别器自动提供的,该识别器预先使用了与说话者无关的模型。连续语音识别的实验结果表明,更好的模型给出了与监督适应性相当的性能。第二,我们提出了一种处理插入和未知单词的方法,以便语音识别系统可以在对话中处理自发的语音。我们使用包括插入或未知单词的测试句子集评估了语音识别系统的同伴性能,并确认该提出的方法效果很好。三分之二,我们研究了菜单引导的口语自然语言理解系统,该系统可以理解所有用户的输入。这项工作是由以下事实激发的,即用户无法理解用自然语言对计算机说些什么或如何说。该系统显示一个由可接受的内容单词组成的菜单,篡夺从菜单中选择一个单词,并说出包含单词的短语。实验表明,我们的系统对新手用户的表现良好。

项目成果

期刊论文数量(37)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
中川聖一: "ニューラルネットワークによる確率密度関数・事後確率の推定と母音認識" 電子情報通信学会論文誌. 76-DII. 1081-1089 (1993)
Seiichi Nakakawa:“使用神经网络估计概率密度函数和后验概率以及元音识别”电子、信息和通信工程师学会汇刊 76-DII 1081-1089 (1993)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
森屋 裕治: "対話予測を利用した音声による観光案内対話システム" 電子情報通信学会,音声研究会技術報告. SP92-121. 43-50 (1993)
Yuji Moriya:“使用对话预测的基于语音的旅游信息对话系统”,电子、信息和通信工程师研究所,语音研究组技术报告 SP92-121(1993)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
中川聖一: "最大事後確率推定法を用いた連続出力分布型HMMの適応化" 日本音響学会誌. 49. 721-728 (1993)
Seiichi Nakakawa:“使用最大后验概率估计方法的连续输出分布类型 HMM 的自适应”日本声学学会杂志 49. 721-728 (1993)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Mikio Yamamoto: "A spoken dialog system with verification and clarification gueries" IEICE Trans.Inf.& Syst.E76-D. 84-94 (1993)
Mikio Yamamoto:“具有验证和澄清问题的语音对话系统”IEICE Trans.Inf。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
中川聖一: "ワードスポッティング法を用いた文脈自由文法制御フレーム同期型HMM連続音声認識法" 電子情報通信学会論文誌. 76-DII. 1329-1336 (1993)
Seiichi Nakakawa:“使用单词识别方法的上下文无关语法控制的帧同步 HMM 连续语音识别方法”,电子、信息和通信工程师协会学报 76-DII。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

NAKAGAWA Seiichi其他文献

小学校のICT活用をモデルとした保育での取り組み
以小学使用信息通信技术为蓝本的儿童保育举措
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    SEKI Hiroshi;YAMAMOTO Kazumasa;AKIBA Tomoyosi;NAKAGAWA Seiichi;堀田博史・佐藤朝美・中村恵;中川聖一;堀田博史・佐藤朝美・森田健宏
  • 通讯作者:
    堀田博史・佐藤朝美・森田健宏
幼児教育でのタブレット端末等の活用
幼儿教育中平板设备等的利用
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    SEKI Hiroshi;YAMAMOTO Kazumasa;AKIBA Tomoyosi;NAKAGAWA Seiichi;堀田博史・佐藤朝美・中村恵
  • 通讯作者:
    堀田博史・佐藤朝美・中村恵
最近の音声言語処理研究の動向 - 筆者の音声認識、音声翻訳、話者認識の研究を中心として -
口语处理研究的最新动态 - 重点关注作者在语音识别、语音翻译、说话人识别方面的研究 -
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    SEKI Hiroshi;YAMAMOTO Kazumasa;AKIBA Tomoyosi;NAKAGAWA Seiichi;堀田博史・佐藤朝美・中村恵;中川聖一
  • 通讯作者:
    中川聖一

NAKAGAWA Seiichi的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('NAKAGAWA Seiichi', 18)}}的其他基金

A detection method using relative phase information for spoofed speech based on speech synthesis, speaker adaptation and edited speech
一种基于语音合成、说话人适应和编辑语音的利用相对相位信息的欺骗语音检测方法
  • 批准号:
    16K12461
  • 财政年份:
    2016
  • 资助金额:
    $ 4.54万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
Study on privacy protection in spoken language
口语隐私保护研究
  • 批准号:
    22650034
  • 财政年份:
    2010
  • 资助金额:
    $ 4.54万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
High accuracy transcription, cleaning and fast term detection for spoken documents
语音文档的高精度转录、清理和快速术语检测
  • 批准号:
    22300059
  • 财政年份:
    2010
  • 资助金额:
    $ 4.54万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Automatic indexing for lecture speech and its advanced utilization through speech interaction
讲座演讲自动索引及其通过语音交互的高级利用
  • 批准号:
    17300064
  • 财政年份:
    2005
  • 资助金额:
    $ 4.54万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
A study on content summarization for large spoken documents and content retrieval through spoken dialogue
大型口语文档内容摘要及口语对话内容检索研究
  • 批准号:
    13480095
  • 财政年份:
    2001
  • 资助金额:
    $ 4.54万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Development for speech interface for form -based in formation access services on Web
基于表单的Web信息访问服务语音接口的开发
  • 批准号:
    13558033
  • 财政年份:
    2001
  • 资助金额:
    $ 4.54万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Studies on Speech Recognition, Closed Caption and Summarization of Broadcast News
广播新闻语音识别、隐藏式字幕和摘要研究
  • 批准号:
    09480064
  • 财政年份:
    1997
  • 资助金额:
    $ 4.54万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Development of a multi-modal dialogue system and a tool for a spoken dialogue system
多模态对话系统和口语对话系统工具的开发
  • 批准号:
    08558030
  • 财政年份:
    1996
  • 资助金额:
    $ 4.54万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
A study on multi-modal man-machine interface through spontaneous speech
基于自发语音的多模态人机界面研究
  • 批准号:
    06452401
  • 财政年份:
    1994
  • 资助金额:
    $ 4.54万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
A Research for the Formation of Basic Concepts in Physics
物理学基本概念形成的研究
  • 批准号:
    05680163
  • 财政年份:
    1993
  • 资助金额:
    $ 4.54万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)

相似国自然基金

声电联合刺激人工电子耳语音识别机理的研究
  • 批准号:
    62371217
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
面向语音识别的丝蛋白基柔性振动传感器介观结构重构与性能研究
  • 批准号:
    52303343
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
低资源蒙汉混合语语音识别关键问题研究
  • 批准号:
    62366037
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目
类脑智能语音信息处理算法与模型研究
  • 批准号:
    62306259
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
面向声学和语言信息解耦的端到端语音识别系统
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Noise-robust speech recognition and spoken dialog system for service robots
用于服务机器人的抗噪声语音识别和语音对话系统
  • 批准号:
    19K24343
  • 财政年份:
    2019
  • 资助金额:
    $ 4.54万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up
Study on Speech Recognition for Spoken Dialog System
口语对话系统语音识别研究
  • 批准号:
    21700204
  • 财政年份:
    2009
  • 资助金额:
    $ 4.54万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
Developping a system for dialog support to the hard of hearing via speech recognition and character display
开发一个通过语音识别和字符显示为听力障碍人士提供对话支持的系统
  • 批准号:
    18500127
  • 财政年份:
    2006
  • 资助金额:
    $ 4.54万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
User Friendly Speech Recognition Algorithm with Adaptability for Environments and Users
用户友好的语音识别算法,具有对环境和用户的适应性
  • 批准号:
    15300060
  • 财政年份:
    2003
  • 资助金额:
    $ 4.54万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Development of a Speech Understanding system and a Spoken Dialog system
语音理解系统和口语对话系统的开发
  • 批准号:
    02555067
  • 财政年份:
    1990
  • 资助金额:
    $ 4.54万
  • 项目类别:
    Grant-in-Aid for Developmental Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了