対話音声認識のための次発話予測メカニズムの開発

开发对话语音识别的下一个话语预测机制

基本信息

  • 批准号:
    05780319
  • 负责人:
  • 金额:
    $ 0.58万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    1993
  • 资助国家:
    日本
  • 起止时间:
    1993 至 无数据
  • 项目状态:
    已结题

项目摘要

対話音声の認識に重要な役割を果たす、次発話を予測するための基本的なメカニズムの開発を行った。1.質問者と回答者の役割を想定した模擬対話データを基にして、音声対話の特徴を調べた。その結果、意味的なまとまり、および発話対の二種類の構造が一般に対話に見られることがわかった。2.対話例を解析した結果に基づき、次発話との関連性に注目しながら二種類の対話構造をモデル化した。まず、意味的なまとまりを捉えるためのモデルとして話題遷移モデル(TPN)を提案した。このモデルは関連話題をパケットにまとめ、さらにそれをネットワーク上に接続したものである。次に、発話対を一つのプランとして捉え、発話対の種類ごとに発話のパターンを分類整理し、話題に依存する発話の構成要素を明らかにした。対話構造のモデル化に当たっては、汎用性の高い対話管理手法を実現するために、計算機側のシステム(問題解決器)に依存した知識とそうでない汎用的な知識に分離することによって、領域に依存しないような対話構造のモデル化を行なった。3.対話音声理解に対話に関する知識を利用するための手段として、対話構造のモデルに基づいた発話の予測手法を検討した。発話における話題を話題遷移モデルに基づいて決定し、さらに発話対に基づいた発話のパターンを話題によって具体化する。曖昧性を含んだ音声認識結果として分節ラティスを想定し、「案内」をタスクとした対話例に関して、本手法の有効性を検証した。
开发了基本机制来预测下一个话语,这些话语在识别对话音频中起着重要作用。 1。根据提问者和受访者的作用,根据模仿对话数据对语音对话的特征进行了检查。结果,发现在对话中通常可以看到两种类型的结构,例如有意义的凝聚力和语音。 2。根据分析对话示例的结果,建模了两种类型的对话结构,重点是下一个讲话者的相关性。首先,我们提出了一个局部过渡模型(TPN)作为捕获有意义协调的模型。该模型是相关主题的一包,并且也连接到网络。接下来,将语音对视为一个计划,并为每种话语进行了分类和组织的话语模式,并且揭示了依赖主题的话语的组成部分。为了建模对话结构,为了实现一种高度的对话管理方法,它取决于该区域,将取决于系统(问题解决工具)的知识和我们不寻常的知识建模了无法完成的对话结构。 3。作为使用对话知识来理解语音的一种手段,我们根据具有对话结构的模型研究了对话的预测方法。话语中的主题将根据主题过渡模型确定,基于语音对的话语模式将由主题体现。检查了该方法的有效性,以示例性地识别语音识别的结果,以及使用“指导”作为任务的对话示例。

项目成果

期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Yoichi Yamashita: "Next Utterance Prediction Based on Two Kinds of Dialog Models" Proc.of Eurospeech'93. 1161-1164 (1993)
Yoichi Yamashita:“基于两种对话模型的下一个话语预测”Proc.of Eurospeech93。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
大田 雅彰: "音声対話における話題と表層表現の関係について" 日本音響学会平成5年秋季研究発表会講演論文集. 21-22 (1993)
Masaaki Ota:“论口语对话中主题和表面表达之间的关系”日本声学学会 1993 年秋季研究会议记录 21-22 (1993)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
大田 雅彰: "音声対話理解のための話題の決定について" 電子情報通信学会技術研究報告. SP93-129. 9-16 (1994)
Masaaki Ota:“关于语音对话理解的主题确定”IEICE SP93-129(1994)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
山下 洋一: "話題の決定と発話予測" 電子情報通信学会時限研究専門委員会資料. SPREC93-3-12. 55-58 (1994)
Yoichi Yamashita:“主题确定和话语预测”IEICE 限时研究委员会材料。 55-58 (1994)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

山下 洋一其他文献

GISのジオリファレンス機能を用いた近世村絵図の分析-富士山宝永噴火からの復興を事例として-
利用GIS的地理参考功能分析早期现代村庄地图 - 以富士山宝荣喷发恢复为例 -
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    石田 泰都;福森 隆寛;山下 洋一;大邑潤三
  • 通讯作者:
    大邑潤三
統計的F0モデルに基づく連続音声のアクセント型自動推定
基于统计F0模型的连续语音口音类型自动估计
テキスト情報を利用した深層学習に基づく音声感情認識
利用文本信息进行基于深度学习的语音情感识别
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    永瀬 亮太郎;福森 隆寛;山下 洋一
  • 通讯作者:
    山下 洋一
音響シーンを用いて検出誤りの深刻さを考慮したイベント検出の評価指標,
考虑使用声学场景的检测错误的严重性的事件检测的评估指数,
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    砺波 紀之;井本 桂右;福森 隆寛;山下 洋一
  • 通讯作者:
    山下 洋一
曲面型パラメトリックスピーカを用いた移動音像構築の基礎検討
使用曲面参数扬声器构建运动声像的基础研究
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    生藤 大典;中山 雅人;西浦 敬信;山下 洋一
  • 通讯作者:
    山下 洋一

山下 洋一的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('山下 洋一', 18)}}的其他基金

対話音声認識のための発話動機のモデル化
对话语音识别的语音动机建模
  • 批准号:
    07780367
  • 财政年份:
    1995
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
対話音声認識のための次発話予測メカニズムの高度化
对话语音识别的下一个话语预测机制的复杂性
  • 批准号:
    06780355
  • 财政年份:
    1994
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
合成規則インタプリタによる音声合成システムの構築
使用合成规则解释器构建语音合成系统
  • 批准号:
    01780041
  • 财政年份:
    1989
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
ルール抽出支援環境を備えた規則合成システムの構築
具有规则提取支持环境的规则合成系统的构建
  • 批准号:
    63780038
  • 财政年份:
    1988
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

音声環境を可視化可能な対話型聴導犬ロボットに関する研究
可视化音频环境的交互式助听狗机器人研究
  • 批准号:
    24K20875
  • 财政年份:
    2024
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
セキュアな音声対話のための実環境なりすまし音声コーパス構築
构建真实世界的欺骗语音语料库以实现安全语音对话
  • 批准号:
    24K14993
  • 财政年份:
    2024
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
意図を的確に伝える音声対話翻訳の基盤技術の創出
创造准确传达意图的语音对话翻译基础技术
  • 批准号:
    23K28144
  • 财政年份:
    2024
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
音声対話系の統一的モデリングに基づくユーザへのモデル自動適応
基于口语对话系统统一建模的自动模型适应用户
  • 批准号:
    23K28147
  • 财政年份:
    2024
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
九州・沖縄方言の継承支援に資する音声対話型生成系AIの開発
开发支持九州、冲绳方言传承的语音对话生成系统AI
  • 批准号:
    24K00074
  • 财政年份:
    2024
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了