対話音声認識のための次発話予測メカニズムの高度化

对话语音识别的下一个话语预测机制的复杂性

基本信息

  • 批准号:
    06780355
  • 负责人:
  • 金额:
    $ 0.58万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    1994
  • 资助国家:
    日本
  • 起止时间:
    1994 至 无数据
  • 项目状态:
    已结题

项目摘要

発話動機のモデルを導入することによって、昨年度までに開発した次発話予測メカニズムを高度化した。1.質問者と回答者の役割を想定した模擬対話を収録し、各発話における動機を解析した。その結果、発話の動機が、「情報伝達レベル」および「問題解決レベル」の二種類の異なる動機から構成されていることを明らかにした。前者は、「得られた情報曖昧である」など、対話において授受された情報の状態に関する動機で、後者は、「比較したい」などのように、対話において授受した情報の利用に関する動機である。模擬対話の分析に基づいて、情報伝達レベルの動機および問題解決レベルの動機をそれぞれ8種類、10種類に分類した。2.対話領域において授受される情報を「行為列」と「オブジェクト」という二種類の情報パケットを用いて表現することによって、対話の進行にともなって変化する情報授受の状態を管理する手法を提案した。3.情報パケットによる情報授受の管理と発話動機のモデルに基づいて、次発話における話題を予測するメカニズムを開発した。地理案内およびスキー予約の二つのタスクでの模擬対話を用いて、二つのレベルを組み合わせた発話動機の頻度を調べることによって、情報伝達レベルの動機と問題解決レベルの動機の全ての組合せがこれらの対話で生じるわけではないことを確認した。模擬対話でみられた発話動機に対しては、発話動機ごとに話題遷移パタンを定義し、考えられる動機から可能な話題を数え上げる。最後に、これらのモデルを組み込んだ発話予測メカニズムをプロトタイプシステムとして実現し、発話動機のモデルが発話予測に有効であることを確認した。
通过引入语音动机的模型,我们制作了下一个到去年发展的语音预测机制。 1。包括模拟对话,以承担发问者和被告的角色,并分析了每个演讲的动机。结果,揭示了语音的动机由两个不同的动机组成:“信息传输水平”和“解决问题水平”。前者是在对话中交流和接收到的信息状态的动机,例如“获得的信息模棱两可”,后者是使用对话中交换和接收的信息的动机,例如“我想比较”。基于对模拟对话的分析,信息传输级别的动机和解决问题的动机分别分为八种和十种类型。 2。我们提出了一种管理信息交换和接收状态的方法,该方法通过使用两种类型的信息包来表达信息交换和接收来进行随着对话的进行而发生变化:“ ACT序列”和“对象”。 3。基于信息包的信息交换和接收的管理以及语音动机的模型,开发了一种预测下一个话语中主题的机制。我们在地理指导和滑雪预订的两个任务中使用模拟对话,研究了将两个级别结合在一起的语音动机的频率,并确认并非所有信息级动机和解决问题的动机的组合都在这些对话中发生在这些对话中。对于在模拟对话中看到的语音动机,为每个语音动机定义了主题过渡模式,并且可能的主题是根据可能的动机计算的。最后,我们意识到了一种语音预测机制,将这些模型纳入原型系统,并确认语音动机模型对语音预测有效。

项目成果

期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
寺谷 俊寛: "発話予測のための発話の動機に関する考察" 情報処理学会音声言語処理研究報告. SLP-3-4. 19-24 (1994)
Toshihiro Teratani:“对语音预测的语音动机的考虑”日本信息处理学会语音和语言处理研究报告 SLP-3-4 (1994)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
細川 亮二: "話題予測のための発話動機モデル" 電気関係学会関西支部連合大会講演論文集. G293 (1994)
Ryoji Hosokawa:“主题预测的语音动机模型”电气工程学会关西分会 G293 会议记录(1994 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
寺谷 俊寛: "発話の動機に関する知識の整理" 情報処理学会講演論文集. 2. 69-70 (1994)
Toshihiro Teratani:“有关言语动机的知识的组织”,日本信息处理学会会议录 2. 69-70 (1994)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Yoichi Yamashita: "An Utherance Prediction Method Based on the Topic Transition Model" IEICE Trans.on Inf.and Syst.E78-D(掲載予定). (1995)
Yoichi Yamashita:“基于主题转换模型的 Utherance 预测方法”IEICE Trans.on Inf.and Syst.E78-D(待出版)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

山下 洋一其他文献

GISのジオリファレンス機能を用いた近世村絵図の分析-富士山宝永噴火からの復興を事例として-
利用GIS的地理参考功能分析早期现代村庄地图 - 以富士山宝荣喷发恢复为例 -
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    石田 泰都;福森 隆寛;山下 洋一;大邑潤三
  • 通讯作者:
    大邑潤三
統計的F0モデルに基づく連続音声のアクセント型自動推定
基于统计F0模型的连续语音口音类型自动估计
テキスト情報を利用した深層学習に基づく音声感情認識
利用文本信息进行基于深度学习的语音情感识别
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    永瀬 亮太郎;福森 隆寛;山下 洋一
  • 通讯作者:
    山下 洋一
音響シーンを用いて検出誤りの深刻さを考慮したイベント検出の評価指標,
考虑使用声学场景的检测错误的严重性的事件检测的评估指数,
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    砺波 紀之;井本 桂右;福森 隆寛;山下 洋一
  • 通讯作者:
    山下 洋一
曲面型パラメトリックスピーカを用いた移動音像構築の基礎検討
使用曲面参数扬声器构建运动声像的基础研究
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    生藤 大典;中山 雅人;西浦 敬信;山下 洋一
  • 通讯作者:
    山下 洋一

山下 洋一的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('山下 洋一', 18)}}的其他基金

対話音声認識のための発話動機のモデル化
对话语音识别的语音动机建模
  • 批准号:
    07780367
  • 财政年份:
    1995
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
対話音声認識のための次発話予測メカニズムの開発
开发对话语音识别的下一个话语预测机制
  • 批准号:
    05780319
  • 财政年份:
    1993
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
合成規則インタプリタによる音声合成システムの構築
使用合成规则解释器构建语音合成系统
  • 批准号:
    01780041
  • 财政年份:
    1989
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
ルール抽出支援環境を備えた規則合成システムの構築
具有规则提取支持环境的规则合成系统的构建
  • 批准号:
    63780038
  • 财政年份:
    1988
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

脳神経疾患による構音障害を克服するための,音声認識および音声合成AIシステムの開発
开发语音识别与语音合成AI系统,克服脑神经疾病引起的构音障碍
  • 批准号:
    24K10630
  • 财政年份:
    2024
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
画像認識と音声認識の複合AIによる災害状況認識ユニットの基礎研究
图像识别与语音识别相结合的AI灾情识别单元基础研究
  • 批准号:
    23K23017
  • 财政年份:
    2024
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
非母語話者のスマートフォン音声認識機能での誤認識傾向を考慮した発音学習システム
使用智能手机语音识别功能,考虑到非母语人士的误识别倾向的发音学习系统。
  • 批准号:
    24K06231
  • 财政年份:
    2024
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
画像・音声認識と料理データベースによる食事記録システム開発、及び疫学研究での応用
基于图像/语音识别和烹饪数据库的用餐记录系统的开发及其在流行病学研究中的应用
  • 批准号:
    23K20170
  • 财政年份:
    2024
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
自動音声認識を利用したbilingual speech-to-textシステム構築と授業分析への応用
自动语音识别双语语音转文本系统的构建及其在课程分析中的应用
  • 批准号:
    24K04125
  • 财政年份:
    2024
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了