Studies on Multimodal Communication by Integrating Speech and Diagram
语音与图解结合的多模态通信研究
基本信息
- 批准号:08458078
- 负责人:
- 金额:$ 4.67万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (B)
- 财政年份:1996
- 资助国家:日本
- 起止时间:1996 至 1997
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The aim of this research is to realize multimodal communication between human and machines through implementing multimodal drawing system with speech input. The results of this research are below :1. Integration of speech, gesture and diagramWe developed multi-mode integration method without assuming the synchronization of each input elements. The validity of this integration method was examined by evaluating the improvement of accuracy of information input in multimodal dictation system.2. Implementation of multimodal interface using speech and pointing gestureWe developed the cooperation mechanism which uses the result of pointing gesture recognition, which is reliable channel, for the recognition of speech, which is relatively unreliable channel. By using the result of pointing gesture recognition, the accuracy of speech recognition raised about 6%. Using this integration method, we implemented a multimodal drawing system with speech input.3. Interpretation of utterance using diagrammatic and contextual information in multimodal drawing system We realized utterance understanding mechanism which uses context management mechanism by stack in order to deal with spontaneous speech (e. g. ellipsis, reference expression, etc.). We integrated this utterance understanding mechanism to multimodal drawing system.
本研究的目的是通过实现具有语音输入的多模态绘图系统来实现人与机器之间的多模态通信。本研究的结果如下: 1.语音、手势和图表的集成我们开发了多模式集成方法,无需假设每个输入元素的同步。通过评价多模态听写系统信息输入准确率的提高情况,检验了该集成方法的有效性。 2.使用语音和指向手势实现多模态界面我们开发了一种协作机制,该机制使用指向手势识别的结果(这是可靠的通道)来识别语音(这是相对不可靠的通道)。利用指向手势识别的结果,语音识别的准确率提高了约6%。利用这种集成方法,我们实现了一个带有语音输入的多模态绘图系统。3.在多模态绘图系统中使用图解和上下文信息解释话语我们实现了话语理解机制,该机制使用堆栈的上下文管理机制来处理自发语音(例如省略号、参考表达等)。我们将这种话语理解机制集成到多模态绘图系统中。
项目成果
期刊论文数量(28)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Doshita,S.: "UNDERSTANDING AND GENERATING DIALOGUE BY INTEGRATING PRO-CESSING OF SPEECH,LANGUAE AND CONCEPT" Proc.of International Symposium on Spoken Dialogue '96. 1-8 (1996)
Doshita,S.:“通过整合语音、语言和概念处理来理解和生成对话”Proc.of 国际口语研讨会 96。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
河原達也: "音声言語を用いた仮想空間との対話による試着システム" 情報処理学会論文誌. (採録決定). (1998)
Tatsuya Kawahara:“使用口语与虚拟空间交互的试穿系统”日本信息处理学会杂志(已接受)(1998 年)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
荒木 雅弘: "マルチモーダル作図システムにおける文脈知識を利用した会話理解" 人工知能学会研究会資料SIG-SLUD-9703-1. (1998)
Masahiro Araki:“在多模态图表系统中使用上下文知识进行对话理解”人工智能研究小组材料 SIG-SLUD-9703-1 (1998)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Araki, M.: "Automatic Evaluation Environment for Spoken Dialogue Systems" in Mayr, E.et al.ed. "Dialogue Processing in Spoken Language Systems". (1997)
Araki, M.:“口语对话系统的自动评估环境”,Mayr, E.et al.ed。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Doshita, S.: "Human-machine communication by speech" Ohmsha inc.(1998)
Doshita, S.:“通过语音进行人机通信”Ohmsha inc.(1998)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
DOSHITA Shuji其他文献
DOSHITA Shuji的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('DOSHITA Shuji', 18)}}的其他基金
Research on Understanding and Generating Dialogue by Integrated Processing of Speech, Language and Concept
语音、语言和概念综合处理理解和生成对话的研究
- 批准号:
05241103 - 财政年份:1996
- 资助金额:
$ 4.67万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
Robust speech understanding against inter-speaker variation and ungrammatical utterances based on high-accuracy speech recognition and semantic driven parsing method
基于高精度语音识别和语义驱动解析方法的针对说话者间变化和不语法话语的鲁棒语音理解
- 批准号:
05452357 - 财政年份:1993
- 资助金额:
$ 4.67万 - 项目类别:
Grant-in-Aid for General Scientific Research (B)
Intelligent pattern recognition and understanding by integrating probabilistic and symbolic reasoning
通过集成概率推理和符号推理进行智能模式识别和理解
- 批准号:
02452281 - 财政年份:1990
- 资助金额:
$ 4.67万 - 项目类别:
Grant-in-Aid for General Scientific Research (B)
Fundamental Research of Speech Translation Based on High Accurate Speech Recognition and Language-Concept Understanding
基于高精度语音识别和语言概念理解的语音翻译基础研究
- 批准号:
62420052 - 财政年份:1987
- 资助金额:
$ 4.67万 - 项目类别:
Grant-in-Aid for General Scientific Research (A)
相似国自然基金
细胞硬度介导口腔鳞癌细胞与CD8+T细胞间力学对话调控免疫杀伤的机制研究
- 批准号:82373255
- 批准年份:2023
- 资助金额:48 万元
- 项目类别:面上项目
LINC01510-ANXA1通过细胞外囊泡介导肺腺癌与M2型巨噬细胞对话促进STAS免疫逃逸的作用与机制研究
- 批准号:82372993
- 批准年份:2023
- 资助金额:46 万元
- 项目类别:面上项目
基于“心主血脉、心主神明”,从“血管-神经”对话探讨芪黄逐瘀合剂通过P65/PAI-1/mBDNF通路治疗冠脉微栓塞后抑郁的研究
- 批准号:82305189
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
Pdk4的m6A修饰调控内质网-线粒体对话异常——钠尿肽信号改善糖尿病心肌病的新机制
- 批准号:82300924
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
胰岛源外泌体miR-455介导β细胞和巨噬细胞对话调控肥胖状态下血糖稳态
- 批准号:82373925
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
相似海外基金
Phantom in the Opera: the Vulnerabilities of Speech Interface for Robotic Dialogue System
歌剧魅影:机器人对话系统语音接口的漏洞
- 批准号:
21K17837 - 财政年份:2021
- 资助金额:
$ 4.67万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Automatic Improvement of Acoustic and Language Models of Automatic Speech Recognition through Spoken Dialogue
通过口语对话自动改进自动语音识别的声学和语言模型
- 批准号:
15K16051 - 财政年份:2015
- 资助金额:
$ 4.67万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
Research of Human-Kind Dialogue System with Recognition and Synthesis of Various Speech Based on State Estimation
基于状态估计的多种语音识别与合成的人类对话系统研究
- 批准号:
15H02720 - 财政年份:2015
- 资助金额:
$ 4.67万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Robust speech recognition and dialogue systems for robotics
强大的机器人语音识别和对话系统
- 批准号:
405349-2011 - 财政年份:2014
- 资助金额:
$ 4.67万 - 项目类别:
Postgraduate Scholarships - Doctoral
Robust speech recognition and dialogue systems for robotics
强大的机器人语音识别和对话系统
- 批准号:
405349-2011 - 财政年份:2013
- 资助金额:
$ 4.67万 - 项目类别:
Postgraduate Scholarships - Doctoral