WWW情報検索サービスのための音声言語インタフェースシステムの開発

WWW信息搜索服务口语接口系统的开发

基本信息

  • 批准号:
    11780267
  • 负责人:
  • 金额:
    $ 0.7万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    1999
  • 资助国家:
    日本
  • 起止时间:
    1999 至 2000
  • 项目状态:
    已结题

项目摘要

本年度の研究では、WWW上での効率的な情報閲覧・検索のための音声言語インタフェース技術を開発するという当初の目的・計画に関してそれぞれ以下のような成果が得られた。1.キーワードの検索のための音声認識手法の開発情報検索システムなどWeb上で利用されるGUIベースのユーザインタフェースには、固有名詞の入力を必要とするものが多く、既存の音声認識システムでは扱いが困難であった。本研究では、日本語において扱いやすい音節を単位とした連続音声認識技術を応用し、音声文書検索および任意のキーワード入力を実現する方法を開発した。具体的には、統計的な言語モデルであるN-gramを日本語の音節列に関して大量のテキストコーパスから求め、音節trigramの制約に基づくone-pass型の連続音声認識アルゴリズムへ適用した。これをもとに、音声文書検索においてはベクトル空間法および複数候補(N-best)の利用に基づく類似性評価法を検討し、音声認識誤りによる性能劣化を抑えた検索法を開発した。また、キーワード入力においては、音節列の複数候補(N-best)とGUIによるユーザ選択に基づく固有名詞入力方式を開発し、実用性への検証を行った。2.システムの試作とデータ収集環境の開発音声以外のモダリティを含むマルチモーダルインタフェース(MMI)システムは、一般に複数の複雑なコンポーネントが有機的に結合し動作するように実現されなければならない。従来は専用の高度なシステム開発環境を提供することに重点が置かれているが、本研究では比較的身近なWWW上の情報検索サービスへの適用を想定し、汎用性の高いMMIプラットフォームを開発した。開発したプラットフォームは、WWWブラウザをクライアントとし、システムや対話タスクの記述及び各種コンポーネント間の通信の手順までをすべてXML(eXtensible Markup Language)で統一することにより汎用性を実現した。実際に、従来UNIX OS上で構築されていたMMI対話システムをこのプラットフォーム上に容易に移行でき、ネットワークを介してユーザが利用できる環境を構築した。これにより、広範な対話データ収集のためのユーザ利用環境を容易に提供可能となった。
今年的研究取得了以下成果,与开发口语界面技术以实现 WWW 上高效信息浏览和搜索的初衷和计划相关。 1. 开发用于关键字搜索的语音识别方法 许多网络上使用的基于 GUI 的用户界面,例如信息检索系统,都需要输入专有名词,而现有的语音识别系统无法处理这一点。在本研究中,我们应用连续语音识别技术,利用日语中易于处理的音节来开发一种搜索语音文档并输入任意关键字的方法。具体来说,我们从日语音节序列的大型文本语料库中导出了一种统计语言模型 N-gram,并将其应用于基于音节三元组约束的一次性连续语音识别算法。在此基础上,我们研究了基于向量空间方法和使用多个候选(N-best)进行语音文档检索的相似性评估方法,并开发了一种抑制由于语音识别错误而导致性能下降的检索方法。此外,对于关键词输入,我们开发了一种基于多个候选音节序列(N-best)和使用GUI的用户选择的专有名词输入方法,并验证了其实用性。 2. 系统原型设计和数据收集环境开发 包括音频以外的模态的多模态接口(MMI)系统通常必须以多个复杂组件有机地组合和操作的方式来实现。传统上,重点放在提供专用的高级系统开发环境上,但在本研究中,我们开发了一个高度通用的MMI平台,并将其应用于WWW上相对熟悉的信息搜索服务。所开发的平台使用WWW浏览器作为客户端,并通过使用XML(可扩展标记语言)统一所有系统和交互任务描述以及各个组件之间的通信过程来实现多功能性。事实上,我们创建了一个环境,使以前构建在UNIX操作系统上的MMI对话系统可以很容易地迁移到这个平台上,并可以通过网络供用户使用。这使得可以容易地提供用于收集广泛的交互数据的用户环境。

项目成果

期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A.Kai,T.Nakano and S.Nakagawa: "A speech Interface ststem for information on retrieval tasks on the www"Proceedings of International Workshop Speech and Cpmputer. 141-144 (1999)
A.Kai、T.Nakano 和 S.Nakakawa:“用于 www 上检索任务信息的语音接口系统”国际语音和计算机研讨会论文集。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
A.Kai,T.Nakano,and S.Nakagawa: "Usability of Browser-Based Pen-Touch/Speech User Interfaces for Form-Based Applications in Mobile Environment"Lecture Notes in Computer Science 1948 : Advances in Multimodal Interfaces-ICMI2000, Springer. Vol.1948. 549-556
A.Kai、T.Nakano 和 S.Nakakawa:“移动环境中基于表单的应用程序的基于浏览器的笔触/语音用户界面的可用性”计算机科学 1948 年讲义:多模式界面的进展 - ICMI2000,Springer
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

甲斐 充彦其他文献

甲斐 充彦的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('甲斐 充彦', 18)}}的其他基金

方言音声データの分析と検索を可能にする諸方言に普遍な音声言語処理基盤モデルの構築
构建多种方言的通用语音语言处理平台模型,实现方言语音数据的分析和检索
  • 批准号:
    24K00450
  • 财政年份:
    2024
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Feature Representation Learning and Imagined Speech Recognition by Simultaneous Recording of Spoken Language Stimuli and EEG
通过同时记录口语刺激和脑电图进行特征表示学习和想象语音识别
  • 批准号:
    22K19828
  • 财政年份:
    2022
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
文脈を含む多角的な発話検証を可能にする対話音声理解システムの開発
开发对话语音理解系统,可实现包括上下文在内的多方面话语验证
  • 批准号:
    17700181
  • 财政年份:
    2005
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
音声・言語現象の個人性モデルに基づく対話音声理解システムの開発
基于语音和语言现象的个性模型的对话语音理解系统的开发
  • 批准号:
    14780272
  • 财政年份:
    2002
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)

相似国自然基金

面向社交万维网的双语知识图谱构建关键技术研究
  • 批准号:
    62006040
  • 批准年份:
    2020
  • 资助金额:
    24 万元
  • 项目类别:
    青年科学基金项目
结合描述逻辑和霍恩规则的不确定推理算法
  • 批准号:
    60903078
  • 批准年份:
    2009
  • 资助金额:
    18.0 万元
  • 项目类别:
    青年科学基金项目
Web结构和社会信息相关性模型及其计算实验方法研究
  • 批准号:
    60573166
  • 批准年份:
    2005
  • 资助金额:
    24.0 万元
  • 项目类别:
    面上项目
基于万维网服务的协同计算模型的研究
  • 批准号:
    90412002
  • 批准年份:
    2004
  • 资助金额:
    30.0 万元
  • 项目类别:
    重大研究计划
WWW多媒体内容安全模型与算法研究
  • 批准号:
    60472082
  • 批准年份:
    2004
  • 资助金额:
    24.0 万元
  • 项目类别:
    面上项目

相似海外基金

Analysis of lifestyle and health texts on the WWW consisting of text and numeric data.
对 WWW 上由文本和数字数据组成的生活方式和健康文本的分析。
  • 批准号:
    18K11549
  • 财政年份:
    2018
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Search Engine Result Page with Visual Context and WWW Navigation
具有视觉上下文和 WWW 导航的搜索引擎结果页面
  • 批准号:
    23700107
  • 财政年份:
    2011
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
Search and Ranking of How-to Information Pages on the Basis of Understandability
基于可理解性的指导信息页面的搜索和排名
  • 批准号:
    22700108
  • 财政年份:
    2010
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
Research on learning community building with a lifelong learning web site.
终身学习网站学习社区建设研究。
  • 批准号:
    22240080
  • 财政年份:
    2010
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Object Identification System using Web Image Collection and Machine Learning
使用网络图像收集和机器学习的对象识别系统
  • 批准号:
    21700121
  • 财政年份:
    2009
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了