Development for speech interface for form -based in formation access services on Web

基于表单的Web信息访问服务语音接口的开发

基本信息

  • 批准号:
    13558033
  • 负责人:
  • 金额:
    $ 4.29万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
  • 财政年份:
    2001
  • 资助国家:
    日本
  • 起止时间:
    2001 至 2003
  • 项目状态:
    已结题

项目摘要

While some speech interface systems have been developed for accessing Web resources, they are limited for accessing some specific contents and they don't provide a universal interface for arbitrary information retrieval services on the WWW. We propose an interactive speech user interface system, which could be applied to many form-based information retrieval services of the WVVW. In particular, our system was implemented based on a client-server, a Web proxy-centered architecture and employed an information extraction and language processing of HTML documents for providing a general-purpose interface for many form-based WWW contents. We also performed some experiments by 12 subjects for the comparison of the usability under different usage conditions. As a result, the proposed system attained comparative and higher expected usability measures over the pen-touch input method under the condition of an ideal speech recognition performance, and could be expected to achieve the effectivenes … More s or the superiority over a pen touch-only interface in terms of the usability as their usage condition approaches to a realistic PDA usage condition.We also proposed an. interface for a name input based on speech recognition using syllable-based N-gram and a word dictionary, which was frequently required to input into form-based web pages. User first utters a name and then chooses the correct word/syllables by pen touch from word/syllable candidates which were obtained from speech recognition. Name utterance is hard to recognize accurately because of the large vocabulary size, so the system uses continuous syllable recognition with syllable-based N-gram and isolated word recognition with a dictionary containing frequent words. The user can find the correct the answer from word candidates or syllable sequence candidates at a rate of 82-86%, and can input correct name at a rate of 94-96% with syllable selection from the syllable lattice. Some subjects used this interface and felt that it was useful. Less
尽管已经开发了一些语音接口系统用于访问Web资源,但它们限制用于访问某些特定内容,并且没有为www上的任意信息检索服务提供通用界面。我们提出了一个交互式语音用户界面系统,该系统可以应用于WVVW的许多基于表单的信息检索服务。特别是,我们的系统是基于客户端服务器,以Web代理为中心的体系结构实现的,并采用了HTML文档的信息提取和语言处理,以为许多基于表单的WWW内容提供通用界面。我们还通过12名受试者进行了一些实验,以比较不同使用条件下的可用性。结果,在理想的语音识别性能的条件下,提出的系统在笔触输入方法上实现了比较和更高的预期可用性度量,并且可以预期可以实现有效性……在使用ANERACIST PDA使用条件下,我们的使用条件方法更高的是纯可用性的唯一性界面。基于语音识别的名称输入的接口使用基于Sylable的n-gram和一个单词词典,通常需要将其输入基于表单的网页。用户首先说明一个名称,然后从单词/sylable候选者中选择正确的单词/sylables,这些单词/sylables是从语音识别中获得的。由于词汇大小较大,因此很难准确地识别名称话语,因此系统使用基于音节的N-gram的连续音节识别和带有经常包含单词的字典的孤立单词识别。用户可以以82-86%的速率找到正确的答案或音节序列的答案,并且可以以94-96%的速度输入正确的名称,并从音节晶格中选择音节。一些受试者使用了此界面,并认为它很有用。较少的

项目成果

期刊论文数量(25)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
山田大輔, 北岡教英, 中川聖一: "音源情報の特徴量を用いた音声認識"電気学会電子情報システム部門誌(C). 122・C・12. 2028-2034 (2002)
山田大辅、北冈纪英、中川精一:“利用声源信息特征的语音识别”日本电气工程学会电子信息系统分部期刊(C)122・C・12 2028-2034(2002)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
松下雅彦: "音声入力によるWeb検索のためのキーワード認識・抽出法の検討"情報処理学会,音声言語情報処理. SLP-48(4). 21-28 (2003)
Masahiko Matsushita:“使用语音输入进行网络搜索的关键字识别和提取方法的研究”,日本信息处理学会,语音和语言信息处理。21-28(2003)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
押川 洋徳, 北岡 教英, 中川 聖一: "ウェブブラウザにおける任意文字列入力を目的とした音声入力インターフェース"日本音響学会春季研究発表会. 217-218 (2002)
Hironori Oshikawa、Norihide Kitaoka 和 Seiichi Nakakawa:“在网络浏览器中输入任意字符串的语音输入接口”日本声学学会春季会议 217-218 (2002)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
押川洋徳: "音節N-gramと単語辞書併用による姓名入力インターフェース"情報処理学会,音声言語情報処理. SLP-49(30). 175-180 (2003)
Hironori Oshikawa:“使用音节 N-gram 和单词词典的名称输入界面”,日本信息处理学会,SLP-49(30) (2003)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
高橋伸寿, 北岡教英, 中川聖一: "連続音声認識システムSPOJUSの改善"日本音響学会講演論文集. 3,4,9. 145-146 (2003)
Nobuhisa Takahashi、Norihide Kitaoka、Seiichi Nakakawa:“连续语音识别系统 SPOJUS 的改进”日本声学学会论文集 3,4,9 (2003)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

NAKAGAWA Seiichi其他文献

小学校のICT活用をモデルとした保育での取り組み
以小学使用信息通信技术为蓝本的儿童保育举措
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    SEKI Hiroshi;YAMAMOTO Kazumasa;AKIBA Tomoyosi;NAKAGAWA Seiichi;堀田博史・佐藤朝美・中村恵;中川聖一;堀田博史・佐藤朝美・森田健宏
  • 通讯作者:
    堀田博史・佐藤朝美・森田健宏
幼児教育でのタブレット端末等の活用
幼儿教育中平板设备等的利用
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    SEKI Hiroshi;YAMAMOTO Kazumasa;AKIBA Tomoyosi;NAKAGAWA Seiichi;堀田博史・佐藤朝美・中村恵
  • 通讯作者:
    堀田博史・佐藤朝美・中村恵
最近の音声言語処理研究の動向 - 筆者の音声認識、音声翻訳、話者認識の研究を中心として -
口语处理研究的最新动态 - 重点关注作者在语音识别、语音翻译、说话人识别方面的研究 -
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    SEKI Hiroshi;YAMAMOTO Kazumasa;AKIBA Tomoyosi;NAKAGAWA Seiichi;堀田博史・佐藤朝美・中村恵;中川聖一
  • 通讯作者:
    中川聖一

NAKAGAWA Seiichi的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('NAKAGAWA Seiichi', 18)}}的其他基金

A detection method using relative phase information for spoofed speech based on speech synthesis, speaker adaptation and edited speech
一种基于语音合成、说话人适应和编辑语音的利用相对相位信息的欺骗语音检测方法
  • 批准号:
    16K12461
  • 财政年份:
    2016
  • 资助金额:
    $ 4.29万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
Study on privacy protection in spoken language
口语隐私保护研究
  • 批准号:
    22650034
  • 财政年份:
    2010
  • 资助金额:
    $ 4.29万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
High accuracy transcription, cleaning and fast term detection for spoken documents
语音文档的高精度转录、清理和快速术语检测
  • 批准号:
    22300059
  • 财政年份:
    2010
  • 资助金额:
    $ 4.29万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Automatic indexing for lecture speech and its advanced utilization through speech interaction
讲座演讲自动索引及其通过语音交互的高级利用
  • 批准号:
    17300064
  • 财政年份:
    2005
  • 资助金额:
    $ 4.29万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
A study on content summarization for large spoken documents and content retrieval through spoken dialogue
大型口语文档内容摘要及口语对话内容检索研究
  • 批准号:
    13480095
  • 财政年份:
    2001
  • 资助金额:
    $ 4.29万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Studies on Speech Recognition, Closed Caption and Summarization of Broadcast News
广播新闻语音识别、隐藏式字幕和摘要研究
  • 批准号:
    09480064
  • 财政年份:
    1997
  • 资助金额:
    $ 4.29万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Development of a multi-modal dialogue system and a tool for a spoken dialogue system
多模态对话系统和口语对话系统工具的开发
  • 批准号:
    08558030
  • 财政年份:
    1996
  • 资助金额:
    $ 4.29万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
A study on multi-modal man-machine interface through spontaneous speech
基于自发语音的多模态人机界面研究
  • 批准号:
    06452401
  • 财政年份:
    1994
  • 资助金额:
    $ 4.29万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
A Research for the Formation of Basic Concepts in Physics
物理学基本概念形成的研究
  • 批准号:
    05680163
  • 财政年份:
    1993
  • 资助金额:
    $ 4.29万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
A Study on Ambiguous Utterance Understanding for Speech Input
语音输入的歧义话语理解研究
  • 批准号:
    03452167
  • 财政年份:
    1991
  • 资助金额:
    $ 4.29万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (B)

相似国自然基金

具有认知能力的可解释多模态信息检索方法研究
  • 批准号:
    62372357
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
面向结构化信息的智能可信的检索技术
  • 批准号:
    62302486
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
知识引导的深度哈希方法研究
  • 批准号:
    62372233
  • 批准年份:
    2023
  • 资助金额:
    50.00 万元
  • 项目类别:
    面上项目
面向决策辅助的信息检索理论与技术
  • 批准号:
    62372431
  • 批准年份:
    2023
  • 资助金额:
    50.00 万元
  • 项目类别:
    面上项目
大数据时代,掩食双星的搜索、分类与研究
  • 批准号:
    12373111
  • 批准年份:
    2023
  • 资助金额:
    52.00 万元
  • 项目类别:
    面上项目

相似海外基金

Travel: Student Support for the 47th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR 2024)
旅行:学生支持第 47 届国际 ACM SIGIR 信息检索研究与发展会议 (SIGIR 2024)
  • 批准号:
    2409649
  • 财政年份:
    2024
  • 资助金额:
    $ 4.29万
  • 项目类别:
    Standard Grant
CAREER: Explanation-based Optimization of Diversified Information Retrieval to Enhance AI Systems
职业:基于解释的多样化信息检索优化以增强人工智能系统
  • 批准号:
    2339932
  • 财政年份:
    2024
  • 资助金额:
    $ 4.29万
  • 项目类别:
    Continuing Grant
SBIR Phase I: Knowledge Graph-powered Information Retrieval and Causal Inference
SBIR 第一阶段:知识图谱驱动的信息检索和因果推理
  • 批准号:
    2335357
  • 财政年份:
    2024
  • 资助金额:
    $ 4.29万
  • 项目类别:
    Standard Grant
Core 1: Biostatistics & Bioinformatics Core
核心1:生物统计学
  • 批准号:
    10716157
  • 财政年份:
    2023
  • 资助金额:
    $ 4.29万
  • 项目类别:
ClinEX - Clinical Evidence Extraction, Representation, and Appraisal
ClinEX - 临床证据提取、表示和评估
  • 批准号:
    10754029
  • 财政年份:
    2023
  • 资助金额:
    $ 4.29万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了