曖昧な質問に対応する対話型質問応答システム

针对歧义问题的互动问答系统

基本信息

项目摘要

本研究課題では、ユーザの質問が暖昧であったときに、ユーザに対して問い合わせを行うことによって適切な解答を選択する対話型質問応答システムを構築することを目的とする。前年度までは知識源となるコーパスとして新聞記事を用いていたが、獲得できる知識に偏りがあるという問題点があった。本年度は、より多様な知識の獲得が期待できるウェブを知識源とし、そのために必要なシステムの改変に取り組んだ。ユーザの質問の暖昧性を検出するために、ウェブページ上の表を抽出する手法とテキスト解析に基づく手法の2つを考案した。ウェブページ上の表を抽出する手法では、ユーザの暖昧な質問に対し、それに対応する複数の解答を一覧表示している表をウェブから発見し、ユーザに提示する。質問文中の主要なキーワードが表の1行目または1列目にあるか、残りのキーワードが表の近傍にあるか、表の一行または一列上にあるテキストが質問に対する解答タイプと一致しているか、などの条件をチェックし、条件を満たす表を抽出する。一方、テキスト解析に基づく手法では、まずキーワード検索でウェブページを獲得し、解答候補を抽出する。次にキーワードの周辺にある限定表現をパタンマッチによって抽出する。最後に共通の属性を持つ限定表現をまとめて解答群を作成し、ユーザに提示する。さらに、まずウェブページ上の表を抽出を試み、ユーザに提示するのに適切な表を発見できなかった場合にはテキスト解析に基づく手法で動的に解答群を作成するという形式で、提案する2つの手法を併用するシステムを作成した。評価実験の結果、2つの手法を併用することにより、より多くの質問に対して適切に暖昧性を検出できることを確認した。
本研究项目的目的是构建一个交互式问答系统,当用户的问题不明确时,通过询问用户来选择合适的答案。直到前年,报纸文章都被用作知识来源的语料库,但存在一个问题,即可以获得的知识存在偏差。今年,我们将重点放在网络作为知识源,我们可以期望获得更多样化的知识,并致力于修改为此目的所需的系统。为了检测用户问题中的歧义,我们设计了两种方法:一种是从网页中提取表格,另一种是基于文本分析。在从网页提取表格的方法中,从网络中发现列出了与用户提出的模糊问题相对应的多个答案的表格并将其呈现给用户。问题文本中的主要关键字是否位于表格的第一行或第一列?表格上方的一行或一列的文本是否与问题的答案类型相匹配?满足条件。另一方面,基于文本分析的方法首先通过关键词搜索获取网页并提取候选答案。接下来,通过模式匹配提取围绕关键字的有限表达。最后,将具有共同属性的有限表达式分组在一起以创建答案组并呈现给用户。此外,我们首先尝试从网页中提取表格,如果我们找不到合适的表格来呈现给用户,我们提出了一种使用基于文本分析的方法动态创建一组答案的方法。同时使用这两种方法的系统。评估实验的结果表明,通过结合使用这两种方法,可以针对大量问题正确检测歧义。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

白井 清昭其他文献

評判情報分析のための製品属性タグ付きコーパスの半自動構築
半自动构建带有产品属性标签的语料库进行声誉信息分析
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中村 駆;白井 清昭
  • 通讯作者:
    白井 清昭
決定木に基づく対話行為のタグ付け支援
支持基于决策树标记对话行为
アニメーションのための料理動作辞書の構築
为动画构建烹饪动作词典

白井 清昭的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('白井 清昭', 18)}}的其他基金

Identifying Usefulness of User Review Considering Mention of Target Entity
考虑提及目标实体来识别用户评论的有用性
  • 批准号:
    23K11228
  • 财政年份:
    2023
  • 资助金额:
    $ 2.24万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
MSLR法における未知語処理に関する研究
MSLR方法中未知词处理的研究
  • 批准号:
    11780254
  • 财政年份:
    1999
  • 资助金额:
    $ 2.24万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

Syntax interface issues in the acquisition of L2 English prepositions
L2英语介词习得中的语法接口问题
  • 批准号:
    26770195
  • 财政年份:
    2014
  • 资助金额:
    $ 2.24万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
A study on Information Structure of the English perfect and temporal adverbials
英语完成时态状语的信息结构研究
  • 批准号:
    26370567
  • 财政年份:
    2014
  • 资助金额:
    $ 2.24万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Environmental sociological study of resilience to cope with risk and living law
应对风险的复原力和生活规律的环境社会学研究
  • 批准号:
    25780313
  • 财政年份:
    2013
  • 资助金额:
    $ 2.24万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
Doctoral Dissertation Research: Consequences of Translation Ambiguity for Bilingual Word Meaning
博士论文研究:双语词义翻译歧义的后果
  • 批准号:
    1052283
  • 财政年份:
    2011
  • 资助金额:
    $ 2.24万
  • 项目类别:
    Standard Grant
Building a large-scale Japanese Combinatory Categorial Grammar by extracting lexical entries from corpora
通过从语料库中提取词汇条目构建大规模日语组合范畴语法
  • 批准号:
    21500152
  • 财政年份:
    2009
  • 资助金额:
    $ 2.24万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了