学術論文検索におけるユーザの視点に基づいたブーリアン型検索クエリ作成支援の研究

学术论文搜索中基于用户视角创建布尔搜索查询的支持研究

基本信息

项目摘要

本年度は,ユーザが考案したブーリアン型検索クエリに対して,検索条件ANDで結合する候補語を推薦するシステムを構築した.提案システムでは,検索クエリとANDで結合される語は,検索クエリと関連性が高く,さらにいずれの検索語と同義的あるいは類似的でないものが適切であるという仮定に基づき,トピックモデルおよび単語分散表現による単語分散表現を用いて推定を行った.まず,Latent Dirichlet Allocationを用いて,検索クエリと関連している可能性の高い語をランク付けする.次に,word2vecを用いて,いずれの検索語と同義的かつ類似的でない可能性の高い語をランク付けする.そして,これら2種類の結果を統合し,最もランクの高い語から順に候補語としてユーザに提示する.実験では,NTCIR-1 ,-2データセットに収録されている15種類の検索課題に対して考案した検索クエリを用いて,システムが提示した上位5件の候補語を検証した.具体的には,検索クエリを用いたクエリ尤度モデルによるランキングを行い,ランキング結果の上位100, 200, 300, 400, 500件を検索結果として獲得する場合に対する再現率により,初期の検索クエリおよびシステムが出力した候補語に対してユーザが最も再現率が向上する選択を行った場合を比較し,検索性能の変化を検証した.なお,本実験では,候補語に対するユーザの操作は,上位5件の候補語から1つの語を選択および適切な語が出力されていなかったため選択しないことを仮定している.その結果,検索結果として獲得する論文数の各条件において,平均で4.44%の向上が期待できることが確認された.
今年,我们构建了一个系统,可以推荐候选词,该候选词可以与搜索条件 AND 结合使用,用于用户设计的布尔搜索查询。在所提出的系统中,主题模型和单词分布基于这样的假设:通过AND与搜索查询组合的单词与搜索查询高度相关,并且与任何搜索词都不同义或相似。是使用基于表达式的词分布式表示来执行的。首先,我们使用潜在狄利克雷分配对可能与搜索查询相关的单词进行排名。接下来,我们使用 word2vec 对可能既不与任何搜索词同义也不相似的单词进行排名。然后将这两种类型的结果集成并按照最高排名的顺序作为候选词呈现给用户。在实验中,我们使用针对 NTCIR-1 和 -2 数据集中包含的 15 种搜索问题设计的搜索查询来验证系统呈现的前 5 个候选词。具体来说,我们使用搜索查询使用查询似然模型进行排名,并计算初始搜索查询,我们比较了用户选择系统输出的最能提高召回率的候选词的情况,并验证了变化搜索性能。在本实验中,我们假设用户对候选词的操作包括从前五个候选词中选择一个词,以及因为没有输出合适的词而没有选择一个词。结果证实,就作为搜索结果获得的论文数量而言,在每种条件下,预计平均可提高 4.44%。

项目成果

期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
網羅性を重視した学術論文に対する検索手法
一种强调综合性的学术论文检索方法
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    福田悟志;冨浦洋一
  • 通讯作者:
    冨浦洋一
論文検索における適合性フィードバックを用いたクエリ拡張支援
在文章搜索中使用相关性反馈的查询扩展支持
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    出永悠真;福田悟志;冨浦洋一
  • 通讯作者:
    冨浦洋一
学術論文検索におけるAND と結合する語の推薦の検討
学术论文检索中结合AND推荐词的思考
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    富田 誠;田島 宏;藤木 武史;福田悟志
  • 通讯作者:
    福田悟志
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

福田 悟志其他文献

特許中の画像とテキストを用いた手順オントロジーの構築
使用专利图像和文本构建程序本体
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    樊 エイブン;福田 悟志;難波 英嗣,
  • 通讯作者:
    難波 英嗣,

福田 悟志的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('福田 悟志', 18)}}的其他基金

感情分析の観点から信頼性が低い情報が拡散されるメカニズムを解析するための研究
从情感分析角度分析不可靠信息传播机制的研究
  • 批准号:
    22K18152
  • 财政年份:
    2022
  • 资助金额:
    $ 2.25万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists

相似海外基金

医学論文検索における生成AI技術導入の有用性および妥当性の検証
验证在医学文章搜索中引入生成式人工智能技术的有用性和有效性
  • 批准号:
    24K15655
  • 财政年份:
    2024
  • 资助金额:
    $ 2.25万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
科学におけるエコーチェンバー現象の実験的解明
科学中回声室现象的实验阐明
  • 批准号:
    21K18018
  • 财政年份:
    2021
  • 资助金额:
    $ 2.25万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Scholar2Vec: 研究者の多様な活動情報を埋め込める深層潜在空間の構築
Scholar2Vec:构建深层潜在空间,可以嵌入研究人员多样化活动的信息
  • 批准号:
    20H04484
  • 财政年份:
    2020
  • 资助金额:
    $ 2.25万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Comprehensive Research on Advanced Support for Searching Academic Papers from the User's Perspective
用户视角下学术论文检索高级支持综合研究
  • 批准号:
    15H01721
  • 财政年份:
    2015
  • 资助金额:
    $ 2.25万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Development of Learning System and Compilation of Graduation Papers Corpus for Supporting Japanese to Write Academic Papers in English
支持日本人用英语撰写学术论文的学习系统开发及毕业论文语料库的编制
  • 批准号:
    21520621
  • 财政年份:
    2009
  • 资助金额:
    $ 2.25万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了