学術論文検索におけるユーザの視点に基づいたブーリアン型検索クエリ作成支援の研究

学术论文搜索中基于用户视角创建布尔搜索查询的支持研究

基本信息

项目摘要

本年度は,ユーザが考案したブーリアン型検索クエリに対して,検索条件ANDで結合する候補語を推薦するシステムを構築した.提案システムでは,検索クエリとANDで結合される語は,検索クエリと関連性が高く,さらにいずれの検索語と同義的あるいは類似的でないものが適切であるという仮定に基づき,トピックモデルおよび単語分散表現による単語分散表現を用いて推定を行った.まず,Latent Dirichlet Allocationを用いて,検索クエリと関連している可能性の高い語をランク付けする.次に,word2vecを用いて,いずれの検索語と同義的かつ類似的でない可能性の高い語をランク付けする.そして,これら2種類の結果を統合し,最もランクの高い語から順に候補語としてユーザに提示する.実験では,NTCIR-1 ,-2データセットに収録されている15種類の検索課題に対して考案した検索クエリを用いて,システムが提示した上位5件の候補語を検証した.具体的には,検索クエリを用いたクエリ尤度モデルによるランキングを行い,ランキング結果の上位100, 200, 300, 400, 500件を検索結果として獲得する場合に対する再現率により,初期の検索クエリおよびシステムが出力した候補語に対してユーザが最も再現率が向上する選択を行った場合を比較し,検索性能の変化を検証した.なお,本実験では,候補語に対するユーザの操作は,上位5件の候補語から1つの語を選択および適切な語が出力されていなかったため選択しないことを仮定している.その結果,検索結果として獲得する論文数の各条件において,平均で4.44%の向上が期待できることが確認された.
今年,我们建立了一个系统,该系统推荐使用搜索标准并为用户设计的布尔搜索查询组合的候选单词。在拟议的系统中,我们估算了与搜索查询相结合的单词,并且基于假设它们与搜索查询高度相关,并且使用主题模型和单词方差表示,它们与任何搜索词没有同义词或与任何搜索词相似。首先,使用潜在的dirichlet分配来对可能与搜索查询有关的单词进行排名。接下来,Word2Vec用于对可能是同义词且与任何搜索词不相似的单词进行排名。然后将这两种类型的结果组合在一起,并将其作为候选单词呈现给用户,从最高等级开始。在实验中,我们使用了针对NTCIR-1和2数据集中包含的15种搜索任务设计的搜索查询来验证系统提出的前五名候选单词。具体而言,我们使用搜索查询使用查询可能性模型进行了排名,并基于系统在系统输出的初始搜索查询和候选单词最多选择的情况下,基于何时获得排名结果的前100、200、200、200、300、400和500个搜索结果的召回率。在此实验中,假定用户对候选单词的操作将不会从前5个候选单词中选择,因为他们没有输出适当的单词。结果,可以证实,在获取的论文数量作为搜索结果的每种情况下,平均提高了4.44%。

项目成果

期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
網羅性を重視した学術論文に対する検索手法
一种强调综合性的学术论文检索方法
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    福田悟志;冨浦洋一
  • 通讯作者:
    冨浦洋一
論文検索における適合性フィードバックを用いたクエリ拡張支援
在文章搜索中使用相关性反馈的查询扩展支持
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    出永悠真;福田悟志;冨浦洋一
  • 通讯作者:
    冨浦洋一
学術論文検索におけるAND と結合する語の推薦の検討
学术论文检索中结合AND推荐词的思考
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    富田 誠;田島 宏;藤木 武史;福田悟志
  • 通讯作者:
    福田悟志
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

福田 悟志其他文献

特許中の画像とテキストを用いた手順オントロジーの構築
使用专利图像和文本构建程序本体
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    樊 エイブン;福田 悟志;難波 英嗣,
  • 通讯作者:
    難波 英嗣,

福田 悟志的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('福田 悟志', 18)}}的其他基金

感情分析の観点から信頼性が低い情報が拡散されるメカニズムを解析するための研究
从情感分析角度分析不可靠信息传播机制的研究
  • 批准号:
    22K18152
  • 财政年份:
    2022
  • 资助金额:
    $ 2.25万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists

相似海外基金

医学論文検索における生成AI技術導入の有用性および妥当性の検証
验证在医学文章搜索中引入生成式人工智能技术的有用性和有效性
  • 批准号:
    24K15655
  • 财政年份:
    2024
  • 资助金额:
    $ 2.25万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
科学におけるエコーチェンバー現象の実験的解明
科学中回声室现象的实验阐明
  • 批准号:
    21K18018
  • 财政年份:
    2021
  • 资助金额:
    $ 2.25万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Consortium for Increasing Research and Collaborative Learning Experiences (CIRCLE)
增加研究和协作学习体验联盟 (CIRCLE)
  • 批准号:
    10381713
  • 财政年份:
    2020
  • 资助金额:
    $ 2.25万
  • 项目类别:
Consortium for Increasing Research and Collaborative Learning Experiences (CIRCLE)
增加研究和协作学习体验联盟 (CIRCLE)
  • 批准号:
    10597181
  • 财政年份:
    2020
  • 资助金额:
    $ 2.25万
  • 项目类别:
Scholar2Vec: 研究者の多様な活動情報を埋め込める深層潜在空間の構築
Scholar2Vec:构建深层潜在空间,可以嵌入研究人员多样化活动的信息
  • 批准号:
    20H04484
  • 财政年份:
    2020
  • 资助金额:
    $ 2.25万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了