III: Small: Efficiency Optimization for Neural Document Ranking with Compact Representations

III:小:具有紧凑表示的神经文档排序的效率优化

基本信息

  • 批准号:
    2225942
  • 负责人:
  • 金额:
    $ 59.37万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2022
  • 资助国家:
    美国
  • 起止时间:
    2022-09-01 至 2025-08-31
  • 项目状态:
    未结题

项目摘要

Over the last few years, the resurgence of neural models has greatly advanced the field of information retrieval enabling retrieval engines to effectively match and rank search results in response to a user query. For example, this new technology has enable to determine the most relevant documents in response to a query even when some query keywords may not appear in these documents. The main drawback of using deep neural models for ranking is that the retrieval is extremely time consuming. As a result, such models cannot be deployed in many practical search applications. This project is focused on studying efficient solutions to perform neural ranking computation and the developed techniques will be evaluated using public datasets to assess the solution’s effectiveness. The project integrates the research with an educational plan including undergraduate and graduate students' involvement, instructional material development, and outreach activities. This project carries out a two-thrust research agenda for efficient neural ranking. The first thrust investigates a fast re-ranking scheme for a dual-encoding architecture by leveraging precomputed embeddings to compose a query representation with approximation, and combining deep contextual token interactions and traditional lexical matching features. The second thrust of this project investigates a compact representation of document embeddings and strike a balance of relevance and space efficiency which affects online inference latency. The project exploits the composite nature of ranking inference for answering a query to approximate query embeddings, and decouples ranking contribution of document embeddings in deriving a compact representation. This research will advance our fundamental understanding of relevance and efficiency tradeoffs in neural information retrieval, and significantly reduce the computing and space cost of online inference while retaining the essential benefits of deep learning for effective ranking on affordable computing platforms.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
在过去几年中,神经模型的复兴极大地推进了信息检索领域,使检索引擎能够根据用户查询有效地匹配和排名搜索结果,例如,这项新技术能够确定最相关的文档。即使某些查询关键字可能不会出现在这些文档中,也要响应查询。使用深度神经模型进行排名的主要缺点是检索非常耗时,因此,此类模型无法部署在许多实际搜索应用中。 .这个项目专注于研究执行神经排名计算的有效解决方案,并将使用公共数据集对所开发的技术进行评估,以评估集成解决方案的有效性。该项目的研究包括本科生和研究生的参与、教学材料的开发和推广。该项目开展了高效神经排序的两个重点研究议程,第一个重点是通过利用预先计算的嵌入来构建具有近似值的查询表示,研究双编码架构的快速重新排序方案。该项目的第二个重点是研究文档嵌入的紧凑表示,并在影响在线推理延迟的相关性和空间效率之间取得平衡。回答查询以近似查询嵌入,并在导出紧凑表示时解耦文档嵌入的排名贡献。这项研究将增进我们对神经信息检索中的相关性和效率权衡的基本理解。显着降低在线推理的计算和空间成本,同时保留深度学习的基本优势,以便在负担得起的计算平台上进行有效排名。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查进行评估,被认为值得支持标准。

项目成果

期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Balanced Knowledge Distillation with Contrastive Learning for Document Re-ranking
文档重排序的对比学习平衡知识蒸馏
Optimizing Guided Traversal for Fast Learned Sparse Retrieval
优化引导遍历以实现快速学习的稀疏检索
Representation Sparsification with Hybrid Thresholding for Fast SPLADE-based Document Retrieval
具有混合阈值的表示稀疏化,用于基于 SPLADE 的快速文档检索
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Tao Yang其他文献

ACLD patients exhibit additional knee kinematic asymmetries at the speed level of healthy subjects
ACLD 患者在健康受试者的速度水平下表现出额外的膝关节运动不对称性
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    5.7
  • 作者:
    Lingchuang Kong;Tao Yang;Qing Wang;Yongliang Ou;Hua;Wenhan Huang;Zhang Tao;Yu Zhang;Xiaolong Zeng
  • 通讯作者:
    Xiaolong Zeng
[Generation high yield vaccine strain wholly derived from avian influenza viruses by reverse genetics].
全禽流感病毒反向遗传学一代高产疫苗株.
Running Hubble Tension and a H0 Diagnostic.
运行哈勃张力和 H0 诊断。
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    C. Krishnan;E. Colgáin;M. Sheikh;Tao Yang
  • 通讯作者:
    Tao Yang
Clinical evaluation of the rapid recovery of patients who underwent video-assisted thoracoscopic lung surgery under non-intubated anesthesia
非插管麻醉下电视胸腔镜肺部手术患者快速康复的临床评价
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Lin;B. Hou;Hua Jin;Y. Bo;Xinlong Chen;Jun Dai;Tao Yang;Bao;Jia;Hao Peng;Jun Peng
  • 通讯作者:
    Jun Peng
A new method to parallel implementation for batching vast small-scale computing tasks based on GPU
基于GPU的海量小规模计算任务并行并行实现新方法

Tao Yang的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Tao Yang', 18)}}的其他基金

EAGER: Efficient Privacy-aware Document Search in the Cloud
EAGER:云端高效的隐私意识文档搜索
  • 批准号:
    2040146
  • 财政年份:
    2020
  • 资助金额:
    $ 59.37万
  • 项目类别:
    Standard Grant
III: Small: Low-Cost Deduplication and Search for Versioned Datasets
III:小型:低成本重复数据删除和版本化数据集搜索
  • 批准号:
    1528041
  • 财政年份:
    2015
  • 资助金额:
    $ 59.37万
  • 项目类别:
    Standard Grant
III: Small: Parallel Similarity Comparison and Duplicate Detection with Incremental Computing
III:小:增量计算的并行相似性比较和重复检测
  • 批准号:
    1118106
  • 财政年份:
    2011
  • 资助金额:
    $ 59.37万
  • 项目类别:
    Standard Grant
SOFTWARE:"Cluster-based Runtime Support for Data-Intensive Online Applications"
软件:“数据密集型在线应用程序基于集群的运行时支持”
  • 批准号:
    0234346
  • 财政年份:
    2003
  • 资助金额:
    $ 59.37万
  • 项目类别:
    Continuing Grant
ITR: Optimizing Execution of Parallel Programs on a Cluster of Shared Memory Machines
ITR:优化共享内存机器集群上并行程序的执行
  • 批准号:
    0082666
  • 财政年份:
    2000
  • 资助金额:
    $ 59.37万
  • 项目类别:
    Standard Grant
CAREER: Scheduling and Run-time Support for Parallel Irregular Computations
职业:并行不规则计算的调度和运行时支持
  • 批准号:
    9702640
  • 财政年份:
    1997
  • 资助金额:
    $ 59.37万
  • 项目类别:
    Continuing Grant
U.S.-France Cooperative Research: Parameterized Task Graph Scheduling
美法合作研究:参数化任务图调度
  • 批准号:
    9513361
  • 财政年份:
    1996
  • 资助金额:
    $ 59.37万
  • 项目类别:
    Standard Grant
Research Initiation Award: Scheduling Task and Loop Parallelism on Message-Passing Architectures
研究启动奖:消息传递架构上的调度任务和循环并行性
  • 批准号:
    9409695
  • 财政年份:
    1994
  • 资助金额:
    $ 59.37万
  • 项目类别:
    Standard Grant

相似国自然基金

基于应税收入弹性的小微企业减税效率提升路径研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
新型污染物的母体暴露及对内源性代谢小分子跨胎盘转运效率的影响研究
  • 批准号:
    42111530087
  • 批准年份:
    2021
  • 资助金额:
    10 万元
  • 项目类别:
    国际(地区)合作与交流项目
多小核草履虫摄食群体微囊藻并降解藻毒素的效率、机制及生态效应
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    59 万元
  • 项目类别:
    面上项目
新型污染物的母体暴露及对内源性代谢小分子跨胎盘转运效率的影响研究
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    万元
  • 项目类别:
    国际(地区)合作与交流项目

相似海外基金

CIF: Small: Efficiency and Robustness of Secure Computation
CIF:小:安全计算的效率和稳健性
  • 批准号:
    2327981
  • 财政年份:
    2023
  • 资助金额:
    $ 59.37万
  • 项目类别:
    Standard Grant
SHF: Small: Improving Efficiency of Vision Transformers via Software-Hardware Co-Design and Acceleration
SHF:小型:通过软硬件协同设计和加速提高视觉变压器的效率
  • 批准号:
    2233893
  • 财政年份:
    2023
  • 资助金额:
    $ 59.37万
  • 项目类别:
    Standard Grant
CRISPR-Cas Editing as a Genetic Cure for Autosomal Dominant Polycystic Kidney Disease
CRISPR-Cas 编辑作为常染色体显性多囊肾病的基因治疗
  • 批准号:
    10822502
  • 财政年份:
    2023
  • 资助金额:
    $ 59.37万
  • 项目类别:
Novel Adipose Targeted Gene Therapy for Lipodystrophy
新型脂肪靶向基因疗法治疗脂肪营养不良
  • 批准号:
    10820263
  • 财政年份:
    2023
  • 资助金额:
    $ 59.37万
  • 项目类别:
The Injectrode- An injectable, easily removable electrode as a trial lead for baroreceptor activation therapy to treat hypertension and heart failure
Injectrode——一种可注射、易于拆卸的电极,作为压力感受器激活疗法的试验引线,以治疗高血压和心力衰竭
  • 批准号:
    10697600
  • 财政年份:
    2023
  • 资助金额:
    $ 59.37万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了