EAGER: Learning to Efficiently Rank with Cascades

EAGER:学习使用级联进行有效排名

基本信息

  • 批准号:
    1144034
  • 负责人:
  • 金额:
    $ 15万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2011
  • 资助国家:
    美国
  • 起止时间:
    2011-09-01 至 2014-08-31
  • 项目状态:
    已结题

项目摘要

Text search is undeniably vital to today's information-based societies, helping users locate relevant information in web pages, journal articles, news stories, blogs, emails, tweets, and a myriad of other sources. Naturally, users desire results that are not only good but also fast. Learning to rank, the dominant approach to information retrieval (IR) today, focuses almost exclusively on effectiveness, often neglecting the runtime speed (i.e., efficiency) of the ranking functions. This project contributes to the emerging research area of learning to efficiently rank, which aims to let algorithm designers capture, model, and reason about tradeoffs between effectiveness and efficiency in a unified framework. Specifically, this project explores a novel cascade model for retrieval, where ranking is broken into a finite number of distinct stages. Each stage considers successively richer and more complex features, but over successively smaller candidate document sets. The intuition is that although complex features are more time-consuming to compute, examining fewer documents offsets the additional overhead. In other words, the cascade model views retrieval as a multi-stage progressive refinement problem. Based on the survey of the current state-of-the-art, knowledge, this is the first project to explore this approach to the ranking problem, marking a substantial departure from previous "monolithic" ranking functions. Although exploration in this uncharted area carries some risk, this research promises to open up a new frontier in IR research. This project aims to narrow the chasm between academic and industrial IR research by bringing together theoretical IR research and practical considerations in "real-world" search. It is expected that the cascade model will be of interest to web search engine companies, thus providing a path from the exploratory research results to significant impact in production systems. Furthermore, this work dovetails with the emerging area of green computing: more efficient algorithms use less energy, hence help reduce the environmental footprint of web-scale services. The project web site (http://www.umiacs.umd.edu/~jimmylin/projects/) includes more information about this project and will be used for the release of a prototype as part of the Ivory open-source retrieval toolkit.
无可否认,文本搜索对于当今的信息社会至关重要,它可以帮助用户在网页、期刊文章、新闻报道、博客、电子邮件、推文和无数其他来源中查找相关信息。自然地,用户不仅希望获得好的结果,而且希望获得快速的结果。学习排序是当今信息检索 (IR) 的主要方法,它几乎完全关注有效性,常常忽略排序函数的运行速度(即效率)。该项目为学习高效排名这一新兴研究领域做出了贡献,旨在让算法设计者在统一的框架中捕获、建模和推理有效性和效率之间的权衡。具体来说,该项目探索了一种新颖的级联检索模型,其中排名被分为有限数量的不同阶段。每个阶段都会考虑逐渐丰富和复杂的特征,但会考虑逐渐较小的候选文档集。直觉是,虽然复杂的特征计算起来更耗时,但检查更少的文档可以抵消额外的开销。换句话说,级联模型将检索视为多阶段渐进细化问题。基于对当前最先进知识的调查,这是第一个探索这种排名问题方法的项目,标志着与以前的“单一”排名功能的实质性背离。尽管探索这个未知领域存在一定风险,但这项研究有望开辟红外研究的新领域。该项目旨在通过将理论 IR 研究和“现实世界”搜索中的实际考虑结合起来,缩小学术和工业 IR 研究之间的鸿沟。预计级联模型将引起网络搜索引擎公司的兴趣,从而提供从探索性研究结果到对生产系统产生重大影响的途径。此外,这项工作与新兴的绿色计算领域相吻合:更高效的算法使用更少的能源,因此有助于减少网络规模服务的环境足迹。该项目网站 (http://www.umiacs.umd.edu/~jimmylin/projects/) 包含有关该项目的更多信息,并将用于作为 Ivory 开源检索工具包的一部分发布原型。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Jimmy Lin其他文献

Sensornet
传感器网
  • DOI:
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Rodney Topor;Kenneth Salem;Amarnath Gupta;K. Goda;John F. Gehrke;N. Palmer;Mohamed Sharaf;Alexandros Labrinidis;J. Roddick;Ariel Fuxman;Renée J. Miller;Wang;Anastasios Kementsietsidis;Philippe Bonnet;D. Shasha;Ronald Peikert;Bertram Ludäscher;S. Bowers;T. McPhillips;Harald Naumann;K. Voruganti;J. Domingo;Ben Carterette;Panagiotis G. Ipeirotis;Marcelo Arenas;Y. Manolopoulos;Y. Theodoridis;V. Tsotras;B. Carminati;Jan Jurjens;Eduardo B. Fernandez;Murat Kantarcıoǧlu;Jaideep Vaidya;Indrakshi Ray;Athena Vakali;Cristina Sirangelo;E. Pitoura;Himanshu Gupta;Surajit Chaudhuri;G. Weikum;Ulf Leser;David W. Embley;Fausto Giunchiglia;P. Shvaiko;Mikalai Yatskevich;Edward Y. Chang;Christine Parent;S. Spaccapietra;E. Zimányi;G. Anadiotis;S. Kotoulas;Ronny Siebes;Grigoris Antoniou;D. Plexousakis;J. Bailey;François Bry;Tim Furche;Sebastian Schaffert;David Martin;Gregory D. Speegle;Krithi Ramamritham;P. Chrysanthis;Kai;Stéphane Bressan;S. Abiteboul;D. Suciu;G. Dobbie;Tok Wang Ling;Sugato Basu;Ramesh Govindan;Michael H. Böhlen;C. S. Jensen;Jianyong Wang;K. Vidyasankar;A. Chan;Serge Mankovski;S. Elnikety;P. Valduriez;Yannis Velegrakis;Mario A. Nascimento;Michael Huggett;Andrew U. Frank;Yanchun Zhang;Guandong Xu;R. Snodgrass;Alan Fekete;Marcus Herzog;Konstantinos Morfonios;Y. Ioannidis;E. Wohlstadter;M. Matera;F. Schwagereit;Steffen Staab;Keir Fraser;Jingren Zhou;M. Mokbel;Walid G. Aref;Mirella M. Moro;Markus Schneider;Panos Kalnis;Gabriel Ghinita;Michael F. Goodchild;Shashi Shekhar;James Kang;Vijayaprasath Gandhi;Nikos Mamoulis;Betsy George;Michel Scholl;Agnès Voisard;Ralf Hartmut Güting;Yufei Tao;Dimitris Papadias;Peter Revesz;G. Kollios;E. Frentzos;Apostolos N. Papadopoulos;Bernhard Thalheim;Jovan Pehcevski;Benjamin Piwowarski;S. Theodoridis;Konstantinos Koutroumbas;George Karabatis;Don Chamberlin;Philip A. Bernstein;Michael H. Böhlen;J. Gamper;Ping Li;Kazimierz Subieta;S. Harizopoulos;Ethan Zhang;Yi Zhang;Theodore Johnson;Hans;S. Fienberg;Jiashun Jin;Radu Sion;C. Paice;Nikos Hardavellas;Ippokratis Pandis;Edie M. Rasmussen;Hiroshi Yoshida;G. Graefe;Bernd Reiner;Karl Hahn;K. Wada;T. Risch;Jiawei Han;Bolin Ding;Lukasz Golab;Michael Stonebraker;Bibudh Lahiri;Srikanta Tirthapura;Erik Vee;Yanif Ahmad;U. Çetintemel;Mitch Cherniack;S. Zdonik;Mariano P. Consens;M. Lalmas;R. Baeza;D. Hiemstra;Peer Krögerand;Arthur Zimek;Nick Craswell;Carson Kai;Maxime Crochemore;Thierry Lecroq;Arie Shoshani;Jimmy Lin;Hwanjo Yu;David B. Lomet;H. Hinterberger;Ninghui Li;Phillip B. Gibbons;Mouna Kacimi;Thomas Neumann
  • 通讯作者:
    Thomas Neumann
PartsList: a web-based system for dynamically ranking protein folds based on disparate attributes, including whole-genome expression and interaction information.
PartsList:一个基于网络的系统,用于根据不同的属性(包括全基因组表达和相互作用信息)对蛋白质折叠进行动态排名。
  • DOI:
  • 发表时间:
    2001
  • 期刊:
  • 影响因子:
    14.9
  • 作者:
    Jiang Qian;Brad Stenger;Cyrus A. Wilson;Jimmy Lin;R. Jansen;S. Teichmann;Jong H. Park;W. G. Krebs;Haiyuan Yu;Vadim Alexandrov;N. Echols;M. Gerstein
  • 通讯作者:
    M. Gerstein
A Machine Learner’s Guide to Streamflow Prediction
机器学习者的水流预测指南
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    M. Gauch;D. Klotz;Frederik Kratzert;G. Nearing;Sepp Hochreiter;Jimmy Lin
  • 通讯作者:
    Jimmy Lin
Systems biology approach to integrative comparative genomics
综合比较基因组学的系统生物学方法
  • DOI:
    10.1586/14789450.4.1.107
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    3.4
  • 作者:
    Jimmy Lin;Jiang Qian
  • 通讯作者:
    Jiang Qian
Structural Genomics Analysis : Phylogenetic Patterns of Unique , Shared , and Common Folds in 20 Genomes
结构基因组分析:20个基因组中独特、共享和共同折叠的系统发育模式
  • DOI:
  • 发表时间:
    2001
  • 期刊:
  • 影响因子:
    0
  • 作者:
    H. Hegyi;Jimmy Lin;M. Gerstein
  • 通讯作者:
    M. Gerstein

Jimmy Lin的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Jimmy Lin', 18)}}的其他基金

Student Travel Support for the 2014 IEEE International Conference on Big Data
2014 年 IEEE 国际大数据会议学生旅行支持
  • 批准号:
    1444666
  • 财政年份:
    2014
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
II-EN: Hadoop NextGen Infrastructure for Heterogeneous Approaches to Data-Intensive Computing
II-EN:用于数据密集型计算异构方法的 Hadoop NextGen 基础设施
  • 批准号:
    1405688
  • 财政年份:
    2014
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
III: Small: Providing Relevant and Timely Results: Real-Time Search Architectures and Relevance Algorithms
III:小型:提供相关且及时的结果:实时搜索架构和相关性算法
  • 批准号:
    1218043
  • 财政年份:
    2012
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
DC: Small: Cross-Language Bayesian Models for Web-Scale Text Analysis Using MapReduce
DC:小型:使用 MapReduce 进行 Web 规模文本分析的跨语言贝叶斯模型
  • 批准号:
    1018625
  • 财政年份:
    2010
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
III: Small: Ivory -- A Hadoop Toolkit for Distributed Text Retrieval
III:小:Ivory——分布式文本检索的 Hadoop 工具包
  • 批准号:
    0916043
  • 财政年份:
    2009
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
2009 PI Meeting for the Cluster Exploratory Program
2009年集群探索计划PI会议
  • 批准号:
    0957954
  • 财政年份:
    2009
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
Putting the Clouds in Context: Statistical Machine Translation with MapReduce
将云放在上下文中:使用 MapReduce 进行统计机器翻译
  • 批准号:
    0836560
  • 财政年份:
    2008
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant

相似国自然基金

利用深度学习方法开发创新高精度城市风速及污染物扩散的预测模型研究
  • 批准号:
    42375193
  • 批准年份:
    2023
  • 资助金额:
    51 万元
  • 项目类别:
    面上项目
​基于自监督学习的医学图像质量迁移反问题理论
  • 批准号:
    12301546
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于共识主动性学习的城市电动汽车充电、行驶行为与交通网—配电网协同控制策略研究
  • 批准号:
    62363022
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目
基于脑电信号多域特征和深度学习的驾驶行为识别研究
  • 批准号:
    62366028
  • 批准年份:
    2023
  • 资助金额:
    33 万元
  • 项目类别:
    地区科学基金项目
基于自监督学习的脑电特征表达预训练模型研究
  • 批准号:
    62376098
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: NSF-BSF: SaTC: CORE: Small: Detecting malware with machine learning models efficiently and reliably
协作研究:NSF-BSF:SaTC:核心:小型:利用机器学习模型高效可靠地检测恶意软件
  • 批准号:
    2338301
  • 财政年份:
    2024
  • 资助金额:
    $ 15万
  • 项目类别:
    Continuing Grant
Collaborative Research: NSF-BSF: SaTC: CORE: Small: Detecting malware with machine learning models efficiently and reliably
协作研究:NSF-BSF:SaTC:核心:小型:利用机器学习模型高效可靠地检测恶意软件
  • 批准号:
    2338302
  • 财政年份:
    2024
  • 资助金额:
    $ 15万
  • 项目类别:
    Continuing Grant
Transformative approaches to rapidly and efficiently test demand creation interventions to promote HIV retesting in adults at increased risk of HIV
快速有效地检测需求创造干预措施的变革性方法,以促进艾滋病毒风险增加的成年人重新检测艾滋病毒
  • 批准号:
    10761117
  • 财政年份:
    2023
  • 资助金额:
    $ 15万
  • 项目类别:
Towards AI that is forever learning efficiently
迈向永远高效学习的人工智能
  • 批准号:
    2740621
  • 财政年份:
    2022
  • 资助金额:
    $ 15万
  • 项目类别:
    Studentship
SaTC: CORE: Small: LESS DOUBT: Learning Efficiently form Statistical Samples-Demonstrating Outcomes Using Better Tests
SaTC:核心:小:更少怀疑:从统计样本中有效学习 - 使用更好的测试展示结果
  • 批准号:
    2228884
  • 财政年份:
    2022
  • 资助金额:
    $ 15万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了