喵ID:o8TWFQ免责声明

Robust Text Classifier on Test-Time Budgets

基本信息

DOI:
10.18653/v1/d19-1108
发表时间:
2018-08
影响因子:
9.5
通讯作者:
Rizwan Parvez;Tolga Bolukbasi;Kai-Wei Chang;Venkatesh Saligrama
中科院分区:
材料科学2区
文献类型:
--
作者: Rizwan Parvez;Tolga Bolukbasi;Kai-Wei Chang;Venkatesh Saligrama研究方向: -- MeSH主题词: --
关键词: --
来源链接:pubmed详情页地址

文献摘要

We design a generic framework for learning a robust text classification model that achieves high accuracy under different selection budgets (a.k.a selection rates) at test-time. We take a different approach from existing methods and learn to dynamically filter a large fraction of unimportant words by a low-complexity selector such that any high-complexity state-of-art classifier only needs to process a small fraction of text, relevant for the target task. To this end, we propose a data aggregation method to train the classifier, allowing it to achieve competitive performance on fractured sentences. On four benchmark text classification tasks, we demonstrate that the framework gains consistent speedup with little degradation in accuracy on various selection budgets.
我们设计了一个通用框架,用于学习一个强大的文本分类模型,该模型在测试时间时在不同的选择预算(又称选择率)下实现高精度。我们采用与现有方法不同的方法,并通过低复杂性选择器学习动态过滤大量不重要的单词,以使任何高复杂性的最先进的分类器都只需要处理一小部分文本,与该文本有关目标任务。为此,我们提出了一种数据聚合方法来训练分类器,从而使其能够在破裂的句子上实现竞争性能。在四个基准的文本分类任务上,我们证明该框架在各种选择预算中的准确性几乎没有降解,从而获得了一致的加速。
参考文献(45)
被引文献(2)

数据更新时间:{{ references.updateTime }}

关联基金

CRII: RI: Learning Structured Prediction Models with Auxiliary Supervision
批准号:
1760523
批准年份:
2017
资助金额:
17.09
项目类别:
Standard Grant
Rizwan Parvez;Tolga Bolukbasi;Kai-Wei Chang;Venkatesh Saligrama
通讯地址:
--
所属机构:
--
电子邮件地址:
--
免责声明免责声明
1、猫眼课题宝专注于为科研工作者提供省时、高效的文献资源检索和预览服务;
2、网站中的文献信息均来自公开、合规、透明的互联网文献查询网站,可以通过页面中的“来源链接”跳转数据网站。
3、在猫眼课题宝点击“求助全文”按钮,发布文献应助需求时求助者需要支付50喵币作为应助成功后的答谢给应助者,发送到用助者账户中。若文献求助失败支付的50喵币将退还至求助者账户中。所支付的喵币仅作为答谢,而不是作为文献的“购买”费用,平台也不从中收取任何费用,
4、特别提醒用户通过求助获得的文献原文仅用户个人学习使用,不得用于商业用途,否则一切风险由用户本人承担;
5、本平台尊重知识产权,如果权利所有者认为平台内容侵犯了其合法权益,可以通过本平台提供的版权投诉渠道提出投诉。一经核实,我们将立即采取措施删除/下架/断链等措施。
我已知晓