RI: SMALL: Fast Prediction and Model Compression for Large-Scale Machine Learning
RI:SMALL:大规模机器学习的快速预测和模型压缩
基本信息
- 批准号:1901527
- 负责人:
- 金额:$ 36.28万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2018
- 资助国家:美国
- 起止时间:2018-08-13 至 2021-07-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
In order to handle large-scale problems, many algorithms have been proposed for improving the training speed of machine learning models. However, in many real world applications the bottleneck is at the prediction phase instead of the training phase due to the time and space complexity of prediction. Unlike the training phase that can run for several hours on multiple machines, the prediction phase usually runs on real-time systems; as a result, each prediction has to be done in a few seconds in order to provide immediate feedback to users. Furthermore, applications that run on mobile devices have even more strict constraints on memory capacity and computational resources. To address these issues, this research develops a new family of machine learning algorithms with faster prediction time and smaller model size. The outcome of this project creates a fundamental shift in the applicability of machine learning models to real-time online systems and on-device applications. Software packages and experimental platforms are made available to the public after being tested on applications. Besides the research objectives, the PI also pursues educational objectives including promoting undergraduate research, involving under-represented minorities in science and engineering, and developing undergraduate and graduate data science curriculums.The goal of this project is to develop novel approaches for reducing prediction time and model size of machine learning algorithms. In particular, the project focuses on machine learning applications with large output space (matrix factorization, extreme multi-class/multi-label classification), and highly nonlinear models (kernel methods and deep neural networks). A series of approximation algorithms are studied, including tree-based algorithms, clustering approaches, and sub-linear time search algorithms. A unified framework is developed for these algorithms and the trade-off between accuracy and prediction time/model size is studied both in theory and in practice. The proposed algorithms are evaluated on a broad range of real world applications, including online web services and on-device applications.
为了处理大规模问题,人们提出了许多算法来提高机器学习模型的训练速度。然而,在许多现实世界的应用中,由于预测的时间和空间复杂性,瓶颈位于预测阶段而不是训练阶段。与可以在多台机器上运行几个小时的训练阶段不同,预测阶段通常在实时系统上运行;因此,每个预测都必须在几秒钟内完成,以便为用户提供即时反馈。此外,在移动设备上运行的应用程序对内存容量和计算资源有更严格的限制。为了解决这些问题,本研究开发了一系列新的机器学习算法,具有更快的预测时间和更小的模型尺寸。该项目的成果使机器学习模型对实时在线系统和设备上应用程序的适用性发生了根本性转变。软件包和实验平台经过应用测试后向公众开放。除了研究目标外,PI 还追求教育目标,包括促进本科生研究、让科学和工程领域代表性不足的少数群体参与进来,以及开发本科生和研究生数据科学课程。该项目的目标是开发减少预测时间和数据科学的新方法。机器学习算法的模型大小。该项目特别关注具有大输出空间(矩阵分解、极端多类/多标签分类)和高度非线性模型(核方法和深度神经网络)的机器学习应用。研究了一系列近似算法,包括基于树的算法、聚类方法和次线性时间搜索算法。为这些算法开发了一个统一的框架,并在理论和实践中研究了准确性和预测时间/模型大小之间的权衡。所提出的算法在广泛的现实世界应用程序中进行了评估,包括在线网络服务和设备上的应用程序。
项目成果
期刊论文数量(21)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
SQL-Rank: A Listwise Approach to Collaborative Ranking
SQL-Rank:协作排名的列表方法
- DOI:
- 发表时间:2018-07
- 期刊:
- 影响因子:0
- 作者:Wu, Liwei;Hsieh, Cho;Sharpnack, James
- 通讯作者:Sharpnack, James
DRONE: Data-aware Low-rank Compression for Large NLP Models
DRONE:大型 NLP 模型的数据感知低阶压缩
- DOI:
- 发表时间:2024-09-14
- 期刊:
- 影响因子:0
- 作者:Patrick H. Chen;Hsiang;I. Dhillon;Cho
- 通讯作者:Cho
A Fast Sampling Algorithm for Maximum Inner Product Search
一种最大内积搜索的快速采样算法
- DOI:
- 发表时间:2019-04
- 期刊:
- 影响因子:0
- 作者:Ding, Qin;Yu, Hsiang;Hsieh, Cho
- 通讯作者:Hsieh, Cho
Stabilizing Differentiable Architecture Search via Perturbation-based Regularization
通过基于扰动的正则化稳定可微架构搜索
- DOI:10.1111/brv.12959
- 发表时间:2020-02-12
- 期刊:
- 影响因子:10
- 作者:Xiangning Chen;Cho
- 通讯作者:Cho
Learning to Stop: Dynamic Simulation Monte-Carlo Tree Search
学习停止:动态模拟蒙特卡罗树搜索
- DOI:10.1609/aaai.v35i1.16100
- 发表时间:2020-12-14
- 期刊:
- 影响因子:0
- 作者:Li;Meng;Ti;I;Cho
- 通讯作者:Cho
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Cho-Jui Hsieh其他文献
Cho-Jui Hsieh的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Cho-Jui Hsieh', 18)}}的其他基金
Collaborative Research: SLES: Verifying and Enforcing Safety Constraints in AI-based Sequential Generation
合作研究:SLES:验证和执行基于人工智能的顺序生成中的安全约束
- 批准号:
2331966 - 财政年份:2023
- 资助金额:
$ 36.28万 - 项目类别:
Standard Grant
CAREER: Robustness Verification and Certified Defense for Machine Learning Models
职业:机器学习模型的鲁棒性验证和认证防御
- 批准号:
2048280 - 财政年份:2021
- 资助金额:
$ 36.28万 - 项目类别:
Continuing Grant
RI: Small: Learning to Optimize: Designing and Improving Optimizers by Machine Learning Algorithms
RI:小:学习优化:通过机器学习算法设计和改进优化器
- 批准号:
2008173 - 财政年份:2020
- 资助金额:
$ 36.28万 - 项目类别:
Standard Grant
RI: SMALL: Fast Prediction and Model Compression for Large-Scale Machine Learning
RI:SMALL:大规模机器学习的快速预测和模型压缩
- 批准号:
1719097 - 财政年份:2017
- 资助金额:
$ 36.28万 - 项目类别:
Standard Grant
相似国自然基金
ALKBH5介导的SOCS3-m6A去甲基化修饰在颅脑损伤后小胶质细胞炎性激活中的调控作用及机制研究
- 批准号:82301557
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
miRNA前体小肽miPEP在葡萄低温胁迫抗性中的功能研究
- 批准号:
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:
PKM2苏木化修饰调节非小细胞肺癌起始细胞介导的耐药生态位的机制研究
- 批准号:82372852
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
基于翻译组学理论探究LncRNA H19编码多肽PELRM促进小胶质细胞活化介导电针巨刺改善膝关节术后疼痛的机制研究
- 批准号:82305399
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
CLDN6高表达肿瘤细胞亚群在非小细胞肺癌ICB治疗抗性形成中的作用及机制研究
- 批准号:82373364
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
相似海外基金
NSF-AoF: RI: Small: Safe Reinforcement Learning in Non-Stationary Environments With Fast Adaptation and Disturbance Prediction
NSF-AoF:RI:小型:具有快速适应和干扰预测功能的非平稳环境中的安全强化学习
- 批准号:
2133656 - 财政年份:2021
- 资助金额:
$ 36.28万 - 项目类别:
Standard Grant
RI: Small: Fast and Accurate Natural Language Parsing and Generation by Marrying Deep Learning with Dynamic Programming
RI:小型:将深度学习与动态规划相结合,快速准确地进行自然语言解析和生成
- 批准号:
1817231 - 财政年份:2018
- 资助金额:
$ 36.28万 - 项目类别:
Continuing Grant
RI: SMALL: Fast Prediction and Model Compression for Large-Scale Machine Learning
RI:SMALL:大规模机器学习的快速预测和模型压缩
- 批准号:
1719097 - 财政年份:2017
- 资助金额:
$ 36.28万 - 项目类别:
Standard Grant
RI: Small: Fast, Scalable Joint Inference for NLP using Markov Logic
RI:小型:使用马尔可夫逻辑进行快速、可扩展的 NLP 联合推理
- 批准号:
1528037 - 财政年份:2015
- 资助金额:
$ 36.28万 - 项目类别:
Standard Grant
RI: Small: Fast, Cheap, and In Control: New Methods for Precision Navigation of Low-Cost Autonomous Underwater Vehicles for Ocean Science
RI:小型:快速、廉价且可控:用于海洋科学的低成本自主水下航行器精确导航的新方法
- 批准号:
1319667 - 财政年份:2013
- 资助金额:
$ 36.28万 - 项目类别:
Continuing Grant