BIGDATA: F: New Algorithms of Online Machine Learning for Big Data

BIGDATA:F:大数据在线机器学习的新算法

基本信息

  • 批准号:
    1545995
  • 负责人:
  • 金额:
    $ 71.24万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2015
  • 资助国家:
    美国
  • 起止时间:
    2015-09-01 至 2019-08-31
  • 项目状态:
    已结题

项目摘要

This project is developing innovative, theoretically rigorous algorithms to learn from continuously arriving (streaming) data. Specific challenges addressed are class imbalance (one of the concepts to be learned is very rare, as in disease detection), cost constraints on both obtaining features (e.g., computationally expensive image processing), and cost constraints on obtaining class labels (e.g., human annotation.) The algorithms developed in this project make it possible to effectively address big data challenges in streaming data due to increased complexities in various aspects such as heavily imbalanced data distributions, ultrahigh dimensional features, a large number of labels, highly complex constraints, etc. The project will also contribute to training future professionals in big data analytics, including participation in the University of Iowa's undergraduate summer research program and high school student training program.Most work devoted to online learning algorithms and their analysis were developed with the goal of minimizing a symmetric measure (e.g., the classification error) and without considering practical constraints arising in big data. This project addresses imbalanced data by developing online learning algorithms for minimizing asymmetric measures including F-score, area under the ROC curve, and area under precision and recall curve. Convex or non-convex surrogate loss functions that well-approximate these asymmetric measures are constructed and minimized in an online fashion. The project also develops online algorithms under three types of constraints arising in big data context namely constraints on computing costs, on query costs, and complex inequality constraints, by exploring techniques in randomized algorithms, active learning and convex optimization. The developed algorithms are being evaluated in real applications including biomedical semantic indexing, social media mining, and image annotation.
该项目正在开发创新的,理论上严格的算法,以从连续到达(流)数据中学习。 所解决的具体挑战是阶级不平衡(在疾病检测中,要学习的概念之一非常罕见),在获得功能(例如,计算上昂贵的图像处理)上都存在成本限制,并且成本的限制因素而在类似数据中获得了众多数据,因此可以在逐渐挑战的各个方面挑战,从而获得了综合数据,因此获得了类标签(例如,人类注释)。分布,超高维度,大量标签,高度复杂的约束等。该项目还将有助于培训未来的专业人员在大数据分析中的培训,包括参与爱荷华大学的本科夏季研究计划和高中生培训计划。大多数工作,致力于在线学习算法及其分析的大多数级别的范围,而没有对级别的衡量标准进行,并确定了衡量标准(E. e.g)。大数据出现。 该项目通过开发在线学习算法来解决不平衡数据,以最大程度地减少不对称措施,包括F-SCORE,ROC曲线下的区域以及精确度和回忆曲线的区域。 以在线方式构建和最小化这些不对称措施的凸或非凸替代损失功能。该项目还通过在计算成本,查询成本和复杂的不平等限制的三种限制下,在三种类型的约束下开发在线算法,通过探索随机算法,主动学习和convex优化的技术。 在实际应用中评估了开发的算法,包括生物医学语义索引,社交媒体挖掘和图像注释。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Tianbao Yang其他文献

Improved bounds for the Nystrm method with application to kernel classification
改进 Nystr 的界限
Deep AUC Maximization for Medical Image Classification: Challenges and Opportunities
  • DOI:
  • 发表时间:
    2021-11
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Tianbao Yang
  • 通讯作者:
    Tianbao Yang
Evolution of the morphological, structural, and molecular properties of gluten protein in dough with different hydration levels during mixing.
  • DOI:
    10.1016/j.fochx.2022.100448
  • 发表时间:
    2022-10-30
  • 期刊:
  • 影响因子:
    6.1
  • 作者:
    Ruobing Jia;Mengli Zhang;Tianbao Yang;Meng Ma;Qingjie Sun;Man Li
  • 通讯作者:
    Man Li
UV-Light-Induced Dehydrogenative N-Acylation of Amines with 2-Nitrobenzaldehydes to Give 2-Aminobenzamides
紫外线诱导胺与 2-硝基苯甲醛脱氢 N-酰化生成 2-氨基苯甲酰胺
  • DOI:
    10.1055/a-1736-4388
  • 发表时间:
    2022-01
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Dishu Zeng;Tianbao Yang;Niu Tang;Wei Deng;Jiannan Xiang;Shuang-Feng Yin;Nobuaki Kambe;Renhua Qiu
  • 通讯作者:
    Renhua Qiu
Regret bounded by gradual variation for online convex optimization
在线凸优化的渐进变化所带来的遗憾
  • DOI:
    10.1007/s10994-013-5418-8
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    7.5
  • 作者:
    Tianbao Yang;M. Mahdavi;Rong Jin;Shenghuo Zhu
  • 通讯作者:
    Shenghuo Zhu

Tianbao Yang的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Tianbao Yang', 18)}}的其他基金

Collaborative Research:SCH:Bimodal Interpretable Multi-Instance Medical-Image Classification
合作研究:SCH:双峰可解释多实例医学图像分类
  • 批准号:
    2306572
  • 财政年份:
    2023
  • 资助金额:
    $ 71.24万
  • 项目类别:
    Standard Grant
FAI: Advancing Optimization for Threshold-Agnostic Fair AI Systems
FAI:推进与阈值无关的公平人工智能系统的优化
  • 批准号:
    2147253
  • 财政年份:
    2022
  • 资助金额:
    $ 71.24万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Robust Deep Learning with Big Imbalanced Data
合作研究:RI:小型:具有大不平衡数据的鲁棒深度学习
  • 批准号:
    2246756
  • 财政年份:
    2022
  • 资助金额:
    $ 71.24万
  • 项目类别:
    Continuing Grant
CAREER: Advancing Constrained and Non-Convex Learning
职业:推进约束和非凸学习
  • 批准号:
    2246753
  • 财政年份:
    2022
  • 资助金额:
    $ 71.24万
  • 项目类别:
    Continuing Grant
FAI: Advancing Optimization for Threshold-Agnostic Fair AI Systems
FAI:推进与阈值无关的公平人工智能系统的优化
  • 批准号:
    2246757
  • 财政年份:
    2022
  • 资助金额:
    $ 71.24万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Robust Deep Learning with Big Imbalanced Data
合作研究:RI:小型:具有大不平衡数据的鲁棒深度学习
  • 批准号:
    2110545
  • 财政年份:
    2021
  • 资助金额:
    $ 71.24万
  • 项目类别:
    Continuing Grant
CAREER: Advancing Constrained and Non-Convex Learning
职业:推进约束和非凸学习
  • 批准号:
    1844403
  • 财政年份:
    2019
  • 资助金额:
    $ 71.24万
  • 项目类别:
    Continuing Grant
Collaborative Research: Online Data Stream Fusion and Deep Learning for Virtual Meter in Smart Power Distribution Systems
合作研究:智能配电系统中虚拟电表的在线数据流融合和深度学习
  • 批准号:
    1933212
  • 财政年份:
    2019
  • 资助金额:
    $ 71.24万
  • 项目类别:
    Standard Grant
CRII: III: Scaling up Distance Metric Learning for Large-scale Ultrahigh-dimensional Data
CRII:III:扩大大规模超高维数据的距离度量学习
  • 批准号:
    1463988
  • 财政年份:
    2015
  • 资助金额:
    $ 71.24万
  • 项目类别:
    Standard Grant

相似国自然基金

光纤干涉型振动传感系统模式识别新智能算法的研究
  • 批准号:
    62305113
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
地方债制度改革与企业劳动力投入:基于新《预算法》的准自然实验
  • 批准号:
    72272166
  • 批准年份:
    2022
  • 资助金额:
    45 万元
  • 项目类别:
    面上项目
基于植被含水量和气象条件约束的卫星遥感火灾一氧化碳排放系数反演新算法
  • 批准号:
    42205135
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
动物中一类新的长前体miRNA的发现、预测算法设计及其功能初探
  • 批准号:
    32270602
  • 批准年份:
    2022
  • 资助金额:
    54.00 万元
  • 项目类别:
    面上项目
基于SCO方法和SDP/SOCP松弛技术的非凸二次约束二次规划新全局算法与应用研究
  • 批准号:
    12271485
  • 批准年份:
    2022
  • 资助金额:
    46 万元
  • 项目类别:
    面上项目

相似海外基金

Theory and algorithms for a new class of computationally amenable nonconvex functions
一类新的可计算非凸函数的理论和算法
  • 批准号:
    2416250
  • 财政年份:
    2024
  • 资助金额:
    $ 71.24万
  • 项目类别:
    Standard Grant
第一原理的電子相関を取り入れた電子スピン状態計算法の開発と新機能材料への応用
结合第一原理电子关联的电子自旋态计算方法的发展及其在新型功能材料中的应用
  • 批准号:
    24K08229
  • 财政年份:
    2024
  • 资助金额:
    $ 71.24万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
構造保存的数値計算法の概念に基づく最適化・深層学習手法の新展開
基于保结构数值计算方法概念的优化和深度学习方法的新进展
  • 批准号:
    23K21674
  • 财政年份:
    2024
  • 资助金额:
    $ 71.24万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
New Algorithms for Cryogenic Electron Microscopy
低温电子显微镜的新算法
  • 批准号:
    10543569
  • 财政年份:
    2023
  • 资助金额:
    $ 71.24万
  • 项目类别:
KidneyAlgo: New Algorithms for UK and International Kidney Exchange
KidneyAlgo:英国和国际肾脏交换的新算法
  • 批准号:
    EP/X01357X/1
  • 财政年份:
    2023
  • 资助金额:
    $ 71.24万
  • 项目类别:
    Research Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了