CAREER: Systematic Software Testing for Deep Learning Applications

职业:深度学习应用程序的系统软件测试

基本信息

  • 批准号:
    1845893
  • 负责人:
  • 金额:
    $ 53.01万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2019
  • 资助国家:
    美国
  • 起止时间:
    2019-05-01 至 2025-04-30
  • 项目状态:
    未结题

项目摘要

A paradigm shift is underway in software development, where decision making is increasingly shifting from hand-coded program logic to a reliance on Deep Learning (DL) --- popular applications of Speech Processing, Image Recognition, Robotics, etc. are using DL to implement their core components. Deep Neural Networks (DNNs), a widely used form of DL, is a key behind much of this progress. With such spectacular growth in traditional applications, DNNs and other DL technologies are also increasingly being used in safety-critical systems such as autonomous cars, medical diagnosis, malware detection, and aircraft collision avoidance systems. Such a wide adoption of DL techniques carries with it concerns about the reliability of these systems, as several high-profile instances of DL-based behavior have already been reported. Thus, it has become crucial to rigorously test these applications with realistic corner cases to ensure high reliability. However, due to the fundamental architectural differences between DL implementations such as DNNs and traditional software, existing software testing techniques do not apply to them in any obvious way. In fact, companies like Google, Tesla, etc. are increasingly confronting software testing challenges to ensure reliable and safe DL applications. Therefore, systematically testing DL-based software systems will be a significant step towards increasing safety and reliability of sensitive and safety-critical DL systems.This project will design, implement, and evaluate a novel software testing framework to assess the reliability of the Deep Learning applications and detect buggy behaviors during the application development and maintenance phase. In particular, the proposed framework will develop novel white-box testing strategies, realistic test-case generation techniques, and regression testing techniques to assess DL applications. A unique characteristic of the DL-based programming paradigm is that the end applications highly depend on the training data. Therefore, the research will build novel white-box testing strategies to evaluate both the model and the training data together as a whole system. In addition, this research will design and deploy techniques to generate new test cases that capture the real-world corner-case behavior where the DL applications may fail. The project will also investigate how any changes in data or model architecture can impact a pre-trained model in order to guide regression test case selection and prioritization process.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
在软件开发中正在进行范式转变,在此过程中,决策越来越多地从手工编码的程序逻辑转移到对深度学习的依赖(DL)---流行语音处理,图像识别,机器人技术等的流行应用正在使用DL来实现其核心组件。深度神经网络(DNNS)是一种广泛使用的DL形式,是大部分进展的关键。随着传统应用中的如此壮观的增长,DNN和其他DL技术也越来越多地用于安全至关重要的系统,例如自动驾驶汽车,医疗诊断,恶意软件检测和飞机避免避免系统。 DL技术的这种广泛采用对这些系统的可靠性产生了关注,因为已经报道了几种基于DL的行为的备受瞩目的实例。因此,严格测试这些应用程序是至关重要的,以确保高可靠性。但是,由于DL实现(例如DNN和传统软件)之间的根本建筑差异,现有的软件测试技术并不以任何明显的方式适用于它们。实际上,诸如Google,Tesla等公司等公司越来越面临软件测试挑战,以确保可靠且安全的DL应用程序。 因此,系统测试基于DL的软件系统将是提高敏感和安全至关重要的DL系统的安全性和可靠性的重要一步。本项目将设计,实施和评估新颖的软件测试框架,以评估深度学习应用程序的可靠性并在应用程序开发阶段检测虫子行为的可靠性。特别是,所提出的框架将开发新颖的白盒测试策略,现实的测试案例生成技术和回归测试技术,以评估DL应用。基于DL的编程范式的独特特征是最终应用程序在很大程度上取决于培训数据。因此,该研究将建立新颖的白盒测试策略,以整个系统一起评估模型和培训数据。此外,这项研究将设计和部署技术,以生成新的测试用例,以捕获DL应用程序可能失败的现实世界角案例行为。该项目还将调查数据或模型体系结构的任何变化如何影响预先训练的模型,以指导回归测试案例选择和优先级别。该奖项反映了NSF的法定任务,并被认为是通过基金会的智力优点和更广泛影响的审查标准通过评估来通过评估来支持的。

项目成果

期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Learning Approximate Execution Semantics From Traces for Binary Function Similarity
  • DOI:
    10.1109/tse.2022.3231621
  • 发表时间:
    2023-04
  • 期刊:
  • 影响因子:
    7.4
  • 作者:
    Kexin Pei;Zhou Xuan;Junfeng Yang;S. Jana;Baishakhi Ray
  • 通讯作者:
    Kexin Pei;Zhou Xuan;Junfeng Yang;S. Jana;Baishakhi Ray
On Multi-Modal Learning of Editing Source Code
PMFuzz: test case generation for persistent memory programs
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Baishakhi Ray其他文献

Variation of Gender Biases in Visual Recognition Models Before and After Finetuning
视觉识别模型微调前后性别偏差的变化
  • DOI:
    10.48550/arxiv.2303.07615
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jaspreet Ranjit;Tianlu Wang;Baishakhi Ray;Vicente Ordonez
  • 通讯作者:
    Vicente Ordonez
A Case Study on the Impact of Similarity Measure on Information Retrieval based Software Engineering Tasks
相似性度量对基于信息检索的软件工程任务影响的案例研究
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Md Masudur Rahman;Saikat Chakraborty;G. Kaiser;Baishakhi Ray
  • 通讯作者:
    Baishakhi Ray
KGym: A Platform and Dataset to Benchmark Large Language Models on Linux Kernel Crash Resolution
KGym:在 Linux 内核崩溃解决方案上对大型语言模型进行基准测试的平台和数据集
  • DOI:
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Alex Mathai;Chenxi Huang;Petros Maniatis;A. Nogikh;Franjo Ivancic;Junfeng Yang;Baishakhi Ray
  • 通讯作者:
    Baishakhi Ray
Poster: Searching for High-Performing Software Configurations with Metaheuristic Algorithms
海报:使用元启发式算法搜索高性能软件配置
Recommending GitHub Projects for Developer Onboarding
推荐用于开发人员入门的 GitHub 项目
  • DOI:
    10.1109/access.2018.2869207
  • 发表时间:
    2018-09
  • 期刊:
  • 影响因子:
    3.9
  • 作者:
    Chao Liu;Dan Yang;Xiaohong Zhang;Baishakhi Ray;Md. Masudur Rahman
  • 通讯作者:
    Md. Masudur Rahman

Baishakhi Ray的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Baishakhi Ray', 18)}}的其他基金

Collaborative Research: SHF: Medium: Learning Semantics of Code To Automate Software Assurance Tasks
协作研究:SHF:媒介:学习代码语义以自动化软件保障任务
  • 批准号:
    2313055
  • 财政年份:
    2023
  • 资助金额:
    $ 53.01万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Medium: Causal Performance Debugging for Highly-Configurable Systems
合作研究:SHF:中:高度可配置系统的因果性能调试
  • 批准号:
    2107405
  • 财政年份:
    2021
  • 资助金额:
    $ 53.01万
  • 项目类别:
    Standard Grant
Workshop on Deep Learning and Software Engineering
深度学习与软件工程研讨会
  • 批准号:
    1945999
  • 财政年份:
    2019
  • 资助金额:
    $ 53.01万
  • 项目类别:
    Standard Grant
TWC: Small: Collaborative: Automated Detection and Repair of Error Handling Bugs in SSL/TLS Implementations
TWC:小:协作:自动检测和修复 SSL/TLS 实现中的错误处理错误
  • 批准号:
    1946068
  • 财政年份:
    2019
  • 资助金额:
    $ 53.01万
  • 项目类别:
    Standard Grant
EAGER: Finding Semantic Security Bugs with Pseudo-Oracle Testing
EAGER:通过伪 Oracle 测试查找语义安全漏洞
  • 批准号:
    1842456
  • 财政年份:
    2018
  • 资助金额:
    $ 53.01万
  • 项目类别:
    Standard Grant
CHS: Small: Translating Compilers for Visual Computing in Dynamic Languages
CHS:小型:用动态语言翻译用于视觉计算的编译器
  • 批准号:
    1936523
  • 财政年份:
    2018
  • 资助金额:
    $ 53.01万
  • 项目类别:
    Standard Grant
CHS: Small: Translating Compilers for Visual Computing in Dynamic Languages
CHS:小型:用动态语言翻译用于视觉计算的编译器
  • 批准号:
    1619123
  • 财政年份:
    2016
  • 资助金额:
    $ 53.01万
  • 项目类别:
    Standard Grant
TWC: Small: Collaborative: Automated Detection and Repair of Error Handling Bugs in SSL/TLS Implementations
TWC:小:协作:自动检测和修复 SSL/TLS 实现中的错误处理错误
  • 批准号:
    1618771
  • 财政年份:
    2016
  • 资助金额:
    $ 53.01万
  • 项目类别:
    Standard Grant

相似国自然基金

基于模型和数据驱动的列控系统软件复合故障诊断方法研究
  • 批准号:
    52302408
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
大规模软件系统的性能缺陷机理分析与检测技术研究
  • 批准号:
    62302514
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
价值视角下软件服务生态系统治理体系和关键技术
  • 批准号:
    62372323
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
面向复杂智能软件系统构建过程的质量保障技术研究
  • 批准号:
    62372225
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
自适应软件系统中人在回路的搜索式性能保障研究
  • 批准号:
    62372084
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目

相似海外基金

University of California, Davis: Human Papillomavirus Cancer Free (UCD: HPV Cancer Free)
加州大学戴维斯分校:无人类乳头瘤病毒癌症(UCD:无 HPV 癌症)
  • 批准号:
    10370548
  • 财政年份:
    2023
  • 资助金额:
    $ 53.01万
  • 项目类别:
Unsupervised Statistical Methods for Data-driven Analyses in Spatially Resolved Transcriptomics Data
空间分辨转录组数据中数据驱动分析的无监督统计方法
  • 批准号:
    10556351
  • 财政年份:
    2022
  • 资助金额:
    $ 53.01万
  • 项目类别:
Unsupervised Statistical Methods for Data-driven Analyses in Spatially Resolved Transcriptomics Data
空间分辨转录组数据中数据驱动分析的无监督统计方法
  • 批准号:
    10350850
  • 财政年份:
    2022
  • 资助金额:
    $ 53.01万
  • 项目类别:
CAREER: An AI Empowered Architecture-Centric Framework for Systematic Software-Performance Optimization
职业:人工智能赋能的以架构为中心的系统软件性能优化框架
  • 批准号:
    2044888
  • 财政年份:
    2021
  • 资助金额:
    $ 53.01万
  • 项目类别:
    Continuing Grant
Developing and testing Collaborative Quality ImProvement initiative (C-QIP) for prevention of cardiovascular disease in India
制定和测试印度预防心血管疾病的协作质量改进计划 (C-QIP)
  • 批准号:
    10677651
  • 财政年份:
    2019
  • 资助金额:
    $ 53.01万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了