EAGER: Data Debugging

EAGER:数据调试

基本信息

  • 批准号:
    1349784
  • 负责人:
  • 金额:
    $ 15万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2013
  • 资助国家:
    美国
  • 起止时间:
    2013-09-01 至 2016-02-29
  • 项目状态:
    已结题

项目摘要

Today, systems rely as heavily on data as on the software that manipulates that data. Unlike software, data cannot be easily tested or analyzed for correctness. Part of the problem is that it is difficult to decide whether data is wrong. Typographical errors can change data items by orders of magnitude. For example, the number 1234 might be entered when the correct value is 12.34. Unfortunately, finding this kind of mistake via manual data auditing is onerous, unscalable, and error-prone. Data errors can be costly: Errors in spreadsheet data have led to million dollar losses, and poor data quality has been estimated to cost the US economy more than $600 billion per year. Data debugging is a new approach for locating likely data errors by leveraging the interaction between data and the programs that operate on it. Since it is impossible to know a priori whether data is incorrect, data debugging aims to do the next best thing: identifying data that has an unusual impact on the computation. Intuitively, data with an inordinate impact on the result of a computation is either very important, or it is wrong. By contrast, wrong data whose presence has no particularly unusual effect on the final result does not matter. By calling attention to data with inordinately high impact, data debugging can provide insights into both the data and the computation and reveal errors. Data debugging is especially well-suited for data-intensive programming environments like databases and spreadsheets that intertwine data and programs. Data debugging can dramatically reduce the risks of human data entry errors or data corruption, increase the reliability of computations over data, and potentially save the US economy millions of dollars.
如今,系统在很大程度上依赖数据与操纵数据的软件一样。 与软件不同,数据不能轻易测试或分析以确保正确性。问题的一部分是很难确定数据是否错误。 印刷错误可以通过数量级来更改数据项。例如,当正确值为12.34时,可以输入数字1234。不幸的是,通过手动数据审核发现这种错误是繁重的,难以实现的。 数据错误可能是昂贵的:电子表格数据中的错误导致了数百万美元的损失,并且估计数据质量较差,每年使美国经济损失超过6000亿美元。数据调试是一种通过利用数据与在其上操作的程序之间的相互作用来定位可能数据错误的新方法。由于不可能知道数据是否不正确,因此数据调试旨在做下一个最好的事情:识别对计算有异常影响的数据。直观地,对计算结果产生过多影响的数据要么很重要,要么是错误的。相比之下,存在对最终结果没有特别异常影响的错误数据并不重要。 通过引起对数据的注意,数据调试可以提供对数据和计算的见解并揭示错误。数据调试特别适合数据密集型编程环境(例如数据库和电子表格)交织数据和程序。 数据调试可以大大减少人类数据输入错误或数据损坏的风险,提高计算对数据的可靠性,并可能节省美国经济的数百万美元。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Emery Berger其他文献

Emery Berger的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Emery Berger', 18)}}的其他基金

Collaborative Research:SHF:Medium:Bringing Python Up to Speed
合作研究:SHF:Medium:加快 Python 速度
  • 批准号:
    1954830
  • 财政年份:
    2020
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
SHF: Small: S3: Statistical and Structural Analysis for Spreadsheets
SHF:小型:S3:电子表格的统计和结构分析
  • 批准号:
    1617892
  • 财政年份:
    2016
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
TWC: Small: Collaborative: EVADE: Evidence-Assisted Detection and Elimination of Security Vulnerabilities
TWC:小型:协作:EVADE:证据辅助检测和消除安全漏洞
  • 批准号:
    1525888
  • 财政年份:
    2015
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
XPS: FULL: SDA: Collaborative Research: SCORE: Scalability-Oriented Optimization
XPS:完整:SDA:协作研究:SCORE:面向可扩展性的优化
  • 批准号:
    1439008
  • 财政年份:
    2014
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
EAGER: Programming the Crowd
EAGER:对人群进行编程
  • 批准号:
    1144520
  • 财政年份:
    2012
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
SHF: Large: Collaborative Research: Reliable Performance for Modern Systems
SHF:大型:协作研究:现代系统的可靠性能
  • 批准号:
    1012195
  • 财政年份:
    2010
  • 资助金额:
    $ 15万
  • 项目类别:
    Continuing Grant
SHF: Large:Collaborative Research: PASS: Perpetually Available Software Systems
SHF:大型:协作研究:PASS:永久可用的软件系统
  • 批准号:
    0910883
  • 财政年份:
    2009
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
Probabilistically Correct Execution: Hardening Applications Against Error and Attack
概率上正确的执行:强化应用程序以防止错误和攻击
  • 批准号:
    0615211
  • 财政年份:
    2006
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
CAREER: Cooperative System Support for Robust High Performance
职业:协作系统支持强大的高性能
  • 批准号:
    0347339
  • 财政年份:
    2004
  • 资助金额:
    $ 15万
  • 项目类别:
    Continuing Grant

相似国自然基金

数据驱动的持续集成测试加速技术研究
  • 批准号:
    62372005
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
时空图数据查询处理关键技术研究
  • 批准号:
    62302084
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
多模态异构社交数据关联挖掘及应用技术研究
  • 批准号:
    62362048
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目
面向边缘智能的车联网数据安全关键技术研究
  • 批准号:
    62372100
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
基于连续张量表示的高维数据复原问题研究
  • 批准号:
    12371456
  • 批准年份:
    2023
  • 资助金额:
    43.5 万元
  • 项目类别:
    面上项目

相似海外基金

Debugging Distributed Data Analysis Workflows (B03)
调试分布式数据分析工作流程(B03)
  • 批准号:
    444757960
  • 财政年份:
    2020
  • 资助金额:
    $ 15万
  • 项目类别:
    Collaborative Research Centres
CAREER: Data-Driven Debugging of Complex Program Changes
职业:复杂程序更改的数据驱动调试
  • 批准号:
    1845446
  • 财政年份:
    2019
  • 资助金额:
    $ 15万
  • 项目类别:
    Continuing Grant
I-Corps: Interactive and Automated Debugging for Big Data Analytics
I-Corps:大数据分析的交互式和自动调试
  • 批准号:
    1842657
  • 财政年份:
    2018
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
CSR: Small: Scalable Fine-Grain Lineage for Debugging Data-Intensive Workflows
CSR:小型:用于调试数据密集型工作流程的可扩展细粒度谱系
  • 批准号:
    1219220
  • 财政年份:
    2012
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
NetSE: Medium: A Data Mining Approach to Diagnostic Debugging in Sensor Networks
NetSE:Medium:传感器网络中诊断调试的数据挖掘方法
  • 批准号:
    0905014
  • 财政年份:
    2009
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了