SDCI Data: New Toolkit for Provenance Collection, Publishing, and Experience Reuse

SDCI 数据:用于来源收集、发布和体验重用的新工具包

基本信息

  • 批准号:
    0721674
  • 负责人:
  • 金额:
    $ 43.3万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2007
  • 资助国家:
    美国
  • 起止时间:
    2007-09-01 至 2011-08-31
  • 项目状态:
    已结题

项目摘要

OCI - SDCI Data: New Toolkit for Provenance Collection, Publishing, and Experience ReuseAs research digital data collections created through computational science experiments proliferate, it becomes increasingly important to address the provenance issues of the data validity and quality: to record and manage information about where each data object originated, the processes applied to the data products, and by whom. The first outcome of this work is a provenance collection and experience reuse tool that makes minimal assumptions about the software environment and imposes minimal burden on the application writer. It stores and produces results in a form suitable for publication to a digital library. The provenance collection system is a standalone system that imposes a minimal burden on users to integrate it into their application framework and it exhibits good performance. A second outcome of the work is a recommender system for workflow completion that employs case-based reasoning to provenance collections in order to make suggestions to users about future workflow-driven investigations. The workflow completion tool builds on computer models of case-based reasoning to develop a support system that leverages the collective experience of the users of the provenance system to provide suggestions. As a key part of effectively evaluating aspects of the tool, this work builds a gigabyte benchmark database of real and synthetic provenance information. Real workflows are sought from the community, with synthetic extensions to the data set for completeness for purposes of testing. The software and database are available to the research community.
OCI - SDCI 数据:用于来源收集、发布和体验重用的新工具包随着通过计算科学实验创建的研究数字数据集合激增,解决数据有效性和质量的来源问题变得越来越重要:记录和管理有关位置的信息每个数据对象的起源、应用于数据产品的过程以及由谁发起。这项工作的第一个成果是一个来源收集和经验重用工具,它对软件环境做出最少的假设,并给应用程序编写者带来最小的负担。它以适合发布到数字图书馆的形式存储和生成结果。 来源收集系统是一个独立的系统,将其集成到应用程序框架中对用户的负担最小,并且表现出良好的性能。这项工作的第二个成果是用于工作流程完成的推荐系统,该系统对来源集合采用基于案例的推理,以便向用户提供有关未来工作流程驱动的调查的建议。工作流程完成工具建立在基于案例推理的计算机模型的基础上,开发一个支持系统,该系统利用来源系统用户的集体经验来提供建议。作为有效评估该工具各个方面的关键部分,这项工作构建了一个包含真实和合成来源信息的千兆字节基准数据库。 从社区中寻求真实的工作流程,并对数据集进行综合扩展,以实现测试的完整性。 该软件和数据库可供研究界使用。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Beth Plale其他文献

Hierarchical MapReduce: towards simplified cross‐domain data processing
分层 MapReduce:简化跨域数据处理
Sigiri: uniform resource abstraction for grids and clouds
Sigiri:网格和云的统一资源抽象
Workload-Aware Resource Reservation for Multi-tenant NoSQL
多租户 NoSQL 的工作负载感知资源预留
Cyberinfrastructure Software Sustainability and Reusability: Report from an NSF-funded workshop held 27 & 28 March 2009
网络基础设施软件的可持续性和可重用性:来自 NSF 资助的研讨会的报告 27
  • DOI:
  • 发表时间:
    2024-09-14
  • 期刊:
  • 影响因子:
    0
  • 作者:
    C. Stewart;G. Almes;D. McCaulay;B. Wheeler;A. Apon;Geoffrey Brown;Neil Philippe Chue Hong;D. Lifka;A. Lumsdaine;C. Lynch;M. Pierce;Beth Plale;R. Pordes;J. Schopf;Von Welch
  • 通讯作者:
    Von Welch
A Unified Relational Approach to Grid Information Services
网格信息服务的统一关系方法
  • DOI:
  • 发表时间:
    2003-05-01
  • 期刊:
  • 影响因子:
    0
  • 作者:
    P. Dinda;Beth Plale
  • 通讯作者:
    Beth Plale

Beth Plale的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Beth Plale', 18)}}的其他基金

Collaborative Research: Software Sustainability: an SI^2 PI Workshop
协作研究:软件可持续性:SI^2 PI 研讨会
  • 批准号:
    1419131
  • 财政年份:
    2014
  • 资助金额:
    $ 43.3万
  • 项目类别:
    Standard Grant
A Data Consortium: Coming Together Around Data
数据联盟:围绕数据聚集在一起
  • 批准号:
    1238168
  • 财政年份:
    2012
  • 资助金额:
    $ 43.3万
  • 项目类别:
    Standard Grant
Collaborative Research SI2 SSE: Pipeline Framework for Ensemble Runs on Clouds
协作研究 SI2 SSE:云上运行的 Ensemble 管道框架
  • 批准号:
    1148359
  • 财政年份:
    2012
  • 资助金额:
    $ 43.3万
  • 项目类别:
    Standard Grant
Coming Together around Data, a PI Project Meeting for DataNet and INTEROP
围绕数据汇聚一堂,针对 DataNet 和 INTEROP 的 PI 项目会议
  • 批准号:
    1152946
  • 财政年份:
    2011
  • 资助金额:
    $ 43.3万
  • 项目类别:
    Standard Grant
III: Small: Assisted Emulation for Digital Preservation
III:小型:数字保存的辅助仿真
  • 批准号:
    1016967
  • 财政年份:
    2010
  • 资助金额:
    $ 43.3万
  • 项目类别:
    Continuing Grant
EAGER: In-situ archiving of digital scientific data
EAGER:数字科学数据的就地归档
  • 批准号:
    1058452
  • 财政年份:
    2010
  • 资助金额:
    $ 43.3万
  • 项目类别:
    Standard Grant
CSR---CSI. An Adaptive Programming Framework for Data and Event Driven Computation
企业社会责任---CSI。
  • 批准号:
    0720580
  • 财政年份:
    2007
  • 资助金额:
    $ 43.3万
  • 项目类别:
    Continuing Grant
Collaborative Research: Science of Search: Data Search, Analytics, and Architectures Center (DSAAC)
合作研究:搜索科学:数据搜索、分析和架构中心 (DSAAC)
  • 批准号:
    0630322
  • 财政年份:
    2006
  • 资助金额:
    $ 43.3万
  • 项目类别:
    Standard Grant
Information Technology Research (ITR): Linked Environments for Atmospheric Discovery (LEAD)
信息技术研究 (ITR):大气发现的关联环境 (LEAD)
  • 批准号:
    0331480
  • 财政年份:
    2003
  • 资助金额:
    $ 43.3万
  • 项目类别:
    Cooperative Agreement
ITR/SY Collaborative Research: A Unified Relational Approach to Grid Information Services
ITR/SY 合作研究:网格信息服务的统一关系方法
  • 批准号:
    0128390
  • 财政年份:
    2001
  • 资助金额:
    $ 43.3万
  • 项目类别:
    Continuing Grant

相似国自然基金

构建多组学数据融合模型预测结直肠癌新辅助免疫治疗疗效的研究
  • 批准号:
    82373431
  • 批准年份:
    2023
  • 资助金额:
    48 万元
  • 项目类别:
    面上项目
基于多模态数据融合和时空特征建模的新冠肺炎危险分层及预后研究
  • 批准号:
    82371958
  • 批准年份:
    2023
  • 资助金额:
    48 万元
  • 项目类别:
    面上项目
基于手机信令大数据的新冠疫情前后城市居民移动性规律变化研究
  • 批准号:
    42301210
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
整合全基因组关联分析和转录组数据鉴定影响绵羊尾长性状的新基因
  • 批准号:
    32360823
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目
基于异构化数据和图神经网络预测新冠肺炎患者恢复期肺功能的研究
  • 批准号:
    82302313
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

SDCI: Data/NMI New/Improvement - Semantic Provenance Capture in Data Ingest Systems (SPCDIS)
SDCI:数据/NMI 新增/改进 - 数据摄取系统中的语义来源捕获 (SPCDIS)
  • 批准号:
    0968277
  • 财政年份:
    2009
  • 资助金额:
    $ 43.3万
  • 项目类别:
    Continuing Grant
SDCI: Data/NMI New/Improvement - Semantic Provenance Capture in Data Ingest Systems (SPCDIS)
SDCI:数据/NMI 新增/改进 - 数据摄取系统中的语义来源捕获 (SPCDIS)
  • 批准号:
    0721943
  • 财政年份:
    2007
  • 资助金额:
    $ 43.3万
  • 项目类别:
    Continuing Grant
SDCI Data New: Trust Management for Open Collaborative Information Repositories: The CalSWIM Cyberinfrastructure
SDCI 数据新内容:开放式协作信息存储库的信任管理:CalSWIM 网络基础设施
  • 批准号:
    0724806
  • 财政年份:
    2007
  • 资助金额:
    $ 43.3万
  • 项目类别:
    Continuing Grant
SDCI Data New: A Modular Software Framework for Evaluation, Testing, and Cross-Fertilization of Authorship Attribution Techniques
SDCI 数据新功能:用于作者归属技术评估、测试和交叉应用的模块化软件框架
  • 批准号:
    0721667
  • 财政年份:
    2007
  • 资助金额:
    $ 43.3万
  • 项目类别:
    Standard Grant
SDCI Data: New - Scalable Authentication of Grid Data Provenance
SDCI 数据:新功能 - 网格数据来源的可扩展身份验证
  • 批准号:
    0722068
  • 财政年份:
    2007
  • 资助金额:
    $ 43.3万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了