Collaborative Research: Framework for Integrative Data Equity Systems

协作研究:综合数据公平系统框架

基本信息

项目摘要

Data Science continues to have a transformative impact on Science and Engineering, and on society at large, by enabling evidence-based decision making, reducing costs and errors, and improving objectivity. The techniques and technologies of data science also have enormous potential for harm if they reinforce inequity or leak private information. As a result, sensitive datasets in the public and private sector are restricted from research use, slowing progress in those areas that have the most to gain: human services in the public sector. Furthermore, the misuse of data science techniques and technologies will disproportionately harm underrepresented groups across race, gender, physical ability, sexual orientation, education, and more. These data equity issues are pervasive, and represent an existential risk for the use of data-driven methods in science and engineering. This project will establish a Framework for Integrative Data Equity Systems (FIDES): an Institute for the study of systems that enable research on sensitive data while preventing misuse and misinterpretation. FIDES will enable interdisciplinary community convergence around data equity systems, with an initial study in critical domains such as mobility, housing, education, economic indicators, and government transparency, leading to the development of a novel data analytics infrastructure that supports responsibility in integrative data science. Towards this goal, the project will address several technically challenging problems: (1) To be able to use data from multiple sources, risks related to privacy, bias, and the potential for misuse must be addressed. This project will develop principled methods for dataset processing to overcome these concerns. (2) Individual datasets are difficult to integrate for use in advanced multi-layer network models. This project considers methods to create pre-trained tensors over large collections of spatially and temporally coherent datasets, making them easier to incorporate while controlling for fairness and equity. (3) Any dataset or model must be equipped with sufficient information to determine fitness for use, communicate limitations, and describe underlying assumptions. This project will develop tools and techniques to produce "nutritional labels" for data and models, formalizing and standardizing ad hoc metadata approaches to provenance, specialized for equity issues. In addition to supporting methodological innovation in data science, the Institute will become a focal point for sharing expertise in data equity systems. It will do so by establishing interfaces for interaction between data science and domain experts to promote expertise development and sharing of best practices, and by consistently supporting efforts on diversity and equity.This project is part of the National Science Foundation's Harnessing the Data Revolution Big Idea activity. The effort is jointly funded by the Office of Advanced Cyberinfrastructure.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
数据科学通过实现基于证据的决策,降低成本和错误以及提高客观性的方式,对科学和工程以及整个社会产生变革性的影响。数据科学的技术和技术在加强不平等或泄漏私人信息的情况下也具有巨大的伤害潜力。 结果,公共和私营部门的敏感数据集受到研究的限制,在那些拥有最大收益的领域的进度放缓:公共部门的人类服务。 此外,数据科学技术和技术的滥用将不成比例地损害种族,性别,身体能力,性取向,教育等方面代表性不足的群体。这些数据权益问题普遍存在,代表了在科学和工程中使用数据驱动方法的存在风险。该项目将建立一个综合数据股权系统(FIDE)的框架:一个系统研究所,可在防止滥用和误解的同时研究敏感数据。 FIDE将在数据股权系统周围实现跨学科的社区融合,并在关键领域(例如移动性,住房,教育,经济指标和政府透明度)进行了最初的研究,从而发展了新的数据分析基础架构,以支持整合数据科学的责任。 为了实现这一目标,该项目将解决几个技术上具有挑战性的问题:(1)必须解决来自多个来源的数据,与隐私,偏见有关的风险,并且必须解决滥用的潜力。该项目将开发用于克服这些问题的数据集处理的原则方法。 (2)很难集成单个数据集,以用于高级多层网络模型。 该项目考虑了在空间和时间相干数据集中创建预训练的张量的方法,从而使它们更易于在控制公平和公平性的同时合并。 (3)任何数据集或模型都必须配备足够的信息,以确定使用的适合度,交流限制并描述基本假设。 该项目将开发工具和技术,以生产数据和模型的“营养标签”,将临时元数据的正式化和标准化来源的临时方法,专门针对股权问题。除了支持数据科学的方法论创新外,该研究所还将成为共享数据股权系统专业知识的重点。 它将通过建立数据科学与领域专家之间互动的界面来促进专业知识发展和最佳实践的共享,并始终如一地支持在多样性和公平上的努力。该项目是国家科学基金会刺激数据革命的大型思想活动的一部分。 这项努力由高级网络基础设施办公室共同资助。该奖项反映了NSF的法定任务,并被认为是值得通过基金会的知识分子优点和更广泛影响的审查标准来评估的。

项目成果

期刊论文数量(19)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Patterns Count-Based Labels for Datasets
数据集基于计数的模式标签
  • DOI:
    10.1109/icde51399.2021.00184
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Moskovitch, Yuval;Jagadish, H. V.
  • 通讯作者:
    Jagadish, H. V.
Identifying Insufficient Data Coverage for Ordinal Continuous-Valued Attributes
识别序数连续值属性的数据覆盖不足
COVID-19 Brings Data Equity Challenges to the Fore
COVID-19 使数据公平性挑战凸显
COUNTATA: Dataset Labeling Using Pattern Counts
COUNTATA:使用模式计数的数据集标记
Enhancing the quality and social impacts of urban planning through community-engaged operations research
通过社区参与的运营研究提高城市规划的质量和社会影响
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Hosagrahar Jagadish其他文献

Hosagrahar Jagadish的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Hosagrahar Jagadish', 18)}}的其他基金

Collaborative Research: III: MEDIUM: Responsible Design and Validation of Algorithmic Rankers
合作研究:III:媒介:算法排序器的负责任设计和验证
  • 批准号:
    2312931
  • 财政年份:
    2023
  • 资助金额:
    $ 76.23万
  • 项目类别:
    Standard Grant
CIVIC-PG Track B: Understanding Native American Tribal Residents Needs through Better Data and Query Systems
CIVIC-PG Track B:通过更好的数据和查询系统了解美洲原住民部落居民的需求
  • 批准号:
    2228275
  • 财政年份:
    2022
  • 资助金额:
    $ 76.23万
  • 项目类别:
    Standard Grant
III: Medium: Collaborative Research: Fairness in Web Database Applications
III:媒介:协作研究:Web 数据库应用程序的公平性
  • 批准号:
    2106176
  • 财政年份:
    2021
  • 资助金额:
    $ 76.23万
  • 项目类别:
    Standard Grant
BD Hubs: Collaborative Proposal: Midwest: Midwest Big Data Hub: Building Communities to Harness the Data Revolution
BD 中心:协作提案:中西部:中西部大数据中心:建设社区以利用数据革命
  • 批准号:
    1916425
  • 财政年份:
    2019
  • 资助金额:
    $ 76.23万
  • 项目类别:
    Cooperative Agreement
BIGDATA: F: Collaborative Research: Foundations of Responsible Data Management
大数据:F:协作研究:负责任的数据管理的基础
  • 批准号:
    1741022
  • 财政年份:
    2017
  • 资助金额:
    $ 76.23万
  • 项目类别:
    Standard Grant
BIGDATA: Small: DA: Choosing a Needle in a Big Data Haystack
大数据:小:DA:大海捞针
  • 批准号:
    1250880
  • 财政年份:
    2013
  • 资助金额:
    $ 76.23万
  • 项目类别:
    Standard Grant
III: Small: Usable Databases Through Organic Technology
III:小型:通过有机技术可用的数据库
  • 批准号:
    1017296
  • 财政年份:
    2010
  • 资助金额:
    $ 76.23万
  • 项目类别:
    Standard Grant
TC: Small: Collaborative Research: User-Centric Privacy Control for Collaborative Social Media
TC:小型:协作研究:协作社交媒体的以用户为中心的隐私控制
  • 批准号:
    1017149
  • 财政年份:
    2010
  • 资助金额:
    $ 76.23万
  • 项目类别:
    Standard Grant
TC: Small: Analysis and Privacy Tools for Enterprise Database Audit Logs
TC:小型:企业数据库审计日志的分析和隐私工具
  • 批准号:
    0915782
  • 财政年份:
    2009
  • 资助金额:
    $ 76.23万
  • 项目类别:
    Continuing Grant
Principles for Scalable Dynamic Visual Analytics
可扩展动态视觉分析的原则
  • 批准号:
    0808824
  • 财政年份:
    2008
  • 资助金额:
    $ 76.23万
  • 项目类别:
    Standard Grant

相似国自然基金

多价框架核酸与CRISPR/Cas协作传感平台研究及三阴性乳腺癌术后监测应用
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
多价框架核酸与CRISPR/Cas协作传感平台研究及三阴性乳腺癌术后监测应用
  • 批准号:
    22204104
  • 批准年份:
    2022
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
基于高阶正则化半监督学习的多跟踪器框架模型及融合策略研究
  • 批准号:
    61571362
  • 批准年份:
    2015
  • 资助金额:
    57.0 万元
  • 项目类别:
    面上项目
表示模型框架下高光谱遥感影像分类若干技术研究
  • 批准号:
    61571033
  • 批准年份:
    2015
  • 资助金额:
    57.0 万元
  • 项目类别:
    面上项目
随机几何框架下的多层异构蜂窝网中物理层安全问题研究
  • 批准号:
    61401510
  • 批准年份:
    2014
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

EAGER/Collaborative Research: An LLM-Powered Framework for G-Code Comprehension and Retrieval
EAGER/协作研究:LLM 支持的 G 代码理解和检索框架
  • 批准号:
    2347624
  • 财政年份:
    2024
  • 资助金额:
    $ 76.23万
  • 项目类别:
    Standard Grant
Collaborative Research: An Integrated Framework for Learning-Enabled and Communication-Aware Hierarchical Distributed Optimization
协作研究:支持学习和通信感知的分层分布式优化的集成框架
  • 批准号:
    2331710
  • 财政年份:
    2024
  • 资助金额:
    $ 76.23万
  • 项目类别:
    Standard Grant
Collaborative Research: An Integrated Framework for Learning-Enabled and Communication-Aware Hierarchical Distributed Optimization
协作研究:支持学习和通信感知的分层分布式优化的集成框架
  • 批准号:
    2331711
  • 财政年份:
    2024
  • 资助金额:
    $ 76.23万
  • 项目类别:
    Standard Grant
Collaborative Research: A Semiconductor Curriculum and Learning Framework for High-Schoolers Using Artificial Intelligence, Game Modules, and Hands-on Experiences
协作研究:利用人工智能、游戏模块和实践经验为高中生提供半导体课程和学习框架
  • 批准号:
    2342747
  • 财政年份:
    2024
  • 资助金额:
    $ 76.23万
  • 项目类别:
    Standard Grant
Collaborative Research: Dynamic connectivity of river networks as a framework for identifying controls on flux propagation and assessing landscape vulnerability to change
合作研究:河流网络的动态连通性作为识别通量传播控制和评估景观变化脆弱性的框架
  • 批准号:
    2342936
  • 财政年份:
    2024
  • 资助金额:
    $ 76.23万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了