BIGDATA: F: Collaborative Research: Foundations of Responsible Data Management

大数据:F:协作研究:负责任的数据管理的基础

基本信息

  • 批准号:
    1926250
  • 负责人:
  • 金额:
    $ 23.1万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2019
  • 资助国家:
    美国
  • 起止时间:
    2019-01-01 至 2021-08-31
  • 项目状态:
    已结题

项目摘要

Big Data technology promises to improve people's lives, accelerate scientific discovery and innovation, and bring about positive societal change. Yet, if not used responsibly, this same technology can reinforce inequity, limit accountability and infringe on the privacy of individuals: irreproducible results can influence global economic policy; algorithmic changes in search engines can sway elections and incite violence; models based on biased data can legitimize and amplify discrimination in the criminal justice system; algorithmic hiring practices can silently reinforce diversity issues and potentially violate the law; privacy and security violations can erode the trust of users and expose companies to legal and financial consequences. The focus of this project is on using Big Data technology responsibly -- in accordance with ethical and moral norms, and legal and policy considerations. This project establishes a foundational new role for data management technology, in which managing the responsible use of data across the lifecycle becomes a core system requirement. The broader goal of this project is to help usher in a new phase of data science, in which the technology considers not only the accuracy of the model but also ensures that the data on which it depends respect the relevant laws, societal norms, and impacts on humans. This project defines properties of responsible data management, which include fairness (and the related concepts of representativeness and diversity), transparency (and accountability), and data protection. It complements what is done in the data mining and machine learning communities, where the focus is on analyzing fairness, accountability and transparency of the final step in the data analysis lifecycle, and considers the problems that can be introduced upstream from data analysis: during dataset selection, cleaning, pre-processing, integration, and sharing. This project develops conceptual frameworks and algorithmic techniques that support fairness, transparency and data protection properties through all stages of the data usage lifecycle: beginning with data discovery and acquisition, through cleaning, integration, querying, and ultimately analysis. The contributions are structured along three aims. Aim 1 considers responsible dataset discovery, profiling, and integration. Aim 2 considers responsible query processing and develops a general framework for declarative specification, checking and enforcement of fairness, representativeness and diversity. Aim 3 incorporates data protection into the lifecycle, develops techniques to facilitate sharing of sensitive data, and considers the tradeoffs between privacy and transparency. This project is poised to establish a multidisciplinary research agenda around responsible data management as a critical factor in enabling fairness, accountability and transparency in decision-making and prediction systems. Additional information about the project is available at DataResponsibly.com.
大数据技术有望改善人们的生活,加速科学发现和创新,并带来积极的社会变革。然而,如果不负责任地使用,同样的技术可能会加剧不平等、限制问责制并侵犯个人隐私:不可复制的结果可能会影响全球经济政策;搜索引擎的算法变化可能会影响选举并煽动暴力;基于有偏见的数据的模型可能会使刑事司法系统中的歧视合法化并扩大;算法招聘做法可能会默默地强化多样性问题,并可能违反法律;侵犯隐私和安全行为可能会削弱用户的信任,并使公司面临法律和财务后果。该项目的重点是根据伦理和道德规范以及法律和政策考虑,负责任地使用大数据技术。该项目为数据管理技术建立了一个基础性的新角色,其中管理整个生命周期中数据的负责任使用成为核心系统要求。该项目更广泛的目标是帮助迎来数据科学的新阶段,其中技术不仅考虑模型的准确性,还确保其所依赖的数据尊重相关法律、社会规范和影响在人类身上。该项目定义了负责任的数据管理的属性,其中包括公平性(以及代表性和多样性的相关概念)、透明度(和问责制)和数据保护。它补充了数据挖掘和机器学习社区所做的工作,重点是分析数据分析生命周期最后一步的公平性、问责制和透明度,并考虑了数据分析上游可能引入的问题:在数据集期间选择、清洗、预处理、集成和共享。该项目开发概念框架和算法技术,在数据使用生命周期的所有阶段支持公平性、透明度和数据保护属性:从数据发现和获取开始,经过清理、集成、查询和最终分析。这些贡献是围绕三个目标构建的。目标 1 考虑负责任的数据集发现、分析和集成。目标 2 考虑负责任的查询处理,并开发一个用于声明性规范、检查和执行公平性、代表性和多样性的通用框架。目标 3 将数据保护纳入生命周期,开发促进敏感数据共享的技术,并考虑隐私和透明度之间的权衡。该项目旨在围绕负责任的数据管理建立一个多学科研究议程,作为实现决策和预测系统公平、问责和透明的关键因素。有关该项目的更多信息,请访问 DataResponsibility.com。

项目成果

期刊论文数量(20)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Disaggregated Interventions to Reduce Inequality
减少不平等的分类干预措施
  • DOI:
    10.1145/3465416.3483286
  • 发表时间:
    2021-10
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Bynum, Lucius;Loftus, Joshua;Stoyanovich, Julia
  • 通讯作者:
    Stoyanovich, Julia
Causal Intersectionality and Fair Ranking
因果交叉性和公平排名
Designing Fair Ranking Schemes
设计公平排名方案
Teaching Responsible Data Science: Charting New Pedagogical Territory
负责任的数据科学教学:绘制新的教学领域
COVID-19 Brings Data Equity Challenges to the Fore
COVID-19 使数据公平性挑战凸显
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Julia Stoyanovich其他文献

The Unbearable Weight of Massive Privilege: Revisiting Bias-Variance Trade-Offs in the Context of Fair Prediction
巨大特权的难以承受之重:在公平预测的背景下重新审视偏差-方差权衡
  • DOI:
    10.48550/arxiv.2302.08704
  • 发表时间:
    2023-02-17
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Falaah Arif Khan;Julia Stoyanovich
  • 通讯作者:
    Julia Stoyanovich
Making interval-based clustering rank-aware
使基于间隔的聚类具有排名意识
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Julia Stoyanovich;S. Amer;Tova Milo
  • 通讯作者:
    Tova Milo
Learning to explore scientific workflow repositories
学习探索科学工作流程存储库
  • DOI:
    10.1145/2484838.2484848
  • 发表时间:
    2013-07-29
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Julia Stoyanovich;Paramveer S. Dhillon;S. Davidson;Brian Lyons
  • 通讯作者:
    Brian Lyons
Workload-driven learning of mallows mixtures with pairwise preference data
具有成对偏好数据的锦葵混合物的工作负载驱动学习
Responsible data management
负责任的数据管理
  • DOI:
    10.14778/3415478.3415570
  • 发表时间:
    2020-08-01
  • 期刊:
  • 影响因子:
    2.5
  • 作者:
    Julia Stoyanovich;Bill Howe;H. V. Jagadish
  • 通讯作者:
    H. V. Jagadish

Julia Stoyanovich的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Julia Stoyanovich', 18)}}的其他基金

Collaborative Research: FW-HTF-RL: Trapeze: Responsible AI-assisted Talent Acquisition for HR Specialists
合作研究:FW-HTF-RL:Trapeze:负责任的人工智能辅助人力资源专家人才获取
  • 批准号:
    2326193
  • 财政年份:
    2023
  • 资助金额:
    $ 23.1万
  • 项目类别:
    Standard Grant
Collaborative Research: III: MEDIUM: Responsible Design and Validation of Algorithmic Rankers
合作研究:III:媒介:算法排序器的负责任设计和验证
  • 批准号:
    2312930
  • 财政年份:
    2023
  • 资助金额:
    $ 23.1万
  • 项目类别:
    Standard Grant
Collaborative Research: Framework for Integrative Data Equity Systems
协作研究:综合数据公平系统框架
  • 批准号:
    1934464
  • 财政年份:
    2019
  • 资助金额:
    $ 23.1万
  • 项目类别:
    Continuing Grant
NSF-BSF: III: Small: Collaborative Research: Databases Meet Computational Social Choice
NSF-BSF:III:小型:协作研究:数据库满足计算社会选择
  • 批准号:
    1916647
  • 财政年份:
    2018
  • 资助金额:
    $ 23.1万
  • 项目类别:
    Standard Grant
NSF-BSF: III: Small: Collaborative Research: Databases Meet Computational Social Choice
NSF-BSF:III:小型:协作研究:数据库满足计算社会选择
  • 批准号:
    1813888
  • 财政年份:
    2018
  • 资助金额:
    $ 23.1万
  • 项目类别:
    Standard Grant
CAREER: Querying Evolving Graphs
职业:查询演化图
  • 批准号:
    1750179
  • 财政年份:
    2018
  • 资助金额:
    $ 23.1万
  • 项目类别:
    Continuing Grant
CAREER: Querying Evolving Graphs
职业:查询演化图
  • 批准号:
    1916505
  • 财政年份:
    2018
  • 资助金额:
    $ 23.1万
  • 项目类别:
    Continuing Grant
BIGDATA: F: Collaborative Research: Foundations of Responsible Data Management
大数据:F:协作研究:负责任的数据管理的基础
  • 批准号:
    1741047
  • 财政年份:
    2017
  • 资助金额:
    $ 23.1万
  • 项目类别:
    Standard Grant
CRII: III: Managing Preference Data
CRII:III:管理偏好数据
  • 批准号:
    1464327
  • 财政年份:
    2015
  • 资助金额:
    $ 23.1万
  • 项目类别:
    Standard Grant
BSF: 2014391: Aggregation Methods for Partial Preferences Overview.
BSF:2014391:部分偏好的聚合方法概述。
  • 批准号:
    1539856
  • 财政年份:
    2015
  • 资助金额:
    $ 23.1万
  • 项目类别:
    Standard Grant

相似国自然基金

基于交易双方异质性的工程项目组织间协作动态耦合研究
  • 批准号:
    72301024
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
医保基金战略性购买促进远程医疗协作网价值共创的制度创新研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    45 万元
  • 项目类别:
    面上项目
面向协作感知车联网的信息分发时效性保证关键技术研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于自主性边界的人机协作-对抗混合智能控制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
面向5G超高清移动视频传输的协作NOMA系统可靠性研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

BIGDATA: IA: Collaborative Research: Asynchronous Distributed Machine Learning Framework for Multi-Site Collaborative Brain Big Data Mining
BIGDATA:IA:协作研究:用于多站点协作大脑大数据挖掘的异步分布式机器学习框架
  • 批准号:
    2348159
  • 财政年份:
    2023
  • 资助金额:
    $ 23.1万
  • 项目类别:
    Standard Grant
BIGDATA: IA: Collaborative Research: Intelligent Solutions for Navigating Big Data from the Arctic and Antarctic
BIGDATA:IA:协作研究:导航北极和南极大数据的智能解决方案
  • 批准号:
    2308649
  • 财政年份:
    2022
  • 资助金额:
    $ 23.1万
  • 项目类别:
    Standard Grant
BIGDATA: Collaborative Research: F: Holistic Optimization of Data-Driven Applications
BIGDATA:协作研究:F:数据驱动应用程序的整体优化
  • 批准号:
    2027516
  • 财政年份:
    2020
  • 资助金额:
    $ 23.1万
  • 项目类别:
    Standard Grant
BigData:IA:Collaborative Research: TIMES: A tensor factorization platform for spatio-temporal data
BigData:IA:协作研究:TIMES:时空数据张量分解平台
  • 批准号:
    2034479
  • 财政年份:
    2020
  • 资助金额:
    $ 23.1万
  • 项目类别:
    Standard Grant
BIGDATA: Collaborative Research: F: Efficient Distributed Computation of Large-Scale Graph Problems in Epidemiology and Contagion Dynamics
BIGDATA:协作研究:F:流行病学和传染动力学中大规模图问题的高效分布式计算
  • 批准号:
    1931628
  • 财政年份:
    2019
  • 资助金额:
    $ 23.1万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了