BIGDATA: F: Collaborative Research: Foundations of Responsible Data Management

大数据:F:协作研究:负责任的数据管理的基础

基本信息

  • 批准号:
    1741047
  • 负责人:
  • 金额:
    $ 48.49万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2017
  • 资助国家:
    美国
  • 起止时间:
    2017-09-01 至 2019-04-30
  • 项目状态:
    已结题

项目摘要

Big Data technology promises to improve people's lives, accelerate scientific discovery and innovation, and bring about positive societal change. Yet, if not used responsibly, this same technology can reinforce inequity, limit accountability and infringe on the privacy of individuals: irreproducible results can influence global economic policy; algorithmic changes in search engines can sway elections and incite violence; models based on biased data can legitimize and amplify discrimination in the criminal justice system; algorithmic hiring practices can silently reinforce diversity issues and potentially violate the law; privacy and security violations can erode the trust of users and expose companies to legal and financial consequences. The focus of this project is on using Big Data technology responsibly -- in accordance with ethical and moral norms, and legal and policy considerations. This project establishes a foundational new role for data management technology, in which managing the responsible use of data across the lifecycle becomes a core system requirement. The broader goal of this project is to help usher in a new phase of data science, in which the technology considers not only the accuracy of the model but also ensures that the data on which it depends respect the relevant laws, societal norms, and impacts on humans. This project defines properties of responsible data management, which include fairness (and the related concepts of representativeness and diversity), transparency (and accountability), and data protection. It complements what is done in the data mining and machine learning communities, where the focus is on analyzing fairness, accountability and transparency of the final step in the data analysis lifecycle, and considers the problems that can be introduced upstream from data analysis: during dataset selection, cleaning, pre-processing, integration, and sharing. This project develops conceptual frameworks and algorithmic techniques that support fairness, transparency and data protection properties through all stages of the data usage lifecycle: beginning with data discovery and acquisition, through cleaning, integration, querying, and ultimately analysis. The contributions are structured along three aims. Aim 1 considers responsible dataset discovery, profiling, and integration. Aim 2 considers responsible query processing and develops a general framework for declarative specification, checking and enforcement of fairness, representativeness and diversity. Aim 3 incorporates data protection into the lifecycle, develops techniques to facilitate sharing of sensitive data, and considers the tradeoffs between privacy and transparency. This project is poised to establish a multidisciplinary research agenda around responsible data management as a critical factor in enabling fairness, accountability and transparency in decision-making and prediction systems. Additional information about the project is available at DataResponsibly.com.
大数据技术有望改善人们的生活,加快科学发现和创新,并带来积极的社会变革。但是,如果不负责任地使用,同样的技术可以加强不平等,限制对个人隐私的责任感和侵犯:不可再现的结果会影响全球经济政策;搜索引擎的算法变化可能会影响选举和煽动暴力;基于偏见数据的模型可以使刑事司法系统中的歧视合法化并扩大歧视;算法招聘实践可以默默地加强多样性问题,并可能违反法律;隐私和安全侵犯可能会侵蚀用户的信任,并使公司承受法律和财务后果。该项目的重点是按照道德和道德规范以及法律和政策考虑,负责任地使用大数据技术。该项目确立了数据管理技术的基础新作用,在该技术中,管理整个生命周期的数据使用成为核心系统的要求。该项目的更广泛的目标是帮助迎来一个新的数据科学阶段,在该阶段中,技术不仅考虑了模型的准确性,而且还确保其依赖其依赖相关法律,社会规范和对人类的影响的数据。该项目定义了负责任的数据管理的属性,其中包括公平性(以及代表性和多样性的相关概念),透明度(以及问责制)和数据保护。它补充了数据挖掘和机器学习社区中所做的事情,其中​​重点是分析数据分析生命周期最终步骤的公平性,问责制和透明度,并考虑了可以从数据分析中引入上游的问题:在数据集选择期间选择,清洁,预处理,预处理,集成,集成和共享。该项目开发了概念框架和算法技术,这些技术通过数据使用生命周期的所有阶段来支持公平,透明度和数据保护属性:从数据发现和获取开始,通过清洁,集成,查询,查询,最终分析。这些贡献是按三个目标结构的。 AIM 1考虑负责任的数据集发现,分析和集成。 AIM 2考虑了负责任的查询处理,并开发了宣告性规范,检查和执行公平,代表性和多样性的一般框架。 AIM 3将数据保护纳入生命周期,开发技术以促进敏感数据共享,并考虑隐私和透明度之间的权衡。该项目有望建立围绕负责数据管理的多学科研究议程,这是在决策和预测系统中实现公平,问责制和透明度的关键因素。有关该项目的其他信息,请访问dataresponsible.com。

项目成果

期刊论文数量(9)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
On Obtaining Stable Rankings
关于获得稳定的排名
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Abolfazl Asudeh, H. V.
  • 通讯作者:
    Abolfazl Asudeh, H. V.
Transparency, Fairness, Data Protection, Neutrality: Data Management Challenges in the Face of New Regulation
透明、公平、数据保护、中立:新监管下的数据管理挑战
Online Set Selection with Fairness and Diversity Constraints
  • DOI:
    10.5441/002/edbt.2018.22
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Julia Stoyanovich;Ke Yang;H. V. Jagadish
  • 通讯作者:
    Julia Stoyanovich;Ke Yang;H. V. Jagadish
A Query Engine for Probabilistic Preferences
概率偏好的查询引擎
  • DOI:
    10.1145/3183713.3196923
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Cohen, Uzi;Kenig, Batya;Ping, Haoyue;Kimelfeld, Benny;Stoyanovich, Julia
  • 通讯作者:
    Stoyanovich, Julia
Special Session: A Technical Research Agenda in Data Ethics and Responsible Data Management
特别会议:数据伦理和负责任的数据管理的技术研究议程
  • DOI:
    10.1145/3183713.3205185
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Stoyanovich, Julia;Howe, Bill;Jagadish, HV
  • 通讯作者:
    Jagadish, HV
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Julia Stoyanovich其他文献

Rankers, Rankees, & Rankings: Peeking into the Pandora's Box from a Socio-Technical Perspective
排名者、排名者、
  • DOI:
    10.48550/arxiv.2211.02932
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jun Yuan;Julia Stoyanovich;Aritra Dasgupta
  • 通讯作者:
    Aritra Dasgupta
Responsible AI literacy: A stakeholder-first approach
负责任的人工智能素养:利益相关者优先的方法
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Daniel Domínguez Figaredo;Julia Stoyanovich
  • 通讯作者:
    Julia Stoyanovich
AI reflections in 2020
2020年人工智能反思
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    23.8
  • 作者:
    Anna Jobin;K. Man;A. Damasio;Georgios Kaissis;R. Braren;Julia Stoyanovich;J. V. Bavel;Tessa V. West;B. Mittelstadt;J. Eshraghian;M. Costa;A. Tzachor;A. Jamjoom;M. Taddeo;E. Sinibaldi;Yipeng Hu;M. Luengo
  • 通讯作者:
    M. Luengo
Rule-based application development using Webdamlog
使用 Webdamlog 进行基于规则的应用程序开发
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    S. Abiteboul;Émilien Antoine;G. Miklau;Julia Stoyanovich;Jules Testard
  • 通讯作者:
    Jules Testard
The Webdamlog System Managing Distributed Knowledge on the Web
Webdamlog 系统管理网络上的分布式知识
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    S. Abiteboul;Émilien Antoine;Julia Stoyanovich
  • 通讯作者:
    Julia Stoyanovich

Julia Stoyanovich的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Julia Stoyanovich', 18)}}的其他基金

Collaborative Research: FW-HTF-RL: Trapeze: Responsible AI-assisted Talent Acquisition for HR Specialists
合作研究:FW-HTF-RL:Trapeze:负责任的人工智能辅助人力资源专家人才获取
  • 批准号:
    2326193
  • 财政年份:
    2023
  • 资助金额:
    $ 48.49万
  • 项目类别:
    Standard Grant
Collaborative Research: III: MEDIUM: Responsible Design and Validation of Algorithmic Rankers
合作研究:III:媒介:算法排序器的负责任设计和验证
  • 批准号:
    2312930
  • 财政年份:
    2023
  • 资助金额:
    $ 48.49万
  • 项目类别:
    Standard Grant
Collaborative Research: Framework for Integrative Data Equity Systems
协作研究:综合数据公平系统框架
  • 批准号:
    1934464
  • 财政年份:
    2019
  • 资助金额:
    $ 48.49万
  • 项目类别:
    Continuing Grant
BIGDATA: F: Collaborative Research: Foundations of Responsible Data Management
大数据:F:协作研究:负责任的数据管理的基础
  • 批准号:
    1926250
  • 财政年份:
    2019
  • 资助金额:
    $ 48.49万
  • 项目类别:
    Standard Grant
NSF-BSF: III: Small: Collaborative Research: Databases Meet Computational Social Choice
NSF-BSF:III:小型:协作研究:数据库满足计算社会选择
  • 批准号:
    1916647
  • 财政年份:
    2018
  • 资助金额:
    $ 48.49万
  • 项目类别:
    Standard Grant
NSF-BSF: III: Small: Collaborative Research: Databases Meet Computational Social Choice
NSF-BSF:III:小型:协作研究:数据库满足计算社会选择
  • 批准号:
    1813888
  • 财政年份:
    2018
  • 资助金额:
    $ 48.49万
  • 项目类别:
    Standard Grant
CAREER: Querying Evolving Graphs
职业:查询演化图
  • 批准号:
    1750179
  • 财政年份:
    2018
  • 资助金额:
    $ 48.49万
  • 项目类别:
    Continuing Grant
CAREER: Querying Evolving Graphs
职业:查询演化图
  • 批准号:
    1916505
  • 财政年份:
    2018
  • 资助金额:
    $ 48.49万
  • 项目类别:
    Continuing Grant
CRII: III: Managing Preference Data
CRII:III:管理偏好数据
  • 批准号:
    1464327
  • 财政年份:
    2015
  • 资助金额:
    $ 48.49万
  • 项目类别:
    Standard Grant
BSF: 2014391: Aggregation Methods for Partial Preferences Overview.
BSF:2014391:部分偏好的聚合方法概述。
  • 批准号:
    1539856
  • 财政年份:
    2015
  • 资助金额:
    $ 48.49万
  • 项目类别:
    Standard Grant

相似国自然基金

临时团队协作历史对协作主动行为的影响研究:基于社会网络视角
  • 批准号:
    72302101
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
在线医疗团队协作模式与绩效提升策略研究
  • 批准号:
    72371111
  • 批准年份:
    2023
  • 资助金额:
    41 万元
  • 项目类别:
    面上项目
数智背景下的团队人力资本层级结构类型、团队协作过程与团队效能结果之间关系的研究
  • 批准号:
    72372084
  • 批准年份:
    2023
  • 资助金额:
    40 万元
  • 项目类别:
    面上项目
A-型结晶抗性淀粉调控肠道细菌协作产丁酸机制研究
  • 批准号:
    32302064
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
面向人机接触式协同作业的协作机器人交互控制方法研究
  • 批准号:
    62373044
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目

相似海外基金

BIGDATA: IA: Collaborative Research: Asynchronous Distributed Machine Learning Framework for Multi-Site Collaborative Brain Big Data Mining
BIGDATA:IA:协作研究:用于多站点协作大脑大数据挖掘的异步分布式机器学习框架
  • 批准号:
    2348159
  • 财政年份:
    2023
  • 资助金额:
    $ 48.49万
  • 项目类别:
    Standard Grant
BIGDATA: IA: Collaborative Research: Intelligent Solutions for Navigating Big Data from the Arctic and Antarctic
BIGDATA:IA:协作研究:导航北极和南极大数据的智能解决方案
  • 批准号:
    2308649
  • 财政年份:
    2022
  • 资助金额:
    $ 48.49万
  • 项目类别:
    Standard Grant
BigData:IA:Collaborative Research: TIMES: A tensor factorization platform for spatio-temporal data
BigData:IA:协作研究:TIMES:时空数据张量分解平台
  • 批准号:
    2034479
  • 财政年份:
    2020
  • 资助金额:
    $ 48.49万
  • 项目类别:
    Standard Grant
BIGDATA: Collaborative Research: F: Holistic Optimization of Data-Driven Applications
BIGDATA:协作研究:F:数据驱动应用程序的整体优化
  • 批准号:
    2027516
  • 财政年份:
    2020
  • 资助金额:
    $ 48.49万
  • 项目类别:
    Standard Grant
BIGDATA: F: Collaborative Research: Practical Analysis of Large-Scale Data with Lyme Disease Case Study
BIGDATA:F:协作研究:莱姆病案例研究大规模数据的实际分析
  • 批准号:
    1934319
  • 财政年份:
    2019
  • 资助金额:
    $ 48.49万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了