Accelerating Genomic Data Sharing and Collaborative Research with Privacy Protection

通过隐私保护加速基因组数据共享和协作研究

基本信息

  • 批准号:
    10735407
  • 负责人:
  • 金额:
    $ 67.3万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-09-01 至 2028-05-31
  • 项目状态:
    未结题

项目摘要

Abstract. The rapid progress in genome sequencing has led to significant data collection. Analyzing this data can be transformative in answering the key questions about disease associations and our evolution. However, due to growing privacy concerns about the sensitive information of participants, access to genomic datasets used in studies, such as genome-wide association studies (GWAS), is restricted to only a limited number of large groups. On the other hand, collaborative research over genomic datasets, which will also lead to democratizing genomic data sharing, requires sharing data across collaborators. One way to share such datasets across collaborators is through the IRB process and the use of institutional data use agreements. Currently, due to the sensitivity of data, the GWAS computation can only be carried out after IRB review for all collaborators. In this research, we propose a sandbox environment in which potential collaborators come together and obtain an accurate "preview" of their collaborative research in an efficient, reproducible (verifiable), and privacy- preserving way. Our proposed framework allows each collaborator to share information about their dataset in a privacy-preserving way within the proposed sandbox environment. This will help the researchers (1) rectify their federated datasets from low-quality, biased, or statistically dependent records, (2) generate an accurate preview of their collaborative GWAS results to provide evidence for benefit versus risk tradeoff in IRB approval, and (3) identify what part of the datasets should be shared among the collaborators (once they obtain the full IRB approval). To achieve these goals, we will develop (1) novel algorithms that enable quality control over federated data while preserving ownership and privacy and (2) algorithms that promote reproducibility of GWAS results by developing novel techniques for verifying the correctness of GWAS computation and for sharing the whole research datasets while preserving privacy. Our preliminary results show that the proposed framework accurately provides evidence of reproducibility of GWAS results, identifies low-quality (e.g., statistically dependent) data in federated datasets, and preserves the privacy of individuals in collaborators' datasets. Notably, we show that privacy risk due to the proposed framework is lower than the one accepted by the NIH Genomic Data Sharing Policy. Finally, working together with the IRB from three institutions, we will design a pilot study to explore the efficacy of the proposed framework and its integration into the current IRB process. The outcomes of this research will provide a new strategy for genomic data sharing.
抽象的。基因组测序的快速进展带来了大量的数据收集。分析中 这些数据对于回答有关疾病关联和我们的疾病的关键问题具有革命性的意义。 进化。然而,由于对参与者敏感信息的隐私担忧日益增加, 访问研究中使用的基因组数据集,例如全基因组关联研究(GWAS) 仅限于数量有限的大型团体。另一方面,合作研究 基因组数据集也将导致基因组数据共享民主化,需要共享数据 跨合作者。在合作者之间共享此类数据集的一种方法是通过 IRB 流程 以及机构数据使用协议的使用。目前,由于数据的敏感性,GWAS 所有合作者必须经过IRB审核后才能进行计算。在这项研究中,我们提出 沙盒环境,潜在合作者聚集在一起并获得准确的 以高效、可重复(可验证)和隐私的方式“预览”他们的合作研究 保存方式。我们提出的框架允许每个合作者共享有关他们的信息 在建议的沙箱环境中以保护隐私的方式存储数据集。这将有助于 研究人员 (1) 纠正低质量、有偏见或统计依赖性的联合数据集 记录,(2) 生成其协作 GWAS 结果的准确预览,为以下方面提供证据: IRB 批准中的收益与风险权衡,以及 (3) 确定应共享数据集的哪一部分 合作者之间(一旦获得 IRB 的完全批准)。为了实现这些目标,我们将 开发 (1) 新颖的算法,能够对联合数据进行质量控制,同时保留 所有权和隐私,以及 (2) 通过开发提高 GWAS 结果可重复性的算法 验证 GWAS 计算正确性和共享整体的新技术 研究数据集,同时保护隐私。我们的初步结果表明,所提出的框架 准确地提供 GWAS 结果可重复性的证据,识别低质量(例如, 统计上相关的)联邦数据集中的数据,并保护个人的隐私 合作者的数据集。值得注意的是,我们表明所提出的框架带来的隐私风险较低 比 NIH 基因组数据共享政策所接受的数据更重要。最后,与 来自三个机构的IRB,我们将设计一项试点研究来探索所提议的功效 框架及其与当前 IRB 流程的整合。这项研究的成果将提供 基因组数据共享的新策略。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Erman Ayday其他文献

Erman Ayday的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Erman Ayday', 18)}}的其他基金

Privacy Challenges of Genomic Data-Sharing Beacons and Solutions
基因组数据共享信标和解决方案的隐私挑战
  • 批准号:
    10031275
  • 财政年份:
    2020
  • 资助金额:
    $ 67.3万
  • 项目类别:
Privacy Challenges of Genomic Data-Sharing Beacons and Solutions
基因组数据共享信标和解决方案的隐私挑战
  • 批准号:
    10443776
  • 财政年份:
    2020
  • 资助金额:
    $ 67.3万
  • 项目类别:
Privacy Challenges of Genomic Data-Sharing Beacons and Solutions
基因组数据共享信标和解决方案的隐私挑战
  • 批准号:
    10674031
  • 财政年份:
    2020
  • 资助金额:
    $ 67.3万
  • 项目类别:
Privacy Challenges of Genomic Data-Sharing Beacons and Solutions
基因组数据共享信标和解决方案的隐私挑战
  • 批准号:
    10223439
  • 财政年份:
    2020
  • 资助金额:
    $ 67.3万
  • 项目类别:

相似国自然基金

本体驱动的地址数据空间语义建模与地址匹配方法
  • 批准号:
    41901325
  • 批准年份:
    2019
  • 资助金额:
    22.0 万元
  • 项目类别:
    青年科学基金项目
时空序列驱动的神经形态视觉目标识别算法研究
  • 批准号:
    61906126
  • 批准年份:
    2019
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
针对内存攻击对象的内存安全防御技术研究
  • 批准号:
    61802432
  • 批准年份:
    2018
  • 资助金额:
    25.0 万元
  • 项目类别:
    青年科学基金项目
大容量固态硬盘地址映射表优化设计与访存优化研究
  • 批准号:
    61802133
  • 批准年份:
    2018
  • 资助金额:
    23.0 万元
  • 项目类别:
    青年科学基金项目
IP地址驱动的多径路由及流量传输控制研究
  • 批准号:
    61872252
  • 批准年份:
    2018
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目

相似海外基金

The Proactive and Reactive Neuromechanics of Instability in Aging and Dementia with Lewy Bodies
衰老和路易体痴呆中不稳定的主动和反应神经力学
  • 批准号:
    10749539
  • 财政年份:
    2024
  • 资助金额:
    $ 67.3万
  • 项目类别:
Mitral Regurgitation Quantification Using Dual-venc 4D flow MRI and Deep learning
使用 Dual-venc 4D 流 MRI 和深度学习对二尖瓣反流进行量化
  • 批准号:
    10648495
  • 财政年份:
    2023
  • 资助金额:
    $ 67.3万
  • 项目类别:
A computational model for prediction of morphology, patterning, and strength in bone regeneration
用于预测骨再生形态、图案和强度的计算模型
  • 批准号:
    10727940
  • 财政年份:
    2023
  • 资助金额:
    $ 67.3万
  • 项目类别:
Admin Core (FABRIC)
管理核心 (FABRIC)
  • 批准号:
    10897496
  • 财政年份:
    2023
  • 资助金额:
    $ 67.3万
  • 项目类别:
Blood Biomarker Development and Validation in Chronic Traumatic Encephalopathy and Alzheimer's Disease and Alzheimer's Disease Related Dementias
慢性创伤性脑病、阿尔茨海默病和阿尔茨海默病相关痴呆的血液生物标记物开发和验证
  • 批准号:
    10662752
  • 财政年份:
    2023
  • 资助金额:
    $ 67.3万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了