CAREER: Differentially-Private Machine Learning with Applications to Biomedical Informatics

职业:差分隐私机器学习及其在生物医学信息学中的应用

基本信息

  • 批准号:
    1253942
  • 负责人:
  • 金额:
    $ 49.06万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2013
  • 资助国家:
    美国
  • 起止时间:
    2013-07-01 至 2019-06-30
  • 项目状态:
    已结题

项目摘要

Machine learning on large-scale patient medical records can lead to the discovery of novel population-wide patterns enabling advances in genetics, disease mechanisms, drug discovery, healthcare policy, and public health. However, concerns over patient privacy prevent biomedical researchers from running their algorithms on large volumes of patient data, creating a barrier to important new discoveries through machine-learning. The goal of this project is to address this barrier by developing privacy-preserving tools to query, cluster, classify and analyze medical databases. In particular, the project aims to ensure differential privacy --- a formal mathematical notion of privacy designed by cryptographers which has gained considerable attention in the systems, algorithms, machine-learning and data-mining communities in recent years. The primary challenge in applying differentially-private machine learning tools to biomedical informatics is the lack of statistical efficiency, or the large number of samples required.The project will overcome this challenge by drawing on insights obtained from the PI's expertise to develop differentially-private and highly statistically-efficient machine learning tools for classification and clustering. The proposed research will advance the state-of-the-art in privacy-preserving data analysis by combining insights from differential privacy, statistics, machine learning, and database algorithms. The proposed research is closely tied to the development of the undergraduate and graduate curricula at UCSD, feeding into the PI's new undergraduate machine learning class, a new graduate learning theory class, and updates to an algorithm design and analysis class. The corresponding materials will be publicly disseminated through the PI's website. The PI is strongly committed to increasing the participation of women and minorities, and will engage in outreach activities to attract and retain women in computer science.
大规模患者病历上的机器学习可能会导致发现新颖的人口范围内的新模式,从而在遗传学,疾病机制,药物发现,医疗保健政策和公共卫生方面取得了进步。但是,对患者隐私的担忧阻止了生物医学研究人员在大量患者数据上运行其算法,从而通过机器学习为重要的新发现造成了障碍。该项目的目的是通过开发保护隐私的工具来查询,群集,分类和分析医疗数据库来解决这一障碍。特别是,该项目旨在确保差异隐私 - 密码师设计的正式数学隐私概念在近年来在系统,算法,机器学习和数据挖掘社区中引起了广泛关注。 将差异性机器学习工具应用于生物医学信息学的主要挑战是缺乏统计效率,或者所需的大量样品。该项目将通过利用从PI的专业知识获得的见解来克服这一挑战,以开发差异性和高度统计效率高的机器学习工具进行分类和聚类。拟议的研究将通过结合来自差异隐私,统计,机器学习和数据库算法的见解来推动保护隐私数据分析的最先进数据。拟议的研究与UCSD的本科生和研究生课程的开发密切相关,介绍了PI的新本科机器学习课程,新的研究生学习理论课程,并​​更新到算法设计和分析类。 相应的材料将通过PI的网站公开传播。 PI强烈致力于增加妇女和少数民族的参与,并将从事外展活动,以吸引和保留妇女在计算机科学中。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Kamalika Chaudhuri其他文献

Privacy Amplification by Subsampling in Time Domain
通过时域二次采样实现隐私放大
A Two-Stage Active Learning Algorithm for k-Nearest Neighbors
k-最近邻的两阶段主动学习算法
Guarantees of confidentiality via Hammersley-Chapman-Robbins bounds
通过 Hammersley-Chapman-Robbins 界限保证机密性
  • DOI:
    10.48550/arxiv.2404.02866
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kamalika Chaudhuri;Chuan Guo;L. Maaten;Saeed Mahloujifar;M. Tygert
  • 通讯作者:
    M. Tygert
Composition properties of inferential privacy for time-series data
时间序列数据推理隐私的组成属性
Agnostic Multi-Group Active Learning
不可知多组主动学习
  • DOI:
    10.48550/arxiv.2306.01922
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Nick Rittler;Kamalika Chaudhuri
  • 通讯作者:
    Kamalika Chaudhuri

Kamalika Chaudhuri的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Kamalika Chaudhuri', 18)}}的其他基金

Collaborative Research: CIF-Medium: Privacy-preserving Machine Learning on Graphs
合作研究:CIF-Medium:图上的隐私保护机器学习
  • 批准号:
    2402817
  • 财政年份:
    2024
  • 资助金额:
    $ 49.06万
  • 项目类别:
    Standard Grant
SaTC: CORE: Small: Robust and Private Federated Analytics on Networked Data
SaTC:核心:小型:网络数据的稳健且私密的联合分析
  • 批准号:
    2241100
  • 财政年份:
    2023
  • 资助金额:
    $ 49.06万
  • 项目类别:
    Standard Grant
SaTC: CORE: Frontier: Collaborative: End-to-End Trustworthiness of Machine-Learning Systems
SaTC:核心:前沿:协作:机器学习系统的端到端可信度
  • 批准号:
    1804829
  • 财政年份:
    2018
  • 资助金额:
    $ 49.06万
  • 项目类别:
    Continuing Grant
CCF: CIF: Small: Interactive Learning from Noisy, Heterogeneous Feedback
CCF:CIF:小型:从嘈杂、异构的反馈中进行交互式学习
  • 批准号:
    1719133
  • 财政年份:
    2017
  • 资助金额:
    $ 49.06万
  • 项目类别:
    Standard Grant
RI: Small: Collaborative Research: New Directions in Spectral Learning with Applications to Comparative Epigenomics
RI:小型:协作研究:光谱学习的新方向及其在比较表观基因组学中的应用
  • 批准号:
    1617157
  • 财政年份:
    2016
  • 资助金额:
    $ 49.06万
  • 项目类别:
    Standard Grant

相似国自然基金

基于QTL定位的砂梨与西洋梨果实酯类芳香物质差异的分子遗传机制解析
  • 批准号:
    32302492
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
同源异形盒转录因子HB15和HB97调控甘蔗热带种和割手密种叶片发育的功能差异解析
  • 批准号:
    32301881
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
玉米氮吸收基因NAE1的遗传变异及功能差异研究
  • 批准号:
    32301839
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
人参属物种主根形态和植化成分差异的遗传机制研究
  • 批准号:
    32360151
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目
基于生理响应和差异代谢-转录组学联合解析3-癸稀-2-酮对马铃薯的抑芽作用机制
  • 批准号:
    32360611
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目

相似海外基金

Collaborative Research: SaTC: CORE: Medium: Differentially Private SQL with flexible privacy modeling, machine-checked system design, and accuracy optimization
协作研究:SaTC:核心:中:具有灵活隐私建模、机器检查系统设计和准确性优化的差异化私有 SQL
  • 批准号:
    2317232
  • 财政年份:
    2024
  • 资助金额:
    $ 49.06万
  • 项目类别:
    Continuing Grant
CICI: TCR: Transitioning Differentially Private Federated Learning to Enable Collaborative, Intelligent, Fair Skin Disease Diagnostics on Medical Imaging Cyberinfrastructure
CICI:TCR:转变差异化私有联合学习,以实现医学影像网络基础设施上的协作、智能、公平的皮肤病诊断
  • 批准号:
    2319742
  • 财政年份:
    2024
  • 资助金额:
    $ 49.06万
  • 项目类别:
    Standard Grant
Collaborative Research: SaTC: CORE: Medium: Differentially Private SQL with flexible privacy modeling, machine-checked system design, and accuracy optimization
协作研究:SaTC:核心:中:具有灵活隐私建模、机器检查系统设计和准确性优化的差异化私有 SQL
  • 批准号:
    2317233
  • 财政年份:
    2024
  • 资助金额:
    $ 49.06万
  • 项目类别:
    Continuing Grant
CIF: Small: Ensuring Accuracy in Differentially Private Decentralized Optimization
CIF:小:确保差分隐私去中心化优化的准确性
  • 批准号:
    2334449
  • 财政年份:
    2024
  • 资助金额:
    $ 49.06万
  • 项目类别:
    Standard Grant
Collaborative Research: SaTC: CORE: Small: Differentially Private Data Synthesis: Practical Algorithms and Statistical Foundations
协作研究:SaTC:核心:小型:差分隐私数据合成:实用算法和统计基础
  • 批准号:
    2247795
  • 财政年份:
    2023
  • 资助金额:
    $ 49.06万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了