TC:Large:Collaborative Research:Anonymizing Textual Data and its Impact on Utility

TC:大型:协作研究:匿名文本数据及其对实用性的影响

基本信息

  • 批准号:
    1011984
  • 负责人:
  • 金额:
    $ 35.7万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2010
  • 资助国家:
    美国
  • 起止时间:
    2010-09-01 至 2015-08-31
  • 项目状态:
    已结题

项目摘要

Data Protection laws that exempt data that is not individually identifiable have led to an explosion in anonymization research. Unfortunately, how well current de-identification and anonymization techniques control risks to privacy and confidentiality is not well understood. Neither is the usefulness of anonymized data for real-world applications. The project addresses anonymization on three fronts: 1) Textual data, even when explicit identifiers are removed (names, dates, locations), can contain highly identifiable information. For example, a sample of chief complaint fields from the Indiana Network for Patient Care (INPC) found several instances of "phantom limb pain". Amputees can be visually identifiable, but the HIPAA Safe Harbor rules do not list this as "identifying information". Any policy explicitly listing all types of identifying data is likely to fail. Through a joint effort with computer science and linguistics, the project is developing new methods to remove specific details from text while preserving meaning, eliminating such highly identifiable information without a priori knowledge of what would be identifying. 2) Current anonymization research is based on unproven measures of identifiability. Through a re-identification challenge on synthetic data (but based on real healthcare data), the project is evaluating the efficacy of these measures. Interdisciplinary teams of students are given challenge problems - anonymized data with hypothetical healthcare data - and asked to make (hypothetical) inferences about health information of individuals. The results can be used to calibrate the effectiveness of different anonymization measures. 3) The utility of anonymized data has been a concern among research: Does anonymized data provide credible research results? By partnering with healthcare studies at the Kinsey Institute and Purdue University School of Nursing, the project is comparing analyses on original data with analyses on anonymized data, and evaluating the impact of types of anonymization on research results. A related issue is determining the impact on data collection: Are individuals more candid in their responses if they know data will be anonymized? Outcomes are broadening the scope of research that can be performed on anonymized data, while ensuring that researchers know when access to individually identifiable data (with attendant restrictions and safeguards) is needed. Through these tasks, the project is advancing our ability to utilize the wealth of data we now collect for the benefit of society, while ensuring individual privacy is protected. For further information see the project web site at the URL: http://projects.cerias.purdue.edu/TextAnon
数据保护法豁免了无法单独识别的数据,这导致了匿名化研究的爆炸式增长。不幸的是,目前的去识别和匿名技术如何控制隐私和机密性风险尚不清楚。匿名数据对于现实世界的应用程序也没有什么用处。该项目从三个方面解决匿名问题:1)即使删除了明确的标识符(姓名、日期、位置),文本数据也可能包含高度可识别的信息。例如,印第安纳州患者护理网络 (INNPC) 的主诉字段样本发现了数起“幻肢痛”的病例。截肢者可以通过视觉识别,但 HIPAA 安全港规则并未将其列为“识别信息”。任何明确列出所有类型的识别数据的策略都可能会失败。通过与计算机科学和语言学的共同努力,该项目正在开发新方法,从文本中删除特定细节,同时保留含义,从而在不事先了解要识别的内容的情况下消除此类高度可识别的信息。 2) 当前的匿名化研究基于未经证实的可识别性措施。通过对合成数据(但基于真实医疗数据)的重新识别挑战,该项目正在评估这些措施的有效性。跨学科的学生团队面临挑战问题 - 匿名数据和假设的医疗保健数据 - 并要求对个人的健康信息做出(假设的)推论。结果可用于校准不同匿名措施的有效性。 3)匿名数据的效用一直是研究关注的问题:匿名数据能否提供可信的研究结果?通过与金赛研究所和普渡大学护理学院的医疗保健研究合作,该项目正在将原始数据分析与匿名数据分析进行比较,并评估匿名类型对研究结果的影响。一个相关的问题是确定对数据收集的影响:如果个人知道数据将被匿名,他们的反应是否会更加坦诚?结果扩大了可对匿名数据进行的研究范围,同时确保研究人员知道何时需要访问个人可识别数据(附带限制和保障措施)。通过这些任务,该项目正在提高我们利用现在收集的大量数据造福社会的能力,同时确保个人隐私受到保护。有关更多信息,请参阅项目网站,网址为:http://projects.cerias.purdue.edu/TextAnon

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Wei Jiang其他文献

Crystalline characteristics of cellulose fiber and film regenerated from ionic liquid solution.
离子液体溶液再生纤维素纤维和薄膜的结晶特性。
  • DOI:
    10.1016/j.carbpol.2014.11.008
  • 发表时间:
    2015-03-15
  • 期刊:
  • 影响因子:
    11.2
  • 作者:
    Liangfeng Sun;Jonathan Y. Chen;Wei Jiang;V. Lynch
  • 通讯作者:
    V. Lynch
Proximate Composition and Nutritional Profile of Rainbow Trout (Oncorhynchus mykiss) Heads and Skipjack tuna (Katsuwonus Pelamis) Heads
虹鳟鱼 (Oncorhynchus mykiss) 头和鲣鱼 (Katsuwonus Pelamis) 头的大致成分和营养成分
  • DOI:
    10.3390/molecules24173189
  • 发表时间:
    2019-09-01
  • 期刊:
  • 影响因子:
    4.6
  • 作者:
    Weinan Li;Yu Liu;Wei Jiang;Xiaojun Yan
  • 通讯作者:
    Xiaojun Yan
Increased systemic microbial translocation is associated with depression during early pregnancy.
全身微生物易位增加与妊娠早期抑郁症有关。
  • DOI:
    10.1016/j.jpsychires.2017.11.009
  • 发表时间:
    2018-02-01
  • 期刊:
  • 影响因子:
    4.8
  • 作者:
    Zejun Zhou;C. Guille;Elizabeth Ogunrinde;Renyu Liu;Zhenwu Luo;Anna M. Powell;Wei Jiang
  • 通讯作者:
    Wei Jiang
Type inactivated bivalent hantavirus vaccines using dual fluorescence quantitative real‐time PCR: Establishment and evaluation
双荧光定量实时 PCR 型灭活二价汉坦病毒疫苗:建立和评价
  • DOI:
    10.1002/jmv.24599
  • 发表时间:
    2017-01-01
  • 期刊:
  • 影响因子:
    12.7
  • 作者:
    Wei Jiang;Ning Ma;Qi Hui;Bo Chen;Ye Qiu;Hongliang Sun;Yuhua Li
  • 通讯作者:
    Yuhua Li
Ultrasound-Guided Lumbar Plexus Block Reduces Emergence Agitation in Children Undergoing Hip Surgery: A Prospective Randomized Controlled Trial
超声引导腰丛阻滞可减少接受髋关节手术的儿童的苏醒期躁动:一项前瞻性随机对照试验
  • DOI:
    10.21203/rs.3.rs-1168457/v1
  • 发表时间:
    2022-01-10
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Hui Zhang;Junfeng Zhang;Xiaofeng Wang;Tao Xu;Haiming Yan;Yonggang Yang;Yongzhu Chen;Wei Jiang;Qing Fan;Ai
  • 通讯作者:
    Ai

Wei Jiang的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Wei Jiang', 18)}}的其他基金

TWC SBE: Medium: Collaborative: Building a Privacy-Preserving Social Networking Platform from a Technological and Sociological Perspective
TWC SBE:媒介:协作:从技术和社会学角度构建保护隐私的社交网络平台
  • 批准号:
    1855391
  • 财政年份:
    2018
  • 资助金额:
    $ 35.7万
  • 项目类别:
    Standard Grant
TWC SBE: Medium: Collaborative: Building a Privacy-Preserving Social Networking Platform from a Technological and Sociological Perspective
TWC SBE:媒介:协作:从技术和社会学角度构建保护隐私的社交网络平台
  • 批准号:
    1564101
  • 财政年份:
    2016
  • 资助金额:
    $ 35.7万
  • 项目类别:
    Standard Grant
I-Corps: An Outsourced and Completely Private Social Network: You&Me
I-Corps:一个外包且完全私有的社交网络:您
  • 批准号:
    1522781
  • 财政年份:
    2015
  • 资助金额:
    $ 35.7万
  • 项目类别:
    Standard Grant
Collaborative Research: Predatory Lending, Predatory Borrowing, and the Mortgage Crisis: Evidence from Loan-Level Data from a Large Bank
合作研究:掠夺性贷款、掠夺性借款和抵押危机:来自大型银行贷款水平数据的证据
  • 批准号:
    0851428
  • 财政年份:
    2009
  • 资助金额:
    $ 35.7万
  • 项目类别:
    Continuing Grant
CAREER: Data Quality Management through Statistical Quality Control and Data Mining
职业:通过统计质量控制和数据挖掘进行数据质量管理
  • 批准号:
    0542881
  • 财政年份:
    2006
  • 资助金额:
    $ 35.7万
  • 项目类别:
    Continuing Grant
STTR Phase I: Fully Embedded Optical Interconnect Layers Based on Molded Polymer Lightwave Components for Large Field Size Printed Circuit Boards
STTR 第一阶段:用于大面积印刷电路板的基于模制聚合物光波组件的完全嵌入式光学互连层
  • 批准号:
    0539538
  • 财政年份:
    2006
  • 资助金额:
    $ 35.7万
  • 项目类别:
    Standard Grant
Role of Cdk Phosphorylation of HsCdc6 in DNA Replication
HsCdc6 Cdk 磷酸化在 DNA 复制中的作用
  • 批准号:
    0233887
  • 财政年份:
    2002
  • 资助金额:
    $ 35.7万
  • 项目类别:
    Continuing Grant
Role of Cdk Phosphorylation of HsCdc6 in DNA Replication
HsCdc6 Cdk 磷酸化在 DNA 复制中的作用
  • 批准号:
    0078432
  • 财政年份:
    2000
  • 资助金额:
    $ 35.7万
  • 项目类别:
    Continuing Grant

相似国自然基金

基于可变惯容调谐质量阻尼器的大跨度桥梁多模态涡振半主动控制方法研究
  • 批准号:
    52378147
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
面向要素流动的城市群居民活动空间边界识别、机理与测度研究:以粤港澳大湾区为例
  • 批准号:
    42371202
  • 批准年份:
    2023
  • 资助金额:
    46 万元
  • 项目类别:
    面上项目
苯并环辛烷类大环对质膜外表面磷脂酰丝氨酸的选择性识别及其体外的应用研究
  • 批准号:
    22301046
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
区域出口产品升级的时空格局及机制研究——以粤港澳大湾区为例
  • 批准号:
    42301182
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
高光产额、快衰减、大尺寸Cs3Cu2I5:Mn晶体的水溶液法生长研究
  • 批准号:
    62305193
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

TC: Large: Collaborative Research: Facilitating Free and Open Access to Information on the Internet
TC:大型:合作研究:促进互联网上信息的自由和开放获取
  • 批准号:
    1540066
  • 财政年份:
    2015
  • 资助金额:
    $ 35.7万
  • 项目类别:
    Continuing Grant
TC: Large: Collaborative Research: Facilitating Free and Open Access to Information on the Internet
TC:大型:合作研究:促进互联网上信息的自由和开放获取
  • 批准号:
    1111539
  • 财政年份:
    2012
  • 资助金额:
    $ 35.7万
  • 项目类别:
    Continuing Grant
TC: Large: Collaborative Research: Facilitating Free and Open Access to Information on the Internet
TC:大型:合作研究:促进互联网上信息的自由和开放获取
  • 批准号:
    1111734
  • 财政年份:
    2012
  • 资助金额:
    $ 35.7万
  • 项目类别:
    Continuing Grant
TC: Large: Collaborative Research: Facilitating Free and Open Access to Information on the Internet
TC:大型:合作研究:促进互联网上信息的自由和开放获取
  • 批准号:
    1111723
  • 财政年份:
    2012
  • 资助金额:
    $ 35.7万
  • 项目类别:
    Continuing Grant
TC: Large: Collaborative Research: Privacy-Enhanced Secure Data Provenance
TC:大型:协作研究:隐私增强的安全数据来源
  • 批准号:
    1111925
  • 财政年份:
    2011
  • 资助金额:
    $ 35.7万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了