A novel platform for synthetic generation and statistical obfuscation of tabular clinical data, simulated images, and machine-generated text

用于表格临床数据、模拟图像和机器生成文本的合成生成和统计混淆的新颖平台

基本信息

  • 批准号:
    10696488
  • 负责人:
  • 金额:
    $ 32.46万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-09-15 至 2024-09-14
  • 项目状态:
    已结题

项目摘要

PROJECT SUMMARY Data is a critical and highly valuable commodity, driving meaningful change in our society, especially when it pertains to patient care and biomedical research. Currently, institutions pay inordinate sums to increase, regain, and complement their data panels. As an extra burden, data legislation and privacy protection regulations introduce barriers to forming effective partnerships between business, clinical, research and educational organizations. As a result, approximately 80% of medical data today can’t be readily shared because they contain personal, protected or sensitive information and remains unstructured and untapped after they are created. There is a growing and urgent unmet need for technology solutions that balance research and commercial organizations interests by supporting flexible general-purpose analytics while guaranteeing privacy protection. There are no effective mechanisms to enable data sharing without either risking inappropriate release of sensitive information or potential degradation of the information content. The currently available few protocols and algorithms for modeling, processing, interrogating, and ultimately sharing large sensitive data (e.g., thousands and millions of records with thousands of heterogeneous features) all share significant limitations and their practical use still lags behind research progress. Two major unmet needs in the data sharing industry are i) the inability to return de-identified clones of the raw data, and ii) lack of scalability requirements of production deployments. GrayRain, LLC is an early-stage Software-as-a-Service company developing a novel platform for statistical obfuscation and de- identification of sensitive structured (numerical, categorical tabular data) and unstructured information (e.g., clinical text, doctors/nurses notes and clinical images, such as MRI, PET). The core of GrayRain’s technology is the novel patented statistical obfuscation algorithm, DataSifter. The technology proposed in this STTR Phase I application will significantly increase the number of secure data transactions in the healthcare sector and beyond, enabling data sharing with fully controllable risk of identification of any sensitive information, including, but not limited to PHI (personal health information), demographic information, or socioeconomic status. GrayRain’s technology is able to produce de-identified clones of raw tabular data, addressing a major limitations encounter across existing data anonymization protocols. As far as scalability, the main goal of this STTR Phase I is to establish feasibility of GrayRain to accurately and efficiently (re: scalability) de- identify and share large-scale complex EHR data repositories with a controlled risk of disclosing protected or personal health information .
项目摘要 数据是一种至关重要且高度有价值的商品,推动了我们社会的有意义的变化, 特别是当它与患者护理和生物医学研究有关时。目前,机构付款 超额增加,继续并补充其数据面板。作为一个额外的伯恩, 数据立法和隐私保护法规引入了形成有效的障碍 业务,临床,研究和教育组织之间的伙伴关系。因此, 当今约有80%的医疗数据不容易共享,因为它们包含 个人,受保护或敏感的信息,并在他们之后保持无结构和未开发 被创建。对技术解决方案的需求不断增长且未满足的需求 研究和商业组织的兴趣通过支持灵活的通用物 分析同时保证隐私保护。 没有有效的机制可以启用 数据共享而不冒险释放敏感信息或潜在的可能性 信息内容的退化。当前可用的很少的协议和算法 建模,处理,询问和最终共享大型敏感数据(例如,成千上万 和数百万的记录具有数千个异质功能)都有重要的 局限性及其实际用途仍然落后于研究进度。两个主要未满足的需求 数据共享行业是i)无法返回原始数据的识别克隆,ii) 缺乏生产部署的可伸缩性要求。 Grayrain,LLC是一个早期 软件即服务公司开发一个新颖的平台,用于统计混淆和de- 识别敏感的结构化(数值,分类表数据)和非结构化 信息(例如,临床文本,医生/护士注意和临床图像,例如MRI,PET)。 Grayrain技术的核心是新颖的专利统计混淆算法,DataSifter。 在此STTR I期应用程序中提出的技术将大大增加 确保医疗保健领域及其他地区的数据交易,使数据共享可以完全 识别任何敏感信息的可控风险,包括但不限于PHI (个人健康信息),人口统计信息或社会经济状况。 Grayrain的 技术能够生成未识别的原始表格数据的克隆,从而解决了主要限制 在现有数据匿名协议中相遇。至于可伸缩性,主要目标 STTR I期是确定Grayrain的可行性,以准确有效地(RE:可伸缩性) 识别并共享具有披露风险的大规模复杂EHR数据存储库 受保护或个人健康信息。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Ronak Shetty其他文献

Ronak Shetty的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似国自然基金

分布式非凸非光滑优化问题的凸松弛及高低阶加速算法研究
  • 批准号:
    12371308
  • 批准年份:
    2023
  • 资助金额:
    43.5 万元
  • 项目类别:
    面上项目
资源受限下集成学习算法设计与硬件实现研究
  • 批准号:
    62372198
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
基于物理信息神经网络的电磁场快速算法研究
  • 批准号:
    52377005
  • 批准年份:
    2023
  • 资助金额:
    52 万元
  • 项目类别:
    面上项目
考虑桩-土-水耦合效应的饱和砂土变形与流动问题的SPH模型与高效算法研究
  • 批准号:
    12302257
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
面向高维不平衡数据的分类集成算法研究
  • 批准号:
    62306119
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Restoring Dexterous Hand Function with Artificial Neural Network-Based Brain-Computer Interfaces
利用基于人工神经网络的脑机接口恢复灵巧手功能
  • 批准号:
    10680206
  • 财政年份:
    2023
  • 资助金额:
    $ 32.46万
  • 项目类别:
A Novel Algorithm to Identify People with Undiagnosed Alzheimer's Disease and Related Dementias
一种识别未确诊阿尔茨海默病和相关痴呆症患者的新算法
  • 批准号:
    10696912
  • 财政年份:
    2023
  • 资助金额:
    $ 32.46万
  • 项目类别:
Molecular origins and evolution to chemoresistance in germ cell tumors
生殖细胞肿瘤中化学耐药性的分子起源和进化
  • 批准号:
    10443070
  • 财政年份:
    2023
  • 资助金额:
    $ 32.46万
  • 项目类别:
Transcriptome and spatial analyses of tumor environment in addressing colorectal cancer racial and ethnical disparities
肿瘤环境的转录组和空间分析在解决结直肠癌种族和民族差异方面的作用
  • 批准号:
    10743201
  • 财政年份:
    2023
  • 资助金额:
    $ 32.46万
  • 项目类别:
An acquisition and analysis pipeline for integrating MRI and neuropathology in TBI-related dementia and VCID
用于将 MRI 和神经病理学整合到 TBI 相关痴呆和 VCID 中的采集和分析流程
  • 批准号:
    10810913
  • 财政年份:
    2023
  • 资助金额:
    $ 32.46万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了