Imputing Single Cell Rna Sequencing Data: Mathematical, Statistical And Computational Challenges

估算单细胞 RNA 测序数据:数学、统计和计算挑战

基本信息

  • 批准号:
    10577202
  • 负责人:
  • 金额:
    $ 22.33万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2019
  • 资助国家:
    美国
  • 起止时间:
    2019-09-23 至 2023-08-31
  • 项目状态:
    已结题

项目摘要

Novel single cell RNA sequencing (scRNA-seq) technologies can simultaneously measure the expression levels of all 30,000 genes over thousands to millions of individual cells. The analysis of scRNA-seq data has already led to fundamental advances in biology, including discovery of new cell types, detection of subtle differences between similar cells, and reconstruction of cellular developmental trajectories. Single- cell measurements involve amplification of tiny amounts of RNA and result in extremely sparse data matrices with many zeros, While some of these zeros are due to missing data (dropouts), others represent true biological inactivity. Yet, many scRNA-seq imputation methods treat all observed zero entries identically, leading to imputed matrices that often overestimate transcriptional activity. Other methods that do attempt to distinguish biological zeros from dropouts lack rigorous theoretical guarantees. The goals of this proposal are to develop models, supporting mathematical theory, and computational tools that explicitly take the existence of true biological zeros into account. Matrix imputation under this constraint involves both computational challenges as well as theoretical questions in random matrix theory and high dimensional statistics. These include rank estimation and low rank sparse matrix recovery from partially observed data, and biclustering in the presence of dropouts and zeros, We plan to develop novel approaches based on non-smooth continuous optimization, and derive accompanying statistical guarantees, We also plan to develop ensemble learning approaches that cleverly combine the outputs of multiple imputation algorithms. Finally, we hope to gain important insights regarding recovery from such data via a study of minimax rates and information lower bounds. To address these challenges, we will build on our promising preliminary results and the joint expertise of the investigators in spectral methods, high dimensional statistics, matrix analysis, numerical optimization, and genomics.
新型的单细胞RNA测序(SCRNA-SEQ)技术可以同时测量所有的表达水平 30,000个基因超过数千至数百万个单个细胞。 SCRNA-seq数据的分析已经导致 生物学的基本进步,包括发现新细胞类型,发现之间的细微差异 类似的细胞,以及细胞发育轨迹的重建。单细胞测量涉及 放大少量的RNA,并在许多零中导致非常稀疏的数据矩阵,而其中一些则导致数据矩阵 这些零是由于缺少数据(辍学)所致,其他零代表了真正的生物学不活动。但是,许多scrna-seq 插补方法对所有观察到的零条目的处理相同,导致估算的矩阵通常高估 转录活动。其他尝试区分生物零与辍学的方法缺乏严格的 理论保证。该建议的目标是开发模型,支持数学理论以及 明确考虑了真正的生物零的存在的计算工具。矩阵插补 该约束涉及随机矩阵理论中的计算挑战以及理论问题 高维统计。这些包括排名估计和低等级稀疏矩阵从部分中恢复 观察到的数据以及在辍学和零的存在下进行的,我们计划基于 非平滑持续优化,并获得随附的统计保证,我们还计划开发 合奏学习方法巧妙地结合了多种归档算法的输出。最后,我们希望 通过研究最小值和信息较低 边界。为了应对这些挑战,我们将以我们有希望的初步结果和共同专业知识为基础 光谱方法的研究者,高维统计,基质分析,数值优化和基因组学。

项目成果

期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Provable Convex Co-clustering of Tensors.
COBRAC: a fast implementation of convex biclustering with compression
COBRAC:压缩凸双聚类的快速实现
  • DOI:
    10.1093/bioinformatics/btab248
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    5.8
  • 作者:
    Yi, Haidong;Huang, Le;Mishne, Gal;Chi, Eric C
  • 通讯作者:
    Chi, Eric C
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Eric C Chi其他文献

Eric C Chi的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Eric C Chi', 18)}}的其他基金

Imputing single cell RNA sequencing data: Mathematical, statistical and computational challenges
估算单细胞 RNA 测序数据:数学、统计和计算挑战
  • 批准号:
    9902859
  • 财政年份:
    2019
  • 资助金额:
    $ 22.33万
  • 项目类别:
Imputing single cell RNA sequencing data: Mathematical, statistical and computational challenges
估算单细胞 RNA 测序数据:数学、统计和计算挑战
  • 批准号:
    10021696
  • 财政年份:
    2019
  • 资助金额:
    $ 22.33万
  • 项目类别:
Imputing single cell RNA sequencing data: Mathematical, statistical and computational challenges
估算单细胞 RNA 测序数据:数学、统计和计算挑战
  • 批准号:
    10242066
  • 财政年份:
    2019
  • 资助金额:
    $ 22.33万
  • 项目类别:

相似国自然基金

含Re、Ru先进镍基单晶高温合金中TCP相成核—生长机理的原位动态研究
  • 批准号:
    52301178
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
基于SERS纳米标签和光子晶体的单细胞Western Blot定量分析技术研究
  • 批准号:
    31900571
  • 批准年份:
    2019
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
酵母RNase MRP的结构及催化机制研究
  • 批准号:
    31900929
  • 批准年份:
    2019
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
单细胞RNA和ATAC测序解析肌肉干细胞激活和增殖中的异质性研究
  • 批准号:
    31900570
  • 批准年份:
    2019
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
亚纳米单分子定位技术研究化学修饰对蛋白-膜相互作用的干预
  • 批准号:
    91753104
  • 批准年份:
    2017
  • 资助金额:
    70.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

Imputing single cell RNA sequencing data: Mathematical, statistical and computational challenges
估算单细胞 RNA 测序数据:数学、统计和计算挑战
  • 批准号:
    9902859
  • 财政年份:
    2019
  • 资助金额:
    $ 22.33万
  • 项目类别:
Imputing single cell RNA sequencing data: Mathematical, statistical and computational challenges
估算单细胞 RNA 测序数据:数学、统计和计算挑战
  • 批准号:
    10021696
  • 财政年份:
    2019
  • 资助金额:
    $ 22.33万
  • 项目类别:
Imputing single cell RNA sequencing data: Mathematical, statistical and computational challenges
估算单细胞 RNA 测序数据:数学、统计和计算挑战
  • 批准号:
    10242066
  • 财政年份:
    2019
  • 资助金额:
    $ 22.33万
  • 项目类别:
Sequencing not required: Imputing rare variants into a cohort of 100,000 on aging
不需要测序:将罕见变异归入 100,000 个衰老队列中
  • 批准号:
    8621405
  • 财政年份:
    2013
  • 资助金额:
    $ 22.33万
  • 项目类别:
Sequencing not required: Imputing rare variants into a cohort of 100,000 on aging
不需要测序:将罕见变异归入 100,000 个衰老队列中
  • 批准号:
    8741922
  • 财政年份:
    2013
  • 资助金额:
    $ 22.33万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了