AF: Small: Algorithmic Techniques for High-throughput Analysis of Long Reads
AF:小:长读长高通量分析的算法技术
基本信息
- 批准号:1816027
- 负责人:
- 金额:$ 42.5万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2018
- 资助国家:美国
- 起止时间:2018-10-01 至 2022-09-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The field of DNA sequencing has rapidly evolved from Sanger sequencing (700-1000 base pairs, or bp, in length) to massively parallel high-throughput sequencing of short reads (100-200 bp) to the more recent advances in generating long ( 5,000 bp) and ultra-long ( 50,000 bp) reads. There is currently an urgent need to develop efficient algorithms for analyzing long-read datasets in the context of the myriad biological applications they enable. Long read technologies sustain high error rates but with more attractive error distribution characteristics that often permit probabilistic guarantees on the quality of results. This project will result in fundamental research advances in developing bioinformatics algorithms for long-read sequencing, along with distributable open-source software products to facilitate their immediate adoption by the life sciences community. The award will also support interdisciplinary training, and undergraduate participation in research.The project seeks to advance mapping, assembly, and biological applications of long-read sequencing through the design of provably efficient algorithms, formal characterization of the quality of results, development of methods that scale to larger datasets, and methods that are robust to changes brought about by continued developments in long read sequencing. Problems addressed include (i) split-read mapping of ultra-long reads to a reference genome, (ii) development of data structures based on bloom filters to achieve space optimization and perfect statistical sensitivity, (iii) algorithms for mapping long reads to a collection of reference genomes represented by compact graph-based structures, (iv) algorithms for partitioning long reads to facilitate identification of haplotypes in diploid assemblies, and (v) long-read inspired alignment free algorithms for genome-to-genome comparison, as well as important biological applications enabled by these. The research will emphasize utilization of real datasets, relevance to practically encountered problems and applications, and independent validation by collaborators and other experts.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
DNA 测序领域已从桑格测序(长度为 700-1000 个碱基对或 bp)迅速发展到短读段(100-200 bp)的大规模并行高通量测序,再到生成长读段(5,000 个碱基对)的最新进展。 bp)和超长(50,000 bp)读取。目前迫切需要开发有效的算法来在其支持的无数生物应用的背景下分析长读数据集。长读技术维持高错误率,但具有更有吸引力的错误分布特征,通常可以对结果质量进行概率保证。该项目将在开发用于长读长测序的生物信息学算法方面取得基础研究进展,并提供可分发的开源软件产品,以促进其立即被生命科学界采用。该奖项还将支持跨学科培训和本科生参与研究。该项目旨在通过设计可证明有效的算法、结果质量的形式表征、方法的开发来推进长读长测序的绘图、组装和生物应用可以扩展到更大的数据集,以及对长读测序的持续发展所带来的变化具有鲁棒性的方法。解决的问题包括(i)超长读段到参考基因组的分割读段映射,(ii)开发基于布隆过滤器的数据结构以实现空间优化和完美的统计灵敏度,(iii)将长读段映射到参考基因组的算法由紧凑的基于图形的结构表示的参考基因组的集合,(iv)用于分割长读的算法,以促进二倍体组装中单倍型的识别,以及(v)用于基因组间比较的长读启发的免对齐算法作为由这些实现的重要生物应用。该研究将强调真实数据集的利用、与实际遇到的问题和应用的相关性,以及合作者和其他专家的独立验证。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查进行评估,被认为值得支持标准。
项目成果
期刊论文数量(14)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Accelerating Sequence Alignment to Graphs
- DOI:10.1109/ipdps.2019.00055
- 发表时间:2019-01-01
- 期刊:
- 影响因子:0
- 作者:Jain, Chirag;Misra, Sanchit;Aluru, Srinivas
- 通讯作者:Aluru, Srinivas
A fast adaptive algorithm for computing whole-genome homology maps
- DOI:10.1093/bioinformatics/bty597
- 发表时间:2018-09-01
- 期刊:
- 影响因子:5.8
- 作者:Jain, Chirag;Koren, Sergey;Aluru, Srinivas
- 通讯作者:Aluru, Srinivas
The Complexity of Approximate Pattern Matching on de Bruijn Graphs
- DOI:10.1007/978-3-031-04749-7_16
- 发表时间:2022-01-01
- 期刊:
- 影响因子:0
- 作者:Gibney, Daniel;Thankachan, Sharma V.;Aluru, Srinivas
- 通讯作者:Aluru, Srinivas
On the Complexity of Sequence-to-Graph Alignment
- DOI:10.1089/cmb.2019.0066
- 发表时间:2020-01-03
- 期刊:
- 影响因子:1.7
- 作者:Jain, Chirag;Zhang, Haowen;Aluru, Srinivas
- 通讯作者:Aluru, Srinivas
Haplotype-aware variant selection for genome graphs
- DOI:10.1145/3535508.3545556
- 发表时间:2022-08
- 期刊:
- 影响因子:0
- 作者:Neda Tavakoli;Daniel Gibney;S. Aluru
- 通讯作者:Neda Tavakoli;Daniel Gibney;S. Aluru
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Srinivas Aluru其他文献
A Parallel Monte Carlo Algorithm for Protein Accessible Surface Area Computation
蛋白质可及表面积计算的并行蒙特卡罗算法
- DOI:
10.1007/978-3-540-46642-0_49 - 发表时间:
1999 - 期刊:
- 影响因子:0
- 作者:
Srinivas Aluru;D. Ranjan;N. Futamura - 通讯作者:
N. Futamura
Srinivas Aluru的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Srinivas Aluru', 18)}}的其他基金
A scalable integrated multi-modal single cell analysis framework for gene regulatory and cell-cell interaction networks
用于基因调控和细胞间相互作用网络的可扩展集成多模式单细胞分析框架
- 批准号:
2233887 - 财政年份:2023
- 资助金额:
$ 42.5万 - 项目类别:
Continuing Grant
BD Hubs: Collaborative Proposal: SOUTH:The South Big Data Innovation Hub
BD Hubs:合作提案:SOUTH:南方大数据创新中心
- 批准号:
1916589 - 财政年份:2019
- 资助金额:
$ 42.5万 - 项目类别:
Cooperative Agreement
EAGER: A Framework for Learning Graph Algorithms with Applications to Social and Gene Networks
EAGER:学习图算法及其在社交和基因网络中的应用的框架
- 批准号:
1841351 - 财政年份:2018
- 资助金额:
$ 42.5万 - 项目类别:
Standard Grant
MRI: Acquisition of an HPC System for Data-Driven Discovery in Computational Astrophysics, Biology, Chemistry, and Materials Science
MRI:获取 HPC 系统,用于计算天体物理学、生物学、化学和材料科学中的数据驱动发现
- 批准号:
1828187 - 财政年份:2018
- 资助金额:
$ 42.5万 - 项目类别:
Standard Grant
Big Data Regional Innovation Hubs and Spokes Workshop
大数据区域创新中心和辐射研讨会
- 批准号:
1736154 - 财政年份:2017
- 资助金额:
$ 42.5万 - 项目类别:
Standard Grant
SHF:Small: Reproducibility and Comprehensive Assessment of Next Generation Sequencing Bioinformatics Software
SHF:Small:下一代测序生物信息学软件的重现性和综合评估
- 批准号:
1718479 - 财政年份:2017
- 资助金额:
$ 42.5万 - 项目类别:
Standard Grant
AF: Medium: Collaborative Research: Sequential and Parallel Algorithms for Approximate Sequence Matching with Applications to Computational Biology
AF:媒介:协作研究:近似序列匹配的顺序和并行算法及其在计算生物学中的应用
- 批准号:
1704552 - 财政年份:2017
- 资助金额:
$ 42.5万 - 项目类别:
Standard Grant
BD Hubs: Collaborative Proposal: SOUTH: A Big Data Innovation Hub for the South Region
BD 中心:合作提案:SOUTH:南部地区的大数据创新中心
- 批准号:
1550305 - 财政年份:2015
- 资助金额:
$ 42.5万 - 项目类别:
Standard Grant
EAGER: Exploratory Research on the Micron Automata Processor
EAGER:微米自动机处理器的探索性研究
- 批准号:
1448333 - 财政年份:2014
- 资助金额:
$ 42.5万 - 项目类别:
Standard Grant
Collaborative Research: ABI Innovation: Towards high-performance flexible transcription factor-DNA docking
合作研究:ABI 创新:迈向高性能灵活的转录因子-DNA 对接
- 批准号:
1356065 - 财政年份:2014
- 资助金额:
$ 42.5万 - 项目类别:
Continuing Grant
相似国自然基金
员工算法规避行为的内涵结构、量表开发及多层次影响机制:基于大(小)数据研究方法整合视角
- 批准号:72372021
- 批准年份:2023
- 资助金额:40 万元
- 项目类别:面上项目
基于球面约束和小波框架正则化的磁共振图像处理变分模型与快速算法
- 批准号:12301545
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于谱图小波变换算法的2型糖尿病肠道微生物组学网络标志物筛选研究
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
用于非小细胞肺癌免疫疗效预测的复合传感模式电子鼻构建及智能算法研究
- 批准号:
- 批准年份:2021
- 资助金额:57 万元
- 项目类别:面上项目
基于相关关系信息增强的遥感图像小目标快速检测算法研究
- 批准号:
- 批准年份:2021
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
AF: Small: Problems in Algorithmic Game Theory for Online Markets
AF:小:在线市场的算法博弈论问题
- 批准号:
2332922 - 财政年份:2024
- 资助金额:
$ 42.5万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: New Directions in Algorithmic Replicability
合作研究:AF:小:算法可复制性的新方向
- 批准号:
2342244 - 财政年份:2024
- 资助金额:
$ 42.5万 - 项目类别:
Standard Grant
NSF-BSF: Collaborative Research: AF: Small: Algorithmic Performance through History Independence
NSF-BSF:协作研究:AF:小型:通过历史独立性实现算法性能
- 批准号:
2420942 - 财政年份:2024
- 资助金额:
$ 42.5万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: New Directions in Algorithmic Replicability
合作研究:AF:小:算法可复制性的新方向
- 批准号:
2342245 - 财政年份:2024
- 资助金额:
$ 42.5万 - 项目类别:
Standard Grant
NSF-BSF: AF: Small: Algorithmic and Information-Theoretic Challenges in Causal Inference
NSF-BSF:AF:小:因果推理中的算法和信息论挑战
- 批准号:
2321079 - 财政年份:2023
- 资助金额:
$ 42.5万 - 项目类别:
Standard Grant