Integrated Assembly Software for Sanger and Next Generation Sequence Technologies

适用于 Sanger 和下一代序列技术的集成装配软件

基本信息

  • 批准号:
    8011298
  • 负责人:
  • 金额:
    $ 72.29万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2007
  • 资助国家:
    美国
  • 起止时间:
    2007-09-01 至 2011-12-31
  • 项目状态:
    已结题

项目摘要

DESCRIPTION (provided by applicant): The advent of next-generation (Next-gen) sequencing technologies has begun a surge in whole genome sequencing and resequencing, exemplified spectacularly by four papers describing five complete human genomes in 2008 alone. One company, Knome, now even offers customers their entire genome sequence using Next-gen sequencing technology. These developments, together with targeted resequencing of genome, presage the day of the $1000 human genome. Broad-scale whole human genome resequencing (WHGR) will have enormous impact on the areas of personalized medicine, human evolution and human diversity. To fully realize that potential, however, software capabilities must be dramatically enhanced to meet the significant challenges posed by the sheer volume of data generated in these projects, the diversity of technology-specific data characteristics and simply analyzing the 6 billion base pair diploid human genome. Moreover, we see the day when technology improvements and cost reductions make WHGR as commonplace as bacterial genome sequencing has become today. For that to occur, assembly and analysis software must be accessible to a far broader and less computer savvy range of researchers than the highly specialized bioinformatics teams that decode the information now. Also, computer resources are far more limited even for a well funded research laboratory than available to a large sequencing center. Therefore, the overall goal of this proposal is to develop a Next-gen sequence assembly and analysis pipeline, DESKAPP, that will run on an affordable ($5000) high- end desktop computer and produce a human genome sequence in a reasonable timeframe (days, not weeks). WHGR by DESKAPP will involve a reference-guided main assembly as well as a de novo assembly branch to characterize unique regions of the new genome relative to the reference. Merging of the assemblies produces a complete sequence that can be evaluated for gene content, single nucleotide polymorphisms (SNPs) and structural variation (SV; indels, inversion, translocations) both by web-based searches of external databases to identify known allelic variation and by direct examination of the sequence to identify new polymorphisms. A Disk Sort Alignment algorithm allows the data sets which are far too large for in-memory processing to be evaluated and clustered for assembly by SeqMan N-Gen (SM N-Gen), our desktop assembly engine. Using a prototype DSA-SM N-Gen pipeline, we have processed the entire 7.4x 454 data set from the James Watson genome to a layout file in 31 hours using DSA and have assembled three chromosomes: 8; 21; and X; using SM N-Gen. Assembly times varied from 1 hour for Chromosome 21 to 10.6 hours for an average- sized chromosome, such as Chromosome 8. Together, these results demonstrate the feasibility of constructing a DESKAPP pipeline for WHGR. The Phase II Aims are designed to build upon this foundation and produce a seamless pipeline for the desktop assembly and analysis of a human genome in a matter of days. PUBLIC HEALTH RELEVANCE: Next-gen sequencing technologies have started a new revolution throughout biology by providing DNA sequence data in unprecedented quantities at continually decreasing costs. This data will be invaluable in the emerging era of personalized medicine and in exploring the immense diversity of life. The goal of this project is to develop desktop computer software that will enable research laboratories and clinics of any size to realize the promise of these new technologies.
描述(由申请人提供):下一代(下一代)测序技术的出现已经开始了整个基因组测序和重大方程的激增,仅在2008年仅描述了五个完整的人类基因组的四篇论文就示例了。一家公司Knome现在甚至使用下一代测序技术为客户提供整个基因组序列。这些事态发展及其基因组的有针对性的重新方程,预示着1000美元的人类基因组的当天。大规模的整个人类基因组重新配置(WHGR)将对个性化医学,人类进化和人类多样性的领域产生巨大影响。为了充分意识到,必须大大提高软件功能,以应对这些项目中产生的大量数据所带来的重大挑战,特定于技术的数据特征的多样性,并简单地分析了60亿个碱基对二倍体人类基因组。此外,我们看到了技术的改进和成本降低使WHGR与细菌基因组测序一样普遍的日子已经成为今天。为此,与现在解码信息的高度专业化的生物信息学团队相比,组装和分析软件的研究人员可以访问更广泛,精通计算机的研究人员。同样,即使对于资金良好的研究实验室,计算机资源也比大型测序中心可用的要受到限制。因此,该提案的总体目标是开发下一代序列组件和分析管道DeskApp,该管道将以负担得起的(5000美元)的高端桌面计算机运行,并在合理的时间范围内生成人类基因组序列(天数,而不是几周)。 DeskApp的WHGR将涉及参考引导的主组装以及从头组装分支,以表征相对于参考的新基因组的独特区域。组件的合并会产生一个完整的序列,可以通过基于Web的外部数据库搜索来识别已知的等位基因变异,并直接检查新的多聚甲形象来评估基因含量,单核苷酸多态性(SNP)和结构变化(SV; Indels,倒置,易位)。磁盘排序对齐算法允许数据集太大,无法进行内存处理,无法评估和聚集由Seqman N-Gen(SM N-Gen)(我们的桌面组装引擎)组装。使用原型DSA-SM N-gen管道,我们使用DSA在31小时内将整个7.4x 454数据集从James Watson基因组中处理为布局文件,并组装了三个染色体:8; 21;和x;使用sm n-gen。从21染色体染色体的1小时到平均尺寸的染色体(例如8号染色体)的组装时间不等。总之,这些结果证明了为WHGR构建DeskApp管道的可行性。 II期目标旨在建立在该基础上,并在几天之内为人类基因组的桌面组装和分析提供无缝的管道。 公共卫生相关性:下一代测序技术通过以前所未有的数量以不断降低的成本提供了DNA序列数据,从而开始了整个生物学的新革命。这些数据将在个性化医学的新兴时代和探索巨大的生活多样性时无价。该项目的目的是开发台式计算机软件,该软件将使研究实验室和任何规模的诊所能够实现这些新技术的希望。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

TIMOTHY J DURFEE其他文献

TIMOTHY J DURFEE的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('TIMOTHY J DURFEE', 18)}}的其他基金

Long read based sequencing software for the comprehensive analysis of clinical samples
基于长读长的测序软件,用于临床样本的综合分析
  • 批准号:
    10009727
  • 财政年份:
    2020
  • 资助金额:
    $ 72.29万
  • 项目类别:
Scalable post-assembly editing software for finishing and annotating personal genomes
可扩展的组装后编辑软件,用于完成和注释个人基因组
  • 批准号:
    9883809
  • 财政年份:
    2018
  • 资助金额:
    $ 72.29万
  • 项目类别:
Scalable post-assembly editing software for finishing and annotating personal genomes
可扩展的组装后编辑软件,用于完成和注释个人基因组
  • 批准号:
    9767335
  • 财政年份:
    2018
  • 资助金额:
    $ 72.29万
  • 项目类别:
Complete genome de novo assembly software for the emerging long read sequencing era
适用于新兴长读长测序时代的完整基因组从头组装软件
  • 批准号:
    9255092
  • 财政年份:
    2017
  • 资助金额:
    $ 72.29万
  • 项目类别:
Complete genome de novo assembly software for the emerging long read sequencing era
适用于新兴长读长测序时代的完整基因组从头组装软件
  • 批准号:
    9747613
  • 财政年份:
    2017
  • 资助金额:
    $ 72.29万
  • 项目类别:
Association Analysis Software for Mining Clinical Next-Gen Sequencing Data
用于挖掘临床下一代测序数据的关联分析软件
  • 批准号:
    8236680
  • 财政年份:
    2012
  • 资助金额:
    $ 72.29万
  • 项目类别:
Association Analysis Software for Mining Clinical Next-Gen Sequencing Data
用于挖掘临床下一代测序数据的关联分析软件
  • 批准号:
    8727829
  • 财政年份:
    2012
  • 资助金额:
    $ 72.29万
  • 项目类别:
Association Analysis Software for Mining Clinical Next-Gen Sequencing Data
用于挖掘临床下一代测序数据的关联分析软件
  • 批准号:
    8703156
  • 财政年份:
    2012
  • 资助金额:
    $ 72.29万
  • 项目类别:
Association Analysis Software for Mining Clinical Next-Gen Sequencing Data
用于挖掘临床下一代测序数据的关联分析软件
  • 批准号:
    8624982
  • 财政年份:
    2012
  • 资助金额:
    $ 72.29万
  • 项目类别:
A Desktop Assembly and Analysis Pipeline for Next-gen Metagenomic Sequencing
用于下一代宏基因组测序的桌面组装和分析流程
  • 批准号:
    8200467
  • 财政年份:
    2011
  • 资助金额:
    $ 72.29万
  • 项目类别:

相似国自然基金

跨区域调水工程与区域经济增长:效应测度、机制探究与政策建议
  • 批准号:
    72373114
  • 批准年份:
    2023
  • 资助金额:
    40 万元
  • 项目类别:
    面上项目
农产品区域公用品牌地方政府干预机制与政策优化研究
  • 批准号:
    72373068
  • 批准年份:
    2023
  • 资助金额:
    41 万元
  • 项目类别:
    面上项目
新型城镇化与区域协调发展的机制与治理体系研究
  • 批准号:
    72334006
  • 批准年份:
    2023
  • 资助金额:
    167 万元
  • 项目类别:
    重点项目
我国西南地区节点城市在次区域跨国城市网络中的地位、功能和能级提升研究
  • 批准号:
    72364037
  • 批准年份:
    2023
  • 资助金额:
    28 万元
  • 项目类别:
    地区科学基金项目
多时序CT联合多区域数字病理早期预测胃癌新辅助化疗抵抗的研究
  • 批准号:
    82360345
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目

相似海外基金

The Assemblatron
组装机
  • 批准号:
    10564169
  • 财政年份:
    2023
  • 资助金额:
    $ 72.29万
  • 项目类别:
Genome-wide structure-based analysis of protein-protein interactions and networks
基于全基因组结构的蛋白质-蛋白质相互作用和网络分析
  • 批准号:
    10320837
  • 财政年份:
    2021
  • 资助金额:
    $ 72.29万
  • 项目类别:
Genome-wide structure-based analysis of protein-protein interactions and networks
基于全基因组结构的蛋白质-蛋白质相互作用和网络分析
  • 批准号:
    10542796
  • 财政年份:
    2021
  • 资助金额:
    $ 72.29万
  • 项目类别:
Genome-wide structure-based analysis of protein-protein interactions and networks
基于全基因组结构的蛋白质-蛋白质相互作用和网络分析
  • 批准号:
    10809330
  • 财政年份:
    2021
  • 资助金额:
    $ 72.29万
  • 项目类别:
Microbial Determinants of Clinical Heterogeneity in Lyme Disease
莱姆病临床异质性的微生物决定因素
  • 批准号:
    10223164
  • 财政年份:
    2020
  • 资助金额:
    $ 72.29万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了