NEW WORD BASED METHODS FOR DNA SEQUENCE ASSEMBLY

基于新单词的 DNA 序列组装方法

基本信息

项目摘要

The growing use of DNA sequence data in research, databases, diagnostic and therapeutic biotechnology, and even litigation dramatically increases the need to improve the quality of data being used. This proposal addresses the problem of assembling a large set of sequenced DNA fragments into a finished consensus. In order for a sequencing project to produce high quality finished sequence data, the assembly of sequence fragments must be correct and accurate both in its large scale structure and in the fine scale detail of the alignment of individual base calls. We propose to investigate new algorithms for consensus estimation and assembly of DNA sequence fragments. Recent novel word- based approaches to consensus estimation offer promise as a method for de novo assembly and for exploring alternative assemblies on the large scale. This will be especially important when sequences contain large exact or approximate repeats. We propose to develop several main enhancements to these algorithms. In particular, we will develop a global optimization algorithm for determining consensus sequences, replacing current locally optimizing methods. Also, we propose to develop algorithms allowing alternative alignments in regions of ambiguity. This approach will allow us to assess alignment accuracy at both the large and fine scale level. PROPOSED COMMERCIAL APPLICATION Accurate assemblies are at the heart of many sequencing projects central to biopharmaceutical, agricultural, and basic research as well as to the Human Genome Project. The proposed advances will provide the potential for simultaneously increasing reliability and automation in a bioinformatics software market totaling about 100 million dollars per year.
在研究,数据库,诊断中,DNA序列数据的使用日益增长 和治疗性生物技术,甚至诉讼 增加了提高所使用数据质量的需求。 这 提案解决了组装​​大量测序的问题 DNA片段成最终的共识。为了进行测序 项目生成高质量的成品数据,组装 序列片段必须大规模正确且准确 结构以及个人对齐方式的细节 基本电话。我们建议研究共识的新算法 DNA序列片段的估计和组装。 最近的小说单词 - 基于共识估计的方法提供了承诺作为一种方法 从头大会和探索大型组装 规模。 当序列包含大的序列时,这将特别重要 精确或近似重复。 我们建议开发几个主要 这些算法的增强。 特别是,我们将发展一个 用于确定共识序列的全局优化算法, 替换当前当前优化方法。 另外,我们建议 开发算法,允许在 歧义。 这种方法将使我们能够评估一致性的准确性 大型和精细的水平。 拟议的商业应用 准确的组件是许多测序项目中心的核心 生物制药,农业和基础研究以及 人类基因组项目。 拟议的进步将提供潜力 同时提高可靠性和自动化 生物信息学软件市场总计约1亿美元 年。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

MAXIMILLIAN A KARLOVITZ其他文献

MAXIMILLIAN A KARLOVITZ的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('MAXIMILLIAN A KARLOVITZ', 18)}}的其他基金

STATISTICAL SOFTWARE FOR SCALE SPACE SMOOTHING
用于尺度空间平滑的统计软件
  • 批准号:
    6322085
  • 财政年份:
    2000
  • 资助金额:
    $ 10万
  • 项目类别:
CONFIDENCE ESTIMATION OF CONSENSUS DNA BASE CALLS
一致 DNA 碱基调用的置信度估计
  • 批准号:
    2717825
  • 财政年份:
    1998
  • 资助金额:
    $ 10万
  • 项目类别:

相似国自然基金

基于CUDA异构平台的大规模高精度药物-靶标相互作用预测研究
  • 批准号:
    61702444
  • 批准年份:
    2017
  • 资助金额:
    28.0 万元
  • 项目类别:
    青年科学基金项目
基于氨基酸序列及药物化合物分子指纹的药物-靶标相互作用预测研究
  • 批准号:
    61572506
  • 批准年份:
    2015
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目

相似海外基金

Training in Biomedical Discovery from Large Scale Data Sets
大规模数据集生物医学发现培训
  • 批准号:
    7293588
  • 财政年份:
    2006
  • 资助金额:
    $ 10万
  • 项目类别:
Training in Biomedical Discovery from Large Scale Data Sets
大规模数据集生物医学发现培训
  • 批准号:
    7492915
  • 财政年份:
    2006
  • 资助金额:
    $ 10万
  • 项目类别:
The MEME suite of motif-based sequence analysis tools
基于基序的序列分析工具 MEME 套件
  • 批准号:
    6907504
  • 财政年份:
    2005
  • 资助金额:
    $ 10万
  • 项目类别:
AMAUTA HEALTH INFORMATICS RESEARCH AND TRAINING PROGRAM
AMAUTA 健康信息学研究和培训计划
  • 批准号:
    7249492
  • 财政年份:
    2004
  • 资助金额:
    $ 10万
  • 项目类别:
Development of Bioinformatic Tools for Virtual Cloning
虚拟克隆生物信息学工具的开发
  • 批准号:
    6908174
  • 财政年份:
    2003
  • 资助金额:
    $ 10万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了