基因组比较与分析算法研究

项目介绍
AI项目解读

基本信息

  • 批准号:
    61472222
  • 项目类别:
    面上项目
  • 资助金额:
    83.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0201.计算机科学的基础理论
  • 结题年份:
    2018
  • 批准年份:
    2014
  • 项目状态:
    已结题
  • 起止时间:
    2015-01-01 至2018-12-31

项目摘要

The reversal or translocation sorting, the short block move sorting, the exemplar breakpoint distance,and the scaffold filling, are all typical combinatorial problems in comparison and analysis of genomes. In this project, we will design two new approximation algorithms, respectively for sorting unsigned genomes by reversals and sorting unsigned genomes by translocations to find better solutions; design a new algorithm for sorting genomes by short block moves to find better solutions, then prove its complexity;design a deterministic exact and a randomized algorithm to improve the time complexity to a lower bound for the zero exemplar breakpoint distance problem, then design a parameterized algorithm for the exemplar breakpoint distance problem; design a new approximation algorithm for the single sided scaffold filling to find better solutions,then prove the complexity of a sub problem of it and design an approximation algorithm to find better solutions than that the algorithm can find for its general version, and design a new approximation algorithm to find better solutions for the two sided scaffold filling. The algorithmic contents of this project always aim to design algorithms to achieve better performance measures, while the complexity approaches aim to prove those problems which are open for their complexity to be NP-Hard. We will manufacture softwares based on the newly designed algorithms, in order to be used in the researches and practices of mocular biology and medical science.
翻转与移位排序、短块移动排序、样本断点距离、和片段框架填充,均为基因组比较与分析的代表性问题。设计无向基因组翻转和移位排序问题的新近似算法,改进算法的近似性能比;设计基因组短块移动排序的改进近似算法,证明该问题的复杂性;设计零样本断点距离问题的确定精确算法和随机求解算法,改进算法的时间复杂性,设计样本断点距离问题的实用参数算法;设计单面片段框架填充问题的新近似算法,改进算法近似性能比;证明单面片段框架填充问题子问题的复杂性,设计其近似算法;设计双面片段框架填充问题的改进近似算法。算法设计均以达到以前未曾达到的量化性能指标为目标,复杂性研究则以证明目前尚未确定复杂性问题的NP-难解性为目标。将设计出的新算法实现为生物信息学软件,用于以基因组比较分析为基础的分子生物学和医学研究与实践中。

结项摘要

项目研究内容以基因组结构比较分析为背景。研究基因组结构差异分析的组合优化问题模型,和解答问题的算法。.将无向基因组移位排序的近似性能比由1.408改进为1.375。设计出无向断点图2-圈分解的多项式时间算法,解决了一个开放20年的基因组重排研究中的基本问题。设计出基因组双面片段填充近似性能比为1.5的多项式时间近似算法,并将近似性能比进一步改进为1.4+e。设计出(1,2)-样本断点距离问题的新动态规划算法,最长样本公共子序列问题的新动态规划算法。最长样本公共子序列用于表示基因组保守子序列,在基因组功能分析研究中具有重要意义。设计出基因组短交换排序问题判定版本的多项式算法,解决了开放10年的基因组比较领域的典型问题。给出转录组组装新算法,计算精度和运算时间好于原有算法。给出一个利用自顶向下蛋白质质谱数据,鉴定蛋白质的有向图模型。这一模型可有效避免鉴定过程中的蛋白质丢失问题,并能保证计算速度。在国家自然科学基金资助下,于2016年举办了第十届国际算法前沿年会(FAW2016),于2018年举办了第24届国际计算与组合年会(Cocoon2018)。发表期刊论文11篇,SCI收录10篇,国际会议论文15篇。

项目成果

期刊论文数量(11)
专著数量(0)
科研奖励数量(0)
会议论文数量(15)
专利数量(0)
Approximating Max NAE-k-SAT by anonymous local search
通过匿名本地搜索近似最大 NAE-k-SAT
  • DOI:
    10.1016/j.tcs.2016.05.040
  • 发表时间:
    2017-01
  • 期刊:
    Theoretical Computer Science
  • 影响因子:
    1.1
  • 作者:
    Aiyong Xian;Kaiyuan Zhu;Daming Zhu;Lianrong Pu;Hong Liu
  • 通讯作者:
    Hong Liu
A factor-(1.408+epsilon) approximation for sorting unsigned genomes by reciprocal translocations
通过相互易位对无符号基因组进行排序的因子(1.408 epsilon)近似值
  • DOI:
    10.1016/j.tcs.2015.04.036
  • 发表时间:
    2015
  • 期刊:
    Theoretical Computer Science
  • 影响因子:
    1.1
  • 作者:
    Jiang Haitao;Zhu Daming;Wang Lusheng;Zhu Binhai;Zhu BH
  • 通讯作者:
    Zhu BH
A graph-based filtering method for top-down mass spectral identification.
用于自上而下质谱识别的基于图的过滤方法
  • DOI:
    10.1186/s12864-018-5026-x
  • 发表时间:
    2018-09-24
  • 期刊:
    BMC genomics
  • 影响因子:
    4.4
  • 作者:
    Yang R;Zhu D
  • 通讯作者:
    Zhu D
An approximation algorithm for genome sorting by reversals to recover all adjacencies
通过反转恢复所有邻接的基因组排序的近似算法
  • DOI:
    10.1007/s10878-018-0346-y
  • 发表时间:
    2019
  • 期刊:
    Journal of Combinatorial Optimization
  • 影响因子:
    1
  • 作者:
    Shanshan Zhai;Peng Zhang;Daming Zhu;Weitian Tong;Yao Xu;Guohui Lin
  • 通讯作者:
    Guohui Lin
PQ-树断点距离中心问题的复杂性和精确算法
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    计算机研究与发展
  • 影响因子:
    --
  • 作者:
    刘培霞;姜海涛;朱大铭
  • 通讯作者:
    朱大铭
共 9 条
  • 1
  • 2
前往

其他文献

基因组移位排序的多项式时间算法
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机学报
  • 影响因子:
    --
  • 作者:
    尹晓;朱大铭
  • 通讯作者:
    朱大铭
Predicting Model and Algorithm in RNA Folding Structure Including Pseudoknots
包括假结在内的 RNA 折叠结构的预测模型和算法
  • DOI:
    10.1142/s0218001418510059
  • 发表时间:
    2018-06
  • 期刊:
    International Journal of Pattern Recognition and Artificial Intelligence
  • 影响因子:
    1.5
  • 作者:
    刘振栋;朱大铭;戴琼海
  • 通讯作者:
    戴琼海
短块移动排序的14/11近似算法
  • DOI:
    --
  • 发表时间:
    2011
  • 期刊:
    中国科学:信息科学
  • 影响因子:
    --
  • 作者:
    姜海涛;朱大铭
  • 通讯作者:
    朱大铭
基于深度卷积神经网络的无序蛋白质功能模体的识别
  • DOI:
    --
  • 发表时间:
    2018
  • 期刊:
    济南大学学报(自然科学版)
  • 影响因子:
    --
  • 作者:
    方春;田爱奎;孙福振;李彩虹;朱大铭
  • 通讯作者:
    朱大铭
超椭圆曲线上Montgomery 标量乘的快速计算公式
  • DOI:
    --
  • 发表时间:
    2013
  • 期刊:
    软件学报
  • 影响因子:
    --
  • 作者:
    李明;孔繁玉;朱大铭
  • 通讯作者:
    朱大铭
共 12 条
  • 1
  • 2
  • 3
前往

正在为您生成内容...

朱大铭的其他基金

基因组结构相似性分析算法
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    55 万元
  • 项目类别:
    面上项目
基因组结构相似性分析算法
  • 批准号:
    62272272
  • 批准年份:
    2022
  • 资助金额:
    55.00 万元
  • 项目类别:
    面上项目
基因组数据分析的基础理论与算法
  • 批准号:
    61732009
  • 批准年份:
    2017
  • 资助金额:
    260.0 万元
  • 项目类别:
    重点项目
基因组比较问题的算法与复杂性
  • 批准号:
    61070019
  • 批准年份:
    2010
  • 资助金额:
    31.0 万元
  • 项目类别:
    面上项目
基因组重组比较算法与复杂性研究
  • 批准号:
    60573024
  • 批准年份:
    2005
  • 资助金额:
    25.0 万元
  • 项目类别:
    面上项目
多中心点问题的算法设计与应用
  • 批准号:
    60273032
  • 批准年份:
    2002
  • 资助金额:
    22.0 万元
  • 项目类别:
    面上项目
基因组重组进化树问题的算法及复杂性
  • 批准号:
    60073042
  • 批准年份:
    2000
  • 资助金额:
    14.0 万元
  • 项目类别:
    面上项目