基于加权有向多重图的DNA序列比较的非比对方法研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61401186
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    24.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0124.生物电子学与生物信息处理
  • 结题年份:
    2017
  • 批准年份:
    2014
  • 项目状态:
    已结题
  • 起止时间:
    2015-01-01 至2017-12-31

项目摘要

Alignment-free methods play an important role in response to the overwhelming burst in data generated by molecular biology initiatives. It is the focus of Post Genome Era. This project establishes a new method of graphical representation, in which DNA sequences are converted into networks. By mapping to weighted directed graph, distances between adjacent k-word in DNA sequence are converted into paths in the network. Existing knowledge and algorithms from graph theory will both promote development of data mining in DNA sequences and provide a new strategy in sequence comparison. The diameter, degree sequence, various paths of properties, scales and numbers of clusters in this new network, together with special features of DNA network, average distance among the same k-words, regression distance, constitute a feature vector. Sequences comparison can be done based on this feature vector. Based on information in paths among k-word, the positional information of k-word is explored. Based on modules' properties in the network, the relationship information of k-word is explored. Mathematical descriptors are created for describing invariants under the process of evolution(mutation, insertion, deletion, replication, shift). Through classification algorithms from SVM and Random Forest, features of network are selected. Based on the features, efficient alignment-free methods are proposed. This study includes establishment of several new efficient alignment-free methods and software tools for DNA sequences comparison. Furthermore, based on DNA sequences’ reconstructible properties from all their k-word counts, this project will also create the mathematical descriptors for data sets, in which the alignment-free methods are tested.
生物序列比较的非比对方法在处理日益增长的生物序列中发挥着重要作用,是后基因组时代的研究热点。本项目将DNA序列映射到加权有向图中,将k-词间的距离对应为网络中的路径长度,利用图论理论和算法为DNA序列的信息挖掘提供全新的策略。将网络的直径,度序列,各种特性的路径,团的大小及数量,及DNA序列网络的特殊具有的相同k-词间的平均距离,回归距离的特征,组成特征向量,利用该向量进行DNA序列比较。计算有向图中的路径信息,挖掘k-词的位置信息;分析有向图中的模块化特性,挖掘k-词间的关联信息。构造DNA序列在进化过程中(如突变、插入、删除、复制、转移等)的相对不变量。通过SVM分类算法和随机森林方法进行特征选择,建立精准高效的序列非比对方法。本项目的研究将建立若干准确高效的非比对方法,为DNA序列的比较提供工具支持,并将给出非比对方法数据测试集的k-词组成唯一生成的数学指标,推动非比对方法研究。

结项摘要

生物序列比较的非比对方法在处理日益增长的生物序列中发挥着重要作用,是后基因组时代的研究热点。基于k-词组成的生物序列非比对方法是其中的一类重要方法。基于k-词组成的非比对方法是经过实践检验的有效的生物序列比较方法。通过它们,我们对生物序列在多种角度和不同层面上有了丰富的了解。然而,基于k-词组成的生物序列非比对方法存在一些需要完善的问题。例如,k-词长度的选择依赖于生物序列数据,没有公认的选择机制。. 本项目将DNA序列首尾相连生成环状结构。通过一一映射,将这个环状结构映射到有向网络中。在给定的有向图网络上,我们实现了查找所有欧拉回路的算法。一方面,基于这个算法,对于给定的DNA序列,该算法能确定k-词组成唯一生成该序列的k值,为我们从理论层面剖析DNA序列提供了切入点。另一方面,我们提出了4种非比对的序列比较方法,对每一种方法中距离的k词长度,给出了有理论依据的选择机制;对于每一种方法,我们分别选取了3个真实生物序列集,基于我们提出的距离,进行进化树重建得到的结果与普遍接受的权威结果高度一致;这些高效的非比对方法,为DNA序列的比较提供工具支持。以上两个方面都有助于推动DNA序列的非比对方法研究。. 另外,我们在与DNA序列非比对方法中的图形表示方法密切相关的图的交叉数领域得到了几个结果。证明了完全4部图K_{1,1,1,3}与路径P_n笛卡尔乘积图的交叉数为10n;给出了完全4部图K_{1,1,m,n}的交叉数的下界;证明了10个六阶图与路径P_n笛卡尔乘积图的交叉数;令G_m是在完全二部图K_{1,m}中添加3条边得到的简单图,并且添加的3条边有一个公共的端点。对于任意的自然数m和n,我们证明了G_m与P_n笛卡尔乘积图的交叉数。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码