多核系统下调控模式识别的MapReduce模型及算法研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61173025
  • 项目类别:
    面上项目
  • 资助金额:
    55.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0214.新型计算及其应用基础
  • 结题年份:
    2015
  • 批准年份:
    2011
  • 项目状态:
    已结题
  • 起止时间:
    2012-01-01 至2015-12-31

项目摘要

调控模式识别是生物信息学研究领域中的一个基本问题。研究表明,现有方法对保守模式预测的准确程度,无论在碱基水平还是在结合位点水平都较低。在本项目中,我们以改善调控模式的识别算法的准确度和性能为基本目标,充分利用当前多核系统的处理器所提供的高效的计算性能以及多线程和多进程的并行处理技术,提出一种基于多核系统的MapReduce模型;其次,引入位点之间的局部构象信息,建立TFBS与转录起始位点之间距离的分布特征及约束关系,从而建立调控模式的模体模型。提出一种调控模式识别的MapReduce算法,降低算法的时间复杂度,提高对于长序列和特征微弱模式识别的准确程度;最后,通过对JASPAR、TRANSFAC等数据库的统计特征分析,研究调控模式位点的分布特征,设计有效和精确的P-value计算方法。在此基础上,建立多核系统上有效解决数据密集型和计算密集型问题的一种新的计算模型。

结项摘要

(1) 项目的背景.转录因子结合位点 (Transcription Factor Binding Site,TFBS)又被称为顺式调控元件 (Cis-regulatory Element)。在生物信息学中也称为模式或模体 (motif)。识别这些控制基因表达的顺式调控元件,以及表征它们与各自转录因子的相互作用,不仅对于构建转录调控网络,而且对于解释有机物复杂的起源和进化有着重要的意义。.(2) 主要研究内容.本项目以改善调控模式识别算法的准确性和性能为基本目标,研究调控模式识别的高效精确算法;建立MapReduce框架下调控模式识别的模型,提高对于长序列、大字符集和特征微弱模式识别的准确程度;研究转录因子结合位点分布的统计特征,建立调控模式识别的统计方法;实现一个调控模式识别的软件系统原型。.(3) 重要结果.在模体发现的精确算法和近似算法方面做出了较好的工作。主要包括:提出了MapReduce框架下大数据集(ChIP-seq数据集)上子串挖掘方法和模体发现算法MCES;提出了MapReduce框架下精确模体识别的数据划分方法PMSPMR,PMSPMR算法具有良好的可扩展性,加速比接近于线性;建立了模体stem首个正则表达式表示方式,提出了大字符集(蛋白质序列)上高效的stem搜索算法(StemFinder);提出了结合概率分析的模体发现的近似算法PairMotif+。建立了高阶熵压缩的参考基因组序列的自索引结构,并基于此结构进行空间高效的短读序列比对。.(4) 关键数据及科学意义.我们在本领域重要刊物IEEE/ACM Transactions on Computational Biology and Bioinformatics (JCR = 2)等和重要会议IEEE International Conference on Bioinformatics and Biomedicine (CCF B类会议)和IEEE Data Compression Conference (CCF B类会议) 等发表了15篇论文(其中8篇论文为刊物论文,7篇为会议论文),SCI检索6篇,EI检索9篇。开发了可在Google和GitHub上访问的软件。这些研究成果为进一步研究高通量测序数据集的结构模体发现,在基因组水平上探索基因的表达调控机制奠定了较好的基础。

项目成果

期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(7)
专利数量(0)
基于最大团求精的随机投影模体发现算法
  • DOI:
    --
  • 发表时间:
    2013
  • 期刊:
    中国科技论文
  • 影响因子:
    --
  • 作者:
    霍红卫;于强;牛伟
  • 通讯作者:
    牛伟
(l,d)-模体识别问题的遗传优化算法
  • DOI:
    --
  • 发表时间:
    2012
  • 期刊:
    计算机学报
  • 影响因子:
    --
  • 作者:
    郭丹丹;于强;张懿璞;牛伟
  • 通讯作者:
    牛伟
An Efficient Algorithm for Discovering Motifs in Large DNA Data Sets
一种在大型 DNA 数据集中发现基序的有效算法
  • DOI:
    10.1109/tnb.2015.2421340
  • 发表时间:
    2015-07-01
  • 期刊:
    IEEE TRANSACTIONS ON NANOBIOSCIENCE
  • 影响因子:
    3.9
  • 作者:
    Yu, Qiang;Huo, Hongwei;Huan, Jun
  • 通讯作者:
    Huan, Jun
PairMotif+: a fast and effective algorithm for de novo motif discovery in DNA sequences.
PairMotif:一种快速有效的 DNA 序列 De Novo Motif 发现算法
  • DOI:
    10.7150/ijbs.5786
  • 发表时间:
    2013
  • 期刊:
    International journal of biological sciences
  • 影响因子:
    9.2
  • 作者:
    Yu Q;Huo H;Zhang Y;Guo H;Guo H
  • 通讯作者:
    Guo H
用于转录因子结合位点识别的定位投影求精算法
  • DOI:
    --
  • 发表时间:
    2013
  • 期刊:
    计算机学报
  • 影响因子:
    --
  • 作者:
    张懿璞;霍红卫;于强;郭鸿志
  • 通讯作者:
    郭鸿志

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

一种基于segmental HMM模型的顺式调控模块识别算法
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    自动化学报
  • 影响因子:
    --
  • 作者:
    郭海涛;霍红卫;于强
  • 通讯作者:
    于强
SegHMC:一种基于Segmental HMM模型的顺式调控模块识别算法
  • DOI:
    10.16383/j.aas.2016.c150309
  • 发表时间:
    2016-11
  • 期刊:
    自动化学报
  • 影响因子:
    --
  • 作者:
    郭海涛;霍红卫;于强
  • 通讯作者:
    于强

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

霍红卫的其他基金

泛基因组的高阶熵压缩索引与检索
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    54 万元
  • 项目类别:
    面上项目
大规模序列数据集的压缩索引与搜索算法研究
  • 批准号:
    61373044
  • 批准年份:
    2013
  • 资助金额:
    75.0 万元
  • 项目类别:
    面上项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码