多核系统下调控模式识别的MapReduce模型及算法研究
项目介绍
AI项目解读
基本信息
- 批准号:61173025
- 项目类别:面上项目
- 资助金额:55.0万
- 负责人:
- 依托单位:
- 学科分类:F0214.新型计算及其应用基础
- 结题年份:2015
- 批准年份:2011
- 项目状态:已结题
- 起止时间:2012-01-01 至2015-12-31
- 项目参与者:霍秋艳; 罗雪梅; 于强; 张懿璞; 郭海涛; 欧阳雄; 陈昆; 高培; 黄宁;
- 关键词:
项目摘要
调控模式识别是生物信息学研究领域中的一个基本问题。研究表明,现有方法对保守模式预测的准确程度,无论在碱基水平还是在结合位点水平都较低。在本项目中,我们以改善调控模式的识别算法的准确度和性能为基本目标,充分利用当前多核系统的处理器所提供的高效的计算性能以及多线程和多进程的并行处理技术,提出一种基于多核系统的MapReduce模型;其次,引入位点之间的局部构象信息,建立TFBS与转录起始位点之间距离的分布特征及约束关系,从而建立调控模式的模体模型。提出一种调控模式识别的MapReduce算法,降低算法的时间复杂度,提高对于长序列和特征微弱模式识别的准确程度;最后,通过对JASPAR、TRANSFAC等数据库的统计特征分析,研究调控模式位点的分布特征,设计有效和精确的P-value计算方法。在此基础上,建立多核系统上有效解决数据密集型和计算密集型问题的一种新的计算模型。
结项摘要
(1) 项目的背景.转录因子结合位点 (Transcription Factor Binding Site,TFBS)又被称为顺式调控元件 (Cis-regulatory Element)。在生物信息学中也称为模式或模体 (motif)。识别这些控制基因表达的顺式调控元件,以及表征它们与各自转录因子的相互作用,不仅对于构建转录调控网络,而且对于解释有机物复杂的起源和进化有着重要的意义。.(2) 主要研究内容.本项目以改善调控模式识别算法的准确性和性能为基本目标,研究调控模式识别的高效精确算法;建立MapReduce框架下调控模式识别的模型,提高对于长序列、大字符集和特征微弱模式识别的准确程度;研究转录因子结合位点分布的统计特征,建立调控模式识别的统计方法;实现一个调控模式识别的软件系统原型。.(3) 重要结果.在模体发现的精确算法和近似算法方面做出了较好的工作。主要包括:提出了MapReduce框架下大数据集(ChIP-seq数据集)上子串挖掘方法和模体发现算法MCES;提出了MapReduce框架下精确模体识别的数据划分方法PMSPMR,PMSPMR算法具有良好的可扩展性,加速比接近于线性;建立了模体stem首个正则表达式表示方式,提出了大字符集(蛋白质序列)上高效的stem搜索算法(StemFinder);提出了结合概率分析的模体发现的近似算法PairMotif+。建立了高阶熵压缩的参考基因组序列的自索引结构,并基于此结构进行空间高效的短读序列比对。.(4) 关键数据及科学意义.我们在本领域重要刊物IEEE/ACM Transactions on Computational Biology and Bioinformatics (JCR = 2)等和重要会议IEEE International Conference on Bioinformatics and Biomedicine (CCF B类会议)和IEEE Data Compression Conference (CCF B类会议) 等发表了15篇论文(其中8篇论文为刊物论文,7篇为会议论文),SCI检索6篇,EI检索9篇。开发了可在Google和GitHub上访问的软件。这些研究成果为进一步研究高通量测序数据集的结构模体发现,在基因组水平上探索基因的表达调控机制奠定了较好的基础。
项目成果
期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(7)
专利数量(0)
基于最大团求精的随机投影模体发现算法
- DOI:--
- 发表时间:2013
- 期刊:中国科技论文
- 影响因子:--
- 作者:霍红卫;于强;牛伟
- 通讯作者:牛伟
(l,d)-模体识别问题的遗传优化算法
- DOI:--
- 发表时间:2012
- 期刊:计算机学报
- 影响因子:--
- 作者:郭丹丹;于强;张懿璞;牛伟
- 通讯作者:牛伟
An Efficient Algorithm for Discovering Motifs in Large DNA Data Sets
一种在大型 DNA 数据集中发现基序的有效算法
- DOI:10.1109/tnb.2015.2421340
- 发表时间:2015-07-01
- 期刊:IEEE TRANSACTIONS ON NANOBIOSCIENCE
- 影响因子:3.9
- 作者:Yu, Qiang;Huo, Hongwei;Huan, Jun
- 通讯作者:Huan, Jun
PairMotif+: a fast and effective algorithm for de novo motif discovery in DNA sequences.
PairMotif:一种快速有效的 DNA 序列 De Novo Motif 发现算法
- DOI:10.7150/ijbs.5786
- 发表时间:2013
- 期刊:International journal of biological sciences
- 影响因子:9.2
- 作者:Yu Q;Huo H;Zhang Y;Guo H;Guo H
- 通讯作者:Guo H
用于转录因子结合位点识别的定位投影求精算法
- DOI:--
- 发表时间:2013
- 期刊:计算机学报
- 影响因子:--
- 作者:张懿璞;霍红卫;于强;郭鸿志
- 通讯作者:郭鸿志
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
一种基于segmental HMM模型的顺式调控模块识别算法
- DOI:--
- 发表时间:2016
- 期刊:自动化学报
- 影响因子:--
- 作者:郭海涛;霍红卫;于强
- 通讯作者:于强
SegHMC:一种基于Segmental HMM模型的顺式调控模块识别算法
- DOI:10.16383/j.aas.2016.c150309
- 发表时间:2016-11
- 期刊:自动化学报
- 影响因子:--
- 作者:郭海涛;霍红卫;于强
- 通讯作者:于强
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
霍红卫的其他基金
泛基因组的高阶熵压缩索引与检索
- 批准号:
- 批准年份:2022
- 资助金额:54 万元
- 项目类别:面上项目
大规模序列数据集的压缩索引与搜索算法研究
- 批准号:61373044
- 批准年份:2013
- 资助金额:75.0 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}