基于果蝇piRNA大数据挖掘的基因调控机制研究
项目介绍
AI项目解读
基本信息
- 批准号:61802256
- 项目类别:青年科学基金项目
- 资助金额:26.0万
- 负责人:
- 依托单位:
- 学科分类:F0213.生物信息计算与数字健康
- 结题年份:2021
- 批准年份:2018
- 项目状态:已结题
- 起止时间:2019-01-01 至2021-12-31
- 项目参与者:臧思聪; 吕晋雄; 庞健辉; 郭昱泽; 邢智皓; 杨浩特;
- 关键词:
项目摘要
As the sequencing technology advances and its cost decreases, the amount of biological sequencing data grows exponentially, which makes computational methods more challenging to systematically mining and integrate multi-source heterogeneous data. This project aims at a series of systematic, biologically plausible piRNA big data analyzing methods, to study the biogenesis and regulation mechanism of Drosophila piRNA system, by network structure learning, introducing known biological knowledge as prior constraints, and multi-view data fusion. piRNA is a genome defense system, and it represses the jumping activity of transposon elements to prevent DNA from breakage which may lead to diseases. The project consists of three parts. First, we model the biogenesis and functioning pathway by Bayesian networks, based on the RNA sequencing data of piRNA related protein mutants. Second, we develop methods for Bayesian network structure learning with constraints induced from biological knowledge and available results, as well as parallel implementation, in order to reduce the structure-searching time and space during learning. Third, we develop methods to integrate multi-source heterogeneous data into network structure learning, for enhanced prediction capacity. To summarize, our final purpose is to build a new unified, data-driven, and knowledge-driven modeling and analysis method, which could delineate the Drosophila piRNA biological regulation system. The research in the project is able to provide new insights into piRNA regulation mechanism, discover new functions, significantly lower costs for a lot of biological experiments, speed up the biological research, and build the computational foundation for studying human piRNA related diseases and drugs in the future.
生物数据急速增长,对分析方法的系统性、多源异质数据融合提出了新的挑战。本项目面向果蝇piRNA大数据,从网络结构学习、引入生物知识指导、多源数据融合三个方面,研究果蝇piRNA的调控机制,形成一套系统的、生物可解释性强的piRNA大数据分析方法。具体地,我们通过果蝇piRNA相关蛋白突变的大数据,使用贝叶斯网络结构学习piRNA的产生和调控机制;为了得到更优的网络结构,将生物学先验知识转化为拓扑结构限制,研究知识指导的带约束结构学习方法及其并行算法以降低计算时间;为了提升模型的预测能力,发展能融合多源异质数据的网络结构学习方法。通过以上研究,最终目的是建立统一的数据驱动与知识指导的建模和分析新方法,解析果蝇piRNA调控系统的特征和功能。本研究有望提供piRNA作用机制的新理解,发现新功能,节约大量实验经费,加速实验突破,为研究人类piRNA相关疾病和药物打下基础。
结项摘要
piRNA是在动物性腺中发现的一类长度在20-30碱基之间的非蛋白编码RNA。piRNA从首次被发现至今,持续得到学术界的高度重视,在2006年被《Science》评为十大科学进展之一。piRNA可沉默转座子和其他重复元件、保护生殖细胞基因组免于因转座子运动导致的双链DNA断裂,从而潜在地避免基因突变引起的遗传性疾病和癌症。本项目面向piRNA大数据,从网络结构学习、引入生物知识指导、多源数据融合三个方面,应对生物数据急速增长下对分析方法的系统性、多源异质数据融合提出的新挑战。为此,我们提出了一套面向piRNA相关蛋白突变数据的贝叶斯网络结构学习方法,用贝叶斯网的上下游关系来建模,每个变量的观察数据则为piRNA产量的变化或者转座子活跃量的变化。该方法可以准确地从数据中学习预测piRNA的产生和调控机制,可以将生物学先验知识转化为拓扑结构限制融合到学习过程中,可以融合多源异质数据提高预测的置信度。通过最大似然准则和BIC模型选择,我们的方法能够准确地刻画piRNA核心通路中4个蛋白(Uap56、Vasa、Aub、Ago3)上下游关系,与已有的生物学数据一致;同时,可以对整个通路提出预测,特别是对局部3~4个蛋白间的关系得到高置信度解析,发现蛋白新功能,节约大量实验经费,加速实验突破。在对piRNA机制研究的基础上,我们与合作者一起建立了piRTarBase,搜集了超过100万个目标位点,覆盖了超过2万多个基因、3万多转录本。其中,由我们前期的Science论文中严格匹配准则所预测的位点有57万个,松弛约束的匹配准则预测的位点有140万个,CLASH数据确定的有1万多个(含904个严格预测位点、2273个松弛预测位点)。piRTarBase还根据搜集的mRNA测序数据计算了含目标位点基因的表达量,以及对应的22G-RNA的产生量,从而可以评估目标位点的调控强度和显著性。综上,本项目提出的piRNA贝叶斯网模型、piRTarBase数据库,辅助揭示了piRNA的产生和调控机制,为RNA治疗提供线索,为研究人类piRNA相关疾病和药物打下基础。
项目成果
期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(6)
专利数量(0)
piRTarBase: a database of piRNA targeting sites and their roles in gene regulation.
piRTarBase:piRNA 靶向位点及其在基因调控中的作用的数据库
- DOI:10.1093/nar/gky956
- 发表时间:2019-01-08
- 期刊:Nucleic acids research
- 影响因子:14.9
- 作者:Wu WS;Brown JS;Chen TT;Chu YH;Huang WC;Tu S;Lee HC
- 通讯作者:Lee HC
Integrated analysis of transcriptome-wide m6A methylome of osteosarcoma stem cells enriched by chemotherapy
化疗富集骨肉瘤干细胞全转录组 m(6)A 甲基化组的综合分析
- DOI:10.2217/epi-2019-0262
- 发表时间:2019-11-01
- 期刊:EPIGENOMICS
- 影响因子:3.8
- 作者:Wang, Yongjie;Zeng, Lin;Dong, Yang
- 通讯作者:Dong, Yang
Two-variate phenotype-targeted tests for detecting phenotypic biomarkers in cancers
用于检测癌症表型生物标志物的二变量表型靶向测试
- DOI:10.1504/ijdmb.2020.10031421
- 发表时间:2020-08
- 期刊:International Journal of Data Mining and Bioinformatics
- 影响因子:0.3
- 作者:Lv Jinxiong;Tu Shikui;Xu Lei
- 通讯作者:Xu Lei
Detection of Phenotype-Related Mutations of COVID-19 via the Whole Genomic Data.
通过全基因组数据检测 COVID-19 的表型相关突变
- DOI:10.1109/tcbb.2021.3049836
- 发表时间:2021-07
- 期刊:IEEE/ACM transactions on computational biology and bioinformatics
- 影响因子:--
- 作者:Lv J;Tu S;Xu L
- 通讯作者:Xu L
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}

内容获取失败,请点击重试

查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图

请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
涂仕奎的其他基金
基于靶点结构的深度双向智能药物设计方法研究
- 批准号:
- 批准年份:2021
- 资助金额:61 万元
- 项目类别:面上项目
基于靶点结构的深度双向智能药物设计方法研究
- 批准号:62172273
- 批准年份:2021
- 资助金额:61.00 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}