整合序列与染色质状态大数据解析基因调控模式的深度学习方法

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61873141
  • 项目类别:
    面上项目
  • 资助金额:
    66.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0305.生物、医学信息系统与技术
  • 结题年份:
    2022
  • 批准年份:
    2018
  • 项目状态:
    已结题
  • 起止时间:
    2019-01-01 至2022-12-31

项目摘要

Deciphering mechanisms of gene regulation specific to a tissue is of fundamental importance to the understanding of cell differentiation, individual development and disease mechanism. In recent years, experimental big data have been rapidly accumulated for both transcriptomics and epigenetics. However, most studies thus far focused on a single type of data and produced qualitative results, not only lacking intelligent deep mining and integrative analysis of multiple types of data, but also overlooking the basic information in the sequence of a genome. Aiming at solving these shortcomings, we propose to develop deep learning approaches for deciphering gene regulation patterns via the integration of sequence and chromatin accessibility big data. We first predict regulatory elements specific to a tissue or cell line by deep learning models that integrate sequence, chromatin status and gene expression data. Then, we integrate sequence and experiment data to predict target genes of these elements by using natural language processing techniques and deep learning models. Finally, we develop novel statistical models to understand whole genome genetic data based on tissue specific regulatory networks composed of genes and regulatory elements. We will summarize research results as three databases and three sets of software, and demonstrate their applications via the analysis of a real whole genome sequencing data set of pulmonary artery hypertension (PAH), thereby promoting applications of deep learning in biological and medical big data, and providing a reference to applications of theories and techniques in information sciences to solving important scientific questions in life sciences.
解析组织特异的基因调控模式是研究细胞分化、个体发育、疾病发生的基础。近年来转录组和表观遗传学实验数据大量积累,但研究方法以单类数据为主,定性分析居多,尚缺乏智能化深入挖掘和多种数据整合分析,更忽略了基因组序列这一基础信息来源。针对这些问题,本项目研究整合序列与染色质状态大数据解析基因调控模式的深度学习方法。首先整合基因组序列、染色质状态、基因表达等数据建立深度学习模型,实现细胞系特异的调控元件预测。其次整合调控元件与基因的序列和实验数据,使用自然语言处理技术和深度学习模型实现细胞系特异的调控元件目标基因预测。最后发展基于基因调控图谱的统计遗传学模型,建立全基因组遗传学数据解读新方法。项目预期成果将汇总为三个数据库和三套分析软件,通过肺动脉高压全基因组测序数据开展综合示范应用研究,从而推动深度学习在生物医学大数据分析中的应用实践,为运用信息科学理论方法解决生命科学关键问题提供有益借鉴。

结项摘要

解析组织特异的基因调控模式是研究细胞分化、个体发育、疾病发生的基础。近年来转录组和表观遗传学实验数据大量积累,但研究方法以单类数据为主,定性分析居多,尚缺乏智能化深入挖掘和多种数据整合分析,更忽略了基因组序列这一基础信息来源。针对这些问题,本项目研究整合序列与染色质状态大数据解析基因调控模式的深度学习方法。首先整合基因组序列、染色质状态、基因表达等数据建立深度学习模型,实现细胞系特异的调控元件预测。其次整合调控元件与基因的序列和实验数据,使用自然语言处理技术和深度学习模型实现细胞系特异的调控元件目标基因预测。最后发展基于基因调控图谱的统计遗传学模型,建立全基因组遗传学数据解读新方法。项目获批启动后,按计划执行,圆满完成了计划书中设定的各项内容,此外,项目组还积极探索了单细胞数据分析的深度学习系列方法,取得了大量创新研究成果。研究过程中所取得的研究成果汇总为29篇学术论文,包括Nature Machine Intelligence 3篇,Proc Natl Acad Sci USA 2篇,Nucleic Acids Research 4篇,Nature Communications 2篇。基于这些成果,项目申请专利2项,发表数据库3个,发布生物信息学软件20个。这些成果从信息整合的角度研究基因调控模式的解析问题,既在生物医学大数据的智能化定量整合分析中具有重要理论意义,又在遗传疾病研究中具有重大实际应用价值。形成的一系列具有自主知识产权的计算方法和应用软件不仅推动了对基因调控等基础科学问题的认识,还促进了致病遗传因素的发现,从而为运用信息科学领域的理论与方法解决生命科学领域的关键问题提供了有益的借鉴。

项目成果

期刊论文数量(29)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(2)
Integrating distal and proximal information to predict gene expression via a densely connected convolutional neural network
通过密集连接的卷积神经网络整合远端和近端信息来预测基因表达
  • DOI:
    10.1101/341214
  • 发表时间:
    2020
  • 期刊:
    Bioinformatics
  • 影响因子:
    5.8
  • 作者:
    Zeng Wanwen;Wang Yong;Jiang Rui
  • 通讯作者:
    Jiang Rui
Deep generative modeling and clustering of single cell Hi-C data
单细胞 Hi-C 数据的深度生成建模和聚类
  • DOI:
    10.1101/2022.07.19.500573
  • 发表时间:
    2023
  • 期刊:
    Briefings in Bioinformatics
  • 影响因子:
    9.5
  • 作者:
    Qiao Liu;Wanwen Zeng;Wei Zhang;Sicheng Wang;Hongyang Chen;Rui Jiang;Mu Zhou;Shaoting Zhang
  • 通讯作者:
    Shaoting Zhang
Density estimation using deep generative neural networks
使用深度生成神经网络进行密度估计
  • DOI:
    10.1073/pnas.2101344118
  • 发表时间:
    2021-04-13
  • 期刊:
    Proceedings of the National Academy of Sciences
  • 影响因子:
    --
  • 作者:
    Liu Q;Xu J;Jiang R;Wong WH
  • 通讯作者:
    Wong WH
DeepCDR: a hybrid graph convolutional network for predicting cancer drug response
DeepCDR:用于预测癌症药物反应的混合图卷积网络
  • DOI:
    10.1101/2020.07.08.192930
  • 发表时间:
    2020
  • 期刊:
    Bioinformatics
  • 影响因子:
    5.8
  • 作者:
    Qiao Liu;Zhiqiang Hu;Rui Jiang;Mu Zhou
  • 通讯作者:
    Mu Zhou
EpiFIT: functional interpretation of transcription factors based on combination of sequence and epigenetic information
EpiFIT:基于序列和表观遗传信息组合的转录因子的功能解释
  • DOI:
    10.1007/s40484-019-0175-8
  • 发表时间:
    2019
  • 期刊:
    Quantitative Biology
  • 影响因子:
    3.1
  • 作者:
    Song Shaoming;Cui Hongfei;Chen Shengquan;Liu Qiao;Jiang Rui
  • 通讯作者:
    Jiang Rui

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

再生水紫外线-氯联合消毒工艺特性研究
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    中国环境科学
  • 影响因子:
    --
  • 作者:
    庞宇辰;席劲瑛;胡洪营;吴乾元;卢如;江瑞
  • 通讯作者:
    江瑞
一种综合加权的本体概念语义相似度计算方法
  • DOI:
    --
  • 发表时间:
    2011
  • 期刊:
    计算机工程与应用
  • 影响因子:
    --
  • 作者:
    甘明鑫;窦雪;王道平;江瑞
  • 通讯作者:
    江瑞
高效液相色谱-氢化物发生-原子荧光光谱联用 检测尿液中形态砷含量的方法研究
  • DOI:
    --
  • 发表时间:
    2021
  • 期刊:
    中国工业医学杂志
  • 影响因子:
    --
  • 作者:
    江瑞;姚余有;梁春梅;姜婷婷;胡园
  • 通讯作者:
    胡园
基于差分总变化量的时变图信号重构算法
  • DOI:
    10.1088/0953-4075/45/8/085302
  • 发表时间:
    2020
  • 期刊:
    现代电子技术
  • 影响因子:
    --
  • 作者:
    江瑞
  • 通讯作者:
    江瑞
一种综合加权的本体概念语义相似度计算方法
  • DOI:
    --
  • 发表时间:
    2012
  • 期刊:
    计算机工程与应用
  • 影响因子:
    --
  • 作者:
    甘明鑫;窦雪;王道平;江瑞
  • 通讯作者:
    江瑞

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

江瑞的其他基金

融合单细胞多组学数据的细胞通讯网络构建与分析
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    53 万元
  • 项目类别:
    面上项目
整合遗传学与基因组学信息的全基因组测序数据分析方法
  • 批准号:
    61573207
  • 批准年份:
    2015
  • 资助金额:
    67.0 万元
  • 项目类别:
    面上项目
融合多种表型相似性和基因相似性的疾病关联基因预测方法
  • 批准号:
    61175002
  • 批准年份:
    2011
  • 资助金额:
    59.0 万元
  • 项目类别:
    面上项目
集成多种数据源识别导致常见疾病的遗传变异
  • 批准号:
    60805010
  • 批准年份:
    2008
  • 资助金额:
    22.0 万元
  • 项目类别:
    青年科学基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码