复杂疾病致病调控变异及其靶基因预测方法研究
项目介绍
AI项目解读
基本信息
- 批准号:31871327
- 项目类别:面上项目
- 资助金额:60.0万
- 负责人:
- 依托单位:
- 学科分类:C0608.生物数据资源与分析方法
- 结题年份:2022
- 批准年份:2018
- 项目状态:已结题
- 起止时间:2019-01-01 至2022-12-31
- 项目参与者:王朝; 张士杰; 伊现富; 梁倩; 黄丹丹; 赵珂; 刘欢欢; 郑展业;
- 关键词:
项目摘要
Precise identification disease-causal regulatory variant in the non-coding genome will significantly facilitate the understanding of genetic mechanism for complex diseases. Relying on particular cellular environment, causal regulatory variant alters the expression pattern of targeted gene and promotes the disease development. We previously developed a series of computational methods to predict and prioritize non-coding functional regulatory variants, however, these methods either lack the abilities to identify causal regulatory variant under particular disease condition, or cannot link the regulatory variant to its gene targets at satisfactory resolution. By integrating large-scale tissue/cell type-specific epigenomes and 3D genomes data, we will design several statistical models to infer causal tissue/cell type and causal regulatory variant for particular disease from summary statistics of genome-wide association study, and predict targeted genes of regulatory variant with high resolution using attention model-based deep learning network. We will experimentally evaluate some of our predictions by in vitro assays. This project will provide novel methods to fine-map disease-causal regulatory variant and associate targeted genes at high resolution, which promotes the in-depth investigation of pathogenesis mechanisms for complex diseases.
准确地鉴定基因组非编码区域的致病调控变异及其作用靶基因对理解复杂疾病遗传机制具有重要意义。致病调控变异依赖于特定的细胞环境,通过多种机制影响靶基因表达模式,进而导致疾病的发生发展。我们前期开发了一系列生物信息学方法预测和排优化非编码功能调控变异,然而,目前的计算方法仍缺乏在特定的复杂疾病条件下准确的预测因果致病调控变异的能力,也无法在精细的粒度上关联调控变异到其相互作用靶位点。本课题拟利用大规模组织细胞特异的表观基因组和三维基因组数据,设计统计计算模型从全基因组关联分析汇总统计结果中推断疾病因果组织/细胞和致病调控变异;构建基于注意力模型的深度学习网络在高分辨率水平上预测调控变异的靶基因;并通过体外实验验证若干预测结果。本课题将为精确定位复杂疾病致病调控变异及其靶基因提供了新的计算方法,促进深入理解复杂疾病遗传致病机制。
结项摘要
在人类非编码区域系统鉴定复杂疾病致病调控变异及其靶基因是目前遗传学研究的重要挑战。致病调控变异依赖于特定的细胞环境,通过多种机制影响靶基因表达模式,进而导致疾病的发生发展。目前的统计遗传学方法受到高度连锁不平衡和基因表达调控的组织细胞特异性限制,仍旧无法完全精确定位复杂疾病致病因果变异,并破解其调控靶基因。本项目通过系统性地整合大量人类组织/细胞特异的表观基因组、三维基因组和变异注释数据,设计高性能的算法准确的预测组织/细胞特异的致病调控变异,并构建深度学习网络预测组织/细胞特异的染色质成环和调控变异靶基因。为了解决这些问题,我们首先创新性的设计了新的基因组注释索引系统和可扩展的并行随机搜索算法,将现有不同规模基因组变异注释任务的计算速度提高了100倍以上。通过系统整合超大规模基因组变异数据资源和调控变异预测模型,该方法能够准确地鉴定遗传性复杂疾病非编码致病调控变异。我们也和其他实验室团队合作,通过实验方法揭示位于卵巢癌特异的增强子上的因果调控变异rs9311399能够通过影响HOXB8的结合导致下游靶基因BHLHE40-AS1的表达水平改变,进而导致卵巢癌增殖和克隆形成能力改变。进一步地,我们也系统的研究了CTCF如何识别绝缘体发挥染色体屏障或增强子阻断作用。我们开发了一个深度学习模型 DeepAnchor,能够精确预测CTCF结合位点的绝缘潜力。通过结合基于单碱基水平的基因组/表观基因组特征,我们以高分辨率揭示了CTCF介导的绝缘的不同染色质和序列特征。此外,我们利用预测的绝缘体分数来优化环挤压模型,并在预测 CTCF 锚定环的形成方面取得了最佳的性能。我们还在52种人类组织/细胞类型中建立了CTCF 锚定环的资源,我们发现CTCF锚定环的上高发基因组变异/突变,可能代表疾病发病机制的普遍因果机制。最后,我们利用近年来系统整合的生物数据,开发了相关生物信息学数据库、工具和在线平台。我们的工作为复杂疾病致病调控变异及其靶基因的精确定位提供了新的计算方法,将促进对复杂疾病遗传致病机制的深入理解。
项目成果
期刊论文数量(14)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Coagulation factors and the incidence of COVID-19 severity: Mendelian randomization analyses and supporting evidence.
凝血因素和 COVID-19 严重程度的发生率:孟德尔随机化分析和支持证据
- DOI:10.1038/s41392-021-00640-1
- 发表时间:2021-06-07
- 期刊:Signal transduction and targeted therapy
- 影响因子:39.3
- 作者:Zhou Y;Qian X;Liu Z;Yang H;Liu T;Chen K;Wang Y;Sham PC;Yu Y;Li MJ
- 通讯作者:Li MJ
regBase: whole genome base-wise aggregation and functional prediction for human non-coding regulatory variants
regBase:人类非编码调控变异的全基因组碱基聚合和功能预测
- DOI:10.1093/nar/gkz774
- 发表时间:2019-12-02
- 期刊:NUCLEIC ACIDS RESEARCH
- 影响因子:14.9
- 作者:Zhang,Shijie;He,Yukun;Li,Mulin Jun
- 通讯作者:Li,Mulin Jun
Ultrafast and scalable variant annotation and prioritization with big functional genomics data.
利用大功能基因组数据进行超快速且可扩展的变异注释和优先级排序
- DOI:10.1101/gr.267997.120
- 发表时间:2020-12
- 期刊:Genome research
- 影响因子:7
- 作者:Huang D;Yi X;Zhou Y;Yao H;Xu H;Wang J;Zhang S;Nong W;Wang P;Shi L;Xuan C;Li M;Wang J;Li W;Kwan HS;Sham PC;Wang K;Li MJ
- 通讯作者:Li MJ
The support of genetic evidence for cardiovascular risk induced by antineoplastic drugs.
抗肿瘤药物诱发心血管风险的遗传证据支持
- DOI:10.1126/sciadv.abb8543
- 发表时间:2020-10
- 期刊:Science advances
- 影响因子:13.6
- 作者:Cui H;Zuo S;Liu Z;Liu H;Wang J;You T;Zheng Z;Zhou Y;Qian X;Yao H;Xie L;Liu T;Sham PC;Yu Y;Li MJ
- 通讯作者:Li MJ
QTLbase: an integrative resource for quantitative trait loci across multiple human molecular phenotypes
QTLbase:跨多个人类分子表型的数量性状基因座的综合资源
- DOI:10.1093/nar/gkz888
- 发表时间:2020-01-08
- 期刊:NUCLEIC ACIDS RESEARCH
- 影响因子:14.9
- 作者:Zheng, Zhanye;Huang, Dandan;Li, Mulin Jun
- 通讯作者:Li, Mulin Jun
共 13 条
- 1
- 2
- 3
其他文献
lncRNA miat functions as a ceRNA to upregulate sirt1 by sponging miR-22-3p in HCC cellular senescence
lncRNA miat作为ceRNA在HCC细胞衰老中通过海绵miR-22-3p上调sirt1
- DOI:10.18632/aging.102240
- 发表时间:2019-09
- 期刊:AGING
- 影响因子:--
- 作者:赵丽君;胡克新;曹建中;王攀;李俊;曾克武;何小东;屠鹏飞;童坦君;韩丽敏
- 通讯作者:韩丽敏
基于K-means聚类与空间相关性的零售户销售行为分析
- DOI:10.13474/j.cnki.11-2246.2019.0284
- 发表时间:2019
- 期刊:测绘通报
- 影响因子:--
- 作者:王路遥;高山;李俊;樊红
- 通讯作者:樊红
Synthesis and rheological property of various modified nano-SiO2/AM/AA hyperbranched polymers for oil displacement
多种驱油用改性纳米SiO2/AM/AA超支化聚合物的合成及流变性能
- DOI:10.1134/s1070427217030235
- 发表时间:2017
- 期刊:Russian Journal of Applied Chemistry
- 影响因子:0.9
- 作者:赖南君;李诗涛;刘璐;李艳香;李俊;赵茂月
- 通讯作者:赵茂月
服装通风研究现状及进展
- DOI:10.13475/j.fzxb.20141005707
- 发表时间:2015
- 期刊:纺织学报
- 影响因子:--
- 作者:柯莹;李俊;HAVENITH George
- 通讯作者:HAVENITH George
基于多邻域策略重心反向学习的差分进化算法
- DOI:--
- 发表时间:2018
- 期刊:武汉科技大学学报
- 影响因子:--
- 作者:李俊;邹杰;李波;刘嘉麒
- 通讯作者:刘嘉麒
共 681 条
- 1
- 2
- 3
- 4
- 5
- 6
- 137
李俊的其他基金
非编码驱动突变的癌种特异性和精确定位研究
- 批准号:
- 批准年份:2022
- 资助金额:54 万元
- 项目类别:面上项目
非编码驱动突变的癌种特异性和精确定位研究
- 批准号:32270717
- 批准年份:2022
- 资助金额:54.00 万元
- 项目类别:面上项目
基于遗传信息全方位基因模型的复杂疾病药物重用研究
- 批准号:
- 批准年份:2020
- 资助金额:58 万元
- 项目类别:面上项目
整合策略预测组织细胞特异调控变异和系列生物信息学工具开发
- 批准号:31701143
- 批准年份:2017
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目