基于深度和多示例学习的m6A-seq数据分析质量提升算法研究
项目介绍
AI项目解读
基本信息
- 批准号:61902323
- 项目类别:青年科学基金项目
- 资助金额:26.0万
- 负责人:
- 依托单位:
- 学科分类:F0213.生物信息计算与数字健康
- 结题年份:2022
- 批准年份:2019
- 项目状态:已结题
- 起止时间:2020-01-01 至2022-12-31
- 项目参与者:--
- 关键词:
项目摘要
m6A-seq, a combination of Immunoprecipitation and Next generation sequencing technology, can be used to map N6-methylated guanidine(m6A) in transcriptome. This application is intended to address the issue of the low quality of existing m6A-seq data analysis methods. The main contents of the research are: (1) To solve the problem that signal (m6A fold enrichment) is confused with noise in raw data, a noise estimation method for raw data will be developed, and a denoising model will be established by using long-short-term memory network and convolutional neural network. (2) To solve the problem that existing method cannot specifically recognize the reads enrichment region(peak) of m6A, the key features which can be used to distinguish m6A peaks from the false positive peaks will be clarified, and a m6A-specific peak recognition model will be established by using deep forests method. (3) To solve the problem that m6A-seq cannot locate the m6A sites, the correspondence between the peaks and the m6A sites will be clarified, and a m6A site localization model will be established by using integrated MIForests method. Finally, a m6A-seq data analysis quality improvement model will be established, which will lay the foundation for the subsequent study of the role of m6A in the development of complex diseases.
m6A-seq是一种结合免疫共沉淀和高通量测序的技术,可从全转录组范围内鉴定N6-甲基化嘌呤(m6A)。本申请拟针对目前m6A-seq数据分析方法质量不高的问题,展开如下研究:(1)针对原始数据信号(m6A富集倍数)与噪声混淆的问题,量化原始数据噪声水平,采用长短期记忆网络结合卷积神经网络方法,建立原始数据去噪模型;(2)针对已存方法无法特异性识别m6A的读段富集区(peak)的问题,阐明区分m6A对应peak和假阳性peak的关键特征,采用深度森林方法,建立m6A特异性peak识别模型;(3)针对m6A-seq无法定位m6A位点的问题,明确peak与m6A位点的对应关系,采用集成多示例森林方法,建立m6A位点定位模型。最终建立起m6A-seq数据分析质量提升模型,为后续研究m6A在复杂疾病的发生发展过程中的作用奠定基础。
结项摘要
m6A-seq被广泛用于m6A修饰图谱绘制,但是其假阳性率较高且无法确定m6A的具体位置和数量。因此,本项目从peak差异分析、假阳性peak剔除及peak中m6A位点定位等三个方面进行研究。首先,对有对应关系的m6A-seq、miCLIP-seq及YTHDF2的RIP-seq数据进行了搜集,分析发现m6A与YTHDF2都在除第1外显子外的其他外显子区域富集程度最高,此外,研究发现YTHDF2结合区域距离转录起始位点较近,说明YTHDF2可能与转录功能关系密切,在此基础上,构建了m6ABRP软件,该模型AUC可达0.920,能够精准地对m6A-YTHDF2结合区域进行预测;然后,为了降低peak的假阳性,进一步区分不同表观修饰产生的peak,对m6Am、m7G及f5C等位点数据进行搜集并构建训练数据集,在此基础上,深入挖掘不同修饰的关键特征并构建m6Aminer、f5Cfinder及m7GPredictor等软件工具,其模型AUC分别可达0.913、0.851及0.945,可用于进一步对peak进行特异性注释;最后,为了确定peak中m6A的数量和位置,将每个peak当作正包,其中每个正包中包含至少一个正示例,在此基础上,构建包级分类器,实现从peak中识别最可靠m6A样本的功能。为了验证模型的可靠性,采用m6A单精度位点数据进行验证,结果表明,所建立的模型能从低分辨率peak数据中准确地识别m6A位点。本项目提出的模型可有效地降低m6A-seq数据的假阳性,并提高m6A位点的定位精度,为进一步研究m6A在神经发育、免疫反应、DNA损伤反应、肿瘤发生发展及植物胁迫响应等多种生物过程中的作用奠定基础。
项目成果
期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(1)
专利数量(0)
HLMethy: a machine learning-based model to identify the hidden labels of m6A candidates
HLMethy:基于机器学习的模型,用于识别 m6A 候选者的隐藏标签
- DOI:10.1007/s11103-019-00930-x
- 发表时间:2019
- 期刊:Plant Molecular Biology
- 影响因子:5.1
- 作者:Ze Liu;Wei Dong;WenJie Luo;Wei Jiang;QuanWu Li;ZiLi He
- 通讯作者:ZiLi He
ANOX: A robust computational model for predicting the antioxidant proteins based on multiple features
ANOX:基于多种特征预测抗氧化蛋白的稳健计算模型
- DOI:10.1016/j.ab.2021.114257
- 发表时间:2021
- 期刊:Analytical Biochemistry
- 影响因子:2.9
- 作者:Deke Sun;Ze Liu;Xiuli Mao;Zongru Yang;Chengcheng Ji;Yanxin Liu;Shaokun Wang
- 通讯作者:Shaokun Wang
m7GPredictor: An improved machine learning-based model for predicting internal m7G modifications using sequence properties
m7GPredictor:一种改进的基于机器学习的模型,用于使用序列属性预测内部 m7G 修改
- DOI:--
- 发表时间:2020
- 期刊:Analytical Biochemistry
- 影响因子:2.9
- 作者:Xudong Liu;Ze Liu;Xiuli Mao;Quanwu Li
- 通讯作者:Quanwu Li
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
上皮细胞粘附分子在肝动脉化疗栓塞治疗肝癌中的表达改变及其功能
- DOI:10.1051/0004-6361/201322747
- 发表时间:2016
- 期刊:传染病信息
- 影响因子:--
- 作者:楼敏;白文林;常秀娟;刘泽;李因茵;荣光华;曾珍
- 通讯作者:曾珍
基于FPGA的在线电磁钢轨探伤系统
- DOI:10.13873/j.1000-9787(2019)06-0089-03
- 发表时间:2019
- 期刊:传感器与微系统
- 影响因子:--
- 作者:霍继伟;刘泽;苗宇;李勇;雷逸凡
- 通讯作者:雷逸凡
电磁探伤系统中FPGA同步采样系统设计
- DOI:--
- 发表时间:2013
- 期刊:现代科学仪器
- 影响因子:--
- 作者:程轶平;朱雳雄;余浩;刘泽
- 通讯作者:刘泽
黑潮近岸分支流在2017年9月与2019年9月差异的研究
- DOI:10.11693/hyhz20201000301
- 发表时间:2021
- 期刊:海洋与湖沼
- 影响因子:--
- 作者:燕杰;侯一筠;刘泽
- 通讯作者:刘泽
添加复合吸附剂对塿土吸附菲和Cr(Ⅵ)的影响
- DOI:--
- 发表时间:2016
- 期刊:环境科学
- 影响因子:--
- 作者:孟昭福;吴琼;许绍娥;刘泽
- 通讯作者:刘泽
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
刘泽的其他基金
光老化微塑料上持久性自由基对蚯蚓肠道的氧化损伤及作用机制
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}