喵ID:HuFJtA免责声明

TagSNP-set selection for genotyping using integrated data

使用集成数据进行基因分型的 TagSNP 集选择

基本信息

DOI:
10.1016/j.future.2020.09.007
发表时间:
2021-02-01
影响因子:
7.5
通讯作者:
Zhang, Yulin
中科院分区:
计算机科学2区
文献类型:
Article
作者: Wang, Shudong;Liu, Gaowei;Zhang, Yulin研究方向: -- MeSH主题词: --
关键词: --
来源链接:pubmed详情页地址

文献摘要

Single-nucleotide polymorphisms (SNPs) are vital in identifying genetic level variations in complex disease. It was found that the information of SNPs on adjacent or identical genes can be represented by a few tagSNPs (called tag SNP-set or tagSNP-set). In this work, we propose a novel method called TagSNP-set Selection by Optimal Iteration with Linkage Disequilibrium (TSOILD) and develop a quantificationally analytical tagSNP-set prediction method called Physical Distance-Linkage Disequi-librium Prediction Method (PDLDPM). To verify the validity of TSOILD method and PDLDPM, a large amount of test data is generated by simulation software HAPGEN2. According to the experimental results, the prediction accuracy of TSOILD is improved by 6.73%, 3.19%, 6.52% and 1.72% over the Random Sampling, Genetic Algorithm (GA) , Greedy Algorithm and TagSNP-Set Selection Method with Maximum Information (TSMI) respectively. In addition, PDLDPM, Linkage Coverage and selection of tag SNPs to maximize prediction accuracy (STAMPA) are used to evaluate the tagSNP-set selected by Random Sampling, GA, Greedy Algorithm and TSMI. Results show that the PDLDPM performs better than the other two methods. These methods provide effective assistance for the study of genetic level variation of complex diseases. (C) 2020 The Authors. Published by Elsevier B.V.
单核苷酸多态性(SNPs)在识别复杂疾病的基因水平变异方面至关重要。研究发现,相邻或相同基因上的SNPs信息可由少数标签单核苷酸多态性(称为标签SNP集或tagSNP - set)来表示。在这项工作中,我们提出了一种名为基于连锁不平衡的最优迭代标签SNP集选择(TSOILD)的新方法,并开发了一种定量分析的标签SNP集预测方法,即物理距离 - 连锁不平衡预测方法(PDLDPM)。为了验证TSOILD方法和PDLDPM的有效性,利用模拟软件HAPGEN2生成了大量测试数据。根据实验结果,TSOILD的预测准确率分别比随机抽样、遗传算法(GA)、贪心算法以及基于最大信息的标签SNP集选择方法(TSMI)提高了6.73%、3.19%、6.52%和1.72%。此外,使用PDLDPM、连锁覆盖度以及为使预测准确率最大化选择标签SNP(STAMPA)来评估由随机抽样、GA、贪心算法和TSMI所选择的标签SNP集。结果表明,PDLDPM的性能优于其他两种方法。这些方法为复杂疾病基因水平变异的研究提供了有效的帮助。(C)2020作者。由爱思唯尔出版社出版。
参考文献(48)
被引文献(0)

数据更新时间:{{ references.updateTime }}

Zhang, Yulin
通讯地址:
--
所属机构:
--
电子邮件地址:
--
免责声明免责声明
1、猫眼课题宝专注于为科研工作者提供省时、高效的文献资源检索和预览服务;
2、网站中的文献信息均来自公开、合规、透明的互联网文献查询网站,可以通过页面中的“来源链接”跳转数据网站。
3、在猫眼课题宝点击“求助全文”按钮,发布文献应助需求时求助者需要支付50喵币作为应助成功后的答谢给应助者,发送到用助者账户中。若文献求助失败支付的50喵币将退还至求助者账户中。所支付的喵币仅作为答谢,而不是作为文献的“购买”费用,平台也不从中收取任何费用,
4、特别提醒用户通过求助获得的文献原文仅用户个人学习使用,不得用于商业用途,否则一切风险由用户本人承担;
5、本平台尊重知识产权,如果权利所有者认为平台内容侵犯了其合法权益,可以通过本平台提供的版权投诉渠道提出投诉。一经核实,我们将立即采取措施删除/下架/断链等措施。
我已知晓