Statistical Methods for Next-Gen Sequencing in Disease Association Studies
疾病关联研究中下一代测序的统计方法
基本信息
- 批准号:7853195
- 负责人:
- 金额:$ 50万
- 依托单位:
- 依托单位国家:美国
- 项目类别:
- 财政年份:2009
- 资助国家:美国
- 起止时间:2009-09-30 至 2011-07-31
- 项目状态:已结题
- 来源:
- 关键词:AccelerationAddressAlgorithmsAreaClassificationClassification SchemeComputer softwareDataData SetDatabasesDevelopmentDiseaseDisease AssociationEvaluationGenomeGenotypeGoalsGrantIndividualInfusion proceduresMolecularNucleotidesOne-Step dentin bonding systemPerformancePositioning AttributeProbabilityReadingSamplingSimulateSiteSolutionsStatistical MethodsTechnologyTestingTimeUncertaintyVariantbasecase controldesigngenome sequencinggenome wide association studymeetingsmethod developmentnew technologynext generationnovel strategiesprogramstheories
项目摘要
Statistical Methods for Next-Generation Sequencing in Disease Association Studies
Through this project we propose to develop statistical approaches and software for genotype calling and
association testing in next-generation sequence data. The field is driven by molecular advances that allow for
affordable, massively parallel sequencing. The rapid development of statistical methods for next-generation
sequence data in disease studies is necessary to keep pace with the advancing molecular technology. Next-
generation sequencing is based on random, short-read technology; thus the coverage of any nucleotide is
highly variable and subject to error. Distinguishing random error from truly variable sites is required for "SNP-
calling". One step beyond this is identifying the individual's actual genotype at the site. This is a highly
statistical problem and we have yet to see this problem addressed in a statistically rigorous manner.
The solution that we propose, and what makes our approach novel, assumes that we have a sample of
individuals, each with next-generation sequence data. We anticipate that sequencing may ultimately replace
GWAS SNP arrays for disease-association studies. While this may be several years away for whole-genome
sequencing, sequencing enough people individually for a small association study is already becoming practical
with target capture arrays. We can leverage the information from a sample of individuals with next-generation
sequence data to more accurately estimate an individual's genotype and the position-specific error rate. Our
approach is to express the genotype probabilities and error rate in a likelihood framework. We can then use
standard statistical theory to help us call genotypes. This approach should perform better than calling
genotypes for a single individual at a time based on an arbitrary filter as is currently done.
A distinct advantage of this statistical framework is that the uncertainty in the genotype calls can be
incorporated directly into our disease-association tests (e.g., case-control and rare variant analysis). In this
way we will increase power of our association tests and reduce bias due to error or systematic missingness.
Incorporation of next-generation sequence data into the association tests provides a complete analysis pipeline
from sequence to association.
疾病关联研究中下一代测序的统计方法
通过这个项目,我们建议开发用于基因型调用的统计方法和软件
下一代序列数据中的关联测试。该领域由分子进步驱动,允许
经济实惠的大规模并行测序。下一代统计方法的快速发展
疾病研究中的序列数据对于跟上先进的分子技术是必要的。下一个-
世代测序基于随机、短读长技术;因此任何核苷酸的覆盖度是
变化很大并且容易出错。 “SNP-”需要将随机误差与真正可变的位点区分开来。
呼叫”。除此之外的一步是在现场识别个体的实际基因型。这是一个高度
统计问题,我们还没有看到这个问题以统计上严格的方式得到解决。
我们提出的解决方案以及使我们的方法新颖的原因是假设我们有一个样本
个体,每个人都有下一代序列数据。我们预计测序可能最终取代
用于疾病关联研究的 GWAS SNP 阵列。虽然这对于全基因组来说可能还需要几年的时间
测序,对足够多的人进行单独测序以进行小型关联研究已经变得可行
与目标捕获阵列。我们可以利用来自下一代个体样本的信息
序列数据以更准确地估计个体的基因型和位置特异性错误率。我们的
方法是在似然框架中表达基因型概率和错误率。然后我们可以使用
标准统计理论帮助我们称呼基因型。这种方法应该比调用执行得更好
正如目前所做的那样,基于任意过滤器一次对单个个体进行基因型分析。
该统计框架的一个显着优点是基因型调用的不确定性可以是
直接纳入我们的疾病关联测试(例如病例对照和罕见变异分析)。在这个
我们将以此方式增强关联测试的功效并减少由于错误或系统性缺失而导致的偏差。
将下一代序列数据纳入关联测试提供了完整的分析流程
从顺序到关联。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Eden R. Martin其他文献
An Analysis Paradigm for Investigating Multi‐locus Effects in Complex Disease: Examination of Three GABAA Receptor Subunit Genes on 15q11‐q13 as Risk Factors for Autistic Disorder.
研究复杂疾病中多位点效应的分析范式:检查 15q11-q13 上的三个 GABAA 受体亚基基因作为自闭症的危险因素。
- DOI:
10.1111/j.1469-1809.2006.00253.x - 发表时间:
2006-05-01 - 期刊:
- 影响因子:1.9
- 作者:
Allison E. Ashley;Hao Mei;J. Jaworski;D. Ma;M. Ritchie;M. Menold;G. R. DeLong;R. Abramson;H. Wright;J. Hussman;M. Cuccaro;John R. Gilbert;Eden R. Martin;M. Pericak - 通讯作者:
M. Pericak
Analysis of the RELN gene as a genetic risk factor for autism
RELN基因作为自闭症遗传危险因素的分析
- DOI:
10.1038/sj.mp.4001614 - 发表时间:
2005-06-01 - 期刊:
- 影响因子:11
- 作者:
David A. Skaar;Yujun Shao;J. Haines;J. E. Stenger;J. Jaworski;Eden R. Martin;G. Delong;Jason H. Moore;Jacob L Mccauley;J. Sutcliffe;Allison E. Ashley;M. Cuccaro;S. Folstein;John R. Gilbert;M. Pericak - 通讯作者:
M. Pericak
Gene‐Gene Interaction Between FGF20 and MAOB in Parkinson Disease
帕金森病中 FGF20 和 MAOB 之间的基因相互作用
- DOI:
10.1111/j.1469-1809.2007.00418.x - 发表时间:
2008-03-01 - 期刊:
- 影响因子:1.9
- 作者:
Xiaoyi Gao;William K. Scott;Gaofeng Wang;Gregory M Mayhew;Yi;Jeffery M. Vance;Eden R. Martin - 通讯作者:
Eden R. Martin
Power studies for the transmission/disequilibrium tests with multiple alleles.
多个等位基因的传递/不平衡测试的功效研究。
- DOI:
10.1002/(sici)1098-2272(1997)14:6<1113::aid-gepi92>3.0.co;2-j - 发表时间:
1997-03-01 - 期刊:
- 影响因子:9.8
- 作者:
Norman L. Kaplan;Eden R. Martin;Eden R. Martin;B. S. Weir - 通讯作者:
B. S. Weir
Correcting for a potential bias in the pedigree disequilibrium test.
纠正谱系不平衡测试中的潜在偏差。
- DOI:
10.1086/319525 - 发表时间:
2001-04-01 - 期刊:
- 影响因子:9.8
- 作者:
Eden R. Martin;M. Bass;Norman L. Kaplan - 通讯作者:
Norman L. Kaplan
Eden R. Martin的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Eden R. Martin', 18)}}的其他基金
GLASS-AD: Global Latinos Sequencing Study for Alzheimer's Disease
GLASS-AD:全球拉丁裔阿尔茨海默病测序研究
- 批准号:
10650278 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Statistical Methods for Next-Gen Sequencing in Disease Association Studies
疾病关联研究中下一代测序的统计方法
- 批准号:
7943996 - 财政年份:2009
- 资助金额:
$ 50万 - 项目类别:
Statistical tests for association with X-linked genes
与 X 连锁基因关联的统计检验
- 批准号:
6904155 - 财政年份:2005
- 资助金额:
$ 50万 - 项目类别:
Statistical tests for association with X-linked genes
与 X 连锁基因关联的统计检验
- 批准号:
7026986 - 财政年份:2005
- 资助金额:
$ 50万 - 项目类别:
Statistical tests for association with X-linked genes
与 X 连锁基因关联的统计检验
- 批准号:
7210546 - 财政年份:2005
- 资助金额:
$ 50万 - 项目类别:
Candidate Genes and Complex Interactions in PD
PD 中的候选基因和复杂的相互作用
- 批准号:
6812934 - 财政年份:2004
- 资助金额:
$ 50万 - 项目类别:
相似国自然基金
本体驱动的地址数据空间语义建模与地址匹配方法
- 批准号:41901325
- 批准年份:2019
- 资助金额:22.0 万元
- 项目类别:青年科学基金项目
时空序列驱动的神经形态视觉目标识别算法研究
- 批准号:61906126
- 批准年份:2019
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
针对内存攻击对象的内存安全防御技术研究
- 批准号:61802432
- 批准年份:2018
- 资助金额:25.0 万元
- 项目类别:青年科学基金项目
大容量固态硬盘地址映射表优化设计与访存优化研究
- 批准号:61802133
- 批准年份:2018
- 资助金额:23.0 万元
- 项目类别:青年科学基金项目
IP地址驱动的多径路由及流量传输控制研究
- 批准号:61872252
- 批准年份:2018
- 资助金额:64.0 万元
- 项目类别:面上项目
相似海外基金
MASS: Muscle and disease in postmenopausal women
MASS:绝经后妇女的肌肉和疾病
- 批准号:
10736293 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Noninvasive prediction of skin precancer severity using in vivo cellular imaging and deep learning algorithms.
使用体内细胞成像和深度学习算法无创预测皮肤癌前病变的严重程度。
- 批准号:
10761578 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Early detection and risk of head and neck cancer through immune based spatial omics
通过基于免疫的空间组学早期发现头颈癌并降低风险
- 批准号:
10766467 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Accelerating Genomic Data Sharing and Collaborative Research with Privacy Protection
通过隐私保护加速基因组数据共享和协作研究
- 批准号:
10735407 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
A computational model for prediction of morphology, patterning, and strength in bone regeneration
用于预测骨再生形态、图案和强度的计算模型
- 批准号:
10727940 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别: