A METHOD TO CORRECT FOR POPULATION STRUCTURE USING A SEGREGATION MODEL
一种利用隔离模型修正人口结构的方法
基本信息
- 批准号:8171730
- 负责人:
- 金额:$ 0.99万
- 依托单位:
- 依托单位国家:美国
- 项目类别:
- 财政年份:2010
- 资助国家:美国
- 起止时间:2010-08-01 至 2011-07-31
- 项目状态:已结题
- 来源:
- 关键词:Computer Retrieval of Information on Scientific Projects DatabaseDataData SetFamilyFramingham Heart StudyFundingGenerationsGenotypeGrantInstitutionLikelihood FunctionsLogistic ModelsMethodsModelingPerformancePopulationResearchResearch PersonnelResourcesSamplingSourceStratificationStructureTestingTimeUnited States National Institutes of Healthbasecohortinterestoffspringpopulation basedsegregationstatistics
项目摘要
This subproject is one of many research subprojects utilizing the
resources provided by a Center grant funded by NIH/NCRR. The subproject and
investigator (PI) may have received primary funding from another NIH source,
and thus could be represented in other CRISP entries. The institution listed is
for the Center, which is not necessarily the institution for the investigator.
To overcome the "spurious" association caused by population stratification in population-based association studies, we propose a principal component based method that can utilize both family and unrelated samples at the same time. More specifically, we adapt a multivariate logistic model, which is often used in segregation analysis and can allow for the family correlation structure, for association analysis. To correct the effect of hidden population structure, the first ten principal components calculated from the matrix of marker genotype data are incorporated as covariates in the model. To test for the association, the marker of interest is also incorporated as a covariate in the model. We applied the proposed method to the second generation, i.e. the Offspring Cohort, in the GAW16 Framingham Heart Study 50k Data Set to evaluate the performance of the method. Although there may have been difficulty in the convergence while maximizing the likelihood function, as indicated by a flat likelihood, the distribution of the empirical P-values for the test statistic does show that the method has a correct Type I error rate whenever the variance-covariance matrix of the estimates can be computed.
该子项目是利用该技术的众多研究子项目之一
资源由 NIH/NCRR 资助的中心拨款提供。子项目和
研究者 (PI) 可能已从 NIH 的另一个来源获得主要资金,
因此可以在其他 CRISP 条目中表示。列出的机构是
对于中心来说,它不一定是研究者的机构。
为了克服基于人群的关联研究中由人群分层引起的“虚假”关联,我们提出了一种基于主成分的方法,可以同时利用家庭和不相关的样本。 更具体地说,我们采用了多变量逻辑模型,该模型通常用于分离分析,并且可以考虑家庭相关结构,以进行关联分析。 为了纠正隐藏群体结构的影响,根据标记基因型数据矩阵计算出的前十个主成分被纳入模型中作为协变量。 为了测试关联性,感兴趣的标记也作为协变量纳入模型中。 我们将所提出的方法应用于 GAW16 Framingham 心脏研究 50k 数据集中的第二代,即后代队列,以评估该方法的性能。 尽管在最大化似然函数时可能存在收敛困难(如平坦似然所示),但检验统计量的经验 P 值的分布确实表明,只要方差满足以下条件,该方法就具有正确的 I 类错误率:可以计算估计值的协方差矩阵。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
XIAOFENG ZHU其他文献
XIAOFENG ZHU的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('XIAOFENG ZHU', 18)}}的其他基金
Statistical analysis of large genomic data sets
大型基因组数据集的统计分析
- 批准号:
10561641 - 财政年份:2020
- 资助金额:
$ 0.99万 - 项目类别:
Statistical analysis of large genomic data sets
大型基因组数据集的统计分析
- 批准号:
10161804 - 财政年份:2020
- 资助金额:
$ 0.99万 - 项目类别:
Statistical analysis of large genomic data sets
大型基因组数据集的统计分析
- 批准号:
10359127 - 财政年份:2020
- 资助金额:
$ 0.99万 - 项目类别:
ASSESSING THE IMPACT OF GLOBAL VERSUS LOCAL ANCESTRY IN ASSOCIATION STUDIES
评估全球血统与当地血统在协会研究中的影响
- 批准号:
8171729 - 财政年份:2010
- 资助金额:
$ 0.99万 - 项目类别:
ASSOCIATION OF REGIONS WITH HYPERTENSION IN NIGERIAN FAMILIES
尼日利亚家庭高血压地区协会
- 批准号:
8171728 - 财政年份:2010
- 资助金额:
$ 0.99万 - 项目类别:
DETECTING RARE VARIANTS FOR COMPLEX TRAITS USING FAMILY AND UNRELATED DATA
使用家庭和不相关的数据检测复杂性状的罕见变异
- 批准号:
8171726 - 财政年份:2010
- 资助金额:
$ 0.99万 - 项目类别:
ADMIXTURE MAPPING OF QUANTITATIVE TRAIT LOCI FOR BMI IN AFRICAN-AMERICANS
非裔美国人 BMI 数量性状位点的混合图谱
- 批准号:
8171727 - 财政年份:2010
- 资助金额:
$ 0.99万 - 项目类别:
A UNIFIED ASSOCIATION ANALYSIS APPROACH FOR FAMILY AND UNRELATED SAMPLES
针对家庭和不相关样本的统一关联分析方法
- 批准号:
8171724 - 财政年份:2010
- 资助金额:
$ 0.99万 - 项目类别:
COMPARISON OF A UNIFIED APPROACH AND THE TDT IN THE FRAMINGHAM HEART STUDY
Framingham 心脏研究中统一方法与 TDT 的比较
- 批准号:
7956501 - 财政年份:2009
- 资助金额:
$ 0.99万 - 项目类别:
A UNIFIED ASSOCIATION ANALYSIS APPROACH FOR FAMILY AND UNRELATED SAMPLES
针对家庭和不相关样本的统一关联分析方法
- 批准号:
7956491 - 财政年份:2009
- 资助金额:
$ 0.99万 - 项目类别:
相似国自然基金
高分辨率气候风险及光伏能源数据集构建与汇聚共享技术研究
- 批准号:42341206
- 批准年份:2023
- 资助金额:60 万元
- 项目类别:专项基金项目
多源不确定性数据驱动的深水集输系统一体化状态监测研究
- 批准号:62373277
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
结合开放数据集的自监督小样本元学习目标检测
- 批准号:62306183
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基因组复杂重复序列区域标准测试数据集的构建
- 批准号:32300518
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
时频域电磁多数据集三维联合反演研究
- 批准号:42304080
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
eQTL mega-analysis for functional assessment of multi-enhancer gene regulation
用于多增强子基因调控功能评估的 eQTL 大分析
- 批准号:
9072104 - 财政年份:2016
- 资助金额:
$ 0.99万 - 项目类别:
eQTL mega-analysis for functional assessment of multi-enhancer gene regulation
用于多增强子基因调控功能评估的 eQTL 大分析
- 批准号:
9330894 - 财政年份:2016
- 资助金额:
$ 0.99万 - 项目类别:
STUDIES OF TRANSLATION IN E COLI IN THE PHASES OF INITIATION, DECODING,
大肠杆菌翻译起始阶段、解码阶段、
- 批准号:
8172266 - 财政年份:2010
- 资助金额:
$ 0.99万 - 项目类别: