Statistics for high-dimensional data with applications in analysis of high-throughput genomics experiments
高维数据统计及其在高通量基因组学实验分析中的应用
基本信息
- 批准号:240006-2006
- 负责人:
- 金额:$ 0.8万
- 依托单位:
- 依托单位国家:加拿大
- 项目类别:Discovery Grants Program - Individual
- 财政年份:2008
- 资助国家:加拿大
- 起止时间:2008-01-01 至 2009-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The analysis of very high-dimensional data poses a unique set of challenges for statisticians: in designing feasible algorithms, in estimation and visualization, and in inference. In this research project I propose to continue my work in addressing some issues in all these areas, with a special emphasis on high-throughput genomic data. This includes data from expression microarray experiments, which can interrogate up to 50k genes in a single biological assay, genome-wide scans of genotypic information, such as Affymetrix GeneChip Human Mapping arrays which can interrogate up to 500k markers on a human genome (so-call Single Nucleotide Polymorphism which are locations on a genome accounting for vast majority of genetic differences), and from proteomics experiments, such as Tandem Mass Spectrometry that is being currently used to detect presence of tens or hundreds of thousands of proteins in one experiment, and is being researched for quantitative use. While the nature of each of these data examples can be very different, as well as the potential applications of such technologies (which are now widely used for both basic and clinical research), they all share a number of characteristics, that can be addressed by general statistical research. The results of this research program will benefit both the statistical community, by introducing new methods for statistical analysis and visualization of high-dimensional data and by motivating further research in this very important area, as well as biologists and clinicians by expanding the toolbox of statistical methods and software tools that can be applied to their genomic experiments. As part of this work we will apply and validate the new methods on real data to perform primary and secondary analysis of important clinical and biological experiments. The long term objective of this work is to connect the some results in theoretical statistics of high-dimensional data, great advances computer technology and the resulting novel approaches to statistical analysis, and the high-throughput revolution in biological research to help answer important questions in biological and health sciences.
高维数据的分析给统计学家带来了一系列独特的挑战:设计可行的算法、估计和可视化以及推理。在这个研究项目中,我建议继续解决所有这些领域的一些问题,特别强调高通量基因组数据,这包括来自表达微阵列实验的数据,该实验可以在一次生物测定中询问多达 50k 个基因,以及基因型信息的全基因组扫描,例如 Affymetrix GeneChip Human。映射阵列可以询问人类基因组上多达 50 万个标记(所谓的单核苷酸多态性,它们是基因组上占绝大多数遗传差异的位置),并且来自蛋白质组学实验,例如目前使用的串联质谱法在一个实验中检测数万或数十万种蛋白质的存在,并且正在研究使用,尽管这些数据示例的每个定量的性质可能非常不同,以及此类技术的潜在应用(其中。现在广泛用于基础和临床研究),它们都有一些共同的特征,可以通过一般统计研究来解决。该研究计划的结果将通过引入新的统计分析方法和方法使统计界受益。高维数据的可视化,并通过扩展可应用于基因组实验的统计方法和软件工具来激发生物学家和科学家在这一非常重要领域的进一步研究。作为这项工作的一部分,我们将应用这些工具。并在实际数据上验证新方法这项工作的长期目标是将高维数据的理论统计、计算机技术的巨大进步和由此产生的统计分析的新方法以及高维数据的一些结果联系起来。 -生物研究的吞吐量革命,有助于回答生物和健康科学中的重要问题。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Kustra, Rafal其他文献
Predictors of all‐cause mortality among patients hospitalized with influenza, respiratory syncytial virus, or SARS‐CoV‐2
因流感、呼吸道合胞病毒或 SARS-CoV-2 住院的患者全因死亡率的预测因素
- DOI:
10.1111/irv.13004 - 发表时间:
2022-11 - 期刊:
- 影响因子:4.4
- 作者:
Hamilton, Mackenzie A.;Liu, Ying;Calzavara, Andrew;Sundaram, Maria E.;Djebli, Mohamed;Darvin, Dariya;Baral, Stefan;Kustra, Rafal;Kwong, Jeffrey C.;Mishra, Sharmistha - 通讯作者:
Mishra, Sharmistha
The quantitative evaluation of functional neuroimaging experiments: the NPAIRS data analysis framework.
功能性神经影像实验的定量评估:NPAIRS 数据分析框架。
- DOI:
- 发表时间:
2002-04 - 期刊:
- 影响因子:0
- 作者:
Strother, Stephen C;Anderson, Jon;Hansen, Lars Kai;Kjems, Ulrik;Kustra, Rafal;Sidtis, John;Frutiger, Sally;Muley, Suraj;LaConte, Stephen;Rottenberg, David - 通讯作者:
Rottenberg, David
Predictive modeling in case-control single-nucleotide polymorphism studies in the presence of population stratification: a case study using Genetic Analysis Workshop 16 Problem 1 dataset.
存在群体分层的病例对照单核苷酸多态性研究中的预测建模:使用遗传分析研讨会 16 问题 1 数据集的案例研究。
- DOI:
- 发表时间:
2009-12-15 - 期刊:
- 影响因子:0
- 作者:
Arshadi, Niloofar;Chang, Billy;Kustra, Rafal - 通讯作者:
Kustra, Rafal
5-hmC in the brain is abundant in synaptic genes and shows differences at the exon-intron boundary
大脑中的 5-hmC 富含突触基因,并且在外显子-内含子边界处表现出差异
- DOI:
10.1038/nsmb.2372 - 发表时间:
2012-10 - 期刊:
- 影响因子:16.8
- 作者:
Khare, Tarang;Pai, Shraddha;Koncevicius, Karolis;Pal, Mrinal;Kriukiene, Edita;Liutkeviciute, Zita;Irimia, Manuel;Jia, Peixin;Ptak, Carolyn;Xia, Menghang;Tice, Raymond;Tochigi, Mamoru;Morera, Solange;Nazarians, Anaies;Belsham, Denise;Wong, Albert H. C.;Blencowe, Benjamin J.;Wang, Sun Chong;Kapranov, Philipp;Kustra, Rafal;Labrie, Viviane;Klimasauskas, Saulius;Petronis, Arturas - 通讯作者:
Petronis, Arturas
A disproportionate epidemic: COVID-19 cases and deaths among essential workers in Toronto, Canada.
不成比例的流行病:加拿大多伦多基本工作人员中的 COVID-19 病例和死亡人数。
- DOI:
- 发表时间:
2021-11 - 期刊:
- 影响因子:5.6
- 作者:
Rao, Amrita;Ma, Huiting;Moloney, Gary;Kwong, Jeffrey C;Jüni, Peter;Sander, Beate;Kustra, Rafal;Baral, Stefan D;Mishra, Sharmistha - 通讯作者:
Mishra, Sharmistha
Kustra, Rafal的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Kustra, Rafal', 18)}}的其他基金
Computational and Inferential Tools for Machine Learning Methods in Biostatistical Research
生物统计研究中机器学习方法的计算和推理工具
- 批准号:
RGPIN-2017-06586 - 财政年份:2019
- 资助金额:
$ 0.8万 - 项目类别:
Discovery Grants Program - Individual
Computational and Inferential Tools for Machine Learning Methods in Biostatistical Research
生物统计研究中机器学习方法的计算和推理工具
- 批准号:
RGPIN-2017-06586 - 财政年份:2019
- 资助金额:
$ 0.8万 - 项目类别:
Discovery Grants Program - Individual
Statistics for high-dimensional data with applications in analysis of high-throughput genomics experiments
高维数据统计及其在高通量基因组学实验分析中的应用
- 批准号:
240006-2006 - 财政年份:2010
- 资助金额:
$ 0.8万 - 项目类别:
Discovery Grants Program - Individual
Statistics for high-dimensional data with applications in analysis of high-throughput genomics experiments
高维数据统计及其在高通量基因组学实验分析中的应用
- 批准号:
240006-2006 - 财政年份:2010
- 资助金额:
$ 0.8万 - 项目类别:
Discovery Grants Program - Individual
Statistics for high-dimensional data with applications in analysis of high-throughput genomics experiments
高维数据统计及其在高通量基因组学实验分析中的应用
- 批准号:
240006-2006 - 财政年份:2009
- 资助金额:
$ 0.8万 - 项目类别:
Discovery Grants Program - Individual
Statistics for high-dimensional data with applications in analysis of high-throughput genomics experiments
高维数据统计及其在高通量基因组学实验分析中的应用
- 批准号:
240006-2006 - 财政年份:2009
- 资助金额:
$ 0.8万 - 项目类别:
Discovery Grants Program - Individual
Statistics for high-dimensional data with applications in analysis of high-throughput genomics experiments
高维数据统计及其在高通量基因组学实验分析中的应用
- 批准号:
240006-2006 - 财政年份:2007
- 资助金额:
$ 0.8万 - 项目类别:
Discovery Grants Program - Individual
Statistics for high-dimensional data with applications in analysis of high-throughput genomics experiments
高维数据统计及其在高通量基因组学实验分析中的应用
- 批准号:
240006-2006 - 财政年份:2007
- 资助金额:
$ 0.8万 - 项目类别:
Discovery Grants Program - Individual
Statistics for high-dimensional data with applications in analysis of high-throughput genomics experiments
高维数据统计及其在高通量基因组学实验分析中的应用
- 批准号:
240006-2006 - 财政年份:2006
- 资助金额:
$ 0.8万 - 项目类别:
Discovery Grants Program - Individual
Statistics for high-dimensional data with applications in analysis of high-throughput genomics experiments
高维数据统计及其在高通量基因组学实验分析中的应用
- 批准号:
240006-2006 - 财政年份:2006
- 资助金额:
$ 0.8万 - 项目类别:
Discovery Grants Program - Individual
相似国自然基金
基于纳米孔多维度数据的恶性胶质瘤基因组结构变异异质性及调控网络研究
- 批准号:32300522
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
敏感数据维度上的本地化差分隐私研究
- 批准号:62302214
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
面向学习过程性评价的高冲突、高维度、多模态数据协同融合方法研究
- 批准号:62377023
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
多模态数据驱动的在线目的地品牌体验:概念重构、维度因果认知与神经机制
- 批准号:72372141
- 批准年份:2023
- 资助金额:41 万元
- 项目类别:面上项目
基于多模态多维度数据及治疗反应关联规则分析的感染性休克临床、分子联合分型研究
- 批准号:82302424
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
Identification of Early Metabolomic and Immune Endotypes of Allergy and Asthma: An Integrated Multiomics Approach
过敏和哮喘早期代谢组学和免疫内型的鉴定:综合多组学方法
- 批准号:
10896779 - 财政年份:2023
- 资助金额:
$ 0.8万 - 项目类别:
Collaborative Research: DMS/NIGMS 2: Novel machine-learning framework for AFMscanner in DNA-protein interaction detection
合作研究:DMS/NIGMS 2:用于 DNA-蛋白质相互作用检测的 AFM 扫描仪的新型机器学习框架
- 批准号:
10797460 - 财政年份:2023
- 资助金额:
$ 0.8万 - 项目类别:
Quantitative characterization of the liver-pancreas axis in diabetes via multiparametric magnetic resonance elastography
通过多参数磁共振弹性成像定量表征糖尿病肝胰轴
- 批准号:
10718333 - 财政年份:2023
- 资助金额:
$ 0.8万 - 项目类别:
Machine Learning with Scintillation Photon Counting Detectors to Advance PET Imaging Performance
利用闪烁光子计数探测器进行机器学习以提高 PET 成像性能
- 批准号:
10742435 - 财政年份:2023
- 资助金额:
$ 0.8万 - 项目类别:
Mapping the single cell state basis of metastasis in space and time
绘制空间和时间转移的单细胞状态基础
- 批准号:
10738579 - 财政年份:2023
- 资助金额:
$ 0.8万 - 项目类别: