Analytical Approaches to Massive Data Computation with Applications to Genomics
海量数据计算的分析方法及其在基因组学中的应用
基本信息
- 批准号:8825472
- 负责人:
- 金额:$ 7.13万
- 依托单位:
- 依托单位国家:美国
- 项目类别:
- 财政年份:2013
- 资助国家:美国
- 起止时间:2013-06-18 至 2016-03-31
- 项目状态:已结题
- 来源:
- 关键词:AdvocateAlgorithmsAreaBig DataCommunitiesDNADataData AnalysesData SourcesDatabasesDisciplineEffectivenessEvaluationEvidence Based MedicineGenomicsGenotypeHealthHuman GenomeInstructionMachine LearningMeasuresMolecular BiologyOutputPerformancePhenotypeRNA SequencesResearchSocial PoliciesTechniquesTestingThe Cancer Genome AtlasUncertaintyValidationWorkbasecancer genomecancer genomicsdata miningdesignheuristicsmathematical analysistranscriptome sequencing
项目摘要
DESCRIPTION (provided by applicant): We propose to design and test mathematically well founded algorithmic and statistical tectonics for analyzing large scale, heterogeneous and noisy data. We focus on fully analytical evaluation of algorithms' performance and rigorous statistical guarantees on the analysis results. This project will leverage on the PIs' recent work on cancer genomics data analysis and rigorous data mining techniques. Those works were driven by specific applications, while in the current project we aim at developing general principles and techniques that will apply to a broad sets of applications. The proposed research is transformative in its emphasis on rigorous analytical evaluation of algorithms' performance and statistical measures of output uncertainty, in contrast to the primarily heuristic approaches currently used in data ming and machine learning. While we cannot expect full mathematical analysis of all data mining and machine learning techniques, any progress in that direction will have significant contribution to the reliability and scientific impact of this discipline. While ou work is motivated by molecular biology data, we expect the techniques to be useful for other scientific communities with massive multi-variate data analysis challenges. Molecular biology provides an excellent source of data for testing advance data analysis techniques: specifically, DNA/RNA sequence data repositories are growing at a super-exponential rate. The data is typically large and noisy, and it includes both genotype and phenotype features that permit experimental validation of the analysis. One such data repository is The Cancer Genome Atlas (TCGA), which we will use for initial testing of the proposed approaches. RELEVANCE (See instructions): This project will advocate a responsible approach to data analysis, based on well-founded mathematical and Statistical concepts. Such an approach enhances the effectiveness of evidence based medicine and other policy and social applications of big data analysis. The proposed work will be tested on human and cancer genome data, contributing to health IT, one of the National Priority Domain Areas.
描述(由申请人提供):我们建议设计和测试数学上良好的算法和统计构件,以分析大规模,异质和嘈杂数据。我们专注于对算法的性能和严格统计保证的全面分析评估。该项目将利用PI的最新研究癌症基因组学数据分析和严格的数据挖掘技术。这些作品是由特定应用程序驱动的,而在当前项目中,我们旨在开发适用于广泛应用程序的一般原则和技术。与目前在数据MING和机器学习中目前使用的主要启发式方法相比,该研究的重点是对算法的性能和输出不确定性的统计测量的严格分析评估的变革性。尽管我们不能期望对所有数据挖掘和机器学习技术进行全面数学分析,但该方向上的任何进展都将对该学科的可靠性和科学影响产生重大贡献。虽然OU工作是由分子生物学数据激励的,但我们希望这些技术对具有大量多变量数据分析挑战的其他科学界有用。分子生物学为测试预先数据分析技术提供了极好的数据来源:具体来说,DNA/RNA序列数据存储库的增长率正在以超指定速率增长。数据通常很大且嘈杂,并且包括允许对分析实验验证的基因型和表型特征。这样的数据存储库之一是癌症基因组图集(TCGA),我们将用于初步测试所提出的方法。相关性(请参阅说明):该项目将基于基于基础的数学和统计概念提倡一种负责任的数据分析方法。这种方法增强了基于证据的医学以及大数据分析的其他政策和社会应用的有效性。拟议的工作将对人类和癌症基因组数据进行测试,并有助于健康,这是国家优先领域之一。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Benjamin Raphael其他文献
Benjamin Raphael的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Benjamin Raphael', 18)}}的其他基金
Pathway, Network and Spatiotemporal Integration of Cancer Genomics Data
癌症基因组数据的路径、网络和时空整合
- 批准号:
10704174 - 财政年份:2021
- 资助金额:
$ 7.13万 - 项目类别:
Pathway, Network and Spatiotemporal Integration of Cancer Genomics Data
癌症基因组数据的路径、网络和时空整合
- 批准号:
10301898 - 财政年份:2021
- 资助金额:
$ 7.13万 - 项目类别:
Comprehensive and Robust Tools for Analysis of Tumor Heterogeneity and Evolution
用于分析肿瘤异质性和进化的全面而强大的工具
- 批准号:
10269002 - 财政年份:2020
- 资助金额:
$ 7.13万 - 项目类别:
Comprehensive and Robust Tools for Analysis of Tumor Heterogeneity and Evolution
用于分析肿瘤异质性和进化的全面而强大的工具
- 批准号:
10700040 - 财政年份:2020
- 资助金额:
$ 7.13万 - 项目类别:
Comprehensive and Robust Tools for Analysis of Tumor Heterogeneity and Evolution
用于分析肿瘤异质性和进化的全面而强大的工具
- 批准号:
10059032 - 财政年份:2020
- 资助金额:
$ 7.13万 - 项目类别:
Comprehensive and Robust Tools for Analysis of Tumor Heterogeneity and Evolution
用于分析肿瘤异质性和进化的全面而强大的工具
- 批准号:
10677268 - 财政年份:2020
- 资助金额:
$ 7.13万 - 项目类别:
Pathway and Network Integration of Cancer Genomics and Clinical Data
癌症基因组学和临床数据的通路和网络整合
- 批准号:
9765287 - 财政年份:2016
- 资助金额:
$ 7.13万 - 项目类别:
Pathway and Network Integration of Cancer Genomics and Clinical Data
癌症基因组学和临床数据的通路和网络整合
- 批准号:
9211127 - 财政年份:2016
- 资助金额:
$ 7.13万 - 项目类别:
Computational Characterization of Genetic Heterogeneity
遗传异质性的计算表征
- 批准号:
8417550 - 财政年份:2013
- 资助金额:
$ 7.13万 - 项目类别:
相似国自然基金
无界区域中非局部Klein-Gordon-Schrödinger方程的保结构算法研究
- 批准号:12301508
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
感兴趣区域驱动的主动式采样CT成像算法研究
- 批准号:62301532
- 批准年份:2023
- 资助金额:30.00 万元
- 项目类别:青年科学基金项目
面向多区域单元化生产线协同调度问题的自动算法设计研究
- 批准号:62303204
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于深度强化学习的约束多目标群智算法及多区域热电调度应用
- 批准号:62303197
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
面向二氧化碳封存的高可扩展时空并行区域分解算法及其大规模应用
- 批准号:12371366
- 批准年份:2023
- 资助金额:43.5 万元
- 项目类别:面上项目
相似海外基金
Electronic Health Record Phenotyping for Case Detection and Prediction of Emergency Department Visits for Child and Adolescent Suicide Attempts
用于病例检测和预测儿童和青少年自杀未遂急诊科就诊的电子健康记录表型
- 批准号:
10507372 - 财政年份:2022
- 资助金额:
$ 7.13万 - 项目类别:
Electronic Health Record Phenotyping for Case Detection and Prediction of Emergency Department Visits for Child and Adolescent Suicide Attempts
用于病例检测和预测儿童和青少年自杀未遂急诊科就诊的电子健康记录表型
- 批准号:
10705670 - 财政年份:2022
- 资助金额:
$ 7.13万 - 项目类别:
Dissemination of a tool for data-driven multiscale modeling of brain circuits
传播数据驱动的脑回路多尺度建模工具
- 批准号:
10669218 - 财政年份:2019
- 资助金额:
$ 7.13万 - 项目类别: