Context-Sensitive Search of Human Expression Compendia

人类表达概要的上下文相关搜索

基本信息

  • 批准号:
    8024978
  • 负责人:
  • 金额:
    $ 39.11万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2011
  • 资助国家:
    美国
  • 起止时间:
    2011-06-28 至 2014-04-30
  • 项目状态:
    已结题

项目摘要

DESCRIPTION (provided by applicant): Gene expression experiments are an abundant and robust source of functional genomics data, with thousands of microarray and a growing number of high throughput RNA sequencing studies publicly available, most interrogating clinical and biological systems relevant to disease. They hold the promise of data-driven characterization of gene function and regulation, including in specific tissues, cell lines, and disease states, and can advance the understanding and modeling of regulatory changes that form the basis of human disease. However, these data remain largely underutilized, as biology researchers do not have effective tools to explore and analyze the entire data collection to generate novel hypotheses and direct experiments. The situation is similar to that of the Internet before the search engines - a biology researcher has to know a priori which datasets pertain to the biological question she is asking, reflect the tissue/cell-lineage specific signals of interest to her, and accurately measure the expression of genes related to her pathways of interest. There is a clear need for methods that will enable biology researchers to use their domain-specific knowledge to direct their exploration of public human expression data, enabling them to generate hypotheses and direct experiments addressing challenging biomedical questions. Such a system should provide users with ability to effectively explore automatically identified datasets relevant to their biological question of interest, leverage metazoan complexity including cell lineage and disease specific signals, and allow the researcher to securely include their unpublished data in the analysis. To address these challenges, this proposal describes a "Google-style" public search engine for large collections of gene expression data built using novel search algorithms and leveraging cloud-computing technologies. This system implements a novel query-based context-sensitive algorithm for search of large expression compendia that exploits the complexity of metazoan organisms, including cell-lineage complexity and disease aspects inherent to human expression studies. Furthermore, the challenge of heterogeneity in human samples will be addressed by developing novel hierarchical learning methods to predict cell-lineage or tissue-specific gene expression based on the compendium and to identify these signals in each dataset. This will enable users to explore tissue-specific expression and also will be integrated with the search algorithm to improve search accuracy. Proposed algorithms, search engine, and user interface will be extensively evaluated in close collaboration with biology researchers, and top predictions will be tested experimentally. These methods will be implemented in a user-friendly public search system that will leverage cloud computing to provide robust interactive query response and will enable biology researchers to explore both published data collections and their own pre-publication datasets in a context-specific, integrated, and secure manner. PUBLIC HEALTH RELEVANCE: We will develop a "Google-style" search engine for massive collections of human gene expression data. Our system will enable researchers to use their domain knowledge to explore the entirety of public human expression data to generate hypotheses and direct experiments addressing a diverse range of challenging biomedical questions. Public availability of our system will advance genome-level understanding of human biology and facilitate development of novel drugs, therapies, and personalized medical treatments.
描述(由申请人提供):基因表达实验是功能基因组学数据的丰富且可靠的来源,其中成千上万的微阵列和越来越多的高吞吐量RNA测序研究公开可用,大多数与疾病相关的临床和生物系统。它们具有数据驱动的基因功能和调节的表征,包括在特定的组织,细胞系和疾病状态中,并可以提高对构成人类疾病基础的调节变化的理解和建模。但是,由于生物学研究人员没有有效的工具来探索和分析整个数据收集以产生新的假设和直接实验,因此这些数据仍然在很大程度上被充分利用。这种情况与搜索引擎之前的互联网相似 - 一名生物学研究人员必须知道一个与她所问的生物学问题有关的数据集,反映了她与她的感兴趣的特定特定信号,并准确地衡量了与她的感兴趣途径相关的基因的表达。明确的方法需要使生物学研究人员使用特定领域的知识来指导他们对公共人类表达数据的探索,从而使他们能够产生假设并直接实验,以解决具有挑战性的生物医学问题。这样的系统应为用户提供有效探索与其感兴趣的生物学问题相关的自动识别数据集,利用复合谱系和特定于疾病信号的复杂性,并允许研究人员在分析中牢固地包含其未公开数据。为了应对这些挑战,该提案描述了使用新颖的搜索算法构建的大量基因表达数据的“ Google风格”公共搜索引擎,并利用了云计算技术。该系统实现了一种基于查询的新型上下文敏感算法,用于搜索大型表达汇编,该算法利用了后生动物的复杂性,包括细胞分离的复杂性和人类表达研究固有的疾病方面。此外,通过开发新型的层次学习方法来预测基于纲要的细胞循环或组织特异性基因表达,并在每个数据集中识别这些信号,从而解决了人类样本中异质性的挑战。这将使用户能够探索组织特异性的表达,并将与搜索算法集成以提高搜索准确性。拟议的算法,搜索引擎和用户界面将与生物学研究人员密切合作进行广泛评估,并将通过实验测试最佳预测。这些方法将在用户友好的公共搜索系统中实现,该系统将利用云计算来提供强大的交互式查询响应,并使生物学研究人员能够以特定于上下文,集成和安全的方式探索已发布的数据收集及其自己的预公开数据集。 公共卫生相关性:我们将开发一个“ Google Style”搜索引擎,以大量人类基因表达数据收集。我们的系统将使研究人员能够利用其领域知识来探索全部公开人类表达数据,以产生假设并直接实验,以解决各种挑战性的生物医学问题。我们系统的公众可用性将提高基因组级别对人类生物学的了解,并促进新型药物,疗法和个性化医疗治疗的发展。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

OLGA G TROYANSKAYA其他文献

OLGA G TROYANSKAYA的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('OLGA G TROYANSKAYA', 18)}}的其他基金

Context-Sensitive Search of Human Expression Compendia
人类表达概要的上下文相关搜索
  • 批准号:
    8290295
  • 财政年份:
    2011
  • 资助金额:
    $ 39.11万
  • 项目类别:
Context-Sensitive Search of Human Expression Compendia
人类表达概要的上下文相关搜索
  • 批准号:
    8464761
  • 财政年份:
    2011
  • 资助金额:
    $ 39.11万
  • 项目类别:
lntegration and Visualization of Diverse Biological Data
多种生物数据的整合和可视化
  • 批准号:
    10393642
  • 财政年份:
    2005
  • 资助金额:
    $ 39.11万
  • 项目类别:
Integration and Visualization of Diverse Biological Data
多种生物数据的整合与可视化
  • 批准号:
    7036576
  • 财政年份:
    2005
  • 资助金额:
    $ 39.11万
  • 项目类别:
Integration and visualization of diverse biological data
多种生物数据的整合和可视化
  • 批准号:
    8041717
  • 财政年份:
    2005
  • 资助金额:
    $ 39.11万
  • 项目类别:
Integration and Visualization of Diverse Biological Data
多种生物数据的整合与可视化
  • 批准号:
    7404447
  • 财政年份:
    2005
  • 资助金额:
    $ 39.11万
  • 项目类别:
Integration and visualization of diverse biological data
多种生物数据的整合和可视化
  • 批准号:
    8209212
  • 财政年份:
    2005
  • 资助金额:
    $ 39.11万
  • 项目类别:
Integration and visualization of diverse biological data
多种生物数据的整合和可视化
  • 批准号:
    8601095
  • 财政年份:
    2005
  • 资助金额:
    $ 39.11万
  • 项目类别:
Integration and Visualization of Diverse Biological Data
多种生物数据的整合与可视化
  • 批准号:
    9266422
  • 财政年份:
    2005
  • 资助金额:
    $ 39.11万
  • 项目类别:
lntegration and Visualization of Diverse Biological Data
多种生物数据的整合和可视化
  • 批准号:
    9902503
  • 财政年份:
    2005
  • 资助金额:
    $ 39.11万
  • 项目类别:

相似国自然基金

加速器磁铁励磁电源扰动物理机制和观测抑制算法的研究
  • 批准号:
    12305170
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
动物中一类新的长前体miRNA的发现、预测算法设计及其功能初探
  • 批准号:
    32270602
  • 批准年份:
    2022
  • 资助金额:
    54.00 万元
  • 项目类别:
    面上项目
动物中一类新的长前体miRNA的发现、预测算法设计及其功能初探
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    54 万元
  • 项目类别:
    面上项目
面向移动物联网的高效数据查询机制与算法研究
  • 批准号:
    62072402
  • 批准年份:
    2020
  • 资助金额:
    56 万元
  • 项目类别:
    面上项目
考虑充电站选址和容量限制的电动物流车辆路径问题研究
  • 批准号:
    71901177
  • 批准年份:
    2019
  • 资助金额:
    18.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Investigating the Protective Efficacy of SIV/HIV T and B cell Immunity Induced by RNA Replicons
研究 RNA 复制子诱导的 SIV/HIV T 和 B 细胞免疫的保护功效
  • 批准号:
    10673223
  • 财政年份:
    2023
  • 资助金额:
    $ 39.11万
  • 项目类别:
Elucidating causal mechanisms of ethanol-induced analgesia in BXD recombinant inbred mouse lines
阐明 BXD 重组近交系小鼠乙醇诱导镇痛的因果机制
  • 批准号:
    10825737
  • 财政年份:
    2023
  • 资助金额:
    $ 39.11万
  • 项目类别:
Unified, Scalable, and Reproducible Neurostatistical Software
统一、可扩展且可重复的神经统计软件
  • 批准号:
    10725500
  • 财政年份:
    2023
  • 资助金额:
    $ 39.11万
  • 项目类别:
Dynamic neural coding of spectro-temporal sound features during free movement
自由运动时谱时声音特征的动态神经编码
  • 批准号:
    10656110
  • 财政年份:
    2023
  • 资助金额:
    $ 39.11万
  • 项目类别:
Biomarkers for Brain Resetting as an Assistive Tool in the Treatment of Status Epilepticus
大脑重置生物标志物作为治疗癫痫持续状态的辅助工具
  • 批准号:
    10698969
  • 财政年份:
    2023
  • 资助金额:
    $ 39.11万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了