Cancer Genomics: Integrative and Scalable Solutions in R/Bioconductor
癌症基因组学:R/Bioconductor 中的集成且可扩展的解决方案
基本信息
- 批准号:10594231
- 负责人:
- 金额:$ 31.86万
- 依托单位:
- 依托单位国家:美国
- 项目类别:
- 财政年份:2021
- 资助国家:美国
- 起止时间:2021-09-01 至 2024-08-31
- 项目状态:已结题
- 来源:
- 关键词:Administrative SupplementBioconductorBioinformaticsBiologicalCellsCharacteristicsCodeCohort StudiesCollaborationsCommunitiesComputer softwareDataData SetDepositionDocumentationEcosystemEpigenetic ProcessEthnic OriginGene ExpressionGenomicsGeographic LocationsGeographyIndividualLearningMachine LearningMaintenanceMalignant NeoplasmsManualsMetadataMetagenomicsMethodsMinorityMinority GroupsModelingModificationMutationParticipantProcessRaceReadinessRecordsReproducibilityResearchResearch PersonnelResourcesReview LiteratureRunningSamplingSequence Read ArchiveSourceStandardizationStructureTensorFlowTextThe Cancer Genome AtlasTrainingTranslatingUnderrepresented PopulationsUnited States National Institutes of HealthbasecBioPortalcancer genomicscohortdata miningdata modelingdata repositorydata resourcedesigngenomic datahealth disparityimprovedinterestlarge scale dataliteratemachine learning algorithmmarginalized populationmultimodalityonline resourceopen sourceparent grantplatform-independentrecruitrepositorysexsoftware developmentusability
项目摘要
Project Summary
Bioconductor is an ecosystem of more than 2,000 open-source software packages for the reproducible
bioinformatics analysis of various types of genomic data. Aim 1 of our parent grant, “Cancer Genomics:
Integrative and Scalable Solutions in R/Bioconductor” (7U24CA180996), develops and maintains
R/Bioconductor data structures for representation, downstream software development, and analysis of
multimodal cancer datasets. Aim 3 of our parent grant establishes ExperimentHub web resources for the
curation, distribution, maintenance, discoverability, and usability of cancer data resources for the
R/Bioconductor community. This proposal targets hundreds of primarily cancer-focused genomic and
metagenomic datasets that are optimized for R/Bioconductor-based usage and contain significant value-added
over primary sources in the form of harmonization and manual curation, but for which substantial domain and
Bioconductor-specific expertise is currently required to translate into formats suitable for widely used AI/ML
softwares. First, it creates the Bioconductor Machine Learning Repository for Omics by translating existing
R/Bioconductor versions of TCGA, cBioPortal, metagenomics, and other datasets. Second, in order to assess
representation and generalizability of any models developed, it employs manual curation to uniformly annotate
key characteristics of each study cohort including race/ethnicity, sex as a biological variable, geographical
location, and recruitment period. Finally, it provides runnable documented examples of the import and use of
these datasets in TensorFlow, PyTorch, and scikit-learn. In total, this proposal will produce the first large-scale,
platform-independent, AI/ML-ready data repository for diverse and highly curated omics data. Thorough
annotation on minority status of the studies and samples in our repository will facilitate the identification of
biases and health disparities for marginalized populations.
项目概要
Bioconductor 是一个由 2,000 多个开源软件包组成的生态系统,用于可重复的
我们的母基金的目标 1“癌症基因组学”:对各种类型的基因组数据进行生物信息学分析。
“R/Bioconductor 中的集成和可扩展解决方案”(7U24CA180996),开发和维护
用于表示、下游软件开发和分析的 R/Bioconductor 数据结构
我们家长资助的目标 3 为以下项目建立 ExperimentHub 网络资源。
癌症数据资源的管理、分发、维护、可发现性和可用性
R/Bioconductor 社区。该提案针对数百个主要关注癌症的基因组和
针对基于 R/Bioconductor 的使用进行优化并包含显着附加值的宏基因组数据集
以协调和手动管理的形式超过主要来源,但对于其实质性领域和
目前需要将生物导体特定的专业知识转化为适合广泛使用的人工智能/机器学习的格式
首先,它通过翻译现有的组学软件创建 Bioconductor 机器学习存储库。
其次,R/Bioconductor 版本的 TCGA、cBioPortal、宏基因组学和其他数据集。
任何开发的模型的代表性和普遍性,它采用手动管理来统一注释
每个研究队列的关键特征,包括种族/民族、作为生物变量的性别、地理位置
最后,它提供了可运行的导入和使用的记录示例。
TensorFlow、PyTorch 和 scikit-learn 中的这些数据集总共将产生第一个大规模的、
独立于平台、支持 AI/ML 的数据存储库,可提供多样化且精心策划的组学数据。
对我们存储库中的研究和样本的少数地位进行注释将有助于识别
边缘化人群的偏见和健康差异。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Martin T Morgan其他文献
Martin T Morgan的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Martin T Morgan', 18)}}的其他基金
Cancer Genomics: Integrative and Scalable Solutions in R/Bioconductor
癌症基因组学:R/Bioconductor 中的集成且可扩展的解决方案
- 批准号:
10703230 - 财政年份:2021
- 资助金额:
$ 31.86万 - 项目类别:
Cancer Genomics: Integrative and Scalable Solutions in R/Bioconductor
癌症基因组学:R/Bioconductor 中的集成且可扩展的解决方案
- 批准号:
10449603 - 财政年份:2021
- 资助金额:
$ 31.86万 - 项目类别:
Cancer Genomics: Integrative and Scalable Solutions in R/Bioconductor
癌症基因组学:R/Bioconductor 中的集成且可扩展的解决方案
- 批准号:
10478123 - 财政年份:2021
- 资助金额:
$ 31.86万 - 项目类别:
Cancer Genomics:Integrative and Scalable Solutions in R / Bioconductor
癌症基因组学:R / Bioconductor 中的集成且可扩展的解决方案
- 批准号:
9186264 - 财政年份:2014
- 资助金额:
$ 31.86万 - 项目类别:
Cancer Genomics:Integrative and Scalable Solutions in R / Bioconductor
癌症基因组学:R / Bioconductor 中的集成且可扩展的解决方案
- 批准号:
9334747 - 财政年份:2014
- 资助金额:
$ 31.86万 - 项目类别:
Cancer Genomics:Integrative and Scalable Solutions in R / Bioconductor
癌症基因组学:R / Bioconductor 中的集成且可扩展的解决方案
- 批准号:
9122328 - 财政年份:2014
- 资助金额:
$ 31.86万 - 项目类别:
Cancer Genomics: Integrative and Salable Solutions in R/Bioconductor
癌症基因组学:R/Bioconductor 中的综合且可销售的解决方案
- 批准号:
10017896 - 财政年份:2014
- 资助金额:
$ 31.86万 - 项目类别:
Bioconductor: An Open Computing Resource for Genomics
Bioconductor:基因组学的开放计算资源
- 批准号:
8337802 - 财政年份:2006
- 资助金额:
$ 31.86万 - 项目类别:
Bioconductor: An Open Computing Resource for Genomics
Bioconductor:基因组学的开放计算资源
- 批准号:
8337802 - 财政年份:2006
- 资助金额:
$ 31.86万 - 项目类别:
Bioconductor: An Open Computing Resource for Genomics
Bioconductor:基因组学的开放计算资源
- 批准号:
8723329 - 财政年份:2006
- 资助金额:
$ 31.86万 - 项目类别:
相似国自然基金
半导体矿物-光合色素协同强化地表水体微生物光电产甲烷机制
- 批准号:42307305
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
用于光驱动化学品合成的半导体材料-微生物杂合体的生产策略研究
- 批准号:32300065
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于原子层沉积半导体沟道的FET生物传感器构筑与性能调控
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于有机半导体材料的超柔性光电生物传感系统的构建
- 批准号:52273249
- 批准年份:2022
- 资助金额:53 万元
- 项目类别:面上项目
光驱动下微生物-半导体耦合体系固碳合成聚羟基丁酸酯的电子传递过程研究
- 批准号:22108231
- 批准年份:2021
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
Leveraging evolutionary analyses and machine learning to discover multiscale molecular features associated with antibiotic resistance
利用进化分析和机器学习发现与抗生素耐药性相关的多尺度分子特征
- 批准号:
10658686 - 财政年份:2023
- 资助金额:
$ 31.86万 - 项目类别:
Novel Computational Methods for Microbiome Data Analysis in Longitudinal Study
纵向研究中微生物组数据分析的新计算方法
- 批准号:
10660234 - 财政年份:2023
- 资助金额:
$ 31.86万 - 项目类别:
Immuno-Oncology Translation Network: Data Management and Resource-Sharing Center at RPCI
免疫肿瘤学翻译网络:RPCI 的数据管理和资源共享中心
- 批准号:
10872397 - 财政年份:2023
- 资助金额:
$ 31.86万 - 项目类别:
Analytical tools for studying the tumor microenvironment leveraging spatial transcriptomics
利用空间转录组学研究肿瘤微环境的分析工具
- 批准号:
10524921 - 财政年份:2022
- 资助金额:
$ 31.86万 - 项目类别: