Identification of Transposable Element Insertions in the Kids First Data
Kids First 数据中转座元件插入的识别
基本信息
- 批准号:10172875
- 负责人:
- 金额:$ 16.9万
- 依托单位:
- 依托单位国家:美国
- 项目类别:
- 财政年份:2020
- 资助国家:美国
- 起止时间:2020-06-01 至 2023-05-31
- 项目状态:已结题
- 来源:
- 关键词:AlgorithmsCommunitiesComputer softwareComputing MethodologiesDNADNA Insertion ElementsDNA Transposable ElementsDataData SetDatabasesDiseaseElementsEndogenous RetrovirusesEnvironmentGene FrequencyGenesGenetic DiseasesGenomeGenomicsGenotypeHuman GenomeIndividualInheritedInsertion MutationJumping GenesLengthLocationMachine LearningMalignant Childhood NeoplasmMalignant NeoplasmsMapsMendelian disorderMethodsModelingMutationNeuronsOutputParentsPaste substancePathogenicityPediatric ResearchPlayPopulationRegulatory ElementReportingResourcesRetrotransposonRoleSamplingSensitivity and SpecificitySingle Nucleotide PolymorphismSiteSourceSpeedStructural Congenital AnomaliesTrainingbasecloud basedcohortdesigndisease phenotypeepigenetic profilinggene functiongenetic elementgenome sequencingimprovedmachine learning methodprobandprogramstranscriptome sequencingwhole genome
项目摘要
Project Summary
Insertion of transposable elements (TEs, sometimes referred to as “jumping genes”) into the
human genome can be pathogenic. Our aim in this project is to use sophisticated computational
approaches to characterize TE insertions in the whole-genome sequencing data generated in
the Gabriella Miller Kids First Pediatric Research Program and identify any insertional mutations
that may disrupt gene function. The large scale of the Kids First program provides an
unprecedented opportunity to investigate the role of TE insertions in childhood cancers and
structural birth defects, as well as to create a resource of reference TE maps that will be
important for all other TE studies. We will first modify our existing algorithm called xTEA for the
trio design of the Kids First studies and increase the accuracy and efficiency of the algorithm.
Then, we will apply it to the thousands of trios that have been profiled in the Kids First program,
using a pipeline optimized for the cloud environment. The resulting set of TE insertions
(especially L1, Alu, SVA, and HERV insertions) will be curated with all relevant features and be
made into a database for the community. We will also apply machine learning methods to
improve the calls once a sufficient amount of training data have been obtained. To investigate
the potential pathogenicity of the mutation, we will first focus on insertions within genes, but we
will also explore those in regulatory elements inferred from epigenetic profiling data.
项目摘要
插入转座元素(TE,有时称为“跳跃基因”)
人基因组可能是致病性的。我们在这个项目中的目标是使用复杂的计算
在整个基因组测序数据中生成的全基因组测序数据中表征Te插入的方法
Gabriella Miller Kids首次小儿研究计划并确定任何插入突变
这可能会破坏基因功能。孩子们的大规模第一个程序提供了
史无前例的机会,调查插入在儿童期癌症中的作用
结构性先天缺陷以及创建参考地图的资源
对于所有其他TE研究都很重要。我们将首先修改现有的算法称为XTEA
儿童的三重奏设计首次研究并提高算法的准确性和效率。
然后,我们将将其应用于在儿童第一个节目中介绍的成千上万的三重奏,
使用针对云环境优化的管道。由此产生的TE插入
(尤其是L1,Alu,SVA和HERV插入)将策划所有相关功能,并成为
制作到社区数据库中。我们还将将机器学习方法应用于
一旦获得了足够数量的培训数据,请改善呼叫。调查
突变的潜在致病性,我们将首先关注基因内的插入,但我们
还将探索从表观遗传分析数据推断出的调节元素中的那些。
项目成果
期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
The landscape of human SVA retrotransposons.
- DOI:10.1093/nar/gkad821
- 发表时间:2023-11-27
- 期刊:
- 影响因子:14.9
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Peter J Park其他文献
Peter J Park的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Peter J Park', 18)}}的其他基金
Data Analysis Center for Somatic Mosaicism Across Human Tissues Network
人体组织网络体细胞镶嵌数据分析中心
- 批准号:
10662721 - 财政年份:2023
- 资助金额:
$ 16.9万 - 项目类别:
Development of an Efficient High Throughput Technique for the Identification of High-Impact Non-Coding Somatic Variants Across Multiple Tissue Types
开发一种高效的高通量技术,用于鉴定跨多种组织类型的高影响力非编码体细胞变异
- 批准号:
10662860 - 财政年份:2023
- 资助金额:
$ 16.9万 - 项目类别:
Mutational signature analysis: methods and applications to the clinic
突变特征分析:方法和临床应用
- 批准号:
10418967 - 财政年份:2022
- 资助金额:
$ 16.9万 - 项目类别:
Mutational signature analysis: methods and applications to the clinic
突变特征分析:方法和临床应用
- 批准号:
10618248 - 财政年份:2022
- 资助金额:
$ 16.9万 - 项目类别:
Interoperability and Collaboration with the Common Fund Data Ecosystem to Improve Utility of 4DN Data
与共同基金数据生态系统的互操作性和协作,以提高 4DN 数据的实用性
- 批准号:
10683513 - 财政年份:2021
- 资助金额:
$ 16.9万 - 项目类别:
Interoperability and Collaboration with the Common Fund Data Ecosystem to Improve Utility of 4DN Data
与共同基金数据生态系统的互操作性和协作,以提高 4DN 数据的实用性
- 批准号:
10406676 - 财政年份:2021
- 资助金额:
$ 16.9万 - 项目类别:
Interoperability and Collaboration with the Common Fund Data Ecosystem to Improve Utility of 4DN Data
与共同基金数据生态系统的互操作性和协作,以提高 4DN 数据的实用性
- 批准号:
10907133 - 财政年份:2021
- 资助金额:
$ 16.9万 - 项目类别:
1/2-Somatic mosaicism and autism spectrum disorder
1/2-躯体镶嵌和自闭症谱系障碍
- 批准号:
9246015 - 财政年份:2016
- 资助金额:
$ 16.9万 - 项目类别:
Linking sequence and copy number variation to eye diseases by regulatory genomics
通过调控基因组学将序列和拷贝数变异与眼部疾病联系起来
- 批准号:
9044785 - 财政年份:2016
- 资助金额:
$ 16.9万 - 项目类别:
Visual Analysis of Genomic and Clinical Data from Large Patient Cohorts
对大型患者队列的基因组和临床数据进行可视化分析
- 批准号:
8875824 - 财政年份:2015
- 资助金额:
$ 16.9万 - 项目类别:
相似国自然基金
云南自然保护区社区生计空间的规制与实践:人地系统适应性视角
- 批准号:42361037
- 批准年份:2023
- 资助金额:32 万元
- 项目类别:地区科学基金项目
基于复元理念的严重精神障碍社区康复服务模式的构建与实证研究
- 批准号:72374109
- 批准年份:2023
- 资助金额:40 万元
- 项目类别:面上项目
基于风险决策偏差识别的社区2型糖尿病患者自我管理行为干预研究:前景理论视角
- 批准号:72374108
- 批准年份:2023
- 资助金额:40 万元
- 项目类别:面上项目
人-物-环交互视角下城市社区环境影响时空动态量化评价与优化策略研究
- 批准号:72371072
- 批准年份:2023
- 资助金额:40 万元
- 项目类别:面上项目
投融资视角下社区更新中环境重构的机理、效应与对策:以武汉市为例
- 批准号:52378074
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
相似海外基金
Brain Digital Slide Archive: An Open Source Platform for data sharing and analysis of digital neuropathology
Brain Digital Slide Archive:数字神经病理学数据共享和分析的开源平台
- 批准号:
10735564 - 财政年份:2023
- 资助金额:
$ 16.9万 - 项目类别:
BioGRID: An open resource for biological interactions and network analysis
BioGRID:生物相互作用和网络分析的开放资源
- 批准号:
10819019 - 财政年份:2023
- 资助金额:
$ 16.9万 - 项目类别:
Multi-modal Tracking of In Vivo Skeletal Structures and Implants
体内骨骼结构和植入物的多模式跟踪
- 批准号:
10839518 - 财政年份:2023
- 资助金额:
$ 16.9万 - 项目类别:
Implementation of an impact assessment tool to optimize responsible stewardship of genomic data in the cloud
实施影响评估工具以优化云中基因组数据的负责任管理
- 批准号:
10721762 - 财政年份:2023
- 资助金额:
$ 16.9万 - 项目类别:
Unified, Scalable, and Reproducible Neurostatistical Software
统一、可扩展且可重复的神经统计软件
- 批准号:
10725500 - 财政年份:2023
- 资助金额:
$ 16.9万 - 项目类别: