Pattern Identification in Sequence Activity Data
序列活动数据中的模式识别
基本信息
- 批准号:8939733
- 负责人:
- 金额:$ 9.49万
- 依托单位:
- 依托单位国家:美国
- 项目类别:
- 财政年份:
- 资助国家:美国
- 起止时间:至
- 项目状态:未结题
- 来源:
- 关键词:Amino Acid SequenceBayesian AnalysisBiological AssayCalculiDataData CollectionData SetData Storage and RetrievalDevelopmentDigit structureFaceGenomeGraphGrowthHandwritingImageMethodsModelingPatternPeptide Sequence DeterminationProblem SolvingReporterScienceSequence AlignmentSystemTechniquesTimeTranscription Initiation Sitecombinatorialcommensal microbescomputing resourcesgenome wide association studyheuristicsinsightprotein structurequantumtheories
项目摘要
Finding patterns in data is one of the most challenging open questions in infor- mation science. The number of possible relationships scales combinatorially with the size of the dataset, overwhelming the exponential increase in avail- ability of computational resources. Physical insights have been instrumental in developing efficient computational heuristics. Using quantum field theory methods and rethinking three centuries of Bayesian inference, we formulated the problem in terms of finding landscapes of patterns and solved this problem exactly.
The generality of our calculus is illustrated by applying it to handwritten digit images and to finding structural features in proteins from sequence alignments without any presumptions about model priors suited to specific datasets. We are applying this calculus to several problems besides protein structure: (1) Transcription start site identification at a genome scale from CAGE-seq data; (2) Commensal bacteria interactions; (3) Identifying dynamical systems from time-course data; (4) Calculating biophysical quantitative sequence activity models directly from massively parallel reporter assays without optimization; (5) Deriving the graph of interactions directly from expression data; (6) Direct computation of SNP interactions from genome-wide association studies.
在数据中找到模式是信息科学中最具挑战性的开放问题之一。可能的关系数量与数据集的大小结合起来,使计算资源的可用性呈指数增长。物理见解对开发有效的计算启发式方法起着重要作用。使用量子场理论方法并重新思考三个世纪的贝叶斯推论,我们在寻找模式的景观方面提出了问题,并准确地解决了这个问题。
通过将其应用于手写数字图像和从序列比对中找到蛋白质中的结构特征,可以说明我们的演算的一般性,而没有任何适用于适合特定数据集的模型先验的型号。除了蛋白质结构以外,我们还将该积分应用于几个问题:(1)从Cage-seq数据中以基因组量表进行转录起始位点识别; (2)共生细菌相互作用; (3)从时间课数据中识别动态系统; (4)在没有优化的情况下直接从大规模平行的记者分析中计算生物物理定量序列活性模型; (5)直接从表达数据得出相互作用的图; (6)从全基因组关联研究中直接计算SNP相互作用。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Vipul Periwal其他文献
Vipul Periwal的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Vipul Periwal', 18)}}的其他基金
Growth and development of islets and beta-cells in the pancreas
胰腺中胰岛和β细胞的生长和发育
- 批准号:
7967846 - 财政年份:
- 资助金额:
$ 9.49万 - 项目类别:
Functional Annotation of Protein Interactome Graphs
蛋白质相互作用组图的功能注释
- 批准号:
7593406 - 财政年份:
- 资助金额:
$ 9.49万 - 项目类别:
相似国自然基金
基于序贯贝叶斯分析的低事例率辐射成像中图像快速识别方法研究
- 批准号:12305346
- 批准年份:2023
- 资助金额:30.00 万元
- 项目类别:青年科学基金项目
带纵向复杂数据类型的混合成员模型的贝叶斯分析
- 批准号:12301368
- 批准年份:2023
- 资助金额:30.00 万元
- 项目类别:青年科学基金项目
带信息终止事件的复发事件数据变换模型的贝叶斯分析
- 批准号:12301332
- 批准年份:2023
- 资助金额:30.00 万元
- 项目类别:青年科学基金项目
贝叶斯框架下基于采样算法的弹性介质全波形反演与不确定性分析
- 批准号:42374138
- 批准年份:2023
- 资助金额:51 万元
- 项目类别:面上项目
隐马尔可夫变系数回归模型的贝叶斯分析
- 批准号:12361061
- 批准年份:2023
- 资助金额:27 万元
- 项目类别:地区科学基金项目
相似海外基金
Systems Genetics of Vascular Smooth Muscle Phenotypes
血管平滑肌表型的系统遗传学
- 批准号:
10771623 - 财政年份:2023
- 资助金额:
$ 9.49万 - 项目类别:
Neuro-computational predictors of treatment responsiveness in trauma-exposed Veterans.
遭受创伤的退伍军人治疗反应的神经计算预测因子。
- 批准号:
10580396 - 财政年份:2023
- 资助金额:
$ 9.49万 - 项目类别:
Platform to support clinical variant interpretation through probabilistic assessment of functional evidence
通过功能证据的概率评估支持临床变异解释的平台
- 批准号:
10742133 - 财政年份:2023
- 资助金额:
$ 9.49万 - 项目类别:
Immunological drivers of the transition from epidemicity to endemicity of SARS-CoV-2 in a high transmission LMIC setting
高传播中低收入国家环境中 SARS-CoV-2 从流行病转变为地方病的免疫驱动因素
- 批准号:
10577684 - 财政年份:2023
- 资助金额:
$ 9.49万 - 项目类别:
Using auxin to understand context-dependent hormone response
使用生长素了解背景依赖性激素反应
- 批准号:
10605909 - 财政年份:2023
- 资助金额:
$ 9.49万 - 项目类别: