Integrated Biological Sequence Data Management
综合生物序列数据管理
基本信息
- 批准号:0926269
- 负责人:
- 金额:$ 40.66万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2008
- 资助国家:美国
- 起止时间:2008-09-01 至 2011-09-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The University of Michigan is awarded funds to develop a comprehensive system that can support complex declarative and efficient querying on biological sequences, called SEQ. The approach is to extend a relational database engine with sophisticated and powerful methods for querying on sequences. Extending a relational database engine, rather than build a stand-alone sequence query processing tool, is a much more challenging task, but is essential as it allows the end-user to combine the power of analytical facilities already provided by SQL engines with the added ability to query sequences. A crucial aspect of this approach is to have a clean query algebra that provides a powerful set of biological sequence querying features, and can be accommodated within the framework of an extended relational model. SEQ will be implemented by extending the existing Postgres database engine. The collaboration between the investigators (computer scientists and biomedical researchers) will also facilitate actual deployment of the SEQ system in a project that will analyze various genomes for transcriptional regulatory elements related to genes essential for eye development and visual function. The key intellectual contribution of this proposal is in the development of a declarative querying tool for managing biological sequence data sets in a relational framework. This effort naturally requires designing and implementing methods that span most of the layers of a relational database engine, including query algebra, query language, query processing algorithms, data storage methods, and query optimization methods. The SEQ project will lead to new computer science methods for sequence query processing in each of these database management aspects. A current preliminary prototype clearly demonstrates the tremendous functionality and performance benefits of these aspects in the SEQ approach. In addition to the contributions that SEQ will make to computer science research, the project will also directly assist in the analysis of downstream targets for a transcription factor critical for rod photoreceptor development and function. The broader impacts of this proposal are in enabling life scientists to query and manage sequence data using declarative and efficient querying methods, and to enable the processing of complex sequence queries with traditional relational querying. The project will result in a free open-source OSI-certified release of the SEQ system using the ECL license. This release will allow the entire life sciences community to leverage these powerful querying methods. We note that a number of model organism databases are starting to use relational databases (often Postgres) for managing sequence data; as an example see the Chado schema used by GMOD. Sequence analysis tools are very applicable to this broader range of users as the system will essentially add complex sequence querying functionality (with efficient performance) to Postgres. The broader impacts of this proposal include enhancing the nascent bioinformatics curriculum at the University of Michigan. The project will result in cross-training computer science PhD students in life sciences research, and include the training of at least one women PhD. This project will allow undergraduate and graduate students, post-doctoral staff, and faculty in the EECS department and the Kellogg's Eye Center at the University of Michigan to foster a close interaction in the methods that span the disciplines of computer science and genetics.
密歇根大学获得资金来开发一个名为 SEQ 的综合系统,该系统可以支持对生物序列进行复杂的声明式和高效查询。该方法是使用复杂而强大的序列查询方法来扩展关系数据库引擎。扩展关系数据库引擎,而不是构建独立的序列查询处理工具,是一项更具挑战性的任务,但也是必不可少的,因为它允许最终用户将 SQL 引擎已提供的分析工具的功能与附加的功能结合起来。查询序列的能力。这种方法的一个关键方面是拥有一个干净的查询代数,它提供一组强大的生物序列查询功能,并且可以容纳在扩展关系模型的框架内。 SEQ 将通过扩展现有的 Postgres 数据库引擎来实现。研究人员(计算机科学家和生物医学研究人员)之间的合作还将促进 SEQ 系统在一个项目中的实际部署,该项目将分析各种基因组,寻找与眼睛发育和视觉功能必需的基因相关的转录调控元件。该提案的关键智力贡献在于开发了用于在关系框架中管理生物序列数据集的声明式查询工具。这项工作自然需要设计和实现跨越关系数据库引擎大部分层的方法,包括查询代数、查询语言、查询处理算法、数据存储方法和查询优化方法。 SEQ 项目将带来新的计算机科学方法,用于数据库管理各个方面的序列查询处理。当前的初步原型清楚地展示了 SEQ 方法中这些方面的巨大功能和性能优势。除了 SEQ 将对计算机科学研究做出贡献外,该项目还将直接协助分析对视杆光感受器发育和功能至关重要的转录因子的下游靶标。该提案更广泛的影响在于使生命科学家能够使用声明性且高效的查询方法来查询和管理序列数据,并能够使用传统的关系查询来处理复杂的序列查询。该项目将使用 ECL 许可证发布 SEQ 系统的免费开源 OSI 认证版本。此版本将使整个生命科学界能够利用这些强大的查询方法。我们注意到许多模型生物数据库开始使用关系数据库(通常是 Postgres)来管理序列数据;作为示例,请参阅 GMOD 使用的 Chado 模式。序列分析工具非常适用于更广泛的用户,因为该系统本质上将向 Postgres 添加复杂的序列查询功能(具有高效的性能)。该提案的更广泛影响包括加强密歇根大学新生的生物信息学课程。该项目将对计算机科学博士生进行生命科学研究的交叉培训,并包括培训至少一名女博士。该项目将使密歇根大学 EECS 系和凯洛格眼科中心的本科生和研究生、博士后人员和教职人员能够在跨越计算机科学和遗传学学科的方法中促进密切互动。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Jignesh Patel其他文献
Fast Regular Expression Matching Using Small TCAMs for Network Intrusion Detection and Prevention Systems
使用小型 TCAM 进行快速正则表达式匹配用于网络入侵检测和预防系统
- DOI:
- 发表时间:
2010-08-11 - 期刊:
- 影响因子:0
- 作者:
C. Meiners;Jignesh Patel;Eric Norige;E. Torng;A. Liu - 通讯作者:
A. Liu
Thrombophilia Profile in Budd-Chiari Syndrome and Splanchnic Vein Thrombosis: A Study from Western India.
布加氏综合征和内脏静脉血栓形成的血栓形成倾向:来自印度西部的一项研究。
- DOI:
10.1016/j.tet.2008.08.059 - 发表时间:
2015-09-01 - 期刊:
- 影响因子:0
- 作者:
P. Sawant;C. Vashishtha;M. Nasa;Pathik Parikh;Jignesh Patel;A. Agasti - 通讯作者:
A. Agasti
ON PILOT CONTAMINATION IN MASSIVE MULTIPLE-INPUT MULTIPLE OUTPUT SYSTEM WITH LEAST SQUARE METHOD AND ZERO FORCING RECEIVER
最小二乘法和零强迫接收器研究大规模多输入多输出系统中的导频污染
- DOI:
10.21917/ijct.2017.0228 - 发表时间:
2017-09-01 - 期刊:
- 影响因子:0
- 作者:
Joshi Poojaben Hirenkumar;Jignesh Patel;H. Shah - 通讯作者:
H. Shah
Comparison of intermittent and continuous extracorporeal treatments for the enhanced elimination of dabigatran
间歇性和连续性体外治疗强化达比加群消除的比较
- DOI:
- 发表时间:
2015 - 期刊:
- 影响因子:3.3
- 作者:
J. Bouchard;M. Ghannoum;A. Bernier;D. Williamson;G. Kershaw;C. Weatherburn;J. Eris;Huyen A Tran;Jignesh Patel;D. Roberts - 通讯作者:
D. Roberts
Long-term outcomes of different ablation strategies for ventricular tachycardia in patients with structural heart disease: systematic review and meta-analysis
不同消融策略治疗结构性心脏病室性心动过速的长期结果:系统评价和荟萃分析
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:6.1
- 作者:
David F Briceño;Jorge Romero;P. Villablanca;A. Londoño;J. Díaz;I. Maraj;S. A. Batul;N. Madan;Jignesh Patel;Anand D. Jagannath;S. Mohanty;P. Mohanty;C. Gianni;D. D. Della Rocca;Ahlam Sabri;Soo G. Kim;A. Natale;L. Di Biase - 通讯作者:
L. Di Biase
Jignesh Patel的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Jignesh Patel', 18)}}的其他基金
Collaborative Research: SHF: Medium: A hardware-software co-design approach for high-performance in-memory analytic data processing
协作研究:SHF:中:用于高性能内存分析数据处理的硬件软件协同设计方法
- 批准号:
2407690 - 财政年份:2023
- 资助金额:
$ 40.66万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Medium: A hardware-software co-design approach for high-performance in-memory analytic data processing
协作研究:SHF:中:用于高性能内存分析数据处理的硬件软件协同设计方法
- 批准号:
2312739 - 财政年份:2023
- 资助金额:
$ 40.66万 - 项目类别:
Standard Grant
Elements: Software: Towards Efficient Embedded Data Processing
要素:软件:实现高效的嵌入式数据处理
- 批准号:
2407755 - 财政年份:2023
- 资助金额:
$ 40.66万 - 项目类别:
Standard Grant
Elements: Software: Towards Efficient Embedded Data Processing
要素:软件:实现高效的嵌入式数据处理
- 批准号:
1835446 - 财政年份:2019
- 资助金额:
$ 40.66万 - 项目类别:
Standard Grant
BIGDATA: Small: DCM: Data Management for Analytics Applications on Modern Architecture
BIGDATA:小型:DCM:现代架构上分析应用程序的数据管理
- 批准号:
1250886 - 财政年份:2013
- 资助金额:
$ 40.66万 - 项目类别:
Standard Grant
III: Large: Collaborative Research: SciDB - An Array Oriented Data Management System for Massive Scale Scientific Data
III:大型:协作研究:SciDB - 用于大规模科学数据的面向数组的数据管理系统
- 批准号:
1110948 - 财政年份:2011
- 资助金额:
$ 40.66万 - 项目类别:
Standard Grant
III: Medium: Energy-Efficient Data Processing
III:媒介:节能数据处理
- 批准号:
0963993 - 财政年份:2010
- 资助金额:
$ 40.66万 - 项目类别:
Continuing Grant
COMET: An Efficient and Scalable Trajectory Data Management System
COMET:高效且可扩展的轨迹数据管理系统
- 批准号:
0929988 - 财政年份:2008
- 资助金额:
$ 40.66万 - 项目类别:
Standard Grant
Integrated Biological Sequence Data Management
综合生物序列数据管理
- 批准号:
0543272 - 财政年份:2006
- 资助金额:
$ 40.66万 - 项目类别:
Continuing Grant
COMET: An Efficient and Scalable Trajectory Data Management System
COMET:高效且可扩展的轨迹数据管理系统
- 批准号:
0414510 - 财政年份:2005
- 资助金额:
$ 40.66万 - 项目类别:
Standard Grant
相似国自然基金
经典红曲色素组分的合成顺序及其生物合成机制研究
- 批准号:32172181
- 批准年份:2021
- 资助金额:58 万元
- 项目类别:面上项目
基于细菌表面共展示顺序酶的生物传感器的制备及其在麦芽糖检测中的应用
- 批准号:31500799
- 批准年份:2015
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
时间-空间可控生物活性分子释放的胶原支架用于脊髓损伤神经网络重建的研究
- 批准号:81471276
- 批准年份:2014
- 资助金额:80.0 万元
- 项目类别:面上项目
基于酵母表面酶共展示全细胞的新型电化学顺序酶生物传感器的构筑研究
- 批准号:21275152
- 批准年份:2012
- 资助金额:80.0 万元
- 项目类别:面上项目
酶功能化介孔硅注流式在线制备及实时性能评价系统研究
- 批准号:51072074
- 批准年份:2010
- 资助金额:37.0 万元
- 项目类别:面上项目
相似海外基金
Integrated frameworks for single-cell epigenomics based transcriptional regulatory networks
基于单细胞表观基因组学的转录调控网络的集成框架
- 批准号:
10713209 - 财政年份:2023
- 资助金额:
$ 40.66万 - 项目类别:
AIM-AI: an Actionable, Integrated and Multiscale genetic map of Alzheimer's disease via deep learning
AIM-AI:通过深度学习绘制阿尔茨海默病的可操作、集成和多尺度遗传图谱
- 批准号:
10668829 - 财政年份:2023
- 资助金额:
$ 40.66万 - 项目类别:
HBV cccDNA and integrated DNA in HIV coinfection and HBV monoinfection
HIV 合并感染和 HBV 单一感染中的 HBV cccDNA 和整合 DNA
- 批准号:
10882266 - 财政年份:2023
- 资助金额:
$ 40.66万 - 项目类别:
Integrated blood and radiomic subtyping to guide immunotherapy treatment selection and early response assessment in metastatic non-small cell lung cancer
综合血液和放射组学亚型,指导转移性非小细胞肺癌的免疫治疗选择和早期反应评估
- 批准号:
10734127 - 财政年份:2023
- 资助金额:
$ 40.66万 - 项目类别: