Small: The MCDB Database System for Managing and Modeling Uncertainty
小:用于管理和建模不确定性的 MCDB 数据库系统
基本信息
- 批准号:0915315
- 负责人:
- 金额:$ 50万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2009
- 资助国家:美国
- 起止时间:2009-09-01 至 2014-08-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The MCDB Database System for Managing and Modeling UncertaintyAnalysts working with large data sets often use statistical models to``guess'' at unknown, inaccurate, or missing information associatedwith the data stored in a database. For example, an analyst for amanufacturer may wish to know, "What would my profits have been ifI'd increased my margins by 5% last year?" The answer to thisquestion depends upon the extent to which the higher prices would haveaffected each customer's demand, which is undoubtedly guessed via theapplication of some statistical model.The MCDB project is concerned with the design and implementation of aprototype database system called the "Monte Carlo Database System," or"MCDB" for short. MCDB allows an expert-level analyst or statisticianto attach arbitrary stochastic models to the database data in order to"guess" the values for unknown or inaccurate data, such as eachcustomer's unseen demand function. These stochastic models reside inthe database, and are always up-to-date in the sense that they areparameterized on the current state of the database (using eachcustomer's most recent purchases in the above example).The project attacks a number of key intellectual and scientificchallenges. Most of these are related to the fact that forperformance reasons, it is not possible to materialize one thousandstochastic instances of a one terabyte data warehouse, and query eachof them in sequence. Novel methods for avoiding such materializationsare being considered, such as skipping Monte Carlo trials that producedata which will never be used to answer a specific query. The projectalso considers statistical challenges, such as generating databaseinstances that fall far out in the tail of the answer distribution,which is necessary for specific applications such as risk assessment.Further information is available at http://mcdb.cs.rice.edu.
用于管理和建模不确定性的 MCDB 数据库系统 处理大型数据集的分析师经常使用统计模型来“猜测”与数据库中存储的数据相关的未知、不准确或丢失的信息。 例如,制造商的分析师可能想知道,“如果我去年的利润率增加 5%,我的利润会是多少?”这个问题的答案取决于更高的价格对每个客户需求的影响程度,这无疑可以通过应用某些统计模型来猜测。MCDB 项目涉及称为“蒙特卡洛数据库”的原型数据库系统的设计和实现。系统,简称“MCDB”。 MCDB 允许专家级分析师或统计学家将任意随机模型附加到数据库数据,以便“猜测”未知或不准确数据的值,例如每个客户看不见的需求函数。 这些随机模型驻留在数据库中,并且始终是最新的,因为它们根据数据库的当前状态进行参数化(在上面的示例中使用每个客户最近的购买)。该项目解决了许多关键的智力和科学挑战。 其中大多数与以下事实有关:出于性能原因,不可能实现 1 TB 数据仓库的数千个随机实例,并按顺序查询每个实例。 人们正在考虑避免这种具体化的新方法,例如跳过蒙特卡罗试验,这些试验产生的数据永远不会用于回答特定的查询。 该项目还考虑了统计挑战,例如生成远远落在答案分布尾部的数据库实例,这对于风险评估等特定应用程序是必要的。更多信息请访问 http://mcdb.cs.rice.edu。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Christopher Jermaine其他文献
Exploring phylogenetic hypotheses via Gibbs sampling on evolutionary networks
通过进化网络上的吉布斯采样探索系统发育假设
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:4.4
- 作者:
Yun Yu;Christopher Jermaine;Luay K. Nakhleh - 通讯作者:
Luay K. Nakhleh
The Latent Community Model for Detecting Sybil Attacks in Social Networks
用于检测社交网络中女巫攻击的潜在社区模型
- DOI:
- 发表时间:
2011 - 期刊:
- 影响因子:0
- 作者:
Zhuhua Cai;Christopher Jermaine - 通讯作者:
Christopher Jermaine
Christopher Jermaine的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Christopher Jermaine', 18)}}的其他基金
Collaborative Research: SHF: Medium: Semantics-Aware Neural Models of Code
合作研究:SHF:媒介:代码的语义感知神经模型
- 批准号:
2212557 - 财政年份:2022
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: CISE-MSI: RPEP: III: celtSTEM Research Collaborative: Catapulting MSI Faculty and Students into Computational Research.
合作研究:CISE-MSI:RPEP:III:celtSTEM 研究合作:将 MSI 教师和学生推向计算研究。
- 批准号:
2131294 - 财政年份:2021
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
III: Small: Applying Relational Database Design Principles to Machine Learning System Design
三:小:将关系数据库设计原理应用于机器学习系统设计
- 批准号:
2008240 - 财政年份:2020
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Expeditions: Collaborative Research: Understanding the World Through Code
探险:合作研究:通过代码了解世界
- 批准号:
1918651 - 财政年份:2020
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
MLWiNS: Wireless On-the-Edge Training of Deep Networks Using Independent Subnets
MLWiNS:使用独立子网的深度网络无线边缘训练
- 批准号:
2003137 - 财政年份:2020
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
III: Small: Declarative Recursive Computation on a Database System
III:小型:数据库系统上的声明式递归计算
- 批准号:
1910803 - 财政年份:2019
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
ABI Innovation: Algorithms and Models for Distributed Computation of Bayesian Phylogenetics
ABI Innovation:贝叶斯系统发育分布式计算算法和模型
- 批准号:
1355998 - 财政年份:2014
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
III: Medium: SimSQL: A Database System Supporting Implementation and Execution of Distributed Machine Learning Codes
III:媒介:SimSQL:支持分布式机器学习代码实现和执行的数据库系统
- 批准号:
1409543 - 财政年份:2014
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
III: Medium: Collaborative Research: Data Mining and Cleaning for Medical Data Warehouses
III:媒介:协作研究:医疗数据仓库的数据挖掘和清理
- 批准号:
0964526 - 财政年份:2010
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
III-COR-Medium: Design and Implementation of the DBO Database System
III-COR-Medium:DBO数据库系统的设计与实现
- 批准号:
1007062 - 财政年份:2009
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant