Tree Ensemble Regression and Classification Methods

树集成回归和分类方法

基本信息

  • 批准号:
    6832086
  • 负责人:
  • 金额:
    $ 9.99万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2004
  • 资助国家:
    美国
  • 起止时间:
    2004-08-01 至 2005-11-30
  • 项目状态:
    已结题

项目摘要

DESCRIPTION (provided by applicant): This SBIR aims to produce next generation classification and regression software based upon ensembles of decision trees: bagging, random forests, and boosting. The prediction accuracy of these methods has caused much excitement in the machine learning community, and both challenges and complements the data modeling culture prevalent among biostatisticians. Recent research extends the methodology to likelihood based methods used in biostatistics, leading to models for survival data and generalized forest models. Generalized forest models extend regression forests in the same way that generalized linear models extend linear models. This software would apply broadly, including to medical diagnosis, prognostic modeling, and detecting cancer; and for modeling patient characteristics like blood pressure, discrete responses in clinical trials, and count data. Phase I work will prototype software for survival data, and investigate the performance of ensemble methods on simulated and real data. For survival applications, we will assess out-of-bag estimates of performance, and investigate measures of variable importance and graphics that help clinicians understand the results. Experience writing prototypes and using them on data will lead to a preliminary software design that serves as the foundation of Phase II work. Phase II will expand upon this work to create commercial software. We will research and implement algorithms for a wider range of applications including generalized forest models, classification, and least squares regression. We will also implement robust loss criteria that enable good performance on noisy data, and make adaptations to handle large data sets. This proposed software will enable medical researchers to obtain high prediction accuracy, and complement traditional tools like discriminant analysis, linear and logistic regression models, and the Cox model.
描述(由申请人提供): 该SBIR旨在基于决策树的集合来生产下一代分​​类和回归软件:包装,随机森林和增强。这些方法的预测准确性引起了机器学习社区的极大兴奋,并且挑战和补充了生物统计学家普遍存在的数据建模文化。最近的研究将方法扩展到了生物统计学中使用的基于可能性的方法,从而导致生存数据和广义森林模型的模型。广义森林模型以与广义线性模型扩展线性模型相同的方式扩展了回归森林。 该软件将广泛应用,包括医学诊断,预后建模和检测癌症;用于对患者特征进行建模,例如血压,临床试验中的离散反应和计数数据。 第一阶段的工作将原型软件用于生存数据,并研究模拟和真实数据的集合方法的性能。对于生存应用,我们将评估绩效的淘汰外估计,并研究可变重要性和图形的度量,以帮助临床医生理解结果。经验编写原型并在数据上使用它们将导致初步软件设计,该设计是II期工作的基础。 第二阶段将扩展这项工作以创建商业软件。我们将研究和实施用于更广泛的森林模型,分类和最小二乘回归在内的更广泛应用的算法。我们还将实施强大的损失标准,以在嘈杂的数据上实现良好的性能,并进行改编以处理大型数据集。 该提出的软件将使医学研究人员能够获得高预测的准确性,并补充传统工具,例如判别分析,线性和逻辑回归模型以及COX模型。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

JAMES SCHIMERT其他文献

JAMES SCHIMERT的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('JAMES SCHIMERT', 18)}}的其他基金

Software to Handle Missing Values in Large Data
处理大数据中缺失值的软件
  • 批准号:
    6690119
  • 财政年份:
    2003
  • 资助金额:
    $ 9.99万
  • 项目类别:
Causal Modeling Software for Longitudinal Studies
用于纵向研究的因果建模软件
  • 批准号:
    6550141
  • 财政年份:
    2002
  • 资助金额:
    $ 9.99万
  • 项目类别:
BAYESIAN MODELING AND DATA ANALYSIS IN S-PLUS
S-PLUS 中的贝叶斯建模和数据分析
  • 批准号:
    6489364
  • 财政年份:
    2000
  • 资助金额:
    $ 9.99万
  • 项目类别:
An S-Plus Functional Data Analysis Module
S-Plus 功能数据分析模块
  • 批准号:
    6622233
  • 财政年份:
    2000
  • 资助金额:
    $ 9.99万
  • 项目类别:
TREE BASED SOFTWARE FOR BIOMEDICAL APPLICATIONS
用于生物医学应用的基于树的软件
  • 批准号:
    2715847
  • 财政年份:
    1998
  • 资助金额:
    $ 9.99万
  • 项目类别:
STRUCTURAL EQUATION SOFTWARE FOR COMPLEX SURVEYS
用于复杂测量的结构方程软件
  • 批准号:
    2790313
  • 财政年份:
    1998
  • 资助金额:
    $ 9.99万
  • 项目类别:
TREE-BASED SOFTWARE FOR BIOMEDICAL APPLICATIONS
用于生物医学应用的基于树的软件
  • 批准号:
    6071793
  • 财政年份:
    1998
  • 资助金额:
    $ 9.99万
  • 项目类别:
TREE-BASED SOFTWARE FOR BIOMEDICAL APPLICATIONS
用于生物医学应用的基于树的软件
  • 批准号:
    6376917
  • 财政年份:
    1998
  • 资助金额:
    $ 9.99万
  • 项目类别:
STATISTICAL SOFTWARE FOR RESAMPLING METHODS
用于重采样方法的统计软件
  • 批准号:
    2111497
  • 财政年份:
    1995
  • 资助金额:
    $ 9.99万
  • 项目类别:
STATISTICAL SOFTWARE FOR RESAMPLING METHODS
用于重采样方法的统计软件
  • 批准号:
    2769788
  • 财政年份:
    1995
  • 资助金额:
    $ 9.99万
  • 项目类别:

相似海外基金

COMMERCIALIZATION OF GRAPHICAL INTRAVENOUS DRUG DISPLAY
静脉药物图形显示的商业化
  • 批准号:
    6883653
  • 财政年份:
    2005
  • 资助金额:
    $ 9.99万
  • 项目类别:
Internet-based Fidelity Enhancement of MTFC
基于互联网的MTFC保真度增强
  • 批准号:
    6994552
  • 财政年份:
    2005
  • 资助金额:
    $ 9.99万
  • 项目类别:
COMMERCIALZATION OF METAPHOR GRAPHIC PHYSIOLOGIC DISPLAY
隐喻图形生理显示的商业化
  • 批准号:
    6793788
  • 财政年份:
    2004
  • 资助金额:
    $ 9.99万
  • 项目类别:
A Context-Sensitive Teleconsultation Infrastructure
上下文敏感的远程会诊基础设施
  • 批准号:
    6725819
  • 财政年份:
    2003
  • 资助金额:
    $ 9.99万
  • 项目类别:
A Context-Sensitive Teleconsultation Infrastructure
上下文敏感的远程会诊基础设施
  • 批准号:
    6948251
  • 财政年份:
    2003
  • 资助金额:
    $ 9.99万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了