CAREER: New Directions in Probabilistic Topic Models

职业:概率主题模型的新方向

基本信息

  • 批准号:
    0745520
  • 负责人:
  • 金额:
    $ 54.99万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2008
  • 资助国家:
    美国
  • 起止时间:
    2008-07-01 至 2014-06-30
  • 项目状态:
    已结题

项目摘要

There is a growing need for (semi-)automated tools to analyze and organize large collections of electronic information. In response, there is a surge of research on machine learning of probabilistic topic models, which automatically discover the hidden thematic structure in a large collection of documents. Once made explicit, this hidden structure facilitates browsing, searching, organizing, and summarizing vast amounts of information.This research program will significantly build on the current state-of-the-art in topic modeling.1. We will develop topic modeling algorithms that discover trends in document streams. Modeling evolutionary and revolutionary change of topics over time will be an important new capability for corpora analysts, providing methods of forecasting and understanding the changing patterns in serial collections such as news feeds, scientific publications, or web blogs.2. Many modern corpora, such as Wikipedia, contain important links between the documents. We will develop topic models of such interconnected collections that explicitly represent and generalize inter-document and/or inter-topic relationships. Such relationships may be hyper-links, scholarly citation, shared authorship, or statistical correlations. Capturing the patterns in these connections, and understanding their relationship to the texts, will have important implications for a great variety of scholarly, commercial, and personal 'recommender' systems.3. Very often, analysts and other users approach a corpora with particular questions in mind. To facilitate focused, personalized exploration, we will develop supervised methods for discovering topic models that predict document-specific variables -- notably forms of relevance -- of online material such as scholarly papers, legal briefs, media sources, and product specifications.This project addresses significant current limitations of topic modeling, and will provide practical new research and education tools for understanding and organizing modern repositories of information. We will make these tools available as open-source software to support and encourage their application to real-world problems, and we will fold the results of our research into ongoing education and outreach programs.
对(半)自动化工具来分析和组织大量电子信息的需求日益增长。 因此,关于概率主题模型的机器学习的研究激增,它可以自动发现大量文档中隐藏的主题结构。 一旦明确,这种隐藏的结构将有助于浏览、搜索、组织和总结大量信息。该研究计划将显着建立在主题建模的当前最先进的基础上。1.我们将开发主题建模算法来发现文档流中的趋势。对主题随时间的演变和革命性变化进行建模将成为语料库分析师的一项重要新功能,提供预测和理解新闻源、科学出版物或网络博客等系列集合中变化模式的方法。2.许多现代语料库,例如维基百科,都包含文档之间的重要链接。 我们将开发此类互连集合的主题模型,以明确表示和概括文档间和/或主题间关系。这种关系可能是超链接、学术引用、共同作者身份或统计相关性。 捕捉这些联系中的模式,并理解它们与文本的关系,将对各种学术、商业和个人“推荐”系统产生重要影响。3.很多时候,分析师和其他用户在使用语料库时都会考虑到特定的问题。为了促进集中、个性化的探索,我们将开发监督方法来发现主题模型,预测在线材料(例如学术论文、法律摘要、媒体来源和产品规格)的文档特定变量(尤其是相关形式)。该项目解决了当前主题建模的重大局限性,并将为理解和组织现代信息存储库提供实用的新研究和教育工具。我们将把这些工具作为开源软件提供,以支持和鼓励它们应用于现实世界的问题,并且我们将把我们的研究成果纳入持续的教育和推广计划中。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

David Blei其他文献

Overlapping clustering methods for networks
网络的重叠聚类方法
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    David Blei;Elena A. Erosheva
  • 通讯作者:
    Elena A. Erosheva
Variational inference for microbiome survey data with application to global ocean data
微生物组调查数据的变分推断及其应用于全球海洋数据
  • DOI:
    10.1101/2024.03.18.585474
  • 发表时间:
    2024-03-19
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Aditya Mishra;Jesse McNichol;J. Fuhrman;David Blei;Christian L. Müller
  • 通讯作者:
    Christian L. Müller

David Blei的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('David Blei', 18)}}的其他基金

New Directions in Bayesian Model Criticism
贝叶斯模型批评的新方向
  • 批准号:
    2311108
  • 财政年份:
    2023
  • 资助金额:
    $ 54.99万
  • 项目类别:
    Standard Grant
RI: Small: New Directions in Probabilistic Deep Learning: Exponential Families, Bayesian Nonparametrics and Empirical Bayes
RI:小:概率深度学习的新方向:指数族、贝叶斯非参数和经验贝叶斯
  • 批准号:
    2127869
  • 财政年份:
    2021
  • 资助金额:
    $ 54.99万
  • 项目类别:
    Standard Grant
BIGDATA: Mid-Scale: ESCE: Collaborative Research: Discovery and Social Analytics for Large-Scale Scientific Literature
大数据:中等规模:ESCE:协作研究:大规模科学文献的发现和社会分析
  • 批准号:
    1502780
  • 财政年份:
    2014
  • 资助金额:
    $ 54.99万
  • 项目类别:
    Standard Grant
BIGDATA: Mid-Scale: ESCE: Collaborative Research: Discovery and Social Analytics for Large-Scale Scientific Literature
大数据:中等规模:ESCE:协作研究:大规模科学文献的发现和社会分析
  • 批准号:
    1247664
  • 财政年份:
    2013
  • 资助金额:
    $ 54.99万
  • 项目类别:
    Standard Grant

相似国自然基金

溶酶体膜蛋白LAMP2新突变Y228*促进心肌细胞糖代谢异常导致Danon病心肌病的机制研究
  • 批准号:
    82360048
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目
基于二元重编程的归一化肿瘤疫苗在局部晚期三阴乳腺癌新辅助治疗中的作用与机制研究
  • 批准号:
    32371451
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
甜菊糖苷新位点糖基化的机制研究及其在低热量甜味剂结构创新中的应用
  • 批准号:
    32372277
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
新骨架紫杉烷二萜baccataxane的化学合成、衍生化和降糖活性研究
  • 批准号:
    82373758
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
通过机器学习和多模式验证聚焦新靶点ENHO/Adropin在系统性硬化症中的作用和机制研究
  • 批准号:
    82371818
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目

相似海外基金

CAREER: New directions in the study of zeros and moments of L-functions
职业:L 函数零点和矩研究的新方向
  • 批准号:
    2339274
  • 财政年份:
    2024
  • 资助金额:
    $ 54.99万
  • 项目类别:
    Continuing Grant
CAREER: New Directions in Foliation Theory and Diffeomorphism Groups
职业:叶状理论和微分同胚群的新方向
  • 批准号:
    2239106
  • 财政年份:
    2023
  • 资助金额:
    $ 54.99万
  • 项目类别:
    Continuing Grant
FASEB SRC: Matricellular Proteins: Fundamental Concepts and New Directions
FASEB SRC:基质细胞蛋白:基本概念和新方向
  • 批准号:
    10468385
  • 财政年份:
    2022
  • 资助金额:
    $ 54.99万
  • 项目类别:
CAREER: New Directions in p-adic Heights and Rational Points on Curves
职业生涯:p-adic 高度和曲线上有理点的新方向
  • 批准号:
    1945452
  • 财政年份:
    2020
  • 资助金额:
    $ 54.99万
  • 项目类别:
    Continuing Grant
CAREER: Shape Analysis in Submanifold Spaces: New Directions for Theory and Algorithms
职业:子流形空间中的形状分析:理论和算法的新方向
  • 批准号:
    1945224
  • 财政年份:
    2020
  • 资助金额:
    $ 54.99万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了