RI-Small: Probabilistic Models for Structure Discovery in Text
RI-Small:文本结构发现的概率模型
基本信息
- 批准号:0915187
- 负责人:
- 金额:$ 44.99万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2009
- 资助国家:美国
- 起止时间:2009-09-01 至 2013-08-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
This project advances learning methods for obtaining linguistic knowledge from raw or nearly raw text; such knowledge constitutes a core component of natural language processing technology but is difficult to obtain, usually relying on expensive manual annotation of text data. Specifically, this project aims to automate some of the mechanical aspects of developing learning algorithms for linguistic structure (in part by using a empirical Bayesian framework to unify considerable past work by the PI and others), to enrich models with richer linguistic bias (particularly through lexicalization and integration of morphology and syntax), and to apply these techniques to new natural language processing problems (identifying boilerplate and quotation extraction). Another exciting dimension is learning from text collections in multiple languages (not necessarily including translations), which past work has shown can lead to better unsupervised learning. The project will lead to working systems, including generic tools applicable to many problems in natural language processing and machine learning. These tools will provide infrastructure for the PI's courses and will be publicly available to the research community. Research results will be published in leading journals and at major conferences. The project supports one primary graduate student and a post-doctoral researcher. Major impacts of this project will be improvements in the quality of rapidly ported natural language processing tools for new languages and text domains, as well as a deeper scientific understanding of natural language learning by machines.
该项目推进了从原始文本或几乎原始文本中获得语言知识的学习方法;这种知识构成了自然语言处理技术的核心组成部分,但很难获得,通常依靠昂贵的文本数据注释。 具体而言,该项目旨在使开发语言结构学习学习算法的某些机械方面自动化(部分是通过使用经验的贝叶斯框架来统一PI和其他人的过去工作),以丰富的语言偏见丰富模型,尤其是通过这些自然的语言和构造的启动和构造,以及新的语言工具,以及新的语言工具,以及新的语言工具的整合)提取)。 另一个令人兴奋的维度是从多种语言(不一定包括翻译)中学习,过去的工作表明,这可能会导致更好的无监督学习。 该项目将导致工作系统,包括适用于自然语言处理和机器学习许多问题的通用工具。 这些工具将为PI课程提供基础架构,并将公开提供研究社区。 研究结果将在领先的期刊和主要会议上发表。 该项目支持一名小学研究生和一名博士后研究员。 该项目的主要影响将是改善新语言和文本领域快速移植的自然语言处理工具的质量,以及对机器对自然语言学习的更深入的科学理解。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Noah Smith其他文献
THE NORTH ATLANTIC TREATY ORGANIZATION AND UNITED STATES RELATIONSHIP: A STUDY OF ITS DEVELOPMENT AND POSSIBLE FUTURE
北大西洋公约组织与美国的关系:对其发展和可能的未来的研究
- DOI:
- 发表时间:
2015 - 期刊:
- 影响因子:0
- 作者:
Noah Smith - 通讯作者:
Noah Smith
Buying health: assessing the impact of a consumer-side vegetable subsidy on purchasing, consumption and waste
购买健康:评估消费者侧蔬菜补贴对购买、消费和浪费的影响
- DOI:
- 发表时间:
2015 - 期刊:
- 影响因子:3.2
- 作者:
Noah Smith - 通讯作者:
Noah Smith
Implications for cumulative and prolonged clinical improvement induced by cross-linked hyaluronic acid: An in vivo biochemical/microscopic study in humans.
交联透明质酸诱导的累积和长期临床改善的影响:人类体内生化/显微镜研究。
- DOI:
10.1111/exd.14998 - 发表时间:
2024 - 期刊:
- 影响因子:3.6
- 作者:
Frank Wang;T. Do;Noah Smith;J. Orringer;Sewon Kang;John J Voorhees;Gary J. Fisher - 通讯作者:
Gary J. Fisher
Biopsy of Suspected Melanoma
疑似黑色素瘤活检
- DOI:
10.1007/978-3-319-46029-1_10-1 - 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
Noah Smith;T. Johnson;J. Kelly;A. Sober;C. Bichakjian - 通讯作者:
C. Bichakjian
How party nationalization conditions economic voting
- DOI:
10.1016/j.electstud.2016.11.014 - 发表时间:
2017-06-01 - 期刊:
- 影响因子:
- 作者:
Scott Morgenstern;Noah Smith;Alejandro Trelles - 通讯作者:
Alejandro Trelles
Noah Smith的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Noah Smith', 18)}}的其他基金
NSF-BSF: RI: Small: Efficient Transformers via Formal and Empirical Analysis
NSF-BSF:RI:小型:通过形式和经验分析的高效变压器
- 批准号:
2113530 - 财政年份:2021
- 资助金额:
$ 44.99万 - 项目类别:
Standard Grant
RI/SES: Conference Proposal: Doctoral Consortium on Text as Data
RI/SES:会议提案:文本即数据博士联盟
- 批准号:
1830158 - 财政年份:2018
- 资助金额:
$ 44.99万 - 项目类别:
Standard Grant
NSF-BSF: RI: Small: Collaborative Research: Modeling Crosslinguistic Influences Between Language Varieties
NSF-BSF:RI:小型:协作研究:模拟语言品种之间的跨语言影响
- 批准号:
1813153 - 财政年份:2018
- 资助金额:
$ 44.99万 - 项目类别:
Continuing Grant
RI: Medium: Broad-Coverage Semantic Parsing: Linguistic Representation Learning from Crowd-Scale Data
RI:中:广泛覆盖的语义解析:从人群规模数据中学习语言表示
- 批准号:
1562364 - 财政年份:2016
- 资助金额:
$ 44.99万 - 项目类别:
Continuing Grant
Workshop: Support for a workshop on scientific research applications of natural language technologies
研讨会:支持自然语言技术科研应用研讨会
- 批准号:
1433108 - 财政年份:2014
- 资助金额:
$ 44.99万 - 项目类别:
Standard Grant
BIGDATA: Small: DA: Big Multilinguality for Data-Driven Lexical Semantics
BIGDATA:小:DA:数据驱动词汇语义的大多语言性
- 批准号:
1251131 - 财政年份:2013
- 资助金额:
$ 44.99万 - 项目类别:
Standard Grant
EAGER: PARTIAL: An Exploratory Study on Practical Approaches for Robust NLP Tools with Integrated Annotation Languages
EAGER: PARTIAL:关于具有集成注释语言的鲁棒 NLP 工具实用方法的探索性研究
- 批准号:
1352440 - 财政年份:2013
- 资助金额:
$ 44.99万 - 项目类别:
Standard Grant
SoCS: Collaborative Research: Data-Driven, Computational Models for Discovery and Analysis of Framing
SoCS:协作研究:用于发现和分析框架的数据驱动计算模型
- 批准号:
1211277 - 财政年份:2012
- 资助金额:
$ 44.99万 - 项目类别:
Standard Grant
CAREER: Flexible Learning for Natural Language Processing
职业:自然语言处理的灵活学习
- 批准号:
1054319 - 财政年份:2011
- 资助金额:
$ 44.99万 - 项目类别:
Continuing Grant
SGER: Scaling up unsupervised grammar induction
SGER:扩大无监督语法归纳
- 批准号:
0836431 - 财政年份:2008
- 资助金额:
$ 44.99万 - 项目类别:
Standard Grant
相似国自然基金
高维小失效概率下的涡轮盘疲劳寿命可靠性优化设计方法研究
- 批准号:12302154
- 批准年份:2023
- 资助金额:30.00 万元
- 项目类别:青年科学基金项目
平均风险时间表征方式对小概率持续风险决策的影响机制及助推效应
- 批准号:72001158
- 批准年份:2020
- 资助金额:24 万元
- 项目类别:青年科学基金项目
基于重采样机制的电力系统小概率高危风险评估理论与应用研究
- 批准号:
- 批准年份:2019
- 资助金额:57 万元
- 项目类别:面上项目
自然电位的小波分析与概率成像联合方法及其在滑坡监测中的应用探索
- 批准号:41874082
- 批准年份:2018
- 资助金额:65.0 万元
- 项目类别:面上项目
小概率失效下基于主动学习Kriging模型的可靠性分析方法研究
- 批准号:51705433
- 批准年份:2017
- 资助金额:25.0 万元
- 项目类别:青年科学基金项目
相似海外基金
RI: Small: New Directions in Probabilistic Deep Learning: Exponential Families, Bayesian Nonparametrics and Empirical Bayes
RI:小:概率深度学习的新方向:指数族、贝叶斯非参数和经验贝叶斯
- 批准号:
2127869 - 财政年份:2021
- 资助金额:
$ 44.99万 - 项目类别:
Standard Grant
RI: Small: Anytime Algorithms and Bounds for Probabilistic Graphical Models
RI:小:概率图形模型的随时算法和界限
- 批准号:
2008516 - 财政年份:2020
- 资助金额:
$ 44.99万 - 项目类别:
Standard Grant
RI: Small: Embracing Deep Neural Networks into Probabilistic Answer Set Programming
RI:小:将深度神经网络融入概率答案集编程
- 批准号:
2006747 - 财政年份:2020
- 资助金额:
$ 44.99万 - 项目类别:
Standard Grant
RI: Small: Stochastic Planning and Probabilistic Inference for Factored State and Action Spaces
RI:小:因子状态和行动空间的随机规划和概率推理
- 批准号:
2002393 - 财政年份:2019
- 资助金额:
$ 44.99万 - 项目类别:
Standard Grant
RI: Small: Expressive Reasoning and Learning about Actions under Uncertainty via Probabilistic Extension of Action Language
RI:小:通过动作语言的概率扩展来表达推理和学习不确定性下的动作
- 批准号:
1815337 - 财政年份:2018
- 资助金额:
$ 44.99万 - 项目类别:
Standard Grant