Collaborative Research III-COR: From a Pile of Documents to a Collection of Information: A Framework for Multi-Dimensional Text Analysis

协作研究III-COR:从一堆文档到信息集合:多维文本分析框架

基本信息

  • 批准号:
    0705566
  • 负责人:
  • 金额:
    --
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2007
  • 资助国家:
    美国
  • 起止时间:
    2007-08-15 至 2009-04-30
  • 项目状态:
    已结题

项目摘要

Many information workers are swamped with unfamiliar collections of text. One challenge is to obtain an accurate overview of a large text collection, such as the public comments collected in ''''''''notice and comment'''''''' rulemaking. No single tool currently provides a sufficiently diversified picture of such a corpus, and no adequate theory exists to help people explore and form a deep and nuanced understanding of such a text collection. This research seeks to develop a computational framework that allows further exploration of this problem from multiple, integrated perspectives. All the assembled perspectives will be brought together into a single overall supra-document structure that is dynamically constructed under user guidance. In this structure, hierarchical topic clusters will be cross-linked by opinion and argumentation links, using two classes of text analysis engines: one for topics and subtopics, and the other for argument structures. The research team will design, develop, build, and systematically test an overall text exploration framework, an application to support federal regulation writersone called the Rule-Writers Workbench. There is a strong collaboration with Federal government officials who will provide data and participate in user testing. The three PIs have successfully collaborated on a related project under previous NSF funding. Intellectual Merit: This is a sustainable collaboration between computer science and political/social science research, rooted in a challenging and important real world application and informed by years of end user research. Dynamic, user-driven subtopic definition and clustering algorithms coupled withlanguage modeling are an innovative yet reachable set of goals. The framework to be developed will be grounded in the humanities disciplines'' expertise in rhetoric, discourse structure, and subjectivity.Broader Impacts: The Rule-Writers Workbench will allow federal government regulation writers to employ a suite of technical tools that perform independent analyses of public responses to proposed regulations, including near-duplicate detection and clustering, user-based topic selection from dynamically extracted keywords, opinion identification, and subtopic clustering. These capabilities will open new avenues for federal comment analysis.
许多信息工作者被陌生的文本收藏所淹没。一个挑战是获得大型文本集的准确概述,例如在'''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''中。目前没有一个工具可以提供足够多样化的这种语料库的图片,并且没有足够的理论来帮助人们探索并形成对此类文本收藏的深刻而细微的理解。这项研究旨在开发一个计算框架,该框架可以从多个集成的角度进一步探索该问题。所有组装的观点都将被汇集到一个在用户指导下动态构建的单个整体上库结构。在这种结构中,使用两类的文本分析引擎:一个用于主题和子主题,另一个用于参数结构,将通过意见和论证链接交联层次群群。研究团队将设计,开发,建造和系统地测试整个文本探索框架,该框架是支持联邦监管撰稿人的应用程序,称为“规则撰写者工作台”。与联邦政府官员进行了强有力的合作,他们将提供数据并参与用户测试。这三个PI成功地在先前的NSF资金下成功合作了一个相关项目。知识分子优点:这是计算机科学与政治/社会科学研究之间的可持续合作,植根于充满挑战且重要的现实世界应用,并由多年的最终用户研究所启发。动态,用户驱动的亚主题定义和聚类算法与语言建模相结合是一组创新但可实现的目标集。要开发的框架将基于人文学科的言论,话语结构和主观性的专业知识。公民的影响:规则界者将允许联邦政府的监管工作台使用一系列技术工具,可以采用一系列技术工具来执行对公众响应的独立分析,包括对拟议的构图,包括近距离识别,从而识别基于用户的识别和凝聚力的范围,该识别范围是动态的,动态启用了动态,该范围是动态的,动态构成了,该范围是动态的,该范围是动态的,该措施是动态的,并介绍了动态的,并介绍了动态的,并介绍了动态的范围,并将其动态构建范围进行动态,并介绍了构想的范围。聚类。这些功能将为联邦评论分析开放新途径。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Stuart Shulman其他文献

Stuart Shulman的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Stuart Shulman', 18)}}的其他基金

Workshop: YouTube and the 2008 Election Cycle in the United States, April 3-4, 2009
研讨会:YouTube 与美国 2008 年选举周期,2009 年 4 月 3 日至 4 日
  • 批准号:
    0903886
  • 财政年份:
    2009
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Collaborative Research III-COR: From a Pile of Documents to a Collection of Information: A Framework for Multi-Dimensional Text Analysis
协作研究III-COR:从一堆文档到信息集合:多维文本分析框架
  • 批准号:
    0917773
  • 财政年份:
    2008
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Coding Across the Disciplines: A Project-Based Workshop on Manual Text Annotation Techniques
跨学科编码:基于项目的手动文本注释技术研讨会
  • 批准号:
    0620673
  • 财政年份:
    2006
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
ITR/PE:Digital Citizenship: Expanding Information Technology Literacy with a Service-Learning Approach
ITR/PE:数字公民:通过服务学习方法扩大信息技术素养
  • 批准号:
    0503997
  • 财政年份:
    2004
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Collaborative Research: Language Processing Technology for Electronic Rulemaking
合作研究:电子规则制定的语言处理技术
  • 批准号:
    0429293
  • 财政年份:
    2004
  • 资助金额:
    --
  • 项目类别:
    Continuing Grant
SGER COLLABORATIVE: A Testbed for eRulemaking Data
SGER Collaborative:电子规则制定数据的测试平台
  • 批准号:
    0502121
  • 财政年份:
    2004
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
SGER COLLABORATIVE: A Testbed for eRulemaking Data
SGER Collaborative:电子规则制定数据的测试平台
  • 批准号:
    0328914
  • 财政年份:
    2003
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
ITR/PE:Digital Citizenship: Expanding Information Technology Literacy with a Service-Learning Approach
ITR/PE:数字公民:通过服务学习方法扩大信息技术素养
  • 批准号:
    0113718
  • 财政年份:
    2001
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Digital Government: SGER: Citizen Agenda-Setting in the Regulatory Process: Electronic Collection and Synthesis of Public Commentary
数字政府:SGER:监管过程中的公民议程设置:公众评论的电子收集和综合
  • 批准号:
    0089892
  • 财政年份:
    2000
  • 资助金额:
    --
  • 项目类别:
    Standard Grant

相似国自然基金

III-E型CRISPR-Cas系统的结构生物学及其应用研究
  • 批准号:
    32371276
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
乙肝肝纤维化进程咪唑丙酸通过mTORC1通路调控III型固有淋巴细胞糖脂代谢重编程及机制研究
  • 批准号:
    82370622
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
铁载体与Fe(III)相互作用过程的铁同位素分馏及机理的模拟实验研究
  • 批准号:
    42377264
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
基于III-V族半导体纳米结构阵列的短波红外偏振探测理论与方法研究
  • 批准号:
    62305023
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
高性能TM(I)-Ln(III)单分子磁体的可控合成与构效关系研究
  • 批准号:
    22371031
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: Conference: DESC: Type III: Eco Edge - Advancing Sustainable Machine Learning at the Edge
协作研究:会议:DESC:类型 III:生态边缘 - 推进边缘的可持续机器学习
  • 批准号:
    2342498
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: High-Performance Scheduling for Modern Database Systems
协作研究:III:小型:现代数据库系统的高性能调度
  • 批准号:
    2322973
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: High-Performance Scheduling for Modern Database Systems
协作研究:III:小型:现代数据库系统的高性能调度
  • 批准号:
    2322974
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Collaborative Research: Conference: DESC: Type III: Eco Edge - Advancing Sustainable Machine Learning at the Edge
协作研究:会议:DESC:类型 III:生态边缘 - 推进边缘的可持续机器学习
  • 批准号:
    2342497
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
III : Medium: Collaborative Research: From Open Data to Open Data Curation
III:媒介:协作研究:从开放数据到开放数据管理
  • 批准号:
    2420691
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了