CAREER: Long Document Summarization with Question-Summary Hierarchy and User Preference Control

职业:具有问题摘要层次结构和用户偏好控制的长文档摘要

基本信息

  • 批准号:
    2046016
  • 负责人:
  • 金额:
    $ 54.76万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2021
  • 资助国家:
    美国
  • 起止时间:
    2021-07-01 至 2026-06-30
  • 项目状态:
    未结题

项目摘要

In an era when long documents are produced at an overwhelming speed, a reader may not have time even to skim over a document to decide which topics deserve a detailed look. The goal of this CAREER project is to build text summarization systems that can understand and aggregate information from long documents, so as to allow users to explore their content with summaries that are generated in styles they prefer. The summarization tools will make long documents more accessible and comprehensible, easing the knowledge learning experience of the general public. Researchers and practitioners can also use the tools to summarize long documents relevant to their work, and educators can incorporate them in their classes to bolster students' reading and writing skills. The project also broadens the investigator’s efforts of engaging young students in immersive research opportunities, allowing them to participate in the design and implementation of advanced summarization systems. This project develops a new summarization framework for long documents in which article-level abstractive summaries provide an overview, and a question-summary hierarchy presents different levels of details. The technical contributions of this project are three-fold. First, the quadratic time complexity of state-of-the-art summarization (e.g., Transformer) is reduced by using adaptively predicted sparse attentions and augmented with a knowledge encoder. Second, an open-ended question generation model fills automatically learned question templates to produce concrete questions that are coherent within the question-summary hierarchy. Third, summaries are tailored to user-specified styles via iterative adjustments during generation, reflecting important advice in plain-language guidelines. This project experiments with new datasets collected from government reports, since their length, topic diversity, and formulaic verbiage embody many common challenges for long document summarization. New evaluation methods are also designed, with cloze questions to target common erroneous generations, and with model confidence metrics to pinpoint errors without using references.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
在一个长文档以惊人的速度生成的时代,读者甚至可能没有时间浏览文档来决定哪些主题值得详细查看。这个 CAREER 项目的目标是构建能够理解和理解的文本摘要系统。聚合长文档中的信息,以便用户能够以自己喜欢的方式生成摘要来探索其内容。摘要工具将使长文档更易于理解和理解,从而简化公众研究人员和从业者的知识学习体验。还可以使用总结与其工作相关的长篇文档的工具,教育工作者可以将它们纳入课堂,以提高学生的阅读和写作技能。该项目还扩大了研究者让年轻学生参与沉浸式研究机会的努力,使他们能够参与到研究中。高级摘要系统的设计和实现。该项目为长文档开发了一个新的摘要框架,其中文章级摘要摘要提供了概述,而问题摘要层次结构则呈现了不同级别的细节。折叠。首先,通过使用自适应预测的稀疏注意力来降低最先进的摘要(例如 Transformer)的二次时间复杂度,并通过知识编码器进行增强。其次,开放式问题生成模型将自动学习的问题模板填充到其中。第三,通过在生成过程中进行迭代调整,生成符合用户指定风格的具体问题,反映了该项目使用新数据集的重要建议。从政府报告中收集的数据,因为它们的长度、主题多样性和正式措辞体现了长文档摘要的许多常见挑战,还设计了新的评估方法,通过完形填空问题来针对常见的错误生成,并通过模型置信度指标来查明错误,而无需使用。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
BOLT: Fast Energy-based Controlled Text Generation with Tunable Biases
  • DOI:
    10.48550/arxiv.2305.12018
  • 发表时间:
    2023-05
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xin Liu;Muhammad Khalifa;Lu Wang
  • 通讯作者:
    Xin Liu;Muhammad Khalifa;Lu Wang
Time-aware Prompting for Text Generation
  • DOI:
    10.48550/arxiv.2211.02162
  • 发表时间:
    2022-11
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Shuyang Cao;Lu Wang
  • 通讯作者:
    Shuyang Cao;Lu Wang
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Lu Wang其他文献

Highly efficient production and simultaneous purification of d-tagatose through one-pot extraction-assisted isomerization of d-galactose.
  • DOI:
    10.1016/j.fochx.2023.100928
  • 发表时间:
    2023-12-30
  • 期刊:
  • 影响因子:
    6.1
  • 作者:
    Guangzhen Wang;Xiaomei Lyu;Lu Wang;Mingming Wang;Ruijin Yang
  • 通讯作者:
    Ruijin Yang
New Insights into Roles of Cell Wall Invertase in Early Seed Development Revealed by Comprehensive Spatial and Temporal Expression Patterns of GhCWIN 1 in Cotton 1 [ W ] [ OA ]
棉花 1 中 GhCWIN 1 的综合时空表达模式揭示了细胞壁蔗糖酶在早期种子发育中的作用的新见解 [ W ] [ OA ]
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Lu Wang;Yong
  • 通讯作者:
    Yong
Working Memory and Strategy Use Contribute to Gender Differences in Spatial Ability
工作记忆和策略使用导致空间能力的性别差异
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Lu Wang;M. Carr
  • 通讯作者:
    M. Carr
Computer-aided Neuromonitoring Techniques To Objectify The Effects Of Acupuncture In The Treatment Of Migraine
计算机辅助神经监测技术客观化针灸治疗偏头痛的效果
  • DOI:
  • 发表时间:
    1999
  • 期刊:
  • 影响因子:
    0
  • 作者:
    G. Litscher;Lu Wang;G. Niederwieser
  • 通讯作者:
    G. Niederwieser
Expression and effects of cardiotrophin‐1 (CT‐1) in human airway smooth muscle cells
心肌营养素-1(CT-1)在人气道平滑肌细胞中的表达和作用
  • DOI:
  • 发表时间:
    2003
  • 期刊:
  • 影响因子:
    7.3
  • 作者:
    Danyi Zhou;Xueyan Zheng;Lu Wang;G. Stelmack;A. Halayko;D. Dorscheid;T. Bai
  • 通讯作者:
    T. Bai

Lu Wang的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Lu Wang', 18)}}的其他基金

Conference: Doctoral Consortium at Student Research Workshop at the Annual Meeting of the Association for Computational Linguistics
会议:计算语言学协会年会学生研究研讨会上的博士联盟
  • 批准号:
    2307288
  • 财政年份:
    2023
  • 资助金额:
    $ 54.76万
  • 项目类别:
    Standard Grant
Argument Graph Supported Multi-Level Approach for Argumentative Writing Assistance
论证图支持多层次的议论文写作辅助方法
  • 批准号:
    2302564
  • 财政年份:
    2023
  • 资助金额:
    $ 54.76万
  • 项目类别:
    Standard Grant
CRII:SCH: Interactive Explainable Deep Survival Analysis
CRII:SC​​H:交互式可解释深度生存分析
  • 批准号:
    2245739
  • 财政年份:
    2023
  • 资助金额:
    $ 54.76万
  • 项目类别:
    Standard Grant
Collaborative Research: From User Reviews to User-Centered Generative Design: Automated Methods for Augmented Designer Performance
协作研究:从用户评论到以用户为中心的生成设计:增强设计师性能的自动化方法
  • 批准号:
    2050130
  • 财政年份:
    2021
  • 资助金额:
    $ 54.76万
  • 项目类别:
    Standard Grant
Entropy in Mean Curvature Flow and Minimal Hypersurfaces
平均曲率流和最小超曲面中的熵
  • 批准号:
    2105576
  • 财政年份:
    2021
  • 资助金额:
    $ 54.76万
  • 项目类别:
    Continuing Grant
Entropy in Mean Curvature Flow and Minimal Hypersurfaces
平均曲率流和最小超曲面中的熵
  • 批准号:
    2146997
  • 财政年份:
    2021
  • 资助金额:
    $ 54.76万
  • 项目类别:
    Continuing Grant
Collaborative Research: III: Small: Entity- and Event-driven Media Bias Detection
协作研究:III:小型:实体和事件驱动的媒体偏差检测
  • 批准号:
    2127747
  • 财政年份:
    2021
  • 资助金额:
    $ 54.76万
  • 项目类别:
    Standard Grant
Geometric Flows and Applications
几何流及其应用
  • 批准号:
    2141529
  • 财政年份:
    2021
  • 资助金额:
    $ 54.76万
  • 项目类别:
    Continuing Grant
Evaluation of Hypothermic Oxygenated Perfusion Ex-Vivo Heart Perfusion to Expand the Donor Pool and Improve Transplant Outcomes
评估低温氧合灌注离体心脏灌注以扩大供体库并改善移植结果
  • 批准号:
    MR/V002074/1
  • 财政年份:
    2020
  • 资助金额:
    $ 54.76万
  • 项目类别:
    Fellowship
RI: Small: Collaborative Research: Computational Methods for Argument Mining: Extraction, Aggregation, and Generation
RI:小型:协作研究:参数挖掘的计算方法:提取、聚合和生成
  • 批准号:
    2100885
  • 财政年份:
    2020
  • 资助金额:
    $ 54.76万
  • 项目类别:
    Standard Grant

相似国自然基金

长链非编码RNA PINT在血管内膜增生中的调节机制及其应用于微针球囊腔内治疗的研究
  • 批准号:
    82300494
  • 批准年份:
    2023
  • 资助金额:
    20 万元
  • 项目类别:
    青年科学基金项目
圈长分布理论中的若干问题
  • 批准号:
    12371350
  • 批准年份:
    2023
  • 资助金额:
    43.5 万元
  • 项目类别:
    面上项目
植被恢复对黄土高原长链式干旱传播过程的影响与机理
  • 批准号:
    52309036
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
长、短视频平台交互影响下的竞合冲突机理及协同应对研究
  • 批准号:
    72301204
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于长脉冲荷载的黏土中速载法试验承载机理和解译方法研究
  • 批准号:
    52378329
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目

相似海外基金

Long-term Prognosis of Acute Kidney Injury in Cardiac Surgery
心脏手术中急性肾损伤的长期预后
  • 批准号:
    7531110
  • 财政年份:
    2008
  • 资助金额:
    $ 54.76万
  • 项目类别:
Drug Abuse Treatment Development and Research Mentoring
药物滥用治疗开发和研究指导
  • 批准号:
    7180794
  • 财政年份:
    2007
  • 资助金额:
    $ 54.76万
  • 项目类别:
AIDS Malignancy Clinical Trials Consortium
艾滋病恶性肿瘤临床试验联盟
  • 批准号:
    7689546
  • 财政年份:
    2006
  • 资助金额:
    $ 54.76万
  • 项目类别:
AIDS Malignancy Clinical Trials Consortium
艾滋病恶性肿瘤临床试验联盟
  • 批准号:
    7689549
  • 财政年份:
    2006
  • 资助金额:
    $ 54.76万
  • 项目类别:
Low glycemic diets in Latino children at risk for type 2 diabetes
有 2 型糖尿病风险的拉丁裔儿童的低血糖饮食
  • 批准号:
    7280509
  • 财政年份:
    2006
  • 资助金额:
    $ 54.76万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了