CAREER: Long Document Summarization with Question-Summary Hierarchy and User Preference Control

职业:具有问题摘要层次结构和用户偏好控制的长文档摘要

基本信息

  • 批准号:
    2046016
  • 负责人:
  • 金额:
    $ 54.76万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2021
  • 资助国家:
    美国
  • 起止时间:
    2021-07-01 至 2026-06-30
  • 项目状态:
    未结题

项目摘要

In an era when long documents are produced at an overwhelming speed, a reader may not have time even to skim over a document to decide which topics deserve a detailed look. The goal of this CAREER project is to build text summarization systems that can understand and aggregate information from long documents, so as to allow users to explore their content with summaries that are generated in styles they prefer. The summarization tools will make long documents more accessible and comprehensible, easing the knowledge learning experience of the general public. Researchers and practitioners can also use the tools to summarize long documents relevant to their work, and educators can incorporate them in their classes to bolster students' reading and writing skills. The project also broadens the investigator’s efforts of engaging young students in immersive research opportunities, allowing them to participate in the design and implementation of advanced summarization systems. This project develops a new summarization framework for long documents in which article-level abstractive summaries provide an overview, and a question-summary hierarchy presents different levels of details. The technical contributions of this project are three-fold. First, the quadratic time complexity of state-of-the-art summarization (e.g., Transformer) is reduced by using adaptively predicted sparse attentions and augmented with a knowledge encoder. Second, an open-ended question generation model fills automatically learned question templates to produce concrete questions that are coherent within the question-summary hierarchy. Third, summaries are tailored to user-specified styles via iterative adjustments during generation, reflecting important advice in plain-language guidelines. This project experiments with new datasets collected from government reports, since their length, topic diversity, and formulaic verbiage embody many common challenges for long document summarization. New evaluation methods are also designed, with cloze questions to target common erroneous generations, and with model confidence metrics to pinpoint errors without using references.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
在一个以压倒性速度生产长文档的时代,读者甚至没有时间浏览文档来决定哪些主题值得详细的外观。该职业项目的目标是构建可以从长文档中理解和汇总信息的文本摘要系统,以便用户使用他们喜欢的样式生成的摘要来探索其内容。摘要工具将使长文档更容易访问和可理解,从而减少公众的知识学习经验。研究人员和从业人员还可以使用这些工具来总结与他们的工作相关的长文档,并且教育工作者可以将它们纳入课堂上,以增强学生的阅读和写作技巧。该项目还扩大了调查人员使年轻学生参与沉浸式研究机会的努力,使他们能够参与高级摘要系统的设计和实施。该项目为长文档开发了一个新的摘要框架,其中文章级的摘要摘要提供了概述,而问题及属于问题的层次结构介绍了不同级别的细节。该项目的技术贡献是三倍。首先,通过使用自适应预测的稀疏注意并用知识编码器增强,最新摘要(例如变压器)的二次时间复杂性(例如变压器)会降低。其次,一个开放式的问题生成模型填充了自动学习的问题模板,以产生问题 - 苏格尔层次结构中相干的具体问题。第三,摘要是通过一代迭代调整为用户指定样式量身定制的,这反映了普通语言指南中的重要建议。该项目通过从政府报告中收集的新数据集进行了实验,因为它们的长度,主题多样性和公式化的词汇体现了长期文档摘要的许多常见挑战。还设计了新的评估方法,并有披oo的问题来针对常见的错误世代,并以模型的置信度指标来指明错误而无需使用参考。该奖项反映了NSF的法定任务,并被认为是通过基金会的智力优点和更广泛影响的评估来通过评估来获得的支持。

项目成果

期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
BOLT: Fast Energy-based Controlled Text Generation with Tunable Biases
  • DOI:
    10.48550/arxiv.2305.12018
  • 发表时间:
    2023-05
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xin Liu;Muhammad Khalifa;Lu Wang
  • 通讯作者:
    Xin Liu;Muhammad Khalifa;Lu Wang
Time-aware Prompting for Text Generation
  • DOI:
    10.48550/arxiv.2211.02162
  • 发表时间:
    2022-11
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Shuyang Cao;Lu Wang
  • 通讯作者:
    Shuyang Cao;Lu Wang
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Lu Wang其他文献

Highly efficient production and simultaneous purification of d-tagatose through one-pot extraction-assisted isomerization of d-galactose.
  • DOI:
    10.1016/j.fochx.2023.100928
  • 发表时间:
    2023-12-30
  • 期刊:
  • 影响因子:
    6.1
  • 作者:
    Guangzhen Wang;Xiaomei Lyu;Lu Wang;Mingming Wang;Ruijin Yang
  • 通讯作者:
    Ruijin Yang
New Insights into Roles of Cell Wall Invertase in Early Seed Development Revealed by Comprehensive Spatial and Temporal Expression Patterns of GhCWIN 1 in Cotton 1 [ W ] [ OA ]
棉花 1 中 GhCWIN 1 的综合时空表达模式揭示了细胞壁蔗糖酶在早期种子发育中的作用的新见解 [ W ] [ OA ]
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Lu Wang;Yong
  • 通讯作者:
    Yong
Working Memory and Strategy Use Contribute to Gender Differences in Spatial Ability
工作记忆和策略使用导致空间能力的性别差异
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Lu Wang;M. Carr
  • 通讯作者:
    M. Carr
Computer-aided Neuromonitoring Techniques To Objectify The Effects Of Acupuncture In The Treatment Of Migraine
计算机辅助神经监测技术客观化针灸治疗偏头痛的效果
  • DOI:
  • 发表时间:
    1999
  • 期刊:
  • 影响因子:
    0
  • 作者:
    G. Litscher;Lu Wang;G. Niederwieser
  • 通讯作者:
    G. Niederwieser
Expression and effects of cardiotrophin‐1 (CT‐1) in human airway smooth muscle cells
心肌营养素-1(CT-1)在人气道平滑肌细胞中的表达和作用
  • DOI:
  • 发表时间:
    2003
  • 期刊:
  • 影响因子:
    7.3
  • 作者:
    Danyi Zhou;Xueyan Zheng;Lu Wang;G. Stelmack;A. Halayko;D. Dorscheid;T. Bai
  • 通讯作者:
    T. Bai

Lu Wang的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Lu Wang', 18)}}的其他基金

Conference: Doctoral Consortium at Student Research Workshop at the Annual Meeting of the Association for Computational Linguistics
会议:计算语言学协会年会学生研究研讨会上的博士联盟
  • 批准号:
    2307288
  • 财政年份:
    2023
  • 资助金额:
    $ 54.76万
  • 项目类别:
    Standard Grant
Argument Graph Supported Multi-Level Approach for Argumentative Writing Assistance
论证图支持多层次的议论文写作辅助方法
  • 批准号:
    2302564
  • 财政年份:
    2023
  • 资助金额:
    $ 54.76万
  • 项目类别:
    Standard Grant
CRII:SCH: Interactive Explainable Deep Survival Analysis
CRII:SC​​H:交互式可解释深度生存分析
  • 批准号:
    2245739
  • 财政年份:
    2023
  • 资助金额:
    $ 54.76万
  • 项目类别:
    Standard Grant
Collaborative Research: From User Reviews to User-Centered Generative Design: Automated Methods for Augmented Designer Performance
协作研究:从用户评论到以用户为中心的生成设计:增强设计师性能的自动化方法
  • 批准号:
    2050130
  • 财政年份:
    2021
  • 资助金额:
    $ 54.76万
  • 项目类别:
    Standard Grant
Entropy in Mean Curvature Flow and Minimal Hypersurfaces
平均曲率流和最小超曲面中的熵
  • 批准号:
    2105576
  • 财政年份:
    2021
  • 资助金额:
    $ 54.76万
  • 项目类别:
    Continuing Grant
Entropy in Mean Curvature Flow and Minimal Hypersurfaces
平均曲率流和最小超曲面中的熵
  • 批准号:
    2146997
  • 财政年份:
    2021
  • 资助金额:
    $ 54.76万
  • 项目类别:
    Continuing Grant
Collaborative Research: III: Small: Entity- and Event-driven Media Bias Detection
协作研究:III:小型:实体和事件驱动的媒体偏差检测
  • 批准号:
    2127747
  • 财政年份:
    2021
  • 资助金额:
    $ 54.76万
  • 项目类别:
    Standard Grant
Geometric Flows and Applications
几何流及其应用
  • 批准号:
    2141529
  • 财政年份:
    2021
  • 资助金额:
    $ 54.76万
  • 项目类别:
    Continuing Grant
Evaluation of Hypothermic Oxygenated Perfusion Ex-Vivo Heart Perfusion to Expand the Donor Pool and Improve Transplant Outcomes
评估低温氧合灌注离体心脏灌注以扩大供体库并改善移植结果
  • 批准号:
    MR/V002074/1
  • 财政年份:
    2020
  • 资助金额:
    $ 54.76万
  • 项目类别:
    Fellowship
RI: Small: Collaborative Research: Computational Methods for Argument Mining: Extraction, Aggregation, and Generation
RI:小型:协作研究:参数挖掘的计算方法:提取、聚合和生成
  • 批准号:
    2100885
  • 财政年份:
    2020
  • 资助金额:
    $ 54.76万
  • 项目类别:
    Standard Grant

相似国自然基金

基于长脉冲荷载的黏土中速载法试验承载机理和解译方法研究
  • 批准号:
    52378329
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
黄熟期水稻调节褐飞虱lnc-21921增强长翅成虫抗药性的分子机制
  • 批准号:
    32372519
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
自放电仿生神经支架重建再生微环境修复长节段神经缺损的效应及其机制研究
  • 批准号:
    82301544
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
南极冰层边缘不稳定性的长时序跨周期分析关键技术研究
  • 批准号:
    42301149
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
长链非编码RNA lnRPT通过YB1/eEF1调控心肌纤维化的功能和机理研究
  • 批准号:
    82370274
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目

相似海外基金

Long-term Prognosis of Acute Kidney Injury in Cardiac Surgery
心脏手术中急性肾损伤的长期预后
  • 批准号:
    7531110
  • 财政年份:
    2008
  • 资助金额:
    $ 54.76万
  • 项目类别:
Drug Abuse Treatment Development and Research Mentoring
药物滥用治疗开发和研究指导
  • 批准号:
    7180794
  • 财政年份:
    2007
  • 资助金额:
    $ 54.76万
  • 项目类别:
AIDS Malignancy Clinical Trials Consortium
艾滋病恶性肿瘤临床试验联盟
  • 批准号:
    7689546
  • 财政年份:
    2006
  • 资助金额:
    $ 54.76万
  • 项目类别:
AIDS Malignancy Clinical Trials Consortium
艾滋病恶性肿瘤临床试验联盟
  • 批准号:
    7689549
  • 财政年份:
    2006
  • 资助金额:
    $ 54.76万
  • 项目类别:
Low glycemic diets in Latino children at risk for type 2 diabetes
有 2 型糖尿病风险的拉丁裔儿童的低血糖饮食
  • 批准号:
    7280509
  • 财政年份:
    2006
  • 资助金额:
    $ 54.76万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了