談話構造を用いた教師なし文書要約生成

使用话语结构的无监督文档摘要生成

基本信息

  • 批准号:
    20J10726
  • 负责人:
  • 金额:
    $ 1.09万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2020
  • 资助国家:
    日本
  • 起止时间:
    2020-04-24 至 2022-03-31
  • 项目状态:
    已结题

项目摘要

情報爆発が叫ばれる現代において、文章から重要な情報を抽出し纏める自動文書要約技術への期待は日々高まっている。自動文書要約のアプローチは、要約に相 応しい文や節を抽出する抽出型要約と、単語や句の言い換え・一般化を行う生成型要約に分けられる。生成型要約はより人手に近い自動要約を実現でき、その確立は自動要約研究の大きな目標である。一方で、生成型要約は見本となる要約(参照要約)を大量に要し、現実の文書の多くは参照要約の数が少なく、それらの用意に多大な労力を要することから、実用上の大きな障害となっている。そこで本研究では、前年度に開発した木構造トピックモデルにより文書のトピック木構造を推定し、各トピックの要約文を生成する手法を開発した。当初の計画では談話構造木のトピック分割による要約生成を計画していたが、最新の文生成研究に基づきトピックごとの要約文を生成するアプローチに切り替えた。木構造上のトピックから要約として相応しい詳細度合いのトピックを選択し、各トピックに関する要約文を生成することで、意見文書の要約が教師なしに得られることを示した。評価実験では、提案法の要約性能は最新の教師なし生成型要約手法と競合することを確認した。また、トピック文の詳細度合いはその潜在分布の分散の大きさに依存し、根の文の潜在分布は分散が大きく一般的な文が生成される一方、葉に近づくにつれ分散が小さくなり具体的な文が生成されるといった特性を確認した。以上の成果を取り纏めた論文は、計算言語学のトップジャーナルTACLに採択された、言語処理学会第27回年次大会で若手奨励賞を、情報処理学会第246回自然言語処理研究会で優秀研究賞および山下記念研究賞を受賞した。
在当今的信息爆炸正在召集的世界中,对自动文档摘要技术的期望,这些技术从文本中提取重要信息并每天都在增长。自动文档摘要方法可以分为一个提取的摘要,该摘要提取了适合摘要的句子和条款,以及生成的摘要,该摘要重现和概括了单词和短语。生成的摘要允许更具人为友好的自动摘要,而建立这是自动摘要研究的主要目标。另一方面,生成的摘要需要大量的样本摘要(参考摘要),并且许多真实文档几乎没有参考摘要,这是一个主要的实际障碍,因为为这些摘要的准备工作需要大量实际使用。因此,在这项研究中,我们开发了一种使用上一年开发的树结构主题模型估算文档的主题树结构的方法,并为每个主题生成摘要声明。最初的计划是按话语结构树的主题划分来生成摘要声明,但是根据最新的句子生成研究,我们改用了为每个主题生成摘要陈述的方法。我们表明,可以通过从树结构上的主题中选择适当细节的主题来获得意见文档的摘要,并为每个主题生成摘要声明。评估实验证实,所提出的方法的摘要性能与最新的无监督生成摘要方法竞争。此外,主题句子的详细程度取决于其潜在分布的差异的大小,并且根句的潜在分布的特征是较大的,并且会产生一般的句子,而随着它们接近叶子和混凝土句子的差异,差异较小。总结上述结果的论文在语言处理协会第27届年度会议上获得了年轻人鼓励奖,该奖项被选为计算语言学的最高期刊,以及卓越研究奖和Yamashita Memorial Research在第246天自然语言处理社会的研究。

项目成果

期刊论文数量(7)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Unsupervised Abstractive Opinion Summarization by Generating Sentences with Tree-Structured Topic Guidance
木構造ニューラルトピックモデル
树结构神经主题模型
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    磯沼 大;森 純一郎;ボレガラ ダヌシカ;坂田 一郎
  • 通讯作者:
    坂田 一郎
トピック文生成による教師なし意見要約(若手奨励賞)
使用主题句生成进行无监督意见总结(青年鼓励奖)
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    磯沼 大;森 純一郎;ボレガラ ダヌシカ;坂田 一郎
  • 通讯作者:
    坂田 一郎
リヴァプール大学(英国)
利物浦大学(英国)
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Tree-Structured Neural Topic Model
  • DOI:
    10.18653/v1/2020.acl-main.73
  • 发表时间:
    2020-07
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Masaru Isonuma;Junichiro Mori;Danushka Bollegala;I. Sakata
  • 通讯作者:
    Masaru Isonuma;Junichiro Mori;Danushka Bollegala;I. Sakata
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

磯沼 大其他文献

ZIP7異常によるB細胞欠損女児
ZIP7 异常导致 B 细胞缺陷的女孩
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    磯沼 大;森 純一郎;ボレガラ ダヌシカ;坂田 一郎;谷田けい
  • 通讯作者:
    谷田けい
文書分類とのマルチタスク学習による重要文抽出
通过文档分类的多任务学习提取重要句子
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Masaru Isonuma;Toru Fujino;Junichiro Mori;Yutaka Matsuo and Ichiro Sakata;Junichiro Mori;磯沼大;磯沼大;蕭喬仁;小野拓也;小野拓也;大知正直;田爪聡;今給黎成彬;磯沼大;蕭喬仁;Kimitaka Asatani;Kimitaka Asatani;田中 和哉;久保田 修平;Kimitaka Asatani;磯沼 大
  • 通讯作者:
    磯沼 大
深層学習を用いた論文書誌情報による研究専門分野ラベリング
使用深度学习使用文章书目信息研究专业标签
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Masaru Isonuma;Toru Fujino;Junichiro Mori;Yutaka Matsuo and Ichiro Sakata;Junichiro Mori;磯沼大;磯沼大;蕭喬仁;小野拓也;小野拓也;大知正直;田爪聡;今給黎成彬;磯沼大;蕭喬仁;Kimitaka Asatani;Kimitaka Asatani;田中 和哉;久保田 修平;Kimitaka Asatani;磯沼 大;浅谷 公威;田中 和哉
  • 通讯作者:
    田中 和哉

磯沼 大的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('磯沼 大', 18)}}的其他基金

Bilevel Optimization for Training Generalizable Language Models
用于训练可推广语言模型的双层优化
  • 批准号:
    23K16940
  • 财政年份:
    2023
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists

相似海外基金

要求仕様書の自動要約ツールの開発と適用評価
需求规格自动汇总工具的开发与应用评估
  • 批准号:
    19K11907
  • 财政年份:
    2019
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Generative Summarization Based on Stepwise Extraction and Rewriting
基于逐步提取和重写的生成摘要
  • 批准号:
    19K20339
  • 财政年份:
    2019
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Study on Improving Performance of Natural Language Processing by Integrating Collocation Extraction and Deep Learning
搭配抽取与深度学习相结合提高自然语言处理性能的研究
  • 批准号:
    19K20333
  • 财政年份:
    2019
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Research on AI's reading comprehension of multimedia data for improving language proficiency
AI多媒体数据阅读理解提高语言能力研究
  • 批准号:
    18K11557
  • 财政年份:
    2018
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Text Personalization with Automatic Summarization and Text Simplification
通过自动摘要和文本简化实现文本个性化
  • 批准号:
    17K12738
  • 财政年份:
    2017
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了