表題構造分析と内容提示項目に基づく技術文書からの表題自動生成に関する研究

基于标题结构分析和内容呈现项的技术文档自动标题生成研究

基本信息

  • 批准号:
    14780292
  • 负责人:
  • 金额:
    $ 1.22万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
  • 财政年份:
    2002
  • 资助国家:
    日本
  • 起止时间:
    2002 至 2003
  • 项目状态:
    已结题

项目摘要

本研究では,対象を技術系論文と新聞記事に絞り,原文を言い換えたり,合成したりすることによって,表題を自動生成する手法を考案する.技術論文の表題には,ある種の構文的構造が存在し,多くの場合は名詞句となることが多いといわれる.研究代表者は,研究・開発の内容を具体的かつ簡潔に表現しなければならないという表題の性質に着目し,表題中にはいくつかの内容提示項目(研究の目的や対象,方法)が必須情報として含まれるべきである仮定する.また,重要文抽出に基づく生成手法では内容提示項目が含まれない可能性が高い.そこで,本文を形態素レベルでとらえることで,より小さな単位から表題を生成することが有効であると考えた.平成15年度は,学術論文から表題を自動生成する方法を考案した.まず,タイトルを生成するためのベースとなる重要文抽出法を考案した.提案手法は,定型表現と手掛り語,TF-IDFにより重要文を抽出する.実験により,約73%の精度で重要文を抽出することを示した.次に,抽出された重要文から内容提示項目(目的,方法,長所,対象,動作,形態,主旨)をベースにタイトルを生成する手法を考案した.提案手法は,「形態」要素を起点にして,必要な内容提示項目を係り受け情報を基に獲得する.提案手法の有効性を確認するために,2000-2002年度の情報処理学会自然言語処理研究会報告359件の論文概要から40件を無作為に抽出して,自動生成したタイトルを以下の指標で評価した.(1)タイトルとして成立する;(2)タイトルして許容できる;(3)タイトルとして物足りない;(4)タイトルとして成立しない.結果として,(1)のみ精度は約32%であったが,(2)まで含めると約73%の精度でタイトルが生成できることを確認した.以上の研究成果は,国際会議や年次大会などで報告した.今後は,重要文に頼らないタイトル生成法へも拡張し,提案した技術をより明確にアピールできるタイトルの自動生成を実現する.
在这项研究中,我们通过将主题缩小到技术论文和报纸文章,重新构成或综合原始文本来自动生成标题的方法。据说技术论文的标题中存在某种句法结构,在许多情况下,通常是名词短语。首席研究人员专注于标题的性质,这意味着必须以具体和简洁的方式表达研发的内容,并假定标题应包括几个内容演示项目(目的,主题,研究方法)作为基本信息。此外,基于提取重要句子的生成方法很可能不包括内容演示项。因此,我们认为,通过捕获词素级别的主文本来产生较小单元的标题将有效。在2003年,我们设计了一种自动从学术论文中生成标题的方法。首先,我们设计了一种提取重要句子作为生成标题的基础的方法。提出的方法使用标准表达式,提示单词和TF-IDF提取重要句子。我们通过大约73%的精度提取了重要的句子。然后,我们提出了一种基于内容演示项(客观,方法,优势,对象,行为,形式,目的)生成标题的方法。提出的方法从“表单”元素开始,并根据信息获取所需的内容演示项。为了确认所提出的方法的有效性,从2000 - 2002年信息处理协会的自然语言处理研究小组中的359篇论文的摘要中随机提取了40个结果,并使用以下指标评估了自动生成的标题。です。英语:(1)有效作为标题; (2)可以接受为标题; (3)作为标题并不令人满意; (4)它作为标题无效。结果,尽管(1)的准确性仅为32%,但最多包括在(2)中时,可以证实标题可以以约73%的精度生成。上述研究结果在国际会议和年度会议上进行了报道。将来,我们将扩展到不依赖重要句子的标题生成方法,并实现自动产生的头衔,可以更清楚地吸引提出的技术。

项目成果

期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
溝渕昭二, 安藤一秋: "暦法的な時間指示表現の意味表現形式"言語処理学会第10回年次大会発表論文集. 476-479 (2004)
Shoji Mizobuchi、Kazuaki Ando:“基于日历的时间指示表达式的语义表达形式”语言处理学会第十届年会记录476-479(2004)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
K.Ando, T.Yamasaki, N.Yamashita: "Internet-based Japanese Language Learning System for Handwriting Kanji Characters Beautifully"Proceedings of the International Conference on Computer in Education 2002(CD-ROM : ISBN 0-7695-1509-6). (2002)
K.Ando、T.Yamasaki、N.Yamashita:“基于互联网的日语学习系统,可漂亮地手写汉字”2002年国际计算机教育会议论文集(CD-ROM:ISBN 0-7695-1509-6)
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
安藤一秋, 新居雅也, 溝渕昭二: "論文概要からのタイトル自動生成の試み"言語処理学会第10回年次大会発表論文集. 269-272 (2004)
Kazuaki Ando、Masaya Arai、Shoji Mizobuchi:“尝试从论文摘要中自动生成标题”语言处理学会第十届年会记录269-272(2004)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
M.Shishibori, S.Tsuge, K.Ando, J.Aoe: "A Filtering Method Based on Multi-attribute Information"Proceedings of the International Conference on Information 2002. Vol.3. 160-165 (2002)
M.Shishibori、S.Tsuge、K.Ando、J.Aoe:“基于多属性信息的过滤方法”2002 年国际信息会议论文集。Vol.3。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Kazuaki Ando, Masami Shishibori, Jun-ichi Aoe: "Analysis of Author's Keywords and Automatic Japanese Keyword Generation"Proceedings of the International Conference on Computer Processing of Oriental Languages 2003. 378-384 (2003)
Kazuaki Ando、Masami Shishibori、Jun-ichi Aoe:“作者关键词分析和自动日语关键词生成”2003 年东方语言计算机处理国际会议论文集。378-384 (2003)
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

安藤 一秋其他文献

子供向け日本語換言コーパス構築のための文間類似度計算法の評価
儿童日语释义语料库构建的句间相似度计算方法评价
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    西山 朋貴;安藤 一秋
  • 通讯作者:
    安藤 一秋
Webニュースからの課題作成支援に向けたNIEワークシートの分析
分析 NIE 工作表以支持从网络新闻创建作业
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    西山 朋貴;安藤 一秋;國方 海秀,安藤 一秋
  • 通讯作者:
    國方 海秀,安藤 一秋
Google Web APIs を利用した英文作成支援ツール
使用 Google Web API 的英语写作支持工具
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    綱嶋 祐一;安藤 一秋
  • 通讯作者:
    安藤 一秋

安藤 一秋的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('安藤 一秋', 18)}}的其他基金

NIEを実践する小学校教師のためのNIEワークシート用の記事選択と問題検討の支援
支持小学教师练习 NIE 的 NIE 工作表的文章选择和问题考虑
  • 批准号:
    22K12294
  • 财政年份:
    2022
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
WWWと自然言語処理技術・資源を活用した英文作成支援ツールの構築
利用WWW和自然语言处理技术/资源构建英语写作支持工具
  • 批准号:
    16700562
  • 财政年份:
    2004
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
効率的な多属性情報検索アルゴリズムの考案と応用
高效多属性信息检索算法的开发与应用
  • 批准号:
    98J01348
  • 财政年份:
    1998
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows

相似海外基金

技術継承に資する技術文書の検索・要約・可視化に関する検討
有助于技术传承的技术文献的检索、总结、可视化研究
  • 批准号:
    24K15084
  • 财政年份:
    2024
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Development of e-Learning System to Exercise Summarizing Essays
开发练习总结论文的电子学习系统
  • 批准号:
    23K02645
  • 财政年份:
    2023
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Abstractive Neural Multi-document Summarization Considering Cross Document Structure
考虑跨文档结构的抽象神经多文档摘要
  • 批准号:
    21H03495
  • 财政年份:
    2021
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
談話構造を用いた教師なし文書要約生成
使用话语结构的无监督文档摘要生成
  • 批准号:
    20J10726
  • 财政年份:
    2020
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
要求仕様書の自動要約ツールの開発と適用評価
需求规格自动汇总工具的开发与应用评估
  • 批准号:
    19K11907
  • 财政年份:
    2019
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了