Web上のテキストデータを対象とした複数テキスト要約に関する研究

网络文本数据的多文本摘要研究

基本信息

  • 批准号:
    14019036
  • 负责人:
  • 金额:
    $ 4.22万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
  • 财政年份:
    2002
  • 资助国家:
    日本
  • 起止时间:
    2002 至 无数据
  • 项目状态:
    已结题

项目摘要

近年インターネットの普及により,Web上に大量のテキストが満ち溢れ,情報洪水という言葉がしばしば使われる.このため,ユーザがWebから情報を収集するのを支援する技術が求められている.本研究では,大規模でかつ分散したテキストデータを統合し,より利用し易い形式に加工することを目指した,Web上の複数テキストを対象にした自動要約とそれを利用した知的情報統合に関する技術の開発を行なう.一般に複数テキストを対象にした自動要約では,要約対象のテキスト集合の収集が要約の前段階として必要であり,また,どのようなテキスト集合を要約対象とするかで,要約の手法も異なる可能性がある.そこで本研究では,(1)具体的な人物,もの,場所などを主題とするテキスト集合からの要約作成,(2)より一般的なテキスト集合(たとえば,現在上映されている映画に関するページ集合)を対象とする要約作成の2つに区分し,これらをこの順に扱う.14年度ではまず,(1)人物,もの,場所などに関するテキスト集合からの自動要約として,人物に関する伝記(biography)作成を実現した.その要素技術として,該当するテキストのみをWeb上から収集する技術,それらのテキスト集合から,テキストの内容の質により適切なテキストのみを選択する技術,選択したテキスト集合から,要約に含めるべき重要個所を抽出する技術,さらに,類似の情報を含む複数のテキストが存在することによる冗長性の問題に対処するため,冗長な個所(テキスト間の共通個所)を検出し削除する技術からなる要約技術を開発した.
近年来,随着互联网的普及,大量的文本充斥着Web,人们经常使用“信息洪水”这个词。因此,需要一种支持用户从Web收集信息的技术。在这项研究中,对Web上的多个文本进行自动摘要,旨在整合大规模且分散的文本数据,并将其处理成更易于使用的格式。我们将开发与智能信息集成相关的技术,摘要方法可能会根据摘要的内容而有所不同,因此,在本研究中,我们重点关注(1)从一组关注特定人物、事物、地点的文本创建摘要。 ETC。; )我们将一个更一般的文本集(例如,一组关于当前正在放映的电影的页面)分为两类,并且我们将按这个顺序处理这些,我们已经实现了自动创建关于一个人的传记。从有关地点等的文本集合中进行摘要。作为一项基本技术,只能从网络上检索相关文本。收集文本的技术、根据文本集中文本内容的质量仅选择适当文本的技术、从所选文本集中提取要包含在摘要中的重要部分的技术以及提取包含相似信息的多个文本的技术为了处理由于多个文本的存在而导致的冗余问题,我们开发了一种摘要技术,可以检测并删除冗余部分(文本之间的公共部分)。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

奥村 学其他文献

対話型意見収集システムの評価方法の検討
交互式意见收集系统评价方法的思考
Automatic Extraction of Travel Blog Entries
自动提取旅游博客条目
  • DOI:
    10.18996/kenkyu2016390305
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    藤井 一輝;難波 英嗣;竹澤 寿幸;石野 亜耶;奥村 学;倉田 洋平;石野 亜耶
  • 通讯作者:
    石野 亜耶
複数のソーシャルメディアアカウントの関連付け防止システムの構築
建立防止多个社交媒体帐户关联的系统
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    木原 裕二;笹野 遼平;高村 大也;奥村 学
  • 通讯作者:
    奥村 学
埒外の生態学にむけて―寄生と依存が生み出す社会
走向国界之外的生态:一个由寄生和依赖创造的社会
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    曹 国林;高村 大也;奥村 学;佐藤洋一郎;内藤直樹
  • 通讯作者:
    内藤直樹
分散表現による語義曖昧性解消の領域適応
使用分布式表示的词义消歧领域适应
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    鈴木 翔太;古宮 嘉那子;佐々木 稔;新納 浩幸;奥村 学
  • 通讯作者:
    奥村 学

奥村 学的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('奥村 学', 18)}}的其他基金

大規模事前学習モデルを活用した生成型複数テキスト要約に関する研究
使用大规模预训练模型的生成式多文本摘要研究
  • 批准号:
    24K02997
  • 财政年份:
    2024
  • 资助金额:
    $ 4.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Abstractive Neural Multi-document Summarization Considering Cross Document Structure
考虑跨文档结构的抽象神经多文档摘要
  • 批准号:
    21H03495
  • 财政年份:
    2021
  • 资助金额:
    $ 4.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
日タイブログを対象とした多観点言語横断ブログ検索
针对日语和泰语博客的多语言跨语言博客搜索
  • 批准号:
    08F08365
  • 财政年份:
    2008
  • 资助金额:
    $ 4.22万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
対話に基づく意見収集・分析システムの構築に向けて
构建基于对话的意见收集与分析体系
  • 批准号:
    18650031
  • 财政年份:
    2006
  • 资助金额:
    $ 4.22万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
blog上の意見分析のためのblogへの属性付与
为博客添加属性以进行博客观点分析
  • 批准号:
    18049025
  • 财政年份:
    2006
  • 资助金额:
    $ 4.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
検索結果の知的提示手法に関する研究
搜索结果智能呈现方法研究
  • 批准号:
    05F05281
  • 财政年份:
    2005
  • 资助金额:
    $ 4.22万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
情報に対する注目と価値判断のモデル化
建模对信息和价值判断的关注
  • 批准号:
    15650022
  • 财政年份:
    2003
  • 资助金额:
    $ 4.22万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
仮想世界のキャラクタを用いた動作生成と身体的理解の研究
使用虚拟世界角色进行动作生成和物理理解的研究
  • 批准号:
    02F00607
  • 财政年份:
    2002
  • 资助金额:
    $ 4.22万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
自然言語処理技術を応用した外国語自習支援システムに関する研究
应用自然语言处理技术的外语自学支持系统研究
  • 批准号:
    12040217
  • 财政年份:
    2000
  • 资助金额:
    $ 4.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas (A)
談話情報付きコーパスの構築とそれを用いた談話解析に関する研究
语篇信息语料库构建及语篇分析研究
  • 批准号:
    08837009
  • 财政年份:
    1996
  • 资助金额:
    $ 4.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)

相似海外基金

知覚的意識の生起における高次過程および感覚情報統合の役割
高阶过程和感觉信息整合在知觉意识生成中的作用
  • 批准号:
    24K16878
  • 财政年份:
    2024
  • 资助金额:
    $ 4.22万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
時間知覚に寄与する文脈的情報統合過程の研究
有助于时间感知的情境信息整合过程研究
  • 批准号:
    22KJ2370
  • 财政年份:
    2023
  • 资助金额:
    $ 4.22万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
時間間隔知覚における多感覚情報統合過程とその脳内機序の解明
时间间隔知觉中多感官信息整合过程及其脑机制的阐明
  • 批准号:
    22KJ0456
  • 财政年份:
    2023
  • 资助金额:
    $ 4.22万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Categorical and Higher-Categorical Approaches to Duality and Semantics across Mathematics, Physics, and Information
跨数学、物理和信息的二元性和语义的分类和更高分类方法
  • 批准号:
    17K14231
  • 财政年份:
    2021
  • 资助金额:
    $ 4.22万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
財務と非財務の統合報告に向けた企業と投資者の認知プロセスに関する実験・実証研究
公司和投资者对综合财务和非财务报告认知过程的实验和实证研究
  • 批准号:
    21K01783
  • 财政年份:
    2021
  • 资助金额:
    $ 4.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了