技術文書中の画像と説明文の対応付けによる知識体系の構築

通过关联技术文档中的图像和解释性文本来构建知识体系

基本信息

  • 批准号:
    22K12154
  • 负责人:
  • 金额:
    $ 2.66万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2022
  • 资助国家:
    日本
  • 起止时间:
    2022-04-01 至 2025-03-31
  • 项目状态:
    未结题

项目摘要

幅広い分野の一連の手続きに関する知識をテキストから自動抽出し、それらを体系化することを目指している。2022年度は、(1)特許中の図表の自動分類、(2)自然言語文の構造解析、(3)多言語(日英中)上位下位関係の抽出に取り組んだ。(1)について、特許中に記載される図表画像の中からフローチャートを自動抽出することで、フローチャート画像とその説明文の11,188対から構成されるコーパスを構築した。このコーパスの有効性を確認するため、フローチャート画像からの説明文の自動生成を行った。説明文の生成では、フローチャート画像からGoogle Cloud Vision APIを用いて文字列を抽出し、この文字列から説明文を自動生成するために、Text-To-Text Transfer Transformer(T5)を用いて学習した。実験の結果、複雑な形状のフローチャートについては課題が残るものの、質の高い説明文が生成できることが確認できた。(2)について、米国特許を対象に、特許請求項から主要部、構成要素、手順に関する文字列を抽出する手法について検討した。抽出には、T5、Bi-LSTM-CRF、CRFを用いた。実験の結果、T5が最も優れており、特に再現率を大幅に改善できることがわかった。(3)について、リンク予測モデルによる日英中上位下位関係の自動抽出を行った。まず、GANを用いて上位下位関係にある用語を識別する。次に、前の手順で構築された上位下位関係のグラフに対し、ConvEとGraphSAGEを組み合わせたリンク予測を行い、本来であれば上位下位関係にあるべき欠落したエッジを予測する。提案手法の有効性を確認するために行った実験では、GANを用いた上位下位関係の識別およびConvEとGraphSAGEを組み合わせたリンク予測の両方において、提案手法が従来手法よりも優れていることがわかった。
目的是自动从文本中提取有关一系列过程的知识并将其系统化。在2022财政年度中,我们研究了(1)专利图表的自动分类,(2)自然语言句子的结构分析,以及(3)提取多语言(日语,英语和中文)高级关系。关于(1),通过从专利中描述的图表和图像中自动提取流程图,由11,188对流程图图像组成的语料库构建了一个及其描述。为了确认该语料库的有效性,从流程图图像中的描述自动生成。在生成描述时,使用Google Cloud Vision API从流程图图像中提取了一个字符串,为了自动从该字符串生成描述,使用文本转换变压器(T5)来学习。该实验证实,可以生成高质量的解释性文本,尽管与复杂形状的流程图仍然存在问题。关于(2),我们研究了一种从索赔中提取与主要部分,组成部分和程序相关的字符字符串的方法,该方法参考了美国专利。为了提取,使用T5,BI-LSTM-CRF和CRF。实验表明T5是最好的,并且可以显着改善回忆。关于(3),我们使用链接预测模型自动提取日语,英语和中文和低级关系。首先,使用GAN确定高级关系中的术语。接下来,在上一步中构建的上层和下部关系的图用于使用凸和图的组合预测链接,并且预测通常在上层和下部关系中的缺失边缘。进行的实验以确认提出的方法的有效性表明,在使用GAN鉴定上和下关系的情况下,提出的方法优于常规方法,并使用凸和图的组合进行了链接预测。

项目成果

期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
リンク予測モデルによる多言語上位下位関係の自動抽出
使用链接预测模型自动提取多语言上级关系
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    何 其歓,杉村 博,田中 哲雄,松本一教;高橋英明;高橋英明;Yao Gong,福田悟志,難波英嗣
  • 通讯作者:
    Yao Gong,福田悟志,難波英嗣
特許中のフローチャート画像からの説明文の自動生成
从专利流程图图像自动生成解释性文本
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    難波英嗣,久保翔平;福田悟志
  • 通讯作者:
    福田悟志
Analyzing the Structure of U.S. Patents Using Patent Families
使用专利族分析美国专利的结构
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Nakamitsu;J.;Fukuda;S.;and Nanba;H.
  • 通讯作者:
    H.
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

難波 英嗣其他文献

旅行者の購買行動プロセスに関連するツイートの自動抽出
自动提取旅客购买行为过程相关推文
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    藤村 雄偉;石野 亜耶;難波 英嗣;竹澤 寿幸
  • 通讯作者:
    竹澤 寿幸
旅行者の感情に基づいた観光スポット推薦
基于游客情绪的旅游景点推荐
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    篠田 広人;柴田 有基;難波 英嗣;石野 亜耶;竹澤 寿幸
  • 通讯作者:
    竹澤 寿幸
観光の形態に基づいた旅行ブログエントリの自動分類
根据旅游类型自动分类旅游博客条目
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    柴田 有基;篠田 広人;難波 英嗣;石野 亜耶;竹澤 寿幸
  • 通讯作者:
    竹澤 寿幸
レファレンス事例の分析による論文検索に効果的な要素の調査
通过分析参考例子研究文章搜索的有效要素
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中野幸二;堀内 潤;石松亮一;今任稔彦;出口弘;鈴木彼方,陽品駒,加瀬敬唯,尾形哲也;難波 英嗣
  • 通讯作者:
    難波 英嗣
観光の形態に基づいた旅行プランの自動生成
根据旅游类型自动生成出行计划
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    柴田 有基;難波 英嗣;石野 亜耶;竹澤 寿幸
  • 通讯作者:
    竹澤 寿幸

難波 英嗣的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('難波 英嗣', 18)}}的其他基金

文書集合の構造化に基づく効率的な情報アクセス技術の開発
基于文档集结构化的高效信息访问技术的开发
  • 批准号:
    16700151
  • 财政年份:
    2004
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
論文間の参照情報を考慮した学術論文要約システムの開発
考虑论文之间参考信息的学术论文摘要系统的开发
  • 批准号:
    01J11226
  • 财政年份:
    2001
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows

相似海外基金

フローチャートで表現できない証明の読解力・表現力を養成する指導法
一种培养阅读和表达无法用流程图表达的证明的能力的教学方法。
  • 批准号:
    24K05951
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
早期の発達軌道から神経発達の診断を予測するためのフローチャートの作成
创建流程图以根据早期发育轨迹预测神经发育诊断
  • 批准号:
    23K09720
  • 财政年份:
    2023
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
有事の医療現場にて日和見感染症抑止に絶大な効果を発揮するフローチャートの開発
开发在紧急医疗环境中预防机会性感染极其有效的流程图
  • 批准号:
    23K09484
  • 财政年份:
    2023
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
2週間の排便日誌から排便パターンを分類する新しい看護アセスメント方法の確立
建立一种新的护理评估方法,根据两周排便日记对排便模式进行分类
  • 批准号:
    22K10679
  • 财政年份:
    2022
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Development of a foot care protocol by visiting nurses for the elderly in home care
通过拜访护士为家庭护理老年人制定足部护理方案
  • 批准号:
    20K10983
  • 财政年份:
    2020
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了