Scholarly document analysis for data repository construction

数据存储库建设的学术文献分析

基本信息

  • 批准号:
    21H03773
  • 负责人:
  • 金额:
    $ 10.98万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
  • 财政年份:
    2021
  • 资助国家:
    日本
  • 起止时间:
    2021-04-01 至 2025-03-31
  • 项目状态:
    未结题

项目摘要

研究データリポジトリ構築の自動化は、オープンサイエンスの促進に効果的である。本研究では、学術論文データを活用した研究データ登録とそのためのメタデータ生成の実現性とその有用性を示すことを目的とする。二年目にあたる今年度は、昨年度整備した論文テキストデータを用いて、(1)論文におけるURLによる引用の多次元分類、及び、(2)メタデータ情報の論文テキストからの抽出、の項目の研究を推進した。(1)論文における研究データの引用を識別・解析することは、研究データリポジトリの拡充や研究データの検索・推薦・評価などにつながる。論文におけるURL引用の多くが研究データを参照している。そこで本研究ではそのような引用に対し、参照先リソースが研究で果たす役割、URLで参照するリソースの種類、および、著者が引用した理由に関する分類問題に取り組んだ。提案する手法では従来手法のフレームワークに、節タイトルや脚注の文を入力素性として追加した。データセットを作成し、国際会議論文を用いた分類実験の結果、提案手法の有効性を確認した。(2)研究データリポジトリの効率的な拡充を目的に、研究資源のメタデータに関する情報を学術論文から抽出する手法を検討した。具体的には、論文テキストに出現するエンティティ及びそれらの間の関係を抽出し、エンティティを節点、関係を有向辺とする知識グラフを獲得する仕組みを開発した。論文データを用いて構築した知識グラフを用いて、既存のメタデータリポジトリにおけるメタデータ及びエントリの拡充可能性を実験的に検証した。実験の結果、既存のメタデータに対する新たな情報の追加可能性、ならびに、研究資源を示すエンティティを識別するニューラルモデルによる研究資源エントリの拡充可能性を確認した.
自动化研究数据存储库构建有效地促进开放科学。这项研究旨在证明使用学术论文数据以及为此目的的元数据生成研究数据注册的可行性和实用性。今年,第二年,我们使用了去年准备的纸质文本数据来促进对以下项目的研究:(1)通过论文中的URL对引用的多维分类,以及(2)从纸质文本中提取元数据信息。 (1)识别和分析论文中的研究数据引用可以导致扩大研究数据存储库以及搜索,建议和研究数据的评估。本文中的许多URL引用是指研究数据。因此,本研究解决了有关参考资源在研究中扮演的角色的分类问题,URL中引用的资源类型以及引用作者的原因。所提出的方法已将子句标题和脚注句子作为输入特征添加到常规方法的框架中。创建了一个数据集,并确认使用国际会议讨论的分类实验结果确认了该方法的有效性。 (2)为了有效地扩展研究数据存储库,我们研究了一种从学术论文中提取有关研究资源元数据的信息的方法。具体来说,我们开发了一种机制,用于提取出现在纸质文本及其关系中的实体,并以指示边缘作为节点和关系获得知识图。使用使用纸数据构建的知识图,我们实验验证了扩展元数据和现有元数据存储库中条目的可能性。该实验证实了将新信息添加到现有元数据中的可能性,以及使用识别代表研究资源的实体的神经模型扩展研究资源条目的可能性。

项目成果

期刊论文数量(8)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Using Citation Contexts in Scholarly Papers for Research Data Search
使用学术论文中的引文上下文进行研究数据搜索
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Masaya Tsunokake;Shigeki Matsubara
  • 通讯作者:
    Shigeki Matsubara
中間タスクの挿入による学術論文におけるURL引用の分類
通过插入中间任务对学术论文中的 URL 引用进行分类
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yasutomo Kimura;Hideyuki Shibuki;Hokuto Ototake;Yuzu Uchida;Keiichi Takamaru;Madoka Ishioroshi;Kazuma Kadowaki;Masaharu Yoshioka;Tomoyosi Akiba;Yasuhiro Ogawa;Minoru Sasaki;Ken-Ichi Yokote;Tatsunori Mori;Kenji Araki;Teruko Mitamura;Satoshi ;和田和浩,松原茂樹
  • 通讯作者:
    和田和浩,松原茂樹
Classification of URLs Citing Research Artifacts in Scholarly Documents based on Distributed Representations
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Masaya Tsunokake;S. Matsubara
  • 通讯作者:
    Masaya Tsunokake;S. Matsubara
Extracting Information about Research Resources from Scholarly Papers
从学术论文中提取有关研究资源的信息
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ayahito Saji;Shigeki Matsubara
  • 通讯作者:
    Shigeki Matsubara
Classification of URL Citations in Scholarly Papers for Promoting Utilization of Research Artifacts
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Masaya Tsunokake;S. Matsubara
  • 通讯作者:
    Masaya Tsunokake;S. Matsubara
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

松原 茂樹其他文献

漸進的係り受け解析結果を用いた講演文への逐次的な改行挿入
使用渐进依赖性分析结果将顺序换行符插入讲座文本
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    高橋 晨成;大野 誠寛;松原 茂樹
  • 通讯作者:
    松原 茂樹
BERTを用いた日本語文のボトムアップ語順整序とその評価
使用 BERT 进行日语句子自下而上的词序及其评估
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    山添 壮登;大野 誠寛;松原 茂樹
  • 通讯作者:
    松原 茂樹
トポロジカルソートとBERTを用いた日本語文の語順整序
使用拓扑排序和 BERT 对日语句子进行词序排序
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    孫 鵬;大野 誠寛;松原 茂樹
  • 通讯作者:
    松原 茂樹
残存文長を考慮した講演テキストへの改行挿入
考虑剩余句子长度,在讲座文本中插入换行符
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    岩村 由香;大野 誠寛;松原 茂樹
  • 通讯作者:
    松原 茂樹
人間の漸進的言語処理能力の分析
人类渐进语言处理能力分析
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    後藤 亮;大野 誠寛;松原 茂樹
  • 通讯作者:
    松原 茂樹

松原 茂樹的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('松原 茂樹', 18)}}的其他基金

研究データリポジトリの構築に向けた学術論文テキストの解析と利用
分析和使用学术论文文本来构建研究数据存储库
  • 批准号:
    23K21844
  • 财政年份:
    2024
  • 资助金额:
    $ 10.98万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
障害者の活動拠点の整備による地域コミュニティの持続可能性に関する研究
通过发展残疾人活动中心研究当地社区的可持续性
  • 批准号:
    23K04194
  • 财政年份:
    2023
  • 资助金额:
    $ 10.98万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Contribution Measurement of Cited Literatures in Scholarly Papers: Towards a New Method for Literature Evaluation
学术论文中引用文献的贡献测量:迈向文献评价的新方法
  • 批准号:
    23K18506
  • 财政年份:
    2023
  • 资助金额:
    $ 10.98万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
音声対話システムの個性化に関する基礎的研究
口语对话系统个性化基础研究
  • 批准号:
    21650028
  • 财政年份:
    2009
  • 资助金额:
    $ 10.98万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
大規模音声言語コーパスを用いた独話文の統計的係り受け解析技術の開発
基于大规模口语语料库的独白句统计依存分析技术开发
  • 批准号:
    17700148
  • 财政年份:
    2005
  • 资助金额:
    $ 10.98万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
大規模音声言語対訳コーパスを用いた同時的な対話翻訳手法の開発とその評価
使用大规模双语口语语料库的同声对话翻译方法的开发和评估
  • 批准号:
    15700127
  • 财政年份:
    2003
  • 资助金额:
    $ 10.98万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
英語講演の同時通訳システムの実現に関する研究
英语讲座同声传译系统的实现研究
  • 批准号:
    13780278
  • 财政年份:
    2001
  • 资助金额:
    $ 10.98万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
同時通訳システムの実現を目指した日英話し言葉翻訳に関する研究
以实现同声传译系统为目标的日英口语翻译研究
  • 批准号:
    11780261
  • 财政年份:
    1999
  • 资助金额:
    $ 10.98万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

Collaborative Research: URoL:ASC: Determining the relationship between genes and ecosystem processes to improve biogeochemical models for nutrient management
合作研究:URoL:ASC:确定基因与生态系统过程之间的关系,以改进营养管理的生物地球化学模型
  • 批准号:
    2319123
  • 财政年份:
    2024
  • 资助金额:
    $ 10.98万
  • 项目类别:
    Standard Grant
Collaborative Research: Fusion of Siloed Data for Multistage Manufacturing Systems: Integrative Product Quality and Machine Health Management
协作研究:多级制造系统的孤立数据融合:集成产品质量和机器健康管理
  • 批准号:
    2323083
  • 财政年份:
    2024
  • 资助金额:
    $ 10.98万
  • 项目类别:
    Standard Grant
異種オープンデータ活用のためのデータ統合・管理基盤の研究開発
利用异构开放数据的数据集成和管理基础设施的研究和开发
  • 批准号:
    23K21726
  • 财政年份:
    2024
  • 资助金额:
    $ 10.98万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
データセントリックな信頼志向データ流通管理の研究
以数据为中心的面向信任的数据分发管理研究
  • 批准号:
    24K03045
  • 财政年份:
    2024
  • 资助金额:
    $ 10.98万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Collaborative Research: URoL:ASC: Determining the relationship between genes and ecosystem processes to improve biogeochemical models for nutrient management
合作研究:URoL:ASC:确定基因与生态系统过程之间的关系,以改进营养管理的生物地球化学模型
  • 批准号:
    2319124
  • 财政年份:
    2024
  • 资助金额:
    $ 10.98万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了