Making Software FAIR: A machine-assisted workflow for the research software lifecycle
让软件公平:研究软件生命周期的机器辅助工作流程
基本信息
- 批准号:EP/Y036352/1
- 负责人:
- 金额:$ 15.7万
- 依托单位:
- 依托单位国家:英国
- 项目类别:Research Grant
- 财政年份:2024
- 资助国家:英国
- 起止时间:2024 至 无数据
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
A key issue hindering the discoverability, attribution and reusability of open research software is that its existence often remains hidden within the manuscript of research papers. For these resources to become first-class bibliographic records, they first need to be identified and subsequently registered with persistent identifiers (PIDs) to be made FAIR (Findable, Accessible, Interoperable and Reusable). To this day, much open research software fails to meet FAIR principles and software resources are mostly not explicitly linked from the manuscripts that introduced them or used them.This project will extend the capabilities of critical and widely used open scholarly infrastructures (CORE,Software Heritage, HAL) and tools (GROBID) operated by the consortium partners, delivering and deploying an effective solution for the management of the research software lifecycle, including: 1)ML-assisted identification of research software assets from within the manuscripts of scholarly papers, 2)validation of the identified assets by authors, 3) registration of software assets with PIDs and their archival. The solution will be optimised for deployment over open content available through the global network of open repositories aggregated by CORE (core.ac.uk), which constitutes with over 32 million full texts and250m+ metadata records from over 10k repositories currently the world's largest collection of open access documents. Our ML software for extraction and disambiguation of software assets will be realised as an extension of the state-of-the-art GROBID tool. We will build on established protocols, such as asOpenAIRE Guidelines v4.0, RIOXX v3 and Codemeta, to encode information about software assets and their links to research manuscripts establishing an interoperable and extensible workflow connecting open repositories (represented by HAL), aggregators (represented by CORE) and software archives(represented by Software Heritage). The efficacy of the developed tools and workflow will be validated in three use cases: 1) a life sciences demonstrator (for Europe PMC), 2) a multi-disciplinary demonstrator for institutional repositories (represented by HAL) and a 3) digital humanities case study (with links to DARIAH and EOSC).
阻碍开放研究软件的可发现性、归属和可重用性的一个关键问题是,它的存在通常隐藏在研究论文的手稿中。为了使这些资源成为一流的书目记录,首先需要对它们进行识别,然后使用持久标识符(PID)进行注册,使其成为 FAIR(可查找、可访问、可互操作和可重用)。迄今为止,许多开放研究软件未能满足公平原则,并且软件资源大多没有与介绍它们或使用它们的手稿明确链接。该项目将扩展关键且广泛使用的开放学术基础设施(CORE、软件遗产)的功能、HAL)和由联盟合作伙伴运营的工具(GROBID),提供和部署用于管理研究软件生命周期的有效解决方案,包括:1)机器学习辅助识别学术论文手稿中的研究软件资产, 2) 作者验证已识别的资产,3) 使用 PID 注册软件资产及其存档。该解决方案将针对通过 CORE (core.ac.uk) 聚合的全球开放存储库网络提供的开放内容进行部署进行优化,该网络包含来自超过 10,000 个存储库的超过 3,200 万条全文和 2.5 亿多个元数据记录,目前是世界上最大的存储库集合。开放获取文档。我们用于软件资产提取和消歧的 ML 软件将作为最先进的 GROBID 工具的扩展来实现。我们将建立在既定协议的基础上,例如OpenAIREGuidelines v4.0、RIOXX v3和Codemeta,对有关软件资产及其与研究手稿的链接的信息进行编码,建立一个连接开放存储库(以HAL为代表)、聚合器(以HAL为代表)的可互操作和可扩展的工作流程由 CORE 代表)和软件档案(由 Software Heritage 代表)。所开发工具和工作流程的有效性将在三个用例中得到验证:1)生命科学演示器(针对欧洲 PMC),2)机构存储库的多学科演示器(以 HAL 为代表)和 3)数字人文案例研究(链接到 DARIAH 和 EOSC)。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Petr Knoth其他文献
What Others Say About This Work? Scalable Extraction of Citation Contexts from Research Papers
其他人对这项工作有何评价?
- DOI:
10.1007/978-3-319-67008-9_23 - 发表时间:
2017-09-17 - 期刊:
- 影响因子:0
- 作者:
Petr Knoth;Phil Gooch;Kris Jack - 通讯作者:
Kris Jack
KMI, The Open University at NTCIR-9 CrossLink: Cross-Lingual Link Discovery in Wikipedia Using Explicit Semantic Analysis
KMI,NTCIR-9 开放大学 CrossLink:使用显式语义分析在维基百科中发现跨语言链接
- DOI:
- 发表时间:
2024-09-14 - 期刊:
- 影响因子:0
- 作者:
Petr Knoth;Lukás Zilka;Z. Zdráhal - 通讯作者:
Z. Zdráhal
Visual Search for Supporting Content Exploration in Large Document Collections
支持大型文档集合中内容探索的视觉搜索
- DOI:
10.1045/july2012-herrmannova - 发表时间:
2012-07-01 - 期刊:
- 影响因子:0
- 作者:
Drahomira Herrmannova;Petr Knoth - 通讯作者:
Petr Knoth
Do Authors Deposit on Time? Tracking Open Access Policy Compliance
作者按时存款吗?
- DOI:
10.1109/jcdl.2019.00037 - 发表时间:
2019-06-01 - 期刊:
- 影响因子:0
- 作者:
Drahomira Herrmannova;Nancy Pontika;Petr Knoth - 通讯作者:
Petr Knoth
A meta-analysis of semantic classification of citations
引文语义分类的荟萃分析
- DOI:
10.1162/qss_a_00159 - 发表时间:
2021-10-08 - 期刊:
- 影响因子:6.4
- 作者:
Suchetha Nambanoor Kunnath;Drahomira Herrmannova;Petr Knoth - 通讯作者:
Petr Knoth
Petr Knoth的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似国自然基金
价值视角下软件服务生态系统治理体系和关键技术
- 批准号:62372323
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
自适应软件系统中人在回路的搜索式性能保障研究
- 批准号:62372084
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
基于编译器多级中间表示的跨语言开源软件漏洞检测与修复方法研究
- 批准号:62372373
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
通用高性能粒子径迹重建软件开发及基于GPU加速的径迹重建研究
- 批准号:12375194
- 批准年份:2023
- 资助金额:52 万元
- 项目类别:面上项目
基于仿真的嵌入式控制软件设计模型与需求模型之间一致性分析方法
- 批准号:62372181
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
相似海外基金
Patient Derived Cancer Model (PDCM) Finder
患者衍生癌症模型 (PDCM) 查找器
- 批准号:
10058856 - 财政年份:2020
- 资助金额:
$ 15.7万 - 项目类别:
Open, interoperable, and configurable clinical decision support modules for OpenMRS, OpenEMR, and beyond
适用于 OpenMRS、OpenEMR 等的开放、可互操作且可配置的临床决策支持模块
- 批准号:
10609206 - 财政年份:2020
- 资助金额:
$ 15.7万 - 项目类别:
Patient Derived Cancer Model (PDCM) Finder
患者衍生癌症模型 (PDCM) 查找器
- 批准号:
10456865 - 财政年份:2020
- 资助金额:
$ 15.7万 - 项目类别: