Making Software FAIR: A machine-assisted workflow for the research software lifecycle
让软件公平:研究软件生命周期的机器辅助工作流程
基本信息
- 批准号:EP/Y036352/1
- 负责人:
- 金额:$ 15.7万
- 依托单位:
- 依托单位国家:英国
- 项目类别:Research Grant
- 财政年份:2024
- 资助国家:英国
- 起止时间:2024 至 无数据
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
A key issue hindering the discoverability, attribution and reusability of open research software is that its existence often remains hidden within the manuscript of research papers. For these resources to become first-class bibliographic records, they first need to be identified and subsequently registered with persistent identifiers (PIDs) to be made FAIR (Findable, Accessible, Interoperable and Reusable). To this day, much open research software fails to meet FAIR principles and software resources are mostly not explicitly linked from the manuscripts that introduced them or used them.This project will extend the capabilities of critical and widely used open scholarly infrastructures (CORE,Software Heritage, HAL) and tools (GROBID) operated by the consortium partners, delivering and deploying an effective solution for the management of the research software lifecycle, including: 1)ML-assisted identification of research software assets from within the manuscripts of scholarly papers, 2)validation of the identified assets by authors, 3) registration of software assets with PIDs and their archival. The solution will be optimised for deployment over open content available through the global network of open repositories aggregated by CORE (core.ac.uk), which constitutes with over 32 million full texts and250m+ metadata records from over 10k repositories currently the world's largest collection of open access documents. Our ML software for extraction and disambiguation of software assets will be realised as an extension of the state-of-the-art GROBID tool. We will build on established protocols, such as asOpenAIRE Guidelines v4.0, RIOXX v3 and Codemeta, to encode information about software assets and their links to research manuscripts establishing an interoperable and extensible workflow connecting open repositories (represented by HAL), aggregators (represented by CORE) and software archives(represented by Software Heritage). The efficacy of the developed tools and workflow will be validated in three use cases: 1) a life sciences demonstrator (for Europe PMC), 2) a multi-disciplinary demonstrator for institutional repositories (represented by HAL) and a 3) digital humanities case study (with links to DARIAH and EOSC).
阻碍开放研究软件的发现性,归因性和可重复使用性的一个关键问题是,其存在通常仍然隐藏在研究论文手稿中。为了使这些资源成为一流的书目记录,首先需要将它们识别为持久标识符(PID)并随后注册,以使其公平(可找到,可访问,可互操作和可重复使用)。直到今天,许多开放的研究软件仍未达到公平的原则和软件资源,主要尚未与介绍或使用它们的手稿明确联系。本项目将扩展关键和广泛使用的开放学术基础架构(核心,软件,软件,HAL)的关键和广泛使用的开放式学术基础架构的能力,并将其置于联盟部门的研究,并置于委员会,以提供既有群体,又有伙伴的委员会,有效地雇用了有效的工作,并有效地进行了工作,并有效地进行了工作。 1)从学术论文手稿中对研究软件资产的识别,2)作者验证确定资产的验证,3)用PID及其档案对软件资产进行注册。该解决方案将用于通过Core(Core.AC.UK)汇总的全球开放存储库网络的开放内容进行优化,该网络构成了超过3200万本完整文本,2000万+元数据的记录超过10K存储库,目前是全球最大的开放式访问文档收藏的10K存储库。我们用于提取和歧义软件资产的ML软件将被视为最先进的Grobid工具的扩展。我们将基于既定协议,例如Asopenaire指南V4.0,Rioxx V3和CodeMeta,以编码有关软件资产的信息及其与Software Connection Connections(由HAL)(由CORE)(由Core)和软件档案(由软件档案代表)(代表)(代表)(代表)组成的软件连接的互联工作流(由HAL代表)建立可互操作和可扩展的工作流程的链接。在三种用例中将验证开发的工具和工作流的功效:1)生命科学演示者(对于欧洲PMC),2)用于机构存储库的多学科演示者(由HAL代表HAL)和3)数字人文学科案例研究(与Dariah和Eosc的链接)。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Petr Knoth其他文献
Can we do better than Co-Citations? - Bringing Citation Proximity Analysis from idea to practice in research article recommendation
我们能比共同引用做得更好吗?
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
Petr Knoth;Anita Khadka - 通讯作者:
Anita Khadka
Quantifying the influence of Open Access on innovation and patents
量化开放获取对创新和专利的影响
- DOI:
10.12688/openreseurope.14680.1 - 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
N. Jahn;Thomas Klebel;David Pride;Petr Knoth;Tony Ross - 通讯作者:
Tony Ross
Semantic annotation of multilingual learning objects based on a domain ontology
基于领域本体的多语言学习对象语义标注
- DOI:
- 发表时间:
2009 - 期刊:
- 影响因子:0
- 作者:
Petr Knoth - 通讯作者:
Petr Knoth
VoMBaT: A Tool for Visualising Evaluation Measure Behaviour in High-Recall Search Tasks
VoMBaT:高召回率搜索任务中可视化评估测量行为的工具
- DOI:
- 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Wojciech Kusa;Aldo Lipani;Petr Knoth;A. Hanbury - 通讯作者:
A. Hanbury
Information Retrieval Evaluation in Knowledge Acquisition Tasks
知识获取任务中的信息检索评估
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
Yasin Ghafourian;Petr Knoth;A. Hanbury - 通讯作者:
A. Hanbury
Petr Knoth的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似国自然基金
位点特异性的糖肽鉴定软件的升级与运用
- 批准号:32371334
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
面向微服务架构软件的知识制导自适应机制研究
- 批准号:62372351
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
亚稳材料可合成性评估方法与软件
- 批准号:12374005
- 批准年份:2023
- 资助金额:53 万元
- 项目类别:面上项目
高吞吐低时延的多元LDPC码译码算法及其软件架构研究
- 批准号:62301029
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
深度学习中的流形优化问题:算法设计与求解软件包的开发
- 批准号:12301408
- 批准年份:2023
- 资助金额:30.00 万元
- 项目类别:青年科学基金项目
相似海外基金
Patient Derived Cancer Model (PDCM) Finder
患者衍生癌症模型 (PDCM) 查找器
- 批准号:
10260591 - 财政年份:2020
- 资助金额:
$ 15.7万 - 项目类别:
Open, interoperable, and configurable clinical decision support modules for OpenMRS, OpenEMR, and beyond
适用于 OpenMRS、OpenEMR 等的开放、可互操作且可配置的临床决策支持模块
- 批准号:
10609206 - 财政年份:2020
- 资助金额:
$ 15.7万 - 项目类别:
Patient Derived Cancer Model (PDCM) Finder
患者衍生癌症模型 (PDCM) 查找器
- 批准号:
10058856 - 财政年份:2020
- 资助金额:
$ 15.7万 - 项目类别: