A software tool to facilitate variable-level equivalency and harmonization in research data: Leveraging the NIH Common Data Elements Repository to link concepts and measures in an open format
促进研究数据中变量级别等效性和协调性的软件工具:利用 NIH 通用数据元素存储库以开放格式链接概念和测量
基本信息
- 批准号:10821517
- 负责人:
- 金额:$ 27.55万
- 依托单位:
- 依托单位国家:美国
- 项目类别:
- 财政年份:2023
- 资助国家:美国
- 起止时间:2023-09-18 至 2024-08-31
- 项目状态:已结题
- 来源:
- 关键词:AgingAlgorithmic AnalysisAlgorithmsAlzheimer&aposs disease related dementiaArchivesCharacteristicsCollectionCommon Data ElementComputer softwareDataData Coordinating CenterData ElementData FilesData SetData SourcesDatabasesDevelopmentDocumentationEffectivenessEnvironmentFAIR principlesFundingIndividualLibrariesLinkMachine LearningManualsMapsMeasuresMeta-AnalysisMetadataModelingMorphologic artifactsNational Institute on AgingOutcomeOutputPainPhaseProcessPublic HealthQuestionnairesRecommendationResearchResearch PersonnelResourcesSoftware ToolsSourceStandardizationStructureTechnologyTestingTextTimeUnited StatesUnited States National Institutes of Healthaging populationartificial intelligence algorithmcostdata harmonizationdata managementdata reductiondata sharinghuman-in-the-loopindividual variationinteroperabilitymetadata standardsmultidisciplinarymultiple datasetsprototyperepositorytooltool development
项目摘要
Abstract
The National Institute on Aging (NIA) supports numerous studies and archives that collect and disseminate
critical data about the aging population of the United States. By supporting the collection and dissemination of
longitudinal and multidisciplinary data, the NIA provides researchers the opportunity to measure change and
stability in individuals over time, as well as to investigate aging phenomena from an integrated theoretical
perspective. In both cases, equivalent or related variables must first be linked or merged before producing
appropriately documented data products for eventual harmonization and analysis. The current aging research
data environment provides many opportunities for linking similar topical datasets and harmonizing extant
common variables, but few software tools are available to facilitate this resource-intensive task. The proposed
project will demonstrate the feasibility of a guided harmonization software prototype by concording variables
from three nationally representative NIA-funded studies (MIDUS, NHATS, NSHAP) and mapping them against
extant data element concept sources such as the NIH Common Data Elements library to identify equivalent
concepts and variables. The software prototype will use machine learning and advanced text analysis
algorithms to guide the creation of concorded databases (variable crosswalks) that support harmonization and
discoverability, both within and across aging-related statistical datasets.
Additionally, the prototype will use an open-standards metadata framework to produce richly-described
concordance databases that are interoperable, citable and FAIR. Colectica has a track record of creating open-
standards based software tools that reduce data management burden by automatically extracting structured
metadata from macro-level (study) and micro-level (variable) characteristics of aging studies. Specifically, the
prototype will evaluate the feasibility of human-in-the-loop algorithms to operate as a “recommendation engine”
to guide the concordance of potentially equivalent or similar variables among multiple datasets. The core
hypothesis posits that the prototype will significantly decrease the labor, time, and resources required to create
accurate and standardized concorded databases. To test this hypothesis, the research team will: construct and
evaluate recommendation algorithms for variable concordance (Aim 1); establish metrics for measuring the
accuracy and effectiveness of concordance (Aim 2); and create a user interface to test the recommendation
engine, its functions, and associated inputs and outputs (Aim 3).
抽象的
国家老龄化研究所 (NIA) 支持大量研究和档案,收集和传播
有关美国人口老龄化的关键数据 通过支持收集和传播
纵向和多学科数据,NIA 为研究人员提供了衡量变化和
个体随时间的稳定性,以及从综合理论研究衰老现象
在这两种情况下,在生成之前必须首先链接或合并等效或相关变量。
适当记录的数据产品,用于最终协调和分析当前的老龄化研究。
数据环境为链接相似的主题数据集和协调现有数据集提供了许多机会
常见的变量,但很少有软件工具可用于完成这项资源密集型任务。
项目将通过协调变量来证明引导协调软件原型的可行性
来自 NIA 资助的三项具有全国代表性的研究(MIDUS、NHATS、NSHAP)并将其与
现有的数据元素概念来源,例如 NIH 通用数据元素库,用于识别等效项
该软件原型将使用机器学习和高级文本分析。
指导创建一致数据库(可变人行横道)的算法,以支持协调和
与衰老相关的统计数据集内部和之间的可发现性。
此外,该原型将使用开放标准元数据框架来生成描述丰富的
Colectica 具有创建开放式索引数据库的良好记录。
基于标准的软件工具,通过自动提取结构化数据来减轻数据管理负担
元数据来自老龄化研究的宏观层面(研究)和微观层面(变量)特征。
原型将评估人机循环算法作为“推荐引擎”运行的可行性
指导多个数据集中潜在等效或相似变量的一致性。
假设假设原型将显着减少创建所需的劳动力、时间和资源
为了检验这一假设,研究团队将: 构建并建立一致的数据库。
评估变量一致性的推荐算法(目标 1);建立衡量变量一致性的指标;
一致性的准确性和有效性(目标 2);并创建一个用户界面来测试推荐
引擎、其功能以及相关的输入和输出(目标 3)。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Dan Smith其他文献
Dan Smith的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Dan Smith', 18)}}的其他基金
Open Standards-Based Data Extraction Web Tool for Complex Longitudinal Datasets
用于复杂纵向数据集的基于开放标准的数据提取 Web 工具
- 批准号:
8123227 - 财政年份:2011
- 资助金额:
$ 27.55万 - 项目类别:
相似国自然基金
基于融合智能算法的泵阀管网水力系统逆瞬变分析及泄漏辨识研究
- 批准号:52379095
- 批准年份:2023
- 资助金额:51 万元
- 项目类别:面上项目
基于图结构分析的全对偶整数性及算法研究
- 批准号:12371318
- 批准年份:2023
- 资助金额:43.5 万元
- 项目类别:面上项目
纠正擦除错误的线性码的译码算法和性能分析
- 批准号:62371259
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
心脏再生复杂动态系统的空间单细胞组学分析算法研究
- 批准号:62372209
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
随机密度泛函理论的算法设计和分析
- 批准号:12371431
- 批准年份:2023
- 资助金额:43.5 万元
- 项目类别:面上项目
相似海外基金
Shape-based personalized AT(N) imaging markers of Alzheimer's disease
基于形状的个性化阿尔茨海默病 AT(N) 成像标记
- 批准号:
10667903 - 财政年份:2023
- 资助金额:
$ 27.55万 - 项目类别:
An acquisition and analysis pipeline for integrating MRI and neuropathology in TBI-related dementia and VCID
用于将 MRI 和神经病理学整合到 TBI 相关痴呆和 VCID 中的采集和分析流程
- 批准号:
10810913 - 财政年份:2023
- 资助金额:
$ 27.55万 - 项目类别:
DementiaBank: An open access language database to understand the progression of dementia
DementiaBank:一个开放获取的语言数据库,用于了解痴呆症的进展
- 批准号:
10738863 - 财政年份:2023
- 资助金额:
$ 27.55万 - 项目类别:
Sugar Probed SRS Volumetric imaging of Metabolic Activities
代谢活动的糖探针 SRS 体积成像
- 批准号:
10639208 - 财政年份:2023
- 资助金额:
$ 27.55万 - 项目类别:
Multi-modal Tracking of In Vivo Skeletal Structures and Implants
体内骨骼结构和植入物的多模式跟踪
- 批准号:
10367144 - 财政年份:2022
- 资助金额:
$ 27.55万 - 项目类别: