Parameter-free Peak Detection Algorithm for Reducing False Positive/Negative Compound Identification from Raw Mass Spectrometry Metabolomics Data.
无参数峰检测算法,用于减少原始质谱代谢组学数据中的假阳性/阴性化合物鉴定。
基本信息
- 批准号:9433358
- 负责人:
- 金额:$ 13.67万
- 依托单位:
- 依托单位国家:美国
- 项目类别:
- 财政年份:2017
- 资助国家:美国
- 起止时间:2017-09-19 至 2019-10-31
- 项目状态:已结题
- 来源:
- 关键词:AddressAlgorithm DesignAlgorithmsBiologicalBypassChromatographyCollaborationsCommunitiesComputer softwareCoupledDataData FilesDetectionDevelopmentDimensionsDiseaseError SourcesEvaluationGas ChromatographyImageryIonsJavaLaboratoriesLeadLiquid substanceManualsMass Spectrum AnalysisMeasurementMeasuresMetabolismMorphologic artifactsNorth CarolinaProcessPythonsReference StandardsResearchResearch PersonnelResolutionSamplingScientistSerumSpecific qualifier valueSpecificityTherapeuticTimeTranslatingUniversitiesVendorWaterWorkbasebiomarker discoveryclinical biomarkerscomputerized data processingcostdesignexperimental studyflexibilityimprovedmetabolomicsmetabolomics resourcenovelopen sourceprototype
项目摘要
Project Summary / Abstract
Parameter-free Peak Detection Algorithm for Reducing False Positive/Negative Compound Identification from
Raw Mass Spectrometry Metabolomics Data
Mass spectrometry (MS) coupled to liquid or gas chromatography (LC or GC) have become indispensable analyt-
ical platforms for untargeted metabolomics. With sensitivity, chromatographic resolution, and mass measurement
accuracy continuously improving, more and more analytes are now detectable, and this has enormous potential to
lead to great strides in our understanding of metabolism. The first step in the preprocessing of raw LC- and GC-MS
metabolomics data is the detection and extraction of peaks that represent ions. However, existing peak detection
algorithms invariably yield an immense number of false positive and false negative peaks. These incorrect peaks
can translate downstream into spurious or missing compound identifications. Furthermore, a large number of
parameters must be specified for these algorithms to work. Unfortunately, general users often do not understand
how to optimize these parameters, and maximizing one aspect (e.g., sensitivity) often has deleterious effects
on another (e.g., specificity). To address the challenges, we propose a paradigm shift in the detection of peaks
by simultaneously considering the three dimension of an ion’s information. This will significantly increase the
accuracy of peak detection compared to what can be achieved by existing algorithms that carry out peak detection
by processing data in three separate 2D planes. The results of our proposed research will benefit metabolomics
research in multiple ways. (1) The more accurate algorithm will eliminate or reduce manual checking of results to
a minimum. (2) With the parameter-free design, researchers will not have to go through many rounds of trial-and-
error to determine the best compromise for a set of processing parameters. (3) The more accurate algorithm will
provide greater confidence in the detection of truly unknown compounds and allow prioritization of candidates for
more detailed and costly structural analysis. (4) The more accurate algorithm will benefit biomarker discovery by
increasing the accuracy of quantitative metabolite information extracted from the raw metabolomics data.
项目摘要 /摘要
无参数的峰值检测算法,用于减少从
原始质谱代谢组学数据
与液态或气相色谱法(LC或GC)结合的质谱(MS)已成为必不可少的分析
非靶向代谢组学的ICAL平台。具有灵敏度,色谱分辨率和质量测量
准确性不断提高,现在可以检测到越来越多的分析物,这具有巨大的潜力
在我们对新陈代谢的理解方面取得了长足的进步。 RAW LC-和GC-MS预处理的第一步
代谢组学数据是代表离子的峰的检测和提取。但是,现有的峰值检测
算法总是产生大量的假阳性和假阴性峰。这些不正确的峰
可以将下游转化为虚假或缺失的复合标识。此外,大量
必须为这些算法指定参数。不幸的是,普通用户通常不了解
如何优化这些参数,并最大化一个方面(例如灵敏度)通常会删除效果
在另一个(例如特异性)上。为了应对挑战,我们提出了检测峰的范式转变
通过简单地考虑离子信息的三个维度。这将大大增加
与执行峰值检测的现有算法相比,峰值检测的准确性
通过在三个单独的2D平面中处理数据。我们提出的研究结果将使代谢组学受益
通过多种方式进行研究。 (1)更准确的算法将消除或减少对结果的手动检查
最低。 (2)通过无参数设计,研究人员将不必经历许多一轮反复试验
错误以确定一组处理参数的最佳折衷。 (3)更准确的算法将
对检测真正未知化合物的检测提供更大的信心,并允许候选人的优先级
更详细且昂贵的结构分析。 (4)更准确的算法将使生物标志物的发现受益
提高从原始代谢组学数据中提取的定量代谢物信息的准确性。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Xiuxia Du其他文献
Xiuxia Du的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Xiuxia Du', 18)}}的其他基金
Human Health Exposure Analysis Resource Core: Untargeted Analysis
人类健康暴露分析资源核心:非目标分析
- 批准号:
10200812 - 财政年份:2019
- 资助金额:
$ 13.67万 - 项目类别:
Human Health Exposure Analysis Resource Core: Untargeted Analysis
人类健康暴露分析资源核心:非目标分析
- 批准号:
9814480 - 财政年份:2019
- 资助金额:
$ 13.67万 - 项目类别:
Cross-Platform and Graphical Software Tool for Adaptive LC/MS and GC/MS Metabolomics Data Preprocessing
用于自适应 LC/MS 和 GC/MS 代谢组学数据预处理的跨平台和图形化软件工具
- 批准号:
9788347 - 财政年份:2018
- 资助金额:
$ 13.67万 - 项目类别:
Cross-Platform and Graphical Software Tool for Adaptive LC/MS and GC/MS Metabolomics Data Preprocessing
用于自适应 LC/MS 和 GC/MS 代谢组学数据预处理的跨平台和图形化软件工具
- 批准号:
10251409 - 财政年份:2018
- 资助金额:
$ 13.67万 - 项目类别:
Cross-Platform and Graphical Software Tool for Adaptive LC/MS and GC/MS Metabolomics Data Preprocessing
用于自适应 LC/MS 和 GC/MS 代谢组学数据预处理的跨平台和图形化软件工具
- 批准号:
10005903 - 财政年份:2018
- 资助金额:
$ 13.67万 - 项目类别:
相似国自然基金
资源受限下集成学习算法设计与硬件实现研究
- 批准号:62372198
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
图机器学习的理论、模型与算法设计
- 批准号:62376007
- 批准年份:2023
- 资助金额:51 万元
- 项目类别:面上项目
基于超图的装填与覆盖问题的多项式时间可解性及近似算法设计研究
- 批准号:12361065
- 批准年份:2023
- 资助金额:27 万元
- 项目类别:地区科学基金项目
利用细胞内RNA结构信息结合深度学习算法设计高效细胞环境特异的CRISPR-Cas13d gRNA
- 批准号:32300521
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
财富科技的监管挑战与监管设计:算法投资视角的研究
- 批准号:72303197
- 批准年份:2023
- 资助金额:30.00 万元
- 项目类别:青年科学基金项目
相似海外基金
Identifying and addressing missingness and bias to enhance discovery from multimodal health data
识别和解决缺失和偏见,以增强多模式健康数据的发现
- 批准号:
10637391 - 财政年份:2023
- 资助金额:
$ 13.67万 - 项目类别:
Brain Digital Slide Archive: An Open Source Platform for data sharing and analysis of digital neuropathology
Brain Digital Slide Archive:数字神经病理学数据共享和分析的开源平台
- 批准号:
10735564 - 财政年份:2023
- 资助金额:
$ 13.67万 - 项目类别:
SCH: Dementia Early Detection for Under-represented Populations via Fair Multimodal Self-Supervised Learning
SCH:通过公平的多模式自我监督学习对代表性不足的人群进行痴呆症早期检测
- 批准号:
10816864 - 财政年份:2023
- 资助金额:
$ 13.67万 - 项目类别:
HEAR-HEARTFELT (Identifying the risk of Hospitalizations or Emergency depARtment visits for patients with HEART Failure in managed long-term care through vErbaL communicaTion)
倾听心声(通过口头交流确定长期管理护理中的心力衰竭患者住院或急诊就诊的风险)
- 批准号:
10723292 - 财政年份:2023
- 资助金额:
$ 13.67万 - 项目类别: