HistoTools: A suite of digital pathology tools for quality control, annotation and dataset identification

HistoTools:一套用于质量控制、注释和数据集识别的数字病理学工具

基本信息

项目摘要

ABSTRACT: Roughly 40% of the US population will be diagnosed with some form of cancer in their lifetime. In a majority of these cases, a definitive cancer diagnosis is only possible via histopathologic confirmation using a tissue slide. Increasingly, these slides are being digitally scanned as high-resolution images for usage in both clinical and research digital pathology (DP) workflows. Our group has been pioneering the use of deep learning (DL), a form of machine learning, for segmentation, detection, and classification of various cancers using digital pathology images. DL learns features and their associated weighting from large datasets to maximally discriminate between user labeled data (e.g., cancer vs non-cancer, nuclei vs non-nuclei); a paradigm known as “learn from data”. Unfortunately, this paradigm makes DL especially sensitive to low quality slides, noise induced by small errors in the manual user labeling process, and general dataset heterogeneity. As many groups do not intentionally account for these problems, they learn that successful employment of DL technologies relies heavily on explicitly addressing challenges associated with (a) carefully curating high quality slides without preparation or scanning artifacts, (b) obtaining a large precise collection of annotations delineating objects of interest, and (c) selecting diverse datasets to ensure robust classifier performance when clinically deploying the model. To address these challenges we propose HistoTools, a suite of three modules or “Apps”: (1) HistoQC examines slides for artifacts and computes metrics associated with slide presentation characteristics (e.g., stain intensity, compression levels) helping to quantify ranges of acceptable characteristics for downstream algorithmic evaluation. (2) HistoAnno drastically improves the efficiency of annotation efforts using a combined active learning and deep learning approach to ensure experts focus only on regions which are important for classifier improvement. (3) HistoFinder aids in selecting suitable training and test cohorts to guarantee that various tissue level characteristics are well balanced, leading to increased reproducibility. Our team already has working prototypes of HistoQC (100% concordance with a pathologist, evaluated on n>1200 slides) and HistoAnno (30% efficiency improvement during annotation tasks). In this U01, we seek to further develop and evaluate HistoTools in the context of enhancing two companion diagnostic (CDx) assays being developed in our group. First, we will use HistoTools to quality control and annotate nuclei, tubules, and mitosis for improving our CDx classifier for predicting recurrence in breast cancers using a cohort of n>900 patients from completed trial ECOG 2197. Secondly, HistoTools will be employed for quality control and identification of tumor infiltrating lymphocytes and cancer nuclei towards improving our CDx classifier for predicting response to immunotherapy in lung cancer using the n>700 patients from completed clinical trials Checkmate 017 and 057. These tools will build on our existing open source tool repository to aid in real-time feedback and dissemination throughout the ITCR and cancer research community.
摘要:大约 40% 的美国人在一生中会被诊断出患有某种形式的癌症。 在大多数病例中,只有通过使用组织病理学确认才能做出明确的癌症诊断 这些载玻片越来越多地被数字化扫描为高分辨率图像,以供在两者中使用。 我们的团队一直在引领深度学习的临床和研究数字病理学 (DP) 工作流程。 (DL),一种机器学习形式,用于使用数字技术对各种癌症进行分割、检测和分类 深度学习从大型数据集中学习特征及其相关权重 用户标记数据之间的区别(例如,癌症与非癌症、细胞核与非细胞核); 不幸的是,这种范式使得深度学习对低质量的幻灯片、噪音特别敏感。 由手动用户标记过程中的小错误以及一般数据集异质性引起。 团体并没有故意解释这些问题,他们了解到 DL 的成功就业 技术在很大程度上依赖于明确解决与以下方面相关的挑战:(a) 仔细固化高 无需准备或扫描伪影即可获得高质量幻灯片,(b) 获得大量精确的注释集合 描绘感兴趣的对象,以及(c)选择不同的数据集以确保鲁棒的分类器性能 为了解决这些挑战,我们提出了 HistoTools,这是一套由三个模块组成的套件。 或“应用程序”:(1) HistoQC 检查幻灯片中的伪影并计算与幻灯片演示相关的指标 特征(例如染色强度、压缩水平)有助于量化可接受的范围 (2) HistoAnno极大地提高了效率 使用主动学习和深度学习相结合的方法进行注释工作,以确保专家只关注 (3) HistoFinder 帮助选择合适的训练 和测试队列,以保证各种组织水平特征的良好平衡,从而导致增加 我们的团队已经拥有 HistoQC 的工作原型(与病理学家 100% 一致, 在 n>1200 张幻灯片上进行评估)和 HistoAnno(在注释任务中效率提高了 30%)。 我们寻求在增强两种伴随诊断的背景下进一步开发和评估 HistoTools 我们小组正在开发的 (CDx) 检测首先,我们将使用 HistoTools 进行质量控制和注释细胞核, 肾小管和有丝分裂,以改进我们的 CDx 分类器,以使用队列预测乳腺癌复发 来自已完成试验 ECOG 2197 的 n> 900 名患者。其次,将采用 HistoTools 进行质量控制 以及肿瘤浸润淋巴细胞和癌核的识别,以改进我们的 CDx 分类器 使用已完成的临床试验中 n>700 名患者预测肺癌免疫治疗的反应 Checkmate 017 和 057。这些工具将构建在我们现有的开源工具存储库上,以提供实时帮助 在整个 ITCR 和癌症研究界进行反馈和传播。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Andrew Robert Janowczyk其他文献

Andrew Robert Janowczyk的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Andrew Robert Janowczyk', 18)}}的其他基金

Histotools: scaling digital pathology curation tools for quality control, annotation, labeling, and dataset identification
Histotools:用于质量控制、注释、标记和数据集识别的扩展数字病理学管理工具
  • 批准号:
    10708011
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
HistoTools: A suite of digital pathology tools for quality control, annotation and dataset identification
HistoTools:一套用于质量控制、注释和数据集识别的数字病理学工具
  • 批准号:
    10392854
  • 财政年份:
    2019
  • 资助金额:
    --
  • 项目类别:
HistoTools: A suite of digital pathology tools for quality control, annotation and dataset identification
HistoTools:一套用于质量控制、注释和数据集识别的数字病理学工具
  • 批准号:
    9897498
  • 财政年份:
    2019
  • 资助金额:
    --
  • 项目类别:

相似国自然基金

本体驱动的地址数据空间语义建模与地址匹配方法
  • 批准号:
    41901325
  • 批准年份:
    2019
  • 资助金额:
    22.0 万元
  • 项目类别:
    青年科学基金项目
时空序列驱动的神经形态视觉目标识别算法研究
  • 批准号:
    61906126
  • 批准年份:
    2019
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
针对内存攻击对象的内存安全防御技术研究
  • 批准号:
    61802432
  • 批准年份:
    2018
  • 资助金额:
    25.0 万元
  • 项目类别:
    青年科学基金项目
大容量固态硬盘地址映射表优化设计与访存优化研究
  • 批准号:
    61802133
  • 批准年份:
    2018
  • 资助金额:
    23.0 万元
  • 项目类别:
    青年科学基金项目
IP地址驱动的多径路由及流量传输控制研究
  • 批准号:
    61872252
  • 批准年份:
    2018
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目

相似海外基金

Combining sources of information to improve HIV pre-exposure prophylaxis
结合信息来源改善艾滋病毒暴露前预防
  • 批准号:
    10700193
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
A Technology-enhanced and Multilevel Approach to Promote Cervical Cancer Prevention Among Women Living with HIV
采用技术增强的多层次方法促进艾滋病毒感染妇女的宫颈癌预防
  • 批准号:
    10740622
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
DYnamics of Contraception in Eswatini (DYCE)
斯威士兰避孕动态 (DYCE)
  • 批准号:
    10590998
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Mentoring the next generation of researchers at the intersection of opioid use disorder and chronic pain
指导下一代研究人员研究阿片类药物使用障碍和慢性疼痛的交叉点
  • 批准号:
    10663642
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Mentoring the next generation of researchers at the intersection of opioid use disorder and chronic pain
指导下一代研究人员研究阿片类药物使用障碍和慢性疼痛的交叉点
  • 批准号:
    10663642
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了