主动学习初始化策略及停止准则研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61906208
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    20.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0603.机器学习
  • 结题年份:
    2022
  • 批准年份:
    2019
  • 项目状态:
    已结题
  • 起止时间:
    2020-01-01 至2022-12-31

项目摘要

Currently, many machine learning tasks face a practical problem that we can easily acquire a large number of unlabeled instances, but labeling these instances is quite burdensome and expensive. Active learning aims to query as little data as possible while maximize the learning performance by using a selective sampling strategy. The initialization strategy and stopping criterion for active learning are two factors that heavily influence the effect of active learning. Since current studies about these two aspects still have a lot of weak points, based on our previous works on active learning, this project explores the corresponding theoretical model and technical methods. First, we attempt to explore a new active initialization strategy that uses a nearest neighbor criterion to select the most representative instances and construct the initial labeled dataset. Secondly, we try to investigate the influence of active initialization strategy to the active learning algorithms employed in subsequent steps. Comparative experiments will be constructed to verify whether initialization strategy is able to directly affect the effectiveness of active learning methods. Lastly, we will search for a new stopping criterion for active learning which does not require a separate validation set. The average retraining-based variance will be used as the stopping criterion. This project will be of significance for promoting the theoretical analysis and practical application of active learning and bringing down the human annotation cost.
当前,很多机器学习任务面临的一个现实问题是:未标记样本数量众多,人工标注成本高昂。主动学习旨在通过交互迭代式的选择性采样,以尽可能少的标注成本来获得性能较高的分类模型。主动学习的初始化策略和停止准则是影响其实际应用效果的两个重要因素。针这两方面的研究尚存在诸多不足,本项目在前期研究基础上,探索了相应的理论问题和技术方法。首先,研究了一种新的主动学习初始化策略,该策略通过一种最近邻准则来寻找最具代表性的样本构建初始训练集;然后,探索了初始化策略对主动学习算法有效性的影响,设计对比实验来验证初始化策略能否直接影响主动学习算法的效益;最后,探索一种新的不依赖独立验证集的主动学习停止准则,该准则采用平均重训练方差作为停止指标。本项目的预期成果对推进主动学习的基础理论研究及其实用化,减少人工标注成本具有重要的现实意义。

结项摘要

本项目主要研究了主动学习初始化策略和停止准则,对上述两个问题的攻坚研究能够促进主动学习在实际生活中的应用,有效地节省人工标注成本,具有重要的现实意义。本项目围绕研究任务展开,主要内容包括:1)研究了主动学习初始化算法,提出了基于最近邻距离的主动学习初始化方法,该算法能够找到一个最具代表性的初始数据集,即该数据集与剩余的未标记数据之间的整体相似性很高。2)研究了初始化策略对主动学习算法的影响,发现初始化算法对整个主动学习样本标注过程影响很大,好的初始化算法更有可能提升主动学习算法的整体性能,性能不佳的初始化算法很可能会降低性能。3)研究了主动学习停止准则及评价指标,提出了基于重训练方差的主动学习停止准则及评价指标,帮助找到人工标记成本与机器学习模型准确率的平衡点。此外,基于此项目,协助培养2名博士研究生,发表3篇SCI论文,预备出版专著一本。本项目研究填补了相关领域的空白,能够推动主动学习在不同领域的应用。

项目成果

期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Batch Mode Active Learning Based on Multi-Set Clustering
基于多集聚类的批量模式主动学习
  • DOI:
    10.1109/access.2021.3053003
  • 发表时间:
    2021
  • 期刊:
    IEEE Access
  • 影响因子:
    3.9
  • 作者:
    Yazhou Yang;Xiaoqing Yin;Yang Zhao;Jun Lei;Weili Li;Zhe Shu
  • 通讯作者:
    Zhe Shu
To Actively Initialize Active Learning
主动启动主动学习
  • DOI:
    10.1016/j.patcog.2022.108836
  • 发表时间:
    2022-06
  • 期刊:
    Pattern Recognition
  • 影响因子:
    8
  • 作者:
    Yazhou Yang;Marco Loog
  • 通讯作者:
    Marco Loog

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

准噶尔盆地西北缘克-乌断裂带推覆体上盘构造样式及影响因素
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    地质通报
  • 影响因子:
    --
  • 作者:
    张磊;白雨;李梦瑶;王涛;马银山;杨亚洲
  • 通讯作者:
    杨亚洲
基于局部不变特征的图像质量评价
  • DOI:
    --
  • 发表时间:
    2012
  • 期刊:
    计算机应用
  • 影响因子:
    --
  • 作者:
    杨亚洲;尹晓晴;程光权;涂丹
  • 通讯作者:
    涂丹
The Effects of Viewing Geometry on the Spectral Analysis of Lunar Regolith as Inferred by in situ Spectrophotometric Measurements of Chang'E‐4
嫦娥原位分光光度测量推断观测几何形状对月球风化层光谱分析的影响-4
  • DOI:
    10.1029/2020gl087080
  • 发表时间:
    2020-04
  • 期刊:
    Geophysical Research Letters
  • 影响因子:
    5.2
  • 作者:
    杨亚洲;林红磊;刘洋;林杨挺;魏勇;胡森;杨蔚;徐睿;何志平;邹永廖
  • 通讯作者:
    邹永廖
Photometric properties of lunar regolith revealed by the Yutu-2 rover
玉兔二号月球车揭示的月表层光度特性
  • DOI:
    10.1051/0004-6361/202037859
  • 发表时间:
    2020-06
  • 期刊:
    Astronomy & Astrophysics
  • 影响因子:
    6.5
  • 作者:
    林红磊;杨亚洲;林杨挺;刘洋;魏勇;李帅;胡森;杨蔚;万文辉;徐睿;何志平;刘晓慧;邢琰;余成武;邹永廖
  • 通讯作者:
    邹永廖
MdMYB1 启动子甲基化对不同色泽类型苹果品种果皮花青苷合成的调 控作用
  • DOI:
    10.13271/j.mpb.016.007415
  • 发表时间:
    2018
  • 期刊:
    分子植物育种
  • 影响因子:
    --
  • 作者:
    常博;马长青;刘聪;刘莉;王英;杨亚洲;赵政阳
  • 通讯作者:
    赵政阳

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码