主动学习初始化策略及停止准则研究
项目介绍
AI项目解读
基本信息
- 批准号:61906208
- 项目类别:青年科学基金项目
- 资助金额:20.0万
- 负责人:
- 依托单位:
- 学科分类:F0603.机器学习
- 结题年份:2022
- 批准年份:2019
- 项目状态:已结题
- 起止时间:2020-01-01 至2022-12-31
- 项目参与者:--
- 关键词:
项目摘要
Currently, many machine learning tasks face a practical problem that we can easily acquire a large number of unlabeled instances, but labeling these instances is quite burdensome and expensive. Active learning aims to query as little data as possible while maximize the learning performance by using a selective sampling strategy. The initialization strategy and stopping criterion for active learning are two factors that heavily influence the effect of active learning. Since current studies about these two aspects still have a lot of weak points, based on our previous works on active learning, this project explores the corresponding theoretical model and technical methods. First, we attempt to explore a new active initialization strategy that uses a nearest neighbor criterion to select the most representative instances and construct the initial labeled dataset. Secondly, we try to investigate the influence of active initialization strategy to the active learning algorithms employed in subsequent steps. Comparative experiments will be constructed to verify whether initialization strategy is able to directly affect the effectiveness of active learning methods. Lastly, we will search for a new stopping criterion for active learning which does not require a separate validation set. The average retraining-based variance will be used as the stopping criterion. This project will be of significance for promoting the theoretical analysis and practical application of active learning and bringing down the human annotation cost.
当前,很多机器学习任务面临的一个现实问题是:未标记样本数量众多,人工标注成本高昂。主动学习旨在通过交互迭代式的选择性采样,以尽可能少的标注成本来获得性能较高的分类模型。主动学习的初始化策略和停止准则是影响其实际应用效果的两个重要因素。针这两方面的研究尚存在诸多不足,本项目在前期研究基础上,探索了相应的理论问题和技术方法。首先,研究了一种新的主动学习初始化策略,该策略通过一种最近邻准则来寻找最具代表性的样本构建初始训练集;然后,探索了初始化策略对主动学习算法有效性的影响,设计对比实验来验证初始化策略能否直接影响主动学习算法的效益;最后,探索一种新的不依赖独立验证集的主动学习停止准则,该准则采用平均重训练方差作为停止指标。本项目的预期成果对推进主动学习的基础理论研究及其实用化,减少人工标注成本具有重要的现实意义。
结项摘要
本项目主要研究了主动学习初始化策略和停止准则,对上述两个问题的攻坚研究能够促进主动学习在实际生活中的应用,有效地节省人工标注成本,具有重要的现实意义。本项目围绕研究任务展开,主要内容包括:1)研究了主动学习初始化算法,提出了基于最近邻距离的主动学习初始化方法,该算法能够找到一个最具代表性的初始数据集,即该数据集与剩余的未标记数据之间的整体相似性很高。2)研究了初始化策略对主动学习算法的影响,发现初始化算法对整个主动学习样本标注过程影响很大,好的初始化算法更有可能提升主动学习算法的整体性能,性能不佳的初始化算法很可能会降低性能。3)研究了主动学习停止准则及评价指标,提出了基于重训练方差的主动学习停止准则及评价指标,帮助找到人工标记成本与机器学习模型准确率的平衡点。此外,基于此项目,协助培养2名博士研究生,发表3篇SCI论文,预备出版专著一本。本项目研究填补了相关领域的空白,能够推动主动学习在不同领域的应用。
项目成果
期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Batch Mode Active Learning Based on Multi-Set Clustering
基于多集聚类的批量模式主动学习
- DOI:10.1109/access.2021.3053003
- 发表时间:2021
- 期刊:IEEE Access
- 影响因子:3.9
- 作者:Yazhou Yang;Xiaoqing Yin;Yang Zhao;Jun Lei;Weili Li;Zhe Shu
- 通讯作者:Zhe Shu
To Actively Initialize Active Learning
主动启动主动学习
- DOI:10.1016/j.patcog.2022.108836
- 发表时间:2022-06
- 期刊:Pattern Recognition
- 影响因子:8
- 作者:Yazhou Yang;Marco Loog
- 通讯作者:Marco Loog
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
准噶尔盆地西北缘克-乌断裂带推覆体上盘构造样式及影响因素
- DOI:--
- 发表时间:--
- 期刊:地质通报
- 影响因子:--
- 作者:张磊;白雨;李梦瑶;王涛;马银山;杨亚洲
- 通讯作者:杨亚洲
基于局部不变特征的图像质量评价
- DOI:--
- 发表时间:2012
- 期刊:计算机应用
- 影响因子:--
- 作者:杨亚洲;尹晓晴;程光权;涂丹
- 通讯作者:涂丹
The Effects of Viewing Geometry on the Spectral Analysis of Lunar Regolith as Inferred by in situ Spectrophotometric Measurements of Chang'E‐4
嫦娥原位分光光度测量推断观测几何形状对月球风化层光谱分析的影响-4
- DOI:10.1029/2020gl087080
- 发表时间:2020-04
- 期刊:Geophysical Research Letters
- 影响因子:5.2
- 作者:杨亚洲;林红磊;刘洋;林杨挺;魏勇;胡森;杨蔚;徐睿;何志平;邹永廖
- 通讯作者:邹永廖
Photometric properties of lunar regolith revealed by the Yutu-2 rover
玉兔二号月球车揭示的月表层光度特性
- DOI:10.1051/0004-6361/202037859
- 发表时间:2020-06
- 期刊:Astronomy & Astrophysics
- 影响因子:6.5
- 作者:林红磊;杨亚洲;林杨挺;刘洋;魏勇;李帅;胡森;杨蔚;万文辉;徐睿;何志平;刘晓慧;邢琰;余成武;邹永廖
- 通讯作者:邹永廖
MdMYB1 启动子甲基化对不同色泽类型苹果品种果皮花青苷合成的调 控作用
- DOI:10.13271/j.mpb.016.007415
- 发表时间:2018
- 期刊:分子植物育种
- 影响因子:--
- 作者:常博;马长青;刘聪;刘莉;王英;杨亚洲;赵政阳
- 通讯作者:赵政阳
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}