Unified approach for data sampling problems based on online prediction theory
基于在线预测理论的数据采样问题统一方法
基本信息
- 批准号:21K12032
- 负责人:
- 金额:$ 2.75万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2021
- 资助国家:日本
- 起止时间:2021-04-01 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
オンライン予測理論に基づくデータサンプリング問題の枠組みを用い,様々な学習タスクへの適用を行った.1. ラベル比率からの学習問題に対する疑似ラベルに基づく方法を構築した.オンライン予測理論に基づくデータサンプリングにより,効率的かつ高精度な疑似ラベルを担保しながらの学習を可能にした.実データを用いた実験でも,既存手法に比べ高い性能を示した.査読付き国際会議に投稿し受理された.2. 研究計画でメインターゲットとしていた,ノイズラベルデータに対するノイズデータを除去しながら学習する手法を構築した.オンライン予測理論に基づくデータサンプリングにより,従来より2倍程度学習を高速化しつつ,高精度なノイズデータ除去と,ラベル予測が可能となった.実データを用いた実験においても,従来手法より高い精度でノイズデータの除去とラベル予測を行えていることが確認できた.現在学術論文誌に投稿中である.これらの結果によって,研究計画でも示した「統合的な枠組み」「オンライン予測理論に基づく理論性能の保証」および「実応用の開拓」を明らかにした.また,研究計画でメインターゲットとしていたノイズラベルデータに対する適用だけではなく,ラベル比率からの学習問題にも適用を可能とし,提案した枠組みの汎用性を示した.1. および 2. で扱った問題に対してオンライン予測理論に基づくデータサンプリングを導入したのは世界で初であり,各問題における既存手法とは一線を画す独創的なアプローチである.
我们使用基于在线预测理论的数据采样问题框架,并将其应用于各种学习任务。 1.我们构建了一种基于伪标签的方法,用于从标签比率中学习问题。基于在线预测理论的数据采样可以在保证高效、高精度伪标签的同时进行学习。使用真实数据的实验也显示出比现有方法更高的性能。提交给同行评审的国际会议并被接受。 2.我们构建了一种噪声标签数据的学习方法,这是我们研究计划的主要目标,同时去除了噪声数据。基于在线预测理论的数据采样使得能够执行高精度的噪声数据去除和标签预测,同时将学习速度提高约两倍。在使用真实数据的实验中,我们证实我们的方法能够去除噪声数据并比传统方法更准确地预测标签。该论文目前正在提交给学术期刊。这些结果明确了研究计划中指出的“综合框架”、“基于在线预测理论的理论性能保证”和“实际应用的探索”。此外,所提出的框架不仅可以应用于噪声标签数据(这是研究计划的主要目标),还可以应用于从标签比率中学习问题,证明了所提出框架的多功能性。针对1.和2.中处理的问题引入基于在线预测理论的数据采样在世界上尚属首次,并且是在每个问题的现有方法中脱颖而出的独创方法。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
No Regret Sample Selection with Noisy Labels
不后悔选择带有噪音标签的样本
- DOI:
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:Heon Song; Nariaki Mitsuo; Seiichi Uchida; Daiki Suehiro
- 通讯作者:Daiki Suehiro
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
末廣 大貴其他文献
Shapeletに基づくマルチインスタンス学習
基于Shapelet的多实例学习
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
末廣 大貴;畑埜 晃平;瀧本 英二;山本 修司;坂内 健一;武田 朗子 - 通讯作者:
武田 朗子
SVMによる2 部ランキング学習を用いたコンピュータ将棋における評価関数の学習
使用支持向量机的两部分排序学习在计算机将棋中学习评估函数
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
末廣 大貴; 畑埜 晃平; 坂内 英夫; 瀧本 英二; 竹田 正幸 - 通讯作者:
竹田 正幸
末廣 大貴的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似海外基金
ソフトウェア品質向上に向けた欠陥予測モデルのオンライン最適化の検討
缺陷预测模型在线优化提高软件质量的思考
- 批准号:
21K11840 - 财政年份:2021
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
High speed sensing of latent biological activities prior to human actions and their very early stages for accident prevention
高速感测人类行为之前的潜在生物活动及其早期阶段的事故预防
- 批准号:
20K20483 - 财政年份:2020
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Challenging Research (Pioneering)
A Model of Consumer Purchase Behavior based on Path Data in Online/Offline Environments
基于线上/线下环境路径数据的消费者购买行为模型
- 批准号:
20K13576 - 财政年份:2020
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Optimization based on discrete structure representations
基于离散结构表示的优化
- 批准号:
19H04174 - 财政年份:2019
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
データの学習容易性解析に基づく実ケース学習理論の確立
基于数据可学习性分析的真实案例学习理论建立
- 批准号:
19H04067 - 财政年份:2019
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Scientific Research (B)