基于输出纠错编码的开集多类数据挖掘算法研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61772023
  • 项目类别:
    面上项目
  • 资助金额:
    48.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0605.模式识别与数据挖掘
  • 结题年份:
    2021
  • 批准年份:
    2017
  • 项目状态:
    已结题
  • 起止时间:
    2018-01-01 至2021-12-31

项目摘要

Open Set Multi-Class Recognition (OSMCR) refers to a type of classification task that a large number of classes in a test set are not included in the corresponding training data set. The openness of OSMCR makes it a hard problem, especially when the data is of high dimension. This study aims to tackle the OSMCR problem based on error correcting output codes (ECOC) algorithm. Data complexity theory is used in the analysis of class division scheme in different feature subsets. And we will try to design some data complexity measures with the capability to handle high dimension by evaluating a feature subset as a whole. Based on these measures, we will explore effective class-decomposition schemes based on diverse feature subsets, and along with the solution for class imbalance problem. Evolutionary algorithm will also be deployed to generate an optimal ECOC coding matrix. By taking such efforts, we can get a deeper insight to the nature of multiclass problem. For OSMCR problem, an unknown class is defined to include all unknown samples those don’t belong to any known class. The strategy of assigning a test sample to the unknown class or a known class is then an important problem we need to solve at the first step. A Dynamic ECOC algorithm is designed to add rows/columns for the division of the unknown class from known classes. To make the distances as large as possible, the distances among all classes and the distance among rows in a coding matrix will be adjusted by a searching algorithm to achieve an optimal solution. Furthermore, we will try to adjust the original idea of regarding all samples not included in known classes as an unknown class. We will try to further divide the unknown class into some classes, so that the distances among known classes and the unknown classes can be further enlarged. The decomposition of the unknown class can aid to draw accurate boundaries among unknown classes and the known classes. As the OSMCR is a newly proposed research topic, any progress of our project can promote the further exploration of this research field, especially the unknown class decomposition problem which is still an untouched problem.
开集多类识别指在有监督学习中,未知数据含有大量未包含于训练数据中的新类别,因此动态识别未知类别就成了研究该问题的关键。这是机器学习领域的新问题,本课题将结合数据复杂度理论,针对高维多类数据设计复杂度测度,结合样本数不均衡解决技术,探索基于数据复杂度的自适应输出纠错编码(ECOC)算法,并设计基于进化算法的ECOC算法,从多个角度探索基于高维特征子集的类别分解机制。在此基础上,根据未知数据与已知类别在不同特征子集的分布差异,实现动态ECOC算法,通过增加编码矩阵的行/列向量,对新类别与已知类别进行动态划分。更进一步,将根据新类别的数据分布情况,将新类别分解成多个子类,设计基于聚类的动态ECOC算法,基于反馈方式调整未知类别的子类划分与编码矩阵的行/列,寻找分界面与编码距离的所有类别距离最大化的双重目标最优解。开集多类数据识别是一个新问题,本课题的研究将为相关研究领域的进一步拓展打下基础。

结项摘要

本项目深入探讨了输出纠错编码算法(Error-Correcting Output Codes, ECOC)的理论、算法及其应用研究,围绕多类别判定的有监督学习进行探讨,结合数据复杂度理论与样本数不均衡解决技术,探索自适应ECOC算法的设计思路,设计了多个基于进化算法的ECOC算法,从多个角度探索基于高维特征子集的类别分解机制。在此基础上,团队结合三进制算子、特征子空间寻优等机器学习理论方法,完成了多个新的输出纠错编码算法框架,根据开集数据的特点,从未知数据与已知类别在不同特征子集的分布差异,实现动态ECOC算法,通过增加编码矩阵的行/列向量,对新类别与已知类别进行动态划分。在研究工作的开展中,团队提出了多个具有首创性的算法设计思路,包括:(1)提出了首个基于遗传规划的ECOC算法框架,将遗传规划的树形结构个体与ECOC编码矩阵相结合,通过有效的个体映射方式,引导遗传规划在进化过程中基于多个约束条件下对ECOC编码矩阵的搜索寻优;(2)提出了基于变长编码的ECOC算法框架,对分类过程中难识别的类别及样本设计针对性的识别方法,从而完成了两阶段的编码算法设计方案,为易识别与难识别的类别分别提供了不同长度的编码算法;(3)提出了首个软编码的ECOC算法思路,根据各个基本分类器的在不同类别的输出分布特点,包括不同类别输出值的均值、区间等基本信息,分别进行新的类别重编码,设计出编码矩阵的重编码算法,实现了首个基于编码特点的重编码方案;(4)提出了首个基于聚类的动态ECOC算法,基于动态选择性集成算法的基本设计思路,根据样本的数据分布特点,动态选择对未知样本最合适的特征空间进行类别判定,寻找分界面与编码距离的所有类别距离最大化的最佳方案。.此外,团队还进一步拓展研究成果,针对偏标签数据、微表情数据、基因微阵列数据等不同数据特点,设计了多个多类别判定算法,结合深度森林、深度神经网络等模型进行算法融合,设计了适用于深度学习的ECOC算法,并针对不同问题域的数据特征构建了新的机器学习模型。

项目成果

期刊论文数量(27)
专著数量(0)
科研奖励数量(0)
会议论文数量(12)
专利数量(12)
The design of variable-length coding matrix for improving error correcting output codes
改进纠错输出码的变长编码矩阵设计
  • DOI:
    10.1016/j.ins.2020.04.021
  • 发表时间:
    2020
  • 期刊:
    Information Sciences
  • 影响因子:
    8.1
  • 作者:
    Feng Kai-Jie;Liong Sze-Teng;Liu Kun-Hong
  • 通讯作者:
    Liu Kun-Hong
Block Division Convolutional Network with Implicit Deep Features Augmentation for Micro-Expression Recognition
用于微表情识别的隐式深度特征增强的块分割卷积网络
  • DOI:
    10.1109/tmm.2022.3141616
  • 发表时间:
    2022
  • 期刊:
    IEEE Transactions on Multimedia
  • 影响因子:
    7.3
  • 作者:
    B. Chen;K. -H. Liu;Y. Xu;Q. -Q. Wu;J. -F. Yao
  • 通讯作者:
    J. -F. Yao
Micro-expression recognition using advanced genetic algorithm
使用先进的遗传算法进行微表情识别
  • DOI:
    10.1016/j.image.2021.116153
  • 发表时间:
    2021
  • 期刊:
    Signal Processing: Image Communication
  • 影响因子:
    --
  • 作者:
    Liu Kun-Hong;Jin Qiu-Shi;Xu Huang-Chao;Gan Yee-Siang;Liong Sze-Teng
  • 通讯作者:
    Liong Sze-Teng
The design of soft recoding-based strategies for improving error-correcting output codes
基于软重编码的改进纠错输出码策略的设计
  • DOI:
    10.1007/s10489-021-02870-w
  • 发表时间:
    2021
  • 期刊:
    Applied Intelligence
  • 影响因子:
    5.3
  • 作者:
    Liu Kun-Hong;Ye Xiao-Na;Guo Hong-Zhou;Wu Qing-Qiang;Hong Qing-Qi
  • 通讯作者:
    Hong Qing-Qi
Partial label learning based on label distributions and error-correcting output codes
基于标签分布和纠错输出码的部分标签学习
  • DOI:
    10.1007/s00500-020-05203-0
  • 发表时间:
    2020
  • 期刊:
    Soft Computing
  • 影响因子:
    4.1
  • 作者:
    Guangyi Lin;Kunhong Liu;Beizhan Wang;Xiaoyan Zhang
  • 通讯作者:
    Xiaoyan Zhang

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

基于形态学的车辆遮挡检测与分割
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    Journal of Information and computational science
  • 影响因子:
    --
  • 作者:
    张海英;郑慧翔;刘昆宏
  • 通讯作者:
    刘昆宏
Feature extraction using constrained maximum variance mapping
使用约束最大方差映射进行特征提取
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    Pattern Recognition
  • 影响因子:
    8
  • 作者:
    李波;王超;刘昆宏;黄德双
  • 通讯作者:
    黄德双
用于癌症分类的多类别微阵列数据的分层集成ECOC方法
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    Information sciences
  • 影响因子:
    8.1
  • 作者:
    刘昆宏;曾志浩;Vincent To Yee Ng
  • 通讯作者:
    Vincent To Yee Ng
基于遗传算法的微阵列数据分类集成系统
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    compitational and mathematical methods in medicine
  • 影响因子:
    --
  • 作者:
    刘昆宏;Muchenxuan Tong;Shu-Tong Xie;Vincent To Yee Ng2
  • 通讯作者:
    Vincent To Yee Ng2

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

刘昆宏的其他基金

基于集成学习的高维癌症基因微阵列数据分析方法研究
  • 批准号:
    61100106
  • 批准年份:
    2011
  • 资助金额:
    22.0 万元
  • 项目类别:
    青年科学基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码