前馈型深度神经网络的奇异学习及算法研究
项目介绍
AI项目解读
基本信息
- 批准号:61906092
- 项目类别:青年科学基金项目
- 资助金额:27.0万
- 负责人:
- 依托单位:
- 学科分类:F0603.机器学习
- 结题年份:2022
- 批准年份:2019
- 项目状态:已结题
- 起止时间:2020-01-01 至2022-12-31
- 项目参与者:--
- 关键词:
项目摘要
Deep learning is a hot topic in artificial intelligence in recent years, and the research results on the feedforward deep neural networks (DNNs), such as deep convolutional neural networks, deep multilayer percetrons etc., have greatly motivated the development and applications of deep learning technology. However, due to the existence of hidden layer, there are singularities in the parameter space of feedforward DNNs, which cause the learning processes often suffer some problems, including insufficient generalization ability, parameter adjustment difficulty and weak robust ability. There are many important problems remain to be solved. In this project, we aim to investigate the singular learning problem of feedforward DNNs, which mainly includes: 1) the types of singularities will be analyzed in theoretically, and the influence of singularities to the learning processes will be numerically analyzed, where the results can explain the reason of insufficient generalization ability; 2) the mechanism of singular learning behaviors will be investigated and the stability of singularities will be analyzed, where the reason of model parameter adjustment difficulty can be explained; 3) the natural gradient algorithm and model order determination algorithm will be proposed to overcome the influence of singularities, where the weak robust ability problem of traditional algorithms will be solved. Finally, the proposed methods will solve the singular learning problem of feedforward DNNs and will promote the development of deep learning technology.
深度学习是近年来人工智能领域的研究热点,其中对包括深度卷积神经网络、深度感知器神经网络等在内的前馈型深度神经网络的深入研究有效推动了深度学习技术的发展和应用,但前馈型深度神经网络由于具有隐层导致参数空间中存在奇异性区域,会遇到泛化能力不足、参数调节困难、鲁棒稳定性差等奇异学习问题,有关此问题的研究尚有不足。本项目研究前馈型深度神经网络的奇异学习问题,主要研究包括:1).在理论上分析奇异性区域的类型,并通过数值分析研究各类奇异性区域的具体影响,从而在理论上解释模型泛化能力不足的原因;2).对奇异学习行为的发生机理进行研究,给出各类奇异性区域的稳定性分析,从而对模型参数调节困难的原因给出解释分析;3).提出应用于前馈型深度神经网络的自然梯度算法和模型定阶算法来研究克服奇异性区域影响,避免传统算法鲁棒稳定不足的问题。项目的研究成果将解决前馈型深度神经网络的奇异学习问题,促进深度学习技术的发展。
结项摘要
深度学习是近年来人工智能领域的研究热点,其中对包括深度卷积神经网络、深度感知器神经网络等在内的前馈型深度神经网络的深人研究有效推动了深度学习技术的发展和应用,但前馈型深度神经网络由于具有隐层导致参数空间中存在奇异性区域,会遇到泛化能力不足、参数调节困难、鲁棒稳定性差等奇异学习问题,有关此问题的研究尚有不足。本报告对前馈型深度神经网络的奇学习问题进行了研究分析,主要包括以下内容: 1)针对深度感知器神经网络,首 先在理论上对深度感知器神经网络的参数空间中存在的奇异性区域的类型进行了分析,分析得出参数空间中存在两类奇异性区域:重合奇异性区域和零权值奇异性区域,然后基于EEG数据库进行大量仿真实验,通过分析实验结果,可以得出深度感知器神经网络的学习主要受到零权值奇异性区域的影响,而较少的受到重合奇异性区域的影响,而且零权值奇异性区域确实会对深度感知器神经网络的学习过程造成严重的影响,需要进行进一步的研究以克服其影响; 2)由于奇异性区域为Fisher信息阵退化的区域,所以Fisher信息阵在分析前馈型深度神经网络的奇异学习以及设计克服奇异性区域的影响都起着非常重要的作用。本报告针对多层感知器神经网络,首先针对输人服从标准高斯分布的情形,求得了Fisher 信息阵的解析表达式,并验证了结果的有效性,进而推广到输人服从一般高斯分布的情形,求得Fisher信息阵的解析表达式,并通过实验验证了基于该解析表达式设计更好的克服奇异性区域影响的算法的潜力。基于本报告的研究结果,可以对前馈型深度神经网络的奇异学习有了更清晰的认识,并为后面设计克服奇异性区域影响的具有更好性能的神经网络算法奠定了基础。
项目成果
期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(3)
专利数量(3)
Fisher Information Matrix and its Application of Bipolar Activation Function Based Multilayer Perceptrons With General Gaussian Input
Fisher信息矩阵及其基于双极激活函数的一般高斯输入多层感知器的应用
- DOI:10.1109/access.2022.3227427
- 发表时间:2022
- 期刊:IEEE Access
- 影响因子:3.9
- 作者:Weili Guo;Guangyu Li;Jianfeng Lu
- 通讯作者:Jianfeng Lu
Singular Learning of Deep Multilayer Perceptrons for EEG-Based Emotion Recognition
基于脑电图的情绪识别的深度多层感知器的奇异学习
- DOI:10.3389/fcomp.2021.786964
- 发表时间:2021-12
- 期刊:FRONTIERS IN COMPUTER SCIENCE
- 影响因子:2.6
- 作者:Guo Weili;Li Guangyu;Lu Jianfeng;Yang Jian
- 通讯作者:Yang Jian
Automatic Detection of Defective Solar Cells in Electroluminescence Images via Global Similarity and Concatenated Saliency Guided Network
通过全局相似性和级联显着性引导网络自动检测电致发光图像中的缺陷太阳能电池
- DOI:10.1109/tii.2022.3211088
- 发表时间:2023-06
- 期刊:IEEE Transactions on Industrial Informatics
- 影响因子:12.3
- 作者:Jinxia Zhang;Yu Shen;Jiacheng Jiang;Shixiong Fang;Liping Chen;Tingting Yan;Zuoyong Li;Kanjian Zhang;Haikun Wei;Weili Guo
- 通讯作者:Weili Guo
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
Efficient Unsupervised Dimension Reduction for Streaming Multiview Data
流式多视图数据的高效无监督降维
- DOI:10.1109/tcyb.2020.2996684
- 发表时间:2020-06
- 期刊:IEEE Transactions on Cybernetics(10.1109/TCYB.2020.2996684)
- 影响因子:--
- 作者:谢利萍;郭伟立;魏海坤;唐远炎;陶大程
- 通讯作者:陶大程
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}

内容获取失败,请点击重试

查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图

请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}