神经网络无监督学习的相关统计物理研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    11805284
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    25.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    A2503.统计物理与复杂系统
  • 结题年份:
    2021
  • 批准年份:
    2018
  • 项目状态:
    已结题
  • 起止时间:
    2019-01-01 至2021-12-31

项目摘要

A deep neural network is a multi-layered neural architecture performing hierarchical non-linear transformation of input data. Deep neural networks, originally inspired from hierarchical architectures in neuroscience, are now powerful tools of wide applications in a variety of domains, ranging from image classification, speech recognition, to natural language processing, and even physics studies in recent years. However, the nested non-linear structure makes deep neural networks highly non-transparent, and therefore deep neural networks remain black boxes. In particular, unsupervised learning, as one important branch, aims at revealing hidden structure in the data without label information. To figure out what learning principles may be used for modeling external world in an unsupervised way can not only shed light on designing machine intelligence, but also have important implications on energy-efficient neuromorphic computations. In this project, we focus on restricted Boltzmann machine, a two-layer feed-forward architecture, and its deep variants, and study how the model works and how its components (e.g., neurons, synapses, and even layers) interact to yield the network's expressive power. We will use physics-based approximations to identify key computational principles of representation learning (feature extraction), which may pave the way towards understanding information processing mechanisms of (deep) unsupervised learning systems, designing new types of architectures and algorithms, and developing associated mean-field theory.
近年来,神经网络作为强大的工具广泛应用于模式识别,语音识别,自然语言处理,甚至是多体物理研究等领域。神经网络对大数据的分析能力经验上认为来源于其深层表征,但由于网络本身嵌套的多层非线性计算等复杂性,神经计算的工作原理仍然是一个黑箱;而无监督学习作为神经计算最重要的研究方向之一,其目标是揭示原始(无标签)数据中的隐藏结构。对于无监督学习多层表征工作机制的理解将有可能打开理解感知学习基本规律的大门。因此,本研究项目将以无监督学习的基本神经网络架构---受限玻尔兹曼机及其深层堆叠为基本研究对象,运用甚至发展平均场理论阐述该模型工作的机理,即组成网络的神经元,神经突触连接,以及隐层间是如何相互作用的。基于物理近似的原则,本研究项目有望不仅能从原理上理解神经计算规则,而且能进一步改进模型,从而推进神经网络在无标签数据隐藏特征提取中的应用,并且为最终揭示无监督学习的信息处理机制打下基础。

结项摘要

该青年基金项目主要研究无监督学习(包括深度表示)的物理本质及其第一性原理启发的算法。在该基金的资助下,3年来项目负责人课题组取得了一系列突破。(1)阐述了浅层无监督学习的物理本质。数据驱动模型出现一系列自发对称性破缺:首先是自旋反转对称性破缺,最后是神经元交换对称性破缺。而且,关于数据规律的先验强烈影响两类对称性破缺的位置和形式。这些成果总结在了J. Phys. A 长文形式和Phys Rev Lett 短文形式。(2)由原理启发提出了无监督学习的变分平均场算法。该算法为处理离散权重值受限玻尔兹曼机的第一个算法,发现了无监督学习的等价网络,揭示了数据、权重和神经元活动三者在学习过程中的相互作用形式。这些成果总结在了Phys Rev E快速通讯形式。(3)循环无监督学习的规范变换对称破缺模型。该模型囊括了经典Hopfield,短程延迟赫布模型,揭示了记忆景观可由微观突触整合时间窗口重塑,并且,发现了超越经典MP律的新型随机矩阵谱。这些成果以两篇长文形式在Phys Rev E背靠背发表。(4)深度学习的物理模型。首先,项目负责人课题组阐述了考虑权重关联的无监督深度网络的平均场理论机制,发现了权重关联不仅可以增强逐层的神经元活动关联水平,也可以减弱逐层维度下降的强度。理论预言与经验结果一致,总结在了Phys Rev E长文形式。其次,项目负责人课题组从统计系综角度构建了深度学习的信用分配物理模型,解释了深度网络的宏观输出与网络参数涨落之间的因果联系,这些成果总结在Phys Rev Lett 短文形式。最后,项目负责人课题组还提出了深度学习权重空间的近似伊辛模型,理论预言了深度学习液态内核的存在并在具体算法设计进行了验证,这些成果总结在Phys Rev Research长文。该青年基金项目从科学上解释了浅层无监督学习的本质,并启发了深度学习模型的构建和系统分析,对未来更加深入系统的工作机制探究具有指导意义。这一系列研究成果汇集成了英文专著《神经网络的统计力学》于2022年由Springer和高等教育出版社联合出版。.

项目成果

期刊论文数量(9)
专著数量(1)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Variational mean-field theory for training restricted Boltzmann machines with binary synapses
用于训练具有二元突触的受限玻尔兹曼机的变分平均场理论
  • DOI:
    --
  • 发表时间:
    2020
  • 期刊:
    Phys. Rev. E
  • 影响因子:
    --
  • 作者:
    Haiping Huang
  • 通讯作者:
    Haiping Huang
Minimal model of permutation symmetry in unsupervised learning
无监督学习中排列对称性的最小模型
  • DOI:
    10.5194/gmd-2023-194
  • 发表时间:
    2019
  • 期刊:
    J. Phys. A: Math. Theor.
  • 影响因子:
    --
  • 作者:
    Tianqi Hou;K Y Michael Wong;Haiping Huang
  • 通讯作者:
    Haiping Huang
Statistical physics of unsupervised learning with prior knowledge in neural networks
神经网络中利用先验知识进行无监督学习的统计物理学
  • DOI:
    10.1103/physrevlett.124.248302
  • 发表时间:
    2020
  • 期刊:
    Phys. Rev. Lett
  • 影响因子:
    --
  • 作者:
    Tianqi Hou;Haiping Huang
  • 通讯作者:
    Haiping Huang
Learning credit assignment
学习学分分配
  • DOI:
    10.1103/physrevlett.125.178301
  • 发表时间:
    2020
  • 期刊:
    Phys. Rev. Lett.
  • 影响因子:
    --
  • 作者:
    Chan Li;Haiping Huang
  • 通讯作者:
    Haiping Huang
Relationship between manifold smoothness and adversarial vulnerability in deep learning with local errors
具有局部误差的深度学习中流形平滑度与对抗脆弱性之间的关系
  • DOI:
    10.1088/1674-1056/abd68e
  • 发表时间:
    2021
  • 期刊:
    Chinese Physics. B
  • 影响因子:
    --
  • 作者:
    Jiang Zijian;Zhou Jianwen;Huang Haiping
  • 通讯作者:
    Huang Haiping

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

粗晶硬质合金硬度和强度影响因素的分析研究
  • DOI:
    10.1093/gigascience/giy163
  • 发表时间:
    2012
  • 期刊:
    稀有金属与硬质合金
  • 影响因子:
    --
  • 作者:
    黄海平;许方;胡咏梅;郑彪华
  • 通讯作者:
    郑彪华
基于Agent和XML的普适计算上下文集成框架
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机技术与发展
  • 影响因子:
    --
  • 作者:
    宋立森;王汝传;叶宁;马守明;黄海平;蔡晓磊
  • 通讯作者:
    蔡晓磊
基于簇内分组的ECC密钥管理方案
  • DOI:
    10.1016/j.bbr.2012.12.027
  • 发表时间:
    --
  • 期刊:
    计算机技术与发展
  • 影响因子:
    --
  • 作者:
    谭志刚;黄海平;王汝传;孙力娟
  • 通讯作者:
    孙力娟
基于(t,n)门限和划分树的可再生散列链构造方案
  • DOI:
    --
  • 发表时间:
    2013
  • 期刊:
    通信学报
  • 影响因子:
    --
  • 作者:
    黄海平;戴庭;王汝传;秦小麟;陈九天
  • 通讯作者:
    陈九天
有向传感器网络覆盖控制策略
  • DOI:
    --
  • 发表时间:
    2011
  • 期刊:
    通信学报
  • 影响因子:
    --
  • 作者:
    李靖;王汝传;黄海平;孙力娟;肖甫;蒋凌云
  • 通讯作者:
    蒋凌云

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码