データ活用制御手法の信頼性向上にむけた確率雑音の効用解析

随机噪声提高数据利用控制方法可靠性的有效性分析

基本信息

  • 批准号:
    21J14577
  • 负责人:
  • 金额:
    $ 0.96万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2021
  • 资助国家:
    日本
  • 起止时间:
    2021-04-28 至 2023-03-31
  • 项目状态:
    已结题

项目摘要

確率雑音が制御システムにおける学習にもたらす効用解析を目的として,最適制御におけるエントロピー正則化の研究に取り組んだ.離散時間線形システムの初期状態分布と目標分布がガウス分布で与えられたときに,終端時刻で状態分布を目標分布に一致させる制御問題を考えた.制御コストを二次形式と制御方策のエントロピー正則化項で与えたとき,コスト最小化解が陽に与えられることを示した.さらにその解がエントロピー正則化最適輸送問題の最適解を与えることを示した.エントロピー正則化は強化学習・最適輸送において,そして分布のダイナミクスは生成モデル(拡散モデル)において注目されており,最適制御を通してこれらをつなげる興味深い結果が得られたといえる.また分布ダイナミクスに関連して,多数の振動子から成る群を一つの確率分布でモデリングし,振動子全体に共通の制御入力を与えることで振動子分布を目標分布へ収束させる問題に取り組んだ.振動子が雑音に駆動される場合,振動子分布を目標分布と完全に一致させることは一般にできない課題があった.そこで本研究では,L2距離の意味で目標分布の近くに留まる振動子分布の軌道を最適化で設計,そしてその軌道へ振動子分布が任意の初期分布から収束できる制御方策を設計するアプローチを提案した.さらに提案法の収束性を証明した.また,エントロピー正則化と同様に制御方策の確率性を促進させる「Kullback-Leibler(KL)制御問題」を考察した.従来のKL制御は遷移分布の可制御性に関する仮定をおくことで,最適解が効率的に計算できることが知られていたが,状態空間が連続な場合,その仮定は非現実的なものであった.そこで本研究ではKL制御の定式化を適切に修正することで,連続状態空間における非現実的な仮定の除去ができ,連続空間においてもKL制御の利点が享受できるようになった.
我们对最优控制中的熵正则化进行了研究,目的是分析随机噪声对控制系统学习的影响。当离散时间线性系统的初始状态分布和目标分布以高斯分布形式给出时,我们考虑状态分布在终端时间与目标分布匹配的控制问题。结果表明,当控制成本由控制策略的二次形式和熵正则化项给出时,明确给出了成本最小化解。此外,结果表明该解给出了熵正则化最优传输问题的最优解。熵正则化在强化学习和最优传输中受到关注,分布动力学在生成模型(扩散模型)中受到关注,可以说通过最优控制将它们连接起来,得到了有趣的结果。关于分布动力学,我们通过对具有单一概率分布的一组许多振荡器进行建模并对所有振荡器应用公共控制输入来解决将振荡器分布收敛到目标分布的问题。当振荡器由噪声驱动时,通常不可能使振荡器分布与目标分布完全匹配。因此,在本研究中,我们提出了一种方法,使用优化来设计振荡分布的轨迹,使其在 L2 距离方面保持接近目标分布,然后设计一种控制策略,使振荡分布从任意值收敛到该轨迹的​​初始分布。此外,我们证明了所提出方法的收敛性。我们还考虑了“Kullback-Leibler (KL) 控制问题”,它促进了类似于熵正则化的控制策略的随机性。众所周知,传统的KL控制可以通过假设转移分布的可控性来有效地计算最优解,但是当状态空间连续时,这种假设是不现实的。因此,在本研究中,通过适当修改KL控制的公式,可以消除连续状态空间中不切实际的假设,并且即使在连续空间中也可以享受KL控制的好处。

项目成果

期刊论文数量(24)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Sinkhornアルゴリズムを活用した動的システム上の最適輸送
使用 Sinkhorn 算法优化动态系统运输
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Misa Kawaguchi;Harumi Yagi;Ryuta X. Suzuki;Masakazu Muto;Yuichiro Nagatsu;Yoshiyuki Tagawa;伊藤 海斗,加嶋 健司
  • 通讯作者:
    伊藤 海斗,加嶋 健司
線形動的システムにおけるベイジアン差分プライバシー
线性动态系统中的贝叶斯差分隐私
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    石丸太一;鈴木素之;高野翔太;山口亞由太;杉浦 玄宜,伊藤 海斗,加嶋 健司
  • 通讯作者:
    杉浦 玄宜,伊藤 海斗,加嶋 健司
Entropic model predictive optimal transport over dynamical systems
熵模型预测动力系统上的最佳传输
  • DOI:
    10.1016/j.automatica.2023.110980
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    6.4
  • 作者:
    Ito Kaito;Kashima Kenji
  • 通讯作者:
    Kashima Kenji
離散時間エントロピー正則化最適制御と雑音応答の関係について
离散时间熵正则化最优控制与噪声响应的关系
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    石丸太一;鈴木素之;伊藤 海斗,加嶋 健司
  • 通讯作者:
    伊藤 海斗,加嶋 健司
離散時間線形システムに対するエントロピー正則化最適分布制御
离散时间线性系统的熵正则化最优分布控制
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    目見田 匠;松田 真司;水野 智仁;石丸太一,鈴木素之,小森朝陽,高野翔太;伊藤 海斗,加嶋 健司
  • 通讯作者:
    伊藤 海斗,加嶋 健司
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

伊藤 海斗其他文献

伊藤 海斗的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('伊藤 海斗', 18)}}的其他基金

最適制御の応用可能性を拡げる最大エントロピー制御理論の開拓
发展最大熵控制理论,扩大最优控制的适用范围
  • 批准号:
    24K17297
  • 财政年份:
    2024
  • 资助金额:
    $ 0.96万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
超大規模群制御の構造を組み込んだ確率分布制御理論の開拓
发展结合超大规模群控制结构的概率分布控制理论
  • 批准号:
    23K19117
  • 财政年份:
    2023
  • 资助金额:
    $ 0.96万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up

相似海外基金

幾何学的方法による緑内障データに対する機械学習法の構築
使用几何方法构建青光眼数据的机器学习方法
  • 批准号:
    23K16941
  • 财政年份:
    2023
  • 资助金额:
    $ 0.96万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
最適輸送理論のための最適化手法と機械学習への応用
最佳运输理论的优化方法及其在机器学习中的应用
  • 批准号:
    22K12175
  • 财政年份:
    2022
  • 资助金额:
    $ 0.96万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Research and development of nonlinear Selective Inference for high-dimensional and small number of samples data
高维小样本数据非线性选择性推理研究进展
  • 批准号:
    20H04243
  • 财政年份:
    2020
  • 资助金额:
    $ 0.96万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
A novel approach to EEG focusing on non-sinusoidal properties of neural oscillations
一种关注神经振荡非正弦特性的脑电图新方法
  • 批准号:
    19K16891
  • 财政年份:
    2019
  • 资助金额:
    $ 0.96万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
将来型宇宙輸送に向けた革新的スクラムジェットの熱空力解析と統合最適化
用于未来太空运输的创新超燃冲压发动机的热空气动力学分析和集成优化
  • 批准号:
    17K20144
  • 财政年份:
    2019
  • 资助金额:
    $ 0.96万
  • 项目类别:
    Fund for the Promotion of Joint International Research (Home-Returning Researcher Development Research)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了