データ活用制御手法の信頼性向上にむけた確率雑音の効用解析
随机噪声提高数据利用控制方法可靠性的有效性分析
基本信息
- 批准号:21J14577
- 负责人:
- 金额:$ 0.96万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for JSPS Fellows
- 财政年份:2021
- 资助国家:日本
- 起止时间:2021-04-28 至 2023-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
確率雑音が制御システムにおける学習にもたらす効用解析を目的として,最適制御におけるエントロピー正則化の研究に取り組んだ.離散時間線形システムの初期状態分布と目標分布がガウス分布で与えられたときに,終端時刻で状態分布を目標分布に一致させる制御問題を考えた.制御コストを二次形式と制御方策のエントロピー正則化項で与えたとき,コスト最小化解が陽に与えられることを示した.さらにその解がエントロピー正則化最適輸送問題の最適解を与えることを示した.エントロピー正則化は強化学習・最適輸送において,そして分布のダイナミクスは生成モデル(拡散モデル)において注目されており,最適制御を通してこれらをつなげる興味深い結果が得られたといえる.また分布ダイナミクスに関連して,多数の振動子から成る群を一つの確率分布でモデリングし,振動子全体に共通の制御入力を与えることで振動子分布を目標分布へ収束させる問題に取り組んだ.振動子が雑音に駆動される場合,振動子分布を目標分布と完全に一致させることは一般にできない課題があった.そこで本研究では,L2距離の意味で目標分布の近くに留まる振動子分布の軌道を最適化で設計,そしてその軌道へ振動子分布が任意の初期分布から収束できる制御方策を設計するアプローチを提案した.さらに提案法の収束性を証明した.また,エントロピー正則化と同様に制御方策の確率性を促進させる「Kullback-Leibler(KL)制御問題」を考察した.従来のKL制御は遷移分布の可制御性に関する仮定をおくことで,最適解が効率的に計算できることが知られていたが,状態空間が連続な場合,その仮定は非現実的なものであった.そこで本研究ではKL制御の定式化を適切に修正することで,連続状態空間における非現実的な仮定の除去ができ,連続空間においてもKL制御の利点が享受できるようになった.
我们研究了最佳控制熵正则化的研究,目的是分析随机噪声带来控制系统中学习的效用。我们考虑一个控制问题,其中初始状态分布和离散时间线性系统的目标分布作为高斯分布,并且状态分布与结束时的目标分布一致。结果表明,当以二次形式给出控制成本和控制策略的熵正则项时,成本最小化解决方案将明确给出。此外,已经表明该解决方案为熵正规化的最佳运输问题提供了最佳解决方案。熵正则化引起了人们对增强学习和最佳运输的关注,并且分布动力学在生成模型(扩散模型)中引起了人们的注意,可以说,通过通过最佳控制将它们链接来获得有趣的结果。此外,与分布动力学有关,我们已经解决了建模由许多具有单个概率分布的振荡器组成的组的问题,并向整个振荡器提供了共同的控制输入,以将振荡器分布收敛到目标分布。当传感器由噪声驱动时,通常很难使传感器分布与目标分布完全匹配。因此,在这项研究中,我们提出了一种设计振荡器分布轨迹的方法,该方法在L2距离的意义上保持在目标分布附近,并设计了一种控制策略,该策略允许振荡器分布从任意初始分布收敛到该轨迹。此外,证明了所提出的方法的收敛性。我们还讨论了“ Kullback-Leibler(KL)控制问题”,该问题促进了控制策略的概率性质,类似于熵正则化。众所周知,常规KL控制可以通过对过渡分布的可控性进行假设来有效地计算最佳解决方案,但是当状态空间连续时,假设是不现实的。因此,在这项研究中,通过正确修改KL控制的制定,可以消除连续状态空间中的不现实假设,并且在连续空间中也可以享受KL控制的优势。
项目成果
期刊论文数量(24)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
線形動的システムにおけるベイジアン差分プライバシー
线性动态系统中的贝叶斯差分隐私
- DOI:
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:石丸太一;鈴木素之;高野翔太;山口亞由太;杉浦 玄宜,伊藤 海斗,加嶋 健司
- 通讯作者:杉浦 玄宜,伊藤 海斗,加嶋 健司
Sinkhornアルゴリズムを活用した動的システム上の最適輸送
使用 Sinkhorn 算法优化动态系统运输
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Misa Kawaguchi;Harumi Yagi;Ryuta X. Suzuki;Masakazu Muto;Yuichiro Nagatsu;Yoshiyuki Tagawa;伊藤 海斗,加嶋 健司
- 通讯作者:伊藤 海斗,加嶋 健司
Entropic model predictive optimal transport over dynamical systems
熵模型预测动力系统上的最佳传输
- DOI:10.1016/j.automatica.2023.110980
- 发表时间:2023
- 期刊:
- 影响因子:6.4
- 作者:Ito Kaito;Kashima Kenji
- 通讯作者:Kashima Kenji
離散時間エントロピー正則化最適制御と雑音応答の関係について
离散时间熵正则化最优控制与噪声响应的关系
- DOI:
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:石丸太一;鈴木素之;伊藤 海斗,加嶋 健司
- 通讯作者:伊藤 海斗,加嶋 健司
離散時間線形システムに対するエントロピー正則化最適分布制御
离散时间线性系统的熵正则化最优分布控制
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:目見田 匠;松田 真司;水野 智仁;石丸太一,鈴木素之,小森朝陽,高野翔太;伊藤 海斗,加嶋 健司
- 通讯作者:伊藤 海斗,加嶋 健司
共 10 条
- 1
- 2
伊藤 海斗的其他基金
最適制御の応用可能性を拡げる最大エントロピー制御理論の開拓
发展最大熵控制理论,扩大最优控制的适用范围
- 批准号:24K1729724K17297
- 财政年份:2024
- 资助金额:$ 0.96万$ 0.96万
- 项目类别:Grant-in-Aid for Early-Career ScientistsGrant-in-Aid for Early-Career Scientists
超大規模群制御の構造を組み込んだ確率分布制御理論の開拓
发展结合超大规模群控制结构的概率分布控制理论
- 批准号:23K1911723K19117
- 财政年份:2023
- 资助金额:$ 0.96万$ 0.96万
- 项目类别:Grant-in-Aid for Research Activity Start-upGrant-in-Aid for Research Activity Start-up
相似海外基金
幾何学的方法による緑内障データに対する機械学習法の構築
使用几何方法构建青光眼数据的机器学习方法
- 批准号:23K1694123K16941
- 财政年份:2023
- 资助金额:$ 0.96万$ 0.96万
- 项目类别:Grant-in-Aid for Early-Career ScientistsGrant-in-Aid for Early-Career Scientists
最適輸送理論のための最適化手法と機械学習への応用
最佳运输理论的优化方法及其在机器学习中的应用
- 批准号:22K1217522K12175
- 财政年份:2022
- 资助金额:$ 0.96万$ 0.96万
- 项目类别:Grant-in-Aid for Scientific Research (C)Grant-in-Aid for Scientific Research (C)
Research and development of nonlinear Selective Inference for high-dimensional and small number of samples data
高维小样本数据非线性选择性推理研究进展
- 批准号:20H0424320H04243
- 财政年份:2020
- 资助金额:$ 0.96万$ 0.96万
- 项目类别:Grant-in-Aid for Scientific Research (B)Grant-in-Aid for Scientific Research (B)
A novel approach to EEG focusing on non-sinusoidal properties of neural oscillations
一种关注神经振荡非正弦特性的脑电图新方法
- 批准号:19K1689119K16891
- 财政年份:2019
- 资助金额:$ 0.96万$ 0.96万
- 项目类别:Grant-in-Aid for Early-Career ScientistsGrant-in-Aid for Early-Career Scientists
将来型宇宙輸送に向けた革新的スクラムジェットの熱空力解析と統合最適化
用于未来太空运输的创新超燃冲压发动机的热空气动力学分析和集成优化
- 批准号:17K2014417K20144
- 财政年份:2019
- 资助金额:$ 0.96万$ 0.96万
- 项目类别:Fund for the Promotion of Joint International Research (Home-Returning Researcher Development Research)Fund for the Promotion of Joint International Research (Home-Returning Researcher Development Research)