強化学習による適応的制御を用いたプラズマの複合制御の実現

利用强化学习的自适应控制实现等离子体的复杂控制

基本信息

项目摘要

令和4年度はJT-60SAにおける電流分布と圧力分布の複合制御システムの研究開発を進めた。安全係数の最小値を1.5以上に維持しながら、規格化ベータ値が3.0とする制御を学習させた。内部輸送障壁を持つ先進プラズマ運転に対する信頼性の高い複合制御を実現することを目指し、学習時には内部輸送障壁における熱輸送の低減度合い(輸送障壁の強さ)に幅を持たせて学習を行った。しかし、輸送障壁の強さが大きく異なるプラズマでは、複合制御に必要な制御が大きく異なり、単一のニューラルネットワークで適切な制御を学習することが困難であることが明らかになった。そこで、学習時の輸送障壁の強さを複数の範囲に分割して、それぞれの限定された輸送障壁の強さを持つプラズマに対する複合制御を強化学習した複数のニューラルネットワークを用意した。さらに、強化学習を行う中で得られたプラズマシミュレーションの結果を利用して、計測データから輸送障壁の強さを判定するニューラルネットワークの学習を行った。このニューラルネットワークが判定する輸送障壁の強さに応じて制御に使用するニューラルネットワークを切り替える、二段階のシステムを構築することで、幅広い輸送障壁の強さに対して安全係数と規格化ベータ値の複合制御を実現した。
2020财年,我们对JT-60SA的电流分配和压力分配联合控制系统进行了研发。我们训练控制以将安全系数的最小值维持在 1.5 或更高,同时将标准化 beta 值维持在 3.0。为了实现具有内部传输势垒的先进等离子体操作的高度可靠的复合控制,对内部传输势垒处的热传输减少程度(传输势垒强度)进行了学习。然而,在传输势垒强度变化很大的等离子体中,复杂控制所需的控制差异很大,并且很明显,用单个神经网络很难学习适当的控制。因此,我们将学习过程中的传输势垒强度分为多个范围,并准备了多个神经网络,对每个有限传输势垒强度的等离子体的复杂控制进行强化学习。此外,利用强化学习过程中获得的等离子体模拟结果,我们训练了一个神经网络,该网络可以根据测量数据确定传输障碍的强度。通过构建一个两级系统,根据该神经网络判断的传输障碍的强度来切换用于控制的神经网络,可以针对各种传输障碍强度调整安全系数和归一化β值,从而实现复合。控制。

项目成果

期刊论文数量(8)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
JT-60SAに向けたプラズマ制御手法の開発
JT-60SA等离子控制方法的开发
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    若月 琢馬
  • 通讯作者:
    若月 琢馬
Investigation of q-profile and normalized beta control in JT-60SA using reinforcement learning
使用强化学习研究 JT-60SA 中的 q 分布和归一化 beta 控制
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    T. Wakatsuki; T. Suzuki; N. Hayashi; M. Yoshida
  • 通讯作者:
    M. Yoshida
Safety factor profile control with reduced central solenoid flux consumption during plasma current ramp-up phase using a reinforcement learning technique
使用强化学习技术在等离子电流上升阶段减少中央螺线管通量消耗的安全系数曲线控制
  • DOI:
    10.1088/1741-4326/ab1571
  • 发表时间:
    2019-04-02
  • 期刊:
  • 影响因子:
    3.3
  • 作者:
    琢馬 若月;隆博 鈴木;直幸 大山;伸彦 林;俊介 井手
  • 通讯作者:
    俊介 井手
小特集 プラズマ・インフォマティクス -データ駆動科学のプラズマへの応用 4.トカマクプラズマ運転への応用展開
专题:等离子体信息学 - 数据驱动科学在等离子体中的应用 4。
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    若月 琢馬 ; 横山 達也 ; 大山 直幸 ; 山田 弘司
  • 通讯作者:
    山田 弘司
Investigation of q-profile and normalized beta control in JT-60SA using reinforcement learning
使用强化学习研究 JT-60SA 中的 q 分布和归一化 beta 控制
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    T. Wakatsuki; T. Suzuki; N. Hayashi; M. Yoshida
  • 通讯作者:
    M. Yoshida
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

若月 琢馬其他文献

若月 琢馬的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('若月 琢馬', 18)}}的其他基金

球状トカマクにおける低域混成波を用いた電流立ち上げシナリオの実証
在球形托卡马克中使用低频混合波演示电流上升场景
  • 批准号:
    13J09787
  • 财政年份:
    2013
  • 资助金额:
    $ 1.83万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows

相似海外基金

CAREER: Intelligent Battery Management with Safe, Efficient, Fast-Adaption Reinforcement Learning and Physics-Inspired Machine Learning: From Cells to Packs
职业:具有安全、高效、快速适应的强化学习和物理启发机器学习的智能电池管理:从电池到电池组
  • 批准号:
    2340194
  • 财政年份:
    2024
  • 资助金额:
    $ 1.83万
  • 项目类别:
    Continuing Grant
EAGER: Exploring Automatic Optimization of Multi-tiered HPC Storage Systems via Practical Reinforcement Learning
EAGER:通过实用强化学习探索多层 HPC 存储系统的自动优化
  • 批准号:
    2412345
  • 财政年份:
    2024
  • 资助金额:
    $ 1.83万
  • 项目类别:
    Standard Grant
昆虫の歩行データ駆動型逆強化学習から探る脚協調制御則の設計論
从昆虫步态数据驱动的逆强化学习探索腿部协调控制律的设计理论
  • 批准号:
    24KJ0341
  • 财政年份:
    2024
  • 资助金额:
    $ 1.83万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Cross-Layer Uncertainty-Aware Reinforcement Learning for Safe Autonomous Driving
用于安全自动驾驶的跨层不确定性感知强化学习
  • 批准号:
    EP/Y002644/1
  • 财政年份:
    2024
  • 资助金额:
    $ 1.83万
  • 项目类别:
    Research Grant
Learning to Reason in Reinforcement Learning
在强化学习中学习推理
  • 批准号:
    DP240103278
  • 财政年份:
    2024
  • 资助金额:
    $ 1.83万
  • 项目类别:
    Discovery Projects
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了