Basic framework of the asymptotic best-response model with deep-reinforcement learning in the traffic simulation applications

交通仿真应用中深度强化学习渐近最佳响应模型的基本框架

基本信息

项目摘要

本研究は、交通システムを利用する個々のユーザーを個別の意思決定者と捉え、特に経路選択行動を対象にゲーム論的なマルチユーザーシステムとしてモデル化し、その日々の選択行動を学習モデルして定式化し、短期政策効果をシミュレーションする手法の確立を目的としている。本研究で提案された手法を漸近的最適応答(ABR)モデルと呼び、確率的・動的に変動するネットワーク分析に有用である。ABRの動的安定性解析は微分包含で表され、再帰的な複数Nash均衡に収束する。ABRはミクロ交通流シミュレーションモデルと併用することにより、シミュレーションベースの動的経路選択モデルとして機能するが、非連続な交通費用関数の場合を含む複雑なコスト関数の場合にも適用可能であり、また、異なる時間価値のマルチユーザーの場合にもNash均衡に収束する点で汎用性がある。このような離散的動的モデルの実用性をさらに高めるために、深層強化学習と組み合わせることにより、追い越し行動などのドライバーのより複雑な挙動をモデル化することが当該年度の課題であった。しかし、シングルユーザーの場合の解析は終了したもののマルチユーザーの場合のシステムの安定性が課題として残された。ABRは、利用者の自己組織的な学習行動に基礎を置くが、交通システムの実際の運用においては道路管理者がユーザーに交通情報を提供することによって何らかの形で介入することも必要になろう。この目的のため、ゲーミフィケーションを用いた道路交通マネージメントの可能性を検討課題とした。すなわち、行動変容には内発的な動機付けのみならず外発的動機付けも必要であるとのアイデアである。ABRとゲーミフィケーションは全く異なるアプローチに思えるが強化学習理論の枠内で統一的なモデル化が可能である。
这项研究旨在建立一种方法,以查看使用运输系统作为个别决策者的个体用户,尤其是将路线选择行为建模为游戏理论多用户系统,学习模型和制定日常选择行为以及模拟短期政策效果。本研究中提出的方法称为渐近最佳响应(ABR)模型,对于随机和动态变化的网络分析非常有用。 ABR的动态稳定性分析表示为差分包含,并收敛到递归的多纳什平衡。当与微流量流仿真模型结合使用时,ABR作为基于模拟的动态路线选择模型的功能,但适用于复杂的成本功能,包括不连续的交通成本功能,并且具有多种多项,因为它在具有不同时间值的多用户的NASH平衡中收敛。为了进一步增强此类离散动态模型的实用性,当年的挑战是通过将它们与深度强化学习相结合来对驾驶员的更复杂行为(例如超车行为)进行建模。但是,尽管对单个用户的分析已经完成,但多用户用户的系统稳定性仍然是一个问题。尽管ABR基于用户的自组织学习行为,但在交通系统的实际操作中,道路经理也有必要通过向用户提供流量信息来以某种方式进行干预。为此,考虑了使用游戏化的道路交通管理的可能性。换句话说,这个想法是行为改变不仅需要内在动机,还需要外在动机。尽管ABR和游戏化似乎是完全不同的方法,但它们可以在强化学习理论的框架内建立统一。

项目成果

期刊论文数量(12)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Investigation of Changes in Passenger Behavior Using Longitudinal Smart Card Data
Social Dynamics Simulation Using a Multi-Layer Network
  • DOI:
    10.3390/su132413744
  • 发表时间:
    2021-12
  • 期刊:
  • 影响因子:
    3.9
  • 作者:
    Nao Sugiki;S. Nagao;F. Kurauchi;Mustafa Mutahari;Kojiro Matsuo
  • 通讯作者:
    Nao Sugiki;S. Nagao;F. Kurauchi;Mustafa Mutahari;Kojiro Matsuo
How Does Travel Demand Follow the Change in Infrastructure? Multiple-Year Eigenvector Centrality Analysis
  • DOI:
    10.3390/su132313366
  • 发表时间:
    2021-12
  • 期刊:
  • 影响因子:
    3.9
  • 作者:
    Hiroe Ando;F. Kurauchi
  • 通讯作者:
    Hiroe Ando;F. Kurauchi
Estimation of Transfer Time Distribution Parameters with Automatic Fare Collection Data: Stochastic Frontier Model
利用自动售检票数据估计换乘时间分布参数:随机前沿模型
深層学習による高速道路の渋滞ナウキャストに関する研究
基于深度学习的高速公路拥堵实时预报研究
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    川本 義海;瀧 駿佑;堀江祐希,朝岡良浩,古川仁志;杜然,倉内文孝
  • 通讯作者:
    杜然,倉内文孝
共 10 条
  • 1
  • 2
前往

宮城 俊彦其他文献

全国都道府県産業連関表による地域間産業連関構造の分析
利用全国地市级投入产出表分析区域间投入产出结构
都市鉄道整備における費用負担スキームの比較分析
城市轨道交通建设成本分摊方案比较分析
Some Aspects of the Combined Trip Distribution and Assignment Model Derived from the User Equilibrium Concept
从用户均衡概念导出的组合出行分配和指派模型的某些方面
  • DOI:
  • 发表时间:
    1986
    1986
  • 期刊:
  • 影响因子:
    0
  • 作者:
    宮城 俊彦;吉田 俊和
    宮城 俊彦;吉田 俊和
  • 通讯作者:
    吉田 俊和
    吉田 俊和
独立した輸送部門を前提にした地域間交易モデル
基于独立运输部门的区域间贸易模式
氷解モデルを基礎とした地域間交易モデルの基本構造:応用一般均衡モデルによるアプローチ
基于融冰模型的区域间贸易模型的基本结构:应用一般均衡模型的方法
共 5 条
  • 1
前往

宮城 俊彦的其他基金

ネットワーク競争の理論と公共政策への応用に関する研究
网络竞争理论及其在公共政策中的应用研究
  • 批准号:
    03650433
    03650433
  • 财政年份:
    1991
  • 资助金额:
    $ 2.75万
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
    Grant-in-Aid for General Scientific Research (C)
非集計選択行動理論を基礎としたネットワーク均衡問題とその解法
基于分类选择行为理论的网络均衡问题及其求解
  • 批准号:
    59750433
    59750433
  • 财政年份:
    1984
  • 资助金额:
    $ 2.75万
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
    Grant-in-Aid for Encouragement of Young Scientists (A)
交通均衡モデルを基礎とした交通量の区間予測法とその計画概念に関する研究
基于交通平衡模型的交通量预测方法及其规划理念研究
  • 批准号:
    X00210----575344
    X00210----575344
  • 财政年份:
    1980
  • 资助金额:
    $ 2.75万
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
    Grant-in-Aid for Encouragement of Young Scientists (A)