制約充足確率に基づく強化学習による組合せ最適化問題の解法に関する基礎的研究
基于约束满足概率的强化学习求解组合优化问题的基础研究
基本信息
- 批准号:22K12158
- 负责人:
- 金额:$ 2.66万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2022
- 资助国家:日本
- 起止时间:2022-04-01 至 2025-03-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
2022年度は、深層強化学習を実際の物流業務における配送時間制約付き配車計画問題に適用するための準備として、巡回セールスマン問題 (TSP) を深層強化学習を用いて解く手法おける報酬の改善方法について検討した。また、制約充足確率に拡張する予定である成功確率に基づく安全な強化学習の手法を深層強化学習に拡張する方法について検討した。実際の物流業務においては、複数の配送先が非常に近い位置にあることがある。配送先が離れている場合には経路を変更すると経路長が大きく変わるが、配送先が非常に近い位置にある場合には経路を変更しても経路長がほとんど変わらない。先行研究において提案された最短経路長を新しく作成した経路長の差分(改善分)を報酬とする手法においては、このような問題に対しては報酬が非常に小さくなり、学習が進まなくなってしまう。そこで本研究では、平方根を用いた報酬関数を導入することによって、1より小さい報酬を増加させるとともに1より大きい報酬を減少させる方法を開発した。この手法を実際の運送会社の配送経路探索問題に適用し、配送先が非常に近い位置に密集している問題において有効であることを確認した。この成果については、2023年6月に熊本で開催される2023年度人工知能学会全国大会(第37回)において発表する予定である。また、我々がこれまでに開発した成功確率に基づく安全な強化学習の手法 EQ を深層強化学習の手法である DQN をベースとして Variable Autoencoder (VAE) を用いて成功し続ける確率を推定する手法 DEQN に拡張した。この成果については、2022年度6月に京都で開催された2022年度人工知能学会全国大会(第36回)において発表した。
2022财年,为了将深度强化学习应用于实际物流操作中具有交货时间限制的车辆调度计划问题,我们将研究使用深度强化学习解决旅行商问题(TSP)的方法中的补偿方法。考虑了一下。我们还考虑了如何将基于成功概率的安全强化学习方法(计划扩展到约束满足概率)扩展到深度强化学习。在实际物流操作中,多个交货目的地可能彼此非常接近。如果配送目的地较远,则即使改变路线,路线长度也会发生较大变化,但如果配送目的地很近,则即使改变路线,路线长度也几乎不会变化。在之前的研究中提出的奖励是最短路径长度和新创建的路径长度之间的差异(改进)的方法中,此类问题的奖励很小并且学习没有进展。因此,在本研究中,我们开发了一种通过引入使用平方根的奖励函数来增加小于 1 的奖励并减少大于 1 的奖励的方法。我们将该方法应用于实际航运公司的送货路线搜索问题,并证实该方法对于送货目的地聚集在非常接近的位置的问题是有效的。研究结果将于2023年6月在熊本举行的日本人工智能学会2023年全国会议(第37届)上公布。此外,我们将我们开发的基于成功概率的安全强化学习方法 EQ 与基于深度强化 DQN 的使用可变自动编码器(VAE)估计持续成功概率的方法 DEQN 相结合。学习方法扩展。这些结果于2022年6月在京都举行的日本人工智能学会2022年全国会议(第36届)上公布。
项目成果
期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
DQNに基づく連続観測空間における安全な強化学習
基于DQN的连续观察空间安全强化学习
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:大橋 宥斗;松井 藤五郎;武藤 敦子;森山 甲一;犬塚 信博
- 通讯作者:犬塚 信博
組合せ最適化におけるジャンピングとアテンションを用いたグラフニューラルネットワーク
在组合优化中使用跳跃和注意力的图神经网络
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:グェンフウ バオロン;松井 藤五郎;原 謙介
- 通讯作者:原 謙介
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
松井 藤五郎其他文献
モデル植物の購買履歴からの変異体選択支援システム
基于模型工厂购买历史的变型选择支持系统
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
佐藤 貴命;賀屋 秀隆;松井 藤五郎;朽津 和幸;大和田 勇人 - 通讯作者:
大和田 勇人
POSデータを用いた注文傾向による店舗間の関係分析
使用 POS 数据根据订单趋势分析商店之间的关系
- DOI:
- 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
安井 彰悟;武藤 敦子;森山 甲一;松井 藤五郎;犬塚 信博 - 通讯作者:
犬塚 信博
Multi-Domain HMMsearch : マルチドメインを持つ遠縁なタンパク質のための相同性検索ツール
多域 HMMsearch:具有多个域的远缘相关蛋白质的同源搜索工具
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
瀬下 真吾;賀屋 秀隆;松井 藤五郎;朽津 和幸;大和田 勇人 - 通讯作者:
大和田 勇人
HMMプロファイルの類似性に着目した遠縁の相同体検出手法の提案
关注HMM轮廓相似度的远亲同源检测方法的提出
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
河村 真平;賀屋 秀隆;松井 藤五郎;朽津 和幸;大和田 勇人 - 通讯作者:
大和田 勇人
ネットワーク構造を導入したコミュニティ活動モデル
引入网络结构的社区活动模型
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
甲村 啓伍;武藤 敦子;松井 藤五郎;森山 甲一;犬塚 信博 - 通讯作者:
犬塚 信博
松井 藤五郎的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('松井 藤五郎', 18)}}的其他基金
ファイナンスにおける時系列解析のための強化学習に関する基礎的研究
强化学习在金融时间序列分析中的基础研究
- 批准号:
21700175 - 财政年份:2009
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
相似海外基金
mHealth Center for Discovery, Optimization, and Translation of Temporally-Precise Interventions (mDOT)
时间精确干预措施的发现、优化和转化移动医疗中心 (mDOT)
- 批准号:
10541801 - 财政年份:2020
- 资助金额:
$ 2.66万 - 项目类别:
mHealth Center for Discovery, Optimization, and Translation of Temporally-Precise Interventions (mDOT)
时间精确干预措施的发现、优化和转化移动医疗中心 (mDOT)
- 批准号:
10025130 - 财政年份:2020
- 资助金额:
$ 2.66万 - 项目类别:
AMAUTA HEALTH INFORMATICS RESEARCH AND TRAINING PROGRAM
AMAUTA 健康信息学研究和培训计划
- 批准号:
7249492 - 财政年份:2004
- 资助金额:
$ 2.66万 - 项目类别:
MINORITY MENTAL HEALTH RESEARCH SCHOLARS PROGRAM
少数民族心理健康研究学者计划
- 批准号:
7231640 - 财政年份:1998
- 资助金额:
$ 2.66万 - 项目类别:
MINORITY MENTAL HEALTH RESEARCH SCHOLARS PROGRAM
少数民族心理健康研究学者计划
- 批准号:
7649042 - 财政年份:1998
- 资助金额:
$ 2.66万 - 项目类别: