強化学習エージェントのための生態学的ニッチ固有の制約構造を活用した状態分割法

利用生态位特定约束结构的强化学习代理的状态划分方法

基本信息

  • 批准号:
    15700159
  • 负责人:
  • 金额:
    $ 1.6万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
  • 财政年份:
    2003
  • 资助国家:
    日本
  • 起止时间:
    2003 至 2004
  • 项目状态:
    已结题

项目摘要

近年,ニューラルネットや強化学習,進化計算のような学習機構を取り入れた自律移動ロボットに関する研究が盛んである.しかしながら,現状では,たとえ高性能な学習機構を取り入れていても,地面のすべりや背景といった環境特有の情報,エージェントのアクチュエータやセンサの特性といった生態学的ニッチ固有の制約構造を巧く活用しないとロボットは全く機能しない.本研究では,自律的に知覚・行動を行う強化学習エージェントに対して与えられた生態学的ニッチ固有の制約構造を活用するための状態分割法を提案しその有用性を示した.提案手法では,知覚-行動-知覚という系列について,状態分割の整合性を検査し,矛盾が検出されるたびにさらなる分割を生じることによりその矛盾解消を試みる.すなわち,ある時刻における知覚入力に対して状態を割り当てるような状態分割器を考える.そして,行動を行った結果として生じる知覚入力を状態分割器に与え,状態を得る.系列をエージェントが行動するたびに蓄えていき,矛盾検出とその解消を行う.提案手法では、階層的な情報処理による状態分割を行うメカニズムを有し、階層は情報の縮約を、上位層は階層で縮約を行ったニューロンが発火した際に、次時刻ではどのような知覚変化を引き起こすかを予測している。この予測の精度にもとづいて状態分割を構成している。本年度は、この研究課題で新たに提案を行った上記の状態分割法について、車の山登り問題へ適用した研究について2004年7月にブダペストで行われたIJCNN04にて成果発表を行った。また状態だけではなく行動の分節化を行うようなアルゴリズムの拡張について検討した。
近年来,研究一直在自动移动机器人上越来越受欢迎,这些移动机器人结合了学习机制,例如神经网络,增强学习和进化计算。但是,目前,即使采用了高性能学习机制,机器人也根本无法发挥作用,而无需熟练利用环境特定的信息,例如接地滑移和背景以及代理执行器和传感器的特性。在这项研究中,我们提出了一种国家划分方法,以利用对执行自主感知和行为的强化学习者的生态细分特异性约束结构,并证明了其有用性。所提出的方法是一系列感知性能感知的序列。 ,我们试图通过检查国家划分的一致性并在检测到冲突时建立进一步的划分来解决矛盾。换句话说,我们认为在特定时间将状态分配给感知输入的状态分隔线。然后,我们向状态分隔线提供了由动作产生的感知输入,并获得了状态。每次代理行动时,我们都会存储序列,并执行矛盾的检测和分辨率。在提出的方法中,我们使用层次信息处理有一种国家分裂的机制,其中层次结构预测信息的凝结,并且较高的层预测下一次在层中减少神经元的神经元火灾的神经元发生的情况下会发生什么样的感知变化。国家划分是根据该预测的准确性构建的。今年,我们在2004年7月在布达佩斯举行的IJCNN04上提出了上述国家分区方法的结果,该研究对汽车的登山问题应用于2004年7月。我们还研究了不仅陈述而且行动的算法的扩展。

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Hisashi HANDA: "State Space Construction of Reinforcement Learning Agents Based upon Anticipated Sensory Changes"International Joint Conference on Neural Networks. (採録決定). (2004)
Hisashi HANDA:“基于预期感官变化的强化学习代理的状态空间构建”神经网络国际联合会议(已接受)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

半田 久志其他文献

Panam Nagar 歴史地区におけるレンガの実測と元素分析 バングラデシュにおける歴史的建造物の評価と保存方法に関する基礎的研究(その3)
帕南纳加尔历史街区砖块实测与元素分析 孟加拉国历史建筑评价与保护方法基础研究(三)
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    川上浩司;平岡 敏洋;小北 麻記子;半田 久志;谷口 忠大;塩瀬 隆之;岡田 美智男;泉 朋子;仲谷 善雄;西本 一志;須藤 秀紹;白川 智弘;矢野 温子 / 井上 朝雄 / 谷 正和 / 岸 泰子;矢野 温子 / 井上 朝雄 / 谷 正和 / 岸 泰子;矢野温子,井上朝雄,谷正和,岸泰子;矢野温子,井上朝雄,谷正和,岸泰子;下田千晴,井上朝雄,谷正和,田上健一,岸泰子,土屋潤,麻生美希,矢野温子,真鍋晧平;真鍋皓平,井上朝雄,谷正和,岸泰子,田上健一,土屋潤,麻生美紀,矢野温子,下田千晴;Huda Mohammed Faisal,谷正和,田上健一,井上朝雄,土屋潤,岸泰子;土屋潤,下田千晴,谷正和,井上朝雄,麻生美希,Md. Huda Faisal;土屋潤,谷正和,井上朝雄,麻生美希,フダ モハンマド ファイサル,有田誠
  • 通讯作者:
    土屋潤,谷正和,井上朝雄,麻生美希,フダ モハンマド ファイサル,有田誠
Heritage Creation in Chittagong Through the challenges of Adaptive Reuse of PK Sen Sattala
吉大港遗产创建应对 PK Sen Sattala 适应性再利用的挑战
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    川上浩司;平岡 敏洋;小北 麻記子;半田 久志;谷口 忠大;塩瀬 隆之;岡田 美智男;泉 朋子;仲谷 善雄;西本 一志;須藤 秀紹;白川 智弘;矢野 温子 / 井上 朝雄 / 谷 正和 / 岸 泰子;矢野 温子 / 井上 朝雄 / 谷 正和 / 岸 泰子;矢野温子,井上朝雄,谷正和,岸泰子;矢野温子,井上朝雄,谷正和,岸泰子;下田千晴,井上朝雄,谷正和,田上健一,岸泰子,土屋潤,麻生美希,矢野温子,真鍋晧平;真鍋皓平,井上朝雄,谷正和,岸泰子,田上健一,土屋潤,麻生美紀,矢野温子,下田千晴;Huda Mohammed Faisal,谷正和,田上健一,井上朝雄,土屋潤,岸泰子
  • 通讯作者:
    Huda Mohammed Faisal,谷正和,田上健一,井上朝雄,土屋潤,岸泰子
Precancerous nature of intestinal metaplasia with accelerated DNA methylation along with altered epigenomic landscape
肠化生的癌前性质伴随着 DNA 甲基化加速以及表观基因组景观的改变
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    玉井 龍成;米田 頼晃;印牧 奨真;樫田 博史;工藤 正俊;半田 久志;米田頼晃 半田久志 工藤正俊;長谷川翔;Chihiro Takeuchi;Chihiro Takeuchi;Chihiro Takeuchi
  • 通讯作者:
    Chihiro Takeuchi
鉄骨考古学によるイギリス植民地時代の建築年代特定に関する研究 その6Panam Nagar の歴史的建造物の年代特定
利用钢铁考古学研究英国殖民建筑年代测定第 6 部分:帕南纳加尔历史建筑年代测定
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    川上浩司;平岡 敏洋;小北 麻記子;半田 久志;谷口 忠大;塩瀬 隆之;岡田 美智男;泉 朋子;仲谷 善雄;西本 一志;須藤 秀紹;白川 智弘;矢野 温子 / 井上 朝雄 / 谷 正和 / 岸 泰子;矢野 温子 / 井上 朝雄 / 谷 正和 / 岸 泰子;矢野温子,井上朝雄,谷正和,岸泰子;矢野温子,井上朝雄,谷正和,岸泰子;下田千晴,井上朝雄,谷正和,田上健一,岸泰子,土屋潤,麻生美希,矢野温子,真鍋晧平;真鍋皓平,井上朝雄,谷正和,岸泰子,田上健一,土屋潤,麻生美紀,矢野温子,下田千晴
  • 通讯作者:
    真鍋皓平,井上朝雄,谷正和,岸泰子,田上健一,土屋潤,麻生美紀,矢野温子,下田千晴
進行肝細胞癌におけるAteozolizumab/Bevacizumab併用療法中の早期病勢進行(PD)予測因子としての末梢血血管新生分子の解析
分析外周血血管生成分子作为晚期肝细胞癌 Ateozolizumab/贝伐单抗联合治疗期间早期疾病进展 (PD) 的预测因子
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    玉井 龍成;米田 頼晃;印牧 奨真;樫田 博史;工藤 正俊;半田 久志;米田頼晃 半田久志 工藤正俊;長谷川翔;Chihiro Takeuchi;Chihiro Takeuchi;Chihiro Takeuchi;Chihiro Takeuchi;大浦杏子
  • 通讯作者:
    大浦杏子

半田 久志的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('半田 久志', 18)}}的其他基金

機械学習を援用した進化計算による有機薄膜太陽電池に適した化合物の探索
使用机器学习的进化计算来搜索适合有机薄膜太阳能电池的化合物
  • 批准号:
    23K11254
  • 财政年份:
    2023
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Evolutionary Search of Structured Data by Using Deep Graph Kernels
使用深度图内核进行结构化数据的进化搜索
  • 批准号:
    20K12000
  • 财政年份:
    2020
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)

相似海外基金

Clarification of Ubiquitous Proton Function in Photoreceptive Proteins by Quantum Molecular Dynamics Simulations
通过量子分子动力学模拟阐明感光蛋白中普遍存在的质子功能
  • 批准号:
    18H05264
  • 财政年份:
    2018
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Scientific Research (S)
Development of analysis method of transition state for improvement of enzymatic function
改进酶功能的过渡态分析方法的开发
  • 批准号:
    16KT0166
  • 财政年份:
    2016
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Development of integrated simulation method for elucidation of electronic properties of nanostructures
开发阐明纳米结构电子特性的集成模拟方法
  • 批准号:
    26286085
  • 财政年份:
    2014
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Development of the geminal-based quantum chemical theory and its application to nanomagnetic devices
基于孪生的量子化学理论的发展及其在纳米磁性器件中的应用
  • 批准号:
    22750016
  • 财政年份:
    2010
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
Development of functional ANOVA models for multi-state survival data and its applications
多状态生存数据函数方差分析模型的开发及其应用
  • 批准号:
    20300099
  • 财政年份:
    2008
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了