強化学習エージェントのための生態学的ニッチ固有の制約構造を活用した状態分割法
利用生态位特定约束结构的强化学习代理的状态划分方法
基本信息
- 批准号:15700159
- 负责人:
- 金额:$ 1.6万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Young Scientists (B)
- 财政年份:2003
- 资助国家:日本
- 起止时间:2003 至 2004
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
近年,ニューラルネットや強化学習,進化計算のような学習機構を取り入れた自律移動ロボットに関する研究が盛んである.しかしながら,現状では,たとえ高性能な学習機構を取り入れていても,地面のすべりや背景といった環境特有の情報,エージェントのアクチュエータやセンサの特性といった生態学的ニッチ固有の制約構造を巧く活用しないとロボットは全く機能しない.本研究では,自律的に知覚・行動を行う強化学習エージェントに対して与えられた生態学的ニッチ固有の制約構造を活用するための状態分割法を提案しその有用性を示した.提案手法では,知覚-行動-知覚という系列について,状態分割の整合性を検査し,矛盾が検出されるたびにさらなる分割を生じることによりその矛盾解消を試みる.すなわち,ある時刻における知覚入力に対して状態を割り当てるような状態分割器を考える.そして,行動を行った結果として生じる知覚入力を状態分割器に与え,状態を得る.系列をエージェントが行動するたびに蓄えていき,矛盾検出とその解消を行う.提案手法では、階層的な情報処理による状態分割を行うメカニズムを有し、階層は情報の縮約を、上位層は階層で縮約を行ったニューロンが発火した際に、次時刻ではどのような知覚変化を引き起こすかを予測している。この予測の精度にもとづいて状態分割を構成している。本年度は、この研究課題で新たに提案を行った上記の状態分割法について、車の山登り問題へ適用した研究について2004年7月にブダペストで行われたIJCNN04にて成果発表を行った。また状態だけではなく行動の分節化を行うようなアルゴリズムの拡張について検討した。
近年来,对自主移动机器人进行的研究,包括神经网等学习机制,增强的学习和进化计算,除非生态利基特异性结构,例如环境,代理的特征和传感器将根本不起作用。行动感是在国家划分中保持一致的,并试图通过每次检测到矛盾来消除矛盾对状态分裂的感知输入,每次代理人行动时都会存储状态,并且矛盾检测及其分辨率。下次点燃了层次结构的神经元时,会导致感知的改变。根据该预测的准确性配置了状态拆分。今年,我们宣布了上述状态分区方法的结果,该方法在本研究问题上是在2004年7月在布达佩斯进行的IJCNN04上新提出的,涉及应用于登山问题的研究。此外,我们不仅检查了执行行为化的算法的状态,而且还研究了扩展。
项目成果
期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Hisashi HANDA: "State Space Construction of Reinforcement Learning Agents Based upon Anticipated Sensory Changes"International Joint Conference on Neural Networks. (採録決定). (2004)
Hisashi HANDA:“基于预期感官变化的强化学习代理的状态空间构建”神经网络国际联合会议(已接受)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
半田 久志其他文献
Heritage Creation in Chittagong Through the challenges of Adaptive Reuse of PK Sen Sattala
吉大港遗产创建应对 PK Sen Sattala 适应性再利用的挑战
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
川上浩司;平岡 敏洋;小北 麻記子;半田 久志;谷口 忠大;塩瀬 隆之;岡田 美智男;泉 朋子;仲谷 善雄;西本 一志;須藤 秀紹;白川 智弘;矢野 温子 / 井上 朝雄 / 谷 正和 / 岸 泰子;矢野 温子 / 井上 朝雄 / 谷 正和 / 岸 泰子;矢野温子,井上朝雄,谷正和,岸泰子;矢野温子,井上朝雄,谷正和,岸泰子;下田千晴,井上朝雄,谷正和,田上健一,岸泰子,土屋潤,麻生美希,矢野温子,真鍋晧平;真鍋皓平,井上朝雄,谷正和,岸泰子,田上健一,土屋潤,麻生美紀,矢野温子,下田千晴;Huda Mohammed Faisal,谷正和,田上健一,井上朝雄,土屋潤,岸泰子 - 通讯作者:
Huda Mohammed Faisal,谷正和,田上健一,井上朝雄,土屋潤,岸泰子
Panam Nagar 歴史地区におけるレンガの実測と元素分析 バングラデシュにおける歴史的建造物の評価と保存方法に関する基礎的研究(その3)
帕南纳加尔历史街区砖块实测与元素分析 孟加拉国历史建筑评价与保护方法基础研究(三)
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
川上浩司;平岡 敏洋;小北 麻記子;半田 久志;谷口 忠大;塩瀬 隆之;岡田 美智男;泉 朋子;仲谷 善雄;西本 一志;須藤 秀紹;白川 智弘;矢野 温子 / 井上 朝雄 / 谷 正和 / 岸 泰子;矢野 温子 / 井上 朝雄 / 谷 正和 / 岸 泰子;矢野温子,井上朝雄,谷正和,岸泰子;矢野温子,井上朝雄,谷正和,岸泰子;下田千晴,井上朝雄,谷正和,田上健一,岸泰子,土屋潤,麻生美希,矢野温子,真鍋晧平;真鍋皓平,井上朝雄,谷正和,岸泰子,田上健一,土屋潤,麻生美紀,矢野温子,下田千晴;Huda Mohammed Faisal,谷正和,田上健一,井上朝雄,土屋潤,岸泰子;土屋潤,下田千晴,谷正和,井上朝雄,麻生美希,Md. Huda Faisal;土屋潤,谷正和,井上朝雄,麻生美希,フダ モハンマド ファイサル,有田誠 - 通讯作者:
土屋潤,谷正和,井上朝雄,麻生美希,フダ モハンマド ファイサル,有田誠
Precancerous nature of intestinal metaplasia with accelerated DNA methylation along with altered epigenomic landscape
肠化生的癌前性质伴随着 DNA 甲基化加速以及表观基因组景观的改变
- DOI:
- 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
玉井 龍成;米田 頼晃;印牧 奨真;樫田 博史;工藤 正俊;半田 久志;米田頼晃 半田久志 工藤正俊;長谷川翔;Chihiro Takeuchi;Chihiro Takeuchi;Chihiro Takeuchi - 通讯作者:
Chihiro Takeuchi
鉄骨考古学によるイギリス植民地時代の建築年代特定に関する研究 その6Panam Nagar の歴史的建造物の年代特定
利用钢铁考古学研究英国殖民建筑年代测定第 6 部分:帕南纳加尔历史建筑年代测定
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
川上浩司;平岡 敏洋;小北 麻記子;半田 久志;谷口 忠大;塩瀬 隆之;岡田 美智男;泉 朋子;仲谷 善雄;西本 一志;須藤 秀紹;白川 智弘;矢野 温子 / 井上 朝雄 / 谷 正和 / 岸 泰子;矢野 温子 / 井上 朝雄 / 谷 正和 / 岸 泰子;矢野温子,井上朝雄,谷正和,岸泰子;矢野温子,井上朝雄,谷正和,岸泰子;下田千晴,井上朝雄,谷正和,田上健一,岸泰子,土屋潤,麻生美希,矢野温子,真鍋晧平;真鍋皓平,井上朝雄,谷正和,岸泰子,田上健一,土屋潤,麻生美紀,矢野温子,下田千晴 - 通讯作者:
真鍋皓平,井上朝雄,谷正和,岸泰子,田上健一,土屋潤,麻生美紀,矢野温子,下田千晴
進行肝細胞癌におけるAteozolizumab/Bevacizumab併用療法中の早期病勢進行(PD)予測因子としての末梢血血管新生分子の解析
分析外周血血管生成分子作为晚期肝细胞癌 Ateozolizumab/贝伐单抗联合治疗期间早期疾病进展 (PD) 的预测因子
- DOI:
- 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
玉井 龍成;米田 頼晃;印牧 奨真;樫田 博史;工藤 正俊;半田 久志;米田頼晃 半田久志 工藤正俊;長谷川翔;Chihiro Takeuchi;Chihiro Takeuchi;Chihiro Takeuchi;Chihiro Takeuchi;大浦杏子 - 通讯作者:
大浦杏子
半田 久志的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('半田 久志', 18)}}的其他基金
機械学習を援用した進化計算による有機薄膜太陽電池に適した化合物の探索
使用机器学习的进化计算来搜索适合有机薄膜太阳能电池的化合物
- 批准号:
23K11254 - 财政年份:2023
- 资助金额:
$ 1.6万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Evolutionary Search of Structured Data by Using Deep Graph Kernels
使用深度图内核进行结构化数据的进化搜索
- 批准号:
20K12000 - 财政年份:2020
- 资助金额:
$ 1.6万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
相似海外基金
Right Ventricular Remodeling in Tetralogy of Fallot
法洛四联症的右心室重构
- 批准号:
10708738 - 财政年份:2022
- 资助金额:
$ 1.6万 - 项目类别:
Clarification of Ubiquitous Proton Function in Photoreceptive Proteins by Quantum Molecular Dynamics Simulations
通过量子分子动力学模拟阐明感光蛋白中普遍存在的质子功能
- 批准号:
18H05264 - 财政年份:2018
- 资助金额:
$ 1.6万 - 项目类别:
Grant-in-Aid for Scientific Research (S)
Development of analysis method of transition state for improvement of enzymatic function
改进酶功能的过渡态分析方法的开发
- 批准号:
16KT0166 - 财政年份:2016
- 资助金额:
$ 1.6万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Development of integrated simulation method for elucidation of electronic properties of nanostructures
开发阐明纳米结构电子特性的集成模拟方法
- 批准号:
26286085 - 财政年份:2014
- 资助金额:
$ 1.6万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Development of the geminal-based quantum chemical theory and its application to nanomagnetic devices
基于孪生的量子化学理论的发展及其在纳米磁性器件中的应用
- 批准号:
22750016 - 财政年份:2010
- 资助金额:
$ 1.6万 - 项目类别:
Grant-in-Aid for Young Scientists (B)