電気探査法と生物的適応アルゴリズムによる3次元海中センシングシステムの構築
利用电探测方法和生物适应算法构建3D水下传感系统
基本信息
- 批准号:17656285
- 负责人:
- 金额:$ 2.05万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Exploratory Research
- 财政年份:2005
- 资助国家:日本
- 起止时间:2005 至 2007
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
これまでの研究実績において製作した水中電気探査装置を利用して、電気探査センサから得られたデータを解釈してより高い精度でセンサ周囲に存在する物体の形状や電気的特性を推定するための解析方法について検討を行い、前年度の研究実績において開発した順解析手法のための3次元有限要素モデルの改良を行った。データ解釈のための逆解析に必要なアルゴリズムについては、生物的適応アルゴリズムについては、高次元の状態入力と行動出力の環境においてより効率良く強化学習を行うため、割引報酬合計の期待値に関して、今までのように1次微分だけでなく2次微分の方向まで考慮に入れた「自然勾配」の方向へ政策を改善していく自然勾配Actor-Critic法に注目し、これと「適正度の履歴」を組み合わせることで、状態観測が不完全なためマルコフ性が保障されない環境下においても頑健に強化学習を行うことが可能な新しいアルゴリズムを提案した。また、前年度の研究実績において提案したランダムタイリングによる特徴量ベクトル生成方法において、ランダムタイルの個数と、任意の2入力によって生成される特徴ベクトルの線形独立性との関係を定量的に示し、空間をグリッド分割した場合との比較を行うことで、提案手法が高次元の入力空間において特徴量の爆発を防ぎつつ極めて高い汎化性能を示す理由についての定量的解析を行った。このランダムタイリングによる状態-行動空間汎化とGibbsサンプリングを用いた行動選択による高次元状態-行動空間における強化学習アルゴリズムは、ロボティクス分野において定評のある国際会議IEEE/RSJ International Conference on Intelligent Robots and Systems(IROSO7採択率49%)において研究発表を行い、新しい生物的適応アルゴリズムとして高く評価された。
使用我们迄今为止在研究中创建的水下电勘探设备,我们的目标是解释从电勘探传感器获得的数据,并以更高的精度估计传感器周围物体的形状和电特性,我们研究了分析方法并改进了。三维有限元模型为前一年研究成果中开发的正演分析方法。关于数据解释的逆分析所需的算法,关于生物适应算法,为了在具有高维状态输入和行为输出的环境中更有效地执行强化学习,我们目前正在考虑总贴现奖励的期望值作为。之前,我们不仅考虑一阶导数,还考虑二阶导数的方向。通过关注自然梯度 Actor-Critic 方法,该方法在“自然梯度”方向上改进策略,并将其与“适当性历史”相结合,我们可以解决由于不完整的状态观察而无法保证马尔可夫属性的环境。提出了一种新算法,即使在以下条件下也可以稳健地执行强化学习。此外,在前一年的研究成果中提出的使用随机分块的特征向量生成方法中,我们通过与所提出的方法进行比较,定量论证了随机分块的数量与任意两个输入生成的特征向量的线性独立性之间的关系。在空间划分为网格的情况下,我们定量分析了所提出的方法在防止高维输入空间中特征爆炸的同时表现出极高泛化性能的原因。这种在高维状态动作空间中使用使用随机平铺的状态动作空间泛化和使用吉布斯采样的动作选择的强化学习算法是在国际会议 IEEE/RSJ 国际智能机器人和系统会议上介绍了我们的研究。在IROSO7(接受率:49%)上,作为一种新的生物适应算法获得了高度评价。
项目成果
期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Reinforcement learning in multi-dimensional state-action space using random rectangular coarse coding and Gibbs sampling
- DOI:10.1109/iros.2007.4399401
- 发表时间:2007-12
- 期刊:
- 影响因子:0
- 作者:K. Kimura
- 通讯作者:K. Kimura
ランダムタイリングとGibbs-samplingを用いた多次元状態-行動空間における強化学習
使用随机平铺和吉布斯采样在多维状态动作空间中进行强化学习
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:大久保 誠介;高 秀君;福井 勝則;木村 元
- 通讯作者:木村 元
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
木村 元其他文献
A study of issues about Meta Pedagogy : Towards an epistemological approach to the trends of theories on character formation and pedagogic pactice
关于元教育学问题的研究:对性格形成和教育实践理论趋势的认识论方法
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
木村元;本田伊克;木村 元;木村 元;Hajime Kimura - 通讯作者:
Hajime Kimura
メタ・ペダゴジーをめぐる諸問題-人間形成論の新動向とペダゴジー
围绕元教育学的问题 - 人类发展理论和教育学的新趋势
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
木村 元;本田伊克 - 通讯作者:
本田伊克
II部5章、豊岡校での東井義雄-ライフヒストリーとペダゴジー
第二部分第5章,丰冈学校的东井义夫 - 生活史和教育学
- DOI:
- 发表时间:
2009 - 期刊:
- 影响因子:0
- 作者:
泊史;大西公江;前田晶子;大西公恵;木村 元 - 通讯作者:
木村 元
東井義雄研究を通して考えたいこと-教育の社会史からの接近
我想通过东井义夫的研究来思考什么——教育社会史的方法
- DOI:
- 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
篠田一希;山田哲也;木村 元;久冨善之;前田晶子;久冨善之;Fumi Tomari & Yoshiyuki Kudomi;木村 元 - 通讯作者:
木村 元
III部1章1節 学校の制度化と教育実践-1930から50年代の教育をめぐる状況
第三部分第一章第一节学校制度化与教育实践——20世纪30年代至1950年代的教育状况
- DOI:
- 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
篠田一希;山田哲也;木村 元;久冨善之;前田晶子;久冨善之;Fumi Tomari & Yoshiyuki Kudomi;木村 元;前田晶子;木村 元・久冨善之;木村 元;木村 元;篠田一希;山田哲也;篠田一希;篠田一希;久冨善之;福島裕敏;眞原里実;泊 史;仲嶺政光;富澤知佳子;泊 史;木村 元 - 通讯作者:
木村 元
木村 元的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('木村 元', 18)}}的其他基金
社会学理論に基づく文理融合研究:環境フローを鍵とした物質的・社会的側面の総合記述
基于社会学理论的跨学科研究:以环境流为关键的物质社会层面的综合描述
- 批准号:
24K15400 - 财政年份:2024
- 资助金额:
$ 2.05万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
日本の学校を支える基本カテゴリーの再検討:修得主義と履修主義の歴史性に着目して
重新考虑支持日本学校的基本类别:关注基于掌握和基于课程的历史性
- 批准号:
24K05610 - 财政年份:2024
- 资助金额:
$ 2.05万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
膵癌微小環境においてCCR2を介した膵癌細胞とマクロファージの関係の検討
胰腺癌微环境中CCR2介导的胰腺癌细胞与巨噬细胞关系的研究
- 批准号:
24K18482 - 财政年份:2024
- 资助金额:
$ 2.05万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
量子論及び量子情報理論における普遍則
量子理论和量子信息论中的普遍规则
- 批准号:
24K06873 - 财政年份:2024
- 资助金额:
$ 2.05万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Aspects of the conflict between education and care that supports children's lives: Seikatsu Kyoiku in the 1930s to 1950s
教育与支持儿童生活的保育之间的冲突的各个方面:1930 年代至 1950 年代的生活教育
- 批准号:
21K02166 - 财政年份:2021
- 资助金额:
$ 2.05万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
国際法学における少数者の保護と「人権」概念再考
保护少数群体并重新思考国际判例中的“人权”概念
- 批准号:
11J56103 - 财政年份:2011
- 资助金额:
$ 2.05万 - 项目类别:
Grant-in-Aid for JSPS Fellows
真核生物ゲノムの機械的特性と生物学的意義
真核基因组的机械特性和生物学意义
- 批准号:
09J07137 - 财政年份:2009
- 资助金额:
$ 2.05万 - 项目类别:
Grant-in-Aid for JSPS Fellows
力学的半群を用いた量子散逸ダイナミクスの分類
使用机械半群对量子耗散动力学进行分类
- 批准号:
03J01133 - 财政年份:2003
- 资助金额:
$ 2.05万 - 项目类别:
Grant-in-Aid for JSPS Fellows
入試に規制される学力の史的研究-戦前中等学校入学者選抜法ならびに試験問題の分析-
入学考试调节学力的历史研究——战前中学入学选拔方式及试题分析——
- 批准号:
04710145 - 财政年份:1992
- 资助金额:
$ 2.05万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
戦前中等学校入学者選抜法および試験問題の分析に基づく近代日本の学力の史的研究
基于战前中学入学选拔方法和试题分析的近代日本学术能力历史研究
- 批准号:
03710121 - 财政年份:1991
- 资助金额:
$ 2.05万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
Cotask-Aware Offloading and Scheduling in Mobile-Edge Computing Systems
移动边缘计算系统中的协同任务感知卸载和调度
- 批准号:
19K21539 - 财政年份:2018
- 资助金额:
$ 2.05万 - 项目类别:
Grant-in-Aid for Research Activity Start-up
Collaboration technique of human and machine-learning for speed up of problem solving and its application for smart grid operations
加速问题解决的人机学习协作技术及其在智能电网运营中的应用
- 批准号:
15K00321 - 财政年份:2015
- 资助金额:
$ 2.05万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Efficient Actor-Critic and Policy-Gradient Methods for Reinforcement Learning
用于强化学习的高效 Actor-Critic 和策略梯度方法
- 批准号:
405275-2011 - 财政年份:2013
- 资助金额:
$ 2.05万 - 项目类别:
Postdoctoral Fellowships
Robust Actor-Critic Algorithms for Reinforcement Learning.
用于强化学习的稳健的 Actor-Critic 算法。
- 批准号:
443153-2013 - 财政年份:2013
- 资助金额:
$ 2.05万 - 项目类别:
Alexander Graham Bell Canada Graduate Scholarships - Master's
Efficient Actor-Critic and Policy-Gradient Methods for Reinforcement Learning
用于强化学习的高效 Actor-Critic 和策略梯度方法
- 批准号:
405275-2011 - 财政年份:2012
- 资助金额:
$ 2.05万 - 项目类别:
Postdoctoral Fellowships