再帰的強化学習を用いた言語理解・発話計画機構の開発

使用递归强化学习开发语言理解和话语规划机制

基本信息

项目摘要

本研究はヒトの言語理解の機構の本質的部分を抽象化した「模型」を作り、世に示すことを目的としている。また、知識獲得の性能を飛躍的に向上させるために、知的エージェントの脳・身体が持つべき機構を、神経科学・認知科学・言語学・論理学などの周辺分野の知見を参考にして明らかにする。「開発フレームワークの実装」に関しては、AIエージェントどうしが論理式に似た形式で対話する機構の実装、行動ルール記述言語のデバッグ支援機構の機能拡張を行った。 「ヒトが解くべきタスクの性質への対応」に関しては、生物一般の報酬関数や対話の際のサブゴールなどについて考察を進めた。 「アーキテクチャの実装と評価」に関しては、AIエージェントに発話と言語理解を行うためのプリミティブを追加し、簡単なテストプログラムを用いて対話動作の確認を行った。 「アルゴリズムの効率化」に関しては、エージェントの自律的行動ルール獲得の実現に向けて、行動価値関数を表現するテーブルの効率的圧縮アルゴリズムを実装し評価した。また、確率的グラフィカルモデルにおける変分近似法について調査した。 「並列処理方式の開発」に関しては、Julia言語を用いた高性能並列実行環境の構築を行った。 「周辺分野の知見との関係の解明」に関しては、言語学における関連性理論、機械学習理論における belief MDP、計算論的神経科学における海馬神経回路モデルと提案アーキテクチャとの間の関係の考察、理論言語学における組み合わせ範疇文法を用いた人間らしい構文解析を行うための文法の開発、「なぜ」「だから」を含む文の意味に関する論理学的な分析を行った。
这项研究的目的是创建一个“模型”,抽象出人类语言理解机制的基本部分并将其呈现给世界。此外,为了大幅提高知识获取的性能,我们将参考神经科学、认知科学、语言学、逻辑学等外围领域的知识,阐明智能体的大脑和身体应具备的机制。它。关于“开发框架的实现”,我们实现了AI代理以类似于逻辑表达式的格式相互交互的机制,并扩展了行为规则描述语言的调试支持机制的功能。关于“回应人类必须解决的任务的本质”,我们继续考虑生物体的一般奖励功能和对话过程中的子目标。关于“架构的实现和评估”,我们向人工智能代理添加了原语以执行语音和语言理解,并使用简单的测试程序确认了交互行为。关于“提高算法的效率”,我们对表达动作价值函数的表实现并评估了一种高效的压缩算法,旨在实现智能体对动作规则的自主获取。我们还研究了随机图模型中的变分逼近方法。关于“并行处理方法的开发”,我们使用Julia语言构建了高性能并行执行环境。关于“与周围领域知识的关系的阐明”,我们将讨论语言学中的相关性理论、机器学习理论中的信念MDP、计算神经科学中海马神经回路模型和所提出的架构之间的关系的考虑以及我们的理论。利用语言学中的组合范畴语法开发了一种类似于人类句法分析的语法,并对包含“why”和“therefore”的句子的含义进行了逻辑分析。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
組合せ範疇文法によるドイツ語文の原因・結果関係の意味表示
使用组合范畴语法表示德语句子中因果关系的含义
Julia言語を用いた高性能並列実行環境の構築
使用Julia语言构建高性能并行执行环境
Design and prototype implementation of a communication mechanism for reward-maximizing AGI
奖励最大化 AGI 通信机制的设计和原型实现
  • DOI:
    10.11517/jsaisigtwo.2022.agi-021_02
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    一杉 裕志;中田 秀基;高橋 直人;竹内 泉;佐野 崇
  • 通讯作者:
    佐野 崇
確率的グラフィカルモデルにおける変分近似法
随机图模型中的变分逼近方法
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    一杉 裕志;中田 秀基;高橋 直人;竹内 泉;佐野 崇;開 智志,伊藤 秀昭,福本 尚生,和久屋 寛;佐野 崇
  • 通讯作者:
    佐野 崇
Philosophers and AI
哲学家和人工智能
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    一杉 裕志;中田 秀基;高橋 直人;竹内 泉;佐野 崇;開 智志,伊藤 秀昭,福本 尚生,和久屋 寛;佐野 崇;板橋 直哉,伊藤 秀昭,福本 尚生,和久屋 寛;竹内泉
  • 通讯作者:
    竹内泉
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

一杉 裕志其他文献

部分観測マルコフ決定過程におけるbelief構造を利用したAlphaZeroアルゴリズムの開発
在部分观察的马尔可夫决策过程中使用信念结构开发 AlphaZero 算法
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    一杉 裕志;中田 秀基;高橋 直人;竹内 泉;佐野 崇;開 智志,伊藤 秀昭,福本 尚生,和久屋 寛
  • 通讯作者:
    開 智志,伊藤 秀昭,福本 尚生,和久屋 寛
模倣報酬を用いた強化学習による二足歩行コントローラの獲得
通过使用模仿奖励的强化学习获得双足行走控制器
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    一杉 裕志;中田 秀基;高橋 直人;竹内 泉;佐野 崇;開 智志,伊藤 秀昭,福本 尚生,和久屋 寛;佐野 崇;板橋 直哉,伊藤 秀昭,福本 尚生,和久屋 寛
  • 通讯作者:
    板橋 直哉,伊藤 秀昭,福本 尚生,和久屋 寛
圧力センサを使用した描画ロボットの開発
使用压力传感器的绘图机器人的开发
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    一杉 裕志;中田 秀基;高橋 直人;竹内 泉;佐野 崇;開 智志,伊藤 秀昭,福本 尚生,和久屋 寛;佐野 崇;板橋 直哉,伊藤 秀昭,福本 尚生,和久屋 寛;竹内泉;二宮 慶生,伊藤 秀昭,福本 尚生,和久屋 寛
  • 通讯作者:
    二宮 慶生,伊藤 秀昭,福本 尚生,和久屋 寛
プログラム合成対象言語 Pro5Lang のための行動価値関数圧縮アルゴリズム
程序合成目标语言Pro5Lang的动作值函数压缩算法
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    一杉 裕志;中田 秀基;高橋 直人;竹内 泉;佐野 崇
  • 通讯作者:
    佐野 崇

一杉 裕志的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

Construction of an integrated cognitive architecture based on ACT-R and POMDP theory and its application
基于ACT-R和POMDP理论的集成认知架构构建及应用
  • 批准号:
    22K12195
  • 财政年份:
    2022
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
合意形成メカニズムに基づく感性-認知アーキテクチャの構築
基于共识机制的感性认知架构构建
  • 批准号:
    20H01748
  • 财政年份:
    2020
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Construction of a comprehensive cognitive architecture based on the POMDP theory and its application to physical RPA
基于POMDP理论的综合认知架构构建及其在物理RPA中的应用
  • 批准号:
    19K12157
  • 财政年份:
    2019
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
ロボットの統合認知アーキテクチャによる実世界に根ざした言語的思考の実現
通过机器人集成认知架构实现植根于现实世界的语言思维
  • 批准号:
    19J23364
  • 财政年份:
    2019
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Development of a Cognitive Architecture Based on Narrative-Based World Representation and Communication
基于叙事的世界表征和交流的认知架构的开发
  • 批准号:
    18K18344
  • 财政年份:
    2018
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了