Development of Motion Generation Technology to Realize Robots that Perform Various Tasks according to Natural Language Instructions
开发运动生成技术以实现根据自然语言指令执行各种任务的机器人
基本信息
- 批准号:21H04910
- 负责人:
- 金额:$ 26.87万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (A)
- 财政年份:2021
- 资助国家:日本
- 起止时间:2021-04-05 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究の骨子は(A-1)言語指示からの環境・身体性非依存な動作記述生成、(A-2)力学的インタラクションに基づく動作系列の生成、(B-1) Inter-object centricprogrammingに基づいたAPIの実現、ならびに(B-2) 力学的インタラクションに基づいた作業模倣の4つとなる。このうち(A-1)について、昨年度から取り組みを開始した画像生成については、成功する場合もあるものの十分な性能を達成するところまでは至っていない。このため、現在は性能の向上に取り組んでいる。それに加え、以前より収集していた多数のキッチンでの調理を観測した大規模映像データに対して、昨年度策定のアノテーション基準に従ってアノテーションを開始している。(A-2)は昨年度、画像からわかる人と物体とのインタラクションの解析に注力するバックアッププランに転換をした。詳細動作認識のタスクで精度向上をすることができたが、動作抽出への応用などができていないため、十分なインタラクション解析技術の実現には至っていない。(B-1)について、特定の食材を取ってきてぶつ切りにし、皿へ移動するまでに必要なスキルセット、および、それらの組合せによる実際の切断を行うことができた。また、既存のシミュレーターを改修し、力学的インタラクションを考慮した食材切断のシミュレーター開発の取り組みを開始した。(B-2)について、昨年度開発した汎用性のあるグリッパによる食材把持技術を拡張し、未知食材についても把持を行う機械学習アルゴリズムを開発した。これにより、多様な食材を把持することができる状態となった。また、ぶつ切り以外の多様な切断パターンを生成する学習型アルゴリズムを開発した。これにより、把持と切断の個別タスクについては動作生成が可能になった。
这项研究的要点是(A-1)基于机械相互作用的运动序列(A-2)基于机械相互作用的API的运动序列(A-2)产生运动序列的(A-2)基于机械互动的API和(B-2)工作模仿。在这些(A-1)中,去年开始的图像产生已经成功,但尚未达到足够的性能。因此,我们目前正在努力提高我们的绩效。此外,根据去年为大规模视频数据制定的注释标准开始了注释,这些标准已针对以前收集过的许多厨房收集。去年,(A-2)改用了备份计划,该计划着重于分析可以通过图像看到的人与对象之间的相互作用。尽管通过详细运动识别的任务提高了精度,但尚未应用于运动提取,并且尚未实现足够的交互分析技术。关于(b-1),我们能够采用特定的成分并将其切成碎片,并实际上使用移动到盘子所需的技能以及这些组合所需的技能。此外,现有的模拟器已经进行了翻新,并开始努力开发一种考虑机械相互作用的食物切割模拟器。关于(B-2),我们扩展了去年开发的多功能抓地力食品抓地力技术,并开发了一种机器学习算法,该算法也可以吸引未知的食物。这使得可以掌握各种成分。我们还开发了一种学习算法,该算法会生成除切割以外的各种切割模式。这使得为抓地力和切割的单个任务生成动议。
项目成果
期刊论文数量(11)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Learning by Breaking: Food Fracture Anticipation for Robotic Food Manipulation
通过打破学习:机器人食物操作的食物破裂预期
- DOI:10.1109/access.2022.3207491
- 发表时间:2022
- 期刊:
- 影响因子:3.9
- 作者:Ishikawa Reina;Hamaya Masashi;Von Drigalski Felix;Tanaka Kazutoshi;Hashimoto Atsushi
- 通讯作者:Hashimoto Atsushi
BioVL2: An Egocentric Biochemical Video-and-Language Dataset
BioVL2:以自我为中心的生化视频和语言数据集
- DOI:10.5715/jnlp.29.1106
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Nishimura Taichi;Sakoda Kojiro;Ushiku Atsushi;Hashimoto Atsushi;Okuda Natsuko;Ono Fumihito;Kameko Hirotaka;Mori Shinsuke
- 通讯作者:Mori Shinsuke
State-aware video procedural captioning
- DOI:10.1007/s11042-023-14774-7
- 发表时间:2021-10
- 期刊:
- 影响因子:3.6
- 作者:Taichi Nishimura;Atsushi Hashimoto;Y. Ushiku;Hirotaka Kameko;Shinsuke Mori
- 通讯作者:Taichi Nishimura;Atsushi Hashimoto;Y. Ushiku;Hirotaka Kameko;Shinsuke Mori
Visual Recipe Flow: A Dataset for Learning Visual State Changes of Objects with Recipe Flows
- DOI:10.48550/arxiv.2209.05840
- 发表时间:2022-09
- 期刊:
- 影响因子:0
- 作者:Keisuke Shirai;Atsushi Hashimoto;Taichi Nishimura;Hirotaka Kameko;Shuhei Kurita;Y. Ushiku;Shinsuke Mori
- 通讯作者:Keisuke Shirai;Atsushi Hashimoto;Taichi Nishimura;Hirotaka Kameko;Shuhei Kurita;Y. Ushiku;Shinsuke Mori
共 11 条
- 1
- 2
- 3
橋本 敦史其他文献
画像・振動音・荷重データを統合的に用いた食材認識
综合使用图像、振动声音和负载数据进行食品识别
- DOI:
- 发表时间:20122012
- 期刊:
- 影响因子:0
- 作者:井上 仁;中村 和晃;舩冨 卓哉;橋本 敦史;上田 真由美;山肩 洋子;美濃 導彦井上 仁;中村 和晃;舩冨 卓哉;橋本 敦史;上田 真由美;山肩 洋子;美濃 導彦
- 通讯作者:美濃 導彦美濃 導彦
調理者の手と容器の位置関係を利用した「かき混ぜる」行動の認識
利用厨师的手和容器之间的位置关系识别“搅拌”行为
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:宮澤 飛鳥;中村 和晃;橋本 敦史;舩冨 卓哉;美濃 導彦宮澤 飛鳥;中村 和晃;橋本 敦史;舩冨 卓哉;美濃 導彦
- 通讯作者:美濃 導彦美濃 導彦
映像からのストーリー生成: イベント選択器と文生成器の同時学習
从视频生成故事:同时学习事件选择器和句子生成器
- DOI:
- 发表时间:20222022
- 期刊:
- 影响因子:0
- 作者:西村 太一;橋本 敦史;牛久 祥孝;森 信介西村 太一;橋本 敦史;牛久 祥孝;森 信介
- 通讯作者:森 信介森 信介
外れ値に頑健な顔のクラスタリング
离群值稳健的人脸聚类
- DOI:
- 发表时间:20162016
- 期刊:
- 影响因子:0
- 作者:伊奈 拓郎;橋本 敦史;飯山 将晃;笠原 秀一;森 幹彦;美濃 導彦伊奈 拓郎;橋本 敦史;飯山 将晃;笠原 秀一;森 幹彦;美濃 導彦
- 通讯作者:美濃 導彦美濃 導彦
料理と食を取り巻く情報メディア技術
围绕烹饪和食品的信息媒体技术
- DOI:
- 发表时间:20122012
- 期刊:
- 影响因子:0
- 作者:山肩 洋子;橋本 敦史;舩冨 卓哉;平松 紘実;辻 秀典;森 信介;山肩 洋子山肩 洋子;橋本 敦史;舩冨 卓哉;平松 紘実;辻 秀典;森 信介;山肩 洋子
- 通讯作者:山肩 洋子山肩 洋子
共 24 条
- 1
- 2
- 3
- 4
- 5
橋本 敦史的其他基金
物体操作を介した心的状態の推定
通过物体操纵来估计心理状态
- 批准号:16K1609916K16099
- 财政年份:2016
- 资助金额:$ 26.87万$ 26.87万
- 项目类别:Grant-in-Aid for Young Scientists (B)Grant-in-Aid for Young Scientists (B)
相似海外基金
実世界を検索可能とするクロスモーダル言語処理基盤の構築
构建跨模态语言处理平台,让现实世界可搜索
- 批准号:23K2816823K28168
- 财政年份:2024
- 资助金额:$ 26.87万$ 26.87万
- 项目类别:Grant-in-Aid for Scientific Research (B)Grant-in-Aid for Scientific Research (B)
実世界を検索可能とするクロスモーダル言語処理基盤の構築
构建跨模态语言处理平台,让现实世界可搜索
- 批准号:23H0347823H03478
- 财政年份:2023
- 资助金额:$ 26.87万$ 26.87万
- 项目类别:Grant-in-Aid for Scientific Research (B)Grant-in-Aid for Scientific Research (B)
7テスラMRI装置を用いたヒト脳におけるクロスモーダル抑制の神経機構の解明
使用 7 特斯拉 MRI 设备阐明人脑交叉模式抑制的神经机制
- 批准号:23K2001423K20014
- 财政年份:2023
- 资助金额:$ 26.87万$ 26.87万
- 项目类别:Grant-in-Aid for Research Activity Start-upGrant-in-Aid for Research Activity Start-up
相補的な音楽と画像の構成要素間における共起性を考慮した解釈可能な検索・変換の実現
考虑互补音乐和图像成分共现的可解释搜索和转换的实现
- 批准号:22K1801722K18017
- 财政年份:2022
- 资助金额:$ 26.87万$ 26.87万
- 项目类别:Grant-in-Aid for Early-Career ScientistsGrant-in-Aid for Early-Career Scientists
放射線診断学の画像とレポートを用いた深層学習の応用
使用诊断放射学图像和报告进行深度学习的应用
- 批准号:22K0766522K07665
- 财政年份:2022
- 资助金额:$ 26.87万$ 26.87万
- 项目类别:Grant-in-Aid for Scientific Research (C)Grant-in-Aid for Scientific Research (C)