Generic Object Recognition System using Deep Learning with Depth Images for Service Robots

使用深度学习和深度图像的服务机器人通用对象识别系统

基本信息

  • 批准号:
    19J11593
  • 负责人:
  • 金额:
    $ 1.34万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2019
  • 资助国家:
    日本
  • 起止时间:
    2019-04-25 至 2021-03-31
  • 项目状态:
    已结题

项目摘要

ホームサービスロボット向け物体認識システムの高性能化を目的とし(a)高精度化のためのDual Stream Convolutional Neural Network (DS-CNN) の実現,(b)高速化・低消費電力化のためのDS-CNNのハードウェア実装の2つを提案した.計画では物体認識CNNである You Only Look Once (YOLO) を対象に [1]提案ネットワークであるMDS-YOLOの実現,[2]MDS-YOLOのハードウェア実装,[3]ハードウェア実装MDS-YOLOのロボットへの搭載を行うとした.学振として採用後,中原らによってYOLOのFPGA実装が実現されていると分かった.そこで本研究では最重要な項目(a)(b)に注力した.このために,多くの研究でベースラインとされるVGG-16を対象に計画を遂行し,併せてデータセット生成手法を提案した.項目[1]ではDS構造でハードウェア指向な「Binarized DS-VGG16 Tiny (BDS-VGG16 Tiny)」を提案し,Binarized VGG-16に比べ4.7%精度を改善した.項目[2]ではBDS-VGG16 Tinyをハードウェア実装し,CPU実装に比べて約4.7倍の高速化と約20倍の電力効率化を実現した.項目[3]ではBDS-VGG16 Tinyとロボット用ミドルウェアを接続し,リアルタイム物体認識システムを構築した.以上の成果はJournal of Robotics and Mechatronicsで採択された.これらの成果と中原らの提案手法を組み合わせることでMDS-YOLOが実現できる.次に計画にはなかったデータセット手法を提案した.RGB画像データセットの半自動生成手法を提案し,YOLOに有効だと確認した.またDS-CNN用に拡張可能である.
目的是通过(a)实现双流卷积神经网络(DS-CNN)以获得更高的精度,(b)实现DS以实现更高的速度和更低的功耗,从而提高家庭服务机器人的物体识别系统的性能 - 我们提出。 CNN 的两种硬件实现。该计划的目标是 You Only Look Once (YOLO),一种对象识别 CNN,[1] 所提出的网络 MDS-YOLO 的实现,[2] MDS-YOLO 的硬件实现,以及 [3] MDS-YOLO 的硬件实现。公司计划将其安装在机器人上。被JSPS采用后,发现Nakahara等人已经实现了YOLO的FPGA实现。因此,本研究重点关注最重要的(a)和(b)项。为此,我们使用被许多研究视为基线的VGG-16进行了计划,并提出了数据集生成方法。在项目[1]中,我们提出了“二值化DS-VGG16 Tiny(BDS-VGG16 Tiny)”,它具有DS结构并且面向硬件,与二值化VGG-16相比,精度提高了4.7%。在项目[2]中,我们在硬件中实现了BDS-VGG16 Tiny,与CPU实现相比,速度提高了约4.7倍,能效提高了约20倍。在项目[3]中,我们连接BDS-VGG16 Tiny和机器人中间件来构建实时物体识别系统。上述成果被Journal of Robotics and Mechatronics接收。将这些结果与Nakahara等人提出的方法相结合即可实现MDS-YOLO。接下来,我们提出了计划中没有的数据集方法。我们提出了一种 RGB 图像数据集的半自动生成方法,并证实它对 YOLO 是有效的。它也可扩展为 DS-CNN。

项目成果

期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
FPGA-enabled Binarized Convolutional Neural Networks toward Real-time Embedded Object Recognition System for Service Robots
支持 FPGA 的二值化卷积神经网络用于服务机器人的实时嵌入式对象识别系统
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yuma Yoshimoto; Daisuke Shuto; Hakaru Tamukoh
  • 通讯作者:
    Hakaru Tamukoh
Live Demonstration: Hardware-Oriented Dual Stream Object Recognition System using Binarized Neural Networks
现场演示:使用二值化神经网络的面向硬件的双流对象识别系统
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yuma Yoshimoto; Hakaru Tamukoh
  • 通讯作者:
    Hakaru Tamukoh
FPGA Implementation of a Binarized Dual Stream Convolutional Neural Network for Service Robots
用于服务机器人的二值化双流卷积神经网络的 FPGA 实现
  • DOI:
    10.20965/jrm.2021.p0386
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    1.1
  • 作者:
    Yuma Yoshimoto; Hakaru Tamukoh
  • 通讯作者:
    Hakaru Tamukoh
Live Demonstration: Hardware-Oriented Dual Stream Object Recognition System using Binarized Neural Networks
现场演示:使用二值化神经网络的面向硬件的双流对象识别系统
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yuma Yoshimoto; Hakaru Tamukoh
  • 通讯作者:
    Hakaru Tamukoh
A Quick Data Generation Method for Training Object Detection Algorithms in Home Environments
一种用于训练家庭环境中物体检测算法的快速数据生成方法
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yuma Yoshimoto; Muhammad Farhan Mustafa; Wan Zuha Wan Hasan; Hakaru Tamukoh
  • 通讯作者:
    Hakaru Tamukoh
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

吉元 裕真其他文献

Depth画像を用いたハードウェア指向一般物体認識ニューラルネットワーク
使用深度图像的面向硬件的通用对象识别神经网络
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    吉元 裕真;田向 権
  • 通讯作者:
    田向 権
Depth画像を活用した深層学習によるホームサービスロボット向け一般物体認識システムの構築
使用深度图像的深度学习构建家庭服务机器人的通用对象识别系统
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    吉元 裕真; 田向 権
  • 通讯作者:
    田向 権

吉元 裕真的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

ニューラルネットワークの内容可視化に基づく革新的なA I教育支援ツールの開発
基于神经网络内容可视化的创新AI教育支持工具开发
  • 批准号:
    24K06368
  • 财政年份:
    2024
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
解釈可能な非線形積分ニューラルネットワークの理論と実装
可解释非线性积分神经网络的理论与实现
  • 批准号:
    24K06868
  • 财政年份:
    2024
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
時間領域論理の導入による超高速かつ超効率動作が可能な超伝導ニューラルネットワーク
引入时域逻辑实现超高速、超高效运行的超导神经网络
  • 批准号:
    24KJ1148
  • 财政年份:
    2024
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
AIを用いた慢性疾患の病態進行モデルの構築法開発とパーキンソン病への適用
开发利用人工智能构建慢性病疾病进展模型的方法及其在帕金森病中的应用
  • 批准号:
    22KJ0473
  • 财政年份:
    2023
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
脳波解析を利用したストレス評価モデルによる使用者の好みに即した操作特性の調整法
一种使用脑电波分析的压力评估模型根据用户偏好调整操作特性的方法
  • 批准号:
    23K03774
  • 财政年份:
    2023
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了