物理的演繹モデルと帰納的深層学習の融合によるしなやかな画像理解

通过物理演绎模型和归纳深度学习的融合灵活的图像理解

基本信息

  • 批准号:
    21H04893
  • 负责人:
  • 金额:
    $ 26.71万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
  • 财政年份:
    2021
  • 资助国家:
    日本
  • 起止时间:
    2021-04-05 至 2026-03-31
  • 项目状态:
    未结题

项目摘要

今年度は、昨年度の精緻な3次元形状復元に関する研究をさらに発展させ、光源状況の推定も同様に解析的な生成モデルを仮定しつつ、帰納的学習によって、反射特性を3次元形状とともに同時推定する手法について研究を進めた。特にマルチビューステレオと呼ばれる、複数枚の画像から形状復元をおこなう手法に着目し、従来仮定される拡散反射特性にとどまらない、さまざまな表面反射をおこなう物体に関して、形状とともに反射特性を求める手法を導出した。これは、単一の画像から物体表面の法線を深層学習モデルによって推定し、それらを物体表面の特徴量として新たなマルチビューステレオ法を構成することによって実現した。法線を視点不変の特徴量としてコストボリュームを構築し、視点間対応および3次元座標を大域的な最適解として求める本手法は新規性が高く、様々な反射特性の物体表面を正確に復元できることを実証した。また、特に自動運転等において重要となる道路光景の素材認識に関する研究も進めた。素材に関する視覚的情報を、各画素と近傍におけるテクスチャを代表とする局所的特徴量だけではなく、それらの画素がどういった物体を構成しているか、またそれらの物体間の画像全体における大局的位置関係を考慮した新たな深層学習モデルを導出し、正確に各画素の素材を認識できることを示した。本研究も極めてノイジーな解空間における大域的な最適解を求める手法を確立するものであり、前述の成果とともに、計画された研究目標を達成するものである。
本财年,我们将进一步发展去年的精确 3D 形状恢复研究,假设采用分析生成模型来估计光源条件,并通过归纳学习同时估计反射特性和 3D 形状,我们对此进行了研究。特别是,我们专注于一种称为多视图立体的方法,该方法可以从多个图像中恢复形状,并导出了一种用于确定具有各种表面反射的物体的形状和反射特性的方法,而不仅仅是传统假设的漫反射特性。 。这是通过使用深度学习模型从单个图像估计物体表面的法线,并使用这些作为物体表面的特征构建新的多视图立体方法来实现的。该方法使用法线作为视点不变特征构建成本体积,并确定视点间对应关系和 3D 坐标作为全局最优解,该方法非常新颖,可以准确地重建具有各种反射特性的物体表面。我们还对道路场景的材质识别进行了研究,这在自动驾驶等领域尤为重要。有关材料的视觉信息不仅是局部特征(例如每个像素及其附近的纹理),而且还包括有关这些像素构成的对象类型以及这些对象之间的整体图像的信息。考虑到位置关系,并表明可以准确识别每个像素的来源。本研究还建立了一种在极其嘈杂的解空间中寻找全局最优解的方法,结合上述结果,达到了预期的研究目标。

项目成果

期刊论文数量(12)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Human-Object Interaction Detection with Missing Objects
Extrinsic Camera Calibration From a Moving Person
通过移动的人进行外部相机校准
  • DOI:
    10.1109/lra.2022.3192629
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    5.2
  • 作者:
    Sang-Eun Lee;Keisuke Shibata;Soma Nonaka;Shohei Nobuhara;Ko Nishino
  • 通讯作者:
    Ko Nishino
RGB Road Scene Material Segmentation
  • DOI:
    10.1007/978-3-031-26284-5_16
  • 发表时间:
    2024-03
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Sudong Cai;Ryosuke Wakaki;S. Nobuhara;K. Nishino
  • 通讯作者:
    Sudong Cai;Ryosuke Wakaki;S. Nobuhara;K. Nishino
BlindSpotNet: Seeing Where We Cannot See
BlindSpotNet:看到我们看不到的地方
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    T. Fukuda;K. Hasegawa;S. Ishizaki;S. Nobuhara and K. Nishino
  • 通讯作者:
    S. Nobuhara and K. Nishino
Multimodal Material Segmentation
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

西野 恒其他文献

コンピュータで視る未来社会
通过计算机观察未来社会
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Satoshi Murai;Meng-Yu Jennifer Kuo;Ryo Kawahara;Shohei Nobuhara;and Ko Nishino;西野 恒;西野 恒;西野 恒;西野 恒
  • 通讯作者:
    西野 恒
Freeing Computer Vision from Its Fundamental Limits
将计算机视觉从其基本限制中解放出来
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Satoshi Murai;Meng-Yu Jennifer Kuo;Ryo Kawahara;Shohei Nobuhara;and Ko Nishino;西野 恒;西野 恒
  • 通讯作者:
    西野 恒
Photometric object modeling : Rendering from a dense/sparse set of images
光度对象建模:从密集/稀疏图像集进行渲染
  • DOI:
  • 发表时间:
    2002
  • 期刊:
  • 影响因子:
    0
  • 作者:
    西野 恒
  • 通讯作者:
    西野 恒
コンピュータビジョンの限界突破
突破计算机视觉的限制
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Satoshi Murai;Meng-Yu Jennifer Kuo;Ryo Kawahara;Shohei Nobuhara;and Ko Nishino;西野 恒;西野 恒;西野 恒
  • 通讯作者:
    西野 恒
コンピュータで視る
在电脑上查看
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Satoshi Murai;Meng-Yu Jennifer Kuo;Ryo Kawahara;Shohei Nobuhara;and Ko Nishino;西野 恒
  • 通讯作者:
    西野 恒

西野 恒的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('西野 恒', 18)}}的其他基金

精緻で豊かな計算機視覚の実現に向けた認識と復元の統合
识别与修复一体化,实现复杂丰富的计算机视觉
  • 批准号:
    17K20143
  • 财政年份:
    2018
  • 资助金额:
    $ 26.71万
  • 项目类别:
    Fund for the Promotion of Joint International Research (Home-Returning Researcher Development Research)

相似海外基金

球面レンズ式マクロステレオフォトグラフィによる微小物体の三次元形状・反射特性計測
利用球面透镜宏观立体摄影测量微小物体的三维形状和反射特性
  • 批准号:
    22K17914
  • 财政年份:
    2022
  • 资助金额:
    $ 26.71万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Multi-layer Light Field for Underwater 3D Shape Recovery
用于水下 3D 形状恢复的多层光场
  • 批准号:
    21K21319
  • 财政年份:
    2021
  • 资助金额:
    $ 26.71万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up
Controllable imaging system of invisible element components by autonomous cooperative acquisition of dynamic light transport
通过动态光传输自主协作采集的不可见元素组件的可控成像系统
  • 批准号:
    21K19799
  • 财政年份:
    2021
  • 资助金额:
    $ 26.71万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
Spatio-temporal modulation imaging toward measurements of shape and physical properties
用于测量形状和物理特性的时空调制成像
  • 批准号:
    20H04215
  • 财政年份:
    2020
  • 资助金额:
    $ 26.71万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Computational Thermography: Innovation of Thermography using Computational Imaging Techniques
计算热成像:利用计算成像技术进行热成像创新
  • 批准号:
    20K21822
  • 财政年份:
    2020
  • 资助金额:
    $ 26.71万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了