階層型視覚的コモンセンスを考慮した動画質問応答
考虑分层视觉常识的视频问答
基本信息
- 批准号:22KJ2914
- 负责人:
- 金额:$ 1.09万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for JSPS Fellows
- 财政年份:2023
- 资助国家:日本
- 起止时间:2023-03-08 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究課題の幼児の一人称視点動画からの視覚的コモンセンス獲得において、2022年度開始時は幼児の一人称視点動画の詳細な分析を行った。しかしながら、幼児の一人称視点動画は撮影条件や視点などが統一されておらず、機械学習の文脈において未来予測をすることは非常に困難であることが明らかとなった。そこで、近年深層学習において技術的転換点となったTransformerを用いてインタラクションを伴う行動計画タスク自体から初期的視覚的コモンセンスを創発させることができないかに取り組んだ。Transformerの自己注意機構を可視化した結果として、視覚的コモンセンスのPやFについての初期的視覚コモンセンスの獲得の傾向は見られたが、CとIとUについての創発は見られなかった。それゆえ、タスク自体の見直しを行うことにした。次に取り組んだタスクとして物理現象を伴うパズルであるPHYREを用いて、視覚的コモンセンスFPICU全ての創発を行うエージェントを開発することに取り組んだ。FPICUを全て創発させるために、FPICUを統一的に考慮する定式化を数学的に行い、実験を行った。しかしながら、因果性であるCの学習が困難を極め、Cの関連する技術であるVAEや統計的因果推論についてのサーベイを行った。結果として、2022年度はタスクの2度の見直しとFPICUの学習困難性のために論文出版を行うことはできなかった。しかしながら、近年登場したChatGPTがIとUを備えている可能性があり、ChatGPTを活用して視覚的コモンセンスを統一的に考慮するための初期的実験を開始した。
在2022年初,从2022年初进行了对婴儿的第一个观点视频的详细分析,这是在这项研究中的第一个人的观点视频中获得了视觉Chomon Sense。但是,婴儿的第一个角度观点视频并未统一拍摄条件和观点,很明显,在机器学习的背景下,很难预测未来。因此,近年来,我们一直在努力使用变形金刚,这是深度学习的技术转折点,以从交互任务本身中创建一个初始的视觉概念。由于对变压器自我注意的可视化,视觉Chomon Sense P和F的最初视觉常识的趋势,但在C,I和U中没有建立。因此,我们决定审查任务本身。下一个任务是开发一种使用Phyre(一个具有物理现象的难题)创建所有视觉常识性FPICU的代理。为了创建所有FPICU,我们执行了一个正式的公式,其中FPICU均匀考虑并进行了实验。但是,C的学习是极难的,并且对C的相关技术和统计因果推断进行了调查。结果,在2022财年,由于两次任务的评论和学习FPICU的困难,不可能发表论文。但是,近年来出现的Chatgpt可能有I和U,并且已经开始了一个初步的实验来利用Chatgpt来统一视觉常识。
项目成果
期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
視覚情報に用いたタスク指向型対話における人間の返答に対する間違い指摘の検討
利用视觉信息指出任务导向对话中人类反应错误的研究
- DOI:
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:Kazuki Kohyama;Takahiro Tsukahara;Keiichi Tamai;Masaki Sano;荒川深映(この発表者と綱島は共同第一著者);大島遼祐(この発表者と綱島は共同著者)
- 通讯作者:大島遼祐(この発表者と綱島は共同著者)
Memory Efficient Diffusion Probabilistic Models via Patch-based Generation
- DOI:10.48550/arxiv.2304.07087
- 发表时间:2023-04
- 期刊:
- 影响因子:0
- 作者:Shinei Arakawa;Hideki Tsunashima;Daichi Horita;Keitaro Tanaka;S. Morishima
- 通讯作者:Shinei Arakawa;Hideki Tsunashima;Daichi Horita;Keitaro Tanaka;S. Morishima
複数解像度で画像を生成可能な拡散確率モデル
可以生成多种分辨率图像的扩散随机模型
- DOI:
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:Kazuki Kohyama;Takahiro Tsukahara;Keiichi Tamai;Masaki Sano;荒川深映(この発表者と綱島は共同第一著者)
- 通讯作者:荒川深映(この発表者と綱島は共同第一著者)
視覚情報に基づくタスク指向型対話における人間の返答に対する間違い指摘の検討
基于视觉信息的任务导向对话中人类反应错误的指出研究
- DOI:
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:Kazuki Kohyama;Takahiro Tsukahara;Keiichi Tamai;Masaki Sano;荒川深映(この発表者と綱島は共同第一著者);大島遼祐(この発表者と綱島は共同著者);大島遼祐(この発表者と綱島は共同著者)
- 通讯作者:大島遼祐(この発表者と綱島は共同著者)
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
綱島 秀樹其他文献
綱島 秀樹的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似海外基金
常識と化した知見の再検証が明らかにするリグニン系芳香族代謝制御の全貌
通过重新审视已成为常识的知识,揭示了基于木质素的芳香代谢控制的全貌
- 批准号:
24KJ1181 - 财政年份:2024
- 资助金额:
$ 1.09万 - 项目类别:
Grant-in-Aid for JSPS Fellows
物理世界の常識を利用したユーザ認証:利便性と安全性を両立する革新的認証技術
使用物理世界常识进行用户认证:平衡便利性和安全性的创新认证技术
- 批准号:
23K28084 - 财政年份:2024
- 资助金额:
$ 1.09万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
常識の社会的認識論:常識が確からしいのはいかにして因果的に生成されるときか
常识的社会认识论:常识在因果关系中产生的可能性如何。
- 批准号:
24K15883 - 财政年份:2024
- 资助金额:
$ 1.09万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
言語で記述された常識と実世界の観察を統合するロボットのための知識推論システム
集成了用语言编写的常识和现实世界观察的机器人知识推理系统
- 批准号:
23K24910 - 财政年份:2024
- 资助金额:
$ 1.09万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
スコットランド常識学派からプラグマティズムへ―英米思想における常識哲学の研究
从苏格兰常识学派到实用主义:英美思想中的常识哲学研究
- 批准号:
23K20064 - 财政年份:2024
- 资助金额:
$ 1.09万 - 项目类别:
Grant-in-Aid for Scientific Research (B)